1 /***************************************************************************
2 * PCSX-Revolution - PlayStation Emulator for Nintendo Wii *
3 * Copyright (C) 2009-2010 PCSX-Revolution Dev Team *
4 * <http://code.google.com/p/pcsx-revolution/> *
6 * This program is free software; you can redistribute it and/or modify *
7 * it under the terms of the GNU General Public License as published by *
8 * the Free Software Foundation; either version 2 of the License, or *
9 * (at your option) any later version. *
11 * This program is distributed in the hope that it will be useful, *
12 * but WITHOUT ANY WARRANTY; without even the implied warranty of *
13 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the *
14 * GNU General Public License for more details. *
16 * You should have received a copy of the GNU General Public License *
17 * along with this program; if not, write to the *
18 * Free Software Foundation, Inc., *
19 * 51 Franklin Street, Fifth Floor, Boston, MA 02111-1307 USA. *
20 ***************************************************************************/
29 #define VX(n) (n < 3 ? psxRegs.CP2D.p[n << 1].sw.l : psxRegs.CP2D.p[9].sw.l)
30 #define VY(n) (n < 3 ? psxRegs.CP2D.p[n << 1].sw.h : psxRegs.CP2D.p[10].sw.l)
31 #define VZ(n) (n < 3 ? psxRegs.CP2D.p[(n << 1) + 1].sw.l : psxRegs.CP2D.p[11].sw.l)
32 #define MX11(n) (n < 3 ? psxRegs.CP2C.p[(n << 3)].sw.l : 0)
33 #define MX12(n) (n < 3 ? psxRegs.CP2C.p[(n << 3)].sw.h : 0)
34 #define MX13(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 1].sw.l : 0)
35 #define MX21(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 1].sw.h : 0)
36 #define MX22(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 2].sw.l : 0)
37 #define MX23(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 2].sw.h : 0)
38 #define MX31(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 3].sw.l : 0)
39 #define MX32(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 3].sw.h : 0)
40 #define MX33(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 4].sw.l : 0)
41 #define CV1(n) (n < 3 ? (s32)psxRegs.CP2C.r[(n << 3) + 5] : 0)
42 #define CV2(n) (n < 3 ? (s32)psxRegs.CP2C.r[(n << 3) + 6] : 0)
43 #define CV3(n) (n < 3 ? (s32)psxRegs.CP2C.r[(n << 3) + 7] : 0)
45 #define fSX(n) ((psxRegs.CP2D.p)[((n) + 12)].sw.l)
46 #define fSY(n) ((psxRegs.CP2D.p)[((n) + 12)].sw.h)
47 #define fSZ(n) ((psxRegs.CP2D.p)[((n) + 17)].w.l) /* (n == 0) => SZ1; */
49 #define gteVXY0 (psxRegs.CP2D.r[0])
50 #define gteVX0 (psxRegs.CP2D.p[0].sw.l)
51 #define gteVY0 (psxRegs.CP2D.p[0].sw.h)
52 #define gteVZ0 (psxRegs.CP2D.p[1].sw.l)
53 #define gteVXY1 (psxRegs.CP2D.r[2])
54 #define gteVX1 (psxRegs.CP2D.p[2].sw.l)
55 #define gteVY1 (psxRegs.CP2D.p[2].sw.h)
56 #define gteVZ1 (psxRegs.CP2D.p[3].sw.l)
57 #define gteVXY2 (psxRegs.CP2D.r[4])
58 #define gteVX2 (psxRegs.CP2D.p[4].sw.l)
59 #define gteVY2 (psxRegs.CP2D.p[4].sw.h)
60 #define gteVZ2 (psxRegs.CP2D.p[5].sw.l)
61 #define gteRGB (psxRegs.CP2D.r[6])
62 #define gteR (psxRegs.CP2D.p[6].b.l)
63 #define gteG (psxRegs.CP2D.p[6].b.h)
64 #define gteB (psxRegs.CP2D.p[6].b.h2)
65 #define gteCODE (psxRegs.CP2D.p[6].b.h3)
66 #define gteOTZ (psxRegs.CP2D.p[7].w.l)
67 #define gteIR0 (psxRegs.CP2D.p[8].sw.l)
68 #define gteIR1 (psxRegs.CP2D.p[9].sw.l)
69 #define gteIR2 (psxRegs.CP2D.p[10].sw.l)
70 #define gteIR3 (psxRegs.CP2D.p[11].sw.l)
71 #define gteSXY0 (psxRegs.CP2D.r[12])
72 #define gteSX0 (psxRegs.CP2D.p[12].sw.l)
73 #define gteSY0 (psxRegs.CP2D.p[12].sw.h)
74 #define gteSXY1 (psxRegs.CP2D.r[13])
75 #define gteSX1 (psxRegs.CP2D.p[13].sw.l)
76 #define gteSY1 (psxRegs.CP2D.p[13].sw.h)
77 #define gteSXY2 (psxRegs.CP2D.r[14])
78 #define gteSX2 (psxRegs.CP2D.p[14].sw.l)
79 #define gteSY2 (psxRegs.CP2D.p[14].sw.h)
80 #define gteSXYP (psxRegs.CP2D.r[15])
81 #define gteSXP (psxRegs.CP2D.p[15].sw.l)
82 #define gteSYP (psxRegs.CP2D.p[15].sw.h)
83 #define gteSZ0 (psxRegs.CP2D.p[16].w.l)
84 #define gteSZ1 (psxRegs.CP2D.p[17].w.l)
85 #define gteSZ2 (psxRegs.CP2D.p[18].w.l)
86 #define gteSZ3 (psxRegs.CP2D.p[19].w.l)
87 #define gteRGB0 (psxRegs.CP2D.r[20])
88 #define gteR0 (psxRegs.CP2D.p[20].b.l)
89 #define gteG0 (psxRegs.CP2D.p[20].b.h)
90 #define gteB0 (psxRegs.CP2D.p[20].b.h2)
91 #define gteCODE0 (psxRegs.CP2D.p[20].b.h3)
92 #define gteRGB1 (psxRegs.CP2D.r[21])
93 #define gteR1 (psxRegs.CP2D.p[21].b.l)
94 #define gteG1 (psxRegs.CP2D.p[21].b.h)
95 #define gteB1 (psxRegs.CP2D.p[21].b.h2)
96 #define gteCODE1 (psxRegs.CP2D.p[21].b.h3)
97 #define gteRGB2 (psxRegs.CP2D.r[22])
98 #define gteR2 (psxRegs.CP2D.p[22].b.l)
99 #define gteG2 (psxRegs.CP2D.p[22].b.h)
100 #define gteB2 (psxRegs.CP2D.p[22].b.h2)
101 #define gteCODE2 (psxRegs.CP2D.p[22].b.h3)
102 #define gteRES1 (psxRegs.CP2D.r[23])
103 #define gteMAC0 (((s32 *)psxRegs.CP2D.r)[24])
104 #define gteMAC1 (((s32 *)psxRegs.CP2D.r)[25])
105 #define gteMAC2 (((s32 *)psxRegs.CP2D.r)[26])
106 #define gteMAC3 (((s32 *)psxRegs.CP2D.r)[27])
107 #define gteIRGB (psxRegs.CP2D.r[28])
108 #define gteORGB (psxRegs.CP2D.r[29])
109 #define gteLZCS (psxRegs.CP2D.r[30])
110 #define gteLZCR (psxRegs.CP2D.r[31])
112 #define gteR11R12 (((s32 *)psxRegs.CP2C.r)[0])
113 #define gteR22R23 (((s32 *)psxRegs.CP2C.r)[2])
114 #define gteR11 (psxRegs.CP2C.p[0].sw.l)
115 #define gteR12 (psxRegs.CP2C.p[0].sw.h)
116 #define gteR13 (psxRegs.CP2C.p[1].sw.l)
117 #define gteR21 (psxRegs.CP2C.p[1].sw.h)
118 #define gteR22 (psxRegs.CP2C.p[2].sw.l)
119 #define gteR23 (psxRegs.CP2C.p[2].sw.h)
120 #define gteR31 (psxRegs.CP2C.p[3].sw.l)
121 #define gteR32 (psxRegs.CP2C.p[3].sw.h)
122 #define gteR33 (psxRegs.CP2C.p[4].sw.l)
123 #define gteTRX (((s32 *)psxRegs.CP2C.r)[5])
124 #define gteTRY (((s32 *)psxRegs.CP2C.r)[6])
125 #define gteTRZ (((s32 *)psxRegs.CP2C.r)[7])
126 #define gteL11 (psxRegs.CP2C.p[8].sw.l)
127 #define gteL12 (psxRegs.CP2C.p[8].sw.h)
128 #define gteL13 (psxRegs.CP2C.p[9].sw.l)
129 #define gteL21 (psxRegs.CP2C.p[9].sw.h)
130 #define gteL22 (psxRegs.CP2C.p[10].sw.l)
131 #define gteL23 (psxRegs.CP2C.p[10].sw.h)
132 #define gteL31 (psxRegs.CP2C.p[11].sw.l)
133 #define gteL32 (psxRegs.CP2C.p[11].sw.h)
134 #define gteL33 (psxRegs.CP2C.p[12].sw.l)
135 #define gteRBK (((s32 *)psxRegs.CP2C.r)[13])
136 #define gteGBK (((s32 *)psxRegs.CP2C.r)[14])
137 #define gteBBK (((s32 *)psxRegs.CP2C.r)[15])
138 #define gteLR1 (psxRegs.CP2C.p[16].sw.l)
139 #define gteLR2 (psxRegs.CP2C.p[16].sw.h)
140 #define gteLR3 (psxRegs.CP2C.p[17].sw.l)
141 #define gteLG1 (psxRegs.CP2C.p[17].sw.h)
142 #define gteLG2 (psxRegs.CP2C.p[18].sw.l)
143 #define gteLG3 (psxRegs.CP2C.p[18].sw.h)
144 #define gteLB1 (psxRegs.CP2C.p[19].sw.l)
145 #define gteLB2 (psxRegs.CP2C.p[19].sw.h)
146 #define gteLB3 (psxRegs.CP2C.p[20].sw.l)
147 #define gteRFC (((s32 *)psxRegs.CP2C.r)[21])
148 #define gteGFC (((s32 *)psxRegs.CP2C.r)[22])
149 #define gteBFC (((s32 *)psxRegs.CP2C.r)[23])
150 #define gteOFX (((s32 *)psxRegs.CP2C.r)[24])
151 #define gteOFY (((s32 *)psxRegs.CP2C.r)[25])
152 #define gteH (psxRegs.CP2C.p[26].sw.l)
153 #define gteDQA (psxRegs.CP2C.p[27].sw.l)
154 #define gteDQB (((s32 *)psxRegs.CP2C.r)[28])
155 #define gteZSF3 (psxRegs.CP2C.p[29].sw.l)
156 #define gteZSF4 (psxRegs.CP2C.p[30].sw.l)
157 #define gteFLAG (psxRegs.CP2C.r[31])
159 #define GTE_OP(op) ((op >> 20) & 31)
160 #define GTE_SF(op) ((op >> 19) & 1)
161 #define GTE_MX(op) ((op >> 17) & 3)
162 #define GTE_V(op) ((op >> 15) & 3)
163 #define GTE_CV(op) ((op >> 13) & 3)
164 #define GTE_CD(op) ((op >> 11) & 3) /* not used */
165 #define GTE_LM(op) ((op >> 10) & 1)
166 #define GTE_CT(op) ((op >> 6) & 15) /* not used */
167 #define GTE_FUNCT(op) (op & 63)
169 #define gteop (psxRegs.code & 0x1ffffff)
171 static inline s64 BOUNDS(s64 n_value, s64 n_max, int n_maxflag, s64 n_min, int n_minflag) {
172 if (n_value > n_max) {
173 gteFLAG |= n_maxflag;
174 } else if (n_value < n_min) {
175 gteFLAG |= n_minflag;
180 static inline s32 LIM(s32 value, s32 max, s32 min, u32 flag) {
185 } else if (value < min) {
192 #define A1(a) BOUNDS((a), 0x7fffffff, (1 << 30), -(s64)0x80000000, (1 << 31) | (1 << 27))
193 #define A2(a) BOUNDS((a), 0x7fffffff, (1 << 29), -(s64)0x80000000, (1 << 31) | (1 << 26))
194 #define A3(a) BOUNDS((a), 0x7fffffff, (1 << 28), -(s64)0x80000000, (1 << 31) | (1 << 25))
195 #define limB1(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 31) | (1 << 24))
196 #define limB2(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 31) | (1 << 23))
197 #define limB3(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 22))
198 #define limC1(a) LIM((a), 0x00ff, 0x0000, (1 << 21))
199 #define limC2(a) LIM((a), 0x00ff, 0x0000, (1 << 20))
200 #define limC3(a) LIM((a), 0x00ff, 0x0000, (1 << 19))
201 #define limD(a) LIM((a), 0xffff, 0x0000, (1 << 31) | (1 << 18))
203 static inline u32 limE(u32 result) {
204 if (result > 0x1ffff) {
205 gteFLAG |= (1 << 31) | (1 << 17);
211 #define F(a) BOUNDS((a), 0x7fffffff, (1 << 31) | (1 << 16), -(s64)0x80000000, (1 << 31) | (1 << 15))
212 #define limG1(a) LIM((a), 0x3ff, -0x400, (1 << 31) | (1 << 14))
213 #define limG2(a) LIM((a), 0x3ff, -0x400, (1 << 31) | (1 << 13))
214 #define limH(a) LIM((a), 0xfff, 0x000, (1 << 12))
216 #include "gte_divider.h"
218 static inline u32 MFC2(int reg) {
227 psxRegs.CP2D.r[reg] = (s32)psxRegs.CP2D.p[reg].sw.l;
235 psxRegs.CP2D.r[reg] = (u32)psxRegs.CP2D.p[reg].w.l;
239 psxRegs.CP2D.r[reg] = gteSXY2;
247 psxRegs.CP2D.r[reg] = LIM(gteIR1 >> 7, 0x1f, 0, 0) |
248 (LIM(gteIR2 >> 7, 0x1f, 0, 0) << 5) |
249 (LIM(gteIR3 >> 7, 0x1f, 0, 0) << 10);
252 return psxRegs.CP2D.r[reg];
255 static inline void MTC2(u32 value, int reg) {
266 gteIR1 = (value & 0x1f) << 7;
267 gteIR2 = (value & 0x3e0) << 2;
268 gteIR3 = (value & 0x7c00) >> 3;
279 for (i = 31; (a & (1 << i)) == 0 && i >= 0; i--);
284 for (i = 31; (a & (1 << i)) == 0 && i >= 0; i--);
298 psxRegs.CP2D.r[reg] = value;
302 static inline void CTC2(u32 value, int reg) {
311 value = (s32)(s16)value;
315 value = value & 0x7ffff000;
316 if (value & 0x7f87e000) value |= 0x80000000;
320 psxRegs.CP2C.r[reg] = value;
325 psxRegs.GPR.r[_Rt_] = MFC2(_Rd_);
330 psxRegs.GPR.r[_Rt_] = psxRegs.CP2C.r[_Rd_];
334 MTC2(psxRegs.GPR.r[_Rt_], _Rd_);
338 CTC2(psxRegs.GPR.r[_Rt_], _Rd_);
341 #define _oB_ (psxRegs.GPR.r[_Rs_] + _Imm_)
344 MTC2(psxMemRead32(_oB_), _Rt_);
348 psxMemWrite32(_oB_, MFC2(_Rt_));
351 #define DIVIDE DIVIDE_
352 static u32 DIVIDE_(s16 n, u16 d) {
353 if (n >= 0 && n < d * 2) {
355 return ((n_ << 16) + d / 2) / d;
356 //return (u32)((float)(n_ << 16) / (float)d + (float)0.5);
365 GTE_LOG("GTE RTPS\n");
369 gteMAC1 = A1((((s64)gteTRX << 12) + (gteR11 * gteVX0) + (gteR12 * gteVY0) + (gteR13 * gteVZ0)) >> 12);
370 gteMAC2 = A2((((s64)gteTRY << 12) + (gteR21 * gteVX0) + (gteR22 * gteVY0) + (gteR23 * gteVZ0)) >> 12);
371 gteMAC3 = A3((((s64)gteTRZ << 12) + (gteR31 * gteVX0) + (gteR32 * gteVY0) + (gteR33 * gteVZ0)) >> 12);
372 gteIR1 = limB1(gteMAC1, 0);
373 gteIR2 = limB2(gteMAC2, 0);
374 gteIR3 = limB3(gteMAC3, 0);
378 gteSZ3 = limD(gteMAC3);
379 quotient = limE(DIVIDE(gteH, gteSZ3));
382 gteSX2 = limG1(F((s64)gteOFX + ((s64)gteIR1 * quotient)) >> 16);
383 gteSY2 = limG2(F((s64)gteOFY + ((s64)gteIR2 * quotient)) >> 16);
385 gteMAC0 = F((s64)(gteDQB + ((s64)gteDQA * quotient)) >> 12);
386 gteIR0 = limH(gteMAC0);
395 GTE_LOG("GTE RTPT\n");
400 for (v = 0; v < 3; v++) {
404 gteMAC1 = A1((((s64)gteTRX << 12) + (gteR11 * vx) + (gteR12 * vy) + (gteR13 * vz)) >> 12);
405 gteMAC2 = A2((((s64)gteTRY << 12) + (gteR21 * vx) + (gteR22 * vy) + (gteR23 * vz)) >> 12);
406 gteMAC3 = A3((((s64)gteTRZ << 12) + (gteR31 * vx) + (gteR32 * vy) + (gteR33 * vz)) >> 12);
407 gteIR1 = limB1(gteMAC1, 0);
408 gteIR2 = limB2(gteMAC2, 0);
409 gteIR3 = limB3(gteMAC3, 0);
410 fSZ(v) = limD(gteMAC3);
411 quotient = limE(DIVIDE(gteH, fSZ(v)));
412 fSX(v) = limG1(F((s64)gteOFX + ((s64)gteIR1 * quotient)) >> 16);
413 fSY(v) = limG2(F((s64)gteOFY + ((s64)gteIR2 * quotient)) >> 16);
415 gteMAC0 = F((s64)(gteDQB + ((s64)gteDQA * quotient)) >> 12);
416 gteIR0 = limH(gteMAC0);
420 int shift = 12 * GTE_SF(gteop);
421 int mx = GTE_MX(gteop);
422 int v = GTE_V(gteop);
423 int cv = GTE_CV(gteop);
424 int lm = GTE_LM(gteop);
430 GTE_LOG("GTE MVMVA\n");
434 gteMAC1 = A1((((s64)CV1(cv) << 12) + (MX11(mx) * vx) + (MX12(mx) * vy) + (MX13(mx) * vz)) >> shift);
435 gteMAC2 = A2((((s64)CV2(cv) << 12) + (MX21(mx) * vx) + (MX22(mx) * vy) + (MX23(mx) * vz)) >> shift);
436 gteMAC3 = A3((((s64)CV3(cv) << 12) + (MX31(mx) * vx) + (MX32(mx) * vy) + (MX33(mx) * vz)) >> shift);
438 gteIR1 = limB1(gteMAC1, lm);
439 gteIR2 = limB2(gteMAC2, lm);
440 gteIR3 = limB3(gteMAC3, lm);
445 GTE_LOG("GTE NCLIP\n");
449 gteMAC0 = F((s64)gteSX0 * (gteSY1 - gteSY2) +
450 gteSX1 * (gteSY2 - gteSY0) +
451 gteSX2 * (gteSY0 - gteSY1));
456 GTE_LOG("GTE AVSZ3\n");
460 gteMAC0 = F((s64)(gteZSF3 * gteSZ1) + (gteZSF3 * gteSZ2) + (gteZSF3 * gteSZ3));
461 gteOTZ = limD(gteMAC0 >> 12);
466 GTE_LOG("GTE AVSZ4\n");
470 gteMAC0 = F((s64)(gteZSF4 * (gteSZ0 + gteSZ1 + gteSZ2 + gteSZ3)));
471 gteOTZ = limD(gteMAC0 >> 12);
475 int shift = 12 * GTE_SF(gteop);
476 int lm = GTE_LM(gteop);
479 GTE_LOG("GTE SQR\n");
483 gteMAC1 = A1((gteIR1 * gteIR1) >> shift);
484 gteMAC2 = A2((gteIR2 * gteIR2) >> shift);
485 gteMAC3 = A3((gteIR3 * gteIR3) >> shift);
486 gteIR1 = limB1(gteMAC1 >> shift, lm);
487 gteIR2 = limB2(gteMAC2 >> shift, lm);
488 gteIR3 = limB3(gteMAC3 >> shift, lm);
493 GTE_LOG("GTE NCCS\n");
497 gteMAC1 = A1((((s64)gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12);
498 gteMAC2 = A2((((s64)gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12);
499 gteMAC3 = A3((((s64)gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12);
500 gteIR1 = limB1(gteMAC1, 1);
501 gteIR2 = limB2(gteMAC2, 1);
502 gteIR3 = limB3(gteMAC3, 1);
503 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
504 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
505 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
506 gteIR1 = limB1(gteMAC1, 1);
507 gteIR2 = limB2(gteMAC2, 1);
508 gteIR3 = limB3(gteMAC3, 1);
509 gteMAC1 = A1(((s64)gteR * gteIR1) >> 8);
510 gteMAC2 = A2(((s64)gteG * gteIR2) >> 8);
511 gteMAC3 = A3(((s64)gteB * gteIR3) >> 8);
512 gteIR1 = limB1(gteMAC1, 1);
513 gteIR2 = limB2(gteMAC2, 1);
514 gteIR3 = limB3(gteMAC3, 1);
519 gteR2 = limC1(gteMAC1 >> 4);
520 gteG2 = limC2(gteMAC2 >> 4);
521 gteB2 = limC3(gteMAC3 >> 4);
529 GTE_LOG("GTE NCCT\n");
533 for (v = 0; v < 3; v++) {
537 gteMAC1 = A1((((s64)gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12);
538 gteMAC2 = A2((((s64)gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12);
539 gteMAC3 = A3((((s64)gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12);
540 gteIR1 = limB1(gteMAC1, 1);
541 gteIR2 = limB2(gteMAC2, 1);
542 gteIR3 = limB3(gteMAC3, 1);
543 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
544 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
545 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
546 gteIR1 = limB1(gteMAC1, 1);
547 gteIR2 = limB2(gteMAC2, 1);
548 gteIR3 = limB3(gteMAC3, 1);
549 gteMAC1 = A1(((s64)gteR * gteIR1) >> 8);
550 gteMAC2 = A2(((s64)gteG * gteIR2) >> 8);
551 gteMAC3 = A3(((s64)gteB * gteIR3) >> 8);
556 gteR2 = limC1(gteMAC1 >> 4);
557 gteG2 = limC2(gteMAC2 >> 4);
558 gteB2 = limC3(gteMAC3 >> 4);
560 gteIR1 = limB1(gteMAC1, 1);
561 gteIR2 = limB2(gteMAC2, 1);
562 gteIR3 = limB3(gteMAC3, 1);
567 GTE_LOG("GTE NCDS\n");
571 gteMAC1 = A1((((s64)gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12);
572 gteMAC2 = A2((((s64)gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12);
573 gteMAC3 = A3((((s64)gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12);
574 gteIR1 = limB1(gteMAC1, 1);
575 gteIR2 = limB2(gteMAC2, 1);
576 gteIR3 = limB3(gteMAC3, 1);
577 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
578 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
579 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
580 gteIR1 = limB1(gteMAC1, 1);
581 gteIR2 = limB2(gteMAC2, 1);
582 gteIR3 = limB3(gteMAC3, 1);
583 gteMAC1 = A1(((((s64)gteR << 4) * gteIR1) + (gteIR0 * limB1(gteRFC - ((gteR * gteIR1) >> 8), 0))) >> 12);
584 gteMAC2 = A2(((((s64)gteG << 4) * gteIR2) + (gteIR0 * limB2(gteGFC - ((gteG * gteIR2) >> 8), 0))) >> 12);
585 gteMAC3 = A3(((((s64)gteB << 4) * gteIR3) + (gteIR0 * limB3(gteBFC - ((gteB * gteIR3) >> 8), 0))) >> 12);
586 gteIR1 = limB1(gteMAC1, 1);
587 gteIR2 = limB2(gteMAC2, 1);
588 gteIR3 = limB3(gteMAC3, 1);
593 gteR2 = limC1(gteMAC1 >> 4);
594 gteG2 = limC2(gteMAC2 >> 4);
595 gteB2 = limC3(gteMAC3 >> 4);
603 GTE_LOG("GTE NCDT\n");
607 for (v = 0; v < 3; v++) {
611 gteMAC1 = A1((((s64)gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12);
612 gteMAC2 = A2((((s64)gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12);
613 gteMAC3 = A3((((s64)gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12);
614 gteIR1 = limB1(gteMAC1, 1);
615 gteIR2 = limB2(gteMAC2, 1);
616 gteIR3 = limB3(gteMAC3, 1);
617 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
618 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
619 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
620 gteIR1 = limB1(gteMAC1, 1);
621 gteIR2 = limB2(gteMAC2, 1);
622 gteIR3 = limB3(gteMAC3, 1);
623 gteMAC1 = A1(((((s64)gteR << 4) * gteIR1) + (gteIR0 * limB1(gteRFC - ((gteR * gteIR1) >> 8), 0))) >> 12);
624 gteMAC2 = A2(((((s64)gteG << 4) * gteIR2) + (gteIR0 * limB2(gteGFC - ((gteG * gteIR2) >> 8), 0))) >> 12);
625 gteMAC3 = A3(((((s64)gteB << 4) * gteIR3) + (gteIR0 * limB3(gteBFC - ((gteB * gteIR3) >> 8), 0))) >> 12);
630 gteR2 = limC1(gteMAC1 >> 4);
631 gteG2 = limC2(gteMAC2 >> 4);
632 gteB2 = limC3(gteMAC3 >> 4);
634 gteIR1 = limB1(gteMAC1, 1);
635 gteIR2 = limB2(gteMAC2, 1);
636 gteIR3 = limB3(gteMAC3, 1);
640 int shift = 12 * GTE_SF(gteop);
641 int lm = GTE_LM(gteop);
648 gteMAC1 = A1(((s64)(gteR22 * gteIR3) - (gteR33 * gteIR2)) >> shift);
649 gteMAC2 = A2(((s64)(gteR33 * gteIR1) - (gteR11 * gteIR3)) >> shift);
650 gteMAC3 = A3(((s64)(gteR11 * gteIR2) - (gteR22 * gteIR1)) >> shift);
651 gteIR1 = limB1(gteMAC1, lm);
652 gteIR2 = limB2(gteMAC2, lm);
653 gteIR3 = limB3(gteMAC3, lm);
657 int lm = GTE_LM(gteop);
659 s64 RIR1 = ((s64)gteR * gteIR1) >> 8;
660 s64 GIR2 = ((s64)gteG * gteIR2) >> 8;
661 s64 BIR3 = ((s64)gteB * gteIR3) >> 8;
664 GTE_LOG("GTE DCPL\n");
668 gteMAC1 = A1(RIR1 + ((gteIR0 * limB1(gteRFC - RIR1, 0)) >> 12));
669 gteMAC2 = A2(GIR2 + ((gteIR0 * limB1(gteGFC - GIR2, 0)) >> 12));
670 gteMAC3 = A3(BIR3 + ((gteIR0 * limB1(gteBFC - BIR3, 0)) >> 12));
672 gteIR1 = limB1(gteMAC1, lm);
673 gteIR2 = limB2(gteMAC2, lm);
674 gteIR3 = limB3(gteMAC3, lm);
679 gteR2 = limC1(gteMAC1 >> 4);
680 gteG2 = limC2(gteMAC2 >> 4);
681 gteB2 = limC3(gteMAC3 >> 4);
685 int shift = 12 * GTE_SF(gteop);
688 GTE_LOG("GTE GPF\n");
692 gteMAC1 = A1(((s64)gteIR0 * gteIR1) >> shift);
693 gteMAC2 = A2(((s64)gteIR0 * gteIR2) >> shift);
694 gteMAC3 = A3(((s64)gteIR0 * gteIR3) >> shift);
695 gteIR1 = limB1(gteMAC1, 0);
696 gteIR2 = limB2(gteMAC2, 0);
697 gteIR3 = limB3(gteMAC3, 0);
702 gteR2 = limC1(gteMAC1 >> 4);
703 gteG2 = limC2(gteMAC2 >> 4);
704 gteB2 = limC3(gteMAC3 >> 4);
708 int shift = 12 * GTE_SF(gteop);
711 GTE_LOG("GTE GPL\n");
715 gteMAC1 = A1((((s64)gteMAC1 << shift) + (gteIR0 * gteIR1)) >> shift);
716 gteMAC2 = A2((((s64)gteMAC2 << shift) + (gteIR0 * gteIR2)) >> shift);
717 gteMAC3 = A3((((s64)gteMAC3 << shift) + (gteIR0 * gteIR3)) >> shift);
718 gteIR1 = limB1(gteMAC1, 0);
719 gteIR2 = limB2(gteMAC2, 0);
720 gteIR3 = limB3(gteMAC3, 0);
725 gteR2 = limC1(gteMAC1 >> 4);
726 gteG2 = limC2(gteMAC2 >> 4);
727 gteB2 = limC3(gteMAC3 >> 4);
731 int shift = 12 * GTE_SF(gteop);
734 GTE_LOG("GTE DPCS\n");
738 gteMAC1 = A1(((gteR << 16) + (gteIR0 * limB1(A1((s64)gteRFC - (gteR << 4)) << (12 - shift), 0))) >> 12);
739 gteMAC2 = A2(((gteG << 16) + (gteIR0 * limB2(A2((s64)gteGFC - (gteG << 4)) << (12 - shift), 0))) >> 12);
740 gteMAC3 = A3(((gteB << 16) + (gteIR0 * limB3(A3((s64)gteBFC - (gteB << 4)) << (12 - shift), 0))) >> 12);
742 gteIR1 = limB1(gteMAC1, 0);
743 gteIR2 = limB2(gteMAC2, 0);
744 gteIR3 = limB3(gteMAC3, 0);
748 gteR2 = limC1(gteMAC1 >> 4);
749 gteG2 = limC2(gteMAC2 >> 4);
750 gteB2 = limC3(gteMAC3 >> 4);
757 GTE_LOG("GTE DPCT\n");
761 for (v = 0; v < 3; v++) {
762 gteMAC1 = A1((((s64)gteR0 << 16) + ((s64)gteIR0 * (limB1(gteRFC - (gteR0 << 4), 0)))) >> 12);
763 gteMAC2 = A2((((s64)gteG0 << 16) + ((s64)gteIR0 * (limB1(gteGFC - (gteG0 << 4), 0)))) >> 12);
764 gteMAC3 = A3((((s64)gteB0 << 16) + ((s64)gteIR0 * (limB1(gteBFC - (gteB0 << 4), 0)))) >> 12);
769 gteR2 = limC1(gteMAC1 >> 4);
770 gteG2 = limC2(gteMAC2 >> 4);
771 gteB2 = limC3(gteMAC3 >> 4);
773 gteIR1 = limB1(gteMAC1, 0);
774 gteIR2 = limB2(gteMAC2, 0);
775 gteIR3 = limB3(gteMAC3, 0);
780 GTE_LOG("GTE NCS\n");
784 gteMAC1 = A1((((s64)gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12);
785 gteMAC2 = A2((((s64)gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12);
786 gteMAC3 = A3((((s64)gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12);
787 gteIR1 = limB1(gteMAC1, 1);
788 gteIR2 = limB2(gteMAC2, 1);
789 gteIR3 = limB3(gteMAC3, 1);
790 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
791 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
792 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
793 gteIR1 = limB1(gteMAC1, 1);
794 gteIR2 = limB2(gteMAC2, 1);
795 gteIR3 = limB3(gteMAC3, 1);
800 gteR2 = limC1(gteMAC1 >> 4);
801 gteG2 = limC2(gteMAC2 >> 4);
802 gteB2 = limC3(gteMAC3 >> 4);
810 GTE_LOG("GTE NCT\n");
814 for (v = 0; v < 3; v++) {
818 gteMAC1 = A1((((s64)gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12);
819 gteMAC2 = A2((((s64)gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12);
820 gteMAC3 = A3((((s64)gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12);
821 gteIR1 = limB1(gteMAC1, 1);
822 gteIR2 = limB2(gteMAC2, 1);
823 gteIR3 = limB3(gteMAC3, 1);
824 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
825 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
826 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
830 gteR2 = limC1(gteMAC1 >> 4);
831 gteG2 = limC2(gteMAC2 >> 4);
832 gteB2 = limC3(gteMAC3 >> 4);
834 gteIR1 = limB1(gteMAC1, 1);
835 gteIR2 = limB2(gteMAC2, 1);
836 gteIR3 = limB3(gteMAC3, 1);
845 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
846 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
847 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
848 gteIR1 = limB1(gteMAC1, 1);
849 gteIR2 = limB2(gteMAC2, 1);
850 gteIR3 = limB3(gteMAC3, 1);
851 gteMAC1 = A1(((s64)gteR * gteIR1) >> 8);
852 gteMAC2 = A2(((s64)gteG * gteIR2) >> 8);
853 gteMAC3 = A3(((s64)gteB * gteIR3) >> 8);
854 gteIR1 = limB1(gteMAC1, 1);
855 gteIR2 = limB2(gteMAC2, 1);
856 gteIR3 = limB3(gteMAC3, 1);
861 gteR2 = limC1(gteMAC1 >> 4);
862 gteG2 = limC2(gteMAC2 >> 4);
863 gteB2 = limC3(gteMAC3 >> 4);
867 int shift = 12 * GTE_SF(gteop);
868 int lm = GTE_LM(gteop);
871 GTE_LOG("GTE INTPL\n");
875 gteMAC1 = A1(((gteIR1 << 12) + (gteIR0 * limB1(((s64)gteRFC - gteIR1), 0))) >> shift);
876 gteMAC2 = A2(((gteIR2 << 12) + (gteIR0 * limB2(((s64)gteGFC - gteIR2), 0))) >> shift);
877 gteMAC3 = A3(((gteIR3 << 12) + (gteIR0 * limB3(((s64)gteBFC - gteIR3), 0))) >> shift);
878 gteIR1 = limB1(gteMAC1, lm);
879 gteIR2 = limB2(gteMAC2, lm);
880 gteIR3 = limB3(gteMAC3, lm);
884 gteR2 = limC1(gteMAC1 >> 4);
885 gteG2 = limC2(gteMAC2 >> 4);
886 gteB2 = limC3(gteMAC3 >> 4);
891 GTE_LOG("GTE CDP\n");
895 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
896 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
897 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
898 gteIR1 = limB1(gteMAC1, 1);
899 gteIR2 = limB2(gteMAC2, 1);
900 gteIR3 = limB3(gteMAC3, 1);
901 gteMAC1 = A1(((((s64)gteR << 4) * gteIR1) + (gteIR0 * limB1(gteRFC - ((gteR * gteIR1) >> 8), 0))) >> 12);
902 gteMAC2 = A2(((((s64)gteG << 4) * gteIR2) + (gteIR0 * limB2(gteGFC - ((gteG * gteIR2) >> 8), 0))) >> 12);
903 gteMAC3 = A3(((((s64)gteB << 4) * gteIR3) + (gteIR0 * limB3(gteBFC - ((gteB * gteIR3) >> 8), 0))) >> 12);
904 gteIR1 = limB1(gteMAC1, 1);
905 gteIR2 = limB2(gteMAC2, 1);
906 gteIR3 = limB3(gteMAC3, 1);
911 gteR2 = limC1(gteMAC1 >> 4);
912 gteG2 = limC2(gteMAC2 >> 4);
913 gteB2 = limC3(gteMAC3 >> 4);