drc: try to avoid full constant reload
[pcsx_rearmed.git] / libpcsxcore / gte.c
1 /***************************************************************************
2  *   PCSX-Revolution - PlayStation Emulator for Nintendo Wii               *
3  *   Copyright (C) 2009-2010  PCSX-Revolution Dev Team                     *
4  *   <http://code.google.com/p/pcsx-revolution/>                           *
5  *                                                                         *
6  *   This program is free software; you can redistribute it and/or modify  *
7  *   it under the terms of the GNU General Public License as published by  *
8  *   the Free Software Foundation; either version 2 of the License, or     *
9  *   (at your option) any later version.                                   *
10  *                                                                         *
11  *   This program is distributed in the hope that it will be useful,       *
12  *   but WITHOUT ANY WARRANTY; without even the implied warranty of        *
13  *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the         *
14  *   GNU General Public License for more details.                          *
15  *                                                                         *
16  *   You should have received a copy of the GNU General Public License     *
17  *   along with this program; if not, write to the                         *
18  *   Free Software Foundation, Inc.,                                       *
19  *   51 Franklin Street, Fifth Floor, Boston, MA 02111-1307 USA.           *
20  ***************************************************************************/
21
22 /*
23 * GTE functions.
24 */
25
26 #include "gte.h"
27 #include "psxmem.h"
28
29 #define VX(n) (n < 3 ? psxRegs.CP2D.p[n << 1].sw.l : psxRegs.CP2D.p[9].sw.l)
30 #define VY(n) (n < 3 ? psxRegs.CP2D.p[n << 1].sw.h : psxRegs.CP2D.p[10].sw.l)
31 #define VZ(n) (n < 3 ? psxRegs.CP2D.p[(n << 1) + 1].sw.l : psxRegs.CP2D.p[11].sw.l)
32 #define MX11(n) (n < 3 ? psxRegs.CP2C.p[(n << 3)].sw.l : 0)
33 #define MX12(n) (n < 3 ? psxRegs.CP2C.p[(n << 3)].sw.h : 0)
34 #define MX13(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 1].sw.l : 0)
35 #define MX21(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 1].sw.h : 0)
36 #define MX22(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 2].sw.l : 0)
37 #define MX23(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 2].sw.h : 0)
38 #define MX31(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 3].sw.l : 0)
39 #define MX32(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 3].sw.h : 0)
40 #define MX33(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 4].sw.l : 0)
41 #define CV1(n) (n < 3 ? (s32)psxRegs.CP2C.r[(n << 3) + 5] : 0)
42 #define CV2(n) (n < 3 ? (s32)psxRegs.CP2C.r[(n << 3) + 6] : 0)
43 #define CV3(n) (n < 3 ? (s32)psxRegs.CP2C.r[(n << 3) + 7] : 0)
44
45 #define fSX(n) ((psxRegs.CP2D.p)[((n) + 12)].sw.l)
46 #define fSY(n) ((psxRegs.CP2D.p)[((n) + 12)].sw.h)
47 #define fSZ(n) ((psxRegs.CP2D.p)[((n) + 17)].w.l) /* (n == 0) => SZ1; */
48
49 #define gteVXY0 (psxRegs.CP2D.r[0])
50 #define gteVX0  (psxRegs.CP2D.p[0].sw.l)
51 #define gteVY0  (psxRegs.CP2D.p[0].sw.h)
52 #define gteVZ0  (psxRegs.CP2D.p[1].sw.l)
53 #define gteVXY1 (psxRegs.CP2D.r[2])
54 #define gteVX1  (psxRegs.CP2D.p[2].sw.l)
55 #define gteVY1  (psxRegs.CP2D.p[2].sw.h)
56 #define gteVZ1  (psxRegs.CP2D.p[3].sw.l)
57 #define gteVXY2 (psxRegs.CP2D.r[4])
58 #define gteVX2  (psxRegs.CP2D.p[4].sw.l)
59 #define gteVY2  (psxRegs.CP2D.p[4].sw.h)
60 #define gteVZ2  (psxRegs.CP2D.p[5].sw.l)
61 #define gteRGB  (psxRegs.CP2D.r[6])
62 #define gteR    (psxRegs.CP2D.p[6].b.l)
63 #define gteG    (psxRegs.CP2D.p[6].b.h)
64 #define gteB    (psxRegs.CP2D.p[6].b.h2)
65 #define gteCODE (psxRegs.CP2D.p[6].b.h3)
66 #define gteOTZ  (psxRegs.CP2D.p[7].w.l)
67 #define gteIR0  (psxRegs.CP2D.p[8].sw.l)
68 #define gteIR1  (psxRegs.CP2D.p[9].sw.l)
69 #define gteIR2  (psxRegs.CP2D.p[10].sw.l)
70 #define gteIR3  (psxRegs.CP2D.p[11].sw.l)
71 #define gteSXY0 (psxRegs.CP2D.r[12])
72 #define gteSX0  (psxRegs.CP2D.p[12].sw.l)
73 #define gteSY0  (psxRegs.CP2D.p[12].sw.h)
74 #define gteSXY1 (psxRegs.CP2D.r[13])
75 #define gteSX1  (psxRegs.CP2D.p[13].sw.l)
76 #define gteSY1  (psxRegs.CP2D.p[13].sw.h)
77 #define gteSXY2 (psxRegs.CP2D.r[14])
78 #define gteSX2  (psxRegs.CP2D.p[14].sw.l)
79 #define gteSY2  (psxRegs.CP2D.p[14].sw.h)
80 #define gteSXYP (psxRegs.CP2D.r[15])
81 #define gteSXP  (psxRegs.CP2D.p[15].sw.l)
82 #define gteSYP  (psxRegs.CP2D.p[15].sw.h)
83 #define gteSZ0  (psxRegs.CP2D.p[16].w.l)
84 #define gteSZ1  (psxRegs.CP2D.p[17].w.l)
85 #define gteSZ2  (psxRegs.CP2D.p[18].w.l)
86 #define gteSZ3  (psxRegs.CP2D.p[19].w.l)
87 #define gteRGB0  (psxRegs.CP2D.r[20])
88 #define gteR0    (psxRegs.CP2D.p[20].b.l)
89 #define gteG0    (psxRegs.CP2D.p[20].b.h)
90 #define gteB0    (psxRegs.CP2D.p[20].b.h2)
91 #define gteCODE0 (psxRegs.CP2D.p[20].b.h3)
92 #define gteRGB1  (psxRegs.CP2D.r[21])
93 #define gteR1    (psxRegs.CP2D.p[21].b.l)
94 #define gteG1    (psxRegs.CP2D.p[21].b.h)
95 #define gteB1    (psxRegs.CP2D.p[21].b.h2)
96 #define gteCODE1 (psxRegs.CP2D.p[21].b.h3)
97 #define gteRGB2  (psxRegs.CP2D.r[22])
98 #define gteR2    (psxRegs.CP2D.p[22].b.l)
99 #define gteG2    (psxRegs.CP2D.p[22].b.h)
100 #define gteB2    (psxRegs.CP2D.p[22].b.h2)
101 #define gteCODE2 (psxRegs.CP2D.p[22].b.h3)
102 #define gteRES1  (psxRegs.CP2D.r[23])
103 #define gteMAC0  (((s32 *)psxRegs.CP2D.r)[24])
104 #define gteMAC1  (((s32 *)psxRegs.CP2D.r)[25])
105 #define gteMAC2  (((s32 *)psxRegs.CP2D.r)[26])
106 #define gteMAC3  (((s32 *)psxRegs.CP2D.r)[27])
107 #define gteIRGB  (psxRegs.CP2D.r[28])
108 #define gteORGB  (psxRegs.CP2D.r[29])
109 #define gteLZCS  (psxRegs.CP2D.r[30])
110 #define gteLZCR  (psxRegs.CP2D.r[31])
111
112 #define gteR11R12 (((s32 *)psxRegs.CP2C.r)[0])
113 #define gteR22R23 (((s32 *)psxRegs.CP2C.r)[2])
114 #define gteR11 (psxRegs.CP2C.p[0].sw.l)
115 #define gteR12 (psxRegs.CP2C.p[0].sw.h)
116 #define gteR13 (psxRegs.CP2C.p[1].sw.l)
117 #define gteR21 (psxRegs.CP2C.p[1].sw.h)
118 #define gteR22 (psxRegs.CP2C.p[2].sw.l)
119 #define gteR23 (psxRegs.CP2C.p[2].sw.h)
120 #define gteR31 (psxRegs.CP2C.p[3].sw.l)
121 #define gteR32 (psxRegs.CP2C.p[3].sw.h)
122 #define gteR33 (psxRegs.CP2C.p[4].sw.l)
123 #define gteTRX (((s32 *)psxRegs.CP2C.r)[5])
124 #define gteTRY (((s32 *)psxRegs.CP2C.r)[6])
125 #define gteTRZ (((s32 *)psxRegs.CP2C.r)[7])
126 #define gteL11 (psxRegs.CP2C.p[8].sw.l)
127 #define gteL12 (psxRegs.CP2C.p[8].sw.h)
128 #define gteL13 (psxRegs.CP2C.p[9].sw.l)
129 #define gteL21 (psxRegs.CP2C.p[9].sw.h)
130 #define gteL22 (psxRegs.CP2C.p[10].sw.l)
131 #define gteL23 (psxRegs.CP2C.p[10].sw.h)
132 #define gteL31 (psxRegs.CP2C.p[11].sw.l)
133 #define gteL32 (psxRegs.CP2C.p[11].sw.h)
134 #define gteL33 (psxRegs.CP2C.p[12].sw.l)
135 #define gteRBK (((s32 *)psxRegs.CP2C.r)[13])
136 #define gteGBK (((s32 *)psxRegs.CP2C.r)[14])
137 #define gteBBK (((s32 *)psxRegs.CP2C.r)[15])
138 #define gteLR1 (psxRegs.CP2C.p[16].sw.l)
139 #define gteLR2 (psxRegs.CP2C.p[16].sw.h)
140 #define gteLR3 (psxRegs.CP2C.p[17].sw.l)
141 #define gteLG1 (psxRegs.CP2C.p[17].sw.h)
142 #define gteLG2 (psxRegs.CP2C.p[18].sw.l)
143 #define gteLG3 (psxRegs.CP2C.p[18].sw.h)
144 #define gteLB1 (psxRegs.CP2C.p[19].sw.l)
145 #define gteLB2 (psxRegs.CP2C.p[19].sw.h)
146 #define gteLB3 (psxRegs.CP2C.p[20].sw.l)
147 #define gteRFC (((s32 *)psxRegs.CP2C.r)[21])
148 #define gteGFC (((s32 *)psxRegs.CP2C.r)[22])
149 #define gteBFC (((s32 *)psxRegs.CP2C.r)[23])
150 #define gteOFX (((s32 *)psxRegs.CP2C.r)[24])
151 #define gteOFY (((s32 *)psxRegs.CP2C.r)[25])
152 #define gteH   (psxRegs.CP2C.p[26].sw.l)
153 #define gteDQA (psxRegs.CP2C.p[27].sw.l)
154 #define gteDQB (((s32 *)psxRegs.CP2C.r)[28])
155 #define gteZSF3 (psxRegs.CP2C.p[29].sw.l)
156 #define gteZSF4 (psxRegs.CP2C.p[30].sw.l)
157 #define gteFLAG (psxRegs.CP2C.r[31])
158
159 #define GTE_OP(op) ((op >> 20) & 31)
160 #define GTE_SF(op) ((op >> 19) & 1)
161 #define GTE_MX(op) ((op >> 17) & 3)
162 #define GTE_V(op) ((op >> 15) & 3)
163 #define GTE_CV(op) ((op >> 13) & 3)
164 #define GTE_CD(op) ((op >> 11) & 3) /* not used */
165 #define GTE_LM(op) ((op >> 10) & 1)
166 #define GTE_CT(op) ((op >> 6) & 15) /* not used */
167 #define GTE_FUNCT(op) (op & 63)
168
169 #define gteop (psxRegs.code & 0x1ffffff)
170
171 #ifndef FLAGLESS
172
173 static inline s64 BOUNDS(s64 n_value, s64 n_max, int n_maxflag, s64 n_min, int n_minflag) {
174         if (n_value > n_max) {
175                 gteFLAG |= n_maxflag;
176         } else if (n_value < n_min) {
177                 gteFLAG |= n_minflag;
178         }
179         return n_value;
180 }
181
182 static inline s32 LIM(s32 value, s32 max, s32 min, u32 flag) {
183         s32 ret = value;
184         if (value > max) {
185                 gteFLAG |= flag;
186                 ret = max;
187         } else if (value < min) {
188                 gteFLAG |= flag;
189                 ret = min;
190         }
191         return ret;
192 }
193
194 static inline u32 limE(u32 result) {
195         if (result > 0x1ffff) {
196                 gteFLAG |= (1 << 31) | (1 << 17);
197                 return 0x1ffff;
198         }
199         return result;
200 }
201
202 #else
203
204 #define BOUNDS(a, ...) (a)
205
206 static inline s32 LIM(s32 value, s32 max, s32 min, u32 flag_unused) {
207         s32 ret = value;
208         if (value > max)
209                 ret = max;
210         else if (value < min)
211                 ret = min;
212         return ret;
213 }
214
215 static inline u32 limE(u32 result) {
216         if (result > 0x1ffff)
217                 return 0x1ffff;
218         return result;
219 }
220
221 #endif
222
223 #define A1(a) BOUNDS((a), 0x7fffffff, (1 << 30), -(s64)0x80000000, (1 << 31) | (1 << 27))
224 #define A2(a) BOUNDS((a), 0x7fffffff, (1 << 29), -(s64)0x80000000, (1 << 31) | (1 << 26))
225 #define A3(a) BOUNDS((a), 0x7fffffff, (1 << 28), -(s64)0x80000000, (1 << 31) | (1 << 25))
226 #define limB1(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 31) | (1 << 24))
227 #define limB2(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 31) | (1 << 23))
228 #define limB3(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 22))
229 #define limC1(a) LIM((a), 0x00ff, 0x0000, (1 << 21))
230 #define limC2(a) LIM((a), 0x00ff, 0x0000, (1 << 20))
231 #define limC3(a) LIM((a), 0x00ff, 0x0000, (1 << 19))
232 #define limD(a) LIM((a), 0xffff, 0x0000, (1 << 31) | (1 << 18))
233
234 #define F(a) BOUNDS((a), 0x7fffffff, (1 << 31) | (1 << 16), -(s64)0x80000000, (1 << 31) | (1 << 15))
235 #define limG1(a) LIM((a), 0x3ff, -0x400, (1 << 31) | (1 << 14))
236 #define limG2(a) LIM((a), 0x3ff, -0x400, (1 << 31) | (1 << 13))
237 #define limH(a) LIM((a), 0x1000, 0x0000, (1 << 12))
238
239 #include "gte_divider.h"
240
241 #ifndef FLAGLESS
242
243 static inline u32 MFC2(int reg) {
244         switch (reg) {
245                 case 1:
246                 case 3:
247                 case 5:
248                 case 8:
249                 case 9:
250                 case 10:
251                 case 11:
252                         psxRegs.CP2D.r[reg] = (s32)psxRegs.CP2D.p[reg].sw.l;
253                         break;
254
255                 case 7:
256                 case 16:
257                 case 17:
258                 case 18:
259                 case 19:
260                         psxRegs.CP2D.r[reg] = (u32)psxRegs.CP2D.p[reg].w.l;
261                         break;
262
263                 case 15:
264                         psxRegs.CP2D.r[reg] = gteSXY2;
265                         break;
266
267                 case 28:
268                 case 29:
269                         psxRegs.CP2D.r[reg] = LIM(gteIR1 >> 7, 0x1f, 0, 0) |
270                                                                         (LIM(gteIR2 >> 7, 0x1f, 0, 0) << 5) |
271                                                                         (LIM(gteIR3 >> 7, 0x1f, 0, 0) << 10);
272                         break;
273         }
274         return psxRegs.CP2D.r[reg];
275 }
276
277 static inline void MTC2(u32 value, int reg) {
278         switch (reg) {
279                 case 15:
280                         gteSXY0 = gteSXY1;
281                         gteSXY1 = gteSXY2;
282                         gteSXY2 = value;
283                         gteSXYP = value;
284                         break;
285
286                 case 28:
287                         gteIRGB = value;
288                         gteIR1 = (value & 0x1f) << 7;
289                         gteIR2 = (value & 0x3e0) << 2;
290                         gteIR3 = (value & 0x7c00) >> 3;
291                         break;
292
293                 case 30:
294                         {
295                                 int a;
296                                 gteLZCS = value;
297
298                                 a = gteLZCS;
299                                 if (a > 0) {
300                                         int i;
301                                         for (i = 31; (a & (1 << i)) == 0 && i >= 0; i--);
302                                         gteLZCR = 31 - i;
303                                 } else if (a < 0) {
304                                         int i;
305                                         a ^= 0xffffffff;
306                                         for (i = 31; (a & (1 << i)) == 0 && i >= 0; i--);
307                                         gteLZCR = 31 - i;
308                                 } else {
309                                         gteLZCR = 32;
310                                 }
311                         }
312                         break;
313
314                 case 31:
315                         return;
316
317                 default:
318                         psxRegs.CP2D.r[reg] = value;
319         }
320 }
321
322 static inline void CTC2(u32 value, int reg) {
323         switch (reg) {
324                 case 4:
325                 case 12:
326                 case 20:
327                 case 26:
328                 case 27:
329                 case 29:
330                 case 30:
331                         value = (s32)(s16)value;
332                         break;
333
334                 case 31:
335                         value = value & 0x7ffff000;
336                         if (value & 0x7f87e000) value |= 0x80000000;
337                         break;
338         }
339
340         psxRegs.CP2C.r[reg] = value;
341 }
342
343 void gteMFC2() {
344         if (!_Rt_) return;
345         psxRegs.GPR.r[_Rt_] = MFC2(_Rd_);
346 }
347
348 void gteCFC2() {
349         if (!_Rt_) return;
350         psxRegs.GPR.r[_Rt_] = psxRegs.CP2C.r[_Rd_];
351 }
352
353 void gteMTC2() {
354         MTC2(psxRegs.GPR.r[_Rt_], _Rd_);
355 }
356
357 void gteCTC2() {
358         CTC2(psxRegs.GPR.r[_Rt_], _Rd_);
359 }
360
361 #define _oB_ (psxRegs.GPR.r[_Rs_] + _Imm_)
362
363 void gteLWC2() {
364         MTC2(psxMemRead32(_oB_), _Rt_);
365 }
366
367 void gteSWC2() {
368         psxMemWrite32(_oB_, MFC2(_Rt_));
369 }
370
371 #endif // FLAGLESS
372
373 #if 0
374 #define DIVIDE DIVIDE_
375 static u32 DIVIDE_(s16 n, u16 d) {
376         if (n >= 0 && n < d * 2) {
377                 s32 n_ = n;
378                 return ((n_ << 16) + d / 2) / d;
379                 //return (u32)((float)(n_ << 16) / (float)d + (float)0.5);
380         }
381         return 0xffffffff;
382 }
383 #endif
384
385 void gteRTPS() {
386         int quotient;
387
388 #ifdef GTE_LOG
389         GTE_LOG("GTE RTPS\n");
390 #endif
391         gteFLAG = 0;
392
393         gteMAC1 = A1((((s64)gteTRX << 12) + (gteR11 * gteVX0) + (gteR12 * gteVY0) + (gteR13 * gteVZ0)) >> 12);
394         gteMAC2 = A2((((s64)gteTRY << 12) + (gteR21 * gteVX0) + (gteR22 * gteVY0) + (gteR23 * gteVZ0)) >> 12);
395         gteMAC3 = A3((((s64)gteTRZ << 12) + (gteR31 * gteVX0) + (gteR32 * gteVY0) + (gteR33 * gteVZ0)) >> 12);
396         gteIR1 = limB1(gteMAC1, 0);
397         gteIR2 = limB2(gteMAC2, 0);
398         gteIR3 = limB3(gteMAC3, 0);
399         gteSZ0 = gteSZ1;
400         gteSZ1 = gteSZ2;
401         gteSZ2 = gteSZ3;
402         gteSZ3 = limD(gteMAC3);
403         quotient = limE(DIVIDE(gteH, gteSZ3));
404         gteSXY0 = gteSXY1;
405         gteSXY1 = gteSXY2;
406         gteSX2 = limG1(F((s64)gteOFX + ((s64)gteIR1 * quotient)) >> 16);
407         gteSY2 = limG2(F((s64)gteOFY + ((s64)gteIR2 * quotient)) >> 16);
408
409         gteMAC0 = F((s64)gteDQB + ((s64)gteDQA * quotient));
410         gteIR0 = limH(gteMAC0 >> 12);
411 }
412
413 void gteRTPT() {
414         int quotient;
415         int v;
416         s32 vx, vy, vz;
417
418 #ifdef GTE_LOG
419         GTE_LOG("GTE RTPT\n");
420 #endif
421         gteFLAG = 0;
422
423         gteSZ0 = gteSZ3;
424         for (v = 0; v < 3; v++) {
425                 vx = VX(v);
426                 vy = VY(v);
427                 vz = VZ(v);
428                 gteMAC1 = A1((((s64)gteTRX << 12) + (gteR11 * vx) + (gteR12 * vy) + (gteR13 * vz)) >> 12);
429                 gteMAC2 = A2((((s64)gteTRY << 12) + (gteR21 * vx) + (gteR22 * vy) + (gteR23 * vz)) >> 12);
430                 gteMAC3 = A3((((s64)gteTRZ << 12) + (gteR31 * vx) + (gteR32 * vy) + (gteR33 * vz)) >> 12);
431                 gteIR1 = limB1(gteMAC1, 0);
432                 gteIR2 = limB2(gteMAC2, 0);
433                 gteIR3 = limB3(gteMAC3, 0);
434                 fSZ(v) = limD(gteMAC3);
435                 quotient = limE(DIVIDE(gteH, fSZ(v)));
436                 fSX(v) = limG1(F((s64)gteOFX + ((s64)gteIR1 * quotient)) >> 16);
437                 fSY(v) = limG2(F((s64)gteOFY + ((s64)gteIR2 * quotient)) >> 16);
438         }
439         gteMAC0 = F((s64)gteDQB + ((s64)gteDQA * quotient));
440         gteIR0 = limH(gteMAC0 >> 12);
441 }
442
443 void gteMVMVA() {
444         int shift = 12 * GTE_SF(gteop);
445         int mx = GTE_MX(gteop);
446         int v = GTE_V(gteop);
447         int cv = GTE_CV(gteop);
448         int lm = GTE_LM(gteop);
449         s32 vx = VX(v);
450         s32 vy = VY(v);
451         s32 vz = VZ(v);
452
453 #ifdef GTE_LOG
454         GTE_LOG("GTE MVMVA\n");
455 #endif
456         gteFLAG = 0;
457
458         gteMAC1 = A1((((s64)CV1(cv) << 12) + (MX11(mx) * vx) + (MX12(mx) * vy) + (MX13(mx) * vz)) >> shift);
459         gteMAC2 = A2((((s64)CV2(cv) << 12) + (MX21(mx) * vx) + (MX22(mx) * vy) + (MX23(mx) * vz)) >> shift);
460         gteMAC3 = A3((((s64)CV3(cv) << 12) + (MX31(mx) * vx) + (MX32(mx) * vy) + (MX33(mx) * vz)) >> shift);
461
462         gteIR1 = limB1(gteMAC1, lm);
463         gteIR2 = limB2(gteMAC2, lm);
464         gteIR3 = limB3(gteMAC3, lm);
465 }
466
467 void gteNCLIP() {
468 #ifdef GTE_LOG
469         GTE_LOG("GTE NCLIP\n");
470 #endif
471         gteFLAG = 0;
472
473         gteMAC0 = F((s64)gteSX0 * (gteSY1 - gteSY2) +
474                                 gteSX1 * (gteSY2 - gteSY0) +
475                                 gteSX2 * (gteSY0 - gteSY1));
476 }
477
478 void gteAVSZ3() {
479 #ifdef GTE_LOG
480         GTE_LOG("GTE AVSZ3\n");
481 #endif
482         gteFLAG = 0;
483
484         gteMAC0 = F((s64)(gteZSF3 * gteSZ1) + (gteZSF3 * gteSZ2) + (gteZSF3 * gteSZ3));
485         gteOTZ = limD(gteMAC0 >> 12);
486 }
487
488 void gteAVSZ4() {
489 #ifdef GTE_LOG
490         GTE_LOG("GTE AVSZ4\n");
491 #endif
492         gteFLAG = 0;
493
494         gteMAC0 = F((s64)(gteZSF4 * (gteSZ0 + gteSZ1 + gteSZ2 + gteSZ3)));
495         gteOTZ = limD(gteMAC0 >> 12);
496 }
497
498 void gteSQR() {
499         int shift = 12 * GTE_SF(gteop);
500         int lm = GTE_LM(gteop);
501
502 #ifdef GTE_LOG
503         GTE_LOG("GTE SQR\n");
504 #endif
505         gteFLAG = 0;
506
507         gteMAC1 = A1((gteIR1 * gteIR1) >> shift);
508         gteMAC2 = A2((gteIR2 * gteIR2) >> shift);
509         gteMAC3 = A3((gteIR3 * gteIR3) >> shift);
510         gteIR1 = limB1(gteMAC1, lm);
511         gteIR2 = limB2(gteMAC2, lm);
512         gteIR3 = limB3(gteMAC3, lm);
513 }
514
515 void gteNCCS() {
516 #ifdef GTE_LOG
517         GTE_LOG("GTE NCCS\n");
518 #endif
519         gteFLAG = 0;
520
521         gteMAC1 = A1((((s64)gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12);
522         gteMAC2 = A2((((s64)gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12);
523         gteMAC3 = A3((((s64)gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12);
524         gteIR1 = limB1(gteMAC1, 1);
525         gteIR2 = limB2(gteMAC2, 1);
526         gteIR3 = limB3(gteMAC3, 1);
527         gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
528         gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
529         gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
530         gteIR1 = limB1(gteMAC1, 1);
531         gteIR2 = limB2(gteMAC2, 1);
532         gteIR3 = limB3(gteMAC3, 1);
533         gteMAC1 = A1(((s64)gteR * gteIR1) >> 8);
534         gteMAC2 = A2(((s64)gteG * gteIR2) >> 8);
535         gteMAC3 = A3(((s64)gteB * gteIR3) >> 8);
536         gteIR1 = limB1(gteMAC1, 1);
537         gteIR2 = limB2(gteMAC2, 1);
538         gteIR3 = limB3(gteMAC3, 1);
539
540         gteRGB0 = gteRGB1;
541         gteRGB1 = gteRGB2;
542         gteCODE2 = gteCODE;
543         gteR2 = limC1(gteMAC1 >> 4);
544         gteG2 = limC2(gteMAC2 >> 4);
545         gteB2 = limC3(gteMAC3 >> 4);
546 }
547
548 void gteNCCT() {
549         int v;
550         s32 vx, vy, vz;
551
552 #ifdef GTE_LOG
553         GTE_LOG("GTE NCCT\n");
554 #endif
555         gteFLAG = 0;
556
557         for (v = 0; v < 3; v++) {
558                 vx = VX(v);
559                 vy = VY(v);
560                 vz = VZ(v);
561                 gteMAC1 = A1((((s64)gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12);
562                 gteMAC2 = A2((((s64)gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12);
563                 gteMAC3 = A3((((s64)gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12);
564                 gteIR1 = limB1(gteMAC1, 1);
565                 gteIR2 = limB2(gteMAC2, 1);
566                 gteIR3 = limB3(gteMAC3, 1);
567                 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
568                 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
569                 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
570                 gteIR1 = limB1(gteMAC1, 1);
571                 gteIR2 = limB2(gteMAC2, 1);
572                 gteIR3 = limB3(gteMAC3, 1);
573                 gteMAC1 = A1(((s64)gteR * gteIR1) >> 8);
574                 gteMAC2 = A2(((s64)gteG * gteIR2) >> 8);
575                 gteMAC3 = A3(((s64)gteB * gteIR3) >> 8);
576
577                 gteRGB0 = gteRGB1;
578                 gteRGB1 = gteRGB2;
579                 gteCODE2 = gteCODE;
580                 gteR2 = limC1(gteMAC1 >> 4);
581                 gteG2 = limC2(gteMAC2 >> 4);
582                 gteB2 = limC3(gteMAC3 >> 4);
583         }
584         gteIR1 = limB1(gteMAC1, 1);
585         gteIR2 = limB2(gteMAC2, 1);
586         gteIR3 = limB3(gteMAC3, 1);
587 }
588
589 void gteNCDS() {
590 #ifdef GTE_LOG
591         GTE_LOG("GTE NCDS\n");
592 #endif
593         gteFLAG = 0;
594
595         gteMAC1 = A1((((s64)gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12);
596         gteMAC2 = A2((((s64)gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12);
597         gteMAC3 = A3((((s64)gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12);
598         gteIR1 = limB1(gteMAC1, 1);
599         gteIR2 = limB2(gteMAC2, 1);
600         gteIR3 = limB3(gteMAC3, 1);
601         gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
602         gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
603         gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
604         gteIR1 = limB1(gteMAC1, 1);
605         gteIR2 = limB2(gteMAC2, 1);
606         gteIR3 = limB3(gteMAC3, 1);
607         gteMAC1 = A1(((((s64)gteR << 4) * gteIR1) + (gteIR0 * limB1(gteRFC - ((gteR * gteIR1) >> 8), 0))) >> 12);
608         gteMAC2 = A2(((((s64)gteG << 4) * gteIR2) + (gteIR0 * limB2(gteGFC - ((gteG * gteIR2) >> 8), 0))) >> 12);
609         gteMAC3 = A3(((((s64)gteB << 4) * gteIR3) + (gteIR0 * limB3(gteBFC - ((gteB * gteIR3) >> 8), 0))) >> 12);
610         gteIR1 = limB1(gteMAC1, 1);
611         gteIR2 = limB2(gteMAC2, 1);
612         gteIR3 = limB3(gteMAC3, 1);
613
614         gteRGB0 = gteRGB1;
615         gteRGB1 = gteRGB2;
616         gteCODE2 = gteCODE;
617         gteR2 = limC1(gteMAC1 >> 4);
618         gteG2 = limC2(gteMAC2 >> 4);
619         gteB2 = limC3(gteMAC3 >> 4);
620 }
621
622 void gteNCDT() {
623         int v;
624         s32 vx, vy, vz;
625
626 #ifdef GTE_LOG
627         GTE_LOG("GTE NCDT\n");
628 #endif
629         gteFLAG = 0;
630
631         for (v = 0; v < 3; v++) {
632                 vx = VX(v);
633                 vy = VY(v);
634                 vz = VZ(v);
635                 gteMAC1 = A1((((s64)gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12);
636                 gteMAC2 = A2((((s64)gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12);
637                 gteMAC3 = A3((((s64)gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12);
638                 gteIR1 = limB1(gteMAC1, 1);
639                 gteIR2 = limB2(gteMAC2, 1);
640                 gteIR3 = limB3(gteMAC3, 1);
641                 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
642                 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
643                 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
644                 gteIR1 = limB1(gteMAC1, 1);
645                 gteIR2 = limB2(gteMAC2, 1);
646                 gteIR3 = limB3(gteMAC3, 1);
647                 gteMAC1 = A1(((((s64)gteR << 4) * gteIR1) + (gteIR0 * limB1(gteRFC - ((gteR * gteIR1) >> 8), 0))) >> 12);
648                 gteMAC2 = A2(((((s64)gteG << 4) * gteIR2) + (gteIR0 * limB2(gteGFC - ((gteG * gteIR2) >> 8), 0))) >> 12);
649                 gteMAC3 = A3(((((s64)gteB << 4) * gteIR3) + (gteIR0 * limB3(gteBFC - ((gteB * gteIR3) >> 8), 0))) >> 12);
650
651                 gteRGB0 = gteRGB1;
652                 gteRGB1 = gteRGB2;
653                 gteCODE2 = gteCODE;
654                 gteR2 = limC1(gteMAC1 >> 4);
655                 gteG2 = limC2(gteMAC2 >> 4);
656                 gteB2 = limC3(gteMAC3 >> 4);
657         }
658         gteIR1 = limB1(gteMAC1, 1);
659         gteIR2 = limB2(gteMAC2, 1);
660         gteIR3 = limB3(gteMAC3, 1);
661 }
662
663 void gteOP() {
664         int shift = 12 * GTE_SF(gteop);
665         int lm = GTE_LM(gteop);
666
667 #ifdef GTE_LOG
668         GTE_LOG("GTE OP\n");
669 #endif
670         gteFLAG = 0;
671
672         gteMAC1 = A1(((s64)(gteR22 * gteIR3) - (gteR33 * gteIR2)) >> shift);
673         gteMAC2 = A2(((s64)(gteR33 * gteIR1) - (gteR11 * gteIR3)) >> shift);
674         gteMAC3 = A3(((s64)(gteR11 * gteIR2) - (gteR22 * gteIR1)) >> shift);
675         gteIR1 = limB1(gteMAC1, lm);
676         gteIR2 = limB2(gteMAC2, lm);
677         gteIR3 = limB3(gteMAC3, lm);
678 }
679
680 void gteDCPL() {
681         int lm = GTE_LM(gteop);
682
683         s64 RIR1 = ((s64)gteR * gteIR1) >> 8;
684         s64 GIR2 = ((s64)gteG * gteIR2) >> 8;
685         s64 BIR3 = ((s64)gteB * gteIR3) >> 8;
686
687 #ifdef GTE_LOG
688         GTE_LOG("GTE DCPL\n");
689 #endif
690         gteFLAG = 0;
691
692         gteMAC1 = A1(RIR1 + ((gteIR0 * limB1(gteRFC - RIR1, 0)) >> 12));
693         gteMAC2 = A2(GIR2 + ((gteIR0 * limB1(gteGFC - GIR2, 0)) >> 12));
694         gteMAC3 = A3(BIR3 + ((gteIR0 * limB1(gteBFC - BIR3, 0)) >> 12));
695
696         gteIR1 = limB1(gteMAC1, lm);
697         gteIR2 = limB2(gteMAC2, lm);
698         gteIR3 = limB3(gteMAC3, lm);
699
700         gteRGB0 = gteRGB1;
701         gteRGB1 = gteRGB2;
702         gteCODE2 = gteCODE;
703         gteR2 = limC1(gteMAC1 >> 4);
704         gteG2 = limC2(gteMAC2 >> 4);
705         gteB2 = limC3(gteMAC3 >> 4);
706 }
707
708 void gteGPF() {
709         int shift = 12 * GTE_SF(gteop);
710
711 #ifdef GTE_LOG
712         GTE_LOG("GTE GPF\n");
713 #endif
714         gteFLAG = 0;
715
716         gteMAC1 = A1(((s64)gteIR0 * gteIR1) >> shift);
717         gteMAC2 = A2(((s64)gteIR0 * gteIR2) >> shift);
718         gteMAC3 = A3(((s64)gteIR0 * gteIR3) >> shift);
719         gteIR1 = limB1(gteMAC1, 0);
720         gteIR2 = limB2(gteMAC2, 0);
721         gteIR3 = limB3(gteMAC3, 0);
722
723         gteRGB0 = gteRGB1;
724         gteRGB1 = gteRGB2;
725         gteCODE2 = gteCODE;
726         gteR2 = limC1(gteMAC1 >> 4);
727         gteG2 = limC2(gteMAC2 >> 4);
728         gteB2 = limC3(gteMAC3 >> 4);
729 }
730
731 void gteGPL() {
732         int shift = 12 * GTE_SF(gteop);
733
734 #ifdef GTE_LOG
735         GTE_LOG("GTE GPL\n");
736 #endif
737         gteFLAG = 0;
738
739         gteMAC1 = A1((((s64)gteMAC1 << shift) + (gteIR0 * gteIR1)) >> shift);
740         gteMAC2 = A2((((s64)gteMAC2 << shift) + (gteIR0 * gteIR2)) >> shift);
741         gteMAC3 = A3((((s64)gteMAC3 << shift) + (gteIR0 * gteIR3)) >> shift);
742         gteIR1 = limB1(gteMAC1, 0);
743         gteIR2 = limB2(gteMAC2, 0);
744         gteIR3 = limB3(gteMAC3, 0);
745
746         gteRGB0 = gteRGB1;
747         gteRGB1 = gteRGB2;
748         gteCODE2 = gteCODE;
749         gteR2 = limC1(gteMAC1 >> 4);
750         gteG2 = limC2(gteMAC2 >> 4);
751         gteB2 = limC3(gteMAC3 >> 4);
752 }
753
754 void gteDPCS() {
755         int shift = 12 * GTE_SF(gteop);
756
757 #ifdef GTE_LOG
758         GTE_LOG("GTE DPCS\n");
759 #endif
760         gteFLAG = 0;
761
762         gteMAC1 = A1(((gteR << 16) + (gteIR0 * limB1(A1((s64)gteRFC - (gteR << 4)) << (12 - shift), 0))) >> 12);
763         gteMAC2 = A2(((gteG << 16) + (gteIR0 * limB2(A2((s64)gteGFC - (gteG << 4)) << (12 - shift), 0))) >> 12);
764         gteMAC3 = A3(((gteB << 16) + (gteIR0 * limB3(A3((s64)gteBFC - (gteB << 4)) << (12 - shift), 0))) >> 12);
765
766         gteIR1 = limB1(gteMAC1, 0);
767         gteIR2 = limB2(gteMAC2, 0);
768         gteIR3 = limB3(gteMAC3, 0);
769         gteRGB0 = gteRGB1;
770         gteRGB1 = gteRGB2;
771         gteCODE2 = gteCODE;
772         gteR2 = limC1(gteMAC1 >> 4);
773         gteG2 = limC2(gteMAC2 >> 4);
774         gteB2 = limC3(gteMAC3 >> 4);
775 }
776
777 void gteDPCT() {
778         int v;
779
780 #ifdef GTE_LOG
781         GTE_LOG("GTE DPCT\n");
782 #endif
783         gteFLAG = 0;
784
785         for (v = 0; v < 3; v++) {
786                 gteMAC1 = A1((((s64)gteR0 << 16) + ((s64)gteIR0 * (limB1(gteRFC - (gteR0 << 4), 0)))) >> 12);
787                 gteMAC2 = A2((((s64)gteG0 << 16) + ((s64)gteIR0 * (limB1(gteGFC - (gteG0 << 4), 0)))) >> 12);
788                 gteMAC3 = A3((((s64)gteB0 << 16) + ((s64)gteIR0 * (limB1(gteBFC - (gteB0 << 4), 0)))) >> 12);
789
790                 gteRGB0 = gteRGB1;
791                 gteRGB1 = gteRGB2;
792                 gteCODE2 = gteCODE;
793                 gteR2 = limC1(gteMAC1 >> 4);
794                 gteG2 = limC2(gteMAC2 >> 4);
795                 gteB2 = limC3(gteMAC3 >> 4);
796         }
797         gteIR1 = limB1(gteMAC1, 0);
798         gteIR2 = limB2(gteMAC2, 0);
799         gteIR3 = limB3(gteMAC3, 0);
800 }
801
802 void gteNCS() {
803 #ifdef GTE_LOG
804         GTE_LOG("GTE NCS\n");
805 #endif
806         gteFLAG = 0;
807
808         gteMAC1 = A1((((s64)gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12);
809         gteMAC2 = A2((((s64)gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12);
810         gteMAC3 = A3((((s64)gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12);
811         gteIR1 = limB1(gteMAC1, 1);
812         gteIR2 = limB2(gteMAC2, 1);
813         gteIR3 = limB3(gteMAC3, 1);
814         gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
815         gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
816         gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
817         gteIR1 = limB1(gteMAC1, 1);
818         gteIR2 = limB2(gteMAC2, 1);
819         gteIR3 = limB3(gteMAC3, 1);
820
821         gteRGB0 = gteRGB1;
822         gteRGB1 = gteRGB2;
823         gteCODE2 = gteCODE;
824         gteR2 = limC1(gteMAC1 >> 4);
825         gteG2 = limC2(gteMAC2 >> 4);
826         gteB2 = limC3(gteMAC3 >> 4);
827 }
828
829 void gteNCT() {
830         int v;
831         s32 vx, vy, vz;
832
833 #ifdef GTE_LOG
834         GTE_LOG("GTE NCT\n");
835 #endif
836         gteFLAG = 0;
837
838         for (v = 0; v < 3; v++) {
839                 vx = VX(v);
840                 vy = VY(v);
841                 vz = VZ(v);
842                 gteMAC1 = A1((((s64)gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12);
843                 gteMAC2 = A2((((s64)gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12);
844                 gteMAC3 = A3((((s64)gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12);
845                 gteIR1 = limB1(gteMAC1, 1);
846                 gteIR2 = limB2(gteMAC2, 1);
847                 gteIR3 = limB3(gteMAC3, 1);
848                 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
849                 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
850                 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
851                 gteRGB0 = gteRGB1;
852                 gteRGB1 = gteRGB2;
853                 gteCODE2 = gteCODE;
854                 gteR2 = limC1(gteMAC1 >> 4);
855                 gteG2 = limC2(gteMAC2 >> 4);
856                 gteB2 = limC3(gteMAC3 >> 4);
857         }
858         gteIR1 = limB1(gteMAC1, 1);
859         gteIR2 = limB2(gteMAC2, 1);
860         gteIR3 = limB3(gteMAC3, 1);
861 }
862
863 void gteCC() {
864 #ifdef GTE_LOG
865         GTE_LOG("GTE CC\n");
866 #endif
867         gteFLAG = 0;
868
869         gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
870         gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
871         gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
872         gteIR1 = limB1(gteMAC1, 1);
873         gteIR2 = limB2(gteMAC2, 1);
874         gteIR3 = limB3(gteMAC3, 1);
875         gteMAC1 = A1(((s64)gteR * gteIR1) >> 8);
876         gteMAC2 = A2(((s64)gteG * gteIR2) >> 8);
877         gteMAC3 = A3(((s64)gteB * gteIR3) >> 8);
878         gteIR1 = limB1(gteMAC1, 1);
879         gteIR2 = limB2(gteMAC2, 1);
880         gteIR3 = limB3(gteMAC3, 1);
881
882         gteRGB0 = gteRGB1;
883         gteRGB1 = gteRGB2;
884         gteCODE2 = gteCODE;
885         gteR2 = limC1(gteMAC1 >> 4);
886         gteG2 = limC2(gteMAC2 >> 4);
887         gteB2 = limC3(gteMAC3 >> 4);
888 }
889
890 void gteINTPL() {
891         int shift = 12 * GTE_SF(gteop);
892         int lm = GTE_LM(gteop);
893
894 #ifdef GTE_LOG
895         GTE_LOG("GTE INTPL\n");
896 #endif
897         gteFLAG = 0;
898
899         gteMAC1 = A1(((gteIR1 << 12) + (gteIR0 * limB1(((s64)gteRFC - gteIR1), 0))) >> shift);
900         gteMAC2 = A2(((gteIR2 << 12) + (gteIR0 * limB2(((s64)gteGFC - gteIR2), 0))) >> shift);
901         gteMAC3 = A3(((gteIR3 << 12) + (gteIR0 * limB3(((s64)gteBFC - gteIR3), 0))) >> shift);
902         gteIR1 = limB1(gteMAC1, lm);
903         gteIR2 = limB2(gteMAC2, lm);
904         gteIR3 = limB3(gteMAC3, lm);
905         gteRGB0 = gteRGB1;
906         gteRGB1 = gteRGB2;
907         gteCODE2 = gteCODE;
908         gteR2 = limC1(gteMAC1 >> 4);
909         gteG2 = limC2(gteMAC2 >> 4);
910         gteB2 = limC3(gteMAC3 >> 4);
911 }
912
913 void gteCDP() {
914 #ifdef GTE_LOG
915         GTE_LOG("GTE CDP\n");
916 #endif
917         gteFLAG = 0;
918
919         gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
920         gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
921         gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
922         gteIR1 = limB1(gteMAC1, 1);
923         gteIR2 = limB2(gteMAC2, 1);
924         gteIR3 = limB3(gteMAC3, 1);
925         gteMAC1 = A1(((((s64)gteR << 4) * gteIR1) + (gteIR0 * limB1(gteRFC - ((gteR * gteIR1) >> 8), 0))) >> 12);
926         gteMAC2 = A2(((((s64)gteG << 4) * gteIR2) + (gteIR0 * limB2(gteGFC - ((gteG * gteIR2) >> 8), 0))) >> 12);
927         gteMAC3 = A3(((((s64)gteB << 4) * gteIR3) + (gteIR0 * limB3(gteBFC - ((gteB * gteIR3) >> 8), 0))) >> 12);
928         gteIR1 = limB1(gteMAC1, 1);
929         gteIR2 = limB2(gteMAC2, 1);
930         gteIR3 = limB3(gteMAC3, 1);
931
932         gteRGB0 = gteRGB1;
933         gteRGB1 = gteRGB2;
934         gteCODE2 = gteCODE;
935         gteR2 = limC1(gteMAC1 >> 4);
936         gteG2 = limC2(gteMAC2 >> 4);
937         gteB2 = limC3(gteMAC3 >> 4);
938 }