change lcf handling
[pcsx_rearmed.git] / libpcsxcore / gte.c
1 /***************************************************************************
2  *   PCSX-Revolution - PlayStation Emulator for Nintendo Wii               *
3  *   Copyright (C) 2009-2010  PCSX-Revolution Dev Team                     *
4  *   <http://code.google.com/p/pcsx-revolution/>                           *
5  *                                                                         *
6  *   This program is free software; you can redistribute it and/or modify  *
7  *   it under the terms of the GNU General Public License as published by  *
8  *   the Free Software Foundation; either version 2 of the License, or     *
9  *   (at your option) any later version.                                   *
10  *                                                                         *
11  *   This program is distributed in the hope that it will be useful,       *
12  *   but WITHOUT ANY WARRANTY; without even the implied warranty of        *
13  *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the         *
14  *   GNU General Public License for more details.                          *
15  *                                                                         *
16  *   You should have received a copy of the GNU General Public License     *
17  *   along with this program; if not, write to the                         *
18  *   Free Software Foundation, Inc.,                                       *
19  *   51 Franklin Street, Fifth Floor, Boston, MA 02111-1307 USA.           *
20  ***************************************************************************/
21
22 /*
23 * GTE functions.
24 */
25
26 #include "gte.h"
27 #include "psxmem.h"
28
29 typedef struct psxCP2Regs {
30         psxCP2Data CP2D;        /* Cop2 data registers */
31         psxCP2Ctrl CP2C;        /* Cop2 control registers */
32 } psxCP2Regs;
33
34 #define VX(n) (n < 3 ? regs->CP2D.p[n << 1].sw.l : regs->CP2D.p[9].sw.l)
35 #define VY(n) (n < 3 ? regs->CP2D.p[n << 1].sw.h : regs->CP2D.p[10].sw.l)
36 #define VZ(n) (n < 3 ? regs->CP2D.p[(n << 1) + 1].sw.l : regs->CP2D.p[11].sw.l)
37 #define MX11(n) (n < 3 ? regs->CP2C.p[(n << 3)].sw.l : 0)
38 #define MX12(n) (n < 3 ? regs->CP2C.p[(n << 3)].sw.h : 0)
39 #define MX13(n) (n < 3 ? regs->CP2C.p[(n << 3) + 1].sw.l : 0)
40 #define MX21(n) (n < 3 ? regs->CP2C.p[(n << 3) + 1].sw.h : 0)
41 #define MX22(n) (n < 3 ? regs->CP2C.p[(n << 3) + 2].sw.l : 0)
42 #define MX23(n) (n < 3 ? regs->CP2C.p[(n << 3) + 2].sw.h : 0)
43 #define MX31(n) (n < 3 ? regs->CP2C.p[(n << 3) + 3].sw.l : 0)
44 #define MX32(n) (n < 3 ? regs->CP2C.p[(n << 3) + 3].sw.h : 0)
45 #define MX33(n) (n < 3 ? regs->CP2C.p[(n << 3) + 4].sw.l : 0)
46 #define CV1(n) (n < 3 ? (s32)regs->CP2C.r[(n << 3) + 5] : 0)
47 #define CV2(n) (n < 3 ? (s32)regs->CP2C.r[(n << 3) + 6] : 0)
48 #define CV3(n) (n < 3 ? (s32)regs->CP2C.r[(n << 3) + 7] : 0)
49
50 #define fSX(n) ((regs->CP2D.p)[((n) + 12)].sw.l)
51 #define fSY(n) ((regs->CP2D.p)[((n) + 12)].sw.h)
52 #define fSZ(n) ((regs->CP2D.p)[((n) + 17)].w.l) /* (n == 0) => SZ1; */
53
54 #define gteVXY0 (regs->CP2D.r[0])
55 #define gteVX0  (regs->CP2D.p[0].sw.l)
56 #define gteVY0  (regs->CP2D.p[0].sw.h)
57 #define gteVZ0  (regs->CP2D.p[1].sw.l)
58 #define gteVXY1 (regs->CP2D.r[2])
59 #define gteVX1  (regs->CP2D.p[2].sw.l)
60 #define gteVY1  (regs->CP2D.p[2].sw.h)
61 #define gteVZ1  (regs->CP2D.p[3].sw.l)
62 #define gteVXY2 (regs->CP2D.r[4])
63 #define gteVX2  (regs->CP2D.p[4].sw.l)
64 #define gteVY2  (regs->CP2D.p[4].sw.h)
65 #define gteVZ2  (regs->CP2D.p[5].sw.l)
66 #define gteRGB  (regs->CP2D.r[6])
67 #define gteR    (regs->CP2D.p[6].b.l)
68 #define gteG    (regs->CP2D.p[6].b.h)
69 #define gteB    (regs->CP2D.p[6].b.h2)
70 #define gteCODE (regs->CP2D.p[6].b.h3)
71 #define gteOTZ  (regs->CP2D.p[7].w.l)
72 #define gteIR0  (regs->CP2D.p[8].sw.l)
73 #define gteIR1  (regs->CP2D.p[9].sw.l)
74 #define gteIR2  (regs->CP2D.p[10].sw.l)
75 #define gteIR3  (regs->CP2D.p[11].sw.l)
76 #define gteSXY0 (regs->CP2D.r[12])
77 #define gteSX0  (regs->CP2D.p[12].sw.l)
78 #define gteSY0  (regs->CP2D.p[12].sw.h)
79 #define gteSXY1 (regs->CP2D.r[13])
80 #define gteSX1  (regs->CP2D.p[13].sw.l)
81 #define gteSY1  (regs->CP2D.p[13].sw.h)
82 #define gteSXY2 (regs->CP2D.r[14])
83 #define gteSX2  (regs->CP2D.p[14].sw.l)
84 #define gteSY2  (regs->CP2D.p[14].sw.h)
85 #define gteSXYP (regs->CP2D.r[15])
86 #define gteSXP  (regs->CP2D.p[15].sw.l)
87 #define gteSYP  (regs->CP2D.p[15].sw.h)
88 #define gteSZ0  (regs->CP2D.p[16].w.l)
89 #define gteSZ1  (regs->CP2D.p[17].w.l)
90 #define gteSZ2  (regs->CP2D.p[18].w.l)
91 #define gteSZ3  (regs->CP2D.p[19].w.l)
92 #define gteRGB0  (regs->CP2D.r[20])
93 #define gteR0    (regs->CP2D.p[20].b.l)
94 #define gteG0    (regs->CP2D.p[20].b.h)
95 #define gteB0    (regs->CP2D.p[20].b.h2)
96 #define gteCODE0 (regs->CP2D.p[20].b.h3)
97 #define gteRGB1  (regs->CP2D.r[21])
98 #define gteR1    (regs->CP2D.p[21].b.l)
99 #define gteG1    (regs->CP2D.p[21].b.h)
100 #define gteB1    (regs->CP2D.p[21].b.h2)
101 #define gteCODE1 (regs->CP2D.p[21].b.h3)
102 #define gteRGB2  (regs->CP2D.r[22])
103 #define gteR2    (regs->CP2D.p[22].b.l)
104 #define gteG2    (regs->CP2D.p[22].b.h)
105 #define gteB2    (regs->CP2D.p[22].b.h2)
106 #define gteCODE2 (regs->CP2D.p[22].b.h3)
107 #define gteRES1  (regs->CP2D.r[23])
108 #define gteMAC0  (((s32 *)regs->CP2D.r)[24])
109 #define gteMAC1  (((s32 *)regs->CP2D.r)[25])
110 #define gteMAC2  (((s32 *)regs->CP2D.r)[26])
111 #define gteMAC3  (((s32 *)regs->CP2D.r)[27])
112 #define gteIRGB  (regs->CP2D.r[28])
113 #define gteORGB  (regs->CP2D.r[29])
114 #define gteLZCS  (regs->CP2D.r[30])
115 #define gteLZCR  (regs->CP2D.r[31])
116
117 #define gteR11R12 (((s32 *)regs->CP2C.r)[0])
118 #define gteR22R23 (((s32 *)regs->CP2C.r)[2])
119 #define gteR11 (regs->CP2C.p[0].sw.l)
120 #define gteR12 (regs->CP2C.p[0].sw.h)
121 #define gteR13 (regs->CP2C.p[1].sw.l)
122 #define gteR21 (regs->CP2C.p[1].sw.h)
123 #define gteR22 (regs->CP2C.p[2].sw.l)
124 #define gteR23 (regs->CP2C.p[2].sw.h)
125 #define gteR31 (regs->CP2C.p[3].sw.l)
126 #define gteR32 (regs->CP2C.p[3].sw.h)
127 #define gteR33 (regs->CP2C.p[4].sw.l)
128 #define gteTRX (((s32 *)regs->CP2C.r)[5])
129 #define gteTRY (((s32 *)regs->CP2C.r)[6])
130 #define gteTRZ (((s32 *)regs->CP2C.r)[7])
131 #define gteL11 (regs->CP2C.p[8].sw.l)
132 #define gteL12 (regs->CP2C.p[8].sw.h)
133 #define gteL13 (regs->CP2C.p[9].sw.l)
134 #define gteL21 (regs->CP2C.p[9].sw.h)
135 #define gteL22 (regs->CP2C.p[10].sw.l)
136 #define gteL23 (regs->CP2C.p[10].sw.h)
137 #define gteL31 (regs->CP2C.p[11].sw.l)
138 #define gteL32 (regs->CP2C.p[11].sw.h)
139 #define gteL33 (regs->CP2C.p[12].sw.l)
140 #define gteRBK (((s32 *)regs->CP2C.r)[13])
141 #define gteGBK (((s32 *)regs->CP2C.r)[14])
142 #define gteBBK (((s32 *)regs->CP2C.r)[15])
143 #define gteLR1 (regs->CP2C.p[16].sw.l)
144 #define gteLR2 (regs->CP2C.p[16].sw.h)
145 #define gteLR3 (regs->CP2C.p[17].sw.l)
146 #define gteLG1 (regs->CP2C.p[17].sw.h)
147 #define gteLG2 (regs->CP2C.p[18].sw.l)
148 #define gteLG3 (regs->CP2C.p[18].sw.h)
149 #define gteLB1 (regs->CP2C.p[19].sw.l)
150 #define gteLB2 (regs->CP2C.p[19].sw.h)
151 #define gteLB3 (regs->CP2C.p[20].sw.l)
152 #define gteRFC (((s32 *)regs->CP2C.r)[21])
153 #define gteGFC (((s32 *)regs->CP2C.r)[22])
154 #define gteBFC (((s32 *)regs->CP2C.r)[23])
155 #define gteOFX (((s32 *)regs->CP2C.r)[24])
156 #define gteOFY (((s32 *)regs->CP2C.r)[25])
157 #define gteH   (regs->CP2C.p[26].sw.l)
158 #define gteDQA (regs->CP2C.p[27].sw.l)
159 #define gteDQB (((s32 *)regs->CP2C.r)[28])
160 #define gteZSF3 (regs->CP2C.p[29].sw.l)
161 #define gteZSF4 (regs->CP2C.p[30].sw.l)
162 #define gteFLAG (regs->CP2C.r[31])
163
164 #define GTE_OP(op) ((op >> 20) & 31)
165 #define GTE_SF(op) ((op >> 19) & 1)
166 #define GTE_MX(op) ((op >> 17) & 3)
167 #define GTE_V(op) ((op >> 15) & 3)
168 #define GTE_CV(op) ((op >> 13) & 3)
169 #define GTE_CD(op) ((op >> 11) & 3) /* not used */
170 #define GTE_LM(op) ((op >> 10) & 1)
171 #define GTE_CT(op) ((op >> 6) & 15) /* not used */
172 #define GTE_FUNCT(op) (op & 63)
173
174 #define gteop (psxRegs.code & 0x1ffffff)
175
176 #ifndef FLAGLESS
177
178 static inline s32 BOUNDS_(psxCP2Regs *regs, s64 n_value, s64 n_max, int n_maxflag, s64 n_min, int n_minflag) {
179         if (n_value > n_max) {
180                 gteFLAG |= n_maxflag;
181         } else if (n_value < n_min) {
182                 gteFLAG |= n_minflag;
183         }
184         return n_value;
185 }
186
187 static inline s32 LIM_(psxCP2Regs *regs, s32 value, s32 max, s32 min, u32 flag) {
188         s32 ret = value;
189         if (value > max) {
190                 gteFLAG |= flag;
191                 ret = max;
192         } else if (value < min) {
193                 gteFLAG |= flag;
194                 ret = min;
195         }
196         return ret;
197 }
198
199 static inline u32 limE_(psxCP2Regs *regs, u32 result) {
200         if (result > 0x1ffff) {
201                 gteFLAG |= (1 << 31) | (1 << 17);
202                 return 0x1ffff;
203         }
204         return result;
205 }
206
207 #else
208
209 #define BOUNDS_(regs, a, ...) (a)
210
211 static inline s32 LIM_(psxCP2Regs *regs, s32 value, s32 max, s32 min, u32 flag_unused) {
212         s32 ret = value;
213         if (value > max)
214                 ret = max;
215         else if (value < min)
216                 ret = min;
217         return ret;
218 }
219
220 static inline u32 limE_(psxCP2Regs *regs, u32 result) {
221         if (result > 0x1ffff)
222                 return 0x1ffff;
223         return result;
224 }
225
226 #endif
227
228 #define BOUNDS(n_value,n_max,n_maxflag,n_min,n_minflag) \
229         BOUNDS_(regs,n_value,n_max,n_maxflag,n_min,n_minflag)
230 #define LIM(value,max,min,flag) \
231         LIM_(regs,value,max,min,flag)
232 #define limE(result) \
233         limE_(regs,result)
234
235 #define A1(a) BOUNDS((a), 0x7fffffff, (1 << 30), -(s64)0x80000000, (1 << 31) | (1 << 27))
236 #define A2(a) BOUNDS((a), 0x7fffffff, (1 << 29), -(s64)0x80000000, (1 << 31) | (1 << 26))
237 #define A3(a) BOUNDS((a), 0x7fffffff, (1 << 28), -(s64)0x80000000, (1 << 31) | (1 << 25))
238 #define limB1(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 31) | (1 << 24))
239 #define limB2(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 31) | (1 << 23))
240 #define limB3(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 22))
241 #define limC1(a) LIM((a), 0x00ff, 0x0000, (1 << 21))
242 #define limC2(a) LIM((a), 0x00ff, 0x0000, (1 << 20))
243 #define limC3(a) LIM((a), 0x00ff, 0x0000, (1 << 19))
244 #define limD(a) LIM((a), 0xffff, 0x0000, (1 << 31) | (1 << 18))
245
246 #define F(a) BOUNDS((a), 0x7fffffff, (1 << 31) | (1 << 16), -(s64)0x80000000, (1 << 31) | (1 << 15))
247 #define limG1(a) LIM((a), 0x3ff, -0x400, (1 << 31) | (1 << 14))
248 #define limG2(a) LIM((a), 0x3ff, -0x400, (1 << 31) | (1 << 13))
249 #define limH(a) LIM((a), 0x1000, 0x0000, (1 << 12))
250
251 #ifndef __arm__
252 #define A1U A1
253 #define A2U A2
254 #define A3U A3
255 #else
256 /* these are unlikely to be hit and usually waste cycles, don't want them on ARM */
257 #define A1U(x) (x)
258 #define A2U(x) (x)
259 #define A3U(x) (x)
260 #endif
261
262 #include "gte_divider.h"
263
264 #ifndef FLAGLESS
265
266 static inline u32 MFC2(int reg) {
267         psxCP2Regs *regs = (psxCP2Regs *)&psxRegs.CP2D;
268         switch (reg) {
269                 case 1:
270                 case 3:
271                 case 5:
272                 case 8:
273                 case 9:
274                 case 10:
275                 case 11:
276                         psxRegs.CP2D.r[reg] = (s32)psxRegs.CP2D.p[reg].sw.l;
277                         break;
278
279                 case 7:
280                 case 16:
281                 case 17:
282                 case 18:
283                 case 19:
284                         psxRegs.CP2D.r[reg] = (u32)psxRegs.CP2D.p[reg].w.l;
285                         break;
286
287                 case 15:
288                         psxRegs.CP2D.r[reg] = gteSXY2;
289                         break;
290
291                 case 28:
292                 case 29:
293                         psxRegs.CP2D.r[reg] = LIM(gteIR1 >> 7, 0x1f, 0, 0) |
294                                                                         (LIM(gteIR2 >> 7, 0x1f, 0, 0) << 5) |
295                                                                         (LIM(gteIR3 >> 7, 0x1f, 0, 0) << 10);
296                         break;
297         }
298         return psxRegs.CP2D.r[reg];
299 }
300
301 static inline void MTC2(u32 value, int reg) {
302         psxCP2Regs *regs = (psxCP2Regs *)&psxRegs.CP2D;
303         switch (reg) {
304                 case 15:
305                         gteSXY0 = gteSXY1;
306                         gteSXY1 = gteSXY2;
307                         gteSXY2 = value;
308                         gteSXYP = value;
309                         break;
310
311                 case 28:
312                         gteIRGB = value;
313                         gteIR1 = (value & 0x1f) << 7;
314                         gteIR2 = (value & 0x3e0) << 2;
315                         gteIR3 = (value & 0x7c00) >> 3;
316                         break;
317
318                 case 30:
319                         {
320                                 int a;
321                                 gteLZCS = value;
322
323                                 a = gteLZCS;
324                                 if (a > 0) {
325                                         int i;
326                                         for (i = 31; (a & (1 << i)) == 0 && i >= 0; i--);
327                                         gteLZCR = 31 - i;
328                                 } else if (a < 0) {
329                                         int i;
330                                         a ^= 0xffffffff;
331                                         for (i = 31; (a & (1 << i)) == 0 && i >= 0; i--);
332                                         gteLZCR = 31 - i;
333                                 } else {
334                                         gteLZCR = 32;
335                                 }
336                         }
337                         break;
338
339                 case 31:
340                         return;
341
342                 default:
343                         psxRegs.CP2D.r[reg] = value;
344         }
345 }
346
347 static inline void CTC2(u32 value, int reg) {
348         switch (reg) {
349                 case 4:
350                 case 12:
351                 case 20:
352                 case 26:
353                 case 27:
354                 case 29:
355                 case 30:
356                         value = (s32)(s16)value;
357                         break;
358
359                 case 31:
360                         value = value & 0x7ffff000;
361                         if (value & 0x7f87e000) value |= 0x80000000;
362                         break;
363         }
364
365         psxRegs.CP2C.r[reg] = value;
366 }
367
368 void gteMFC2() {
369         if (!_Rt_) return;
370         psxRegs.GPR.r[_Rt_] = MFC2(_Rd_);
371 }
372
373 void gteCFC2() {
374         if (!_Rt_) return;
375         psxRegs.GPR.r[_Rt_] = psxRegs.CP2C.r[_Rd_];
376 }
377
378 void gteMTC2() {
379         MTC2(psxRegs.GPR.r[_Rt_], _Rd_);
380 }
381
382 void gteCTC2() {
383         CTC2(psxRegs.GPR.r[_Rt_], _Rd_);
384 }
385
386 #define _oB_ (psxRegs.GPR.r[_Rs_] + _Imm_)
387
388 void gteLWC2() {
389         MTC2(psxMemRead32(_oB_), _Rt_);
390 }
391
392 void gteSWC2() {
393         psxMemWrite32(_oB_, MFC2(_Rt_));
394 }
395
396 #endif // FLAGLESS
397
398 #if 0
399 #define DIVIDE DIVIDE_
400 static u32 DIVIDE_(s16 n, u16 d) {
401         if (n >= 0 && n < d * 2) {
402                 s32 n_ = n;
403                 return ((n_ << 16) + d / 2) / d;
404                 //return (u32)((float)(n_ << 16) / (float)d + (float)0.5);
405         }
406         return 0xffffffff;
407 }
408 #endif
409
410 void gteRTPS(psxCP2Regs *regs) {
411         int quotient;
412
413 #ifdef GTE_LOG
414         GTE_LOG("GTE RTPS\n");
415 #endif
416         gteFLAG = 0;
417
418         gteMAC1 = A1((((s64)gteTRX << 12) + (gteR11 * gteVX0) + (gteR12 * gteVY0) + (gteR13 * gteVZ0)) >> 12);
419         gteMAC2 = A2((((s64)gteTRY << 12) + (gteR21 * gteVX0) + (gteR22 * gteVY0) + (gteR23 * gteVZ0)) >> 12);
420         gteMAC3 = A3((((s64)gteTRZ << 12) + (gteR31 * gteVX0) + (gteR32 * gteVY0) + (gteR33 * gteVZ0)) >> 12);
421         gteIR1 = limB1(gteMAC1, 0);
422         gteIR2 = limB2(gteMAC2, 0);
423         gteIR3 = limB3(gteMAC3, 0);
424         gteSZ0 = gteSZ1;
425         gteSZ1 = gteSZ2;
426         gteSZ2 = gteSZ3;
427         gteSZ3 = limD(gteMAC3);
428         quotient = limE(DIVIDE(gteH, gteSZ3));
429         gteSXY0 = gteSXY1;
430         gteSXY1 = gteSXY2;
431         gteSX2 = limG1(F((s64)gteOFX + ((s64)gteIR1 * quotient)) >> 16);
432         gteSY2 = limG2(F((s64)gteOFY + ((s64)gteIR2 * quotient)) >> 16);
433
434         gteMAC0 = F((s64)gteDQB + ((s64)gteDQA * quotient));
435         gteIR0 = limH(gteMAC0 >> 12);
436 }
437
438 void gteRTPT(psxCP2Regs *regs) {
439         int quotient;
440         int v;
441         s32 vx, vy, vz;
442
443 #ifdef GTE_LOG
444         GTE_LOG("GTE RTPT\n");
445 #endif
446         gteFLAG = 0;
447
448         gteSZ0 = gteSZ3;
449         for (v = 0; v < 3; v++) {
450                 vx = VX(v);
451                 vy = VY(v);
452                 vz = VZ(v);
453                 gteMAC1 = A1((((s64)gteTRX << 12) + (gteR11 * vx) + (gteR12 * vy) + (gteR13 * vz)) >> 12);
454                 gteMAC2 = A2((((s64)gteTRY << 12) + (gteR21 * vx) + (gteR22 * vy) + (gteR23 * vz)) >> 12);
455                 gteMAC3 = A3((((s64)gteTRZ << 12) + (gteR31 * vx) + (gteR32 * vy) + (gteR33 * vz)) >> 12);
456                 gteIR1 = limB1(gteMAC1, 0);
457                 gteIR2 = limB2(gteMAC2, 0);
458                 gteIR3 = limB3(gteMAC3, 0);
459                 fSZ(v) = limD(gteMAC3);
460                 quotient = limE(DIVIDE(gteH, fSZ(v)));
461                 fSX(v) = limG1(F((s64)gteOFX + ((s64)gteIR1 * quotient)) >> 16);
462                 fSY(v) = limG2(F((s64)gteOFY + ((s64)gteIR2 * quotient)) >> 16);
463         }
464         gteMAC0 = F((s64)gteDQB + ((s64)gteDQA * quotient));
465         gteIR0 = limH(gteMAC0 >> 12);
466 }
467
468 void gteMVMVA(psxCP2Regs *regs) {
469         int shift = 12 * GTE_SF(gteop);
470         int mx = GTE_MX(gteop);
471         int v = GTE_V(gteop);
472         int cv = GTE_CV(gteop);
473         int lm = GTE_LM(gteop);
474         s32 vx = VX(v);
475         s32 vy = VY(v);
476         s32 vz = VZ(v);
477
478 #ifdef GTE_LOG
479         GTE_LOG("GTE MVMVA\n");
480 #endif
481         gteFLAG = 0;
482
483         gteMAC1 = A1((((s64)CV1(cv) << 12) + (MX11(mx) * vx) + (MX12(mx) * vy) + (MX13(mx) * vz)) >> shift);
484         gteMAC2 = A2((((s64)CV2(cv) << 12) + (MX21(mx) * vx) + (MX22(mx) * vy) + (MX23(mx) * vz)) >> shift);
485         gteMAC3 = A3((((s64)CV3(cv) << 12) + (MX31(mx) * vx) + (MX32(mx) * vy) + (MX33(mx) * vz)) >> shift);
486
487         gteIR1 = limB1(gteMAC1, lm);
488         gteIR2 = limB2(gteMAC2, lm);
489         gteIR3 = limB3(gteMAC3, lm);
490 }
491
492 void gteNCLIP(psxCP2Regs *regs) {
493 #ifdef GTE_LOG
494         GTE_LOG("GTE NCLIP\n");
495 #endif
496         gteFLAG = 0;
497
498         gteMAC0 = F((s64)gteSX0 * (gteSY1 - gteSY2) +
499                                 gteSX1 * (gteSY2 - gteSY0) +
500                                 gteSX2 * (gteSY0 - gteSY1));
501 }
502
503 void gteAVSZ3(psxCP2Regs *regs) {
504 #ifdef GTE_LOG
505         GTE_LOG("GTE AVSZ3\n");
506 #endif
507         gteFLAG = 0;
508
509         gteMAC0 = F((s64)gteZSF3 * (gteSZ1 + gteSZ2 + gteSZ3));
510         gteOTZ = limD(gteMAC0 >> 12);
511 }
512
513 void gteAVSZ4(psxCP2Regs *regs) {
514 #ifdef GTE_LOG
515         GTE_LOG("GTE AVSZ4\n");
516 #endif
517         gteFLAG = 0;
518
519         gteMAC0 = F((s64)gteZSF4 * (gteSZ0 + gteSZ1 + gteSZ2 + gteSZ3));
520         gteOTZ = limD(gteMAC0 >> 12);
521 }
522
523 void gteSQR(psxCP2Regs *regs) {
524         int shift = 12 * GTE_SF(gteop);
525         int lm = GTE_LM(gteop);
526
527 #ifdef GTE_LOG
528         GTE_LOG("GTE SQR\n");
529 #endif
530         gteFLAG = 0;
531
532         gteMAC1 = (gteIR1 * gteIR1) >> shift;
533         gteMAC2 = (gteIR2 * gteIR2) >> shift;
534         gteMAC3 = (gteIR3 * gteIR3) >> shift;
535         gteIR1 = limB1(gteMAC1, lm);
536         gteIR2 = limB2(gteMAC2, lm);
537         gteIR3 = limB3(gteMAC3, lm);
538 }
539
540 void gteNCCS(psxCP2Regs *regs) {
541 #ifdef GTE_LOG
542         GTE_LOG("GTE NCCS\n");
543 #endif
544         gteFLAG = 0;
545
546         gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12;
547         gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12;
548         gteMAC3 = ((s64)(gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12;
549         gteIR1 = limB1(gteMAC1, 1);
550         gteIR2 = limB2(gteMAC2, 1);
551         gteIR3 = limB3(gteMAC3, 1);
552         gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
553         gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
554         gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
555         gteIR1 = limB1(gteMAC1, 1);
556         gteIR2 = limB2(gteMAC2, 1);
557         gteIR3 = limB3(gteMAC3, 1);
558         gteMAC1 = ((s32)gteR * gteIR1) >> 8;
559         gteMAC2 = ((s32)gteG * gteIR2) >> 8;
560         gteMAC3 = ((s32)gteB * gteIR3) >> 8;
561         gteIR1 = gteMAC1;
562         gteIR2 = gteMAC2;
563         gteIR3 = gteMAC3;
564
565         gteRGB0 = gteRGB1;
566         gteRGB1 = gteRGB2;
567         gteCODE2 = gteCODE;
568         gteR2 = limC1(gteMAC1 >> 4);
569         gteG2 = limC2(gteMAC2 >> 4);
570         gteB2 = limC3(gteMAC3 >> 4);
571 }
572
573 void gteNCCT(psxCP2Regs *regs) {
574         int v;
575         s32 vx, vy, vz;
576
577 #ifdef GTE_LOG
578         GTE_LOG("GTE NCCT\n");
579 #endif
580         gteFLAG = 0;
581
582         for (v = 0; v < 3; v++) {
583                 vx = VX(v);
584                 vy = VY(v);
585                 vz = VZ(v);
586                 gteMAC1 = ((s64)(gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12;
587                 gteMAC2 = ((s64)(gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12;
588                 gteMAC3 = ((s64)(gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12;
589                 gteIR1 = limB1(gteMAC1, 1);
590                 gteIR2 = limB2(gteMAC2, 1);
591                 gteIR3 = limB3(gteMAC3, 1);
592                 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
593                 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
594                 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
595                 gteIR1 = limB1(gteMAC1, 1);
596                 gteIR2 = limB2(gteMAC2, 1);
597                 gteIR3 = limB3(gteMAC3, 1);
598                 gteMAC1 = ((s32)gteR * gteIR1) >> 8;
599                 gteMAC2 = ((s32)gteG * gteIR2) >> 8;
600                 gteMAC3 = ((s32)gteB * gteIR3) >> 8;
601
602                 gteRGB0 = gteRGB1;
603                 gteRGB1 = gteRGB2;
604                 gteCODE2 = gteCODE;
605                 gteR2 = limC1(gteMAC1 >> 4);
606                 gteG2 = limC2(gteMAC2 >> 4);
607                 gteB2 = limC3(gteMAC3 >> 4);
608         }
609         gteIR1 = gteMAC1;
610         gteIR2 = gteMAC2;
611         gteIR3 = gteMAC3;
612 }
613
614 void gteNCDS(psxCP2Regs *regs) {
615 #ifdef GTE_LOG
616         GTE_LOG("GTE NCDS\n");
617 #endif
618         gteFLAG = 0;
619
620         gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12;
621         gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12;
622         gteMAC3 = ((s64)(gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12;
623         gteIR1 = limB1(gteMAC1, 1);
624         gteIR2 = limB2(gteMAC2, 1);
625         gteIR3 = limB3(gteMAC3, 1);
626         gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
627         gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
628         gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
629         gteIR1 = limB1(gteMAC1, 1);
630         gteIR2 = limB2(gteMAC2, 1);
631         gteIR3 = limB3(gteMAC3, 1);
632         gteMAC1 = (((gteR << 4) * gteIR1) + (gteIR0 * limB1(A1U((s64)gteRFC - ((gteR * gteIR1) >> 8)), 0))) >> 12;
633         gteMAC2 = (((gteG << 4) * gteIR2) + (gteIR0 * limB2(A2U((s64)gteGFC - ((gteG * gteIR2) >> 8)), 0))) >> 12;
634         gteMAC3 = (((gteB << 4) * gteIR3) + (gteIR0 * limB3(A3U((s64)gteBFC - ((gteB * gteIR3) >> 8)), 0))) >> 12;
635         gteIR1 = limB1(gteMAC1, 1);
636         gteIR2 = limB2(gteMAC2, 1);
637         gteIR3 = limB3(gteMAC3, 1);
638
639         gteRGB0 = gteRGB1;
640         gteRGB1 = gteRGB2;
641         gteCODE2 = gteCODE;
642         gteR2 = limC1(gteMAC1 >> 4);
643         gteG2 = limC2(gteMAC2 >> 4);
644         gteB2 = limC3(gteMAC3 >> 4);
645 }
646
647 void gteNCDT(psxCP2Regs *regs) {
648         int v;
649         s32 vx, vy, vz;
650
651 #ifdef GTE_LOG
652         GTE_LOG("GTE NCDT\n");
653 #endif
654         gteFLAG = 0;
655
656         for (v = 0; v < 3; v++) {
657                 vx = VX(v);
658                 vy = VY(v);
659                 vz = VZ(v);
660                 gteMAC1 = ((s64)(gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12;
661                 gteMAC2 = ((s64)(gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12;
662                 gteMAC3 = ((s64)(gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12;
663                 gteIR1 = limB1(gteMAC1, 1);
664                 gteIR2 = limB2(gteMAC2, 1);
665                 gteIR3 = limB3(gteMAC3, 1);
666                 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
667                 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
668                 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
669                 gteIR1 = limB1(gteMAC1, 1);
670                 gteIR2 = limB2(gteMAC2, 1);
671                 gteIR3 = limB3(gteMAC3, 1);
672                 gteMAC1 = (((gteR << 4) * gteIR1) + (gteIR0 * limB1(A1U((s64)gteRFC - ((gteR * gteIR1) >> 8)), 0))) >> 12;
673                 gteMAC2 = (((gteG << 4) * gteIR2) + (gteIR0 * limB2(A2U((s64)gteGFC - ((gteG * gteIR2) >> 8)), 0))) >> 12;
674                 gteMAC3 = (((gteB << 4) * gteIR3) + (gteIR0 * limB3(A3U((s64)gteBFC - ((gteB * gteIR3) >> 8)), 0))) >> 12;
675
676                 gteRGB0 = gteRGB1;
677                 gteRGB1 = gteRGB2;
678                 gteCODE2 = gteCODE;
679                 gteR2 = limC1(gteMAC1 >> 4);
680                 gteG2 = limC2(gteMAC2 >> 4);
681                 gteB2 = limC3(gteMAC3 >> 4);
682         }
683         gteIR1 = limB1(gteMAC1, 1);
684         gteIR2 = limB2(gteMAC2, 1);
685         gteIR3 = limB3(gteMAC3, 1);
686 }
687
688 void gteOP(psxCP2Regs *regs) {
689         int shift = 12 * GTE_SF(gteop);
690         int lm = GTE_LM(gteop);
691
692 #ifdef GTE_LOG
693         GTE_LOG("GTE OP\n");
694 #endif
695         gteFLAG = 0;
696
697         gteMAC1 = ((gteR22 * gteIR3) - (gteR33 * gteIR2)) >> shift;
698         gteMAC2 = ((gteR33 * gteIR1) - (gteR11 * gteIR3)) >> shift;
699         gteMAC3 = ((gteR11 * gteIR2) - (gteR22 * gteIR1)) >> shift;
700         gteIR1 = limB1(gteMAC1, lm);
701         gteIR2 = limB2(gteMAC2, lm);
702         gteIR3 = limB3(gteMAC3, lm);
703 }
704
705 void gteDCPL(psxCP2Regs *regs) {
706         int lm = GTE_LM(gteop);
707
708         s32 RIR1 = ((s32)gteR * gteIR1) >> 8;
709         s32 GIR2 = ((s32)gteG * gteIR2) >> 8;
710         s32 BIR3 = ((s32)gteB * gteIR3) >> 8;
711
712 #ifdef GTE_LOG
713         GTE_LOG("GTE DCPL\n");
714 #endif
715         gteFLAG = 0;
716
717         gteMAC1 = RIR1 + ((gteIR0 * limB1(A1U((s64)gteRFC - RIR1), 0)) >> 12);
718         gteMAC2 = GIR2 + ((gteIR0 * limB1(A2U((s64)gteGFC - GIR2), 0)) >> 12);
719         gteMAC3 = BIR3 + ((gteIR0 * limB1(A3U((s64)gteBFC - BIR3), 0)) >> 12);
720
721         gteIR1 = limB1(gteMAC1, lm);
722         gteIR2 = limB2(gteMAC2, lm);
723         gteIR3 = limB3(gteMAC3, lm);
724
725         gteRGB0 = gteRGB1;
726         gteRGB1 = gteRGB2;
727         gteCODE2 = gteCODE;
728         gteR2 = limC1(gteMAC1 >> 4);
729         gteG2 = limC2(gteMAC2 >> 4);
730         gteB2 = limC3(gteMAC3 >> 4);
731 }
732
733 void gteGPF(psxCP2Regs *regs) {
734         int shift = 12 * GTE_SF(gteop);
735
736 #ifdef GTE_LOG
737         GTE_LOG("GTE GPF\n");
738 #endif
739         gteFLAG = 0;
740
741         gteMAC1 = (gteIR0 * gteIR1) >> shift;
742         gteMAC2 = (gteIR0 * gteIR2) >> shift;
743         gteMAC3 = (gteIR0 * gteIR3) >> shift;
744         gteIR1 = limB1(gteMAC1, 0);
745         gteIR2 = limB2(gteMAC2, 0);
746         gteIR3 = limB3(gteMAC3, 0);
747
748         gteRGB0 = gteRGB1;
749         gteRGB1 = gteRGB2;
750         gteCODE2 = gteCODE;
751         gteR2 = limC1(gteMAC1 >> 4);
752         gteG2 = limC2(gteMAC2 >> 4);
753         gteB2 = limC3(gteMAC3 >> 4);
754 }
755
756 void gteGPL(psxCP2Regs *regs) {
757         int shift = 12 * GTE_SF(gteop);
758
759 #ifdef GTE_LOG
760         GTE_LOG("GTE GPL\n");
761 #endif
762         gteFLAG = 0;
763
764         gteMAC1 = A1((((s64)gteMAC1 << shift) + (gteIR0 * gteIR1)) >> shift);
765         gteMAC2 = A2((((s64)gteMAC2 << shift) + (gteIR0 * gteIR2)) >> shift);
766         gteMAC3 = A3((((s64)gteMAC3 << shift) + (gteIR0 * gteIR3)) >> shift);
767         gteIR1 = limB1(gteMAC1, 0);
768         gteIR2 = limB2(gteMAC2, 0);
769         gteIR3 = limB3(gteMAC3, 0);
770
771         gteRGB0 = gteRGB1;
772         gteRGB1 = gteRGB2;
773         gteCODE2 = gteCODE;
774         gteR2 = limC1(gteMAC1 >> 4);
775         gteG2 = limC2(gteMAC2 >> 4);
776         gteB2 = limC3(gteMAC3 >> 4);
777 }
778
779 void gteDPCS(psxCP2Regs *regs) {
780         int shift = 12 * GTE_SF(gteop);
781
782 #ifdef GTE_LOG
783         GTE_LOG("GTE DPCS\n");
784 #endif
785         gteFLAG = 0;
786
787         gteMAC1 = ((gteR << 16) + (gteIR0 * limB1(A1U(((s64)gteRFC - (gteR << 4)) << (12 - shift)), 0))) >> 12;
788         gteMAC2 = ((gteG << 16) + (gteIR0 * limB2(A2U(((s64)gteGFC - (gteG << 4)) << (12 - shift)), 0))) >> 12;
789         gteMAC3 = ((gteB << 16) + (gteIR0 * limB3(A3U(((s64)gteBFC - (gteB << 4)) << (12 - shift)), 0))) >> 12;
790
791         gteIR1 = limB1(gteMAC1, 0);
792         gteIR2 = limB2(gteMAC2, 0);
793         gteIR3 = limB3(gteMAC3, 0);
794         gteRGB0 = gteRGB1;
795         gteRGB1 = gteRGB2;
796         gteCODE2 = gteCODE;
797         gteR2 = limC1(gteMAC1 >> 4);
798         gteG2 = limC2(gteMAC2 >> 4);
799         gteB2 = limC3(gteMAC3 >> 4);
800 }
801
802 void gteDPCT(psxCP2Regs *regs) {
803         int v;
804
805 #ifdef GTE_LOG
806         GTE_LOG("GTE DPCT\n");
807 #endif
808         gteFLAG = 0;
809
810         for (v = 0; v < 3; v++) {
811                 gteMAC1 = ((gteR0 << 16) + (gteIR0 * limB1(A1U((s64)gteRFC - (gteR0 << 4)), 0))) >> 12;
812                 gteMAC2 = ((gteG0 << 16) + (gteIR0 * limB1(A2U((s64)gteGFC - (gteG0 << 4)), 0))) >> 12;
813                 gteMAC3 = ((gteB0 << 16) + (gteIR0 * limB1(A3U((s64)gteBFC - (gteB0 << 4)), 0))) >> 12;
814
815                 gteRGB0 = gteRGB1;
816                 gteRGB1 = gteRGB2;
817                 gteCODE2 = gteCODE;
818                 gteR2 = limC1(gteMAC1 >> 4);
819                 gteG2 = limC2(gteMAC2 >> 4);
820                 gteB2 = limC3(gteMAC3 >> 4);
821         }
822         gteIR1 = limB1(gteMAC1, 0);
823         gteIR2 = limB2(gteMAC2, 0);
824         gteIR3 = limB3(gteMAC3, 0);
825 }
826
827 void gteNCS(psxCP2Regs *regs) {
828 #ifdef GTE_LOG
829         GTE_LOG("GTE NCS\n");
830 #endif
831         gteFLAG = 0;
832
833         gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12;
834         gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12;
835         gteMAC3 = ((s64)(gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12;
836         gteIR1 = limB1(gteMAC1, 1);
837         gteIR2 = limB2(gteMAC2, 1);
838         gteIR3 = limB3(gteMAC3, 1);
839         gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
840         gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
841         gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
842         gteIR1 = limB1(gteMAC1, 1);
843         gteIR2 = limB2(gteMAC2, 1);
844         gteIR3 = limB3(gteMAC3, 1);
845
846         gteRGB0 = gteRGB1;
847         gteRGB1 = gteRGB2;
848         gteCODE2 = gteCODE;
849         gteR2 = limC1(gteMAC1 >> 4);
850         gteG2 = limC2(gteMAC2 >> 4);
851         gteB2 = limC3(gteMAC3 >> 4);
852 }
853
854 void gteNCT(psxCP2Regs *regs) {
855         int v;
856         s32 vx, vy, vz;
857
858 #ifdef GTE_LOG
859         GTE_LOG("GTE NCT\n");
860 #endif
861         gteFLAG = 0;
862
863         for (v = 0; v < 3; v++) {
864                 vx = VX(v);
865                 vy = VY(v);
866                 vz = VZ(v);
867                 gteMAC1 = ((s64)(gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12;
868                 gteMAC2 = ((s64)(gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12;
869                 gteMAC3 = ((s64)(gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12;
870                 gteIR1 = limB1(gteMAC1, 1);
871                 gteIR2 = limB2(gteMAC2, 1);
872                 gteIR3 = limB3(gteMAC3, 1);
873                 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
874                 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
875                 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
876                 gteRGB0 = gteRGB1;
877                 gteRGB1 = gteRGB2;
878                 gteCODE2 = gteCODE;
879                 gteR2 = limC1(gteMAC1 >> 4);
880                 gteG2 = limC2(gteMAC2 >> 4);
881                 gteB2 = limC3(gteMAC3 >> 4);
882         }
883         gteIR1 = limB1(gteMAC1, 1);
884         gteIR2 = limB2(gteMAC2, 1);
885         gteIR3 = limB3(gteMAC3, 1);
886 }
887
888 void gteCC(psxCP2Regs *regs) {
889 #ifdef GTE_LOG
890         GTE_LOG("GTE CC\n");
891 #endif
892         gteFLAG = 0;
893
894         gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
895         gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
896         gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
897         gteIR1 = limB1(gteMAC1, 1);
898         gteIR2 = limB2(gteMAC2, 1);
899         gteIR3 = limB3(gteMAC3, 1);
900         gteMAC1 = ((s32)gteR * gteIR1) >> 8;
901         gteMAC2 = ((s32)gteG * gteIR2) >> 8;
902         gteMAC3 = ((s32)gteB * gteIR3) >> 8;
903         gteIR1 = limB1(gteMAC1, 1);
904         gteIR2 = limB2(gteMAC2, 1);
905         gteIR3 = limB3(gteMAC3, 1);
906
907         gteRGB0 = gteRGB1;
908         gteRGB1 = gteRGB2;
909         gteCODE2 = gteCODE;
910         gteR2 = limC1(gteMAC1 >> 4);
911         gteG2 = limC2(gteMAC2 >> 4);
912         gteB2 = limC3(gteMAC3 >> 4);
913 }
914
915 void gteINTPL(psxCP2Regs *regs) {
916         int shift = 12 * GTE_SF(gteop);
917         int lm = GTE_LM(gteop);
918
919 #ifdef GTE_LOG
920         GTE_LOG("GTE INTPL\n");
921 #endif
922         gteFLAG = 0;
923
924         gteMAC1 = ((gteIR1 << 12) + (gteIR0 * limB1(A1U((s64)gteRFC - gteIR1), 0))) >> shift;
925         gteMAC2 = ((gteIR2 << 12) + (gteIR0 * limB2(A2U((s64)gteGFC - gteIR2), 0))) >> shift;
926         gteMAC3 = ((gteIR3 << 12) + (gteIR0 * limB3(A3U((s64)gteBFC - gteIR3), 0))) >> shift;
927         gteIR1 = limB1(gteMAC1, lm);
928         gteIR2 = limB2(gteMAC2, lm);
929         gteIR3 = limB3(gteMAC3, lm);
930         gteRGB0 = gteRGB1;
931         gteRGB1 = gteRGB2;
932         gteCODE2 = gteCODE;
933         gteR2 = limC1(gteMAC1 >> 4);
934         gteG2 = limC2(gteMAC2 >> 4);
935         gteB2 = limC3(gteMAC3 >> 4);
936 }
937
938 void gteCDP(psxCP2Regs *regs) {
939 #ifdef GTE_LOG
940         GTE_LOG("GTE CDP\n");
941 #endif
942         gteFLAG = 0;
943
944         gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
945         gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
946         gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
947         gteIR1 = limB1(gteMAC1, 1);
948         gteIR2 = limB2(gteMAC2, 1);
949         gteIR3 = limB3(gteMAC3, 1);
950         gteMAC1 = (((gteR << 4) * gteIR1) + (gteIR0 * limB1(A1U((s64)gteRFC - ((gteR * gteIR1) >> 8)), 0))) >> 12;
951         gteMAC2 = (((gteG << 4) * gteIR2) + (gteIR0 * limB2(A2U((s64)gteGFC - ((gteG * gteIR2) >> 8)), 0))) >> 12;
952         gteMAC3 = (((gteB << 4) * gteIR3) + (gteIR0 * limB3(A3U((s64)gteBFC - ((gteB * gteIR3) >> 8)), 0))) >> 12;
953         gteIR1 = limB1(gteMAC1, 1);
954         gteIR2 = limB2(gteMAC2, 1);
955         gteIR3 = limB3(gteMAC3, 1);
956
957         gteRGB0 = gteRGB1;
958         gteRGB1 = gteRGB2;
959         gteCODE2 = gteCODE;
960         gteR2 = limC1(gteMAC1 >> 4);
961         gteG2 = limC2(gteMAC2 >> 4);
962         gteB2 = limC3(gteMAC3 >> 4);
963 }
964
965 /* decomposed/parametrized versions for the recompiler */
966
967 #ifndef FLAGLESS
968
969 void gteSQR_part_noshift(psxCP2Regs *regs) {
970         gteFLAG = 0;
971
972         gteMAC1 = gteIR1 * gteIR1;
973         gteMAC2 = gteIR2 * gteIR2;
974         gteMAC3 = gteIR3 * gteIR3;
975 }
976
977 void gteSQR_part_shift(psxCP2Regs *regs) {
978         gteFLAG = 0;
979
980         gteMAC1 = (gteIR1 * gteIR1) >> 12;
981         gteMAC2 = (gteIR2 * gteIR2) >> 12;
982         gteMAC3 = (gteIR3 * gteIR3) >> 12;
983 }
984
985 void gteOP_part_noshift(psxCP2Regs *regs) {
986         gteFLAG = 0;
987
988         gteMAC1 = (gteR22 * gteIR3) - (gteR33 * gteIR2);
989         gteMAC2 = (gteR33 * gteIR1) - (gteR11 * gteIR3);
990         gteMAC3 = (gteR11 * gteIR2) - (gteR22 * gteIR1);
991 }
992
993 void gteOP_part_shift(psxCP2Regs *regs) {
994         gteFLAG = 0;
995
996         gteMAC1 = ((gteR22 * gteIR3) - (gteR33 * gteIR2)) >> 12;
997         gteMAC2 = ((gteR33 * gteIR1) - (gteR11 * gteIR3)) >> 12;
998         gteMAC3 = ((gteR11 * gteIR2) - (gteR22 * gteIR1)) >> 12;
999 }
1000
1001 void gteDCPL_part(psxCP2Regs *regs) {
1002         s32 RIR1 = ((s32)gteR * gteIR1) >> 8;
1003         s32 GIR2 = ((s32)gteG * gteIR2) >> 8;
1004         s32 BIR3 = ((s32)gteB * gteIR3) >> 8;
1005
1006         gteFLAG = 0;
1007
1008         gteMAC1 = RIR1 + ((gteIR0 * limB1(A1U((s64)gteRFC - RIR1), 0)) >> 12);
1009         gteMAC2 = GIR2 + ((gteIR0 * limB1(A2U((s64)gteGFC - GIR2), 0)) >> 12);
1010         gteMAC3 = BIR3 + ((gteIR0 * limB1(A3U((s64)gteBFC - BIR3), 0)) >> 12);
1011 }
1012
1013 void gteGPF_part_noshift(psxCP2Regs *regs) {
1014         gteFLAG = 0;
1015
1016         gteMAC1 = gteIR0 * gteIR1;
1017         gteMAC2 = gteIR0 * gteIR2;
1018         gteMAC3 = gteIR0 * gteIR3;
1019 }
1020
1021 void gteGPF_part_shift(psxCP2Regs *regs) {
1022         gteFLAG = 0;
1023
1024         gteMAC1 = (gteIR0 * gteIR1) >> 12;
1025         gteMAC2 = (gteIR0 * gteIR2) >> 12;
1026         gteMAC3 = (gteIR0 * gteIR3) >> 12;
1027 }
1028
1029 #endif // !FLAGLESS
1030
1031 void gteGPL_part_noshift(psxCP2Regs *regs) {
1032         gteFLAG = 0;
1033
1034         gteMAC1 = A1((s64)gteMAC1 + (gteIR0 * gteIR1));
1035         gteMAC2 = A2((s64)gteMAC2 + (gteIR0 * gteIR2));
1036         gteMAC3 = A3((s64)gteMAC3 + (gteIR0 * gteIR3));
1037 }
1038
1039 void gteGPL_part_shift(psxCP2Regs *regs) {
1040         gteFLAG = 0;
1041
1042         gteMAC1 = A1((s64)gteMAC1 + ((gteIR0 * gteIR1) >> 12));
1043         gteMAC2 = A2((s64)gteMAC2 + ((gteIR0 * gteIR2) >> 12));
1044         gteMAC3 = A3((s64)gteMAC3 + ((gteIR0 * gteIR3) >> 12));
1045 }
1046
1047 void gteDPCS_part_noshift(psxCP2Regs *regs) {
1048         int shift = 0;
1049
1050         gteFLAG = 0;
1051
1052         gteMAC1 = ((gteR << 16) + (gteIR0 * limB1(A1U((s64)gteRFC - (gteR << 4)) << (12 - shift), 0))) >> 12;
1053         gteMAC2 = ((gteG << 16) + (gteIR0 * limB2(A2U((s64)gteGFC - (gteG << 4)) << (12 - shift), 0))) >> 12;
1054         gteMAC3 = ((gteB << 16) + (gteIR0 * limB3(A3U((s64)gteBFC - (gteB << 4)) << (12 - shift), 0))) >> 12;
1055 }
1056
1057 void gteDPCS_part_shift(psxCP2Regs *regs) {
1058         int shift = 12;
1059
1060         gteFLAG = 0;
1061
1062         gteMAC1 = ((gteR << 16) + (gteIR0 * limB1(A1U((s64)gteRFC - (gteR << 4)) << (12 - shift), 0))) >> 12;
1063         gteMAC2 = ((gteG << 16) + (gteIR0 * limB2(A2U((s64)gteGFC - (gteG << 4)) << (12 - shift), 0))) >> 12;
1064         gteMAC3 = ((gteB << 16) + (gteIR0 * limB3(A3U((s64)gteBFC - (gteB << 4)) << (12 - shift), 0))) >> 12;
1065 }
1066
1067 void gteINTPL_part_noshift(psxCP2Regs *regs) {
1068         gteFLAG = 0;
1069
1070         gteMAC1 = ((gteIR1 << 12) + (gteIR0 * limB1(A1U((s64)gteRFC - gteIR1), 0)));
1071         gteMAC2 = ((gteIR2 << 12) + (gteIR0 * limB2(A2U((s64)gteGFC - gteIR2), 0)));
1072         gteMAC3 = ((gteIR3 << 12) + (gteIR0 * limB3(A3U((s64)gteBFC - gteIR3), 0)));
1073 }
1074
1075 void gteINTPL_part_shift(psxCP2Regs *regs) {
1076         gteFLAG = 0;
1077
1078         gteMAC1 = ((gteIR1 << 12) + (gteIR0 * limB1(A1U((s64)gteRFC - gteIR1), 0))) >> 12;
1079         gteMAC2 = ((gteIR2 << 12) + (gteIR0 * limB2(A2U((s64)gteGFC - gteIR2), 0))) >> 12;
1080         gteMAC3 = ((gteIR3 << 12) + (gteIR0 * limB3(A3U((s64)gteBFC - gteIR3), 0))) >> 12;
1081 }
1082
1083 void gteMACtoRGB(psxCP2Regs *regs) {
1084         gteRGB0 = gteRGB1;
1085         gteRGB1 = gteRGB2;
1086         gteCODE2 = gteCODE;
1087         gteR2 = limC1(gteMAC1 >> 4);
1088         gteG2 = limC2(gteMAC2 >> 4);
1089         gteB2 = limC3(gteMAC3 >> 4);
1090 }
1091