cdrom: clean up play command handling
[pcsx_rearmed.git] / libpcsxcore / gte.c
1 /***************************************************************************
2  *   PCSX-Revolution - PlayStation Emulator for Nintendo Wii               *
3  *   Copyright (C) 2009-2010  PCSX-Revolution Dev Team                     *
4  *   <http://code.google.com/p/pcsx-revolution/>                           *
5  *                                                                         *
6  *   This program is free software; you can redistribute it and/or modify  *
7  *   it under the terms of the GNU General Public License as published by  *
8  *   the Free Software Foundation; either version 2 of the License, or     *
9  *   (at your option) any later version.                                   *
10  *                                                                         *
11  *   This program is distributed in the hope that it will be useful,       *
12  *   but WITHOUT ANY WARRANTY; without even the implied warranty of        *
13  *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the         *
14  *   GNU General Public License for more details.                          *
15  *                                                                         *
16  *   You should have received a copy of the GNU General Public License     *
17  *   along with this program; if not, write to the                         *
18  *   Free Software Foundation, Inc.,                                       *
19  *   51 Franklin Street, Fifth Floor, Boston, MA 02111-1307 USA.           *
20  ***************************************************************************/
21
22 /*
23 * GTE functions.
24 */
25
26 #include "gte.h"
27 #include "psxmem.h"
28
29 #define VX(n) (n < 3 ? regs->CP2D.p[n << 1].sw.l : regs->CP2D.p[9].sw.l)
30 #define VY(n) (n < 3 ? regs->CP2D.p[n << 1].sw.h : regs->CP2D.p[10].sw.l)
31 #define VZ(n) (n < 3 ? regs->CP2D.p[(n << 1) + 1].sw.l : regs->CP2D.p[11].sw.l)
32 #define MX11(n) (n < 3 ? regs->CP2C.p[(n << 3)].sw.l : 0)
33 #define MX12(n) (n < 3 ? regs->CP2C.p[(n << 3)].sw.h : 0)
34 #define MX13(n) (n < 3 ? regs->CP2C.p[(n << 3) + 1].sw.l : 0)
35 #define MX21(n) (n < 3 ? regs->CP2C.p[(n << 3) + 1].sw.h : 0)
36 #define MX22(n) (n < 3 ? regs->CP2C.p[(n << 3) + 2].sw.l : 0)
37 #define MX23(n) (n < 3 ? regs->CP2C.p[(n << 3) + 2].sw.h : 0)
38 #define MX31(n) (n < 3 ? regs->CP2C.p[(n << 3) + 3].sw.l : 0)
39 #define MX32(n) (n < 3 ? regs->CP2C.p[(n << 3) + 3].sw.h : 0)
40 #define MX33(n) (n < 3 ? regs->CP2C.p[(n << 3) + 4].sw.l : 0)
41 #define CV1(n) (n < 3 ? (s32)regs->CP2C.r[(n << 3) + 5] : 0)
42 #define CV2(n) (n < 3 ? (s32)regs->CP2C.r[(n << 3) + 6] : 0)
43 #define CV3(n) (n < 3 ? (s32)regs->CP2C.r[(n << 3) + 7] : 0)
44
45 #define fSX(n) ((regs->CP2D.p)[((n) + 12)].sw.l)
46 #define fSY(n) ((regs->CP2D.p)[((n) + 12)].sw.h)
47 #define fSZ(n) ((regs->CP2D.p)[((n) + 17)].w.l) /* (n == 0) => SZ1; */
48
49 #define gteVXY0 (regs->CP2D.r[0])
50 #define gteVX0  (regs->CP2D.p[0].sw.l)
51 #define gteVY0  (regs->CP2D.p[0].sw.h)
52 #define gteVZ0  (regs->CP2D.p[1].sw.l)
53 #define gteVXY1 (regs->CP2D.r[2])
54 #define gteVX1  (regs->CP2D.p[2].sw.l)
55 #define gteVY1  (regs->CP2D.p[2].sw.h)
56 #define gteVZ1  (regs->CP2D.p[3].sw.l)
57 #define gteVXY2 (regs->CP2D.r[4])
58 #define gteVX2  (regs->CP2D.p[4].sw.l)
59 #define gteVY2  (regs->CP2D.p[4].sw.h)
60 #define gteVZ2  (regs->CP2D.p[5].sw.l)
61 #define gteRGB  (regs->CP2D.r[6])
62 #define gteR    (regs->CP2D.p[6].b.l)
63 #define gteG    (regs->CP2D.p[6].b.h)
64 #define gteB    (regs->CP2D.p[6].b.h2)
65 #define gteCODE (regs->CP2D.p[6].b.h3)
66 #define gteOTZ  (regs->CP2D.p[7].w.l)
67 #define gteIR0  (regs->CP2D.p[8].sw.l)
68 #define gteIR1  (regs->CP2D.p[9].sw.l)
69 #define gteIR2  (regs->CP2D.p[10].sw.l)
70 #define gteIR3  (regs->CP2D.p[11].sw.l)
71 #define gteSXY0 (regs->CP2D.r[12])
72 #define gteSX0  (regs->CP2D.p[12].sw.l)
73 #define gteSY0  (regs->CP2D.p[12].sw.h)
74 #define gteSXY1 (regs->CP2D.r[13])
75 #define gteSX1  (regs->CP2D.p[13].sw.l)
76 #define gteSY1  (regs->CP2D.p[13].sw.h)
77 #define gteSXY2 (regs->CP2D.r[14])
78 #define gteSX2  (regs->CP2D.p[14].sw.l)
79 #define gteSY2  (regs->CP2D.p[14].sw.h)
80 #define gteSXYP (regs->CP2D.r[15])
81 #define gteSXP  (regs->CP2D.p[15].sw.l)
82 #define gteSYP  (regs->CP2D.p[15].sw.h)
83 #define gteSZ0  (regs->CP2D.p[16].w.l)
84 #define gteSZ1  (regs->CP2D.p[17].w.l)
85 #define gteSZ2  (regs->CP2D.p[18].w.l)
86 #define gteSZ3  (regs->CP2D.p[19].w.l)
87 #define gteRGB0  (regs->CP2D.r[20])
88 #define gteR0    (regs->CP2D.p[20].b.l)
89 #define gteG0    (regs->CP2D.p[20].b.h)
90 #define gteB0    (regs->CP2D.p[20].b.h2)
91 #define gteCODE0 (regs->CP2D.p[20].b.h3)
92 #define gteRGB1  (regs->CP2D.r[21])
93 #define gteR1    (regs->CP2D.p[21].b.l)
94 #define gteG1    (regs->CP2D.p[21].b.h)
95 #define gteB1    (regs->CP2D.p[21].b.h2)
96 #define gteCODE1 (regs->CP2D.p[21].b.h3)
97 #define gteRGB2  (regs->CP2D.r[22])
98 #define gteR2    (regs->CP2D.p[22].b.l)
99 #define gteG2    (regs->CP2D.p[22].b.h)
100 #define gteB2    (regs->CP2D.p[22].b.h2)
101 #define gteCODE2 (regs->CP2D.p[22].b.h3)
102 #define gteRES1  (regs->CP2D.r[23])
103 #define gteMAC0  (((s32 *)regs->CP2D.r)[24])
104 #define gteMAC1  (((s32 *)regs->CP2D.r)[25])
105 #define gteMAC2  (((s32 *)regs->CP2D.r)[26])
106 #define gteMAC3  (((s32 *)regs->CP2D.r)[27])
107 #define gteIRGB  (regs->CP2D.r[28])
108 #define gteORGB  (regs->CP2D.r[29])
109 #define gteLZCS  (regs->CP2D.r[30])
110 #define gteLZCR  (regs->CP2D.r[31])
111
112 #define gteR11R12 (((s32 *)regs->CP2C.r)[0])
113 #define gteR22R23 (((s32 *)regs->CP2C.r)[2])
114 #define gteR11 (regs->CP2C.p[0].sw.l)
115 #define gteR12 (regs->CP2C.p[0].sw.h)
116 #define gteR13 (regs->CP2C.p[1].sw.l)
117 #define gteR21 (regs->CP2C.p[1].sw.h)
118 #define gteR22 (regs->CP2C.p[2].sw.l)
119 #define gteR23 (regs->CP2C.p[2].sw.h)
120 #define gteR31 (regs->CP2C.p[3].sw.l)
121 #define gteR32 (regs->CP2C.p[3].sw.h)
122 #define gteR33 (regs->CP2C.p[4].sw.l)
123 #define gteTRX (((s32 *)regs->CP2C.r)[5])
124 #define gteTRY (((s32 *)regs->CP2C.r)[6])
125 #define gteTRZ (((s32 *)regs->CP2C.r)[7])
126 #define gteL11 (regs->CP2C.p[8].sw.l)
127 #define gteL12 (regs->CP2C.p[8].sw.h)
128 #define gteL13 (regs->CP2C.p[9].sw.l)
129 #define gteL21 (regs->CP2C.p[9].sw.h)
130 #define gteL22 (regs->CP2C.p[10].sw.l)
131 #define gteL23 (regs->CP2C.p[10].sw.h)
132 #define gteL31 (regs->CP2C.p[11].sw.l)
133 #define gteL32 (regs->CP2C.p[11].sw.h)
134 #define gteL33 (regs->CP2C.p[12].sw.l)
135 #define gteRBK (((s32 *)regs->CP2C.r)[13])
136 #define gteGBK (((s32 *)regs->CP2C.r)[14])
137 #define gteBBK (((s32 *)regs->CP2C.r)[15])
138 #define gteLR1 (regs->CP2C.p[16].sw.l)
139 #define gteLR2 (regs->CP2C.p[16].sw.h)
140 #define gteLR3 (regs->CP2C.p[17].sw.l)
141 #define gteLG1 (regs->CP2C.p[17].sw.h)
142 #define gteLG2 (regs->CP2C.p[18].sw.l)
143 #define gteLG3 (regs->CP2C.p[18].sw.h)
144 #define gteLB1 (regs->CP2C.p[19].sw.l)
145 #define gteLB2 (regs->CP2C.p[19].sw.h)
146 #define gteLB3 (regs->CP2C.p[20].sw.l)
147 #define gteRFC (((s32 *)regs->CP2C.r)[21])
148 #define gteGFC (((s32 *)regs->CP2C.r)[22])
149 #define gteBFC (((s32 *)regs->CP2C.r)[23])
150 #define gteOFX (((s32 *)regs->CP2C.r)[24])
151 #define gteOFY (((s32 *)regs->CP2C.r)[25])
152 #define gteH   (regs->CP2C.p[26].sw.l)
153 #define gteDQA (regs->CP2C.p[27].sw.l)
154 #define gteDQB (((s32 *)regs->CP2C.r)[28])
155 #define gteZSF3 (regs->CP2C.p[29].sw.l)
156 #define gteZSF4 (regs->CP2C.p[30].sw.l)
157 #define gteFLAG (regs->CP2C.r[31])
158
159 #define GTE_OP(op) ((op >> 20) & 31)
160 #define GTE_SF(op) ((op >> 19) & 1)
161 #define GTE_MX(op) ((op >> 17) & 3)
162 #define GTE_V(op) ((op >> 15) & 3)
163 #define GTE_CV(op) ((op >> 13) & 3)
164 #define GTE_CD(op) ((op >> 11) & 3) /* not used */
165 #define GTE_LM(op) ((op >> 10) & 1)
166 #define GTE_CT(op) ((op >> 6) & 15) /* not used */
167 #define GTE_FUNCT(op) (op & 63)
168
169 #define gteop (psxRegs.code & 0x1ffffff)
170
171 #ifndef FLAGLESS
172
173 static inline s32 BOUNDS_(psxCP2Regs *regs, s64 n_value, s64 n_max, int n_maxflag, s64 n_min, int n_minflag) {
174         if (n_value > n_max) {
175                 gteFLAG |= n_maxflag;
176         } else if (n_value < n_min) {
177                 gteFLAG |= n_minflag;
178         }
179         return n_value;
180 }
181
182 static inline s32 LIM_(psxCP2Regs *regs, s32 value, s32 max, s32 min, u32 flag) {
183         s32 ret = value;
184         if (value > max) {
185                 gteFLAG |= flag;
186                 ret = max;
187         } else if (value < min) {
188                 gteFLAG |= flag;
189                 ret = min;
190         }
191         return ret;
192 }
193
194 static inline u32 limE_(psxCP2Regs *regs, u32 result) {
195         if (result > 0x1ffff) {
196                 gteFLAG |= (1 << 31) | (1 << 17);
197                 return 0x1ffff;
198         }
199         return result;
200 }
201
202 #else
203
204 #define BOUNDS_(regs, a, ...) (a)
205
206 static inline s32 LIM_(psxCP2Regs *regs, s32 value, s32 max, s32 min, u32 flag_unused) {
207         s32 ret = value;
208         if (value > max)
209                 ret = max;
210         else if (value < min)
211                 ret = min;
212         return ret;
213 }
214
215 static inline u32 limE_(psxCP2Regs *regs, u32 result) {
216         if (result > 0x1ffff)
217                 return 0x1ffff;
218         return result;
219 }
220
221 #endif
222
223 #define BOUNDS(n_value,n_max,n_maxflag,n_min,n_minflag) \
224         BOUNDS_(regs,n_value,n_max,n_maxflag,n_min,n_minflag)
225 #define LIM(value,max,min,flag) \
226         LIM_(regs,value,max,min,flag)
227 #define limE(result) \
228         limE_(regs,result)
229
230 #define A1(a) BOUNDS((a), 0x7fffffff, (1 << 30), -(s64)0x80000000, (1 << 31) | (1 << 27))
231 #define A2(a) BOUNDS((a), 0x7fffffff, (1 << 29), -(s64)0x80000000, (1 << 31) | (1 << 26))
232 #define A3(a) BOUNDS((a), 0x7fffffff, (1 << 28), -(s64)0x80000000, (1 << 31) | (1 << 25))
233 #define limB1(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 31) | (1 << 24))
234 #define limB2(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 31) | (1 << 23))
235 #define limB3(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 22))
236 #define limC1(a) LIM((a), 0x00ff, 0x0000, (1 << 21))
237 #define limC2(a) LIM((a), 0x00ff, 0x0000, (1 << 20))
238 #define limC3(a) LIM((a), 0x00ff, 0x0000, (1 << 19))
239 #define limD(a) LIM((a), 0xffff, 0x0000, (1 << 31) | (1 << 18))
240
241 #define F(a) BOUNDS((a), 0x7fffffff, (1 << 31) | (1 << 16), -(s64)0x80000000, (1 << 31) | (1 << 15))
242 #define limG1(a) LIM((a), 0x3ff, -0x400, (1 << 31) | (1 << 14))
243 #define limG2(a) LIM((a), 0x3ff, -0x400, (1 << 31) | (1 << 13))
244 #define limH(a) LIM((a), 0x1000, 0x0000, (1 << 12))
245
246 #ifndef __arm__
247 #define A1U A1
248 #define A2U A2
249 #define A3U A3
250 #else
251 /* these are unlikely to be hit and usually waste cycles, don't want them on ARM */
252 #define A1U(x) (x)
253 #define A2U(x) (x)
254 #define A3U(x) (x)
255 #endif
256
257 #include "gte_divider.h"
258
259 #ifndef FLAGLESS
260
261 static inline u32 MFC2(int reg) {
262         psxCP2Regs *regs = &psxRegs.CP2;
263         switch (reg) {
264                 case 1:
265                 case 3:
266                 case 5:
267                 case 8:
268                 case 9:
269                 case 10:
270                 case 11:
271                         psxRegs.CP2D.r[reg] = (s32)psxRegs.CP2D.p[reg].sw.l;
272                         break;
273
274                 case 7:
275                 case 16:
276                 case 17:
277                 case 18:
278                 case 19:
279                         psxRegs.CP2D.r[reg] = (u32)psxRegs.CP2D.p[reg].w.l;
280                         break;
281
282                 case 15:
283                         psxRegs.CP2D.r[reg] = gteSXY2;
284                         break;
285
286                 case 28:
287                 case 29:
288                         psxRegs.CP2D.r[reg] = LIM(gteIR1 >> 7, 0x1f, 0, 0) |
289                                                                         (LIM(gteIR2 >> 7, 0x1f, 0, 0) << 5) |
290                                                                         (LIM(gteIR3 >> 7, 0x1f, 0, 0) << 10);
291                         break;
292         }
293         return psxRegs.CP2D.r[reg];
294 }
295
296 static inline void MTC2(u32 value, int reg) {
297         psxCP2Regs *regs = &psxRegs.CP2;
298         switch (reg) {
299                 case 15:
300                         gteSXY0 = gteSXY1;
301                         gteSXY1 = gteSXY2;
302                         gteSXY2 = value;
303                         gteSXYP = value;
304                         break;
305
306                 case 28:
307                         gteIRGB = value;
308                         gteIR1 = (value & 0x1f) << 7;
309                         gteIR2 = (value & 0x3e0) << 2;
310                         gteIR3 = (value & 0x7c00) >> 3;
311                         break;
312
313                 case 30:
314                         {
315                                 int a;
316                                 gteLZCS = value;
317
318                                 a = gteLZCS;
319                                 if (a > 0) {
320                                         int i;
321                                         for (i = 31; (a & (1 << i)) == 0 && i >= 0; i--);
322                                         gteLZCR = 31 - i;
323                                 } else if (a < 0) {
324                                         int i;
325                                         a ^= 0xffffffff;
326                                         for (i = 31; (a & (1 << i)) == 0 && i >= 0; i--);
327                                         gteLZCR = 31 - i;
328                                 } else {
329                                         gteLZCR = 32;
330                                 }
331                         }
332                         break;
333
334                 case 31:
335                         return;
336
337                 default:
338                         psxRegs.CP2D.r[reg] = value;
339         }
340 }
341
342 static inline void CTC2(u32 value, int reg) {
343         switch (reg) {
344                 case 4:
345                 case 12:
346                 case 20:
347                 case 26:
348                 case 27:
349                 case 29:
350                 case 30:
351                         value = (s32)(s16)value;
352                         break;
353
354                 case 31:
355                         value = value & 0x7ffff000;
356                         if (value & 0x7f87e000) value |= 0x80000000;
357                         break;
358         }
359
360         psxRegs.CP2C.r[reg] = value;
361 }
362
363 void gteMFC2() {
364         if (!_Rt_) return;
365         psxRegs.GPR.r[_Rt_] = MFC2(_Rd_);
366 }
367
368 void gteCFC2() {
369         if (!_Rt_) return;
370         psxRegs.GPR.r[_Rt_] = psxRegs.CP2C.r[_Rd_];
371 }
372
373 void gteMTC2() {
374         MTC2(psxRegs.GPR.r[_Rt_], _Rd_);
375 }
376
377 void gteCTC2() {
378         CTC2(psxRegs.GPR.r[_Rt_], _Rd_);
379 }
380
381 #define _oB_ (psxRegs.GPR.r[_Rs_] + _Imm_)
382
383 void gteLWC2() {
384         MTC2(psxMemRead32(_oB_), _Rt_);
385 }
386
387 void gteSWC2() {
388         psxMemWrite32(_oB_, MFC2(_Rt_));
389 }
390
391 #endif // FLAGLESS
392
393 #if 0
394 #define DIVIDE DIVIDE_
395 static u32 DIVIDE_(s16 n, u16 d) {
396         if (n >= 0 && n < d * 2) {
397                 s32 n_ = n;
398                 return ((n_ << 16) + d / 2) / d;
399                 //return (u32)((float)(n_ << 16) / (float)d + (float)0.5);
400         }
401         return 0xffffffff;
402 }
403 #endif
404
405 void gteRTPS(psxCP2Regs *regs) {
406         int quotient;
407
408 #ifdef GTE_LOG
409         GTE_LOG("GTE RTPS\n");
410 #endif
411         gteFLAG = 0;
412
413         gteMAC1 = A1((((s64)gteTRX << 12) + (gteR11 * gteVX0) + (gteR12 * gteVY0) + (gteR13 * gteVZ0)) >> 12);
414         gteMAC2 = A2((((s64)gteTRY << 12) + (gteR21 * gteVX0) + (gteR22 * gteVY0) + (gteR23 * gteVZ0)) >> 12);
415         gteMAC3 = A3((((s64)gteTRZ << 12) + (gteR31 * gteVX0) + (gteR32 * gteVY0) + (gteR33 * gteVZ0)) >> 12);
416         gteIR1 = limB1(gteMAC1, 0);
417         gteIR2 = limB2(gteMAC2, 0);
418         gteIR3 = limB3(gteMAC3, 0);
419         gteSZ0 = gteSZ1;
420         gteSZ1 = gteSZ2;
421         gteSZ2 = gteSZ3;
422         gteSZ3 = limD(gteMAC3);
423         quotient = limE(DIVIDE(gteH, gteSZ3));
424         gteSXY0 = gteSXY1;
425         gteSXY1 = gteSXY2;
426         gteSX2 = limG1(F((s64)gteOFX + ((s64)gteIR1 * quotient)) >> 16);
427         gteSY2 = limG2(F((s64)gteOFY + ((s64)gteIR2 * quotient)) >> 16);
428
429         gteMAC0 = F((s64)gteDQB + ((s64)gteDQA * quotient));
430         gteIR0 = limH(gteMAC0 >> 12);
431 }
432
433 void gteRTPT(psxCP2Regs *regs) {
434         int quotient;
435         int v;
436         s32 vx, vy, vz;
437
438 #ifdef GTE_LOG
439         GTE_LOG("GTE RTPT\n");
440 #endif
441         gteFLAG = 0;
442
443         gteSZ0 = gteSZ3;
444         for (v = 0; v < 3; v++) {
445                 vx = VX(v);
446                 vy = VY(v);
447                 vz = VZ(v);
448                 gteMAC1 = A1((((s64)gteTRX << 12) + (gteR11 * vx) + (gteR12 * vy) + (gteR13 * vz)) >> 12);
449                 gteMAC2 = A2((((s64)gteTRY << 12) + (gteR21 * vx) + (gteR22 * vy) + (gteR23 * vz)) >> 12);
450                 gteMAC3 = A3((((s64)gteTRZ << 12) + (gteR31 * vx) + (gteR32 * vy) + (gteR33 * vz)) >> 12);
451                 gteIR1 = limB1(gteMAC1, 0);
452                 gteIR2 = limB2(gteMAC2, 0);
453                 gteIR3 = limB3(gteMAC3, 0);
454                 fSZ(v) = limD(gteMAC3);
455                 quotient = limE(DIVIDE(gteH, fSZ(v)));
456                 fSX(v) = limG1(F((s64)gteOFX + ((s64)gteIR1 * quotient)) >> 16);
457                 fSY(v) = limG2(F((s64)gteOFY + ((s64)gteIR2 * quotient)) >> 16);
458         }
459         gteMAC0 = F((s64)gteDQB + ((s64)gteDQA * quotient));
460         gteIR0 = limH(gteMAC0 >> 12);
461 }
462
463 void gteMVMVA(psxCP2Regs *regs) {
464         int shift = 12 * GTE_SF(gteop);
465         int mx = GTE_MX(gteop);
466         int v = GTE_V(gteop);
467         int cv = GTE_CV(gteop);
468         int lm = GTE_LM(gteop);
469         s32 vx = VX(v);
470         s32 vy = VY(v);
471         s32 vz = VZ(v);
472
473 #ifdef GTE_LOG
474         GTE_LOG("GTE MVMVA\n");
475 #endif
476         gteFLAG = 0;
477
478         gteMAC1 = A1((((s64)CV1(cv) << 12) + (MX11(mx) * vx) + (MX12(mx) * vy) + (MX13(mx) * vz)) >> shift);
479         gteMAC2 = A2((((s64)CV2(cv) << 12) + (MX21(mx) * vx) + (MX22(mx) * vy) + (MX23(mx) * vz)) >> shift);
480         gteMAC3 = A3((((s64)CV3(cv) << 12) + (MX31(mx) * vx) + (MX32(mx) * vy) + (MX33(mx) * vz)) >> shift);
481
482         gteIR1 = limB1(gteMAC1, lm);
483         gteIR2 = limB2(gteMAC2, lm);
484         gteIR3 = limB3(gteMAC3, lm);
485 }
486
487 void gteNCLIP(psxCP2Regs *regs) {
488 #ifdef GTE_LOG
489         GTE_LOG("GTE NCLIP\n");
490 #endif
491         gteFLAG = 0;
492
493         gteMAC0 = F((s64)gteSX0 * (gteSY1 - gteSY2) +
494                                 gteSX1 * (gteSY2 - gteSY0) +
495                                 gteSX2 * (gteSY0 - gteSY1));
496 }
497
498 void gteAVSZ3(psxCP2Regs *regs) {
499 #ifdef GTE_LOG
500         GTE_LOG("GTE AVSZ3\n");
501 #endif
502         gteFLAG = 0;
503
504         gteMAC0 = F((s64)gteZSF3 * (gteSZ1 + gteSZ2 + gteSZ3));
505         gteOTZ = limD(gteMAC0 >> 12);
506 }
507
508 void gteAVSZ4(psxCP2Regs *regs) {
509 #ifdef GTE_LOG
510         GTE_LOG("GTE AVSZ4\n");
511 #endif
512         gteFLAG = 0;
513
514         gteMAC0 = F((s64)gteZSF4 * (gteSZ0 + gteSZ1 + gteSZ2 + gteSZ3));
515         gteOTZ = limD(gteMAC0 >> 12);
516 }
517
518 void gteSQR(psxCP2Regs *regs) {
519         int shift = 12 * GTE_SF(gteop);
520         int lm = GTE_LM(gteop);
521
522 #ifdef GTE_LOG
523         GTE_LOG("GTE SQR\n");
524 #endif
525         gteFLAG = 0;
526
527         gteMAC1 = (gteIR1 * gteIR1) >> shift;
528         gteMAC2 = (gteIR2 * gteIR2) >> shift;
529         gteMAC3 = (gteIR3 * gteIR3) >> shift;
530         gteIR1 = limB1(gteMAC1, lm);
531         gteIR2 = limB2(gteMAC2, lm);
532         gteIR3 = limB3(gteMAC3, lm);
533 }
534
535 void gteNCCS(psxCP2Regs *regs) {
536 #ifdef GTE_LOG
537         GTE_LOG("GTE NCCS\n");
538 #endif
539         gteFLAG = 0;
540
541         gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12;
542         gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12;
543         gteMAC3 = ((s64)(gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12;
544         gteIR1 = limB1(gteMAC1, 1);
545         gteIR2 = limB2(gteMAC2, 1);
546         gteIR3 = limB3(gteMAC3, 1);
547         gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
548         gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
549         gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
550         gteIR1 = limB1(gteMAC1, 1);
551         gteIR2 = limB2(gteMAC2, 1);
552         gteIR3 = limB3(gteMAC3, 1);
553         gteMAC1 = ((s32)gteR * gteIR1) >> 8;
554         gteMAC2 = ((s32)gteG * gteIR2) >> 8;
555         gteMAC3 = ((s32)gteB * gteIR3) >> 8;
556         gteIR1 = gteMAC1;
557         gteIR2 = gteMAC2;
558         gteIR3 = gteMAC3;
559
560         gteRGB0 = gteRGB1;
561         gteRGB1 = gteRGB2;
562         gteCODE2 = gteCODE;
563         gteR2 = limC1(gteMAC1 >> 4);
564         gteG2 = limC2(gteMAC2 >> 4);
565         gteB2 = limC3(gteMAC3 >> 4);
566 }
567
568 void gteNCCT(psxCP2Regs *regs) {
569         int v;
570         s32 vx, vy, vz;
571
572 #ifdef GTE_LOG
573         GTE_LOG("GTE NCCT\n");
574 #endif
575         gteFLAG = 0;
576
577         for (v = 0; v < 3; v++) {
578                 vx = VX(v);
579                 vy = VY(v);
580                 vz = VZ(v);
581                 gteMAC1 = ((s64)(gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12;
582                 gteMAC2 = ((s64)(gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12;
583                 gteMAC3 = ((s64)(gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12;
584                 gteIR1 = limB1(gteMAC1, 1);
585                 gteIR2 = limB2(gteMAC2, 1);
586                 gteIR3 = limB3(gteMAC3, 1);
587                 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
588                 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
589                 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
590                 gteIR1 = limB1(gteMAC1, 1);
591                 gteIR2 = limB2(gteMAC2, 1);
592                 gteIR3 = limB3(gteMAC3, 1);
593                 gteMAC1 = ((s32)gteR * gteIR1) >> 8;
594                 gteMAC2 = ((s32)gteG * gteIR2) >> 8;
595                 gteMAC3 = ((s32)gteB * gteIR3) >> 8;
596
597                 gteRGB0 = gteRGB1;
598                 gteRGB1 = gteRGB2;
599                 gteCODE2 = gteCODE;
600                 gteR2 = limC1(gteMAC1 >> 4);
601                 gteG2 = limC2(gteMAC2 >> 4);
602                 gteB2 = limC3(gteMAC3 >> 4);
603         }
604         gteIR1 = gteMAC1;
605         gteIR2 = gteMAC2;
606         gteIR3 = gteMAC3;
607 }
608
609 void gteNCDS(psxCP2Regs *regs) {
610 #ifdef GTE_LOG
611         GTE_LOG("GTE NCDS\n");
612 #endif
613         gteFLAG = 0;
614
615         gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12;
616         gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12;
617         gteMAC3 = ((s64)(gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12;
618         gteIR1 = limB1(gteMAC1, 1);
619         gteIR2 = limB2(gteMAC2, 1);
620         gteIR3 = limB3(gteMAC3, 1);
621         gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
622         gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
623         gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
624         gteIR1 = limB1(gteMAC1, 1);
625         gteIR2 = limB2(gteMAC2, 1);
626         gteIR3 = limB3(gteMAC3, 1);
627         gteMAC1 = (((gteR << 4) * gteIR1) + (gteIR0 * limB1(A1U((s64)gteRFC - ((gteR * gteIR1) >> 8)), 0))) >> 12;
628         gteMAC2 = (((gteG << 4) * gteIR2) + (gteIR0 * limB2(A2U((s64)gteGFC - ((gteG * gteIR2) >> 8)), 0))) >> 12;
629         gteMAC3 = (((gteB << 4) * gteIR3) + (gteIR0 * limB3(A3U((s64)gteBFC - ((gteB * gteIR3) >> 8)), 0))) >> 12;
630         gteIR1 = limB1(gteMAC1, 1);
631         gteIR2 = limB2(gteMAC2, 1);
632         gteIR3 = limB3(gteMAC3, 1);
633
634         gteRGB0 = gteRGB1;
635         gteRGB1 = gteRGB2;
636         gteCODE2 = gteCODE;
637         gteR2 = limC1(gteMAC1 >> 4);
638         gteG2 = limC2(gteMAC2 >> 4);
639         gteB2 = limC3(gteMAC3 >> 4);
640 }
641
642 void gteNCDT(psxCP2Regs *regs) {
643         int v;
644         s32 vx, vy, vz;
645
646 #ifdef GTE_LOG
647         GTE_LOG("GTE NCDT\n");
648 #endif
649         gteFLAG = 0;
650
651         for (v = 0; v < 3; v++) {
652                 vx = VX(v);
653                 vy = VY(v);
654                 vz = VZ(v);
655                 gteMAC1 = ((s64)(gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12;
656                 gteMAC2 = ((s64)(gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12;
657                 gteMAC3 = ((s64)(gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12;
658                 gteIR1 = limB1(gteMAC1, 1);
659                 gteIR2 = limB2(gteMAC2, 1);
660                 gteIR3 = limB3(gteMAC3, 1);
661                 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
662                 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
663                 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
664                 gteIR1 = limB1(gteMAC1, 1);
665                 gteIR2 = limB2(gteMAC2, 1);
666                 gteIR3 = limB3(gteMAC3, 1);
667                 gteMAC1 = (((gteR << 4) * gteIR1) + (gteIR0 * limB1(A1U((s64)gteRFC - ((gteR * gteIR1) >> 8)), 0))) >> 12;
668                 gteMAC2 = (((gteG << 4) * gteIR2) + (gteIR0 * limB2(A2U((s64)gteGFC - ((gteG * gteIR2) >> 8)), 0))) >> 12;
669                 gteMAC3 = (((gteB << 4) * gteIR3) + (gteIR0 * limB3(A3U((s64)gteBFC - ((gteB * gteIR3) >> 8)), 0))) >> 12;
670
671                 gteRGB0 = gteRGB1;
672                 gteRGB1 = gteRGB2;
673                 gteCODE2 = gteCODE;
674                 gteR2 = limC1(gteMAC1 >> 4);
675                 gteG2 = limC2(gteMAC2 >> 4);
676                 gteB2 = limC3(gteMAC3 >> 4);
677         }
678         gteIR1 = limB1(gteMAC1, 1);
679         gteIR2 = limB2(gteMAC2, 1);
680         gteIR3 = limB3(gteMAC3, 1);
681 }
682
683 void gteOP(psxCP2Regs *regs) {
684         int shift = 12 * GTE_SF(gteop);
685         int lm = GTE_LM(gteop);
686
687 #ifdef GTE_LOG
688         GTE_LOG("GTE OP\n");
689 #endif
690         gteFLAG = 0;
691
692         gteMAC1 = ((gteR22 * gteIR3) - (gteR33 * gteIR2)) >> shift;
693         gteMAC2 = ((gteR33 * gteIR1) - (gteR11 * gteIR3)) >> shift;
694         gteMAC3 = ((gteR11 * gteIR2) - (gteR22 * gteIR1)) >> shift;
695         gteIR1 = limB1(gteMAC1, lm);
696         gteIR2 = limB2(gteMAC2, lm);
697         gteIR3 = limB3(gteMAC3, lm);
698 }
699
700 void gteDCPL(psxCP2Regs *regs) {
701         int lm = GTE_LM(gteop);
702
703         s32 RIR1 = ((s32)gteR * gteIR1) >> 8;
704         s32 GIR2 = ((s32)gteG * gteIR2) >> 8;
705         s32 BIR3 = ((s32)gteB * gteIR3) >> 8;
706
707 #ifdef GTE_LOG
708         GTE_LOG("GTE DCPL\n");
709 #endif
710         gteFLAG = 0;
711
712         gteMAC1 = RIR1 + ((gteIR0 * limB1(A1U((s64)gteRFC - RIR1), 0)) >> 12);
713         gteMAC2 = GIR2 + ((gteIR0 * limB1(A2U((s64)gteGFC - GIR2), 0)) >> 12);
714         gteMAC3 = BIR3 + ((gteIR0 * limB1(A3U((s64)gteBFC - BIR3), 0)) >> 12);
715
716         gteIR1 = limB1(gteMAC1, lm);
717         gteIR2 = limB2(gteMAC2, lm);
718         gteIR3 = limB3(gteMAC3, lm);
719
720         gteRGB0 = gteRGB1;
721         gteRGB1 = gteRGB2;
722         gteCODE2 = gteCODE;
723         gteR2 = limC1(gteMAC1 >> 4);
724         gteG2 = limC2(gteMAC2 >> 4);
725         gteB2 = limC3(gteMAC3 >> 4);
726 }
727
728 void gteGPF(psxCP2Regs *regs) {
729         int shift = 12 * GTE_SF(gteop);
730
731 #ifdef GTE_LOG
732         GTE_LOG("GTE GPF\n");
733 #endif
734         gteFLAG = 0;
735
736         gteMAC1 = (gteIR0 * gteIR1) >> shift;
737         gteMAC2 = (gteIR0 * gteIR2) >> shift;
738         gteMAC3 = (gteIR0 * gteIR3) >> shift;
739         gteIR1 = limB1(gteMAC1, 0);
740         gteIR2 = limB2(gteMAC2, 0);
741         gteIR3 = limB3(gteMAC3, 0);
742
743         gteRGB0 = gteRGB1;
744         gteRGB1 = gteRGB2;
745         gteCODE2 = gteCODE;
746         gteR2 = limC1(gteMAC1 >> 4);
747         gteG2 = limC2(gteMAC2 >> 4);
748         gteB2 = limC3(gteMAC3 >> 4);
749 }
750
751 void gteGPL(psxCP2Regs *regs) {
752         int shift = 12 * GTE_SF(gteop);
753
754 #ifdef GTE_LOG
755         GTE_LOG("GTE GPL\n");
756 #endif
757         gteFLAG = 0;
758
759         gteMAC1 = A1((((s64)gteMAC1 << shift) + (gteIR0 * gteIR1)) >> shift);
760         gteMAC2 = A2((((s64)gteMAC2 << shift) + (gteIR0 * gteIR2)) >> shift);
761         gteMAC3 = A3((((s64)gteMAC3 << shift) + (gteIR0 * gteIR3)) >> shift);
762         gteIR1 = limB1(gteMAC1, 0);
763         gteIR2 = limB2(gteMAC2, 0);
764         gteIR3 = limB3(gteMAC3, 0);
765
766         gteRGB0 = gteRGB1;
767         gteRGB1 = gteRGB2;
768         gteCODE2 = gteCODE;
769         gteR2 = limC1(gteMAC1 >> 4);
770         gteG2 = limC2(gteMAC2 >> 4);
771         gteB2 = limC3(gteMAC3 >> 4);
772 }
773
774 void gteDPCS(psxCP2Regs *regs) {
775         int shift = 12 * GTE_SF(gteop);
776
777 #ifdef GTE_LOG
778         GTE_LOG("GTE DPCS\n");
779 #endif
780         gteFLAG = 0;
781
782         gteMAC1 = ((gteR << 16) + (gteIR0 * limB1(A1U(((s64)gteRFC - (gteR << 4)) << (12 - shift)), 0))) >> 12;
783         gteMAC2 = ((gteG << 16) + (gteIR0 * limB2(A2U(((s64)gteGFC - (gteG << 4)) << (12 - shift)), 0))) >> 12;
784         gteMAC3 = ((gteB << 16) + (gteIR0 * limB3(A3U(((s64)gteBFC - (gteB << 4)) << (12 - shift)), 0))) >> 12;
785
786         gteIR1 = limB1(gteMAC1, 0);
787         gteIR2 = limB2(gteMAC2, 0);
788         gteIR3 = limB3(gteMAC3, 0);
789         gteRGB0 = gteRGB1;
790         gteRGB1 = gteRGB2;
791         gteCODE2 = gteCODE;
792         gteR2 = limC1(gteMAC1 >> 4);
793         gteG2 = limC2(gteMAC2 >> 4);
794         gteB2 = limC3(gteMAC3 >> 4);
795 }
796
797 void gteDPCT(psxCP2Regs *regs) {
798         int v;
799
800 #ifdef GTE_LOG
801         GTE_LOG("GTE DPCT\n");
802 #endif
803         gteFLAG = 0;
804
805         for (v = 0; v < 3; v++) {
806                 gteMAC1 = ((gteR0 << 16) + (gteIR0 * limB1(A1U((s64)gteRFC - (gteR0 << 4)), 0))) >> 12;
807                 gteMAC2 = ((gteG0 << 16) + (gteIR0 * limB1(A2U((s64)gteGFC - (gteG0 << 4)), 0))) >> 12;
808                 gteMAC3 = ((gteB0 << 16) + (gteIR0 * limB1(A3U((s64)gteBFC - (gteB0 << 4)), 0))) >> 12;
809
810                 gteRGB0 = gteRGB1;
811                 gteRGB1 = gteRGB2;
812                 gteCODE2 = gteCODE;
813                 gteR2 = limC1(gteMAC1 >> 4);
814                 gteG2 = limC2(gteMAC2 >> 4);
815                 gteB2 = limC3(gteMAC3 >> 4);
816         }
817         gteIR1 = limB1(gteMAC1, 0);
818         gteIR2 = limB2(gteMAC2, 0);
819         gteIR3 = limB3(gteMAC3, 0);
820 }
821
822 void gteNCS(psxCP2Regs *regs) {
823 #ifdef GTE_LOG
824         GTE_LOG("GTE NCS\n");
825 #endif
826         gteFLAG = 0;
827
828         gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12;
829         gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12;
830         gteMAC3 = ((s64)(gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12;
831         gteIR1 = limB1(gteMAC1, 1);
832         gteIR2 = limB2(gteMAC2, 1);
833         gteIR3 = limB3(gteMAC3, 1);
834         gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
835         gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
836         gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
837         gteIR1 = limB1(gteMAC1, 1);
838         gteIR2 = limB2(gteMAC2, 1);
839         gteIR3 = limB3(gteMAC3, 1);
840
841         gteRGB0 = gteRGB1;
842         gteRGB1 = gteRGB2;
843         gteCODE2 = gteCODE;
844         gteR2 = limC1(gteMAC1 >> 4);
845         gteG2 = limC2(gteMAC2 >> 4);
846         gteB2 = limC3(gteMAC3 >> 4);
847 }
848
849 void gteNCT(psxCP2Regs *regs) {
850         int v;
851         s32 vx, vy, vz;
852
853 #ifdef GTE_LOG
854         GTE_LOG("GTE NCT\n");
855 #endif
856         gteFLAG = 0;
857
858         for (v = 0; v < 3; v++) {
859                 vx = VX(v);
860                 vy = VY(v);
861                 vz = VZ(v);
862                 gteMAC1 = ((s64)(gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12;
863                 gteMAC2 = ((s64)(gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12;
864                 gteMAC3 = ((s64)(gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12;
865                 gteIR1 = limB1(gteMAC1, 1);
866                 gteIR2 = limB2(gteMAC2, 1);
867                 gteIR3 = limB3(gteMAC3, 1);
868                 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
869                 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
870                 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
871                 gteRGB0 = gteRGB1;
872                 gteRGB1 = gteRGB2;
873                 gteCODE2 = gteCODE;
874                 gteR2 = limC1(gteMAC1 >> 4);
875                 gteG2 = limC2(gteMAC2 >> 4);
876                 gteB2 = limC3(gteMAC3 >> 4);
877         }
878         gteIR1 = limB1(gteMAC1, 1);
879         gteIR2 = limB2(gteMAC2, 1);
880         gteIR3 = limB3(gteMAC3, 1);
881 }
882
883 void gteCC(psxCP2Regs *regs) {
884 #ifdef GTE_LOG
885         GTE_LOG("GTE CC\n");
886 #endif
887         gteFLAG = 0;
888
889         gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
890         gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
891         gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
892         gteIR1 = limB1(gteMAC1, 1);
893         gteIR2 = limB2(gteMAC2, 1);
894         gteIR3 = limB3(gteMAC3, 1);
895         gteMAC1 = ((s32)gteR * gteIR1) >> 8;
896         gteMAC2 = ((s32)gteG * gteIR2) >> 8;
897         gteMAC3 = ((s32)gteB * gteIR3) >> 8;
898         gteIR1 = limB1(gteMAC1, 1);
899         gteIR2 = limB2(gteMAC2, 1);
900         gteIR3 = limB3(gteMAC3, 1);
901
902         gteRGB0 = gteRGB1;
903         gteRGB1 = gteRGB2;
904         gteCODE2 = gteCODE;
905         gteR2 = limC1(gteMAC1 >> 4);
906         gteG2 = limC2(gteMAC2 >> 4);
907         gteB2 = limC3(gteMAC3 >> 4);
908 }
909
910 void gteINTPL(psxCP2Regs *regs) {
911         int shift = 12 * GTE_SF(gteop);
912         int lm = GTE_LM(gteop);
913
914 #ifdef GTE_LOG
915         GTE_LOG("GTE INTPL\n");
916 #endif
917         gteFLAG = 0;
918
919         gteMAC1 = ((gteIR1 << 12) + (gteIR0 * limB1(A1U((s64)gteRFC - gteIR1), 0))) >> shift;
920         gteMAC2 = ((gteIR2 << 12) + (gteIR0 * limB2(A2U((s64)gteGFC - gteIR2), 0))) >> shift;
921         gteMAC3 = ((gteIR3 << 12) + (gteIR0 * limB3(A3U((s64)gteBFC - gteIR3), 0))) >> shift;
922         gteIR1 = limB1(gteMAC1, lm);
923         gteIR2 = limB2(gteMAC2, lm);
924         gteIR3 = limB3(gteMAC3, lm);
925         gteRGB0 = gteRGB1;
926         gteRGB1 = gteRGB2;
927         gteCODE2 = gteCODE;
928         gteR2 = limC1(gteMAC1 >> 4);
929         gteG2 = limC2(gteMAC2 >> 4);
930         gteB2 = limC3(gteMAC3 >> 4);
931 }
932
933 void gteCDP(psxCP2Regs *regs) {
934 #ifdef GTE_LOG
935         GTE_LOG("GTE CDP\n");
936 #endif
937         gteFLAG = 0;
938
939         gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
940         gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
941         gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
942         gteIR1 = limB1(gteMAC1, 1);
943         gteIR2 = limB2(gteMAC2, 1);
944         gteIR3 = limB3(gteMAC3, 1);
945         gteMAC1 = (((gteR << 4) * gteIR1) + (gteIR0 * limB1(A1U((s64)gteRFC - ((gteR * gteIR1) >> 8)), 0))) >> 12;
946         gteMAC2 = (((gteG << 4) * gteIR2) + (gteIR0 * limB2(A2U((s64)gteGFC - ((gteG * gteIR2) >> 8)), 0))) >> 12;
947         gteMAC3 = (((gteB << 4) * gteIR3) + (gteIR0 * limB3(A3U((s64)gteBFC - ((gteB * gteIR3) >> 8)), 0))) >> 12;
948         gteIR1 = limB1(gteMAC1, 1);
949         gteIR2 = limB2(gteMAC2, 1);
950         gteIR3 = limB3(gteMAC3, 1);
951
952         gteRGB0 = gteRGB1;
953         gteRGB1 = gteRGB2;
954         gteCODE2 = gteCODE;
955         gteR2 = limC1(gteMAC1 >> 4);
956         gteG2 = limC2(gteMAC2 >> 4);
957         gteB2 = limC3(gteMAC3 >> 4);
958 }
959
960 /* decomposed/parametrized versions for the recompiler */
961
962 #ifndef FLAGLESS
963
964 void gteSQR_part_noshift(psxCP2Regs *regs) {
965         gteFLAG = 0;
966
967         gteMAC1 = gteIR1 * gteIR1;
968         gteMAC2 = gteIR2 * gteIR2;
969         gteMAC3 = gteIR3 * gteIR3;
970 }
971
972 void gteSQR_part_shift(psxCP2Regs *regs) {
973         gteFLAG = 0;
974
975         gteMAC1 = (gteIR1 * gteIR1) >> 12;
976         gteMAC2 = (gteIR2 * gteIR2) >> 12;
977         gteMAC3 = (gteIR3 * gteIR3) >> 12;
978 }
979
980 void gteOP_part_noshift(psxCP2Regs *regs) {
981         gteFLAG = 0;
982
983         gteMAC1 = (gteR22 * gteIR3) - (gteR33 * gteIR2);
984         gteMAC2 = (gteR33 * gteIR1) - (gteR11 * gteIR3);
985         gteMAC3 = (gteR11 * gteIR2) - (gteR22 * gteIR1);
986 }
987
988 void gteOP_part_shift(psxCP2Regs *regs) {
989         gteFLAG = 0;
990
991         gteMAC1 = ((gteR22 * gteIR3) - (gteR33 * gteIR2)) >> 12;
992         gteMAC2 = ((gteR33 * gteIR1) - (gteR11 * gteIR3)) >> 12;
993         gteMAC3 = ((gteR11 * gteIR2) - (gteR22 * gteIR1)) >> 12;
994 }
995
996 void gteDCPL_part(psxCP2Regs *regs) {
997         s32 RIR1 = ((s32)gteR * gteIR1) >> 8;
998         s32 GIR2 = ((s32)gteG * gteIR2) >> 8;
999         s32 BIR3 = ((s32)gteB * gteIR3) >> 8;
1000
1001         gteFLAG = 0;
1002
1003         gteMAC1 = RIR1 + ((gteIR0 * limB1(A1U((s64)gteRFC - RIR1), 0)) >> 12);
1004         gteMAC2 = GIR2 + ((gteIR0 * limB1(A2U((s64)gteGFC - GIR2), 0)) >> 12);
1005         gteMAC3 = BIR3 + ((gteIR0 * limB1(A3U((s64)gteBFC - BIR3), 0)) >> 12);
1006 }
1007
1008 void gteGPF_part_noshift(psxCP2Regs *regs) {
1009         gteFLAG = 0;
1010
1011         gteMAC1 = gteIR0 * gteIR1;
1012         gteMAC2 = gteIR0 * gteIR2;
1013         gteMAC3 = gteIR0 * gteIR3;
1014 }
1015
1016 void gteGPF_part_shift(psxCP2Regs *regs) {
1017         gteFLAG = 0;
1018
1019         gteMAC1 = (gteIR0 * gteIR1) >> 12;
1020         gteMAC2 = (gteIR0 * gteIR2) >> 12;
1021         gteMAC3 = (gteIR0 * gteIR3) >> 12;
1022 }
1023
1024 #endif // !FLAGLESS
1025
1026 void gteGPL_part_noshift(psxCP2Regs *regs) {
1027         gteFLAG = 0;
1028
1029         gteMAC1 = A1((s64)gteMAC1 + (gteIR0 * gteIR1));
1030         gteMAC2 = A2((s64)gteMAC2 + (gteIR0 * gteIR2));
1031         gteMAC3 = A3((s64)gteMAC3 + (gteIR0 * gteIR3));
1032 }
1033
1034 void gteGPL_part_shift(psxCP2Regs *regs) {
1035         gteFLAG = 0;
1036
1037         gteMAC1 = A1((s64)gteMAC1 + ((gteIR0 * gteIR1) >> 12));
1038         gteMAC2 = A2((s64)gteMAC2 + ((gteIR0 * gteIR2) >> 12));
1039         gteMAC3 = A3((s64)gteMAC3 + ((gteIR0 * gteIR3) >> 12));
1040 }
1041
1042 void gteDPCS_part_noshift(psxCP2Regs *regs) {
1043         int shift = 0;
1044
1045         gteFLAG = 0;
1046
1047         gteMAC1 = ((gteR << 16) + (gteIR0 * limB1(A1U((s64)gteRFC - (gteR << 4)) << (12 - shift), 0))) >> 12;
1048         gteMAC2 = ((gteG << 16) + (gteIR0 * limB2(A2U((s64)gteGFC - (gteG << 4)) << (12 - shift), 0))) >> 12;
1049         gteMAC3 = ((gteB << 16) + (gteIR0 * limB3(A3U((s64)gteBFC - (gteB << 4)) << (12 - shift), 0))) >> 12;
1050 }
1051
1052 void gteDPCS_part_shift(psxCP2Regs *regs) {
1053         int shift = 12;
1054
1055         gteFLAG = 0;
1056
1057         gteMAC1 = ((gteR << 16) + (gteIR0 * limB1(A1U((s64)gteRFC - (gteR << 4)) << (12 - shift), 0))) >> 12;
1058         gteMAC2 = ((gteG << 16) + (gteIR0 * limB2(A2U((s64)gteGFC - (gteG << 4)) << (12 - shift), 0))) >> 12;
1059         gteMAC3 = ((gteB << 16) + (gteIR0 * limB3(A3U((s64)gteBFC - (gteB << 4)) << (12 - shift), 0))) >> 12;
1060 }
1061
1062 void gteINTPL_part_noshift(psxCP2Regs *regs) {
1063         gteFLAG = 0;
1064
1065         gteMAC1 = ((gteIR1 << 12) + (gteIR0 * limB1(A1U((s64)gteRFC - gteIR1), 0)));
1066         gteMAC2 = ((gteIR2 << 12) + (gteIR0 * limB2(A2U((s64)gteGFC - gteIR2), 0)));
1067         gteMAC3 = ((gteIR3 << 12) + (gteIR0 * limB3(A3U((s64)gteBFC - gteIR3), 0)));
1068 }
1069
1070 void gteINTPL_part_shift(psxCP2Regs *regs) {
1071         gteFLAG = 0;
1072
1073         gteMAC1 = ((gteIR1 << 12) + (gteIR0 * limB1(A1U((s64)gteRFC - gteIR1), 0))) >> 12;
1074         gteMAC2 = ((gteIR2 << 12) + (gteIR0 * limB2(A2U((s64)gteGFC - gteIR2), 0))) >> 12;
1075         gteMAC3 = ((gteIR3 << 12) + (gteIR0 * limB3(A3U((s64)gteBFC - gteIR3), 0))) >> 12;
1076 }
1077
1078 void gteMACtoRGB(psxCP2Regs *regs) {
1079         gteRGB0 = gteRGB1;
1080         gteRGB1 = gteRGB2;
1081         gteCODE2 = gteCODE;
1082         gteR2 = limC1(gteMAC1 >> 4);
1083         gteG2 = limC2(gteMAC2 >> 4);
1084         gteB2 = limC3(gteMAC3 >> 4);
1085 }
1086