drc: something works on arm64
[pcsx_rearmed.git] / libpcsxcore / gte.c
CommitLineData
ef79bbde
P
1/***************************************************************************
2 * PCSX-Revolution - PlayStation Emulator for Nintendo Wii *
3 * Copyright (C) 2009-2010 PCSX-Revolution Dev Team *
4 * <http://code.google.com/p/pcsx-revolution/> *
5 * *
6 * This program is free software; you can redistribute it and/or modify *
7 * it under the terms of the GNU General Public License as published by *
8 * the Free Software Foundation; either version 2 of the License, or *
9 * (at your option) any later version. *
10 * *
11 * This program is distributed in the hope that it will be useful, *
12 * but WITHOUT ANY WARRANTY; without even the implied warranty of *
13 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the *
14 * GNU General Public License for more details. *
15 * *
16 * You should have received a copy of the GNU General Public License *
17 * along with this program; if not, write to the *
18 * Free Software Foundation, Inc., *
19 * 51 Franklin Street, Fifth Floor, Boston, MA 02111-1307 USA. *
20 ***************************************************************************/
21
22/*
23* GTE functions.
24*/
25
26#include "gte.h"
27#include "psxmem.h"
28
f74fb727 29#define VX(n) (n < 3 ? regs->CP2D.p[n << 1].sw.l : regs->CP2D.p[9].sw.l)
30#define VY(n) (n < 3 ? regs->CP2D.p[n << 1].sw.h : regs->CP2D.p[10].sw.l)
31#define VZ(n) (n < 3 ? regs->CP2D.p[(n << 1) + 1].sw.l : regs->CP2D.p[11].sw.l)
32#define MX11(n) (n < 3 ? regs->CP2C.p[(n << 3)].sw.l : 0)
33#define MX12(n) (n < 3 ? regs->CP2C.p[(n << 3)].sw.h : 0)
34#define MX13(n) (n < 3 ? regs->CP2C.p[(n << 3) + 1].sw.l : 0)
35#define MX21(n) (n < 3 ? regs->CP2C.p[(n << 3) + 1].sw.h : 0)
36#define MX22(n) (n < 3 ? regs->CP2C.p[(n << 3) + 2].sw.l : 0)
37#define MX23(n) (n < 3 ? regs->CP2C.p[(n << 3) + 2].sw.h : 0)
38#define MX31(n) (n < 3 ? regs->CP2C.p[(n << 3) + 3].sw.l : 0)
39#define MX32(n) (n < 3 ? regs->CP2C.p[(n << 3) + 3].sw.h : 0)
40#define MX33(n) (n < 3 ? regs->CP2C.p[(n << 3) + 4].sw.l : 0)
41#define CV1(n) (n < 3 ? (s32)regs->CP2C.r[(n << 3) + 5] : 0)
42#define CV2(n) (n < 3 ? (s32)regs->CP2C.r[(n << 3) + 6] : 0)
43#define CV3(n) (n < 3 ? (s32)regs->CP2C.r[(n << 3) + 7] : 0)
44
45#define fSX(n) ((regs->CP2D.p)[((n) + 12)].sw.l)
46#define fSY(n) ((regs->CP2D.p)[((n) + 12)].sw.h)
47#define fSZ(n) ((regs->CP2D.p)[((n) + 17)].w.l) /* (n == 0) => SZ1; */
48
49#define gteVXY0 (regs->CP2D.r[0])
50#define gteVX0 (regs->CP2D.p[0].sw.l)
51#define gteVY0 (regs->CP2D.p[0].sw.h)
52#define gteVZ0 (regs->CP2D.p[1].sw.l)
53#define gteVXY1 (regs->CP2D.r[2])
54#define gteVX1 (regs->CP2D.p[2].sw.l)
55#define gteVY1 (regs->CP2D.p[2].sw.h)
56#define gteVZ1 (regs->CP2D.p[3].sw.l)
57#define gteVXY2 (regs->CP2D.r[4])
58#define gteVX2 (regs->CP2D.p[4].sw.l)
59#define gteVY2 (regs->CP2D.p[4].sw.h)
60#define gteVZ2 (regs->CP2D.p[5].sw.l)
61#define gteRGB (regs->CP2D.r[6])
62#define gteR (regs->CP2D.p[6].b.l)
63#define gteG (regs->CP2D.p[6].b.h)
64#define gteB (regs->CP2D.p[6].b.h2)
65#define gteCODE (regs->CP2D.p[6].b.h3)
66#define gteOTZ (regs->CP2D.p[7].w.l)
67#define gteIR0 (regs->CP2D.p[8].sw.l)
68#define gteIR1 (regs->CP2D.p[9].sw.l)
69#define gteIR2 (regs->CP2D.p[10].sw.l)
70#define gteIR3 (regs->CP2D.p[11].sw.l)
71#define gteSXY0 (regs->CP2D.r[12])
72#define gteSX0 (regs->CP2D.p[12].sw.l)
73#define gteSY0 (regs->CP2D.p[12].sw.h)
74#define gteSXY1 (regs->CP2D.r[13])
75#define gteSX1 (regs->CP2D.p[13].sw.l)
76#define gteSY1 (regs->CP2D.p[13].sw.h)
77#define gteSXY2 (regs->CP2D.r[14])
78#define gteSX2 (regs->CP2D.p[14].sw.l)
79#define gteSY2 (regs->CP2D.p[14].sw.h)
80#define gteSXYP (regs->CP2D.r[15])
81#define gteSXP (regs->CP2D.p[15].sw.l)
82#define gteSYP (regs->CP2D.p[15].sw.h)
83#define gteSZ0 (regs->CP2D.p[16].w.l)
84#define gteSZ1 (regs->CP2D.p[17].w.l)
85#define gteSZ2 (regs->CP2D.p[18].w.l)
86#define gteSZ3 (regs->CP2D.p[19].w.l)
87#define gteRGB0 (regs->CP2D.r[20])
88#define gteR0 (regs->CP2D.p[20].b.l)
89#define gteG0 (regs->CP2D.p[20].b.h)
90#define gteB0 (regs->CP2D.p[20].b.h2)
91#define gteCODE0 (regs->CP2D.p[20].b.h3)
92#define gteRGB1 (regs->CP2D.r[21])
93#define gteR1 (regs->CP2D.p[21].b.l)
94#define gteG1 (regs->CP2D.p[21].b.h)
95#define gteB1 (regs->CP2D.p[21].b.h2)
96#define gteCODE1 (regs->CP2D.p[21].b.h3)
97#define gteRGB2 (regs->CP2D.r[22])
98#define gteR2 (regs->CP2D.p[22].b.l)
99#define gteG2 (regs->CP2D.p[22].b.h)
100#define gteB2 (regs->CP2D.p[22].b.h2)
101#define gteCODE2 (regs->CP2D.p[22].b.h3)
102#define gteRES1 (regs->CP2D.r[23])
103#define gteMAC0 (((s32 *)regs->CP2D.r)[24])
104#define gteMAC1 (((s32 *)regs->CP2D.r)[25])
105#define gteMAC2 (((s32 *)regs->CP2D.r)[26])
106#define gteMAC3 (((s32 *)regs->CP2D.r)[27])
107#define gteIRGB (regs->CP2D.r[28])
108#define gteORGB (regs->CP2D.r[29])
109#define gteLZCS (regs->CP2D.r[30])
110#define gteLZCR (regs->CP2D.r[31])
111
112#define gteR11R12 (((s32 *)regs->CP2C.r)[0])
113#define gteR22R23 (((s32 *)regs->CP2C.r)[2])
114#define gteR11 (regs->CP2C.p[0].sw.l)
115#define gteR12 (regs->CP2C.p[0].sw.h)
116#define gteR13 (regs->CP2C.p[1].sw.l)
117#define gteR21 (regs->CP2C.p[1].sw.h)
118#define gteR22 (regs->CP2C.p[2].sw.l)
119#define gteR23 (regs->CP2C.p[2].sw.h)
120#define gteR31 (regs->CP2C.p[3].sw.l)
121#define gteR32 (regs->CP2C.p[3].sw.h)
122#define gteR33 (regs->CP2C.p[4].sw.l)
123#define gteTRX (((s32 *)regs->CP2C.r)[5])
124#define gteTRY (((s32 *)regs->CP2C.r)[6])
125#define gteTRZ (((s32 *)regs->CP2C.r)[7])
126#define gteL11 (regs->CP2C.p[8].sw.l)
127#define gteL12 (regs->CP2C.p[8].sw.h)
128#define gteL13 (regs->CP2C.p[9].sw.l)
129#define gteL21 (regs->CP2C.p[9].sw.h)
130#define gteL22 (regs->CP2C.p[10].sw.l)
131#define gteL23 (regs->CP2C.p[10].sw.h)
132#define gteL31 (regs->CP2C.p[11].sw.l)
133#define gteL32 (regs->CP2C.p[11].sw.h)
134#define gteL33 (regs->CP2C.p[12].sw.l)
135#define gteRBK (((s32 *)regs->CP2C.r)[13])
136#define gteGBK (((s32 *)regs->CP2C.r)[14])
137#define gteBBK (((s32 *)regs->CP2C.r)[15])
138#define gteLR1 (regs->CP2C.p[16].sw.l)
139#define gteLR2 (regs->CP2C.p[16].sw.h)
140#define gteLR3 (regs->CP2C.p[17].sw.l)
141#define gteLG1 (regs->CP2C.p[17].sw.h)
142#define gteLG2 (regs->CP2C.p[18].sw.l)
143#define gteLG3 (regs->CP2C.p[18].sw.h)
144#define gteLB1 (regs->CP2C.p[19].sw.l)
145#define gteLB2 (regs->CP2C.p[19].sw.h)
146#define gteLB3 (regs->CP2C.p[20].sw.l)
147#define gteRFC (((s32 *)regs->CP2C.r)[21])
148#define gteGFC (((s32 *)regs->CP2C.r)[22])
149#define gteBFC (((s32 *)regs->CP2C.r)[23])
150#define gteOFX (((s32 *)regs->CP2C.r)[24])
151#define gteOFY (((s32 *)regs->CP2C.r)[25])
b7159e1a 152// senquack - gteH register is u16, not s16, and used in GTE that way.
153// HOWEVER when read back by CPU using CFC2, it will be incorrectly
154// sign-extended by bug in original hardware, according to Nocash docs
155// GTE section 'Screen Offset and Distance'. The emulator does this
156// sign extension when it is loaded to GTE by CTC2.
157//#define gteH (psxRegs.CP2C.p[26].sw.l)
158#define gteH (psxRegs.CP2C.p[26].w.l)
f74fb727 159#define gteDQA (regs->CP2C.p[27].sw.l)
160#define gteDQB (((s32 *)regs->CP2C.r)[28])
161#define gteZSF3 (regs->CP2C.p[29].sw.l)
162#define gteZSF4 (regs->CP2C.p[30].sw.l)
163#define gteFLAG (regs->CP2C.r[31])
ef79bbde
P
164
165#define GTE_OP(op) ((op >> 20) & 31)
166#define GTE_SF(op) ((op >> 19) & 1)
167#define GTE_MX(op) ((op >> 17) & 3)
168#define GTE_V(op) ((op >> 15) & 3)
169#define GTE_CV(op) ((op >> 13) & 3)
170#define GTE_CD(op) ((op >> 11) & 3) /* not used */
171#define GTE_LM(op) ((op >> 10) & 1)
172#define GTE_CT(op) ((op >> 6) & 15) /* not used */
173#define GTE_FUNCT(op) (op & 63)
174
175#define gteop (psxRegs.code & 0x1ffffff)
176
59774ed0 177#ifndef FLAGLESS
178
669fed93 179static inline s64 BOUNDS_(psxCP2Regs *regs, s64 n_value, s64 n_max, int n_maxflag, s64 n_min, int n_minflag) {
ef79bbde
P
180 if (n_value > n_max) {
181 gteFLAG |= n_maxflag;
182 } else if (n_value < n_min) {
183 gteFLAG |= n_minflag;
184 }
185 return n_value;
186}
187
f74fb727 188static inline s32 LIM_(psxCP2Regs *regs, s32 value, s32 max, s32 min, u32 flag) {
ef79bbde
P
189 s32 ret = value;
190 if (value > max) {
191 gteFLAG |= flag;
192 ret = max;
193 } else if (value < min) {
194 gteFLAG |= flag;
195 ret = min;
196 }
197 return ret;
198}
199
f74fb727 200static inline u32 limE_(psxCP2Regs *regs, u32 result) {
59774ed0 201 if (result > 0x1ffff) {
202 gteFLAG |= (1 << 31) | (1 << 17);
203 return 0x1ffff;
204 }
205 return result;
206}
207
208#else
209
f74fb727 210#define BOUNDS_(regs, a, ...) (a)
59774ed0 211
f74fb727 212static inline s32 LIM_(psxCP2Regs *regs, s32 value, s32 max, s32 min, u32 flag_unused) {
59774ed0 213 s32 ret = value;
214 if (value > max)
215 ret = max;
216 else if (value < min)
217 ret = min;
218 return ret;
219}
220
f74fb727 221static inline u32 limE_(psxCP2Regs *regs, u32 result) {
bedfea38 222 if (result > 0x1ffff)
223 return 0x1ffff;
224 return result;
225}
59774ed0 226
227#endif
228
f74fb727 229#define BOUNDS(n_value,n_max,n_maxflag,n_min,n_minflag) \
230 BOUNDS_(regs,n_value,n_max,n_maxflag,n_min,n_minflag)
231#define LIM(value,max,min,flag) \
232 LIM_(regs,value,max,min,flag)
233#define limE(result) \
234 limE_(regs,result)
235
ef79bbde
P
236#define A1(a) BOUNDS((a), 0x7fffffff, (1 << 30), -(s64)0x80000000, (1 << 31) | (1 << 27))
237#define A2(a) BOUNDS((a), 0x7fffffff, (1 << 29), -(s64)0x80000000, (1 << 31) | (1 << 26))
238#define A3(a) BOUNDS((a), 0x7fffffff, (1 << 28), -(s64)0x80000000, (1 << 31) | (1 << 25))
239#define limB1(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 31) | (1 << 24))
240#define limB2(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 31) | (1 << 23))
241#define limB3(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 22))
242#define limC1(a) LIM((a), 0x00ff, 0x0000, (1 << 21))
243#define limC2(a) LIM((a), 0x00ff, 0x0000, (1 << 20))
244#define limC3(a) LIM((a), 0x00ff, 0x0000, (1 << 19))
245#define limD(a) LIM((a), 0xffff, 0x0000, (1 << 31) | (1 << 18))
246
ef79bbde
P
247#define F(a) BOUNDS((a), 0x7fffffff, (1 << 31) | (1 << 16), -(s64)0x80000000, (1 << 31) | (1 << 15))
248#define limG1(a) LIM((a), 0x3ff, -0x400, (1 << 31) | (1 << 14))
249#define limG2(a) LIM((a), 0x3ff, -0x400, (1 << 31) | (1 << 13))
7384197d 250#define limH(a) LIM((a), 0x1000, 0x0000, (1 << 12))
ef79bbde 251
6c6c9590 252#ifndef __arm__
253#define A1U A1
254#define A2U A2
255#define A3U A3
256#else
257/* these are unlikely to be hit and usually waste cycles, don't want them on ARM */
258#define A1U(x) (x)
259#define A2U(x) (x)
260#define A3U(x) (x)
261#endif
262
b7159e1a 263
264//senquack - n param should be unsigned (will be 'gteH' reg which is u16)
265#ifdef GTE_USE_NATIVE_DIVIDE
266INLINE u32 DIVIDE(u16 n, u16 d) {
267 if (n < d * 2) {
268 return ((u32)n << 16) / d;
269 }
270 return 0xffffffff;
271}
272#else
ef79bbde 273#include "gte_divider.h"
b7159e1a 274#endif // GTE_USE_NATIVE_DIVIDE
ef79bbde 275
59774ed0 276#ifndef FLAGLESS
277
ef79bbde 278static inline u32 MFC2(int reg) {
eac38522 279 psxCP2Regs *regs = &psxRegs.CP2;
ef79bbde
P
280 switch (reg) {
281 case 1:
282 case 3:
283 case 5:
284 case 8:
285 case 9:
286 case 10:
287 case 11:
288 psxRegs.CP2D.r[reg] = (s32)psxRegs.CP2D.p[reg].sw.l;
289 break;
290
291 case 7:
292 case 16:
293 case 17:
294 case 18:
295 case 19:
296 psxRegs.CP2D.r[reg] = (u32)psxRegs.CP2D.p[reg].w.l;
297 break;
298
299 case 15:
300 psxRegs.CP2D.r[reg] = gteSXY2;
301 break;
302
303 case 28:
ef79bbde
P
304 case 29:
305 psxRegs.CP2D.r[reg] = LIM(gteIR1 >> 7, 0x1f, 0, 0) |
306 (LIM(gteIR2 >> 7, 0x1f, 0, 0) << 5) |
307 (LIM(gteIR3 >> 7, 0x1f, 0, 0) << 10);
308 break;
309 }
310 return psxRegs.CP2D.r[reg];
311}
312
313static inline void MTC2(u32 value, int reg) {
eac38522 314 psxCP2Regs *regs = &psxRegs.CP2;
ef79bbde
P
315 switch (reg) {
316 case 15:
317 gteSXY0 = gteSXY1;
318 gteSXY1 = gteSXY2;
319 gteSXY2 = value;
320 gteSXYP = value;
321 break;
322
323 case 28:
324 gteIRGB = value;
3968e69e 325 // not gteIR1 etc. just to be consistent with dynarec
326 regs->CP2D.n.ir1 = (value & 0x1f) << 7;
327 regs->CP2D.n.ir2 = (value & 0x3e0) << 2;
328 regs->CP2D.n.ir3 = (value & 0x7c00) >> 3;
ef79bbde
P
329 break;
330
331 case 30:
332 {
333 int a;
334 gteLZCS = value;
335
336 a = gteLZCS;
337 if (a > 0) {
338 int i;
339 for (i = 31; (a & (1 << i)) == 0 && i >= 0; i--);
340 gteLZCR = 31 - i;
341 } else if (a < 0) {
342 int i;
343 a ^= 0xffffffff;
344 for (i = 31; (a & (1 << i)) == 0 && i >= 0; i--);
345 gteLZCR = 31 - i;
346 } else {
347 gteLZCR = 32;
348 }
349 }
350 break;
351
ef79bbde
P
352 case 31:
353 return;
354
355 default:
356 psxRegs.CP2D.r[reg] = value;
357 }
358}
359
360static inline void CTC2(u32 value, int reg) {
361 switch (reg) {
362 case 4:
363 case 12:
364 case 20:
365 case 26:
366 case 27:
367 case 29:
368 case 30:
369 value = (s32)(s16)value;
370 break;
371
372 case 31:
373 value = value & 0x7ffff000;
374 if (value & 0x7f87e000) value |= 0x80000000;
375 break;
376 }
377
378 psxRegs.CP2C.r[reg] = value;
379}
380
381void gteMFC2() {
382 if (!_Rt_) return;
383 psxRegs.GPR.r[_Rt_] = MFC2(_Rd_);
384}
385
386void gteCFC2() {
387 if (!_Rt_) return;
388 psxRegs.GPR.r[_Rt_] = psxRegs.CP2C.r[_Rd_];
389}
390
391void gteMTC2() {
392 MTC2(psxRegs.GPR.r[_Rt_], _Rd_);
393}
394
395void gteCTC2() {
396 CTC2(psxRegs.GPR.r[_Rt_], _Rd_);
397}
398
399#define _oB_ (psxRegs.GPR.r[_Rs_] + _Imm_)
400
401void gteLWC2() {
402 MTC2(psxMemRead32(_oB_), _Rt_);
403}
404
405void gteSWC2() {
406 psxMemWrite32(_oB_, MFC2(_Rt_));
407}
408
59774ed0 409#endif // FLAGLESS
410
3ebefe71 411#if 0
a2544c92 412#define DIVIDE DIVIDE_
413static u32 DIVIDE_(s16 n, u16 d) {
414 if (n >= 0 && n < d * 2) {
415 s32 n_ = n;
416 return ((n_ << 16) + d / 2) / d;
417 //return (u32)((float)(n_ << 16) / (float)d + (float)0.5);
418 }
419 return 0xffffffff;
420}
3ebefe71 421#endif
a2544c92 422
f74fb727 423void gteRTPS(psxCP2Regs *regs) {
ef79bbde 424 int quotient;
8cb04d22 425 s64 tmp;
ef79bbde
P
426
427#ifdef GTE_LOG
428 GTE_LOG("GTE RTPS\n");
429#endif
430 gteFLAG = 0;
431
432 gteMAC1 = A1((((s64)gteTRX << 12) + (gteR11 * gteVX0) + (gteR12 * gteVY0) + (gteR13 * gteVZ0)) >> 12);
433 gteMAC2 = A2((((s64)gteTRY << 12) + (gteR21 * gteVX0) + (gteR22 * gteVY0) + (gteR23 * gteVZ0)) >> 12);
434 gteMAC3 = A3((((s64)gteTRZ << 12) + (gteR31 * gteVX0) + (gteR32 * gteVY0) + (gteR33 * gteVZ0)) >> 12);
435 gteIR1 = limB1(gteMAC1, 0);
436 gteIR2 = limB2(gteMAC2, 0);
437 gteIR3 = limB3(gteMAC3, 0);
438 gteSZ0 = gteSZ1;
439 gteSZ1 = gteSZ2;
440 gteSZ2 = gteSZ3;
441 gteSZ3 = limD(gteMAC3);
442 quotient = limE(DIVIDE(gteH, gteSZ3));
443 gteSXY0 = gteSXY1;
444 gteSXY1 = gteSXY2;
445 gteSX2 = limG1(F((s64)gteOFX + ((s64)gteIR1 * quotient)) >> 16);
446 gteSY2 = limG2(F((s64)gteOFY + ((s64)gteIR2 * quotient)) >> 16);
447
8cb04d22 448 tmp = (s64)gteDQB + ((s64)gteDQA * quotient);
449 gteMAC0 = F(tmp);
450 gteIR0 = limH(tmp >> 12);
ef79bbde
P
451}
452
f74fb727 453void gteRTPT(psxCP2Regs *regs) {
ef79bbde
P
454 int quotient;
455 int v;
456 s32 vx, vy, vz;
8cb04d22 457 s64 tmp;
ef79bbde
P
458
459#ifdef GTE_LOG
460 GTE_LOG("GTE RTPT\n");
461#endif
462 gteFLAG = 0;
463
464 gteSZ0 = gteSZ3;
465 for (v = 0; v < 3; v++) {
466 vx = VX(v);
467 vy = VY(v);
468 vz = VZ(v);
469 gteMAC1 = A1((((s64)gteTRX << 12) + (gteR11 * vx) + (gteR12 * vy) + (gteR13 * vz)) >> 12);
470 gteMAC2 = A2((((s64)gteTRY << 12) + (gteR21 * vx) + (gteR22 * vy) + (gteR23 * vz)) >> 12);
471 gteMAC3 = A3((((s64)gteTRZ << 12) + (gteR31 * vx) + (gteR32 * vy) + (gteR33 * vz)) >> 12);
472 gteIR1 = limB1(gteMAC1, 0);
473 gteIR2 = limB2(gteMAC2, 0);
474 gteIR3 = limB3(gteMAC3, 0);
475 fSZ(v) = limD(gteMAC3);
476 quotient = limE(DIVIDE(gteH, fSZ(v)));
477 fSX(v) = limG1(F((s64)gteOFX + ((s64)gteIR1 * quotient)) >> 16);
478 fSY(v) = limG2(F((s64)gteOFY + ((s64)gteIR2 * quotient)) >> 16);
479 }
8cb04d22 480
481 tmp = (s64)gteDQB + ((s64)gteDQA * quotient);
482 gteMAC0 = F(tmp);
483 gteIR0 = limH(tmp >> 12);
ef79bbde
P
484}
485
f74fb727 486void gteMVMVA(psxCP2Regs *regs) {
ef79bbde
P
487 int shift = 12 * GTE_SF(gteop);
488 int mx = GTE_MX(gteop);
489 int v = GTE_V(gteop);
490 int cv = GTE_CV(gteop);
491 int lm = GTE_LM(gteop);
492 s32 vx = VX(v);
493 s32 vy = VY(v);
494 s32 vz = VZ(v);
495
496#ifdef GTE_LOG
497 GTE_LOG("GTE MVMVA\n");
498#endif
499 gteFLAG = 0;
500
501 gteMAC1 = A1((((s64)CV1(cv) << 12) + (MX11(mx) * vx) + (MX12(mx) * vy) + (MX13(mx) * vz)) >> shift);
502 gteMAC2 = A2((((s64)CV2(cv) << 12) + (MX21(mx) * vx) + (MX22(mx) * vy) + (MX23(mx) * vz)) >> shift);
503 gteMAC3 = A3((((s64)CV3(cv) << 12) + (MX31(mx) * vx) + (MX32(mx) * vy) + (MX33(mx) * vz)) >> shift);
504
505 gteIR1 = limB1(gteMAC1, lm);
506 gteIR2 = limB2(gteMAC2, lm);
507 gteIR3 = limB3(gteMAC3, lm);
508}
509
f74fb727 510void gteNCLIP(psxCP2Regs *regs) {
ef79bbde
P
511#ifdef GTE_LOG
512 GTE_LOG("GTE NCLIP\n");
513#endif
514 gteFLAG = 0;
515
516 gteMAC0 = F((s64)gteSX0 * (gteSY1 - gteSY2) +
517 gteSX1 * (gteSY2 - gteSY0) +
518 gteSX2 * (gteSY0 - gteSY1));
519}
520
f74fb727 521void gteAVSZ3(psxCP2Regs *regs) {
ef79bbde
P
522#ifdef GTE_LOG
523 GTE_LOG("GTE AVSZ3\n");
524#endif
525 gteFLAG = 0;
526
b3254af9 527 gteMAC0 = F((s64)gteZSF3 * (gteSZ1 + gteSZ2 + gteSZ3));
ef79bbde
P
528 gteOTZ = limD(gteMAC0 >> 12);
529}
530
f74fb727 531void gteAVSZ4(psxCP2Regs *regs) {
ef79bbde
P
532#ifdef GTE_LOG
533 GTE_LOG("GTE AVSZ4\n");
534#endif
535 gteFLAG = 0;
536
b3254af9 537 gteMAC0 = F((s64)gteZSF4 * (gteSZ0 + gteSZ1 + gteSZ2 + gteSZ3));
ef79bbde
P
538 gteOTZ = limD(gteMAC0 >> 12);
539}
540
f74fb727 541void gteSQR(psxCP2Regs *regs) {
ef79bbde
P
542 int shift = 12 * GTE_SF(gteop);
543 int lm = GTE_LM(gteop);
544
545#ifdef GTE_LOG
546 GTE_LOG("GTE SQR\n");
547#endif
548 gteFLAG = 0;
549
b3254af9 550 gteMAC1 = (gteIR1 * gteIR1) >> shift;
551 gteMAC2 = (gteIR2 * gteIR2) >> shift;
552 gteMAC3 = (gteIR3 * gteIR3) >> shift;
7384197d 553 gteIR1 = limB1(gteMAC1, lm);
554 gteIR2 = limB2(gteMAC2, lm);
555 gteIR3 = limB3(gteMAC3, lm);
ef79bbde
P
556}
557
f74fb727 558void gteNCCS(psxCP2Regs *regs) {
ef79bbde
P
559#ifdef GTE_LOG
560 GTE_LOG("GTE NCCS\n");
561#endif
562 gteFLAG = 0;
563
b3254af9 564 gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12;
565 gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12;
566 gteMAC3 = ((s64)(gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12;
ef79bbde
P
567 gteIR1 = limB1(gteMAC1, 1);
568 gteIR2 = limB2(gteMAC2, 1);
569 gteIR3 = limB3(gteMAC3, 1);
570 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
571 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
572 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
573 gteIR1 = limB1(gteMAC1, 1);
574 gteIR2 = limB2(gteMAC2, 1);
575 gteIR3 = limB3(gteMAC3, 1);
b3254af9 576 gteMAC1 = ((s32)gteR * gteIR1) >> 8;
577 gteMAC2 = ((s32)gteG * gteIR2) >> 8;
578 gteMAC3 = ((s32)gteB * gteIR3) >> 8;
579 gteIR1 = gteMAC1;
580 gteIR2 = gteMAC2;
581 gteIR3 = gteMAC3;
ef79bbde
P
582
583 gteRGB0 = gteRGB1;
584 gteRGB1 = gteRGB2;
585 gteCODE2 = gteCODE;
586 gteR2 = limC1(gteMAC1 >> 4);
587 gteG2 = limC2(gteMAC2 >> 4);
588 gteB2 = limC3(gteMAC3 >> 4);
589}
590
f74fb727 591void gteNCCT(psxCP2Regs *regs) {
ef79bbde
P
592 int v;
593 s32 vx, vy, vz;
594
595#ifdef GTE_LOG
596 GTE_LOG("GTE NCCT\n");
597#endif
598 gteFLAG = 0;
599
600 for (v = 0; v < 3; v++) {
601 vx = VX(v);
602 vy = VY(v);
603 vz = VZ(v);
b3254af9 604 gteMAC1 = ((s64)(gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12;
605 gteMAC2 = ((s64)(gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12;
606 gteMAC3 = ((s64)(gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12;
ef79bbde
P
607 gteIR1 = limB1(gteMAC1, 1);
608 gteIR2 = limB2(gteMAC2, 1);
609 gteIR3 = limB3(gteMAC3, 1);
610 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
611 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
612 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
613 gteIR1 = limB1(gteMAC1, 1);
614 gteIR2 = limB2(gteMAC2, 1);
615 gteIR3 = limB3(gteMAC3, 1);
b3254af9 616 gteMAC1 = ((s32)gteR * gteIR1) >> 8;
617 gteMAC2 = ((s32)gteG * gteIR2) >> 8;
618 gteMAC3 = ((s32)gteB * gteIR3) >> 8;
ef79bbde
P
619
620 gteRGB0 = gteRGB1;
621 gteRGB1 = gteRGB2;
622 gteCODE2 = gteCODE;
623 gteR2 = limC1(gteMAC1 >> 4);
624 gteG2 = limC2(gteMAC2 >> 4);
625 gteB2 = limC3(gteMAC3 >> 4);
626 }
b3254af9 627 gteIR1 = gteMAC1;
628 gteIR2 = gteMAC2;
629 gteIR3 = gteMAC3;
ef79bbde
P
630}
631
f74fb727 632void gteNCDS(psxCP2Regs *regs) {
ef79bbde
P
633#ifdef GTE_LOG
634 GTE_LOG("GTE NCDS\n");
635#endif
636 gteFLAG = 0;
637
b3254af9 638 gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12;
639 gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12;
640 gteMAC3 = ((s64)(gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12;
ef79bbde
P
641 gteIR1 = limB1(gteMAC1, 1);
642 gteIR2 = limB2(gteMAC2, 1);
643 gteIR3 = limB3(gteMAC3, 1);
644 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
645 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
646 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
647 gteIR1 = limB1(gteMAC1, 1);
648 gteIR2 = limB2(gteMAC2, 1);
649 gteIR3 = limB3(gteMAC3, 1);
6c6c9590 650 gteMAC1 = (((gteR << 4) * gteIR1) + (gteIR0 * limB1(A1U((s64)gteRFC - ((gteR * gteIR1) >> 8)), 0))) >> 12;
651 gteMAC2 = (((gteG << 4) * gteIR2) + (gteIR0 * limB2(A2U((s64)gteGFC - ((gteG * gteIR2) >> 8)), 0))) >> 12;
652 gteMAC3 = (((gteB << 4) * gteIR3) + (gteIR0 * limB3(A3U((s64)gteBFC - ((gteB * gteIR3) >> 8)), 0))) >> 12;
ef79bbde
P
653 gteIR1 = limB1(gteMAC1, 1);
654 gteIR2 = limB2(gteMAC2, 1);
655 gteIR3 = limB3(gteMAC3, 1);
656
657 gteRGB0 = gteRGB1;
658 gteRGB1 = gteRGB2;
659 gteCODE2 = gteCODE;
660 gteR2 = limC1(gteMAC1 >> 4);
661 gteG2 = limC2(gteMAC2 >> 4);
662 gteB2 = limC3(gteMAC3 >> 4);
663}
664
f74fb727 665void gteNCDT(psxCP2Regs *regs) {
ef79bbde
P
666 int v;
667 s32 vx, vy, vz;
668
669#ifdef GTE_LOG
670 GTE_LOG("GTE NCDT\n");
671#endif
672 gteFLAG = 0;
673
674 for (v = 0; v < 3; v++) {
675 vx = VX(v);
676 vy = VY(v);
677 vz = VZ(v);
b3254af9 678 gteMAC1 = ((s64)(gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12;
679 gteMAC2 = ((s64)(gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12;
680 gteMAC3 = ((s64)(gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12;
ef79bbde
P
681 gteIR1 = limB1(gteMAC1, 1);
682 gteIR2 = limB2(gteMAC2, 1);
683 gteIR3 = limB3(gteMAC3, 1);
684 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
685 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
686 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
687 gteIR1 = limB1(gteMAC1, 1);
688 gteIR2 = limB2(gteMAC2, 1);
689 gteIR3 = limB3(gteMAC3, 1);
6c6c9590 690 gteMAC1 = (((gteR << 4) * gteIR1) + (gteIR0 * limB1(A1U((s64)gteRFC - ((gteR * gteIR1) >> 8)), 0))) >> 12;
691 gteMAC2 = (((gteG << 4) * gteIR2) + (gteIR0 * limB2(A2U((s64)gteGFC - ((gteG * gteIR2) >> 8)), 0))) >> 12;
692 gteMAC3 = (((gteB << 4) * gteIR3) + (gteIR0 * limB3(A3U((s64)gteBFC - ((gteB * gteIR3) >> 8)), 0))) >> 12;
ef79bbde
P
693
694 gteRGB0 = gteRGB1;
695 gteRGB1 = gteRGB2;
696 gteCODE2 = gteCODE;
697 gteR2 = limC1(gteMAC1 >> 4);
698 gteG2 = limC2(gteMAC2 >> 4);
699 gteB2 = limC3(gteMAC3 >> 4);
700 }
701 gteIR1 = limB1(gteMAC1, 1);
702 gteIR2 = limB2(gteMAC2, 1);
703 gteIR3 = limB3(gteMAC3, 1);
704}
705
f74fb727 706void gteOP(psxCP2Regs *regs) {
ef79bbde
P
707 int shift = 12 * GTE_SF(gteop);
708 int lm = GTE_LM(gteop);
709
710#ifdef GTE_LOG
711 GTE_LOG("GTE OP\n");
712#endif
713 gteFLAG = 0;
714
b3254af9 715 gteMAC1 = ((gteR22 * gteIR3) - (gteR33 * gteIR2)) >> shift;
716 gteMAC2 = ((gteR33 * gteIR1) - (gteR11 * gteIR3)) >> shift;
717 gteMAC3 = ((gteR11 * gteIR2) - (gteR22 * gteIR1)) >> shift;
ef79bbde
P
718 gteIR1 = limB1(gteMAC1, lm);
719 gteIR2 = limB2(gteMAC2, lm);
720 gteIR3 = limB3(gteMAC3, lm);
721}
722
f74fb727 723void gteDCPL(psxCP2Regs *regs) {
ef79bbde
P
724 int lm = GTE_LM(gteop);
725
b3254af9 726 s32 RIR1 = ((s32)gteR * gteIR1) >> 8;
727 s32 GIR2 = ((s32)gteG * gteIR2) >> 8;
728 s32 BIR3 = ((s32)gteB * gteIR3) >> 8;
ef79bbde
P
729
730#ifdef GTE_LOG
731 GTE_LOG("GTE DCPL\n");
732#endif
733 gteFLAG = 0;
734
6c6c9590 735 gteMAC1 = RIR1 + ((gteIR0 * limB1(A1U((s64)gteRFC - RIR1), 0)) >> 12);
736 gteMAC2 = GIR2 + ((gteIR0 * limB1(A2U((s64)gteGFC - GIR2), 0)) >> 12);
737 gteMAC3 = BIR3 + ((gteIR0 * limB1(A3U((s64)gteBFC - BIR3), 0)) >> 12);
ef79bbde
P
738
739 gteIR1 = limB1(gteMAC1, lm);
740 gteIR2 = limB2(gteMAC2, lm);
741 gteIR3 = limB3(gteMAC3, lm);
742
743 gteRGB0 = gteRGB1;
744 gteRGB1 = gteRGB2;
745 gteCODE2 = gteCODE;
746 gteR2 = limC1(gteMAC1 >> 4);
747 gteG2 = limC2(gteMAC2 >> 4);
748 gteB2 = limC3(gteMAC3 >> 4);
749}
750
f74fb727 751void gteGPF(psxCP2Regs *regs) {
ef79bbde
P
752 int shift = 12 * GTE_SF(gteop);
753
754#ifdef GTE_LOG
755 GTE_LOG("GTE GPF\n");
756#endif
757 gteFLAG = 0;
758
b3254af9 759 gteMAC1 = (gteIR0 * gteIR1) >> shift;
760 gteMAC2 = (gteIR0 * gteIR2) >> shift;
761 gteMAC3 = (gteIR0 * gteIR3) >> shift;
ef79bbde
P
762 gteIR1 = limB1(gteMAC1, 0);
763 gteIR2 = limB2(gteMAC2, 0);
764 gteIR3 = limB3(gteMAC3, 0);
765
766 gteRGB0 = gteRGB1;
767 gteRGB1 = gteRGB2;
768 gteCODE2 = gteCODE;
769 gteR2 = limC1(gteMAC1 >> 4);
770 gteG2 = limC2(gteMAC2 >> 4);
771 gteB2 = limC3(gteMAC3 >> 4);
772}
773
f74fb727 774void gteGPL(psxCP2Regs *regs) {
ef79bbde
P
775 int shift = 12 * GTE_SF(gteop);
776
777#ifdef GTE_LOG
778 GTE_LOG("GTE GPL\n");
779#endif
780 gteFLAG = 0;
781
782 gteMAC1 = A1((((s64)gteMAC1 << shift) + (gteIR0 * gteIR1)) >> shift);
783 gteMAC2 = A2((((s64)gteMAC2 << shift) + (gteIR0 * gteIR2)) >> shift);
784 gteMAC3 = A3((((s64)gteMAC3 << shift) + (gteIR0 * gteIR3)) >> shift);
785 gteIR1 = limB1(gteMAC1, 0);
786 gteIR2 = limB2(gteMAC2, 0);
787 gteIR3 = limB3(gteMAC3, 0);
788
789 gteRGB0 = gteRGB1;
790 gteRGB1 = gteRGB2;
791 gteCODE2 = gteCODE;
792 gteR2 = limC1(gteMAC1 >> 4);
793 gteG2 = limC2(gteMAC2 >> 4);
794 gteB2 = limC3(gteMAC3 >> 4);
795}
796
f74fb727 797void gteDPCS(psxCP2Regs *regs) {
ef79bbde
P
798 int shift = 12 * GTE_SF(gteop);
799
800#ifdef GTE_LOG
801 GTE_LOG("GTE DPCS\n");
802#endif
803 gteFLAG = 0;
804
6c6c9590 805 gteMAC1 = ((gteR << 16) + (gteIR0 * limB1(A1U(((s64)gteRFC - (gteR << 4)) << (12 - shift)), 0))) >> 12;
806 gteMAC2 = ((gteG << 16) + (gteIR0 * limB2(A2U(((s64)gteGFC - (gteG << 4)) << (12 - shift)), 0))) >> 12;
807 gteMAC3 = ((gteB << 16) + (gteIR0 * limB3(A3U(((s64)gteBFC - (gteB << 4)) << (12 - shift)), 0))) >> 12;
ef79bbde
P
808
809 gteIR1 = limB1(gteMAC1, 0);
810 gteIR2 = limB2(gteMAC2, 0);
811 gteIR3 = limB3(gteMAC3, 0);
812 gteRGB0 = gteRGB1;
813 gteRGB1 = gteRGB2;
814 gteCODE2 = gteCODE;
815 gteR2 = limC1(gteMAC1 >> 4);
816 gteG2 = limC2(gteMAC2 >> 4);
817 gteB2 = limC3(gteMAC3 >> 4);
818}
819
f74fb727 820void gteDPCT(psxCP2Regs *regs) {
ef79bbde
P
821 int v;
822
823#ifdef GTE_LOG
824 GTE_LOG("GTE DPCT\n");
825#endif
826 gteFLAG = 0;
827
828 for (v = 0; v < 3; v++) {
6c6c9590 829 gteMAC1 = ((gteR0 << 16) + (gteIR0 * limB1(A1U((s64)gteRFC - (gteR0 << 4)), 0))) >> 12;
830 gteMAC2 = ((gteG0 << 16) + (gteIR0 * limB1(A2U((s64)gteGFC - (gteG0 << 4)), 0))) >> 12;
831 gteMAC3 = ((gteB0 << 16) + (gteIR0 * limB1(A3U((s64)gteBFC - (gteB0 << 4)), 0))) >> 12;
ef79bbde
P
832
833 gteRGB0 = gteRGB1;
834 gteRGB1 = gteRGB2;
835 gteCODE2 = gteCODE;
836 gteR2 = limC1(gteMAC1 >> 4);
837 gteG2 = limC2(gteMAC2 >> 4);
838 gteB2 = limC3(gteMAC3 >> 4);
839 }
840 gteIR1 = limB1(gteMAC1, 0);
841 gteIR2 = limB2(gteMAC2, 0);
842 gteIR3 = limB3(gteMAC3, 0);
843}
844
f74fb727 845void gteNCS(psxCP2Regs *regs) {
ef79bbde
P
846#ifdef GTE_LOG
847 GTE_LOG("GTE NCS\n");
848#endif
849 gteFLAG = 0;
850
b3254af9 851 gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12;
852 gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12;
853 gteMAC3 = ((s64)(gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12;
ef79bbde
P
854 gteIR1 = limB1(gteMAC1, 1);
855 gteIR2 = limB2(gteMAC2, 1);
856 gteIR3 = limB3(gteMAC3, 1);
857 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
858 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
859 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
860 gteIR1 = limB1(gteMAC1, 1);
861 gteIR2 = limB2(gteMAC2, 1);
862 gteIR3 = limB3(gteMAC3, 1);
863
864 gteRGB0 = gteRGB1;
865 gteRGB1 = gteRGB2;
866 gteCODE2 = gteCODE;
867 gteR2 = limC1(gteMAC1 >> 4);
868 gteG2 = limC2(gteMAC2 >> 4);
869 gteB2 = limC3(gteMAC3 >> 4);
870}
871
f74fb727 872void gteNCT(psxCP2Regs *regs) {
ef79bbde
P
873 int v;
874 s32 vx, vy, vz;
875
876#ifdef GTE_LOG
877 GTE_LOG("GTE NCT\n");
878#endif
879 gteFLAG = 0;
880
881 for (v = 0; v < 3; v++) {
882 vx = VX(v);
883 vy = VY(v);
884 vz = VZ(v);
b3254af9 885 gteMAC1 = ((s64)(gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12;
886 gteMAC2 = ((s64)(gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12;
887 gteMAC3 = ((s64)(gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12;
ef79bbde
P
888 gteIR1 = limB1(gteMAC1, 1);
889 gteIR2 = limB2(gteMAC2, 1);
890 gteIR3 = limB3(gteMAC3, 1);
891 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
892 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
893 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
894 gteRGB0 = gteRGB1;
895 gteRGB1 = gteRGB2;
896 gteCODE2 = gteCODE;
897 gteR2 = limC1(gteMAC1 >> 4);
898 gteG2 = limC2(gteMAC2 >> 4);
899 gteB2 = limC3(gteMAC3 >> 4);
900 }
901 gteIR1 = limB1(gteMAC1, 1);
902 gteIR2 = limB2(gteMAC2, 1);
903 gteIR3 = limB3(gteMAC3, 1);
904}
905
f74fb727 906void gteCC(psxCP2Regs *regs) {
ef79bbde
P
907#ifdef GTE_LOG
908 GTE_LOG("GTE CC\n");
909#endif
910 gteFLAG = 0;
911
912 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
913 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
914 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
915 gteIR1 = limB1(gteMAC1, 1);
916 gteIR2 = limB2(gteMAC2, 1);
917 gteIR3 = limB3(gteMAC3, 1);
b3254af9 918 gteMAC1 = ((s32)gteR * gteIR1) >> 8;
919 gteMAC2 = ((s32)gteG * gteIR2) >> 8;
920 gteMAC3 = ((s32)gteB * gteIR3) >> 8;
ef79bbde
P
921 gteIR1 = limB1(gteMAC1, 1);
922 gteIR2 = limB2(gteMAC2, 1);
923 gteIR3 = limB3(gteMAC3, 1);
924
925 gteRGB0 = gteRGB1;
926 gteRGB1 = gteRGB2;
927 gteCODE2 = gteCODE;
928 gteR2 = limC1(gteMAC1 >> 4);
929 gteG2 = limC2(gteMAC2 >> 4);
930 gteB2 = limC3(gteMAC3 >> 4);
931}
932
f74fb727 933void gteINTPL(psxCP2Regs *regs) {
ef79bbde
P
934 int shift = 12 * GTE_SF(gteop);
935 int lm = GTE_LM(gteop);
936
937#ifdef GTE_LOG
938 GTE_LOG("GTE INTPL\n");
939#endif
940 gteFLAG = 0;
941
6c6c9590 942 gteMAC1 = ((gteIR1 << 12) + (gteIR0 * limB1(A1U((s64)gteRFC - gteIR1), 0))) >> shift;
943 gteMAC2 = ((gteIR2 << 12) + (gteIR0 * limB2(A2U((s64)gteGFC - gteIR2), 0))) >> shift;
944 gteMAC3 = ((gteIR3 << 12) + (gteIR0 * limB3(A3U((s64)gteBFC - gteIR3), 0))) >> shift;
ef79bbde
P
945 gteIR1 = limB1(gteMAC1, lm);
946 gteIR2 = limB2(gteMAC2, lm);
947 gteIR3 = limB3(gteMAC3, lm);
948 gteRGB0 = gteRGB1;
949 gteRGB1 = gteRGB2;
950 gteCODE2 = gteCODE;
951 gteR2 = limC1(gteMAC1 >> 4);
952 gteG2 = limC2(gteMAC2 >> 4);
953 gteB2 = limC3(gteMAC3 >> 4);
954}
955
f74fb727 956void gteCDP(psxCP2Regs *regs) {
ef79bbde
P
957#ifdef GTE_LOG
958 GTE_LOG("GTE CDP\n");
959#endif
960 gteFLAG = 0;
961
962 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
963 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
964 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
965 gteIR1 = limB1(gteMAC1, 1);
966 gteIR2 = limB2(gteMAC2, 1);
967 gteIR3 = limB3(gteMAC3, 1);
6c6c9590 968 gteMAC1 = (((gteR << 4) * gteIR1) + (gteIR0 * limB1(A1U((s64)gteRFC - ((gteR * gteIR1) >> 8)), 0))) >> 12;
969 gteMAC2 = (((gteG << 4) * gteIR2) + (gteIR0 * limB2(A2U((s64)gteGFC - ((gteG * gteIR2) >> 8)), 0))) >> 12;
970 gteMAC3 = (((gteB << 4) * gteIR3) + (gteIR0 * limB3(A3U((s64)gteBFC - ((gteB * gteIR3) >> 8)), 0))) >> 12;
ef79bbde
P
971 gteIR1 = limB1(gteMAC1, 1);
972 gteIR2 = limB2(gteMAC2, 1);
973 gteIR3 = limB3(gteMAC3, 1);
974
975 gteRGB0 = gteRGB1;
976 gteRGB1 = gteRGB2;
977 gteCODE2 = gteCODE;
978 gteR2 = limC1(gteMAC1 >> 4);
979 gteG2 = limC2(gteMAC2 >> 4);
980 gteB2 = limC3(gteMAC3 >> 4);
981}
6c0eefaf 982
983/* decomposed/parametrized versions for the recompiler */
984
985#ifndef FLAGLESS
986
987void gteSQR_part_noshift(psxCP2Regs *regs) {
988 gteFLAG = 0;
989
990 gteMAC1 = gteIR1 * gteIR1;
991 gteMAC2 = gteIR2 * gteIR2;
992 gteMAC3 = gteIR3 * gteIR3;
993}
994
995void gteSQR_part_shift(psxCP2Regs *regs) {
996 gteFLAG = 0;
997
998 gteMAC1 = (gteIR1 * gteIR1) >> 12;
999 gteMAC2 = (gteIR2 * gteIR2) >> 12;
1000 gteMAC3 = (gteIR3 * gteIR3) >> 12;
1001}
1002
1003void gteOP_part_noshift(psxCP2Regs *regs) {
1004 gteFLAG = 0;
1005
1006 gteMAC1 = (gteR22 * gteIR3) - (gteR33 * gteIR2);
1007 gteMAC2 = (gteR33 * gteIR1) - (gteR11 * gteIR3);
1008 gteMAC3 = (gteR11 * gteIR2) - (gteR22 * gteIR1);
1009}
1010
1011void gteOP_part_shift(psxCP2Regs *regs) {
1012 gteFLAG = 0;
1013
1014 gteMAC1 = ((gteR22 * gteIR3) - (gteR33 * gteIR2)) >> 12;
1015 gteMAC2 = ((gteR33 * gteIR1) - (gteR11 * gteIR3)) >> 12;
1016 gteMAC3 = ((gteR11 * gteIR2) - (gteR22 * gteIR1)) >> 12;
1017}
1018
1019void gteDCPL_part(psxCP2Regs *regs) {
1020 s32 RIR1 = ((s32)gteR * gteIR1) >> 8;
1021 s32 GIR2 = ((s32)gteG * gteIR2) >> 8;
1022 s32 BIR3 = ((s32)gteB * gteIR3) >> 8;
1023
1024 gteFLAG = 0;
1025
1026 gteMAC1 = RIR1 + ((gteIR0 * limB1(A1U((s64)gteRFC - RIR1), 0)) >> 12);
1027 gteMAC2 = GIR2 + ((gteIR0 * limB1(A2U((s64)gteGFC - GIR2), 0)) >> 12);
1028 gteMAC3 = BIR3 + ((gteIR0 * limB1(A3U((s64)gteBFC - BIR3), 0)) >> 12);
1029}
1030
1031void gteGPF_part_noshift(psxCP2Regs *regs) {
1032 gteFLAG = 0;
1033
1034 gteMAC1 = gteIR0 * gteIR1;
1035 gteMAC2 = gteIR0 * gteIR2;
1036 gteMAC3 = gteIR0 * gteIR3;
1037}
1038
1039void gteGPF_part_shift(psxCP2Regs *regs) {
1040 gteFLAG = 0;
1041
1042 gteMAC1 = (gteIR0 * gteIR1) >> 12;
1043 gteMAC2 = (gteIR0 * gteIR2) >> 12;
1044 gteMAC3 = (gteIR0 * gteIR3) >> 12;
1045}
1046
1047#endif // !FLAGLESS
1048
1049void gteGPL_part_noshift(psxCP2Regs *regs) {
1050 gteFLAG = 0;
1051
1052 gteMAC1 = A1((s64)gteMAC1 + (gteIR0 * gteIR1));
1053 gteMAC2 = A2((s64)gteMAC2 + (gteIR0 * gteIR2));
1054 gteMAC3 = A3((s64)gteMAC3 + (gteIR0 * gteIR3));
1055}
1056
1057void gteGPL_part_shift(psxCP2Regs *regs) {
1058 gteFLAG = 0;
1059
1060 gteMAC1 = A1((s64)gteMAC1 + ((gteIR0 * gteIR1) >> 12));
1061 gteMAC2 = A2((s64)gteMAC2 + ((gteIR0 * gteIR2) >> 12));
1062 gteMAC3 = A3((s64)gteMAC3 + ((gteIR0 * gteIR3) >> 12));
1063}
1064
1065void gteDPCS_part_noshift(psxCP2Regs *regs) {
1066 int shift = 0;
1067
1068 gteFLAG = 0;
1069
1070 gteMAC1 = ((gteR << 16) + (gteIR0 * limB1(A1U((s64)gteRFC - (gteR << 4)) << (12 - shift), 0))) >> 12;
1071 gteMAC2 = ((gteG << 16) + (gteIR0 * limB2(A2U((s64)gteGFC - (gteG << 4)) << (12 - shift), 0))) >> 12;
1072 gteMAC3 = ((gteB << 16) + (gteIR0 * limB3(A3U((s64)gteBFC - (gteB << 4)) << (12 - shift), 0))) >> 12;
1073}
1074
1075void gteDPCS_part_shift(psxCP2Regs *regs) {
1076 int shift = 12;
1077
1078 gteFLAG = 0;
1079
1080 gteMAC1 = ((gteR << 16) + (gteIR0 * limB1(A1U((s64)gteRFC - (gteR << 4)) << (12 - shift), 0))) >> 12;
1081 gteMAC2 = ((gteG << 16) + (gteIR0 * limB2(A2U((s64)gteGFC - (gteG << 4)) << (12 - shift), 0))) >> 12;
1082 gteMAC3 = ((gteB << 16) + (gteIR0 * limB3(A3U((s64)gteBFC - (gteB << 4)) << (12 - shift), 0))) >> 12;
1083}
1084
1085void gteINTPL_part_noshift(psxCP2Regs *regs) {
1086 gteFLAG = 0;
1087
1088 gteMAC1 = ((gteIR1 << 12) + (gteIR0 * limB1(A1U((s64)gteRFC - gteIR1), 0)));
1089 gteMAC2 = ((gteIR2 << 12) + (gteIR0 * limB2(A2U((s64)gteGFC - gteIR2), 0)));
1090 gteMAC3 = ((gteIR3 << 12) + (gteIR0 * limB3(A3U((s64)gteBFC - gteIR3), 0)));
1091}
1092
1093void gteINTPL_part_shift(psxCP2Regs *regs) {
1094 gteFLAG = 0;
1095
1096 gteMAC1 = ((gteIR1 << 12) + (gteIR0 * limB1(A1U((s64)gteRFC - gteIR1), 0))) >> 12;
1097 gteMAC2 = ((gteIR2 << 12) + (gteIR0 * limB2(A2U((s64)gteGFC - gteIR2), 0))) >> 12;
1098 gteMAC3 = ((gteIR3 << 12) + (gteIR0 * limB3(A3U((s64)gteBFC - gteIR3), 0))) >> 12;
1099}
1100
1101void gteMACtoRGB(psxCP2Regs *regs) {
1102 gteRGB0 = gteRGB1;
1103 gteRGB1 = gteRGB2;
1104 gteCODE2 = gteCODE;
1105 gteR2 = limC1(gteMAC1 >> 4);
1106 gteG2 = limC2(gteMAC2 >> 4);
1107 gteB2 = limC3(gteMAC3 >> 4);
1108}
1109