spu: finish offload code to TI C64x DSP
[pcsx_rearmed.git] / libpcsxcore / gte.c
CommitLineData
ef79bbde
P
1/***************************************************************************
2 * PCSX-Revolution - PlayStation Emulator for Nintendo Wii *
3 * Copyright (C) 2009-2010 PCSX-Revolution Dev Team *
4 * <http://code.google.com/p/pcsx-revolution/> *
5 * *
6 * This program is free software; you can redistribute it and/or modify *
7 * it under the terms of the GNU General Public License as published by *
8 * the Free Software Foundation; either version 2 of the License, or *
9 * (at your option) any later version. *
10 * *
11 * This program is distributed in the hope that it will be useful, *
12 * but WITHOUT ANY WARRANTY; without even the implied warranty of *
13 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the *
14 * GNU General Public License for more details. *
15 * *
16 * You should have received a copy of the GNU General Public License *
17 * along with this program; if not, write to the *
18 * Free Software Foundation, Inc., *
19 * 51 Franklin Street, Fifth Floor, Boston, MA 02111-1307 USA. *
20 ***************************************************************************/
21
22/*
23* GTE functions.
24*/
25
26#include "gte.h"
27#include "psxmem.h"
28
f74fb727 29#define VX(n) (n < 3 ? regs->CP2D.p[n << 1].sw.l : regs->CP2D.p[9].sw.l)
30#define VY(n) (n < 3 ? regs->CP2D.p[n << 1].sw.h : regs->CP2D.p[10].sw.l)
31#define VZ(n) (n < 3 ? regs->CP2D.p[(n << 1) + 1].sw.l : regs->CP2D.p[11].sw.l)
32#define MX11(n) (n < 3 ? regs->CP2C.p[(n << 3)].sw.l : 0)
33#define MX12(n) (n < 3 ? regs->CP2C.p[(n << 3)].sw.h : 0)
34#define MX13(n) (n < 3 ? regs->CP2C.p[(n << 3) + 1].sw.l : 0)
35#define MX21(n) (n < 3 ? regs->CP2C.p[(n << 3) + 1].sw.h : 0)
36#define MX22(n) (n < 3 ? regs->CP2C.p[(n << 3) + 2].sw.l : 0)
37#define MX23(n) (n < 3 ? regs->CP2C.p[(n << 3) + 2].sw.h : 0)
38#define MX31(n) (n < 3 ? regs->CP2C.p[(n << 3) + 3].sw.l : 0)
39#define MX32(n) (n < 3 ? regs->CP2C.p[(n << 3) + 3].sw.h : 0)
40#define MX33(n) (n < 3 ? regs->CP2C.p[(n << 3) + 4].sw.l : 0)
41#define CV1(n) (n < 3 ? (s32)regs->CP2C.r[(n << 3) + 5] : 0)
42#define CV2(n) (n < 3 ? (s32)regs->CP2C.r[(n << 3) + 6] : 0)
43#define CV3(n) (n < 3 ? (s32)regs->CP2C.r[(n << 3) + 7] : 0)
44
45#define fSX(n) ((regs->CP2D.p)[((n) + 12)].sw.l)
46#define fSY(n) ((regs->CP2D.p)[((n) + 12)].sw.h)
47#define fSZ(n) ((regs->CP2D.p)[((n) + 17)].w.l) /* (n == 0) => SZ1; */
48
49#define gteVXY0 (regs->CP2D.r[0])
50#define gteVX0 (regs->CP2D.p[0].sw.l)
51#define gteVY0 (regs->CP2D.p[0].sw.h)
52#define gteVZ0 (regs->CP2D.p[1].sw.l)
53#define gteVXY1 (regs->CP2D.r[2])
54#define gteVX1 (regs->CP2D.p[2].sw.l)
55#define gteVY1 (regs->CP2D.p[2].sw.h)
56#define gteVZ1 (regs->CP2D.p[3].sw.l)
57#define gteVXY2 (regs->CP2D.r[4])
58#define gteVX2 (regs->CP2D.p[4].sw.l)
59#define gteVY2 (regs->CP2D.p[4].sw.h)
60#define gteVZ2 (regs->CP2D.p[5].sw.l)
61#define gteRGB (regs->CP2D.r[6])
62#define gteR (regs->CP2D.p[6].b.l)
63#define gteG (regs->CP2D.p[6].b.h)
64#define gteB (regs->CP2D.p[6].b.h2)
65#define gteCODE (regs->CP2D.p[6].b.h3)
66#define gteOTZ (regs->CP2D.p[7].w.l)
67#define gteIR0 (regs->CP2D.p[8].sw.l)
68#define gteIR1 (regs->CP2D.p[9].sw.l)
69#define gteIR2 (regs->CP2D.p[10].sw.l)
70#define gteIR3 (regs->CP2D.p[11].sw.l)
71#define gteSXY0 (regs->CP2D.r[12])
72#define gteSX0 (regs->CP2D.p[12].sw.l)
73#define gteSY0 (regs->CP2D.p[12].sw.h)
74#define gteSXY1 (regs->CP2D.r[13])
75#define gteSX1 (regs->CP2D.p[13].sw.l)
76#define gteSY1 (regs->CP2D.p[13].sw.h)
77#define gteSXY2 (regs->CP2D.r[14])
78#define gteSX2 (regs->CP2D.p[14].sw.l)
79#define gteSY2 (regs->CP2D.p[14].sw.h)
80#define gteSXYP (regs->CP2D.r[15])
81#define gteSXP (regs->CP2D.p[15].sw.l)
82#define gteSYP (regs->CP2D.p[15].sw.h)
83#define gteSZ0 (regs->CP2D.p[16].w.l)
84#define gteSZ1 (regs->CP2D.p[17].w.l)
85#define gteSZ2 (regs->CP2D.p[18].w.l)
86#define gteSZ3 (regs->CP2D.p[19].w.l)
87#define gteRGB0 (regs->CP2D.r[20])
88#define gteR0 (regs->CP2D.p[20].b.l)
89#define gteG0 (regs->CP2D.p[20].b.h)
90#define gteB0 (regs->CP2D.p[20].b.h2)
91#define gteCODE0 (regs->CP2D.p[20].b.h3)
92#define gteRGB1 (regs->CP2D.r[21])
93#define gteR1 (regs->CP2D.p[21].b.l)
94#define gteG1 (regs->CP2D.p[21].b.h)
95#define gteB1 (regs->CP2D.p[21].b.h2)
96#define gteCODE1 (regs->CP2D.p[21].b.h3)
97#define gteRGB2 (regs->CP2D.r[22])
98#define gteR2 (regs->CP2D.p[22].b.l)
99#define gteG2 (regs->CP2D.p[22].b.h)
100#define gteB2 (regs->CP2D.p[22].b.h2)
101#define gteCODE2 (regs->CP2D.p[22].b.h3)
102#define gteRES1 (regs->CP2D.r[23])
103#define gteMAC0 (((s32 *)regs->CP2D.r)[24])
104#define gteMAC1 (((s32 *)regs->CP2D.r)[25])
105#define gteMAC2 (((s32 *)regs->CP2D.r)[26])
106#define gteMAC3 (((s32 *)regs->CP2D.r)[27])
107#define gteIRGB (regs->CP2D.r[28])
108#define gteORGB (regs->CP2D.r[29])
109#define gteLZCS (regs->CP2D.r[30])
110#define gteLZCR (regs->CP2D.r[31])
111
112#define gteR11R12 (((s32 *)regs->CP2C.r)[0])
113#define gteR22R23 (((s32 *)regs->CP2C.r)[2])
114#define gteR11 (regs->CP2C.p[0].sw.l)
115#define gteR12 (regs->CP2C.p[0].sw.h)
116#define gteR13 (regs->CP2C.p[1].sw.l)
117#define gteR21 (regs->CP2C.p[1].sw.h)
118#define gteR22 (regs->CP2C.p[2].sw.l)
119#define gteR23 (regs->CP2C.p[2].sw.h)
120#define gteR31 (regs->CP2C.p[3].sw.l)
121#define gteR32 (regs->CP2C.p[3].sw.h)
122#define gteR33 (regs->CP2C.p[4].sw.l)
123#define gteTRX (((s32 *)regs->CP2C.r)[5])
124#define gteTRY (((s32 *)regs->CP2C.r)[6])
125#define gteTRZ (((s32 *)regs->CP2C.r)[7])
126#define gteL11 (regs->CP2C.p[8].sw.l)
127#define gteL12 (regs->CP2C.p[8].sw.h)
128#define gteL13 (regs->CP2C.p[9].sw.l)
129#define gteL21 (regs->CP2C.p[9].sw.h)
130#define gteL22 (regs->CP2C.p[10].sw.l)
131#define gteL23 (regs->CP2C.p[10].sw.h)
132#define gteL31 (regs->CP2C.p[11].sw.l)
133#define gteL32 (regs->CP2C.p[11].sw.h)
134#define gteL33 (regs->CP2C.p[12].sw.l)
135#define gteRBK (((s32 *)regs->CP2C.r)[13])
136#define gteGBK (((s32 *)regs->CP2C.r)[14])
137#define gteBBK (((s32 *)regs->CP2C.r)[15])
138#define gteLR1 (regs->CP2C.p[16].sw.l)
139#define gteLR2 (regs->CP2C.p[16].sw.h)
140#define gteLR3 (regs->CP2C.p[17].sw.l)
141#define gteLG1 (regs->CP2C.p[17].sw.h)
142#define gteLG2 (regs->CP2C.p[18].sw.l)
143#define gteLG3 (regs->CP2C.p[18].sw.h)
144#define gteLB1 (regs->CP2C.p[19].sw.l)
145#define gteLB2 (regs->CP2C.p[19].sw.h)
146#define gteLB3 (regs->CP2C.p[20].sw.l)
147#define gteRFC (((s32 *)regs->CP2C.r)[21])
148#define gteGFC (((s32 *)regs->CP2C.r)[22])
149#define gteBFC (((s32 *)regs->CP2C.r)[23])
150#define gteOFX (((s32 *)regs->CP2C.r)[24])
151#define gteOFY (((s32 *)regs->CP2C.r)[25])
152#define gteH (regs->CP2C.p[26].sw.l)
153#define gteDQA (regs->CP2C.p[27].sw.l)
154#define gteDQB (((s32 *)regs->CP2C.r)[28])
155#define gteZSF3 (regs->CP2C.p[29].sw.l)
156#define gteZSF4 (regs->CP2C.p[30].sw.l)
157#define gteFLAG (regs->CP2C.r[31])
ef79bbde
P
158
159#define GTE_OP(op) ((op >> 20) & 31)
160#define GTE_SF(op) ((op >> 19) & 1)
161#define GTE_MX(op) ((op >> 17) & 3)
162#define GTE_V(op) ((op >> 15) & 3)
163#define GTE_CV(op) ((op >> 13) & 3)
164#define GTE_CD(op) ((op >> 11) & 3) /* not used */
165#define GTE_LM(op) ((op >> 10) & 1)
166#define GTE_CT(op) ((op >> 6) & 15) /* not used */
167#define GTE_FUNCT(op) (op & 63)
168
169#define gteop (psxRegs.code & 0x1ffffff)
170
59774ed0 171#ifndef FLAGLESS
172
b3254af9 173static inline s32 BOUNDS_(psxCP2Regs *regs, s64 n_value, s64 n_max, int n_maxflag, s64 n_min, int n_minflag) {
ef79bbde
P
174 if (n_value > n_max) {
175 gteFLAG |= n_maxflag;
176 } else if (n_value < n_min) {
177 gteFLAG |= n_minflag;
178 }
179 return n_value;
180}
181
f74fb727 182static inline s32 LIM_(psxCP2Regs *regs, s32 value, s32 max, s32 min, u32 flag) {
ef79bbde
P
183 s32 ret = value;
184 if (value > max) {
185 gteFLAG |= flag;
186 ret = max;
187 } else if (value < min) {
188 gteFLAG |= flag;
189 ret = min;
190 }
191 return ret;
192}
193
f74fb727 194static inline u32 limE_(psxCP2Regs *regs, u32 result) {
59774ed0 195 if (result > 0x1ffff) {
196 gteFLAG |= (1 << 31) | (1 << 17);
197 return 0x1ffff;
198 }
199 return result;
200}
201
202#else
203
f74fb727 204#define BOUNDS_(regs, a, ...) (a)
59774ed0 205
f74fb727 206static inline s32 LIM_(psxCP2Regs *regs, s32 value, s32 max, s32 min, u32 flag_unused) {
59774ed0 207 s32 ret = value;
208 if (value > max)
209 ret = max;
210 else if (value < min)
211 ret = min;
212 return ret;
213}
214
f74fb727 215static inline u32 limE_(psxCP2Regs *regs, u32 result) {
bedfea38 216 if (result > 0x1ffff)
217 return 0x1ffff;
218 return result;
219}
59774ed0 220
221#endif
222
f74fb727 223#define BOUNDS(n_value,n_max,n_maxflag,n_min,n_minflag) \
224 BOUNDS_(regs,n_value,n_max,n_maxflag,n_min,n_minflag)
225#define LIM(value,max,min,flag) \
226 LIM_(regs,value,max,min,flag)
227#define limE(result) \
228 limE_(regs,result)
229
ef79bbde
P
230#define A1(a) BOUNDS((a), 0x7fffffff, (1 << 30), -(s64)0x80000000, (1 << 31) | (1 << 27))
231#define A2(a) BOUNDS((a), 0x7fffffff, (1 << 29), -(s64)0x80000000, (1 << 31) | (1 << 26))
232#define A3(a) BOUNDS((a), 0x7fffffff, (1 << 28), -(s64)0x80000000, (1 << 31) | (1 << 25))
233#define limB1(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 31) | (1 << 24))
234#define limB2(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 31) | (1 << 23))
235#define limB3(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 22))
236#define limC1(a) LIM((a), 0x00ff, 0x0000, (1 << 21))
237#define limC2(a) LIM((a), 0x00ff, 0x0000, (1 << 20))
238#define limC3(a) LIM((a), 0x00ff, 0x0000, (1 << 19))
239#define limD(a) LIM((a), 0xffff, 0x0000, (1 << 31) | (1 << 18))
240
ef79bbde
P
241#define F(a) BOUNDS((a), 0x7fffffff, (1 << 31) | (1 << 16), -(s64)0x80000000, (1 << 31) | (1 << 15))
242#define limG1(a) LIM((a), 0x3ff, -0x400, (1 << 31) | (1 << 14))
243#define limG2(a) LIM((a), 0x3ff, -0x400, (1 << 31) | (1 << 13))
7384197d 244#define limH(a) LIM((a), 0x1000, 0x0000, (1 << 12))
ef79bbde 245
6c6c9590 246#ifndef __arm__
247#define A1U A1
248#define A2U A2
249#define A3U A3
250#else
251/* these are unlikely to be hit and usually waste cycles, don't want them on ARM */
252#define A1U(x) (x)
253#define A2U(x) (x)
254#define A3U(x) (x)
255#endif
256
ef79bbde
P
257#include "gte_divider.h"
258
59774ed0 259#ifndef FLAGLESS
260
ef79bbde 261static inline u32 MFC2(int reg) {
eac38522 262 psxCP2Regs *regs = &psxRegs.CP2;
ef79bbde
P
263 switch (reg) {
264 case 1:
265 case 3:
266 case 5:
267 case 8:
268 case 9:
269 case 10:
270 case 11:
271 psxRegs.CP2D.r[reg] = (s32)psxRegs.CP2D.p[reg].sw.l;
272 break;
273
274 case 7:
275 case 16:
276 case 17:
277 case 18:
278 case 19:
279 psxRegs.CP2D.r[reg] = (u32)psxRegs.CP2D.p[reg].w.l;
280 break;
281
282 case 15:
283 psxRegs.CP2D.r[reg] = gteSXY2;
284 break;
285
286 case 28:
ef79bbde
P
287 case 29:
288 psxRegs.CP2D.r[reg] = LIM(gteIR1 >> 7, 0x1f, 0, 0) |
289 (LIM(gteIR2 >> 7, 0x1f, 0, 0) << 5) |
290 (LIM(gteIR3 >> 7, 0x1f, 0, 0) << 10);
291 break;
292 }
293 return psxRegs.CP2D.r[reg];
294}
295
296static inline void MTC2(u32 value, int reg) {
eac38522 297 psxCP2Regs *regs = &psxRegs.CP2;
ef79bbde
P
298 switch (reg) {
299 case 15:
300 gteSXY0 = gteSXY1;
301 gteSXY1 = gteSXY2;
302 gteSXY2 = value;
303 gteSXYP = value;
304 break;
305
306 case 28:
307 gteIRGB = value;
308 gteIR1 = (value & 0x1f) << 7;
309 gteIR2 = (value & 0x3e0) << 2;
310 gteIR3 = (value & 0x7c00) >> 3;
311 break;
312
313 case 30:
314 {
315 int a;
316 gteLZCS = value;
317
318 a = gteLZCS;
319 if (a > 0) {
320 int i;
321 for (i = 31; (a & (1 << i)) == 0 && i >= 0; i--);
322 gteLZCR = 31 - i;
323 } else if (a < 0) {
324 int i;
325 a ^= 0xffffffff;
326 for (i = 31; (a & (1 << i)) == 0 && i >= 0; i--);
327 gteLZCR = 31 - i;
328 } else {
329 gteLZCR = 32;
330 }
331 }
332 break;
333
ef79bbde
P
334 case 31:
335 return;
336
337 default:
338 psxRegs.CP2D.r[reg] = value;
339 }
340}
341
342static inline void CTC2(u32 value, int reg) {
343 switch (reg) {
344 case 4:
345 case 12:
346 case 20:
347 case 26:
348 case 27:
349 case 29:
350 case 30:
351 value = (s32)(s16)value;
352 break;
353
354 case 31:
355 value = value & 0x7ffff000;
356 if (value & 0x7f87e000) value |= 0x80000000;
357 break;
358 }
359
360 psxRegs.CP2C.r[reg] = value;
361}
362
363void gteMFC2() {
364 if (!_Rt_) return;
365 psxRegs.GPR.r[_Rt_] = MFC2(_Rd_);
366}
367
368void gteCFC2() {
369 if (!_Rt_) return;
370 psxRegs.GPR.r[_Rt_] = psxRegs.CP2C.r[_Rd_];
371}
372
373void gteMTC2() {
374 MTC2(psxRegs.GPR.r[_Rt_], _Rd_);
375}
376
377void gteCTC2() {
378 CTC2(psxRegs.GPR.r[_Rt_], _Rd_);
379}
380
381#define _oB_ (psxRegs.GPR.r[_Rs_] + _Imm_)
382
383void gteLWC2() {
384 MTC2(psxMemRead32(_oB_), _Rt_);
385}
386
387void gteSWC2() {
388 psxMemWrite32(_oB_, MFC2(_Rt_));
389}
390
59774ed0 391#endif // FLAGLESS
392
3ebefe71 393#if 0
a2544c92 394#define DIVIDE DIVIDE_
395static u32 DIVIDE_(s16 n, u16 d) {
396 if (n >= 0 && n < d * 2) {
397 s32 n_ = n;
398 return ((n_ << 16) + d / 2) / d;
399 //return (u32)((float)(n_ << 16) / (float)d + (float)0.5);
400 }
401 return 0xffffffff;
402}
3ebefe71 403#endif
a2544c92 404
f74fb727 405void gteRTPS(psxCP2Regs *regs) {
ef79bbde
P
406 int quotient;
407
408#ifdef GTE_LOG
409 GTE_LOG("GTE RTPS\n");
410#endif
411 gteFLAG = 0;
412
413 gteMAC1 = A1((((s64)gteTRX << 12) + (gteR11 * gteVX0) + (gteR12 * gteVY0) + (gteR13 * gteVZ0)) >> 12);
414 gteMAC2 = A2((((s64)gteTRY << 12) + (gteR21 * gteVX0) + (gteR22 * gteVY0) + (gteR23 * gteVZ0)) >> 12);
415 gteMAC3 = A3((((s64)gteTRZ << 12) + (gteR31 * gteVX0) + (gteR32 * gteVY0) + (gteR33 * gteVZ0)) >> 12);
416 gteIR1 = limB1(gteMAC1, 0);
417 gteIR2 = limB2(gteMAC2, 0);
418 gteIR3 = limB3(gteMAC3, 0);
419 gteSZ0 = gteSZ1;
420 gteSZ1 = gteSZ2;
421 gteSZ2 = gteSZ3;
422 gteSZ3 = limD(gteMAC3);
423 quotient = limE(DIVIDE(gteH, gteSZ3));
424 gteSXY0 = gteSXY1;
425 gteSXY1 = gteSXY2;
426 gteSX2 = limG1(F((s64)gteOFX + ((s64)gteIR1 * quotient)) >> 16);
427 gteSY2 = limG2(F((s64)gteOFY + ((s64)gteIR2 * quotient)) >> 16);
428
631e6f28 429 gteMAC0 = F((s64)gteDQB + ((s64)gteDQA * quotient));
430 gteIR0 = limH(gteMAC0 >> 12);
ef79bbde
P
431}
432
f74fb727 433void gteRTPT(psxCP2Regs *regs) {
ef79bbde
P
434 int quotient;
435 int v;
436 s32 vx, vy, vz;
437
438#ifdef GTE_LOG
439 GTE_LOG("GTE RTPT\n");
440#endif
441 gteFLAG = 0;
442
443 gteSZ0 = gteSZ3;
444 for (v = 0; v < 3; v++) {
445 vx = VX(v);
446 vy = VY(v);
447 vz = VZ(v);
448 gteMAC1 = A1((((s64)gteTRX << 12) + (gteR11 * vx) + (gteR12 * vy) + (gteR13 * vz)) >> 12);
449 gteMAC2 = A2((((s64)gteTRY << 12) + (gteR21 * vx) + (gteR22 * vy) + (gteR23 * vz)) >> 12);
450 gteMAC3 = A3((((s64)gteTRZ << 12) + (gteR31 * vx) + (gteR32 * vy) + (gteR33 * vz)) >> 12);
451 gteIR1 = limB1(gteMAC1, 0);
452 gteIR2 = limB2(gteMAC2, 0);
453 gteIR3 = limB3(gteMAC3, 0);
454 fSZ(v) = limD(gteMAC3);
455 quotient = limE(DIVIDE(gteH, fSZ(v)));
456 fSX(v) = limG1(F((s64)gteOFX + ((s64)gteIR1 * quotient)) >> 16);
457 fSY(v) = limG2(F((s64)gteOFY + ((s64)gteIR2 * quotient)) >> 16);
458 }
631e6f28 459 gteMAC0 = F((s64)gteDQB + ((s64)gteDQA * quotient));
460 gteIR0 = limH(gteMAC0 >> 12);
ef79bbde
P
461}
462
f74fb727 463void gteMVMVA(psxCP2Regs *regs) {
ef79bbde
P
464 int shift = 12 * GTE_SF(gteop);
465 int mx = GTE_MX(gteop);
466 int v = GTE_V(gteop);
467 int cv = GTE_CV(gteop);
468 int lm = GTE_LM(gteop);
469 s32 vx = VX(v);
470 s32 vy = VY(v);
471 s32 vz = VZ(v);
472
473#ifdef GTE_LOG
474 GTE_LOG("GTE MVMVA\n");
475#endif
476 gteFLAG = 0;
477
478 gteMAC1 = A1((((s64)CV1(cv) << 12) + (MX11(mx) * vx) + (MX12(mx) * vy) + (MX13(mx) * vz)) >> shift);
479 gteMAC2 = A2((((s64)CV2(cv) << 12) + (MX21(mx) * vx) + (MX22(mx) * vy) + (MX23(mx) * vz)) >> shift);
480 gteMAC3 = A3((((s64)CV3(cv) << 12) + (MX31(mx) * vx) + (MX32(mx) * vy) + (MX33(mx) * vz)) >> shift);
481
482 gteIR1 = limB1(gteMAC1, lm);
483 gteIR2 = limB2(gteMAC2, lm);
484 gteIR3 = limB3(gteMAC3, lm);
485}
486
f74fb727 487void gteNCLIP(psxCP2Regs *regs) {
ef79bbde
P
488#ifdef GTE_LOG
489 GTE_LOG("GTE NCLIP\n");
490#endif
491 gteFLAG = 0;
492
493 gteMAC0 = F((s64)gteSX0 * (gteSY1 - gteSY2) +
494 gteSX1 * (gteSY2 - gteSY0) +
495 gteSX2 * (gteSY0 - gteSY1));
496}
497
f74fb727 498void gteAVSZ3(psxCP2Regs *regs) {
ef79bbde
P
499#ifdef GTE_LOG
500 GTE_LOG("GTE AVSZ3\n");
501#endif
502 gteFLAG = 0;
503
b3254af9 504 gteMAC0 = F((s64)gteZSF3 * (gteSZ1 + gteSZ2 + gteSZ3));
ef79bbde
P
505 gteOTZ = limD(gteMAC0 >> 12);
506}
507
f74fb727 508void gteAVSZ4(psxCP2Regs *regs) {
ef79bbde
P
509#ifdef GTE_LOG
510 GTE_LOG("GTE AVSZ4\n");
511#endif
512 gteFLAG = 0;
513
b3254af9 514 gteMAC0 = F((s64)gteZSF4 * (gteSZ0 + gteSZ1 + gteSZ2 + gteSZ3));
ef79bbde
P
515 gteOTZ = limD(gteMAC0 >> 12);
516}
517
f74fb727 518void gteSQR(psxCP2Regs *regs) {
ef79bbde
P
519 int shift = 12 * GTE_SF(gteop);
520 int lm = GTE_LM(gteop);
521
522#ifdef GTE_LOG
523 GTE_LOG("GTE SQR\n");
524#endif
525 gteFLAG = 0;
526
b3254af9 527 gteMAC1 = (gteIR1 * gteIR1) >> shift;
528 gteMAC2 = (gteIR2 * gteIR2) >> shift;
529 gteMAC3 = (gteIR3 * gteIR3) >> shift;
7384197d 530 gteIR1 = limB1(gteMAC1, lm);
531 gteIR2 = limB2(gteMAC2, lm);
532 gteIR3 = limB3(gteMAC3, lm);
ef79bbde
P
533}
534
f74fb727 535void gteNCCS(psxCP2Regs *regs) {
ef79bbde
P
536#ifdef GTE_LOG
537 GTE_LOG("GTE NCCS\n");
538#endif
539 gteFLAG = 0;
540
b3254af9 541 gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12;
542 gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12;
543 gteMAC3 = ((s64)(gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12;
ef79bbde
P
544 gteIR1 = limB1(gteMAC1, 1);
545 gteIR2 = limB2(gteMAC2, 1);
546 gteIR3 = limB3(gteMAC3, 1);
547 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
548 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
549 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
550 gteIR1 = limB1(gteMAC1, 1);
551 gteIR2 = limB2(gteMAC2, 1);
552 gteIR3 = limB3(gteMAC3, 1);
b3254af9 553 gteMAC1 = ((s32)gteR * gteIR1) >> 8;
554 gteMAC2 = ((s32)gteG * gteIR2) >> 8;
555 gteMAC3 = ((s32)gteB * gteIR3) >> 8;
556 gteIR1 = gteMAC1;
557 gteIR2 = gteMAC2;
558 gteIR3 = gteMAC3;
ef79bbde
P
559
560 gteRGB0 = gteRGB1;
561 gteRGB1 = gteRGB2;
562 gteCODE2 = gteCODE;
563 gteR2 = limC1(gteMAC1 >> 4);
564 gteG2 = limC2(gteMAC2 >> 4);
565 gteB2 = limC3(gteMAC3 >> 4);
566}
567
f74fb727 568void gteNCCT(psxCP2Regs *regs) {
ef79bbde
P
569 int v;
570 s32 vx, vy, vz;
571
572#ifdef GTE_LOG
573 GTE_LOG("GTE NCCT\n");
574#endif
575 gteFLAG = 0;
576
577 for (v = 0; v < 3; v++) {
578 vx = VX(v);
579 vy = VY(v);
580 vz = VZ(v);
b3254af9 581 gteMAC1 = ((s64)(gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12;
582 gteMAC2 = ((s64)(gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12;
583 gteMAC3 = ((s64)(gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12;
ef79bbde
P
584 gteIR1 = limB1(gteMAC1, 1);
585 gteIR2 = limB2(gteMAC2, 1);
586 gteIR3 = limB3(gteMAC3, 1);
587 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
588 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
589 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
590 gteIR1 = limB1(gteMAC1, 1);
591 gteIR2 = limB2(gteMAC2, 1);
592 gteIR3 = limB3(gteMAC3, 1);
b3254af9 593 gteMAC1 = ((s32)gteR * gteIR1) >> 8;
594 gteMAC2 = ((s32)gteG * gteIR2) >> 8;
595 gteMAC3 = ((s32)gteB * gteIR3) >> 8;
ef79bbde
P
596
597 gteRGB0 = gteRGB1;
598 gteRGB1 = gteRGB2;
599 gteCODE2 = gteCODE;
600 gteR2 = limC1(gteMAC1 >> 4);
601 gteG2 = limC2(gteMAC2 >> 4);
602 gteB2 = limC3(gteMAC3 >> 4);
603 }
b3254af9 604 gteIR1 = gteMAC1;
605 gteIR2 = gteMAC2;
606 gteIR3 = gteMAC3;
ef79bbde
P
607}
608
f74fb727 609void gteNCDS(psxCP2Regs *regs) {
ef79bbde
P
610#ifdef GTE_LOG
611 GTE_LOG("GTE NCDS\n");
612#endif
613 gteFLAG = 0;
614
b3254af9 615 gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12;
616 gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12;
617 gteMAC3 = ((s64)(gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12;
ef79bbde
P
618 gteIR1 = limB1(gteMAC1, 1);
619 gteIR2 = limB2(gteMAC2, 1);
620 gteIR3 = limB3(gteMAC3, 1);
621 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
622 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
623 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
624 gteIR1 = limB1(gteMAC1, 1);
625 gteIR2 = limB2(gteMAC2, 1);
626 gteIR3 = limB3(gteMAC3, 1);
6c6c9590 627 gteMAC1 = (((gteR << 4) * gteIR1) + (gteIR0 * limB1(A1U((s64)gteRFC - ((gteR * gteIR1) >> 8)), 0))) >> 12;
628 gteMAC2 = (((gteG << 4) * gteIR2) + (gteIR0 * limB2(A2U((s64)gteGFC - ((gteG * gteIR2) >> 8)), 0))) >> 12;
629 gteMAC3 = (((gteB << 4) * gteIR3) + (gteIR0 * limB3(A3U((s64)gteBFC - ((gteB * gteIR3) >> 8)), 0))) >> 12;
ef79bbde
P
630 gteIR1 = limB1(gteMAC1, 1);
631 gteIR2 = limB2(gteMAC2, 1);
632 gteIR3 = limB3(gteMAC3, 1);
633
634 gteRGB0 = gteRGB1;
635 gteRGB1 = gteRGB2;
636 gteCODE2 = gteCODE;
637 gteR2 = limC1(gteMAC1 >> 4);
638 gteG2 = limC2(gteMAC2 >> 4);
639 gteB2 = limC3(gteMAC3 >> 4);
640}
641
f74fb727 642void gteNCDT(psxCP2Regs *regs) {
ef79bbde
P
643 int v;
644 s32 vx, vy, vz;
645
646#ifdef GTE_LOG
647 GTE_LOG("GTE NCDT\n");
648#endif
649 gteFLAG = 0;
650
651 for (v = 0; v < 3; v++) {
652 vx = VX(v);
653 vy = VY(v);
654 vz = VZ(v);
b3254af9 655 gteMAC1 = ((s64)(gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12;
656 gteMAC2 = ((s64)(gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12;
657 gteMAC3 = ((s64)(gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12;
ef79bbde
P
658 gteIR1 = limB1(gteMAC1, 1);
659 gteIR2 = limB2(gteMAC2, 1);
660 gteIR3 = limB3(gteMAC3, 1);
661 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
662 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
663 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
664 gteIR1 = limB1(gteMAC1, 1);
665 gteIR2 = limB2(gteMAC2, 1);
666 gteIR3 = limB3(gteMAC3, 1);
6c6c9590 667 gteMAC1 = (((gteR << 4) * gteIR1) + (gteIR0 * limB1(A1U((s64)gteRFC - ((gteR * gteIR1) >> 8)), 0))) >> 12;
668 gteMAC2 = (((gteG << 4) * gteIR2) + (gteIR0 * limB2(A2U((s64)gteGFC - ((gteG * gteIR2) >> 8)), 0))) >> 12;
669 gteMAC3 = (((gteB << 4) * gteIR3) + (gteIR0 * limB3(A3U((s64)gteBFC - ((gteB * gteIR3) >> 8)), 0))) >> 12;
ef79bbde
P
670
671 gteRGB0 = gteRGB1;
672 gteRGB1 = gteRGB2;
673 gteCODE2 = gteCODE;
674 gteR2 = limC1(gteMAC1 >> 4);
675 gteG2 = limC2(gteMAC2 >> 4);
676 gteB2 = limC3(gteMAC3 >> 4);
677 }
678 gteIR1 = limB1(gteMAC1, 1);
679 gteIR2 = limB2(gteMAC2, 1);
680 gteIR3 = limB3(gteMAC3, 1);
681}
682
f74fb727 683void gteOP(psxCP2Regs *regs) {
ef79bbde
P
684 int shift = 12 * GTE_SF(gteop);
685 int lm = GTE_LM(gteop);
686
687#ifdef GTE_LOG
688 GTE_LOG("GTE OP\n");
689#endif
690 gteFLAG = 0;
691
b3254af9 692 gteMAC1 = ((gteR22 * gteIR3) - (gteR33 * gteIR2)) >> shift;
693 gteMAC2 = ((gteR33 * gteIR1) - (gteR11 * gteIR3)) >> shift;
694 gteMAC3 = ((gteR11 * gteIR2) - (gteR22 * gteIR1)) >> shift;
ef79bbde
P
695 gteIR1 = limB1(gteMAC1, lm);
696 gteIR2 = limB2(gteMAC2, lm);
697 gteIR3 = limB3(gteMAC3, lm);
698}
699
f74fb727 700void gteDCPL(psxCP2Regs *regs) {
ef79bbde
P
701 int lm = GTE_LM(gteop);
702
b3254af9 703 s32 RIR1 = ((s32)gteR * gteIR1) >> 8;
704 s32 GIR2 = ((s32)gteG * gteIR2) >> 8;
705 s32 BIR3 = ((s32)gteB * gteIR3) >> 8;
ef79bbde
P
706
707#ifdef GTE_LOG
708 GTE_LOG("GTE DCPL\n");
709#endif
710 gteFLAG = 0;
711
6c6c9590 712 gteMAC1 = RIR1 + ((gteIR0 * limB1(A1U((s64)gteRFC - RIR1), 0)) >> 12);
713 gteMAC2 = GIR2 + ((gteIR0 * limB1(A2U((s64)gteGFC - GIR2), 0)) >> 12);
714 gteMAC3 = BIR3 + ((gteIR0 * limB1(A3U((s64)gteBFC - BIR3), 0)) >> 12);
ef79bbde
P
715
716 gteIR1 = limB1(gteMAC1, lm);
717 gteIR2 = limB2(gteMAC2, lm);
718 gteIR3 = limB3(gteMAC3, lm);
719
720 gteRGB0 = gteRGB1;
721 gteRGB1 = gteRGB2;
722 gteCODE2 = gteCODE;
723 gteR2 = limC1(gteMAC1 >> 4);
724 gteG2 = limC2(gteMAC2 >> 4);
725 gteB2 = limC3(gteMAC3 >> 4);
726}
727
f74fb727 728void gteGPF(psxCP2Regs *regs) {
ef79bbde
P
729 int shift = 12 * GTE_SF(gteop);
730
731#ifdef GTE_LOG
732 GTE_LOG("GTE GPF\n");
733#endif
734 gteFLAG = 0;
735
b3254af9 736 gteMAC1 = (gteIR0 * gteIR1) >> shift;
737 gteMAC2 = (gteIR0 * gteIR2) >> shift;
738 gteMAC3 = (gteIR0 * gteIR3) >> shift;
ef79bbde
P
739 gteIR1 = limB1(gteMAC1, 0);
740 gteIR2 = limB2(gteMAC2, 0);
741 gteIR3 = limB3(gteMAC3, 0);
742
743 gteRGB0 = gteRGB1;
744 gteRGB1 = gteRGB2;
745 gteCODE2 = gteCODE;
746 gteR2 = limC1(gteMAC1 >> 4);
747 gteG2 = limC2(gteMAC2 >> 4);
748 gteB2 = limC3(gteMAC3 >> 4);
749}
750
f74fb727 751void gteGPL(psxCP2Regs *regs) {
ef79bbde
P
752 int shift = 12 * GTE_SF(gteop);
753
754#ifdef GTE_LOG
755 GTE_LOG("GTE GPL\n");
756#endif
757 gteFLAG = 0;
758
759 gteMAC1 = A1((((s64)gteMAC1 << shift) + (gteIR0 * gteIR1)) >> shift);
760 gteMAC2 = A2((((s64)gteMAC2 << shift) + (gteIR0 * gteIR2)) >> shift);
761 gteMAC3 = A3((((s64)gteMAC3 << shift) + (gteIR0 * gteIR3)) >> shift);
762 gteIR1 = limB1(gteMAC1, 0);
763 gteIR2 = limB2(gteMAC2, 0);
764 gteIR3 = limB3(gteMAC3, 0);
765
766 gteRGB0 = gteRGB1;
767 gteRGB1 = gteRGB2;
768 gteCODE2 = gteCODE;
769 gteR2 = limC1(gteMAC1 >> 4);
770 gteG2 = limC2(gteMAC2 >> 4);
771 gteB2 = limC3(gteMAC3 >> 4);
772}
773
f74fb727 774void gteDPCS(psxCP2Regs *regs) {
ef79bbde
P
775 int shift = 12 * GTE_SF(gteop);
776
777#ifdef GTE_LOG
778 GTE_LOG("GTE DPCS\n");
779#endif
780 gteFLAG = 0;
781
6c6c9590 782 gteMAC1 = ((gteR << 16) + (gteIR0 * limB1(A1U(((s64)gteRFC - (gteR << 4)) << (12 - shift)), 0))) >> 12;
783 gteMAC2 = ((gteG << 16) + (gteIR0 * limB2(A2U(((s64)gteGFC - (gteG << 4)) << (12 - shift)), 0))) >> 12;
784 gteMAC3 = ((gteB << 16) + (gteIR0 * limB3(A3U(((s64)gteBFC - (gteB << 4)) << (12 - shift)), 0))) >> 12;
ef79bbde
P
785
786 gteIR1 = limB1(gteMAC1, 0);
787 gteIR2 = limB2(gteMAC2, 0);
788 gteIR3 = limB3(gteMAC3, 0);
789 gteRGB0 = gteRGB1;
790 gteRGB1 = gteRGB2;
791 gteCODE2 = gteCODE;
792 gteR2 = limC1(gteMAC1 >> 4);
793 gteG2 = limC2(gteMAC2 >> 4);
794 gteB2 = limC3(gteMAC3 >> 4);
795}
796
f74fb727 797void gteDPCT(psxCP2Regs *regs) {
ef79bbde
P
798 int v;
799
800#ifdef GTE_LOG
801 GTE_LOG("GTE DPCT\n");
802#endif
803 gteFLAG = 0;
804
805 for (v = 0; v < 3; v++) {
6c6c9590 806 gteMAC1 = ((gteR0 << 16) + (gteIR0 * limB1(A1U((s64)gteRFC - (gteR0 << 4)), 0))) >> 12;
807 gteMAC2 = ((gteG0 << 16) + (gteIR0 * limB1(A2U((s64)gteGFC - (gteG0 << 4)), 0))) >> 12;
808 gteMAC3 = ((gteB0 << 16) + (gteIR0 * limB1(A3U((s64)gteBFC - (gteB0 << 4)), 0))) >> 12;
ef79bbde
P
809
810 gteRGB0 = gteRGB1;
811 gteRGB1 = gteRGB2;
812 gteCODE2 = gteCODE;
813 gteR2 = limC1(gteMAC1 >> 4);
814 gteG2 = limC2(gteMAC2 >> 4);
815 gteB2 = limC3(gteMAC3 >> 4);
816 }
817 gteIR1 = limB1(gteMAC1, 0);
818 gteIR2 = limB2(gteMAC2, 0);
819 gteIR3 = limB3(gteMAC3, 0);
820}
821
f74fb727 822void gteNCS(psxCP2Regs *regs) {
ef79bbde
P
823#ifdef GTE_LOG
824 GTE_LOG("GTE NCS\n");
825#endif
826 gteFLAG = 0;
827
b3254af9 828 gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12;
829 gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12;
830 gteMAC3 = ((s64)(gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12;
ef79bbde
P
831 gteIR1 = limB1(gteMAC1, 1);
832 gteIR2 = limB2(gteMAC2, 1);
833 gteIR3 = limB3(gteMAC3, 1);
834 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
835 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
836 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
837 gteIR1 = limB1(gteMAC1, 1);
838 gteIR2 = limB2(gteMAC2, 1);
839 gteIR3 = limB3(gteMAC3, 1);
840
841 gteRGB0 = gteRGB1;
842 gteRGB1 = gteRGB2;
843 gteCODE2 = gteCODE;
844 gteR2 = limC1(gteMAC1 >> 4);
845 gteG2 = limC2(gteMAC2 >> 4);
846 gteB2 = limC3(gteMAC3 >> 4);
847}
848
f74fb727 849void gteNCT(psxCP2Regs *regs) {
ef79bbde
P
850 int v;
851 s32 vx, vy, vz;
852
853#ifdef GTE_LOG
854 GTE_LOG("GTE NCT\n");
855#endif
856 gteFLAG = 0;
857
858 for (v = 0; v < 3; v++) {
859 vx = VX(v);
860 vy = VY(v);
861 vz = VZ(v);
b3254af9 862 gteMAC1 = ((s64)(gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12;
863 gteMAC2 = ((s64)(gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12;
864 gteMAC3 = ((s64)(gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12;
ef79bbde
P
865 gteIR1 = limB1(gteMAC1, 1);
866 gteIR2 = limB2(gteMAC2, 1);
867 gteIR3 = limB3(gteMAC3, 1);
868 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
869 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
870 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
871 gteRGB0 = gteRGB1;
872 gteRGB1 = gteRGB2;
873 gteCODE2 = gteCODE;
874 gteR2 = limC1(gteMAC1 >> 4);
875 gteG2 = limC2(gteMAC2 >> 4);
876 gteB2 = limC3(gteMAC3 >> 4);
877 }
878 gteIR1 = limB1(gteMAC1, 1);
879 gteIR2 = limB2(gteMAC2, 1);
880 gteIR3 = limB3(gteMAC3, 1);
881}
882
f74fb727 883void gteCC(psxCP2Regs *regs) {
ef79bbde
P
884#ifdef GTE_LOG
885 GTE_LOG("GTE CC\n");
886#endif
887 gteFLAG = 0;
888
889 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
890 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
891 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
892 gteIR1 = limB1(gteMAC1, 1);
893 gteIR2 = limB2(gteMAC2, 1);
894 gteIR3 = limB3(gteMAC3, 1);
b3254af9 895 gteMAC1 = ((s32)gteR * gteIR1) >> 8;
896 gteMAC2 = ((s32)gteG * gteIR2) >> 8;
897 gteMAC3 = ((s32)gteB * gteIR3) >> 8;
ef79bbde
P
898 gteIR1 = limB1(gteMAC1, 1);
899 gteIR2 = limB2(gteMAC2, 1);
900 gteIR3 = limB3(gteMAC3, 1);
901
902 gteRGB0 = gteRGB1;
903 gteRGB1 = gteRGB2;
904 gteCODE2 = gteCODE;
905 gteR2 = limC1(gteMAC1 >> 4);
906 gteG2 = limC2(gteMAC2 >> 4);
907 gteB2 = limC3(gteMAC3 >> 4);
908}
909
f74fb727 910void gteINTPL(psxCP2Regs *regs) {
ef79bbde
P
911 int shift = 12 * GTE_SF(gteop);
912 int lm = GTE_LM(gteop);
913
914#ifdef GTE_LOG
915 GTE_LOG("GTE INTPL\n");
916#endif
917 gteFLAG = 0;
918
6c6c9590 919 gteMAC1 = ((gteIR1 << 12) + (gteIR0 * limB1(A1U((s64)gteRFC - gteIR1), 0))) >> shift;
920 gteMAC2 = ((gteIR2 << 12) + (gteIR0 * limB2(A2U((s64)gteGFC - gteIR2), 0))) >> shift;
921 gteMAC3 = ((gteIR3 << 12) + (gteIR0 * limB3(A3U((s64)gteBFC - gteIR3), 0))) >> shift;
ef79bbde
P
922 gteIR1 = limB1(gteMAC1, lm);
923 gteIR2 = limB2(gteMAC2, lm);
924 gteIR3 = limB3(gteMAC3, lm);
925 gteRGB0 = gteRGB1;
926 gteRGB1 = gteRGB2;
927 gteCODE2 = gteCODE;
928 gteR2 = limC1(gteMAC1 >> 4);
929 gteG2 = limC2(gteMAC2 >> 4);
930 gteB2 = limC3(gteMAC3 >> 4);
931}
932
f74fb727 933void gteCDP(psxCP2Regs *regs) {
ef79bbde
P
934#ifdef GTE_LOG
935 GTE_LOG("GTE CDP\n");
936#endif
937 gteFLAG = 0;
938
939 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
940 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
941 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
942 gteIR1 = limB1(gteMAC1, 1);
943 gteIR2 = limB2(gteMAC2, 1);
944 gteIR3 = limB3(gteMAC3, 1);
6c6c9590 945 gteMAC1 = (((gteR << 4) * gteIR1) + (gteIR0 * limB1(A1U((s64)gteRFC - ((gteR * gteIR1) >> 8)), 0))) >> 12;
946 gteMAC2 = (((gteG << 4) * gteIR2) + (gteIR0 * limB2(A2U((s64)gteGFC - ((gteG * gteIR2) >> 8)), 0))) >> 12;
947 gteMAC3 = (((gteB << 4) * gteIR3) + (gteIR0 * limB3(A3U((s64)gteBFC - ((gteB * gteIR3) >> 8)), 0))) >> 12;
ef79bbde
P
948 gteIR1 = limB1(gteMAC1, 1);
949 gteIR2 = limB2(gteMAC2, 1);
950 gteIR3 = limB3(gteMAC3, 1);
951
952 gteRGB0 = gteRGB1;
953 gteRGB1 = gteRGB2;
954 gteCODE2 = gteCODE;
955 gteR2 = limC1(gteMAC1 >> 4);
956 gteG2 = limC2(gteMAC2 >> 4);
957 gteB2 = limC3(gteMAC3 >> 4);
958}
6c0eefaf 959
960/* decomposed/parametrized versions for the recompiler */
961
962#ifndef FLAGLESS
963
964void gteSQR_part_noshift(psxCP2Regs *regs) {
965 gteFLAG = 0;
966
967 gteMAC1 = gteIR1 * gteIR1;
968 gteMAC2 = gteIR2 * gteIR2;
969 gteMAC3 = gteIR3 * gteIR3;
970}
971
972void gteSQR_part_shift(psxCP2Regs *regs) {
973 gteFLAG = 0;
974
975 gteMAC1 = (gteIR1 * gteIR1) >> 12;
976 gteMAC2 = (gteIR2 * gteIR2) >> 12;
977 gteMAC3 = (gteIR3 * gteIR3) >> 12;
978}
979
980void gteOP_part_noshift(psxCP2Regs *regs) {
981 gteFLAG = 0;
982
983 gteMAC1 = (gteR22 * gteIR3) - (gteR33 * gteIR2);
984 gteMAC2 = (gteR33 * gteIR1) - (gteR11 * gteIR3);
985 gteMAC3 = (gteR11 * gteIR2) - (gteR22 * gteIR1);
986}
987
988void gteOP_part_shift(psxCP2Regs *regs) {
989 gteFLAG = 0;
990
991 gteMAC1 = ((gteR22 * gteIR3) - (gteR33 * gteIR2)) >> 12;
992 gteMAC2 = ((gteR33 * gteIR1) - (gteR11 * gteIR3)) >> 12;
993 gteMAC3 = ((gteR11 * gteIR2) - (gteR22 * gteIR1)) >> 12;
994}
995
996void gteDCPL_part(psxCP2Regs *regs) {
997 s32 RIR1 = ((s32)gteR * gteIR1) >> 8;
998 s32 GIR2 = ((s32)gteG * gteIR2) >> 8;
999 s32 BIR3 = ((s32)gteB * gteIR3) >> 8;
1000
1001 gteFLAG = 0;
1002
1003 gteMAC1 = RIR1 + ((gteIR0 * limB1(A1U((s64)gteRFC - RIR1), 0)) >> 12);
1004 gteMAC2 = GIR2 + ((gteIR0 * limB1(A2U((s64)gteGFC - GIR2), 0)) >> 12);
1005 gteMAC3 = BIR3 + ((gteIR0 * limB1(A3U((s64)gteBFC - BIR3), 0)) >> 12);
1006}
1007
1008void gteGPF_part_noshift(psxCP2Regs *regs) {
1009 gteFLAG = 0;
1010
1011 gteMAC1 = gteIR0 * gteIR1;
1012 gteMAC2 = gteIR0 * gteIR2;
1013 gteMAC3 = gteIR0 * gteIR3;
1014}
1015
1016void gteGPF_part_shift(psxCP2Regs *regs) {
1017 gteFLAG = 0;
1018
1019 gteMAC1 = (gteIR0 * gteIR1) >> 12;
1020 gteMAC2 = (gteIR0 * gteIR2) >> 12;
1021 gteMAC3 = (gteIR0 * gteIR3) >> 12;
1022}
1023
1024#endif // !FLAGLESS
1025
1026void gteGPL_part_noshift(psxCP2Regs *regs) {
1027 gteFLAG = 0;
1028
1029 gteMAC1 = A1((s64)gteMAC1 + (gteIR0 * gteIR1));
1030 gteMAC2 = A2((s64)gteMAC2 + (gteIR0 * gteIR2));
1031 gteMAC3 = A3((s64)gteMAC3 + (gteIR0 * gteIR3));
1032}
1033
1034void gteGPL_part_shift(psxCP2Regs *regs) {
1035 gteFLAG = 0;
1036
1037 gteMAC1 = A1((s64)gteMAC1 + ((gteIR0 * gteIR1) >> 12));
1038 gteMAC2 = A2((s64)gteMAC2 + ((gteIR0 * gteIR2) >> 12));
1039 gteMAC3 = A3((s64)gteMAC3 + ((gteIR0 * gteIR3) >> 12));
1040}
1041
1042void gteDPCS_part_noshift(psxCP2Regs *regs) {
1043 int shift = 0;
1044
1045 gteFLAG = 0;
1046
1047 gteMAC1 = ((gteR << 16) + (gteIR0 * limB1(A1U((s64)gteRFC - (gteR << 4)) << (12 - shift), 0))) >> 12;
1048 gteMAC2 = ((gteG << 16) + (gteIR0 * limB2(A2U((s64)gteGFC - (gteG << 4)) << (12 - shift), 0))) >> 12;
1049 gteMAC3 = ((gteB << 16) + (gteIR0 * limB3(A3U((s64)gteBFC - (gteB << 4)) << (12 - shift), 0))) >> 12;
1050}
1051
1052void gteDPCS_part_shift(psxCP2Regs *regs) {
1053 int shift = 12;
1054
1055 gteFLAG = 0;
1056
1057 gteMAC1 = ((gteR << 16) + (gteIR0 * limB1(A1U((s64)gteRFC - (gteR << 4)) << (12 - shift), 0))) >> 12;
1058 gteMAC2 = ((gteG << 16) + (gteIR0 * limB2(A2U((s64)gteGFC - (gteG << 4)) << (12 - shift), 0))) >> 12;
1059 gteMAC3 = ((gteB << 16) + (gteIR0 * limB3(A3U((s64)gteBFC - (gteB << 4)) << (12 - shift), 0))) >> 12;
1060}
1061
1062void gteINTPL_part_noshift(psxCP2Regs *regs) {
1063 gteFLAG = 0;
1064
1065 gteMAC1 = ((gteIR1 << 12) + (gteIR0 * limB1(A1U((s64)gteRFC - gteIR1), 0)));
1066 gteMAC2 = ((gteIR2 << 12) + (gteIR0 * limB2(A2U((s64)gteGFC - gteIR2), 0)));
1067 gteMAC3 = ((gteIR3 << 12) + (gteIR0 * limB3(A3U((s64)gteBFC - gteIR3), 0)));
1068}
1069
1070void gteINTPL_part_shift(psxCP2Regs *regs) {
1071 gteFLAG = 0;
1072
1073 gteMAC1 = ((gteIR1 << 12) + (gteIR0 * limB1(A1U((s64)gteRFC - gteIR1), 0))) >> 12;
1074 gteMAC2 = ((gteIR2 << 12) + (gteIR0 * limB2(A2U((s64)gteGFC - gteIR2), 0))) >> 12;
1075 gteMAC3 = ((gteIR3 << 12) + (gteIR0 * limB3(A3U((s64)gteBFC - gteIR3), 0))) >> 12;
1076}
1077
1078void gteMACtoRGB(psxCP2Regs *regs) {
1079 gteRGB0 = gteRGB1;
1080 gteRGB1 = gteRGB2;
1081 gteCODE2 = gteCODE;
1082 gteR2 = limC1(gteMAC1 >> 4);
1083 gteG2 = limC2(gteMAC2 >> 4);
1084 gteB2 = limC3(gteMAC3 >> 4);
1085}
1086