drc: implement literal dupe merging
[pcsx_rearmed.git] / libpcsxcore / gte.c
CommitLineData
ef79bbde
P
1/***************************************************************************
2 * PCSX-Revolution - PlayStation Emulator for Nintendo Wii *
3 * Copyright (C) 2009-2010 PCSX-Revolution Dev Team *
4 * <http://code.google.com/p/pcsx-revolution/> *
5 * *
6 * This program is free software; you can redistribute it and/or modify *
7 * it under the terms of the GNU General Public License as published by *
8 * the Free Software Foundation; either version 2 of the License, or *
9 * (at your option) any later version. *
10 * *
11 * This program is distributed in the hope that it will be useful, *
12 * but WITHOUT ANY WARRANTY; without even the implied warranty of *
13 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the *
14 * GNU General Public License for more details. *
15 * *
16 * You should have received a copy of the GNU General Public License *
17 * along with this program; if not, write to the *
18 * Free Software Foundation, Inc., *
19 * 51 Franklin Street, Fifth Floor, Boston, MA 02111-1307 USA. *
20 ***************************************************************************/
21
22/*
23* GTE functions.
24*/
25
26#include "gte.h"
27#include "psxmem.h"
28
29#define VX(n) (n < 3 ? psxRegs.CP2D.p[n << 1].sw.l : psxRegs.CP2D.p[9].sw.l)
30#define VY(n) (n < 3 ? psxRegs.CP2D.p[n << 1].sw.h : psxRegs.CP2D.p[10].sw.l)
31#define VZ(n) (n < 3 ? psxRegs.CP2D.p[(n << 1) + 1].sw.l : psxRegs.CP2D.p[11].sw.l)
32#define MX11(n) (n < 3 ? psxRegs.CP2C.p[(n << 3)].sw.l : 0)
33#define MX12(n) (n < 3 ? psxRegs.CP2C.p[(n << 3)].sw.h : 0)
34#define MX13(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 1].sw.l : 0)
35#define MX21(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 1].sw.h : 0)
36#define MX22(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 2].sw.l : 0)
37#define MX23(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 2].sw.h : 0)
38#define MX31(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 3].sw.l : 0)
39#define MX32(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 3].sw.h : 0)
40#define MX33(n) (n < 3 ? psxRegs.CP2C.p[(n << 3) + 4].sw.l : 0)
41#define CV1(n) (n < 3 ? (s32)psxRegs.CP2C.r[(n << 3) + 5] : 0)
42#define CV2(n) (n < 3 ? (s32)psxRegs.CP2C.r[(n << 3) + 6] : 0)
43#define CV3(n) (n < 3 ? (s32)psxRegs.CP2C.r[(n << 3) + 7] : 0)
44
45#define fSX(n) ((psxRegs.CP2D.p)[((n) + 12)].sw.l)
46#define fSY(n) ((psxRegs.CP2D.p)[((n) + 12)].sw.h)
47#define fSZ(n) ((psxRegs.CP2D.p)[((n) + 17)].w.l) /* (n == 0) => SZ1; */
48
49#define gteVXY0 (psxRegs.CP2D.r[0])
50#define gteVX0 (psxRegs.CP2D.p[0].sw.l)
51#define gteVY0 (psxRegs.CP2D.p[0].sw.h)
52#define gteVZ0 (psxRegs.CP2D.p[1].sw.l)
53#define gteVXY1 (psxRegs.CP2D.r[2])
54#define gteVX1 (psxRegs.CP2D.p[2].sw.l)
55#define gteVY1 (psxRegs.CP2D.p[2].sw.h)
56#define gteVZ1 (psxRegs.CP2D.p[3].sw.l)
57#define gteVXY2 (psxRegs.CP2D.r[4])
58#define gteVX2 (psxRegs.CP2D.p[4].sw.l)
59#define gteVY2 (psxRegs.CP2D.p[4].sw.h)
60#define gteVZ2 (psxRegs.CP2D.p[5].sw.l)
61#define gteRGB (psxRegs.CP2D.r[6])
62#define gteR (psxRegs.CP2D.p[6].b.l)
63#define gteG (psxRegs.CP2D.p[6].b.h)
64#define gteB (psxRegs.CP2D.p[6].b.h2)
65#define gteCODE (psxRegs.CP2D.p[6].b.h3)
66#define gteOTZ (psxRegs.CP2D.p[7].w.l)
67#define gteIR0 (psxRegs.CP2D.p[8].sw.l)
68#define gteIR1 (psxRegs.CP2D.p[9].sw.l)
69#define gteIR2 (psxRegs.CP2D.p[10].sw.l)
70#define gteIR3 (psxRegs.CP2D.p[11].sw.l)
71#define gteSXY0 (psxRegs.CP2D.r[12])
72#define gteSX0 (psxRegs.CP2D.p[12].sw.l)
73#define gteSY0 (psxRegs.CP2D.p[12].sw.h)
74#define gteSXY1 (psxRegs.CP2D.r[13])
75#define gteSX1 (psxRegs.CP2D.p[13].sw.l)
76#define gteSY1 (psxRegs.CP2D.p[13].sw.h)
77#define gteSXY2 (psxRegs.CP2D.r[14])
78#define gteSX2 (psxRegs.CP2D.p[14].sw.l)
79#define gteSY2 (psxRegs.CP2D.p[14].sw.h)
80#define gteSXYP (psxRegs.CP2D.r[15])
81#define gteSXP (psxRegs.CP2D.p[15].sw.l)
82#define gteSYP (psxRegs.CP2D.p[15].sw.h)
83#define gteSZ0 (psxRegs.CP2D.p[16].w.l)
84#define gteSZ1 (psxRegs.CP2D.p[17].w.l)
85#define gteSZ2 (psxRegs.CP2D.p[18].w.l)
86#define gteSZ3 (psxRegs.CP2D.p[19].w.l)
87#define gteRGB0 (psxRegs.CP2D.r[20])
88#define gteR0 (psxRegs.CP2D.p[20].b.l)
89#define gteG0 (psxRegs.CP2D.p[20].b.h)
90#define gteB0 (psxRegs.CP2D.p[20].b.h2)
91#define gteCODE0 (psxRegs.CP2D.p[20].b.h3)
92#define gteRGB1 (psxRegs.CP2D.r[21])
93#define gteR1 (psxRegs.CP2D.p[21].b.l)
94#define gteG1 (psxRegs.CP2D.p[21].b.h)
95#define gteB1 (psxRegs.CP2D.p[21].b.h2)
96#define gteCODE1 (psxRegs.CP2D.p[21].b.h3)
97#define gteRGB2 (psxRegs.CP2D.r[22])
98#define gteR2 (psxRegs.CP2D.p[22].b.l)
99#define gteG2 (psxRegs.CP2D.p[22].b.h)
100#define gteB2 (psxRegs.CP2D.p[22].b.h2)
101#define gteCODE2 (psxRegs.CP2D.p[22].b.h3)
102#define gteRES1 (psxRegs.CP2D.r[23])
103#define gteMAC0 (((s32 *)psxRegs.CP2D.r)[24])
104#define gteMAC1 (((s32 *)psxRegs.CP2D.r)[25])
105#define gteMAC2 (((s32 *)psxRegs.CP2D.r)[26])
106#define gteMAC3 (((s32 *)psxRegs.CP2D.r)[27])
107#define gteIRGB (psxRegs.CP2D.r[28])
108#define gteORGB (psxRegs.CP2D.r[29])
109#define gteLZCS (psxRegs.CP2D.r[30])
110#define gteLZCR (psxRegs.CP2D.r[31])
111
112#define gteR11R12 (((s32 *)psxRegs.CP2C.r)[0])
113#define gteR22R23 (((s32 *)psxRegs.CP2C.r)[2])
114#define gteR11 (psxRegs.CP2C.p[0].sw.l)
115#define gteR12 (psxRegs.CP2C.p[0].sw.h)
116#define gteR13 (psxRegs.CP2C.p[1].sw.l)
117#define gteR21 (psxRegs.CP2C.p[1].sw.h)
118#define gteR22 (psxRegs.CP2C.p[2].sw.l)
119#define gteR23 (psxRegs.CP2C.p[2].sw.h)
120#define gteR31 (psxRegs.CP2C.p[3].sw.l)
121#define gteR32 (psxRegs.CP2C.p[3].sw.h)
122#define gteR33 (psxRegs.CP2C.p[4].sw.l)
123#define gteTRX (((s32 *)psxRegs.CP2C.r)[5])
124#define gteTRY (((s32 *)psxRegs.CP2C.r)[6])
125#define gteTRZ (((s32 *)psxRegs.CP2C.r)[7])
126#define gteL11 (psxRegs.CP2C.p[8].sw.l)
127#define gteL12 (psxRegs.CP2C.p[8].sw.h)
128#define gteL13 (psxRegs.CP2C.p[9].sw.l)
129#define gteL21 (psxRegs.CP2C.p[9].sw.h)
130#define gteL22 (psxRegs.CP2C.p[10].sw.l)
131#define gteL23 (psxRegs.CP2C.p[10].sw.h)
132#define gteL31 (psxRegs.CP2C.p[11].sw.l)
133#define gteL32 (psxRegs.CP2C.p[11].sw.h)
134#define gteL33 (psxRegs.CP2C.p[12].sw.l)
135#define gteRBK (((s32 *)psxRegs.CP2C.r)[13])
136#define gteGBK (((s32 *)psxRegs.CP2C.r)[14])
137#define gteBBK (((s32 *)psxRegs.CP2C.r)[15])
138#define gteLR1 (psxRegs.CP2C.p[16].sw.l)
139#define gteLR2 (psxRegs.CP2C.p[16].sw.h)
140#define gteLR3 (psxRegs.CP2C.p[17].sw.l)
141#define gteLG1 (psxRegs.CP2C.p[17].sw.h)
142#define gteLG2 (psxRegs.CP2C.p[18].sw.l)
143#define gteLG3 (psxRegs.CP2C.p[18].sw.h)
144#define gteLB1 (psxRegs.CP2C.p[19].sw.l)
145#define gteLB2 (psxRegs.CP2C.p[19].sw.h)
146#define gteLB3 (psxRegs.CP2C.p[20].sw.l)
147#define gteRFC (((s32 *)psxRegs.CP2C.r)[21])
148#define gteGFC (((s32 *)psxRegs.CP2C.r)[22])
149#define gteBFC (((s32 *)psxRegs.CP2C.r)[23])
150#define gteOFX (((s32 *)psxRegs.CP2C.r)[24])
151#define gteOFY (((s32 *)psxRegs.CP2C.r)[25])
152#define gteH (psxRegs.CP2C.p[26].sw.l)
153#define gteDQA (psxRegs.CP2C.p[27].sw.l)
154#define gteDQB (((s32 *)psxRegs.CP2C.r)[28])
155#define gteZSF3 (psxRegs.CP2C.p[29].sw.l)
156#define gteZSF4 (psxRegs.CP2C.p[30].sw.l)
157#define gteFLAG (psxRegs.CP2C.r[31])
158
159#define GTE_OP(op) ((op >> 20) & 31)
160#define GTE_SF(op) ((op >> 19) & 1)
161#define GTE_MX(op) ((op >> 17) & 3)
162#define GTE_V(op) ((op >> 15) & 3)
163#define GTE_CV(op) ((op >> 13) & 3)
164#define GTE_CD(op) ((op >> 11) & 3) /* not used */
165#define GTE_LM(op) ((op >> 10) & 1)
166#define GTE_CT(op) ((op >> 6) & 15) /* not used */
167#define GTE_FUNCT(op) (op & 63)
168
169#define gteop (psxRegs.code & 0x1ffffff)
170
59774ed0 171#ifndef FLAGLESS
172
ef79bbde
P
173static inline s64 BOUNDS(s64 n_value, s64 n_max, int n_maxflag, s64 n_min, int n_minflag) {
174 if (n_value > n_max) {
175 gteFLAG |= n_maxflag;
176 } else if (n_value < n_min) {
177 gteFLAG |= n_minflag;
178 }
179 return n_value;
180}
181
182static inline s32 LIM(s32 value, s32 max, s32 min, u32 flag) {
183 s32 ret = value;
184 if (value > max) {
185 gteFLAG |= flag;
186 ret = max;
187 } else if (value < min) {
188 gteFLAG |= flag;
189 ret = min;
190 }
191 return ret;
192}
193
59774ed0 194static inline u32 limE(u32 result) {
195 if (result > 0x1ffff) {
196 gteFLAG |= (1 << 31) | (1 << 17);
197 return 0x1ffff;
198 }
199 return result;
200}
201
202#else
203
204#define BOUNDS(a, ...) (a)
205
206static inline s32 LIM(s32 value, s32 max, s32 min, u32 flag_unused) {
207 s32 ret = value;
208 if (value > max)
209 ret = max;
210 else if (value < min)
211 ret = min;
212 return ret;
213}
214
bedfea38 215static inline u32 limE(u32 result) {
216 if (result > 0x1ffff)
217 return 0x1ffff;
218 return result;
219}
59774ed0 220
221#endif
222
ef79bbde
P
223#define A1(a) BOUNDS((a), 0x7fffffff, (1 << 30), -(s64)0x80000000, (1 << 31) | (1 << 27))
224#define A2(a) BOUNDS((a), 0x7fffffff, (1 << 29), -(s64)0x80000000, (1 << 31) | (1 << 26))
225#define A3(a) BOUNDS((a), 0x7fffffff, (1 << 28), -(s64)0x80000000, (1 << 31) | (1 << 25))
226#define limB1(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 31) | (1 << 24))
227#define limB2(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 31) | (1 << 23))
228#define limB3(a, l) LIM((a), 0x7fff, -0x8000 * !l, (1 << 22))
229#define limC1(a) LIM((a), 0x00ff, 0x0000, (1 << 21))
230#define limC2(a) LIM((a), 0x00ff, 0x0000, (1 << 20))
231#define limC3(a) LIM((a), 0x00ff, 0x0000, (1 << 19))
232#define limD(a) LIM((a), 0xffff, 0x0000, (1 << 31) | (1 << 18))
233
ef79bbde
P
234#define F(a) BOUNDS((a), 0x7fffffff, (1 << 31) | (1 << 16), -(s64)0x80000000, (1 << 31) | (1 << 15))
235#define limG1(a) LIM((a), 0x3ff, -0x400, (1 << 31) | (1 << 14))
236#define limG2(a) LIM((a), 0x3ff, -0x400, (1 << 31) | (1 << 13))
7384197d 237#define limH(a) LIM((a), 0x1000, 0x0000, (1 << 12))
ef79bbde
P
238
239#include "gte_divider.h"
240
59774ed0 241#ifndef FLAGLESS
242
ef79bbde
P
243static inline u32 MFC2(int reg) {
244 switch (reg) {
245 case 1:
246 case 3:
247 case 5:
248 case 8:
249 case 9:
250 case 10:
251 case 11:
252 psxRegs.CP2D.r[reg] = (s32)psxRegs.CP2D.p[reg].sw.l;
253 break;
254
255 case 7:
256 case 16:
257 case 17:
258 case 18:
259 case 19:
260 psxRegs.CP2D.r[reg] = (u32)psxRegs.CP2D.p[reg].w.l;
261 break;
262
263 case 15:
264 psxRegs.CP2D.r[reg] = gteSXY2;
265 break;
266
267 case 28:
ef79bbde
P
268 case 29:
269 psxRegs.CP2D.r[reg] = LIM(gteIR1 >> 7, 0x1f, 0, 0) |
270 (LIM(gteIR2 >> 7, 0x1f, 0, 0) << 5) |
271 (LIM(gteIR3 >> 7, 0x1f, 0, 0) << 10);
272 break;
273 }
274 return psxRegs.CP2D.r[reg];
275}
276
277static inline void MTC2(u32 value, int reg) {
278 switch (reg) {
279 case 15:
280 gteSXY0 = gteSXY1;
281 gteSXY1 = gteSXY2;
282 gteSXY2 = value;
283 gteSXYP = value;
284 break;
285
286 case 28:
287 gteIRGB = value;
288 gteIR1 = (value & 0x1f) << 7;
289 gteIR2 = (value & 0x3e0) << 2;
290 gteIR3 = (value & 0x7c00) >> 3;
291 break;
292
293 case 30:
294 {
295 int a;
296 gteLZCS = value;
297
298 a = gteLZCS;
299 if (a > 0) {
300 int i;
301 for (i = 31; (a & (1 << i)) == 0 && i >= 0; i--);
302 gteLZCR = 31 - i;
303 } else if (a < 0) {
304 int i;
305 a ^= 0xffffffff;
306 for (i = 31; (a & (1 << i)) == 0 && i >= 0; i--);
307 gteLZCR = 31 - i;
308 } else {
309 gteLZCR = 32;
310 }
311 }
312 break;
313
ef79bbde
P
314 case 31:
315 return;
316
317 default:
318 psxRegs.CP2D.r[reg] = value;
319 }
320}
321
322static inline void CTC2(u32 value, int reg) {
323 switch (reg) {
324 case 4:
325 case 12:
326 case 20:
327 case 26:
328 case 27:
329 case 29:
330 case 30:
331 value = (s32)(s16)value;
332 break;
333
334 case 31:
335 value = value & 0x7ffff000;
336 if (value & 0x7f87e000) value |= 0x80000000;
337 break;
338 }
339
340 psxRegs.CP2C.r[reg] = value;
341}
342
343void gteMFC2() {
344 if (!_Rt_) return;
345 psxRegs.GPR.r[_Rt_] = MFC2(_Rd_);
346}
347
348void gteCFC2() {
349 if (!_Rt_) return;
350 psxRegs.GPR.r[_Rt_] = psxRegs.CP2C.r[_Rd_];
351}
352
353void gteMTC2() {
354 MTC2(psxRegs.GPR.r[_Rt_], _Rd_);
355}
356
357void gteCTC2() {
358 CTC2(psxRegs.GPR.r[_Rt_], _Rd_);
359}
360
361#define _oB_ (psxRegs.GPR.r[_Rs_] + _Imm_)
362
363void gteLWC2() {
364 MTC2(psxMemRead32(_oB_), _Rt_);
365}
366
367void gteSWC2() {
368 psxMemWrite32(_oB_, MFC2(_Rt_));
369}
370
59774ed0 371#endif // FLAGLESS
372
3ebefe71 373#if 0
a2544c92 374#define DIVIDE DIVIDE_
375static u32 DIVIDE_(s16 n, u16 d) {
376 if (n >= 0 && n < d * 2) {
377 s32 n_ = n;
378 return ((n_ << 16) + d / 2) / d;
379 //return (u32)((float)(n_ << 16) / (float)d + (float)0.5);
380 }
381 return 0xffffffff;
382}
3ebefe71 383#endif
a2544c92 384
ef79bbde
P
385void gteRTPS() {
386 int quotient;
387
388#ifdef GTE_LOG
389 GTE_LOG("GTE RTPS\n");
390#endif
391 gteFLAG = 0;
392
393 gteMAC1 = A1((((s64)gteTRX << 12) + (gteR11 * gteVX0) + (gteR12 * gteVY0) + (gteR13 * gteVZ0)) >> 12);
394 gteMAC2 = A2((((s64)gteTRY << 12) + (gteR21 * gteVX0) + (gteR22 * gteVY0) + (gteR23 * gteVZ0)) >> 12);
395 gteMAC3 = A3((((s64)gteTRZ << 12) + (gteR31 * gteVX0) + (gteR32 * gteVY0) + (gteR33 * gteVZ0)) >> 12);
396 gteIR1 = limB1(gteMAC1, 0);
397 gteIR2 = limB2(gteMAC2, 0);
398 gteIR3 = limB3(gteMAC3, 0);
399 gteSZ0 = gteSZ1;
400 gteSZ1 = gteSZ2;
401 gteSZ2 = gteSZ3;
402 gteSZ3 = limD(gteMAC3);
403 quotient = limE(DIVIDE(gteH, gteSZ3));
404 gteSXY0 = gteSXY1;
405 gteSXY1 = gteSXY2;
406 gteSX2 = limG1(F((s64)gteOFX + ((s64)gteIR1 * quotient)) >> 16);
407 gteSY2 = limG2(F((s64)gteOFY + ((s64)gteIR2 * quotient)) >> 16);
408
631e6f28 409 gteMAC0 = F((s64)gteDQB + ((s64)gteDQA * quotient));
410 gteIR0 = limH(gteMAC0 >> 12);
ef79bbde
P
411}
412
413void gteRTPT() {
414 int quotient;
415 int v;
416 s32 vx, vy, vz;
417
418#ifdef GTE_LOG
419 GTE_LOG("GTE RTPT\n");
420#endif
421 gteFLAG = 0;
422
423 gteSZ0 = gteSZ3;
424 for (v = 0; v < 3; v++) {
425 vx = VX(v);
426 vy = VY(v);
427 vz = VZ(v);
428 gteMAC1 = A1((((s64)gteTRX << 12) + (gteR11 * vx) + (gteR12 * vy) + (gteR13 * vz)) >> 12);
429 gteMAC2 = A2((((s64)gteTRY << 12) + (gteR21 * vx) + (gteR22 * vy) + (gteR23 * vz)) >> 12);
430 gteMAC3 = A3((((s64)gteTRZ << 12) + (gteR31 * vx) + (gteR32 * vy) + (gteR33 * vz)) >> 12);
431 gteIR1 = limB1(gteMAC1, 0);
432 gteIR2 = limB2(gteMAC2, 0);
433 gteIR3 = limB3(gteMAC3, 0);
434 fSZ(v) = limD(gteMAC3);
435 quotient = limE(DIVIDE(gteH, fSZ(v)));
436 fSX(v) = limG1(F((s64)gteOFX + ((s64)gteIR1 * quotient)) >> 16);
437 fSY(v) = limG2(F((s64)gteOFY + ((s64)gteIR2 * quotient)) >> 16);
438 }
631e6f28 439 gteMAC0 = F((s64)gteDQB + ((s64)gteDQA * quotient));
440 gteIR0 = limH(gteMAC0 >> 12);
ef79bbde
P
441}
442
443void gteMVMVA() {
444 int shift = 12 * GTE_SF(gteop);
445 int mx = GTE_MX(gteop);
446 int v = GTE_V(gteop);
447 int cv = GTE_CV(gteop);
448 int lm = GTE_LM(gteop);
449 s32 vx = VX(v);
450 s32 vy = VY(v);
451 s32 vz = VZ(v);
452
453#ifdef GTE_LOG
454 GTE_LOG("GTE MVMVA\n");
455#endif
456 gteFLAG = 0;
457
458 gteMAC1 = A1((((s64)CV1(cv) << 12) + (MX11(mx) * vx) + (MX12(mx) * vy) + (MX13(mx) * vz)) >> shift);
459 gteMAC2 = A2((((s64)CV2(cv) << 12) + (MX21(mx) * vx) + (MX22(mx) * vy) + (MX23(mx) * vz)) >> shift);
460 gteMAC3 = A3((((s64)CV3(cv) << 12) + (MX31(mx) * vx) + (MX32(mx) * vy) + (MX33(mx) * vz)) >> shift);
461
462 gteIR1 = limB1(gteMAC1, lm);
463 gteIR2 = limB2(gteMAC2, lm);
464 gteIR3 = limB3(gteMAC3, lm);
465}
466
467void gteNCLIP() {
468#ifdef GTE_LOG
469 GTE_LOG("GTE NCLIP\n");
470#endif
471 gteFLAG = 0;
472
473 gteMAC0 = F((s64)gteSX0 * (gteSY1 - gteSY2) +
474 gteSX1 * (gteSY2 - gteSY0) +
475 gteSX2 * (gteSY0 - gteSY1));
476}
477
478void gteAVSZ3() {
479#ifdef GTE_LOG
480 GTE_LOG("GTE AVSZ3\n");
481#endif
482 gteFLAG = 0;
483
484 gteMAC0 = F((s64)(gteZSF3 * gteSZ1) + (gteZSF3 * gteSZ2) + (gteZSF3 * gteSZ3));
485 gteOTZ = limD(gteMAC0 >> 12);
486}
487
488void gteAVSZ4() {
489#ifdef GTE_LOG
490 GTE_LOG("GTE AVSZ4\n");
491#endif
492 gteFLAG = 0;
493
494 gteMAC0 = F((s64)(gteZSF4 * (gteSZ0 + gteSZ1 + gteSZ2 + gteSZ3)));
495 gteOTZ = limD(gteMAC0 >> 12);
496}
497
498void gteSQR() {
499 int shift = 12 * GTE_SF(gteop);
500 int lm = GTE_LM(gteop);
501
502#ifdef GTE_LOG
503 GTE_LOG("GTE SQR\n");
504#endif
505 gteFLAG = 0;
506
507 gteMAC1 = A1((gteIR1 * gteIR1) >> shift);
508 gteMAC2 = A2((gteIR2 * gteIR2) >> shift);
509 gteMAC3 = A3((gteIR3 * gteIR3) >> shift);
7384197d 510 gteIR1 = limB1(gteMAC1, lm);
511 gteIR2 = limB2(gteMAC2, lm);
512 gteIR3 = limB3(gteMAC3, lm);
ef79bbde
P
513}
514
515void gteNCCS() {
516#ifdef GTE_LOG
517 GTE_LOG("GTE NCCS\n");
518#endif
519 gteFLAG = 0;
520
521 gteMAC1 = A1((((s64)gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12);
522 gteMAC2 = A2((((s64)gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12);
523 gteMAC3 = A3((((s64)gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12);
524 gteIR1 = limB1(gteMAC1, 1);
525 gteIR2 = limB2(gteMAC2, 1);
526 gteIR3 = limB3(gteMAC3, 1);
527 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
528 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
529 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
530 gteIR1 = limB1(gteMAC1, 1);
531 gteIR2 = limB2(gteMAC2, 1);
532 gteIR3 = limB3(gteMAC3, 1);
533 gteMAC1 = A1(((s64)gteR * gteIR1) >> 8);
534 gteMAC2 = A2(((s64)gteG * gteIR2) >> 8);
535 gteMAC3 = A3(((s64)gteB * gteIR3) >> 8);
536 gteIR1 = limB1(gteMAC1, 1);
537 gteIR2 = limB2(gteMAC2, 1);
538 gteIR3 = limB3(gteMAC3, 1);
539
540 gteRGB0 = gteRGB1;
541 gteRGB1 = gteRGB2;
542 gteCODE2 = gteCODE;
543 gteR2 = limC1(gteMAC1 >> 4);
544 gteG2 = limC2(gteMAC2 >> 4);
545 gteB2 = limC3(gteMAC3 >> 4);
546}
547
548void gteNCCT() {
549 int v;
550 s32 vx, vy, vz;
551
552#ifdef GTE_LOG
553 GTE_LOG("GTE NCCT\n");
554#endif
555 gteFLAG = 0;
556
557 for (v = 0; v < 3; v++) {
558 vx = VX(v);
559 vy = VY(v);
560 vz = VZ(v);
561 gteMAC1 = A1((((s64)gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12);
562 gteMAC2 = A2((((s64)gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12);
563 gteMAC3 = A3((((s64)gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12);
564 gteIR1 = limB1(gteMAC1, 1);
565 gteIR2 = limB2(gteMAC2, 1);
566 gteIR3 = limB3(gteMAC3, 1);
567 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
568 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
569 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
570 gteIR1 = limB1(gteMAC1, 1);
571 gteIR2 = limB2(gteMAC2, 1);
572 gteIR3 = limB3(gteMAC3, 1);
573 gteMAC1 = A1(((s64)gteR * gteIR1) >> 8);
574 gteMAC2 = A2(((s64)gteG * gteIR2) >> 8);
575 gteMAC3 = A3(((s64)gteB * gteIR3) >> 8);
576
577 gteRGB0 = gteRGB1;
578 gteRGB1 = gteRGB2;
579 gteCODE2 = gteCODE;
580 gteR2 = limC1(gteMAC1 >> 4);
581 gteG2 = limC2(gteMAC2 >> 4);
582 gteB2 = limC3(gteMAC3 >> 4);
583 }
584 gteIR1 = limB1(gteMAC1, 1);
585 gteIR2 = limB2(gteMAC2, 1);
586 gteIR3 = limB3(gteMAC3, 1);
587}
588
589void gteNCDS() {
590#ifdef GTE_LOG
591 GTE_LOG("GTE NCDS\n");
592#endif
593 gteFLAG = 0;
594
595 gteMAC1 = A1((((s64)gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12);
596 gteMAC2 = A2((((s64)gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12);
597 gteMAC3 = A3((((s64)gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12);
598 gteIR1 = limB1(gteMAC1, 1);
599 gteIR2 = limB2(gteMAC2, 1);
600 gteIR3 = limB3(gteMAC3, 1);
601 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
602 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
603 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
604 gteIR1 = limB1(gteMAC1, 1);
605 gteIR2 = limB2(gteMAC2, 1);
606 gteIR3 = limB3(gteMAC3, 1);
607 gteMAC1 = A1(((((s64)gteR << 4) * gteIR1) + (gteIR0 * limB1(gteRFC - ((gteR * gteIR1) >> 8), 0))) >> 12);
608 gteMAC2 = A2(((((s64)gteG << 4) * gteIR2) + (gteIR0 * limB2(gteGFC - ((gteG * gteIR2) >> 8), 0))) >> 12);
609 gteMAC3 = A3(((((s64)gteB << 4) * gteIR3) + (gteIR0 * limB3(gteBFC - ((gteB * gteIR3) >> 8), 0))) >> 12);
610 gteIR1 = limB1(gteMAC1, 1);
611 gteIR2 = limB2(gteMAC2, 1);
612 gteIR3 = limB3(gteMAC3, 1);
613
614 gteRGB0 = gteRGB1;
615 gteRGB1 = gteRGB2;
616 gteCODE2 = gteCODE;
617 gteR2 = limC1(gteMAC1 >> 4);
618 gteG2 = limC2(gteMAC2 >> 4);
619 gteB2 = limC3(gteMAC3 >> 4);
620}
621
622void gteNCDT() {
623 int v;
624 s32 vx, vy, vz;
625
626#ifdef GTE_LOG
627 GTE_LOG("GTE NCDT\n");
628#endif
629 gteFLAG = 0;
630
631 for (v = 0; v < 3; v++) {
632 vx = VX(v);
633 vy = VY(v);
634 vz = VZ(v);
635 gteMAC1 = A1((((s64)gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12);
636 gteMAC2 = A2((((s64)gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12);
637 gteMAC3 = A3((((s64)gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12);
638 gteIR1 = limB1(gteMAC1, 1);
639 gteIR2 = limB2(gteMAC2, 1);
640 gteIR3 = limB3(gteMAC3, 1);
641 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
642 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
643 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
644 gteIR1 = limB1(gteMAC1, 1);
645 gteIR2 = limB2(gteMAC2, 1);
646 gteIR3 = limB3(gteMAC3, 1);
647 gteMAC1 = A1(((((s64)gteR << 4) * gteIR1) + (gteIR0 * limB1(gteRFC - ((gteR * gteIR1) >> 8), 0))) >> 12);
648 gteMAC2 = A2(((((s64)gteG << 4) * gteIR2) + (gteIR0 * limB2(gteGFC - ((gteG * gteIR2) >> 8), 0))) >> 12);
649 gteMAC3 = A3(((((s64)gteB << 4) * gteIR3) + (gteIR0 * limB3(gteBFC - ((gteB * gteIR3) >> 8), 0))) >> 12);
650
651 gteRGB0 = gteRGB1;
652 gteRGB1 = gteRGB2;
653 gteCODE2 = gteCODE;
654 gteR2 = limC1(gteMAC1 >> 4);
655 gteG2 = limC2(gteMAC2 >> 4);
656 gteB2 = limC3(gteMAC3 >> 4);
657 }
658 gteIR1 = limB1(gteMAC1, 1);
659 gteIR2 = limB2(gteMAC2, 1);
660 gteIR3 = limB3(gteMAC3, 1);
661}
662
663void gteOP() {
664 int shift = 12 * GTE_SF(gteop);
665 int lm = GTE_LM(gteop);
666
667#ifdef GTE_LOG
668 GTE_LOG("GTE OP\n");
669#endif
670 gteFLAG = 0;
671
672 gteMAC1 = A1(((s64)(gteR22 * gteIR3) - (gteR33 * gteIR2)) >> shift);
673 gteMAC2 = A2(((s64)(gteR33 * gteIR1) - (gteR11 * gteIR3)) >> shift);
674 gteMAC3 = A3(((s64)(gteR11 * gteIR2) - (gteR22 * gteIR1)) >> shift);
675 gteIR1 = limB1(gteMAC1, lm);
676 gteIR2 = limB2(gteMAC2, lm);
677 gteIR3 = limB3(gteMAC3, lm);
678}
679
680void gteDCPL() {
681 int lm = GTE_LM(gteop);
682
683 s64 RIR1 = ((s64)gteR * gteIR1) >> 8;
684 s64 GIR2 = ((s64)gteG * gteIR2) >> 8;
685 s64 BIR3 = ((s64)gteB * gteIR3) >> 8;
686
687#ifdef GTE_LOG
688 GTE_LOG("GTE DCPL\n");
689#endif
690 gteFLAG = 0;
691
692 gteMAC1 = A1(RIR1 + ((gteIR0 * limB1(gteRFC - RIR1, 0)) >> 12));
693 gteMAC2 = A2(GIR2 + ((gteIR0 * limB1(gteGFC - GIR2, 0)) >> 12));
694 gteMAC3 = A3(BIR3 + ((gteIR0 * limB1(gteBFC - BIR3, 0)) >> 12));
695
696 gteIR1 = limB1(gteMAC1, lm);
697 gteIR2 = limB2(gteMAC2, lm);
698 gteIR3 = limB3(gteMAC3, lm);
699
700 gteRGB0 = gteRGB1;
701 gteRGB1 = gteRGB2;
702 gteCODE2 = gteCODE;
703 gteR2 = limC1(gteMAC1 >> 4);
704 gteG2 = limC2(gteMAC2 >> 4);
705 gteB2 = limC3(gteMAC3 >> 4);
706}
707
708void gteGPF() {
709 int shift = 12 * GTE_SF(gteop);
710
711#ifdef GTE_LOG
712 GTE_LOG("GTE GPF\n");
713#endif
714 gteFLAG = 0;
715
716 gteMAC1 = A1(((s64)gteIR0 * gteIR1) >> shift);
717 gteMAC2 = A2(((s64)gteIR0 * gteIR2) >> shift);
718 gteMAC3 = A3(((s64)gteIR0 * gteIR3) >> shift);
719 gteIR1 = limB1(gteMAC1, 0);
720 gteIR2 = limB2(gteMAC2, 0);
721 gteIR3 = limB3(gteMAC3, 0);
722
723 gteRGB0 = gteRGB1;
724 gteRGB1 = gteRGB2;
725 gteCODE2 = gteCODE;
726 gteR2 = limC1(gteMAC1 >> 4);
727 gteG2 = limC2(gteMAC2 >> 4);
728 gteB2 = limC3(gteMAC3 >> 4);
729}
730
731void gteGPL() {
732 int shift = 12 * GTE_SF(gteop);
733
734#ifdef GTE_LOG
735 GTE_LOG("GTE GPL\n");
736#endif
737 gteFLAG = 0;
738
739 gteMAC1 = A1((((s64)gteMAC1 << shift) + (gteIR0 * gteIR1)) >> shift);
740 gteMAC2 = A2((((s64)gteMAC2 << shift) + (gteIR0 * gteIR2)) >> shift);
741 gteMAC3 = A3((((s64)gteMAC3 << shift) + (gteIR0 * gteIR3)) >> shift);
742 gteIR1 = limB1(gteMAC1, 0);
743 gteIR2 = limB2(gteMAC2, 0);
744 gteIR3 = limB3(gteMAC3, 0);
745
746 gteRGB0 = gteRGB1;
747 gteRGB1 = gteRGB2;
748 gteCODE2 = gteCODE;
749 gteR2 = limC1(gteMAC1 >> 4);
750 gteG2 = limC2(gteMAC2 >> 4);
751 gteB2 = limC3(gteMAC3 >> 4);
752}
753
754void gteDPCS() {
755 int shift = 12 * GTE_SF(gteop);
756
757#ifdef GTE_LOG
758 GTE_LOG("GTE DPCS\n");
759#endif
760 gteFLAG = 0;
761
762 gteMAC1 = A1(((gteR << 16) + (gteIR0 * limB1(A1((s64)gteRFC - (gteR << 4)) << (12 - shift), 0))) >> 12);
763 gteMAC2 = A2(((gteG << 16) + (gteIR0 * limB2(A2((s64)gteGFC - (gteG << 4)) << (12 - shift), 0))) >> 12);
764 gteMAC3 = A3(((gteB << 16) + (gteIR0 * limB3(A3((s64)gteBFC - (gteB << 4)) << (12 - shift), 0))) >> 12);
765
766 gteIR1 = limB1(gteMAC1, 0);
767 gteIR2 = limB2(gteMAC2, 0);
768 gteIR3 = limB3(gteMAC3, 0);
769 gteRGB0 = gteRGB1;
770 gteRGB1 = gteRGB2;
771 gteCODE2 = gteCODE;
772 gteR2 = limC1(gteMAC1 >> 4);
773 gteG2 = limC2(gteMAC2 >> 4);
774 gteB2 = limC3(gteMAC3 >> 4);
775}
776
777void gteDPCT() {
778 int v;
779
780#ifdef GTE_LOG
781 GTE_LOG("GTE DPCT\n");
782#endif
783 gteFLAG = 0;
784
785 for (v = 0; v < 3; v++) {
786 gteMAC1 = A1((((s64)gteR0 << 16) + ((s64)gteIR0 * (limB1(gteRFC - (gteR0 << 4), 0)))) >> 12);
787 gteMAC2 = A2((((s64)gteG0 << 16) + ((s64)gteIR0 * (limB1(gteGFC - (gteG0 << 4), 0)))) >> 12);
788 gteMAC3 = A3((((s64)gteB0 << 16) + ((s64)gteIR0 * (limB1(gteBFC - (gteB0 << 4), 0)))) >> 12);
789
790 gteRGB0 = gteRGB1;
791 gteRGB1 = gteRGB2;
792 gteCODE2 = gteCODE;
793 gteR2 = limC1(gteMAC1 >> 4);
794 gteG2 = limC2(gteMAC2 >> 4);
795 gteB2 = limC3(gteMAC3 >> 4);
796 }
797 gteIR1 = limB1(gteMAC1, 0);
798 gteIR2 = limB2(gteMAC2, 0);
799 gteIR3 = limB3(gteMAC3, 0);
800}
801
802void gteNCS() {
803#ifdef GTE_LOG
804 GTE_LOG("GTE NCS\n");
805#endif
806 gteFLAG = 0;
807
808 gteMAC1 = A1((((s64)gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12);
809 gteMAC2 = A2((((s64)gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12);
810 gteMAC3 = A3((((s64)gteL31 * gteVX0) + (gteL32 * gteVY0) + (gteL33 * gteVZ0)) >> 12);
811 gteIR1 = limB1(gteMAC1, 1);
812 gteIR2 = limB2(gteMAC2, 1);
813 gteIR3 = limB3(gteMAC3, 1);
814 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
815 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
816 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
817 gteIR1 = limB1(gteMAC1, 1);
818 gteIR2 = limB2(gteMAC2, 1);
819 gteIR3 = limB3(gteMAC3, 1);
820
821 gteRGB0 = gteRGB1;
822 gteRGB1 = gteRGB2;
823 gteCODE2 = gteCODE;
824 gteR2 = limC1(gteMAC1 >> 4);
825 gteG2 = limC2(gteMAC2 >> 4);
826 gteB2 = limC3(gteMAC3 >> 4);
827}
828
829void gteNCT() {
830 int v;
831 s32 vx, vy, vz;
832
833#ifdef GTE_LOG
834 GTE_LOG("GTE NCT\n");
835#endif
836 gteFLAG = 0;
837
838 for (v = 0; v < 3; v++) {
839 vx = VX(v);
840 vy = VY(v);
841 vz = VZ(v);
842 gteMAC1 = A1((((s64)gteL11 * vx) + (gteL12 * vy) + (gteL13 * vz)) >> 12);
843 gteMAC2 = A2((((s64)gteL21 * vx) + (gteL22 * vy) + (gteL23 * vz)) >> 12);
844 gteMAC3 = A3((((s64)gteL31 * vx) + (gteL32 * vy) + (gteL33 * vz)) >> 12);
845 gteIR1 = limB1(gteMAC1, 1);
846 gteIR2 = limB2(gteMAC2, 1);
847 gteIR3 = limB3(gteMAC3, 1);
848 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
849 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
850 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
851 gteRGB0 = gteRGB1;
852 gteRGB1 = gteRGB2;
853 gteCODE2 = gteCODE;
854 gteR2 = limC1(gteMAC1 >> 4);
855 gteG2 = limC2(gteMAC2 >> 4);
856 gteB2 = limC3(gteMAC3 >> 4);
857 }
858 gteIR1 = limB1(gteMAC1, 1);
859 gteIR2 = limB2(gteMAC2, 1);
860 gteIR3 = limB3(gteMAC3, 1);
861}
862
863void gteCC() {
864#ifdef GTE_LOG
865 GTE_LOG("GTE CC\n");
866#endif
867 gteFLAG = 0;
868
869 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
870 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
871 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
872 gteIR1 = limB1(gteMAC1, 1);
873 gteIR2 = limB2(gteMAC2, 1);
874 gteIR3 = limB3(gteMAC3, 1);
875 gteMAC1 = A1(((s64)gteR * gteIR1) >> 8);
876 gteMAC2 = A2(((s64)gteG * gteIR2) >> 8);
877 gteMAC3 = A3(((s64)gteB * gteIR3) >> 8);
878 gteIR1 = limB1(gteMAC1, 1);
879 gteIR2 = limB2(gteMAC2, 1);
880 gteIR3 = limB3(gteMAC3, 1);
881
882 gteRGB0 = gteRGB1;
883 gteRGB1 = gteRGB2;
884 gteCODE2 = gteCODE;
885 gteR2 = limC1(gteMAC1 >> 4);
886 gteG2 = limC2(gteMAC2 >> 4);
887 gteB2 = limC3(gteMAC3 >> 4);
888}
889
890void gteINTPL() {
891 int shift = 12 * GTE_SF(gteop);
892 int lm = GTE_LM(gteop);
893
894#ifdef GTE_LOG
895 GTE_LOG("GTE INTPL\n");
896#endif
897 gteFLAG = 0;
898
899 gteMAC1 = A1(((gteIR1 << 12) + (gteIR0 * limB1(((s64)gteRFC - gteIR1), 0))) >> shift);
900 gteMAC2 = A2(((gteIR2 << 12) + (gteIR0 * limB2(((s64)gteGFC - gteIR2), 0))) >> shift);
901 gteMAC3 = A3(((gteIR3 << 12) + (gteIR0 * limB3(((s64)gteBFC - gteIR3), 0))) >> shift);
902 gteIR1 = limB1(gteMAC1, lm);
903 gteIR2 = limB2(gteMAC2, lm);
904 gteIR3 = limB3(gteMAC3, lm);
905 gteRGB0 = gteRGB1;
906 gteRGB1 = gteRGB2;
907 gteCODE2 = gteCODE;
908 gteR2 = limC1(gteMAC1 >> 4);
909 gteG2 = limC2(gteMAC2 >> 4);
910 gteB2 = limC3(gteMAC3 >> 4);
911}
912
913void gteCDP() {
914#ifdef GTE_LOG
915 GTE_LOG("GTE CDP\n");
916#endif
917 gteFLAG = 0;
918
919 gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
920 gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
921 gteMAC3 = A3((((s64)gteBBK << 12) + (gteLB1 * gteIR1) + (gteLB2 * gteIR2) + (gteLB3 * gteIR3)) >> 12);
922 gteIR1 = limB1(gteMAC1, 1);
923 gteIR2 = limB2(gteMAC2, 1);
924 gteIR3 = limB3(gteMAC3, 1);
925 gteMAC1 = A1(((((s64)gteR << 4) * gteIR1) + (gteIR0 * limB1(gteRFC - ((gteR * gteIR1) >> 8), 0))) >> 12);
926 gteMAC2 = A2(((((s64)gteG << 4) * gteIR2) + (gteIR0 * limB2(gteGFC - ((gteG * gteIR2) >> 8), 0))) >> 12);
927 gteMAC3 = A3(((((s64)gteB << 4) * gteIR3) + (gteIR0 * limB3(gteBFC - ((gteB * gteIR3) >> 8), 0))) >> 12);
928 gteIR1 = limB1(gteMAC1, 1);
929 gteIR2 = limB2(gteMAC2, 1);
930 gteIR3 = limB3(gteMAC3, 1);
931
932 gteRGB0 = gteRGB1;
933 gteRGB1 = gteRGB2;
934 gteCODE2 = gteCODE;
935 gteR2 = limC1(gteMAC1 >> 4);
936 gteG2 = limC2(gteMAC2 >> 4);
937 gteB2 = limC3(gteMAC3 >> 4);
938}