X-Git-Url: https://notaz.gp2x.de/cgi-bin/gitweb.cgi?p=pcsx_rearmed.git;a=blobdiff_plain;f=libpcsxcore%2Fgte.c;h=77dff1b114c275828102ba32be0b7f252b117e74;hp=38e630875b36e83816fb2b783b850c421c0971f2;hb=9d3801c90db3dee73a7a30d898857ad1a5821e59;hpb=6c6c9590d093e80f0afe444d3be04df5ff8fbfda diff --git a/libpcsxcore/gte.c b/libpcsxcore/gte.c index 38e63087..77dff1b1 100644 --- a/libpcsxcore/gte.c +++ b/libpcsxcore/gte.c @@ -170,7 +170,7 @@ #ifndef FLAGLESS -static inline s32 BOUNDS_(psxCP2Regs *regs, s64 n_value, s64 n_max, int n_maxflag, s64 n_min, int n_minflag) { +static inline s64 BOUNDS_(psxCP2Regs *regs, s64 n_value, s64 n_max, int n_maxflag, s64 n_min, int n_minflag) { if (n_value > n_max) { gteFLAG |= n_maxflag; } else if (n_value < n_min) { @@ -259,7 +259,7 @@ static inline u32 limE_(psxCP2Regs *regs, u32 result) { #ifndef FLAGLESS static inline u32 MFC2(int reg) { - psxCP2Regs *regs = (psxCP2Regs *)&psxRegs.CP2D; + psxCP2Regs *regs = &psxRegs.CP2; switch (reg) { case 1: case 3: @@ -294,7 +294,7 @@ static inline u32 MFC2(int reg) { } static inline void MTC2(u32 value, int reg) { - psxCP2Regs *regs = (psxCP2Regs *)&psxRegs.CP2D; + psxCP2Regs *regs = &psxRegs.CP2; switch (reg) { case 15: gteSXY0 = gteSXY1; @@ -404,6 +404,7 @@ static u32 DIVIDE_(s16 n, u16 d) { void gteRTPS(psxCP2Regs *regs) { int quotient; + s64 tmp; #ifdef GTE_LOG GTE_LOG("GTE RTPS\n"); @@ -426,14 +427,16 @@ void gteRTPS(psxCP2Regs *regs) { gteSX2 = limG1(F((s64)gteOFX + ((s64)gteIR1 * quotient)) >> 16); gteSY2 = limG2(F((s64)gteOFY + ((s64)gteIR2 * quotient)) >> 16); - gteMAC0 = F((s64)gteDQB + ((s64)gteDQA * quotient)); - gteIR0 = limH(gteMAC0 >> 12); + tmp = (s64)gteDQB + ((s64)gteDQA * quotient); + gteMAC0 = F(tmp); + gteIR0 = limH(tmp >> 12); } void gteRTPT(psxCP2Regs *regs) { int quotient; int v; s32 vx, vy, vz; + s64 tmp; #ifdef GTE_LOG GTE_LOG("GTE RTPT\n"); @@ -456,8 +459,10 @@ void gteRTPT(psxCP2Regs *regs) { fSX(v) = limG1(F((s64)gteOFX + ((s64)gteIR1 * quotient)) >> 16); fSY(v) = limG2(F((s64)gteOFY + ((s64)gteIR2 * quotient)) >> 16); } - gteMAC0 = F((s64)gteDQB + ((s64)gteDQA * quotient)); - gteIR0 = limH(gteMAC0 >> 12); + + tmp = (s64)gteDQB + ((s64)gteDQA * quotient); + gteMAC0 = F(tmp); + gteIR0 = limH(tmp >> 12); } void gteMVMVA(psxCP2Regs *regs) { @@ -956,3 +961,131 @@ void gteCDP(psxCP2Regs *regs) { gteG2 = limC2(gteMAC2 >> 4); gteB2 = limC3(gteMAC3 >> 4); } + +/* decomposed/parametrized versions for the recompiler */ + +#ifndef FLAGLESS + +void gteSQR_part_noshift(psxCP2Regs *regs) { + gteFLAG = 0; + + gteMAC1 = gteIR1 * gteIR1; + gteMAC2 = gteIR2 * gteIR2; + gteMAC3 = gteIR3 * gteIR3; +} + +void gteSQR_part_shift(psxCP2Regs *regs) { + gteFLAG = 0; + + gteMAC1 = (gteIR1 * gteIR1) >> 12; + gteMAC2 = (gteIR2 * gteIR2) >> 12; + gteMAC3 = (gteIR3 * gteIR3) >> 12; +} + +void gteOP_part_noshift(psxCP2Regs *regs) { + gteFLAG = 0; + + gteMAC1 = (gteR22 * gteIR3) - (gteR33 * gteIR2); + gteMAC2 = (gteR33 * gteIR1) - (gteR11 * gteIR3); + gteMAC3 = (gteR11 * gteIR2) - (gteR22 * gteIR1); +} + +void gteOP_part_shift(psxCP2Regs *regs) { + gteFLAG = 0; + + gteMAC1 = ((gteR22 * gteIR3) - (gteR33 * gteIR2)) >> 12; + gteMAC2 = ((gteR33 * gteIR1) - (gteR11 * gteIR3)) >> 12; + gteMAC3 = ((gteR11 * gteIR2) - (gteR22 * gteIR1)) >> 12; +} + +void gteDCPL_part(psxCP2Regs *regs) { + s32 RIR1 = ((s32)gteR * gteIR1) >> 8; + s32 GIR2 = ((s32)gteG * gteIR2) >> 8; + s32 BIR3 = ((s32)gteB * gteIR3) >> 8; + + gteFLAG = 0; + + gteMAC1 = RIR1 + ((gteIR0 * limB1(A1U((s64)gteRFC - RIR1), 0)) >> 12); + gteMAC2 = GIR2 + ((gteIR0 * limB1(A2U((s64)gteGFC - GIR2), 0)) >> 12); + gteMAC3 = BIR3 + ((gteIR0 * limB1(A3U((s64)gteBFC - BIR3), 0)) >> 12); +} + +void gteGPF_part_noshift(psxCP2Regs *regs) { + gteFLAG = 0; + + gteMAC1 = gteIR0 * gteIR1; + gteMAC2 = gteIR0 * gteIR2; + gteMAC3 = gteIR0 * gteIR3; +} + +void gteGPF_part_shift(psxCP2Regs *regs) { + gteFLAG = 0; + + gteMAC1 = (gteIR0 * gteIR1) >> 12; + gteMAC2 = (gteIR0 * gteIR2) >> 12; + gteMAC3 = (gteIR0 * gteIR3) >> 12; +} + +#endif // !FLAGLESS + +void gteGPL_part_noshift(psxCP2Regs *regs) { + gteFLAG = 0; + + gteMAC1 = A1((s64)gteMAC1 + (gteIR0 * gteIR1)); + gteMAC2 = A2((s64)gteMAC2 + (gteIR0 * gteIR2)); + gteMAC3 = A3((s64)gteMAC3 + (gteIR0 * gteIR3)); +} + +void gteGPL_part_shift(psxCP2Regs *regs) { + gteFLAG = 0; + + gteMAC1 = A1((s64)gteMAC1 + ((gteIR0 * gteIR1) >> 12)); + gteMAC2 = A2((s64)gteMAC2 + ((gteIR0 * gteIR2) >> 12)); + gteMAC3 = A3((s64)gteMAC3 + ((gteIR0 * gteIR3) >> 12)); +} + +void gteDPCS_part_noshift(psxCP2Regs *regs) { + int shift = 0; + + gteFLAG = 0; + + gteMAC1 = ((gteR << 16) + (gteIR0 * limB1(A1U((s64)gteRFC - (gteR << 4)) << (12 - shift), 0))) >> 12; + gteMAC2 = ((gteG << 16) + (gteIR0 * limB2(A2U((s64)gteGFC - (gteG << 4)) << (12 - shift), 0))) >> 12; + gteMAC3 = ((gteB << 16) + (gteIR0 * limB3(A3U((s64)gteBFC - (gteB << 4)) << (12 - shift), 0))) >> 12; +} + +void gteDPCS_part_shift(psxCP2Regs *regs) { + int shift = 12; + + gteFLAG = 0; + + gteMAC1 = ((gteR << 16) + (gteIR0 * limB1(A1U((s64)gteRFC - (gteR << 4)) << (12 - shift), 0))) >> 12; + gteMAC2 = ((gteG << 16) + (gteIR0 * limB2(A2U((s64)gteGFC - (gteG << 4)) << (12 - shift), 0))) >> 12; + gteMAC3 = ((gteB << 16) + (gteIR0 * limB3(A3U((s64)gteBFC - (gteB << 4)) << (12 - shift), 0))) >> 12; +} + +void gteINTPL_part_noshift(psxCP2Regs *regs) { + gteFLAG = 0; + + gteMAC1 = ((gteIR1 << 12) + (gteIR0 * limB1(A1U((s64)gteRFC - gteIR1), 0))); + gteMAC2 = ((gteIR2 << 12) + (gteIR0 * limB2(A2U((s64)gteGFC - gteIR2), 0))); + gteMAC3 = ((gteIR3 << 12) + (gteIR0 * limB3(A3U((s64)gteBFC - gteIR3), 0))); +} + +void gteINTPL_part_shift(psxCP2Regs *regs) { + gteFLAG = 0; + + gteMAC1 = ((gteIR1 << 12) + (gteIR0 * limB1(A1U((s64)gteRFC - gteIR1), 0))) >> 12; + gteMAC2 = ((gteIR2 << 12) + (gteIR0 * limB2(A2U((s64)gteGFC - gteIR2), 0))) >> 12; + gteMAC3 = ((gteIR3 << 12) + (gteIR0 * limB3(A3U((s64)gteBFC - gteIR3), 0))) >> 12; +} + +void gteMACtoRGB(psxCP2Regs *regs) { + gteRGB0 = gteRGB1; + gteRGB1 = gteRGB2; + gteCODE2 = gteCODE; + gteR2 = limC1(gteMAC1 >> 4); + gteG2 = limC2(gteMAC2 >> 4); + gteB2 = limC3(gteMAC3 >> 4); +} +