X-Git-Url: https://notaz.gp2x.de/cgi-bin/gitweb.cgi?a=blobdiff_plain;f=libpcsxcore%2Fgte.c;h=991a4452c5b20c74c434d35d2887b339bbf44a91;hb=7cbd2996964abf782dd4bdfe9b582fd7c8af36b2;hp=239d2e5a14f95f369366df0f6607a3694c77fa47;hpb=f343e0e38670b902a2747a944cc366e9434e89fc;p=pcsx_rearmed.git diff --git a/libpcsxcore/gte.c b/libpcsxcore/gte.c index 239d2e5a..991a4452 100644 --- a/libpcsxcore/gte.c +++ b/libpcsxcore/gte.c @@ -260,6 +260,7 @@ static inline u32 limE_(psxCP2Regs *regs, u32 result) { #define A3U(x) (x) #endif + //senquack - n param should be unsigned (will be 'gteH' reg which is u16) #ifdef GTE_USE_NATIVE_DIVIDE INLINE u32 DIVIDE(u16 n, u16 d) { @@ -274,8 +275,33 @@ INLINE u32 DIVIDE(u16 n, u16 d) { #ifndef FLAGLESS -u32 MFC2(int reg) { - psxCP2Regs *regs = &psxRegs.CP2; +const unsigned char gte_cycletab[64] = { + /* 1 2 3 4 5 6 7 8 9 a b c d e f */ + 0, 15, 0, 0, 0, 0, 8, 0, 0, 0, 0, 0, 6, 0, 0, 0, + 8, 8, 8, 19, 13, 0, 44, 0, 0, 0, 0, 17, 11, 0, 14, 0, + 30, 0, 0, 0, 0, 0, 0, 0, 5, 8, 17, 0, 0, 5, 6, 0, + 23, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 5, 5, 39, +}; + +// warning: called by the dynarec +int gteCheckStallRaw(u32 op_cycles, psxRegisters *regs) { + u32 left = regs->gteBusyCycle - regs->cycle; + int stall = 0; + + if (left <= 44) { + //printf("c %2u stall %2u %u\n", op_cycles, left, regs->cycle); + regs->cycle = regs->gteBusyCycle; + stall = left; + } + regs->gteBusyCycle = regs->cycle + op_cycles; + return stall; +} + +void gteCheckStall(u32 op) { + gteCheckStallRaw(gte_cycletab[op], &psxRegs); +} + +u32 MFC2(struct psxCP2Regs *regs, int reg) { switch (reg) { case 1: case 3: @@ -284,7 +310,7 @@ u32 MFC2(int reg) { case 9: case 10: case 11: - psxRegs.CP2D.r[reg] = (s32)psxRegs.CP2D.p[reg].sw.l; + regs->CP2D.r[reg] = (s32)regs->CP2D.p[reg].sw.l; break; case 7: @@ -292,25 +318,24 @@ u32 MFC2(int reg) { case 17: case 18: case 19: - psxRegs.CP2D.r[reg] = (u32)psxRegs.CP2D.p[reg].w.l; + regs->CP2D.r[reg] = (u32)regs->CP2D.p[reg].w.l; break; case 15: - psxRegs.CP2D.r[reg] = gteSXY2; + regs->CP2D.r[reg] = gteSXY2; break; case 28: case 29: - psxRegs.CP2D.r[reg] = LIM(gteIR1 >> 7, 0x1f, 0, 0) | + regs->CP2D.r[reg] = LIM(gteIR1 >> 7, 0x1f, 0, 0) | (LIM(gteIR2 >> 7, 0x1f, 0, 0) << 5) | (LIM(gteIR3 >> 7, 0x1f, 0, 0) << 10); break; } - return psxRegs.CP2D.r[reg]; + return regs->CP2D.r[reg]; } -void MTC2(u32 value, int reg) { - psxCP2Regs *regs = &psxRegs.CP2; +void MTC2(struct psxCP2Regs *regs, u32 value, int reg) { switch (reg) { case 15: gteSXY0 = gteSXY1; @@ -321,9 +346,10 @@ void MTC2(u32 value, int reg) { case 28: gteIRGB = value; - gteIR1 = (value & 0x1f) << 7; - gteIR2 = (value & 0x3e0) << 2; - gteIR3 = (value & 0x7c00) >> 3; + // not gteIR1 etc. just to be consistent with dynarec + regs->CP2D.n.ir1 = (value & 0x1f) << 7; + regs->CP2D.n.ir2 = (value & 0x3e0) << 2; + regs->CP2D.n.ir3 = (value & 0x7c00) >> 3; break; case 30: @@ -351,11 +377,11 @@ void MTC2(u32 value, int reg) { return; default: - psxRegs.CP2D.r[reg] = value; + regs->CP2D.r[reg] = value; } } -void CTC2(u32 value, int reg) { +void CTC2(struct psxCP2Regs *regs, u32 value, int reg) { switch (reg) { case 4: case 12: @@ -373,38 +399,7 @@ void CTC2(u32 value, int reg) { break; } - psxRegs.CP2C.r[reg] = value; -} - -void gteMFC2() { - psxRegs.cycle += 1; - if (!_Rt_) return; - psxRegs.GPR.r[_Rt_] = MFC2(_Rd_); -} - -void gteCFC2() { - psxRegs.cycle += 1; - if (!_Rt_) return; - psxRegs.GPR.r[_Rt_] = psxRegs.CP2C.r[_Rd_]; -} - -void gteMTC2() { - MTC2(psxRegs.GPR.r[_Rt_], _Rd_); -} - -void gteCTC2() { - CTC2(psxRegs.GPR.r[_Rt_], _Rd_); -} - -#define _oB_ (psxRegs.GPR.r[_Rs_] + _Imm_) - -void gteLWC2() { - MTC2(psxMemRead32(_oB_), _Rt_); -} - -void gteSWC2() { - //psxRegs.cycle += 1; - psxMemWrite32(_oB_, MFC2(_Rt_)); + regs->CP2C.r[reg] = value; } #endif // FLAGLESS @@ -428,7 +423,6 @@ void gteRTPS(psxCP2Regs *regs) { #ifdef GTE_LOG GTE_LOG("GTE RTPS\n"); #endif - psxRegs.cycle += 15; gteFLAG = 0; gteMAC1 = A1((((s64)gteTRX << 12) + (gteR11 * gteVX0) + (gteR12 * gteVY0) + (gteR13 * gteVZ0)) >> 12); @@ -461,7 +455,6 @@ void gteRTPT(psxCP2Regs *regs) { #ifdef GTE_LOG GTE_LOG("GTE RTPT\n"); #endif - psxRegs.cycle += 23; gteFLAG = 0; gteSZ0 = gteSZ3; @@ -500,7 +493,6 @@ void gteMVMVA(psxCP2Regs *regs) { GTE_LOG("GTE MVMVA\n"); #endif gteFLAG = 0; - psxRegs.cycle += 8; gteMAC1 = A1((((s64)CV1(cv) << 12) + (MX11(mx) * vx) + (MX12(mx) * vy) + (MX13(mx) * vz)) >> shift); gteMAC2 = A2((((s64)CV2(cv) << 12) + (MX21(mx) * vx) + (MX22(mx) * vy) + (MX23(mx) * vz)) >> shift); @@ -516,7 +508,6 @@ void gteNCLIP(psxCP2Regs *regs) { GTE_LOG("GTE NCLIP\n"); #endif gteFLAG = 0; - psxRegs.cycle += 8; gteMAC0 = F((s64)gteSX0 * (gteSY1 - gteSY2) + gteSX1 * (gteSY2 - gteSY0) + @@ -528,7 +519,6 @@ void gteAVSZ3(psxCP2Regs *regs) { GTE_LOG("GTE AVSZ3\n"); #endif gteFLAG = 0; - psxRegs.cycle += 5; gteMAC0 = F((s64)gteZSF3 * (gteSZ1 + gteSZ2 + gteSZ3)); gteOTZ = limD(gteMAC0 >> 12); @@ -539,7 +529,6 @@ void gteAVSZ4(psxCP2Regs *regs) { GTE_LOG("GTE AVSZ4\n"); #endif gteFLAG = 0; - psxRegs.cycle += 6; gteMAC0 = F((s64)gteZSF4 * (gteSZ0 + gteSZ1 + gteSZ2 + gteSZ3)); gteOTZ = limD(gteMAC0 >> 12); @@ -553,7 +542,6 @@ void gteSQR(psxCP2Regs *regs) { GTE_LOG("GTE SQR\n"); #endif gteFLAG = 0; - psxRegs.cycle += 5; gteMAC1 = (gteIR1 * gteIR1) >> shift; gteMAC2 = (gteIR2 * gteIR2) >> shift; @@ -568,7 +556,6 @@ void gteNCCS(psxCP2Regs *regs) { GTE_LOG("GTE NCCS\n"); #endif gteFLAG = 0; - psxRegs.cycle += 17; gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12; gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12; @@ -605,7 +592,6 @@ void gteNCCT(psxCP2Regs *regs) { GTE_LOG("GTE NCCT\n"); #endif gteFLAG = 0; - psxRegs.cycle += 39; for (v = 0; v < 3; v++) { vx = VX(v); @@ -644,7 +630,6 @@ void gteNCDS(psxCP2Regs *regs) { GTE_LOG("GTE NCDS\n"); #endif gteFLAG = 0; - psxRegs.cycle += 19; gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12; gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12; @@ -681,7 +666,6 @@ void gteNCDT(psxCP2Regs *regs) { GTE_LOG("GTE NCDT\n"); #endif gteFLAG = 0; - psxRegs.cycle += 44; for (v = 0; v < 3; v++) { vx = VX(v); @@ -723,7 +707,6 @@ void gteOP(psxCP2Regs *regs) { GTE_LOG("GTE OP\n"); #endif gteFLAG = 0; - psxRegs.cycle += 6; gteMAC1 = ((gteR22 * gteIR3) - (gteR33 * gteIR2)) >> shift; gteMAC2 = ((gteR33 * gteIR1) - (gteR11 * gteIR3)) >> shift; @@ -744,7 +727,6 @@ void gteDCPL(psxCP2Regs *regs) { GTE_LOG("GTE DCPL\n"); #endif gteFLAG = 0; - psxRegs.cycle += 8; gteMAC1 = RIR1 + ((gteIR0 * limB1(A1U((s64)gteRFC - RIR1), 0)) >> 12); gteMAC2 = GIR2 + ((gteIR0 * limB1(A2U((s64)gteGFC - GIR2), 0)) >> 12); @@ -769,7 +751,6 @@ void gteGPF(psxCP2Regs *regs) { GTE_LOG("GTE GPF\n"); #endif gteFLAG = 0; - psxRegs.cycle += 5; gteMAC1 = (gteIR0 * gteIR1) >> shift; gteMAC2 = (gteIR0 * gteIR2) >> shift; @@ -793,7 +774,6 @@ void gteGPL(psxCP2Regs *regs) { GTE_LOG("GTE GPL\n"); #endif gteFLAG = 0; - psxRegs.cycle += 5; gteMAC1 = A1((((s64)gteMAC1 << shift) + (gteIR0 * gteIR1)) >> shift); gteMAC2 = A2((((s64)gteMAC2 << shift) + (gteIR0 * gteIR2)) >> shift); @@ -817,7 +797,6 @@ void gteDPCS(psxCP2Regs *regs) { GTE_LOG("GTE DPCS\n"); #endif gteFLAG = 0; - psxRegs.cycle += 8; gteMAC1 = ((gteR << 16) + (gteIR0 * limB1(A1U(((s64)gteRFC - (gteR << 4)) << (12 - shift)), 0))) >> 12; gteMAC2 = ((gteG << 16) + (gteIR0 * limB2(A2U(((s64)gteGFC - (gteG << 4)) << (12 - shift)), 0))) >> 12; @@ -841,7 +820,6 @@ void gteDPCT(psxCP2Regs *regs) { GTE_LOG("GTE DPCT\n"); #endif gteFLAG = 0; - psxRegs.cycle += 17; for (v = 0; v < 3; v++) { gteMAC1 = ((gteR0 << 16) + (gteIR0 * limB1(A1U((s64)gteRFC - (gteR0 << 4)), 0))) >> 12; @@ -865,7 +843,6 @@ void gteNCS(psxCP2Regs *regs) { GTE_LOG("GTE NCS\n"); #endif gteFLAG = 0; - psxRegs.cycle += 14; gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12; gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12; @@ -896,7 +873,6 @@ void gteNCT(psxCP2Regs *regs) { GTE_LOG("GTE NCT\n"); #endif gteFLAG = 0; - psxRegs.cycle += 30; for (v = 0; v < 3; v++) { vx = VX(v); @@ -928,7 +904,6 @@ void gteCC(psxCP2Regs *regs) { GTE_LOG("GTE CC\n"); #endif gteFLAG = 0; - psxRegs.cycle += 11; gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12); gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12); @@ -959,7 +934,6 @@ void gteINTPL(psxCP2Regs *regs) { GTE_LOG("GTE INTPL\n"); #endif gteFLAG = 0; - psxRegs.cycle += 8; gteMAC1 = ((gteIR1 << 12) + (gteIR0 * limB1(A1U((s64)gteRFC - gteIR1), 0))) >> shift; gteMAC2 = ((gteIR2 << 12) + (gteIR0 * limB2(A2U((s64)gteGFC - gteIR2), 0))) >> shift; @@ -980,7 +954,6 @@ void gteCDP(psxCP2Regs *regs) { GTE_LOG("GTE CDP\n"); #endif gteFLAG = 0; - psxRegs.cycle += 13; gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12); gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);