overwrite dynarec related code with upstream version
[pcsx_rearmed.git] / libpcsxcore / gte.c
index 239d2e5..5164a89 100644 (file)
 //  sign-extended by bug in original hardware, according to Nocash docs
 //  GTE section 'Screen Offset and Distance'. The emulator does this
 //  sign extension when it is loaded to GTE by CTC2.
-//#define gteH   (regs->CP2C.p[26].sw.l)
-#define gteH   (regs->CP2C.p[26].w.l)
+//#define gteH   (psxRegs.CP2C.p[26].sw.l)
+#define gteH   (psxRegs.CP2C.p[26].w.l)
 #define gteDQA (regs->CP2C.p[27].sw.l)
 #define gteDQB (((s32 *)regs->CP2C.r)[28])
 #define gteZSF3 (regs->CP2C.p[29].sw.l)
@@ -260,6 +260,7 @@ static inline u32 limE_(psxCP2Regs *regs, u32 result) {
 #define A3U(x) (x)
 #endif
 
+
 //senquack - n param should be unsigned (will be 'gteH' reg which is u16)
 #ifdef GTE_USE_NATIVE_DIVIDE
 INLINE u32 DIVIDE(u16 n, u16 d) {
@@ -274,6 +275,32 @@ INLINE u32 DIVIDE(u16 n, u16 d) {
 
 #ifndef FLAGLESS
 
+const unsigned char gte_cycletab[64] = {
+       /*   1   2   3   4   5   6   7   8   9   a   b   c   d   e   f */
+        0, 15,  0,  0,  0,  0,  8,  0,  0,  0,  0,  0,  6,  0,  0,  0,
+        8,  8,  8, 19, 13,  0, 44,  0,  0,  0,  0, 17, 11,  0, 14,  0,
+       30,  0,  0,  0,  0,  0,  0,  0,  5,  8, 17,  0,  0,  5,  6,  0,
+       23,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  5,  5, 39,
+};
+
+// warning: called by the dynarec
+int gteCheckStallRaw(u32 op_cycles, psxRegisters *regs) {
+       u32 left = regs->gteBusyCycle - regs->cycle;
+       int stall = 0;
+
+       if (left <= 44) {
+               //printf("c %2u stall %2u %u\n", op_cycles, left, regs->cycle);
+               regs->cycle = regs->gteBusyCycle;
+               stall = left;
+       }
+       regs->gteBusyCycle = regs->cycle + op_cycles;
+       return stall;
+}
+
+void gteCheckStall(u32 op) {
+       gteCheckStallRaw(gte_cycletab[op], &psxRegs);
+}
+
 u32 MFC2(int reg) {
        psxCP2Regs *regs = &psxRegs.CP2;
        switch (reg) {
@@ -321,9 +348,10 @@ void MTC2(u32 value, int reg) {
 
                case 28:
                        gteIRGB = value;
-                       gteIR1 = (value & 0x1f) << 7;
-                       gteIR2 = (value & 0x3e0) << 2;
-                       gteIR3 = (value & 0x7c00) >> 3;
+                       // not gteIR1 etc. just to be consistent with dynarec
+                       regs->CP2D.n.ir1 = (value & 0x1f) << 7;
+                       regs->CP2D.n.ir2 = (value & 0x3e0) << 2;
+                       regs->CP2D.n.ir3 = (value & 0x7c00) >> 3;
                        break;
 
                case 30:
@@ -377,13 +405,11 @@ void CTC2(u32 value, int reg) {
 }
 
 void gteMFC2() {
-       psxRegs.cycle += 1;
        if (!_Rt_) return;
        psxRegs.GPR.r[_Rt_] = MFC2(_Rd_);
 }
 
 void gteCFC2() {
-       psxRegs.cycle += 1;
        if (!_Rt_) return;
        psxRegs.GPR.r[_Rt_] = psxRegs.CP2C.r[_Rd_];
 }
@@ -403,10 +429,19 @@ void gteLWC2() {
 }
 
 void gteSWC2() {
-       //psxRegs.cycle += 1;
        psxMemWrite32(_oB_, MFC2(_Rt_));
 }
 
+void gteLWC2_stall() {
+       gteCheckStall(0);
+       gteLWC2();
+}
+
+void gteSWC2_stall() {
+       gteCheckStall(0);
+       gteSWC2();
+}
+
 #endif // FLAGLESS
 
 #if 0
@@ -428,7 +463,6 @@ void gteRTPS(psxCP2Regs *regs) {
 #ifdef GTE_LOG
        GTE_LOG("GTE RTPS\n");
 #endif
-       psxRegs.cycle += 15;
        gteFLAG = 0;
 
        gteMAC1 = A1((((s64)gteTRX << 12) + (gteR11 * gteVX0) + (gteR12 * gteVY0) + (gteR13 * gteVZ0)) >> 12);
@@ -461,7 +495,6 @@ void gteRTPT(psxCP2Regs *regs) {
 #ifdef GTE_LOG
        GTE_LOG("GTE RTPT\n");
 #endif
-       psxRegs.cycle += 23;
        gteFLAG = 0;
 
        gteSZ0 = gteSZ3;
@@ -500,7 +533,6 @@ void gteMVMVA(psxCP2Regs *regs) {
        GTE_LOG("GTE MVMVA\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 8;
 
        gteMAC1 = A1((((s64)CV1(cv) << 12) + (MX11(mx) * vx) + (MX12(mx) * vy) + (MX13(mx) * vz)) >> shift);
        gteMAC2 = A2((((s64)CV2(cv) << 12) + (MX21(mx) * vx) + (MX22(mx) * vy) + (MX23(mx) * vz)) >> shift);
@@ -516,7 +548,6 @@ void gteNCLIP(psxCP2Regs *regs) {
        GTE_LOG("GTE NCLIP\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 8;
 
        gteMAC0 = F((s64)gteSX0 * (gteSY1 - gteSY2) +
                                gteSX1 * (gteSY2 - gteSY0) +
@@ -528,7 +559,6 @@ void gteAVSZ3(psxCP2Regs *regs) {
        GTE_LOG("GTE AVSZ3\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 5;
 
        gteMAC0 = F((s64)gteZSF3 * (gteSZ1 + gteSZ2 + gteSZ3));
        gteOTZ = limD(gteMAC0 >> 12);
@@ -539,7 +569,6 @@ void gteAVSZ4(psxCP2Regs *regs) {
        GTE_LOG("GTE AVSZ4\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 6;
 
        gteMAC0 = F((s64)gteZSF4 * (gteSZ0 + gteSZ1 + gteSZ2 + gteSZ3));
        gteOTZ = limD(gteMAC0 >> 12);
@@ -553,7 +582,6 @@ void gteSQR(psxCP2Regs *regs) {
        GTE_LOG("GTE SQR\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 5;
 
        gteMAC1 = (gteIR1 * gteIR1) >> shift;
        gteMAC2 = (gteIR2 * gteIR2) >> shift;
@@ -568,7 +596,6 @@ void gteNCCS(psxCP2Regs *regs) {
        GTE_LOG("GTE NCCS\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 17;
 
        gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12;
        gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12;
@@ -605,7 +632,6 @@ void gteNCCT(psxCP2Regs *regs) {
        GTE_LOG("GTE NCCT\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 39;
 
        for (v = 0; v < 3; v++) {
                vx = VX(v);
@@ -644,7 +670,6 @@ void gteNCDS(psxCP2Regs *regs) {
        GTE_LOG("GTE NCDS\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 19;
 
        gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12;
        gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12;
@@ -681,7 +706,6 @@ void gteNCDT(psxCP2Regs *regs) {
        GTE_LOG("GTE NCDT\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 44;
 
        for (v = 0; v < 3; v++) {
                vx = VX(v);
@@ -723,7 +747,6 @@ void gteOP(psxCP2Regs *regs) {
        GTE_LOG("GTE OP\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 6;
 
        gteMAC1 = ((gteR22 * gteIR3) - (gteR33 * gteIR2)) >> shift;
        gteMAC2 = ((gteR33 * gteIR1) - (gteR11 * gteIR3)) >> shift;
@@ -744,7 +767,6 @@ void gteDCPL(psxCP2Regs *regs) {
        GTE_LOG("GTE DCPL\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 8;
 
        gteMAC1 = RIR1 + ((gteIR0 * limB1(A1U((s64)gteRFC - RIR1), 0)) >> 12);
        gteMAC2 = GIR2 + ((gteIR0 * limB1(A2U((s64)gteGFC - GIR2), 0)) >> 12);
@@ -769,7 +791,6 @@ void gteGPF(psxCP2Regs *regs) {
        GTE_LOG("GTE GPF\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 5;
 
        gteMAC1 = (gteIR0 * gteIR1) >> shift;
        gteMAC2 = (gteIR0 * gteIR2) >> shift;
@@ -793,7 +814,6 @@ void gteGPL(psxCP2Regs *regs) {
        GTE_LOG("GTE GPL\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 5;
 
        gteMAC1 = A1((((s64)gteMAC1 << shift) + (gteIR0 * gteIR1)) >> shift);
        gteMAC2 = A2((((s64)gteMAC2 << shift) + (gteIR0 * gteIR2)) >> shift);
@@ -817,7 +837,6 @@ void gteDPCS(psxCP2Regs *regs) {
        GTE_LOG("GTE DPCS\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 8;
 
        gteMAC1 = ((gteR << 16) + (gteIR0 * limB1(A1U(((s64)gteRFC - (gteR << 4)) << (12 - shift)), 0))) >> 12;
        gteMAC2 = ((gteG << 16) + (gteIR0 * limB2(A2U(((s64)gteGFC - (gteG << 4)) << (12 - shift)), 0))) >> 12;
@@ -841,7 +860,6 @@ void gteDPCT(psxCP2Regs *regs) {
        GTE_LOG("GTE DPCT\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 17;
 
        for (v = 0; v < 3; v++) {
                gteMAC1 = ((gteR0 << 16) + (gteIR0 * limB1(A1U((s64)gteRFC - (gteR0 << 4)), 0))) >> 12;
@@ -865,7 +883,6 @@ void gteNCS(psxCP2Regs *regs) {
        GTE_LOG("GTE NCS\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 14;
 
        gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12;
        gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12;
@@ -896,7 +913,6 @@ void gteNCT(psxCP2Regs *regs) {
        GTE_LOG("GTE NCT\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 30;
 
        for (v = 0; v < 3; v++) {
                vx = VX(v);
@@ -928,7 +944,6 @@ void gteCC(psxCP2Regs *regs) {
        GTE_LOG("GTE CC\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 11;
 
        gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
        gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
@@ -959,7 +974,6 @@ void gteINTPL(psxCP2Regs *regs) {
        GTE_LOG("GTE INTPL\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 8;
 
        gteMAC1 = ((gteIR1 << 12) + (gteIR0 * limB1(A1U((s64)gteRFC - gteIR1), 0))) >> shift;
        gteMAC2 = ((gteIR2 << 12) + (gteIR0 * limB2(A2U((s64)gteGFC - gteIR2), 0))) >> shift;
@@ -980,7 +994,6 @@ void gteCDP(psxCP2Regs *regs) {
        GTE_LOG("GTE CDP\n");
 #endif
        gteFLAG = 0;
-       psxRegs.cycle += 13;
 
        gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
        gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);