#define A3U(x) (x)
#endif
+
//senquack - n param should be unsigned (will be 'gteH' reg which is u16)
#ifdef GTE_USE_NATIVE_DIVIDE
INLINE u32 DIVIDE(u16 n, u16 d) {
#ifndef FLAGLESS
-u32 MFC2(int reg) {
- psxCP2Regs *regs = &psxRegs.CP2;
+const unsigned char gte_cycletab[64] = {
+ /* 1 2 3 4 5 6 7 8 9 a b c d e f */
+ 0, 15, 0, 0, 0, 0, 8, 0, 0, 0, 0, 0, 6, 0, 0, 0,
+ 8, 8, 8, 19, 13, 0, 44, 0, 0, 0, 0, 17, 11, 0, 14, 0,
+ 30, 0, 0, 0, 0, 0, 0, 0, 5, 8, 17, 0, 0, 5, 6, 0,
+ 23, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 5, 5, 39,
+};
+
+// warning: called by the dynarec
+int gteCheckStallRaw(u32 op_cycles, psxRegisters *regs) {
+ u32 left = regs->gteBusyCycle - regs->cycle;
+ int stall = 0;
+
+ if (left <= 44) {
+ //printf("c %2u stall %2u %u\n", op_cycles, left, regs->cycle);
+ regs->cycle = regs->gteBusyCycle;
+ stall = left;
+ }
+ regs->gteBusyCycle = regs->cycle + op_cycles;
+ return stall;
+}
+
+void gteCheckStall(u32 op) {
+ gteCheckStallRaw(gte_cycletab[op], &psxRegs);
+}
+
+u32 MFC2(struct psxCP2Regs *regs, int reg) {
switch (reg) {
case 1:
case 3:
case 9:
case 10:
case 11:
- psxRegs.CP2D.r[reg] = (s32)psxRegs.CP2D.p[reg].sw.l;
+ regs->CP2D.r[reg] = (s32)regs->CP2D.p[reg].sw.l;
break;
case 7:
case 17:
case 18:
case 19:
- psxRegs.CP2D.r[reg] = (u32)psxRegs.CP2D.p[reg].w.l;
+ regs->CP2D.r[reg] = (u32)regs->CP2D.p[reg].w.l;
break;
case 15:
- psxRegs.CP2D.r[reg] = gteSXY2;
+ regs->CP2D.r[reg] = gteSXY2;
break;
case 28:
case 29:
- psxRegs.CP2D.r[reg] = LIM(gteIR1 >> 7, 0x1f, 0, 0) |
+ regs->CP2D.r[reg] = LIM(gteIR1 >> 7, 0x1f, 0, 0) |
(LIM(gteIR2 >> 7, 0x1f, 0, 0) << 5) |
(LIM(gteIR3 >> 7, 0x1f, 0, 0) << 10);
break;
}
- return psxRegs.CP2D.r[reg];
+ return regs->CP2D.r[reg];
}
-void MTC2(u32 value, int reg) {
- psxCP2Regs *regs = &psxRegs.CP2;
+void MTC2(struct psxCP2Regs *regs, u32 value, int reg) {
switch (reg) {
case 15:
gteSXY0 = gteSXY1;
case 28:
gteIRGB = value;
- gteIR1 = (value & 0x1f) << 7;
- gteIR2 = (value & 0x3e0) << 2;
- gteIR3 = (value & 0x7c00) >> 3;
+ // not gteIR1 etc. just to be consistent with dynarec
+ regs->CP2D.n.ir1 = (value & 0x1f) << 7;
+ regs->CP2D.n.ir2 = (value & 0x3e0) << 2;
+ regs->CP2D.n.ir3 = (value & 0x7c00) >> 3;
break;
case 30:
return;
default:
- psxRegs.CP2D.r[reg] = value;
+ regs->CP2D.r[reg] = value;
}
}
-void CTC2(u32 value, int reg) {
+void CTC2(struct psxCP2Regs *regs, u32 value, int reg) {
switch (reg) {
case 4:
case 12:
break;
}
- psxRegs.CP2C.r[reg] = value;
-}
-
-void gteMFC2() {
- psxRegs.cycle += 1;
- if (!_Rt_) return;
- psxRegs.GPR.r[_Rt_] = MFC2(_Rd_);
-}
-
-void gteCFC2() {
- psxRegs.cycle += 1;
- if (!_Rt_) return;
- psxRegs.GPR.r[_Rt_] = psxRegs.CP2C.r[_Rd_];
-}
-
-void gteMTC2() {
- MTC2(psxRegs.GPR.r[_Rt_], _Rd_);
-}
-
-void gteCTC2() {
- CTC2(psxRegs.GPR.r[_Rt_], _Rd_);
-}
-
-#define _oB_ (psxRegs.GPR.r[_Rs_] + _Imm_)
-
-void gteLWC2() {
- MTC2(psxMemRead32(_oB_), _Rt_);
-}
-
-void gteSWC2() {
- //psxRegs.cycle += 1;
- psxMemWrite32(_oB_, MFC2(_Rt_));
+ regs->CP2C.r[reg] = value;
}
#endif // FLAGLESS
#ifdef GTE_LOG
GTE_LOG("GTE RTPS\n");
#endif
- psxRegs.cycle += 15;
gteFLAG = 0;
gteMAC1 = A1((((s64)gteTRX << 12) + (gteR11 * gteVX0) + (gteR12 * gteVY0) + (gteR13 * gteVZ0)) >> 12);
#ifdef GTE_LOG
GTE_LOG("GTE RTPT\n");
#endif
- psxRegs.cycle += 23;
gteFLAG = 0;
gteSZ0 = gteSZ3;
GTE_LOG("GTE MVMVA\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 8;
gteMAC1 = A1((((s64)CV1(cv) << 12) + (MX11(mx) * vx) + (MX12(mx) * vy) + (MX13(mx) * vz)) >> shift);
gteMAC2 = A2((((s64)CV2(cv) << 12) + (MX21(mx) * vx) + (MX22(mx) * vy) + (MX23(mx) * vz)) >> shift);
GTE_LOG("GTE NCLIP\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 8;
gteMAC0 = F((s64)gteSX0 * (gteSY1 - gteSY2) +
gteSX1 * (gteSY2 - gteSY0) +
GTE_LOG("GTE AVSZ3\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 5;
gteMAC0 = F((s64)gteZSF3 * (gteSZ1 + gteSZ2 + gteSZ3));
gteOTZ = limD(gteMAC0 >> 12);
GTE_LOG("GTE AVSZ4\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 6;
gteMAC0 = F((s64)gteZSF4 * (gteSZ0 + gteSZ1 + gteSZ2 + gteSZ3));
gteOTZ = limD(gteMAC0 >> 12);
GTE_LOG("GTE SQR\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 5;
gteMAC1 = (gteIR1 * gteIR1) >> shift;
gteMAC2 = (gteIR2 * gteIR2) >> shift;
GTE_LOG("GTE NCCS\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 17;
gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12;
gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12;
GTE_LOG("GTE NCCT\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 39;
for (v = 0; v < 3; v++) {
vx = VX(v);
GTE_LOG("GTE NCDS\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 19;
gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12;
gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12;
GTE_LOG("GTE NCDT\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 44;
for (v = 0; v < 3; v++) {
vx = VX(v);
GTE_LOG("GTE OP\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 6;
gteMAC1 = ((gteR22 * gteIR3) - (gteR33 * gteIR2)) >> shift;
gteMAC2 = ((gteR33 * gteIR1) - (gteR11 * gteIR3)) >> shift;
GTE_LOG("GTE DCPL\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 8;
gteMAC1 = RIR1 + ((gteIR0 * limB1(A1U((s64)gteRFC - RIR1), 0)) >> 12);
gteMAC2 = GIR2 + ((gteIR0 * limB1(A2U((s64)gteGFC - GIR2), 0)) >> 12);
GTE_LOG("GTE GPF\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 5;
gteMAC1 = (gteIR0 * gteIR1) >> shift;
gteMAC2 = (gteIR0 * gteIR2) >> shift;
GTE_LOG("GTE GPL\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 5;
gteMAC1 = A1((((s64)gteMAC1 << shift) + (gteIR0 * gteIR1)) >> shift);
gteMAC2 = A2((((s64)gteMAC2 << shift) + (gteIR0 * gteIR2)) >> shift);
GTE_LOG("GTE DPCS\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 8;
gteMAC1 = ((gteR << 16) + (gteIR0 * limB1(A1U(((s64)gteRFC - (gteR << 4)) << (12 - shift)), 0))) >> 12;
gteMAC2 = ((gteG << 16) + (gteIR0 * limB2(A2U(((s64)gteGFC - (gteG << 4)) << (12 - shift)), 0))) >> 12;
GTE_LOG("GTE DPCT\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 17;
for (v = 0; v < 3; v++) {
gteMAC1 = ((gteR0 << 16) + (gteIR0 * limB1(A1U((s64)gteRFC - (gteR0 << 4)), 0))) >> 12;
GTE_LOG("GTE NCS\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 14;
gteMAC1 = ((s64)(gteL11 * gteVX0) + (gteL12 * gteVY0) + (gteL13 * gteVZ0)) >> 12;
gteMAC2 = ((s64)(gteL21 * gteVX0) + (gteL22 * gteVY0) + (gteL23 * gteVZ0)) >> 12;
GTE_LOG("GTE NCT\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 30;
for (v = 0; v < 3; v++) {
vx = VX(v);
GTE_LOG("GTE CC\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 11;
gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);
GTE_LOG("GTE INTPL\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 8;
gteMAC1 = ((gteIR1 << 12) + (gteIR0 * limB1(A1U((s64)gteRFC - gteIR1), 0))) >> shift;
gteMAC2 = ((gteIR2 << 12) + (gteIR0 * limB2(A2U((s64)gteGFC - gteIR2), 0))) >> shift;
GTE_LOG("GTE CDP\n");
#endif
gteFLAG = 0;
- psxRegs.cycle += 13;
gteMAC1 = A1((((s64)gteRBK << 12) + (gteLR1 * gteIR1) + (gteLR2 * gteIR2) + (gteLR3 * gteIR3)) >> 12);
gteMAC2 = A2((((s64)gteGBK << 12) + (gteLG1 * gteIR1) + (gteLG2 * gteIR2) + (gteLG3 * gteIR3)) >> 12);