svp. does some output now
[picodrive.git] / Pico / carthw / svp / ssp16.c
index da8409f..8df79ee 100644 (file)
@@ -66,7 +66,9 @@
  *   size: 16?
  *   desc: Programmable Memory access register.
  *         On reset, or when one (both?) GP0 bits are clear,
- *         acts as some additional status reg?
+ *         acts as status for XST, mapped at 015004 at 68k side:
+ *         bit0: ssp has written something to XST (cleared when 015004 is read)
+ *         bit1: 68k has written something through a1500{0|2} (cleared on PM0 read)
  *
  * 9. "PM1"
  *   size: 16?
@@ -80,8 +82,9 @@
  *
  * 11. "XST"
  *   size: 16?
- *   desc: eXternal STate. Mapped to a15000 at 68k side.
+ *   desc: eXternal STate. Mapped to a15000 and a15002 at 68k side.
  *         Can be programmed as PMAR? (only seen in test mode code)
+ *         Affects PM0 when written to?
  *
  * 12. "PM4"
  *   size: 16?
  *
  * Instruction notes
  *
+ * ld a, * doesn't affect flags! (e: A_LAW.SC, Div_c_dp.sc)
+ *
  * mld (rj), (ri) [, b]
  *   operation: A = 0; P = (rj) * (ri)
  *   notes: based on IIR_4B.SC sample. flags? what is b???
  *   name: multiply and subtract?
  *   notes: not used by VR code.
  *
+ * mod cond, op
+ *   mod cond, shr  does arithmetic shift
+ *
+ * memory map:
+ * 000000 - 1fffff   ROM, accessable by both
+ * 200000 - 2fffff   unused?
+ * 300000 - 31ffff   DRAM, both
+ * 320000 - 38ffff   unused?
+ * 390000 - 3907ff   IRAM. can only be accessed by ssp?
+ * 390000 - 39ffff   similar mapping to "cell arrange" in Sega CD, 68k only?
+ * 3a0000 - 3affff   similar mapping to "cell arrange" in Sega CD, a bit different
+ *
+ * 30fe02 - 0 if SVP busy, 1 if done (set by SVP, checked and cleared by 68k)
+ * 30fe06 - also sync related.
+ * 30fe08 - job number [1-12] for SVP. 0 means no job. Set by 68k, read-cleared by SVP.
+ *
+ * misc:
+ * pressing all buttons while resetting game will kick into test mode
  *
  * Assumptions in this code
  *   P is not directly writeable
 #define SET_PC(d) PC = (unsigned short *)svp->iram_rom + d
 
 #define REG_READ(r) (((r) <= 4) ? ssp->gr[r].h : read_handlers[r]())
-// if r is 'A', should we set flags?
 #define REG_WRITE(r,d) { \
        int r1 = r; \
        if (r1 >= 4) write_handlers[r1](d); \
 }
 
 // flags
-#define FLAG_L (1<<0xc)
-#define FLAG_Z (1<<0xd)
-#define FLAG_V (1<<0xe)
-#define FLAG_N (1<<0xf)
+#define SSP_FLAG_L (1<<0xc)
+#define SSP_FLAG_Z (1<<0xd)
+#define SSP_FLAG_V (1<<0xe)
+#define SSP_FLAG_N (1<<0xf)
 
 // update ZN according to 32bit ACC.
 #define UPD_ACC_ZN \
-       rST &= ~(FLAG_Z|FLAG_N); \
-       if (!rA32) rST |= FLAG_Z; \
-       else rST |= (rA32>>16)&FLAG_N;
+       rST &= ~(SSP_FLAG_Z|SSP_FLAG_N); \
+       if (!rA32) rST |= SSP_FLAG_Z; \
+       else rST |= (rA32>>16)&SSP_FLAG_N;
 
 // it seems SVP code never checks for L and OV, so we leave them out.
-// rST |= (t>>4)&FLAG_L;
+// rST |= (t>>4)&SSP_FLAG_L;
 #define UPD_t_LZVN \
-       rST &= ~(FLAG_L|FLAG_Z|FLAG_V|FLAG_N); \
-       if (!t) rST |= FLAG_Z; \
-       else    rST |= t&FLAG_N; \
+       rST &= ~(SSP_FLAG_L|SSP_FLAG_Z|SSP_FLAG_V|SSP_FLAG_N); \
+       if (!t) rST |= SSP_FLAG_Z; \
+       else    rST |= t&SSP_FLAG_N; \
 
 // standard cond processing.
 // again, only Z and N is checked, as SVP doesn't seem to use any other conds.
 #define COND_CHECK \
        switch (op&0xf0) { \
                case 0x00: cond = 1; break; /* always true */ \
-               case 0x50: cond = !((rST ^ (op<<5)) & FLAG_Z); break; /* Z matches f(?) bit */ \
-               case 0x70: cond = !((rST ^ (op<<7)) & FLAG_N); break; /* N matches f(?) bit */ \
+               case 0x50: cond = !((rST ^ (op<<5)) & SSP_FLAG_Z); break; /* Z matches f(?) bit */ \
+               case 0x70: cond = !((rST ^ (op<<7)) & SSP_FLAG_N); break; /* N matches f(?) bit */ \
                default:elprintf(EL_SVP, "unimplemented cond @ %04x", GET_PPC_OFFS()); break; \
        }
 
 // ops with accumulator.
 // how is low word really affected by these?
-// not sure if 'ld A' affects flags (assume it does..)
+// nearly sure 'ld A' doesn't affect flags
 #define OP_LDA(x) \
-       ssp->gr[SSP_A].h = x; \
-       UPD_ACC_ZN
+       ssp->gr[SSP_A].h = x
 
 #define OP_SUBA(x) { \
        u32 t = (ssp->gr[SSP_A].v >> 16) - (x); \
@@ -260,6 +281,7 @@ static unsigned short *PC;
 static int g_cycles;
 // debug
 static int running = 0;
+static int last_iram = 0;
 
 // -----------------------------------------------------
 // register i/o handlers
@@ -267,13 +289,13 @@ static int running = 0;
 // 0-4, 13
 static u32 read_unknown(void)
 {
-       elprintf(EL_ANOMALY|EL_SVP, "ssp16: unknown read @ %04x", GET_PPC_OFFS());
+       elprintf(EL_ANOMALY|EL_SVP, "ssp16: FIXME: unknown read @ %04x", GET_PPC_OFFS());
        return 0;
 }
 
 static void write_unknown(u32 d)
 {
-       elprintf(EL_ANOMALY|EL_SVP, "ssp16: unknown write @ %04x", GET_PPC_OFFS());
+       elprintf(EL_ANOMALY|EL_SVP, "ssp16: FIXME: unknown write @ %04x", GET_PPC_OFFS());
 }
 
 // 4
@@ -281,7 +303,7 @@ static void write_ST(u32 d)
 {
        if ((rST ^ d) & 7) {
                elprintf(EL_SVP, "ssp16: RPL %i -> %i @ %04x", rST&7, d&7, GET_PPC_OFFS());
-               running = 0;
+//             running = 0;
        }
        rST = d;
 }
@@ -293,7 +315,7 @@ static u32 read_STACK(void)
        --rSTACK;
        if ((short)rSTACK < 0) {
                rSTACK = 5;
-               elprintf(EL_ANOMALY|EL_SVP, "ssp16: stack underflow! (%i) @ %04x", rSTACK, GET_PPC_OFFS());
+               elprintf(EL_ANOMALY|EL_SVP, "ssp16: FIXME: stack underflow! (%i) @ %04x", rSTACK, GET_PPC_OFFS());
        }
        return ssp->stack[rSTACK];
 }
@@ -301,8 +323,8 @@ static u32 read_STACK(void)
 static void write_STACK(u32 d)
 {
        if (rSTACK >= 6) {
-               //running = 0;
-               elprintf(EL_ANOMALY|EL_SVP, "ssp16: stack overflow! (%i) @ %04x", rSTACK, GET_PPC_OFFS());
+               running = 0;
+               elprintf(EL_ANOMALY|EL_SVP, "ssp16: FIXME: stack overflow! (%i) @ %04x", rSTACK, GET_PPC_OFFS());
                rSTACK = 0;
        }
        ssp->stack[rSTACK++] = d;
@@ -332,18 +354,49 @@ static u32 read_P(void)
 static void iram_write(int addr, u32 d, int reg, int inc)
 {
        if ((addr&0xfc00) != 0x8000)
-               elprintf(EL_SVP|EL_ANOMALY, "ssp invalid IRAM addr: %04x", addr<<1);
+               elprintf(EL_SVP|EL_ANOMALY, "ssp FIXME: invalid IRAM addr: %04x", addr<<1);
        elprintf(EL_SVP, "ssp IRAM w [%06x] %04x (inc %i)", (addr<<1)&0x7ff, d, inc);
        ((unsigned short *)svp->iram_rom)[addr&0x3ff] = d;
        ssp->pmac_write[reg] += inc<<16;
 }
 
+int lil[32] = { 0, }, lilp = 0;
+
+static void debug_dump2file(const char *fname, void *mem, int len);
+
+#define overwite_write(dst, d) \
+{ \
+       if (d & 0xf000) { dst &= ~0xf000; dst |= d & 0xf000; } \
+       if (d & 0x0f00) { dst &= ~0x0f00; dst |= d & 0x0f00; } \
+       if (d & 0x00f0) { dst &= ~0x00f0; dst |= d & 0x00f0; } \
+       if (d & 0x000f) { dst &= ~0x000f; dst |= d & 0x000f; } \
+}
+
 static u32 pm_io(int reg, int write, u32 d)
 {
        if (ssp->emu_status & SSP_PMC_SET) {
                elprintf(EL_SVP, "PM%i (%c) set to %08x @ %04x", reg, write ? 'w' : 'r', rPMC.v, GET_PPC_OFFS());
                ssp->pmac_read[write ? reg + 6 : reg] = rPMC.v;
                ssp->emu_status &= ~SSP_PMC_SET;
+               if ((rPMC.v & 0x7f) == 0x1c && (rPMC.v & 0x7fff0000) == 0) {
+                       elprintf(EL_SVP, "IRAM copy from %06x", (ssp->RAM1[0]-1)<<1);
+/*
+                       {
+                               int i;
+                               char buff[64];
+                               for (i = 0; i < 32; i++) {
+                                       if (lil[i] == last_iram) break;
+                                       if (lil[i] == 0) {
+                                               lil[i] = last_iram;
+                                               sprintf(buff, "iramrom_%04x.bin", last_iram);
+                                               debug_dump2file(buff, svp->iram_rom, sizeof(svp->iram_rom));
+                                               break;
+                                       }
+                               }
+                       }
+*/
+                       last_iram = (ssp->RAM1[0]-1)<<1;
+               }
                return 0;
        }
 
@@ -353,47 +406,82 @@ static u32 pm_io(int reg, int write, u32 d)
 //     if (ssp->pmac_read[reg] != 0)
        if (reg == 4 || (rST & 0x60))
        {
+               #define CADDR ((((mode<<16)&0x7f0000)|addr)<<1)
+               unsigned short *dram = (unsigned short *)svp->dram;
                if (write)
                {
+                       /* TODO: 0c18 mode? */
                        int mode = ssp->pmac_write[reg]&0xffff;
                        int addr = ssp->pmac_write[reg]>>16;
                        switch (mode) {
-                               case 0x0018: elprintf(EL_SVP, "ssp DRAM w [%06x] %04x", addr<<1, d);
-                                            ((unsigned short *)svp->dram)[addr] = d;
+                               case 0x0018: elprintf(EL_SVP, "ssp DRAM w [%06x] %04x", CADDR, d);
+                                            dram[addr] = d;
+                                            break;
+                               case 0x0418: elprintf(EL_SVP, "ssp DRAM w [%06x] %04x (overwr)", CADDR, d);
+                                            overwite_write(dram[addr], d);
                                             break;
-                               case 0x0818: elprintf(EL_SVP, "ssp DRAM w [%06x] %04x (inc 1)", addr<<1, d);
-                                            ((unsigned short *)svp->dram)[addr] = d;
+                               case 0x0818: elprintf(EL_SVP, "ssp DRAM w [%06x] %04x (inc 1)", CADDR, d);
+                                            dram[addr] = d;
                                             ssp->pmac_write[reg] += 1<<16;
                                             break;
                                case 0x081c: iram_write(addr, d, reg, 1); break; // checked: used by code @ 0902
                                case 0x101c: iram_write(addr, d, reg, 2); break; // checked: used by code @ 3b7c
+                               case 0x4018: elprintf(EL_SVP, "ssp DRAM w [%06x] %04x (cell inc)", CADDR, d);
+                                            dram[addr] = d;
+                                            ssp->pmac_write[reg] += (addr&1) ? (31<<16) : (1<<16);
+                                            break;
+                               case 0x4418: elprintf(EL_SVP, "ssp DRAM w [%06x] %04x (overwr, cell inc)", CADDR, d);
+                                            overwite_write(dram[addr], d);
+                                            ssp->pmac_write[reg] += (addr&1) ? (31<<16) : (1<<16);
+                                            break;
                                default:     elprintf(EL_SVP|EL_ANOMALY, "ssp PM%i unhandled write mode %04x, [%06x] %04x @ %04x",
-                                                       reg, mode, addr<<1, d, GET_PPC_OFFS()); break;
+                                                       reg, mode, CADDR, d, GET_PPC_OFFS()); break;
                        }
                }
                else
                {
                        int mode = ssp->pmac_read[reg]&0xffff;
                        int addr = ssp->pmac_read[reg]>>16;
+                       if ((mode & 0xfff0) == 0x0800) { // ROM, inc 1, verified to be correct
+                               elprintf(EL_SVP, "ssp ROM  r [%06x] %04x", CADDR,
+                                       ((unsigned short *)Pico.rom)[addr|((mode&0xf)<<16)]);
+                               ssp->pmac_read[reg] += 1<<16;
+                               d = ((unsigned short *)Pico.rom)[addr|((mode&0xf)<<16)];
+                               goto ext_io_end;
+                       }
+
                        switch (mode) {
-                               case 0x0809: elprintf(EL_SVP, "ssp ROM  r [%06x] %04x", (addr|((mode&0xf)<<16))<<1,
-                                                       ((unsigned short *)Pico.rom)[addr|((mode&0xf)<<16)]);
-                                            // possibly correct, the first word read is some sort of counter, sane values in ROM
-                                            ssp->pmac_read[reg] += 1<<16;
-                                            return ((unsigned short *)Pico.rom)[addr|((mode&0xf)<<16)];
-                               case 0x0018: elprintf(EL_SVP, "ssp DRAM r [%06x] %04x", addr<<1, ((unsigned short *)svp->dram)[addr]);
-                                            return ((unsigned short *)svp->dram)[addr]; // checked
-                               case 0x0818: elprintf(EL_SVP, "ssp DRAM r [%06x] %04x (inc 1)", addr<<1, ((unsigned short *)svp->dram)[addr]);
-                                            ssp->pmac_read[reg] += 1<<16;
-                                            return ((unsigned short *)svp->dram)[addr];
-                               case 0x3018: elprintf(EL_SVP, "ssp DRAM r [%06x] %04x (inc 32)", addr<<1, ((unsigned short *)svp->dram)[addr]);
-                                            ssp->pmac_read[reg] += 32<<16;
-                                            return ((unsigned short *)svp->dram)[addr];
+                               case 0x0018: elprintf(EL_SVP, "ssp DRAM r [%06x] %04x", CADDR, dram[addr]);
+                                            d = dram[addr]; // checked
+                                            break;
+                               case 0x0818: elprintf(EL_SVP, "ssp DRAM r [%06x] %04x (inc 1)", CADDR, dram[addr]);
+                                            ssp->pmac_read[reg] += 1<<16;
+                                            d = dram[addr];
+                                            break;
+                               case 0x3018: elprintf(EL_SVP, "ssp DRAM r [%06x] %04x (inc 32)", CADDR, dram[addr]);
+                                            ssp->pmac_read[reg] += 32<<16;
+                                            d = dram[addr];
+                                            break;
+                               case 0xa818: elprintf(EL_SVP, "ssp DRAM r [%06x] %04x (dec 16)", CADDR, dram[addr]);
+                                            ssp->pmac_read[reg] -= 16<<16;
+                                            d = dram[addr];
+                                            break;
+                               case 0xb818: elprintf(EL_SVP, "ssp DRAM r [%06x] %04x (dec 128?)", CADDR, dram[addr]);
+                                            ssp->pmac_read[reg] -= 128<<16;
+                                            d = dram[addr];
+                                            break;
                                default:     elprintf(EL_SVP|EL_ANOMALY, "ssp PM%i unhandled read  mode %04x, [%06x] @ %04x",
-                                                       reg, mode, addr<<1, GET_PPC_OFFS()); break;
+                                                       reg, mode, CADDR, GET_PPC_OFFS());
+                                            d = 0;
+                                            break;
                        }
                }
-               return 0;
+
+ext_io_end:
+               // PMC value corresponds to last PMR accessed (not sure).
+               rPMC.v = ssp->pmac_read[write ? reg + 6 : reg];
+
+               return d;
        }
 
        return (u32)-1;
@@ -406,7 +494,12 @@ static u32 read_PM0(void)
        if (d != (u32)-1) return d;
        if (GET_PPC_OFFS() != 0x800 || rPM0 != 0) // debug
                elprintf(EL_SVP, "PM0 raw r %04x @ %04x", rPM0, GET_PPC_OFFS());
-       return rPM0;
+       d = rPM0;
+       if (!(d & 2) && (GET_PPC_OFFS() == 0x800 || GET_PPC_OFFS() == 0x1851E)) {
+               ssp->emu_status |= SSP_WAIT_PM0; elprintf(EL_SVP, "det TIGHT loop: PM0");
+       }
+       rPM0 &= ~2; // ?
+       return d;
 }
 
 static void write_PM0(u32 d)
@@ -473,6 +566,7 @@ static void write_XST(u32 d)
        if (r != (u32)-1) return;
 
        elprintf(EL_SVP, "XST raw w %04x @ %04x", d, GET_PPC_OFFS());
+       rPM0 |= 1;
        rXST = d;
 }
 
@@ -480,6 +574,12 @@ static void write_XST(u32 d)
 static u32 read_PM4(void)
 {
        u32 d = pm_io(4, 0, 0);
+       if (d == 0) {
+               switch (GET_PPC_OFFS()) {
+                       case 0x0854: ssp->emu_status |= SSP_WAIT_30FE08; elprintf(EL_SVP, "det TIGHT loop: [30fe08]"); break;
+                       case 0x4f12: ssp->emu_status |= SSP_WAIT_30FE06; elprintf(EL_SVP, "det TIGHT loop: [30fe06]"); break;
+               }
+       }
        if (d != (u32)-1) return d;
        // can be removed?
        elprintf(EL_SVP, "PM4 raw r %04x @ %04x", rPM4, GET_PPC_OFFS());
@@ -498,6 +598,7 @@ static void write_PM4(u32 d)
 // 14
 static u32 read_PMC(void)
 {
+       elprintf(EL_SVP, "PMC r %08x @ %04x", rPMC.v, GET_PPC_OFFS());
        if (ssp->emu_status & SSP_PMC_HAVE_ADDR) {
                if (ssp->emu_status & SSP_PMC_SET)
                        elprintf(EL_ANOMALY|EL_SVP, "prev PMC not used @ %04x", GET_PPC_OFFS());
@@ -528,6 +629,8 @@ static void write_PMC(u32 d)
 static u32 read_AL(void)
 {
        // TODO: figure out what's up with those blind reads..
+       if (*(PC-1) == 0x000f)
+               elprintf(EL_SVP|EL_ANOMALY, "ssp unhandled AL blind read..");
        return rAL;
 }
 
@@ -584,7 +687,8 @@ static write_func_t write_handlers[16] =
 static u32 ptr1_read_(int ri, int isj2, int modi3)
 {
        //int t = (op&3) | ((op>>6)&4) | ((op<<1)&0x18);
-       int t = ri | isj2 | modi3;
+       u32 mask, add = 0, t = ri | isj2 | modi3;
+       unsigned char *rp = NULL;
        switch (t)
        {
                // mod=0 (00)
@@ -597,36 +701,48 @@ static u32 ptr1_read_(int ri, int isj2, int modi3)
                case 0x06: return ssp->RAM1[ssp->r1[t&3]];
                case 0x07: return ssp->RAM1[0];
                // mod=1 (01), "+!"
-               // mod=3,      "+"
                case 0x08:
-               case 0x18:
                case 0x09:
-               case 0x19:
-               case 0x0a:
-               case 0x1a: return ssp->RAM0[ssp->r0[t&3]++];
+               case 0x0a: return ssp->RAM0[ssp->r0[t&3]++];
                case 0x0b: return ssp->RAM0[1];
                case 0x0c:
-               case 0x1c:
                case 0x0d:
-               case 0x1d:
-               case 0x0e:
-               case 0x1e: return ssp->RAM1[ssp->r1[t&3]++];
+               case 0x0e: return ssp->RAM1[ssp->r1[t&3]++];
                case 0x0f: return ssp->RAM1[1];
                // mod=2 (10), "-"
                case 0x10:
                case 0x11:
-               case 0x12: return ssp->RAM0[ssp->r0[t&3]--];
+               case 0x12: rp = &ssp->r0[t&3]; t = ssp->RAM0[*rp];
+                          if (!(rST&7)) { (*rp)--; return t; }
+                          add = -1; goto modulo;
                case 0x13: return ssp->RAM0[2];
                case 0x14:
                case 0x15:
-               case 0x16: return ssp->RAM1[ssp->r1[t&3]--];
+               case 0x16: rp = &ssp->r1[t&3]; t = ssp->RAM1[*rp];
+                          if (!(rST&7)) { (*rp)--; return t; }
+                          add = -1; goto modulo;
                case 0x17: return ssp->RAM1[2];
-               // mod=3 (11)
+               // mod=3 (11), "+"
+               case 0x18:
+               case 0x19:
+               case 0x1a: rp = &ssp->r0[t&3]; t = ssp->RAM0[*rp];
+                          if (!(rST&7)) { (*rp)++; return t; }
+                          add = 1; goto modulo;
                case 0x1b: return ssp->RAM0[3];
+               case 0x1c:
+               case 0x1d:
+               case 0x1e: rp = &ssp->r1[t&3]; t = ssp->RAM1[*rp];
+                          if (!(rST&7)) { (*rp)++; return t; }
+                          add = 1; goto modulo;
                case 0x1f: return ssp->RAM1[3];
        }
 
        return 0;
+
+modulo:
+       mask = (1 << (rST&7)) - 1;
+       *rp = (*rp & ~mask) | ((*rp + add) & mask);
+       return t;
 }
 
 static void ptr1_write(int op, u32 d)
@@ -697,7 +813,7 @@ static u32 ptr2_read(int op)
                // mod=3 (11)
                case 0x1b: mv = ssp->RAM0[3]++; break;
                case 0x1f: mv = ssp->RAM1[3]++; break;
-               default:   elprintf(EL_SVP|EL_ANOMALY, "invalid mod in ((rX))? @ %04x", GET_PPC_OFFS());
+               default:   elprintf(EL_SVP|EL_ANOMALY, "ssp FIXME: invalid mod in ((rX))? @ %04x", GET_PPC_OFFS());
                           return 0;
        }
 
@@ -714,6 +830,7 @@ void ssp1601_reset(ssp1601_t *l_ssp)
        ssp->gr[SSP_GR0].v = 0xffff0000;
        rPC = 0x400;
        rSTACK = 0; // ? using ascending stack
+       rST = 0;
 }
 
 
@@ -723,8 +840,8 @@ static void debug_dump(void)
        printf("PC:    %04x  (%04x)                P: %08x\n", GET_PC(), GET_PC() << 1, ssp->gr[SSP_P].v);
        printf("PM0:   %04x  PM1: %04x  PM2: %04x\n", rPM0, rPM1, rPM2);
        printf("XST:   %04x  PM4: %04x  PMC: %08x\n", rXST, rPM4, ssp->gr[SSP_PMC].v);
-       printf(" ST:   %04x  %c%c%c%c,  GP0_0 %i,  GP0_1 %i\n", rST, rST&FLAG_N?'N':'n', rST&FLAG_V?'V':'v',
-               rST&FLAG_Z?'Z':'z', rST&FLAG_L?'L':'l', (rST>>5)&1, (rST>>6)&1);
+       printf(" ST:   %04x  %c%c%c%c,  GP0_0 %i,  GP0_1 %i\n", rST, rST&SSP_FLAG_N?'N':'n', rST&SSP_FLAG_V?'V':'v',
+               rST&SSP_FLAG_Z?'Z':'z', rST&SSP_FLAG_L?'L':'l', (rST>>5)&1, (rST>>6)&1);
        printf("STACK: %i %04x %04x %04x %04x %04x %04x\n", rSTACK, ssp->stack[0], ssp->stack[1],
                ssp->stack[2], ssp->stack[3], ssp->stack[4], ssp->stack[5]);
        printf("r0-r2: %02x %02x %02x  r4-r6: %02x %02x %02x\n", rIJ[0], rIJ[1], rIJ[2], rIJ[4], rIJ[5], rIJ[6]);
@@ -745,6 +862,22 @@ static void debug_dump_mem(void)
        }
 }
 
+static void debug_dump2file(const char *fname, void *mem, int len)
+{
+       FILE *f = fopen(fname, "wb");
+       unsigned short *p = mem;
+       int i;
+       if (f) {
+               for (i = 0; i < len/2; i++) p[i] = (p[i]<<8) | (p[i]>>8);
+               fwrite(mem, 1, len, f);
+               fclose(f);
+               for (i = 0; i < len/2; i++) p[i] = (p[i]<<8) | (p[i]>>8);
+               printf("dumped to %s\n", fname);
+       }
+       else
+               printf("dump failed\n");
+}
+
 static int bpts[10] = { 0, };
 
 static void debug(unsigned int pc, unsigned int op)
@@ -789,21 +922,11 @@ static void debug(unsigned int pc, unsigned int op)
                                printf("breakpoint %i set @ %04x\n", i, bpts[i]<<1);
                                break;
                        }
-                       case 'd': {
-                               FILE *f = fopen("dump.bin", "wb");
-                               unsigned short *p = (unsigned short *)svp->iram_rom;
-                               int i;
-                               if (f) {
-                                       for (i = 0; i < 0x10000; i++) p[i] = (p[i]<<8) | (p[i]>>8);
-                                       fwrite(svp->iram_rom, 1, 0x20000, f);
-                                       fclose(f);
-                                       for (i = 0; i < 0x10000; i++) p[i] = (p[i]<<8) | (p[i]>>8);
-                                       printf("dumped to dump.bin\n");
-                               }
-                               else
-                                       printf("dump failed\n");
+                       case 'd':
+                               sprintf(buff, "iramrom_%04x.bin", last_iram);
+                               debug_dump2file(buff, svp->iram_rom, sizeof(svp->iram_rom));
+                               debug_dump2file("dram.bin", svp->dram, sizeof(svp->dram));
                                break;
-                       }
                        default:  printf("unknown command\n"); break;
                }
        }
@@ -813,9 +936,10 @@ void ssp1601_run(int cycles)
 {
        SET_PC(rPC);
        g_cycles = cycles;
-//running = 0;
 
-       while (g_cycles > 0)
+//if (Pico.m.frame_count == 480) running = 0;
+
+       while (g_cycles > 0 && !(ssp->emu_status & SSP_WAIT_MASK))
        {
                int op;
                u32 tmpv;
@@ -896,22 +1020,36 @@ void ssp1601_run(int cycles)
                                COND_CHECK
                                if (cond) {
                                        switch (op & 7) {
-                                               case 2: rA32 >>= 1; break; // shr
+                                               case 2: rA32 = (signed int)rA32 >> 1; break; // shr (arithmetic)
                                                case 3: rA32 <<= 1; break; // shl
-                                               case 6: rA32 = -(int)rA32; break; // neg
-                                               case 7: if ((int)rA32 < 0) rA32 = -(int)rA32; break; // abs
-                                               default: elprintf(EL_SVP, "ssp16: unhandled mod %i @ %04x", op&7, GET_PPC_OFFS());
+                                               case 6: rA32 = -(signed int)rA32; break; // neg
+                                               case 7: if ((int)rA32 < 0) rA32 = -(signed int)rA32; break; // abs
+                                               default: elprintf(EL_SVP, "ssp16: FIXME unhandled mod %i @ %04x", op&7, GET_PPC_OFFS());
                                        }
-                                       UPD_ACC_ZN
+                                       UPD_ACC_ZN // ?
                                }
                                break;
                        }
 
+#if 1
+                       // mpys?
+                       case 0x1b:
+                               // very uncertain about this one. What about b?
+                               if (!(op&0x100)) elprintf(EL_SVP|EL_ANOMALY, "ssp16: FIXME: no b bit @ %04x", GET_PPC_OFFS());
+                               read_P(); // update P
+                               ssp->gr[SSP_A].v -= ssp->gr[SSP_P].v; // maybe only upper word?
+//                             UPD_ACC_ZN // I've seen code checking flags after this
+                               rX = ptr1_read_(op&3, 0, (op<<1)&0x18); // ri (maybe rj?)
+                               rY = ptr1_read_((op>>4)&3, 4, (op>>3)&0x18); // rj
+                               break;
+#endif
                        // mpya (rj), (ri), b
                        case 0x4b:
                                // dunno if this is correct. What about b?
+                               if (!(op&0x100)) elprintf(EL_SVP|EL_ANOMALY, "ssp16: FIXME: no b bit @ %04x", GET_PPC_OFFS());
                                read_P(); // update P
                                ssp->gr[SSP_A].v += ssp->gr[SSP_P].v; // maybe only upper word?
+                               UPD_ACC_ZN // ?
                                rX = ptr1_read_(op&3, 0, (op<<1)&0x18); // ri (maybe rj?)
                                rY = ptr1_read_((op>>4)&3, 4, (op>>3)&0x18); // rj
                                break;
@@ -919,7 +1057,9 @@ void ssp1601_run(int cycles)
                        // mld (rj), (ri), b
                        case 0x5b:
                                // dunno if this is correct. What about b?
+                               if (!(op&0x100)) elprintf(EL_SVP|EL_ANOMALY, "ssp16: FIXME: no b bit @ %04x", GET_PPC_OFFS());
                                ssp->gr[SSP_A].v = 0; // maybe only upper word?
+                               // UPD_t_LZVN // ?
                                rX = ptr1_read_(op&3, 0, (op<<1)&0x18); // ri (maybe rj?)
                                rY = ptr1_read_((op>>4)&3, 4, (op>>3)&0x18); // rj
                                break;
@@ -983,7 +1123,7 @@ void ssp1601_run(int cycles)
                        case 0x7c: OP_EORA(op & 0xff); break;
 
                        default:
-                               elprintf(EL_ANOMALY|EL_SVP, "ssp16: unhandled op %04x @ %04x", op, GET_PPC_OFFS());
+                               elprintf(EL_ANOMALY|EL_SVP, "ssp16: FIXME unhandled op %04x @ %04x", op, GET_PPC_OFFS());
                                break;
                }
                g_cycles--;
@@ -993,6 +1133,6 @@ void ssp1601_run(int cycles)
        rPC = GET_PC();
 
        if (ssp->gr[SSP_GR0].v != 0xffff0000)
-               elprintf(EL_ANOMALY|EL_SVP, "ssp16: REG 0 corruption! %08x", ssp->gr[SSP_GR0].v);
+               elprintf(EL_ANOMALY|EL_SVP, "ssp16: FIXME: REG 0 corruption! %08x", ssp->gr[SSP_GR0].v);
 }