spu: rework irq handling and loop reloading
authornotaz <notasas@gmail.com>
Sat, 7 Jul 2012 18:45:00 +0000 (21:45 +0300)
committernotaz <notasas@gmail.com>
Sun, 15 Jul 2012 17:29:48 +0000 (20:29 +0300)
irq might be too early, but this seems to be better than was before.
Special thanks to Ryphecha for some ideas again.

plugins/dfsound/externals.h
plugins/dfsound/freeze.c
plugins/dfsound/registers.c
plugins/dfsound/spu.c

index 0146553..3cb388c 100644 (file)
@@ -109,7 +109,7 @@ typedef struct
  unsigned int      bRVBActive:1;                       // reverb active flag\r
  unsigned int      bNoise:1;                           // noise active flag\r
  unsigned int      bFMod:2;                            // freq mod (0=off, 1=sound channel, 2=freq channel)\r
- unsigned int      bJump:1;                            // last decoded block jumped\r
+ unsigned int      prevflags:3;                        // flags from previous block\r
 \r
  int               iLeftVolume;                        // left volume\r
  int               iRightVolume;                       // right volume\r
index d7e45b1..ec097c5 100644 (file)
@@ -134,11 +134,11 @@ static void save_channel(SPUCHAN_orig *d, const SPUCHAN *s, int ch)
  d->bOn = !!(dwChannelOn & (1<<ch));\r
  d->bStop = s->bStop;\r
  d->bReverb = s->bReverb;\r
- d->bIgnoreLoop = s->bJump;\r
  d->iActFreq = 1;\r
  d->iUsedFreq = 2;\r
  d->iLeftVolume = s->iLeftVolume;\r
- d->bIgnoreLoop = 0;\r
+ // this one is nasty but safe, save compat is important\r
+ d->bIgnoreLoop = (s->prevflags ^ 2) << 1;\r
  d->iRightVolume = s->iRightVolume;\r
  d->iRawPitch = s->iRawPitch;\r
  d->s_1 = s->SB[27]; // yes it's reversed\r
@@ -179,7 +179,7 @@ static void load_channel(SPUCHAN *d, const SPUCHAN_orig *s, int ch)
  d->bRVBActive = s->bRVBActive;\r
  d->bNoise = s->bNoise;\r
  d->bFMod = s->bFMod;\r
- d->bJump = s->bIgnoreLoop;\r
+ d->prevflags = (s->bIgnoreLoop >> 1) ^ 2;\r
  d->ADSRX.State = s->ADSRX.State;\r
  d->ADSRX.AttackModeExp = s->ADSRX.AttackModeExp;\r
  d->ADSRX.AttackRate = s->ADSRX.AttackRate;\r
@@ -232,11 +232,11 @@ long CALLBACK SPUfreeze(uint32_t ulFreezeMode,SPUFreeze_t * pF)
    pFO->spuAddr=spuAddr;\r
    if(pFO->spuAddr==0) pFO->spuAddr=0xbaadf00d;\r
 \r
-   dwChannelOn&=~dwPendingChanOff;\r
-   dwPendingChanOff=0;\r
-\r
    for(i=0;i<MAXCHAN;i++)\r
     {\r
+     if(!(s_chan[i].prevflags&2))\r
+      dwChannelOn&=~(1<<i);\r
+\r
      save_channel(&pFO->s_chan[i],&s_chan[i],i);\r
      if(pFO->s_chan[i].pCurr)\r
       pFO->s_chan[i].pCurr-=(unsigned long)spuMemC;\r
@@ -257,7 +257,6 @@ long CALLBACK SPUfreeze(uint32_t ulFreezeMode,SPUFreeze_t * pF)
   SPUplayADPCMchannel(&pF->xaS);\r
 \r
  xapGlobal=0;\r
- dwPendingChanOff=0;\r
 \r
  if(!strcmp(pF->szSPUName,"PBOSS") && pF->ulFreezeVersion==5)\r
    LoadStateV5(pF);\r
index 1a51cd7..45df2eb 100644 (file)
@@ -173,10 +173,6 @@ void CALLBACK SPUwriteRegister(unsigned long reg, unsigned short val)
      //------------------------------------------------//\r
      case 14:                                          // loop?\r
        s_chan[ch].pLoop=spuMemC+((val&~1)<<3);\r
-       if(s_chan[ch].bJump)\r
-        // real machine would be most likely still doing the last block and use new value for the jump;\r
-        // but we decode ahead a bit and already did the jump part, so compensate for that now.\r
-        s_chan[ch].pCurr=s_chan[ch].pLoop;\r
        break;\r
      //------------------------------------------------//\r
     }\r
@@ -428,7 +424,7 @@ static void SoundOn(int start,int end,unsigned short val)
      s_chan[ch].bStop=0;\r
      s_chan[ch].pCurr=spuMemC+((regAreaGet(ch,6)&~1)<<3); // must be block aligned\r
      s_chan[ch].pLoop=spuMemC+((regAreaGet(ch,14)&~1)<<3);\r
-     s_chan[ch].bJump=0;\r
+     s_chan[ch].prevflags=2;\r
 \r
      dwNewChannel|=(1<<ch);                            // bitfield for faster testing\r
      dwChannelOn|=1<<ch;\r
index 4759f3f..d5a8215 100644 (file)
@@ -5,7 +5,7 @@
     copyright            : (C) 2002 by Pete Bernert
     email                : BlackDove@addcom.de
 
- Portions (C) Gražvydas "notaz" Ignotas, 2010-2011
+ Portions (C) Gražvydas "notaz" Ignotas, 2010-2012
 
  ***************************************************************************/
 /***************************************************************************
@@ -250,6 +250,26 @@ INLINE void InterpolateDown(int ch)
 
 #include "xa.c"
 
+static void do_irq(void)
+{
+ //if(!(spuStat & STAT_IRQ))
+ {
+  spuStat |= STAT_IRQ;                                 // asserted status?
+  if(irqCallback) irqCallback();
+ }
+}
+
+static int check_irq(int ch, unsigned char *pos)
+{
+ if((spuCtrl & CTRL_IRQ) && pos == pSpuIrq)
+ {
+  //printf("ch%d irq %04x\n", ch, pos - spuMemC);
+  do_irq();
+  return 1;
+ }
+ return 0;
+}
+
 ////////////////////////////////////////////////////////////////////////
 // START SOUND... called by main thread to setup a new sound on a channel
 ////////////////////////////////////////////////////////////////////////
@@ -275,6 +295,8 @@ INLINE void StartSound(int ch)
       {s_chan[ch].spos=0x30000L;s_chan[ch].SB[28]=0;}  // -> start with more decoding
  else {s_chan[ch].spos=0x10000L;s_chan[ch].SB[31]=0;}  // -> no/simple interpolation starts with one 44100 decoding
 
+ check_irq(ch, s_chan[ch].pCurr);                      // just in case
+
  dwNewChannel&=~(1<<ch);                               // clear new channel bit
 }
 
@@ -390,15 +412,6 @@ INLINE int iGetInterpolationVal(int ch, int spos)
  return fa;
 }
 
-static void do_irq(void)
-{
- //if(!(spuStat & STAT_IRQ))
- {
-  spuStat |= STAT_IRQ;                                 // asserted status?
-  if(irqCallback) irqCallback();
- }
-}
-
 static void decode_block_data(int *dest, const unsigned char *src, int predict_nr, int shift_factor)
 {
  int nSample;
@@ -434,23 +447,17 @@ static int decode_block(int ch)
  int ret = 0;
 
  start=s_chan[ch].pCurr;                   // set up the current pos
- if(dwPendingChanOff&(1<<ch))
- {
-  dwChannelOn&=~(1<<ch);                   // -> turn everything off
-  dwPendingChanOff&=~(1<<ch);
-  s_chan[ch].bStop=1;
-  s_chan[ch].ADSRX.EnvelopeVol=0;
- }
 
- //////////////////////////////////////////// irq check
-
- if(spuCtrl&CTRL_IRQ)
+ if(s_chan[ch].prevflags&1)                // 1: stop/loop
  {
-  if(pSpuIrq == start)                     // irq address reached?
+  if(!(s_chan[ch].prevflags&2))
   {
-   do_irq();                               // -> call main emu
-   ret = 1;
+   dwChannelOn&=~(1<<ch);                  // -> turn everything off
+   s_chan[ch].bStop=1;
+   s_chan[ch].ADSRX.EnvelopeVol=0;
   }
+
+  start = s_chan[ch].pLoop;
  }
 
  predict_nr=(int)start[0];
@@ -459,29 +466,22 @@ static int decode_block(int ch)
 
  decode_block_data(s_chan[ch].SB, start + 2, predict_nr, shift_factor);
 
- //////////////////////////////////////////// flag handler
-
  flags=(int)start[1];
  if(flags&4)
   s_chan[ch].pLoop=start;                  // loop adress
 
  start+=16;
- if(flags&1)                               // 1: stop/loop
- {
-  if(!(flags&2))
-   dwPendingChanOff|=1<<ch;
 
+ if(flags&1)                               // 1: stop/loop
   start = s_chan[ch].pLoop;
- }
 
- if (start - spuMemC >= 0x80000) {
-  // most likely wrong
+ if (start - spuMemC >= 0x80000)
   start = spuMemC;
-  printf("ch%d oflow\n", ch);
- }
+
+ ret = check_irq(ch, start);
 
  s_chan[ch].pCurr = start;                 // store values for next cycle
- s_chan[ch].bJump = flags & 1;
+ s_chan[ch].prevflags = flags;
 
  return ret;
 }
@@ -491,24 +491,22 @@ static int skip_block(int ch)
 {
  unsigned char *start = s_chan[ch].pCurr;
  int flags = start[1];
- int ret = 0;
 
- if(start == pSpuIrq)
- {
-  do_irq();
-  ret = 1;
- }
+ if(s_chan[ch].prevflags & 1)
+  start = s_chan[ch].pLoop;
 
  if(flags & 4)
   s_chan[ch].pLoop = start;
 
- s_chan[ch].pCurr += 16;
+ start += 16;
 
  if(flags & 1)
-  s_chan[ch].pCurr = s_chan[ch].pLoop;
+  start = s_chan[ch].pLoop;
 
- s_chan[ch].bJump = flags & 1;
- return ret;
+ s_chan[ch].pCurr = start;
+ s_chan[ch].prevflags = flags;
+
+ return check_irq(ch, start);
 }
 
 #define make_do_samples(name, fmod_code, interp_start, interp1_code, interp2_code, interp_end) \
@@ -824,18 +822,15 @@ static int do_samples(int forced_updates)
   // an IRQ. Only problem: the "wait for cpu" option is kinda hard to do here
   // in some of Peops timer modes. So: we ignore this option here (for now).
 
-  if(pMixIrq)
+  if(pMixIrq && (spuCtrl&CTRL_IRQ) && pSpuIrq && pSpuIrq<spuMemC+0x1000)                 
    {
     for(ns=0;ns<NSSIZE;ns++)
      {
-      if((spuCtrl&0x40) && pSpuIrq && pSpuIrq<spuMemC+0x1000)                 
-       {
         for(ch=0;ch<4;ch++)
          {
           if(pSpuIrq>=pMixIrq+(ch*0x400) && pSpuIrq<pMixIrq+(ch*0x400)+2)
            do_irq();
          }
-       }
       pMixIrq+=2;if(pMixIrq>spuMemC+0x3ff) pMixIrq=spuMemC;
      }
    }
@@ -863,6 +858,7 @@ static int do_samples(int forced_updates)
 
 void CALLBACK SPUasync(unsigned long cycle)
 {
+ static int old_ctrl;
  int forced_updates = 0;
  int do_update = 0;
 
@@ -877,9 +873,16 @@ void CALLBACK SPUasync(unsigned long cycle)
    had_dma = 0;
   }
 
- // once per frame should be fine (using a bit more because of BIAS)
- if(cycles_since_update > PSXCLK/60 * 5/4)
+ if((spuCtrl&CTRL_IRQ) && (((spuCtrl^old_ctrl)&CTRL_IRQ) // irq was enabled
+    || cycles_since_update > PSXCLK/60 / 4)) {
   do_update = 1;
+  forced_updates = cycles_since_update / (PSXCLK/44100) / NSSIZE;
+ }
+ // with no irqs, once per frame should be fine (using a bit more because of BIAS)
+ else if(cycles_since_update > PSXCLK/60 * 5/4)
+  do_update = 1;
+
+ old_ctrl = spuCtrl;
 
  if(do_update)
   do_samples(forced_updates);