32x: memhandler improvements
[picodrive.git] / pico / 32x / sh2soc.c
1 /*
2  * SH2 peripherals/"system on chip"
3  * (C) notaz, 2013
4  *
5  * This work is licensed under the terms of MAME license.
6  * See COPYING file in the top-level directory.
7  *
8  * rough fffffe00-ffffffff map:
9  * e00-e05 SCI    serial communication interface
10  * e10-e1a FRT    free-running timer
11  * e60-e68 VCRx   irq vectors
12  * e71-e72 DRCR   dma selection
13  * e80-e83 WDT    watchdog timer
14  * e91     SBYCR  standby control
15  * e92     CCR    cache control
16  * ee0     ICR    irq control
17  * ee2     IPRA   irq priorities
18  * ee4     VCRWDT WDT irq vectors
19  * f00-f17 DIVU
20  * f40-f7b UBC   user break controller
21  * f80-fb3 DMAC
22  * fe0-ffb BSC   bus state controller
23  */
24
25 #include "../pico_int.h"
26 #include "../memory.h"
27
28 // DMAC handling
29 struct dma_chan {
30   unsigned int sar, dar;  // src, dst addr
31   unsigned int tcr;       // transfer count
32   unsigned int chcr;      // chan ctl
33   // -- dm dm sm sm  ts ts ar am  al ds dl tb  ta ie te de
34   // ts - transfer size: 1, 2, 4, 16 bytes
35   // ar - auto request if 1, else dreq signal
36   // ie - irq enable
37   // te - transfer end
38   // de - dma enable
39   #define DMA_AR (1 << 9)
40   #define DMA_IE (1 << 2)
41   #define DMA_TE (1 << 1)
42   #define DMA_DE (1 << 0)
43 };
44
45 struct dmac {
46   struct dma_chan chan[2];
47   unsigned int vcrdma0;
48   unsigned int unknown0;
49   unsigned int vcrdma1;
50   unsigned int unknown1;
51   unsigned int dmaor;
52   // -- pr ae nmif dme
53   // pr - priority: chan0 > chan1 or round-robin
54   // ae - address error
55   // nmif - nmi occurred
56   // dme - DMA master enable
57   #define DMA_DME  (1 << 0)
58 };
59
60 static void dmac_te_irq(SH2 *sh2, struct dma_chan *chan)
61 {
62   char *regs = (void *)sh2->peri_regs;
63   struct dmac *dmac = (void *)(regs + 0x180);
64   int level = PREG8(regs, 0xe2) & 0x0f; // IPRA
65   int vector = (chan == &dmac->chan[0]) ?
66                dmac->vcrdma0 : dmac->vcrdma1;
67
68   elprintf(EL_32XP, "dmac irq %d %d", level, vector);
69   sh2_internal_irq(sh2, level, vector & 0x7f);
70 }
71
72 static void dmac_transfer_complete(SH2 *sh2, struct dma_chan *chan)
73 {
74   chan->chcr |= DMA_TE; // DMA has ended normally
75
76   p32x_sh2_poll_event(sh2, SH2_STATE_SLEEP, SekCyclesDoneT());
77   if (chan->chcr & DMA_IE)
78     dmac_te_irq(sh2, chan);
79 }
80
81 static void dmac_transfer_one(SH2 *sh2, struct dma_chan *chan)
82 {
83   u32 size, d;
84
85   size = (chan->chcr >> 10) & 3;
86   switch (size) {
87   case 0:
88     d = p32x_sh2_read8(chan->sar, sh2);
89     p32x_sh2_write8(chan->dar, d, sh2);
90   case 1:
91     d = p32x_sh2_read16(chan->sar, sh2);
92     p32x_sh2_write16(chan->dar, d, sh2);
93     break;
94   case 2:
95     d = p32x_sh2_read32(chan->sar, sh2);
96     p32x_sh2_write32(chan->dar, d, sh2);
97     break;
98   case 3:
99     d = p32x_sh2_read32(chan->sar + 0x00, sh2);
100     p32x_sh2_write32(chan->dar + 0x00, d, sh2);
101     d = p32x_sh2_read32(chan->sar + 0x04, sh2);
102     p32x_sh2_write32(chan->dar + 0x04, d, sh2);
103     d = p32x_sh2_read32(chan->sar + 0x08, sh2);
104     p32x_sh2_write32(chan->dar + 0x08, d, sh2);
105     d = p32x_sh2_read32(chan->sar + 0x0c, sh2);
106     p32x_sh2_write32(chan->dar + 0x0c, d, sh2);
107     chan->sar += 16; // always?
108     if (chan->chcr & (1 << 15))
109       chan->dar -= 16;
110     if (chan->chcr & (1 << 14))
111       chan->dar += 16;
112     chan->tcr -= 4;
113     return;
114   }
115   chan->tcr--;
116
117   size = 1 << size;
118   if (chan->chcr & (1 << 15))
119     chan->dar -= size;
120   if (chan->chcr & (1 << 14))
121     chan->dar += size;
122   if (chan->chcr & (1 << 13))
123     chan->sar -= size;
124   if (chan->chcr & (1 << 12))
125     chan->sar += size;
126 }
127
128 // DMA trigger by SH2 register write
129 static void dmac_trigger(SH2 *sh2, struct dma_chan *chan)
130 {
131   elprintf(EL_32XP, "sh2 DMA %08x->%08x, cnt %d, chcr %04x @%06x",
132     chan->sar, chan->dar, chan->tcr, chan->chcr, sh2->pc);
133   chan->tcr &= 0xffffff;
134
135   if (chan->chcr & DMA_AR) {
136     // auto-request transfer
137     while ((int)chan->tcr > 0)
138       dmac_transfer_one(sh2, chan);
139     dmac_transfer_complete(sh2, chan);
140     return;
141   }
142
143   // DREQ0 is only sent after first 4 words are written.
144   // we do multiple of 4 words to avoid messing up alignment
145   if (chan->sar == 0x20004012) {
146     if (Pico32x.dmac0_fifo_ptr && (Pico32x.dmac0_fifo_ptr & 3) == 0) {
147       elprintf(EL_32XP, "68k -> sh2 DMA");
148       p32x_dreq0_trigger();
149     }
150     return;
151   }
152
153   elprintf(EL_32XP|EL_ANOMALY, "unhandled DMA: "
154     "%08x->%08x, cnt %d, chcr %04x @%06x",
155     chan->sar, chan->dar, chan->tcr, chan->chcr, sh2->pc);
156 }
157
158 // timer state - FIXME
159 static int timer_cycles[2];
160 static int timer_tick_cycles[2];
161
162 // timers
163 void p32x_timers_recalc(void)
164 {
165   int cycles;
166   int tmp, i;
167
168   // SH2 timer step
169   for (i = 0; i < 2; i++) {
170     tmp = PREG8(sh2s[i].peri_regs, 0x80) & 7;
171     // Sclk cycles per timer tick
172     if (tmp)
173       cycles = 0x20 << tmp;
174     else
175       cycles = 2;
176     timer_tick_cycles[i] = cycles;
177     timer_cycles[i] = 0;
178     elprintf(EL_32XP, "WDT cycles[%d] = %d", i, cycles);
179   }
180 }
181
182 void p32x_timers_do(unsigned int m68k_slice)
183 {
184   unsigned int cycles = m68k_slice * 3;
185   int cnt, i;
186
187   // WDT timers
188   for (i = 0; i < 2; i++) {
189     void *pregs = sh2s[i].peri_regs;
190     if (PREG8(pregs, 0x80) & 0x20) { // TME
191       timer_cycles[i] += cycles;
192       cnt = PREG8(pregs, 0x81);
193       while (timer_cycles[i] >= timer_tick_cycles[i]) {
194         timer_cycles[i] -= timer_tick_cycles[i];
195         cnt++;
196       }
197       if (cnt >= 0x100) {
198         int level = PREG8(pregs, 0xe3) >> 4;
199         int vector = PREG8(pregs, 0xe4) & 0x7f;
200         elprintf(EL_32XP, "%csh2 WDT irq (%d, %d)",
201           i ? 's' : 'm', level, vector);
202         sh2_internal_irq(&sh2s[i], level, vector);
203         cnt &= 0xff;
204       }
205       PREG8(pregs, 0x81) = cnt;
206     }
207   }
208 }
209
210 // ------------------------------------------------------------------
211 // SH2 internal peripheral memhandlers
212 // we keep them in little endian format
213
214 u32 sh2_peripheral_read8(u32 a, SH2 *sh2)
215 {
216   u8 *r = (void *)sh2->peri_regs;
217   u32 d;
218
219   a &= 0x1ff;
220   d = PREG8(r, a);
221
222   elprintf(EL_32XP, "%csh2 peri r8  [%08x]       %02x @%06x",
223     sh2->is_slave ? 's' : 'm', a | ~0x1ff, d, sh2_pc(sh2));
224   return d;
225 }
226
227 u32 sh2_peripheral_read16(u32 a, SH2 *sh2)
228 {
229   u16 *r = (void *)sh2->peri_regs;
230   u32 d;
231
232   a &= 0x1ff;
233   d = r[(a / 2) ^ 1];
234
235   elprintf(EL_32XP, "%csh2 peri r16 [%08x]     %04x @%06x",
236     sh2->is_slave ? 's' : 'm', a | ~0x1ff, d, sh2_pc(sh2));
237   return d;
238 }
239
240 u32 sh2_peripheral_read32(u32 a, SH2 *sh2)
241 {
242   u32 d;
243   a &= 0x1fc;
244   d = sh2->peri_regs[a / 4];
245
246   elprintf(EL_32XP, "%csh2 peri r32 [%08x] %08x @%06x",
247     sh2->is_slave ? 's' : 'm', a | ~0x1ff, d, sh2_pc(sh2));
248   return d;
249 }
250
251 void REGPARM(3) sh2_peripheral_write8(u32 a, u32 d, SH2 *sh2)
252 {
253   u8 *r = (void *)sh2->peri_regs;
254   elprintf(EL_32XP, "%csh2 peri w8  [%08x]       %02x @%06x",
255     sh2->is_slave ? 's' : 'm', a, d, sh2_pc(sh2));
256
257   a &= 0x1ff;
258   PREG8(r, a) = d;
259
260   // X-men SCI hack
261   if ((a == 2 &&  (d & 0x20)) || // transmiter enabled
262       (a == 4 && !(d & 0x80))) { // valid data in TDR
263     void *oregs = sh2->other_sh2->peri_regs;
264     if ((PREG8(oregs, 2) & 0x50) == 0x50) { // receiver + irq enabled
265       int level = PREG8(oregs, 0x60) >> 4;
266       int vector = PREG8(oregs, 0x63) & 0x7f;
267       elprintf(EL_32XP, "%csh2 SCI recv irq (%d, %d)",
268         (sh2->is_slave ^ 1) ? 's' : 'm', level, vector);
269       sh2_internal_irq(sh2->other_sh2, level, vector);
270       return;
271     }
272   }
273 }
274
275 void REGPARM(3) sh2_peripheral_write16(u32 a, u32 d, SH2 *sh2)
276 {
277   u16 *r = (void *)sh2->peri_regs;
278   elprintf(EL_32XP, "%csh2 peri w16 [%08x]     %04x @%06x",
279     sh2->is_slave ? 's' : 'm', a, d, sh2_pc(sh2));
280
281   a &= 0x1ff;
282
283   // evil WDT
284   if (a == 0x80) {
285     if ((d & 0xff00) == 0xa500) { // WTCSR
286       PREG8(r, 0x80) = d;
287       p32x_timers_recalc();
288     }
289     if ((d & 0xff00) == 0x5a00) // WTCNT
290       PREG8(r, 0x81) = d;
291     return;
292   }
293
294   r[(a / 2) ^ 1] = d;
295 }
296
297 void sh2_peripheral_write32(u32 a, u32 d, SH2 *sh2)
298 {
299   u32 *r = sh2->peri_regs;
300   elprintf(EL_32XP, "%csh2 peri w32 [%08x] %08x @%06x",
301     sh2->is_slave ? 's' : 'm', a, d, sh2_pc(sh2));
302
303   a &= 0x1fc;
304   r[a / 4] = d;
305
306   switch (a) {
307     // division unit (TODO: verify):
308     case 0x104: // DVDNT: divident L, starts divide
309       elprintf(EL_32XP, "%csh2 divide %08x / %08x",
310         sh2->is_slave ? 's' : 'm', d, r[0x100 / 4]);
311       if (r[0x100 / 4]) {
312         signed int divisor = r[0x100 / 4];
313                        r[0x118 / 4] = r[0x110 / 4] = (signed int)d % divisor;
314         r[0x104 / 4] = r[0x11c / 4] = r[0x114 / 4] = (signed int)d / divisor;
315       }
316       else
317         r[0x110 / 4] = r[0x114 / 4] = r[0x118 / 4] = r[0x11c / 4] = 0; // ?
318       break;
319     case 0x114:
320       elprintf(EL_32XP, "%csh2 divide %08x%08x / %08x @%08x",
321         sh2->is_slave ? 's' : 'm', r[0x110 / 4], d, r[0x100 / 4], sh2_pc(sh2));
322       if (r[0x100 / 4]) {
323         signed long long divident = (signed long long)r[0x110 / 4] << 32 | d;
324         signed int divisor = r[0x100 / 4];
325         // XXX: undocumented mirroring to 0x118,0x11c?
326         r[0x118 / 4] = r[0x110 / 4] = divident % divisor;
327         divident /= divisor;
328         r[0x11c / 4] = r[0x114 / 4] = divident;
329         divident >>= 31;
330         if ((unsigned long long)divident + 1 > 1) {
331           //elprintf(EL_32XP, "%csh2 divide overflow! @%08x",
332           //  sh2->is_slave ? 's' : 'm', sh2_pc(sh2));
333           r[0x11c / 4] = r[0x114 / 4] = divident > 0 ? 0x7fffffff : 0x80000000; // overflow
334         }
335       }
336       else
337         r[0x110 / 4] = r[0x114 / 4] = r[0x118 / 4] = r[0x11c / 4] = 0; // ?
338       break;
339   }
340
341   // perhaps starting a DMA?
342   if (a == 0x1b0 || a == 0x18c || a == 0x19c) {
343     struct dmac *dmac = (void *)&sh2->peri_regs[0x180 / 4];
344     if (!(dmac->dmaor & DMA_DME))
345       return;
346
347     if ((dmac->chan[0].chcr & (DMA_TE|DMA_DE)) == DMA_DE)
348       dmac_trigger(sh2, &dmac->chan[0]);
349     if ((dmac->chan[1].chcr & (DMA_TE|DMA_DE)) == DMA_DE)
350       dmac_trigger(sh2, &dmac->chan[1]);
351   }
352 }
353
354 /* 32X specific */
355 static void dreq0_do(SH2 *sh2, struct dma_chan *chan)
356 {
357   unsigned short *dreqlen = &Pico32x.regs[0x10 / 2];
358   int i;
359
360   // debug/sanity checks
361   if (chan->tcr != *dreqlen)
362     elprintf(EL_32XP|EL_ANOMALY, "dreq0: tcr0 and len differ: %d != %d",
363       chan->tcr, *dreqlen);
364   // note: DACK is not connected, single addr mode should not be used
365   if ((chan->chcr & 0x3f08) != 0x0400)
366     elprintf(EL_32XP|EL_ANOMALY, "dreq0: bad control: %04x", chan->chcr);
367   if (chan->sar != 0x20004012)
368     elprintf(EL_32XP|EL_ANOMALY, "dreq0: bad sar?: %08x\n", chan->sar);
369
370   // HACK: assume bus is busy and SH2 is halted
371   sh2->state |= SH2_STATE_SLEEP;
372
373   for (i = 0; i < Pico32x.dmac0_fifo_ptr && chan->tcr > 0; i++) {
374     elprintf(EL_32XP, "dmaw [%08x] %04x, left %d",
375       chan->dar, Pico32x.dmac_fifo[i], *dreqlen);
376     p32x_sh2_write16(chan->dar, Pico32x.dmac_fifo[i], sh2);
377     chan->dar += 2;
378     chan->tcr--;
379     (*dreqlen)--;
380   }
381
382   if (Pico32x.dmac0_fifo_ptr != i)
383     memmove(Pico32x.dmac_fifo, &Pico32x.dmac_fifo[i],
384       (Pico32x.dmac0_fifo_ptr - i) * 2);
385   Pico32x.dmac0_fifo_ptr -= i;
386
387   Pico32x.regs[6 / 2] &= ~P32XS_FULL;
388   if (*dreqlen == 0)
389     Pico32x.regs[6 / 2] &= ~P32XS_68S; // transfer complete
390   if (chan->tcr == 0)
391     dmac_transfer_complete(sh2, chan);
392   else
393     sh2_end_run(sh2, 16);
394 }
395
396 static void dreq1_do(SH2 *sh2, struct dma_chan *chan)
397 {
398   // debug/sanity checks
399   if ((chan->chcr & 0xc308) != 0x0000)
400     elprintf(EL_32XP|EL_ANOMALY, "dreq1: bad control: %04x", chan->chcr);
401   if ((chan->dar & ~0xf) != 0x20004030)
402     elprintf(EL_32XP|EL_ANOMALY, "dreq1: bad dar?: %08x\n", chan->dar);
403
404   dmac_transfer_one(sh2, chan);
405   if (chan->tcr == 0)
406     dmac_transfer_complete(sh2, chan);
407 }
408
409 void p32x_dreq0_trigger(void)
410 {
411   struct dmac *mdmac = (void *)&msh2.peri_regs[0x180 / 4];
412   struct dmac *sdmac = (void *)&ssh2.peri_regs[0x180 / 4];
413
414   elprintf(EL_32XP, "dreq0_trigger");
415   if ((mdmac->dmaor & DMA_DME) && (mdmac->chan[0].chcr & 3) == DMA_DE) {
416     dreq0_do(&msh2, &mdmac->chan[0]);
417   }
418   if ((sdmac->dmaor & DMA_DME) && (sdmac->chan[0].chcr & 3) == DMA_DE) {
419     dreq0_do(&ssh2, &sdmac->chan[0]);
420   }
421 }
422
423 void p32x_dreq1_trigger(void)
424 {
425   struct dmac *mdmac = (void *)&msh2.peri_regs[0x180 / 4];
426   struct dmac *sdmac = (void *)&ssh2.peri_regs[0x180 / 4];
427   int hit = 0;
428
429   elprintf(EL_32XP, "dreq1_trigger");
430   if ((mdmac->dmaor & DMA_DME) && (mdmac->chan[1].chcr & 3) == DMA_DE) {
431     dreq1_do(&msh2, &mdmac->chan[1]);
432     hit = 1;
433   }
434   if ((sdmac->dmaor & DMA_DME) && (sdmac->chan[1].chcr & 3) == DMA_DE) {
435     dreq1_do(&ssh2, &sdmac->chan[1]);
436     hit = 1;
437   }
438
439   if (!hit)
440     elprintf(EL_32XP|EL_ANOMALY, "dreq1: nobody cared");
441 }
442
443 // vim:shiftwidth=2:ts=2:expandtab