32x: fix lockstep code
[picodrive.git] / pico / 32x / 32x.c
1 /*
2  * PicoDrive
3  * (C) notaz, 2009,2010
4  *
5  * This work is licensed under the terms of MAME license.
6  * See COPYING file in the top-level directory.
7  */
8 #include "../pico_int.h"
9 #include "../sound/ym2612.h"
10
11 struct Pico32x Pico32x;
12 SH2 sh2s[2];
13
14 static int REGPARM(2) sh2_irq_cb(SH2 *sh2, int level)
15 {
16   if (sh2->pending_irl > sh2->pending_int_irq) {
17     elprintf(EL_32X, "%csh2 ack/irl %d @ %08x",
18       sh2->is_slave ? 's' : 'm', level, sh2->pc);
19     return 64 + sh2->pending_irl / 2;
20   } else {
21     elprintf(EL_32X, "%csh2 ack/int %d/%d @ %08x",
22       sh2->is_slave ? 's' : 'm', level, sh2->pending_int_vector, sh2->pc);
23     sh2->pending_int_irq = 0; // auto-clear
24     sh2->pending_level = sh2->pending_irl;
25     return sh2->pending_int_vector;
26   }
27 }
28
29 void p32x_update_irls(int nested_call)
30 {
31   int irqs, mlvl = 0, slvl = 0;
32
33   // msh2
34   irqs = (Pico32x.sh2irqs | Pico32x.sh2irqi[0]) & ((Pico32x.sh2irq_mask[0] << 3) | P32XI_VRES);
35   while ((irqs >>= 1))
36     mlvl++;
37   mlvl *= 2;
38
39   // ssh2
40   irqs = (Pico32x.sh2irqs | Pico32x.sh2irqi[1]) & ((Pico32x.sh2irq_mask[1] << 3) | P32XI_VRES);
41   while ((irqs >>= 1))
42     slvl++;
43   slvl *= 2;
44
45   elprintf(EL_32X, "update_irls: m %d, s %d", mlvl, slvl);
46   sh2_irl_irq(&msh2, mlvl, nested_call);
47   sh2_irl_irq(&ssh2, slvl, nested_call);
48   mlvl = mlvl ? 1 : 0;
49   slvl = slvl ? 1 : 0;
50   p32x_poll_event(mlvl | (slvl << 1), 0);
51 }
52
53 void Pico32xStartup(void)
54 {
55   elprintf(EL_STATUS|EL_32X, "32X startup");
56
57   // TODO: OOM handling
58   PicoAHW |= PAHW_32X;
59   sh2_init(&msh2, 0);
60   msh2.irq_callback = sh2_irq_cb;
61   sh2_init(&ssh2, 1);
62   ssh2.irq_callback = sh2_irq_cb;
63
64   PicoMemSetup32x();
65
66   if (!Pico.m.pal)
67     Pico32x.vdp_regs[0] |= P32XV_nPAL;
68
69   PREG8(Pico32xMem->sh2_peri_regs[0], 4) =
70   PREG8(Pico32xMem->sh2_peri_regs[1], 4) = 0x84; // SCI SSR
71
72   rendstatus_old = -1;
73
74   emu_32x_startup();
75 }
76
77 #define HWSWAP(x) (((x) << 16) | ((x) >> 16))
78 void p32x_reset_sh2s(void)
79 {
80   elprintf(EL_32X, "sh2 reset");
81
82   sh2_reset(&msh2);
83   sh2_reset(&ssh2);
84
85   // if we don't have BIOS set, perform it's work here.
86   // MSH2
87   if (p32x_bios_m == NULL) {
88     unsigned int idl_src, idl_dst, idl_size; // initial data load
89     unsigned int vbr;
90
91     // initial data
92     idl_src = HWSWAP(*(unsigned int *)(Pico.rom + 0x3d4)) & ~0xf0000000;
93     idl_dst = HWSWAP(*(unsigned int *)(Pico.rom + 0x3d8)) & ~0xf0000000;
94     idl_size= HWSWAP(*(unsigned int *)(Pico.rom + 0x3dc));
95     if (idl_size > Pico.romsize || idl_src + idl_size > Pico.romsize ||
96         idl_size > 0x40000 || idl_dst + idl_size > 0x40000 || (idl_src & 3) || (idl_dst & 3)) {
97       elprintf(EL_STATUS|EL_ANOMALY, "32x: invalid initial data ptrs: %06x -> %06x, %06x",
98         idl_src, idl_dst, idl_size);
99     }
100     else
101       memcpy(Pico32xMem->sdram + idl_dst, Pico.rom + idl_src, idl_size);
102
103     // GBR/VBR
104     vbr = HWSWAP(*(unsigned int *)(Pico.rom + 0x3e8));
105     sh2_set_gbr(0, 0x20004000);
106     sh2_set_vbr(0, vbr);
107
108     // checksum and M_OK
109     Pico32x.regs[0x28 / 2] = *(unsigned short *)(Pico.rom + 0x18e);
110     // program will set M_OK
111   }
112
113   // SSH2
114   if (p32x_bios_s == NULL) {
115     unsigned int vbr;
116
117     // GBR/VBR
118     vbr = HWSWAP(*(unsigned int *)(Pico.rom + 0x3ec));
119     sh2_set_gbr(1, 0x20004000);
120     sh2_set_vbr(1, vbr);
121     // program will set S_OK
122   }
123 }
124
125 void Pico32xInit(void)
126 {
127 }
128
129 void PicoPower32x(void)
130 {
131   memset(&Pico32x, 0, sizeof(Pico32x));
132
133   Pico32x.regs[0] = P32XS_REN|P32XS_nRES; // verified
134   Pico32x.vdp_regs[0x0a/2] = P32XV_VBLK|P32XV_HBLK|P32XV_PEN;
135   Pico32x.sh2_regs[0] = P32XS2_ADEN;
136 }
137
138 void PicoUnload32x(void)
139 {
140   if (Pico32xMem != NULL)
141     plat_munmap(Pico32xMem, sizeof(*Pico32xMem));
142   Pico32xMem = NULL;
143   sh2_finish(&msh2);
144   sh2_finish(&ssh2);
145
146   PicoAHW &= ~PAHW_32X;
147 }
148
149 void PicoReset32x(void)
150 {
151   if (PicoAHW & PAHW_32X) {
152     Pico32x.sh2irqs |= P32XI_VRES;
153     p32x_update_irls(0);
154     p32x_poll_event(3, 0);
155   }
156 }
157
158 static void p32x_start_blank(void)
159 {
160   if (Pico32xDrawMode != PDM32X_OFF && !PicoSkipFrame) {
161     int offs, lines;
162
163     pprof_start(draw);
164
165     offs = 8; lines = 224;
166     if ((Pico.video.reg[1] & 8) && !(PicoOpt & POPT_ALT_RENDERER)) {
167       offs = 0;
168       lines = 240;
169     }
170
171     // XXX: no proper handling of 32col mode..
172     if ((Pico32x.vdp_regs[0] & P32XV_Mx) != 0 && // 32x not blanking
173         (Pico.video.reg[12] & 1) && // 40col mode
174         (PicoDrawMask & PDRAW_32X_ON))
175     {
176       int md_bg = Pico.video.reg[7] & 0x3f;
177
178       // we draw full layer (not line-by-line)
179       PicoDraw32xLayer(offs, lines, md_bg);
180     }
181     else if (Pico32xDrawMode != PDM32X_32X_ONLY)
182       PicoDraw32xLayerMdOnly(offs, lines);
183
184     pprof_end(draw);
185   }
186
187   // enter vblank
188   Pico32x.vdp_regs[0x0a/2] |= P32XV_VBLK|P32XV_PEN;
189
190   // FB swap waits until vblank
191   if ((Pico32x.vdp_regs[0x0a/2] ^ Pico32x.pending_fb) & P32XV_FS) {
192     Pico32x.vdp_regs[0x0a/2] &= ~P32XV_FS;
193     Pico32x.vdp_regs[0x0a/2] |= Pico32x.pending_fb;
194     Pico32xSwapDRAM(Pico32x.pending_fb ^ 1);
195   }
196
197   Pico32x.sh2irqs |= P32XI_VINT;
198   p32x_update_irls(0);
199   p32x_poll_event(3, 1);
200 }
201
202 static __inline void run_m68k(int cyc)
203 {
204   pprof_start(m68k);
205
206 p32x_poll_event(3, 0);
207 #if defined(EMU_C68K)
208   PicoCpuCM68k.cycles = cyc;
209   CycloneRun(&PicoCpuCM68k);
210   SekCycleCnt += cyc - PicoCpuCM68k.cycles;
211 #elif defined(EMU_M68K)
212   SekCycleCnt += m68k_execute(cyc);
213 #elif defined(EMU_F68K)
214   SekCycleCnt += fm68k_emulate(cyc+1, 0, 0);
215 #endif
216
217   pprof_end(m68k);
218 }
219
220 // ~1463.8, but due to cache misses and slow mem
221 // it's much lower than that
222 //#define SH2_LINE_CYCLES 735
223 #define CYCLES_M68K2MSH2(x) (((x) * p32x_msh2_multiplier) >> 10)
224 #define CYCLES_M68K2SSH2(x) (((x) * p32x_ssh2_multiplier) >> 10)
225
226 #define PICO_32X
227 #define CPUS_RUN_SIMPLE(m68k_cycles,s68k_cycles) \
228 { \
229   int slice; \
230   SekCycleAim += m68k_cycles; \
231   while (SekCycleCnt < SekCycleAim) { \
232     slice = SekCycleCnt; \
233     run_m68k(SekCycleAim - SekCycleCnt); \
234     if (!(Pico32x.regs[0] & P32XS_nRES)) \
235       continue; /* SH2s reseting */ \
236     slice = SekCycleCnt - slice; /* real count from 68k */ \
237     if (SekCycleCnt < SekCycleAim) \
238       elprintf(EL_32X, "slice %d", slice); \
239     if (!(Pico32x.emu_flags & (P32XF_SSH2POLL|P32XF_SSH2VPOLL))) { \
240       pprof_start(ssh2); \
241       sh2_execute(&ssh2, CYCLES_M68K2SSH2(slice)); \
242       pprof_end(ssh2); \
243     } \
244     if (!(Pico32x.emu_flags & (P32XF_MSH2POLL|P32XF_MSH2VPOLL))) { \
245       pprof_start(msh2); \
246       sh2_execute(&msh2, CYCLES_M68K2MSH2(slice)); \
247       pprof_end(msh2); \
248     } \
249     pprof_start(dummy); \
250     pprof_end(dummy); \
251   } \
252 }
253
254 #define STEP_68K 24
255 #define CPUS_RUN_LOCKSTEP(m68k_cycles,s68k_cycles) \
256 { \
257   int slice; \
258   SekCycleAim += m68k_cycles; \
259   while (SekCycleCnt < SekCycleAim) { \
260     slice = SekCycleCnt; \
261     run_m68k(STEP_68K); \
262     if (!(Pico32x.regs[0] & P32XS_nRES)) \
263       continue; /* SH2s reseting */ \
264     slice = SekCycleCnt - slice; /* real count from 68k */ \
265     if (!(Pico32x.emu_flags & (P32XF_SSH2POLL|P32XF_SSH2VPOLL))) { \
266       sh2_execute(&ssh2, CYCLES_M68K2SSH2(slice)); \
267     } \
268     if (!(Pico32x.emu_flags & (P32XF_MSH2POLL|P32XF_MSH2VPOLL))) { \
269       sh2_execute(&msh2, CYCLES_M68K2MSH2(slice)); \
270     } \
271   } \
272 }
273
274 #define CPUS_RUN CPUS_RUN_SIMPLE
275 //#define CPUS_RUN CPUS_RUN_LOCKSTEP
276
277 #include "../pico_cmn.c"
278
279 void PicoFrame32x(void)
280 {
281   pwm_frame_smp_cnt = 0;
282
283   Pico32x.vdp_regs[0x0a/2] &= ~P32XV_VBLK; // get out of vblank
284   if ((Pico32x.vdp_regs[0] & P32XV_Mx) != 0) // no forced blanking
285     Pico32x.vdp_regs[0x0a/2] &= ~P32XV_PEN; // no palette access
286
287   p32x_poll_event(3, 1);
288
289   PicoFrameStart();
290   PicoFrameHints();
291   elprintf(EL_32X, "poll: %02x", Pico32x.emu_flags);
292 }
293