new z80 scheduling method, timers are still wip
[picodrive.git] / platform / gp2x / 940ctl.c
1 // Code for communication with ARM940 and control of it.\r
2 // (c) Copyright 2007, Grazvydas "notaz" Ignotas\r
3 \r
4 #include <stdio.h>\r
5 #include <stdlib.h>\r
6 #include <string.h>\r
7 #include <unistd.h>\r
8 #include <sys/mman.h>\r
9 #include <sys/ioctl.h>\r
10 #include <fcntl.h>\r
11 #include <errno.h>\r
12 \r
13 #include "code940/940shared.h"\r
14 #include "gp2x.h"\r
15 #include "emu.h"\r
16 #include "menu.h"\r
17 #include "../common/mp3.h"\r
18 #include "../common/arm_utils.h"\r
19 #include "../common/menu.h"\r
20 #include "../common/emu.h"\r
21 #include "../../Pico/PicoInt.h"\r
22 #include "../../Pico/sound/ym2612.h"\r
23 #include "../../Pico/sound/mix.h"\r
24 \r
25 /* we will need some gp2x internals here */\r
26 extern volatile unsigned short *gp2x_memregs; /* from minimal library rlyeh */\r
27 extern volatile unsigned long  *gp2x_memregl;\r
28 \r
29 extern int reset_timing;\r
30 static unsigned char *shared_mem = 0;\r
31 static _940_data_t *shared_data = 0;\r
32 _940_ctl_t *shared_ctl = 0;\r
33 unsigned char *mp3_mem = 0;\r
34 \r
35 #define MP3_SIZE_MAX (0x400000 + 0x800000) // 12M\r
36 #define CODE940_FILE "pico940_v2.bin"\r
37 \r
38 int crashed_940 = 0;\r
39 \r
40 static FILE *loaded_mp3 = 0;\r
41 \r
42 /***********************************************************/\r
43 \r
44 #define MAXOUT          (+32767)\r
45 #define MINOUT          (-32768)\r
46 \r
47 /* limitter */\r
48 #define Limit(val, max,min) { \\r
49         if ( val > max )      val = max; \\r
50         else if ( val < min ) val = min; \\r
51 }\r
52 \r
53 /* these will be managed locally on our side */\r
54 static UINT8 ST_address;        /* address register     */\r
55 static INT32 addr_A1;           /* address line A1      */\r
56 \r
57 static int   writebuff_ptr = 0;\r
58 \r
59 \r
60 /* YM2612 write */\r
61 /* a = address */\r
62 /* v = value   */\r
63 /* returns 1 if sample affecting state changed */\r
64 int YM2612Write_940(unsigned int a, unsigned int v, int scanline)\r
65 {\r
66         int upd = 1;    /* the write affects sample generation */\r
67 \r
68         a &= 3;\r
69 \r
70         //printf("%05i:%03i: ym w ([%i] %02x)\n", Pico.m.frame_count, Pico.m.scanline, a, v);\r
71 \r
72         switch (a) {\r
73                 case 0: /* address port 0 */\r
74                         if (addr_A1 == 0 && ST_address == v)\r
75                                 return 0; /* address already selected, don't send this command to 940 */\r
76                         ST_address = v;\r
77                         addr_A1 = 0;\r
78                         /* don't send DAC or timer related address changes to 940 */\r
79                         if (v == 0x24 || v == 0x25 || v == 0x26 || v == 0x2a)\r
80                                 return 0;\r
81                         upd = 0;\r
82                         break;\r
83 \r
84                 case 1: /* data port 0    */\r
85                         if (ST_address == 0x2b) upd = 0; /* DAC sel */\r
86                         break;\r
87 \r
88                 case 2: /* address port 1 */\r
89                         if (addr_A1 == 1 && ST_address == v)\r
90                                 return 0;\r
91                         ST_address = v;\r
92                         addr_A1 = 1;\r
93                         upd = 0;\r
94                         break;\r
95         }\r
96 \r
97         //printf("ym pass\n");\r
98 \r
99         if (currentConfig.EmuOpt & 4)\r
100         {\r
101                 UINT16 *writebuff = shared_ctl->writebuffsel ? shared_ctl->writebuff0 : shared_ctl->writebuff1;\r
102 \r
103                 /* detect rapid ym updates */\r
104                 if (upd && !(writebuff_ptr & 0x80000000) && scanline < 224)\r
105                 {\r
106                         int mid = Pico.m.pal ? 68 : 93;\r
107                         if (scanline > mid) {\r
108                                 //printf("%05i:%03i: rapid ym\n", Pico.m.frame_count, scanline);\r
109                                 writebuff[writebuff_ptr++ & 0xffff] = 0xfffe;\r
110                                 writebuff_ptr |= 0x80000000;\r
111                                 //printf("%05i:%03i: ym w ([%02x] %02x, upd=%i)\n", Pico.m.frame_count, scanline, addr, v, upd);\r
112                         }\r
113                 }\r
114 \r
115                 /* queue this write for 940 */\r
116                 if ((writebuff_ptr&0xffff) < 2047) {\r
117                         writebuff[writebuff_ptr++ & 0xffff] = (a<<8)|v;\r
118                 } else {\r
119                         printf("warning: writebuff_ptr > 2047 ([%i] %02x)\n", a, v);\r
120                 }\r
121         }\r
122 \r
123         return 0; // cause the engine to do updates once per frame only\r
124 }\r
125 \r
126 \r
127 #define CHECK_BUSY(job) \\r
128         (gp2x_memregs[0x3b46>>1] & (1<<(job-1)))\r
129 \r
130 static void wait_busy_940(int job)\r
131 {\r
132         int i;\r
133 \r
134         job--;\r
135         for (i = 0; (gp2x_memregs[0x3b46>>1] & (1<<job)) && i < 0x10000; i++)\r
136                 spend_cycles(8*1024); // tested to be best for mp3 dec\r
137         if (i < 0x10000) return;\r
138 \r
139         /* 940 crashed */\r
140         printf("940 crashed (cnt: %i, ve: ", shared_ctl->loopc);\r
141         for (i = 0; i < 8; i++)\r
142                 printf("%i ", shared_ctl->vstarts[i]);\r
143         printf(")\n");\r
144         printf("irq pending flags: DUALCPU %04x, SRCPND %08lx (see 26), INTPND %08lx\n",\r
145                 gp2x_memregs[0x3b46>>1], gp2x_memregl[0x4500>>2], gp2x_memregl[0x4510>>2]);\r
146         printf("last lr: %08x, lastjob: %i\n", shared_ctl->last_lr, shared_ctl->lastjob);\r
147         printf("trying to interrupt..\n");\r
148         gp2x_memregs[0x3B3E>>1] = 0xffff;\r
149         for (i = 0; gp2x_memregs[0x3b46>>1] && i < 0x10000; i++)\r
150                 spend_cycles(8*1024);\r
151         printf("i = 0x%x\n", i);\r
152         printf("irq pending flags: DUALCPU %04x, SRCPND %08lx (see 26), INTPND %08lx\n",\r
153                 gp2x_memregs[0x3b46>>1], gp2x_memregl[0x4500>>2], gp2x_memregl[0x4510>>2]);\r
154         printf("last lr: %08x, lastjob: %i\n", shared_ctl->last_lr, shared_ctl->lastjob);\r
155 \r
156         strcpy(menuErrorMsg, "940 crashed, too much overclock?");\r
157         engineState = PGS_Menu;\r
158         crashed_940 = 1;\r
159 }\r
160 \r
161 \r
162 static void add_job_940(int job)\r
163 {\r
164         if (job <= 0 || job > 16) {\r
165                 printf("add_job_940: bad job: %i\n", job);\r
166                 return;\r
167         }\r
168 \r
169         // generate interrupt for this job\r
170         job--;\r
171         gp2x_memregs[(0x3B20+job*2)>>1] = 1;\r
172 \r
173 //      printf("added %i, pending %04x\n", job+1, gp2x_memregs[0x3b46>>1]);\r
174 }\r
175 \r
176 \r
177 void YM2612PicoStateLoad_940(void)\r
178 {\r
179         UINT8 *REGS = YM2612GetRegs();\r
180 \r
181         int i;\r
182 \r
183         /* make sure JOB940_PICOSTATELOAD gets done before next JOB940_YM2612UPDATEONE */\r
184         add_job_940(JOB940_PICOSTATELOAD);\r
185         if (CHECK_BUSY(JOB940_PICOSTATELOAD)) wait_busy_940(JOB940_PICOSTATELOAD);\r
186 \r
187         writebuff_ptr = 0;\r
188 \r
189         // feed all the registers and update internal state\r
190         for(i = 0; i < 0x100; i++) {\r
191                 YM2612Write_940(0, i, -1);\r
192                 YM2612Write_940(1, REGS[i], -1);\r
193         }\r
194         for(i = 0; i < 0x100; i++) {\r
195                 YM2612Write_940(2, i, -1);\r
196                 YM2612Write_940(3, REGS[i|0x100], -1);\r
197         }\r
198 \r
199         addr_A1 = *(INT32 *) (REGS + 0x200);\r
200 }\r
201 \r
202 \r
203 static void internal_reset(void)\r
204 {\r
205         writebuff_ptr = 0;\r
206         ST_address = addr_A1 = -1;\r
207 }\r
208 \r
209 \r
210 /* this must be called after mmu hack, the allocated regions must not get cached */\r
211 void sharedmem_init(void)\r
212 {\r
213         if (shared_mem != NULL) return;\r
214 \r
215         shared_mem = (unsigned char *) mmap(0, 0x210000, PROT_READ|PROT_WRITE, MAP_SHARED, memdev, 0x2000000);\r
216         if(shared_mem == MAP_FAILED)\r
217         {\r
218                 printf("mmap(shared_data) failed with %i\n", errno);\r
219                 exit(1);\r
220         }\r
221         shared_data = (_940_data_t *) (shared_mem+0x100000);\r
222         /* this area must not get buffered on either side */\r
223         shared_ctl =  (_940_ctl_t *)  (shared_mem+0x200000);\r
224         mp3_mem = (unsigned char *) mmap(0, MP3_SIZE_MAX, PROT_READ|PROT_WRITE, MAP_SHARED, memdev, 0x2400000);\r
225         if (mp3_mem == MAP_FAILED)\r
226         {\r
227                 printf("mmap(mp3_mem) failed with %i\n", errno);\r
228                 exit(1);\r
229         }\r
230         crashed_940 = 1;\r
231 }\r
232 \r
233 \r
234 void sharedmem_deinit(void)\r
235 {\r
236         munmap(shared_mem, 0x210000);\r
237         munmap(mp3_mem, MP3_SIZE_MAX);\r
238         shared_mem = mp3_mem = NULL;\r
239         shared_data = NULL;\r
240         shared_ctl = NULL;\r
241 }\r
242 \r
243 \r
244 extern char **g_argv;\r
245 \r
246 /* none of the functions in this file should be called before this one */\r
247 void YM2612Init_940(int baseclock, int rate)\r
248 {\r
249         printf("YM2612Init_940()\n");\r
250         printf("Mem usage: shared_data: %i, shared_ctl: %i\n", sizeof(*shared_data), sizeof(*shared_ctl));\r
251 \r
252         Reset940(1, 2);\r
253         Pause940(1);\r
254 \r
255         gp2x_memregs[0x3B40>>1] = 0;      // disable DUALCPU interrupts for 920\r
256         gp2x_memregs[0x3B42>>1] = 1;      // enable  DUALCPU interrupts for 940\r
257 \r
258         gp2x_memregl[0x4504>>2] = 0;        // make sure no FIQs will be generated\r
259         gp2x_memregl[0x4508>>2] = ~(1<<26); // unmask DUALCPU ints in the undocumented 940's interrupt controller\r
260 \r
261 \r
262         if (crashed_940)\r
263         {\r
264                 unsigned char ucData[1024];\r
265                 int nRead, i, nLen = 0;\r
266                 char binpath[1024];\r
267                 FILE *fp;\r
268 \r
269                 strncpy(binpath, g_argv[0], 1023);\r
270                 binpath[1023] = 0;\r
271                 for (i = strlen(binpath); i > 0; i--)\r
272                         if (binpath[i] == '/') { binpath[i] = 0; break; }\r
273                 strcat(binpath, "/" CODE940_FILE);\r
274 \r
275                 fp = fopen(binpath, "rb");\r
276                 if(!fp)\r
277                 {\r
278                         memset(gp2x_screen, 0, 320*240*2);\r
279                         text_out16(10, 100, "failed to open required file:");\r
280                         text_out16(10, 110, CODE940_FILE);\r
281                         gp2x_video_flip2();\r
282                         printf("failed to open %s\n", binpath);\r
283                         exit(1);\r
284                 }\r
285 \r
286                 while(1)\r
287                 {\r
288                         nRead = fread(ucData, 1, 1024, fp);\r
289                         if(nRead <= 0)\r
290                                 break;\r
291                         memcpy(shared_mem + nLen, ucData, nRead);\r
292                         nLen += nRead;\r
293                 }\r
294                 fclose(fp);\r
295                 crashed_940 = 0;\r
296         }\r
297 \r
298         memset(shared_data, 0, sizeof(*shared_data));\r
299         memset(shared_ctl,  0, sizeof(*shared_ctl));\r
300 \r
301         /* cause local ym2612 to init REGS */\r
302         YM2612Init_(baseclock, rate);\r
303 \r
304         internal_reset();\r
305 \r
306         loaded_mp3 = 0;\r
307 \r
308         gp2x_memregs[0x3B46>>1] = 0xffff; // clear pending DUALCPU interrupts for 940\r
309         gp2x_memregl[0x4500>>2] = 0xffffffff; // clear pending IRQs in SRCPND\r
310         gp2x_memregl[0x4510>>2] = 0xffffffff; // clear pending IRQs in INTPND\r
311 \r
312         /* start the 940 */\r
313         Reset940(0, 2);\r
314         Pause940(0);\r
315 \r
316         // YM2612ResetChip_940(); // will be done on JOB940_YM2612INIT\r
317 \r
318         /* now cause 940 to init it's ym2612 stuff */\r
319         shared_ctl->baseclock = baseclock;\r
320         shared_ctl->rate = rate;\r
321         add_job_940(JOB940_INITALL);\r
322 }\r
323 \r
324 \r
325 void YM2612ResetChip_940(void)\r
326 {\r
327         //printf("YM2612ResetChip_940()\n");\r
328         if (shared_data == NULL) {\r
329                 printf("YM2612ResetChip_940: reset before init?\n");\r
330                 return;\r
331         }\r
332 \r
333         YM2612ResetChip_();\r
334         internal_reset();\r
335 \r
336         add_job_940(JOB940_YM2612RESETCHIP);\r
337 }\r
338 \r
339 \r
340 int YM2612UpdateOne_940(int *buffer, int length, int stereo, int is_buf_empty)\r
341 {\r
342         int *ym_buf = shared_data->ym_buffer;\r
343         int ym_active_chs;\r
344 \r
345         //printf("YM2612UpdateOne_940()\n");\r
346 \r
347         if (CHECK_BUSY(JOB940_YM2612UPDATEONE)) wait_busy_940(JOB940_YM2612UPDATEONE);\r
348 \r
349         ym_active_chs = shared_ctl->ym_active_chs;\r
350 \r
351         // mix in ym buffer. is_buf_empty means nobody mixed there anything yet and it may contain trash\r
352         if (is_buf_empty && ym_active_chs) memcpy32(buffer, ym_buf, length<<stereo);\r
353         else memset32(buffer, 0, length<<stereo);\r
354 \r
355         if (shared_ctl->writebuffsel == 1) {\r
356                 shared_ctl->writebuff0[writebuff_ptr & 0xffff] = 0xffff;\r
357         } else {\r
358                 shared_ctl->writebuff1[writebuff_ptr & 0xffff] = 0xffff;\r
359         }\r
360         writebuff_ptr = 0;\r
361 \r
362         /* predict sample counter for next frame */\r
363         if (PsndLen_exc_add) {\r
364                 if (PsndLen_exc_cnt + PsndLen_exc_add >= 0x10000) length = PsndLen + 1;\r
365                 else length = PsndLen;\r
366         }\r
367 \r
368         /* give 940 ym job */\r
369         shared_ctl->writebuffsel ^= 1;\r
370         shared_ctl->length = length;\r
371         shared_ctl->stereo = stereo;\r
372 \r
373         add_job_940(JOB940_YM2612UPDATEONE);\r
374 \r
375         return ym_active_chs;\r
376 }\r
377 \r
378 \r
379 static int mp3_samples_ready = 0, mp3_buffer_offs = 0;\r
380 static int mp3_play_bufsel = 0, mp3_job_started = 0;\r
381 \r
382 void mp3_update(int *buffer, int length, int stereo)\r
383 {\r
384         int length_mp3;\r
385         int cdda_on;\r
386 \r
387         // playback was started, track not ended\r
388         cdda_on = loaded_mp3 && shared_ctl->mp3_offs < shared_ctl->mp3_len;\r
389 \r
390         if (!cdda_on) return;\r
391 \r
392         if (!(PicoOpt&0x200)) {\r
393                 mp3_update_local(buffer, length, stereo);\r
394                 return;\r
395         }\r
396 \r
397         length_mp3 = length;\r
398         if (PsndRate == 22050) length_mp3 <<= 1;        // mp3s are locked to 44100Hz stereo\r
399         else if (PsndRate == 11025) length_mp3 <<= 2;   // so make length 44100ish\r
400 \r
401         /* do we have to wait? */\r
402         if (mp3_job_started && mp3_samples_ready < length_mp3) {\r
403                 if (CHECK_BUSY(JOB940_MP3DECODE)) wait_busy_940(JOB940_MP3DECODE);\r
404                 mp3_job_started = 0;\r
405                 mp3_samples_ready += 1152;\r
406         }\r
407 \r
408         /* mix mp3 data, only stereo */\r
409         if (mp3_samples_ready >= length_mp3)\r
410         {\r
411                 int shr = 0;\r
412                 void (*mix_samples)(int *dest_buf, short *mp3_buf, int count) = mix_16h_to_32;\r
413                 if (PsndRate == 22050) { mix_samples = mix_16h_to_32_s1; shr = 1; }\r
414                 else if (PsndRate == 11025) { mix_samples = mix_16h_to_32_s2; shr = 2; }\r
415 \r
416                 if (1152 - mp3_buffer_offs >= length_mp3) {\r
417                         mix_samples(buffer, shared_data->mp3_buffer[mp3_play_bufsel] + mp3_buffer_offs*2, length<<1);\r
418 \r
419                         mp3_buffer_offs += length_mp3;\r
420                 } else {\r
421                         // collect samples from both buffers..\r
422                         int left = 1152 - mp3_buffer_offs;\r
423                         if (mp3_play_bufsel == 0)\r
424                         {\r
425                                 mix_samples(buffer, shared_data->mp3_buffer[0] + mp3_buffer_offs*2, length<<1);\r
426                                 mp3_buffer_offs = length_mp3 - left;\r
427                                 mp3_play_bufsel = 1;\r
428                         } else {\r
429                                 mix_samples(buffer, shared_data->mp3_buffer[1] + mp3_buffer_offs*2, (left>>shr)<<1);\r
430                                 mp3_buffer_offs = length_mp3 - left;\r
431                                 mix_samples(buffer + ((left>>shr)<<1),\r
432                                         shared_data->mp3_buffer[0], (mp3_buffer_offs>>shr)<<1);\r
433                                 mp3_play_bufsel = 0;\r
434                         }\r
435                 }\r
436                 mp3_samples_ready -= length_mp3;\r
437         }\r
438 \r
439         // ask to decode more if we already can\r
440         if (!mp3_job_started)\r
441         {\r
442                 mp3_job_started = 1;\r
443                 shared_ctl->mp3_buffsel ^= 1;\r
444                 add_job_940(JOB940_MP3DECODE);\r
445         }\r
446 }\r
447 \r
448 \r
449 /***********************************************************/\r
450 \r
451 void mp3_start_play(FILE *f, int pos) // pos is 0-1023\r
452 {\r
453         int byte_offs = 0;\r
454 \r
455         if (!(PicoOpt&0x800)) { // cdda disabled?\r
456                 return;\r
457         }\r
458 \r
459         if (loaded_mp3 != f)\r
460         {\r
461                 if (PicoMessage != NULL)\r
462                 {\r
463                         fseek(f, 0, SEEK_END);\r
464                         if (ftell(f) > 2*1024*1024)\r
465                                 PicoMessage("Loading MP3...");\r
466                 }\r
467                 fseek(f, 0, SEEK_SET);\r
468                 fread(mp3_mem, 1, MP3_SIZE_MAX, f);\r
469                 if (!feof(f)) printf("Warning: mp3 was too large, not all data loaded.\n");\r
470                 shared_ctl->mp3_len = ftell(f);\r
471                 loaded_mp3 = f;\r
472 \r
473                 if (PicoOpt&0x200) {\r
474                         // as we are going to change 940's cacheable area, we must invalidate it's cache..\r
475                         if (CHECK_BUSY(JOB940_MP3DECODE)) wait_busy_940(JOB940_MP3DECODE);\r
476                         add_job_940(JOB940_INVALIDATE_DCACHE);\r
477                 }\r
478                 reset_timing = 1;\r
479         }\r
480 \r
481         // seek..\r
482         if (pos) {\r
483                 byte_offs  = (shared_ctl->mp3_len << 6) >> 10;\r
484                 byte_offs *= pos;\r
485                 byte_offs >>= 6;\r
486         }\r
487         // printf("mp3 pos1024: %i, byte_offs %i/%i\n", pos, byte_offs, shared_ctl->mp3_len);\r
488 \r
489         shared_ctl->mp3_offs = byte_offs;\r
490 \r
491         // reset buffer pointers and stuff..\r
492         mp3_samples_ready = mp3_buffer_offs = mp3_play_bufsel = 0;\r
493         mp3_job_started = 0;\r
494         shared_ctl->mp3_buffsel = 1; // will change to 0 on first decode\r
495 \r
496         if (!(PicoOpt&0x200)) mp3_start_local();\r
497 }\r
498 \r
499 \r
500 int mp3_get_offset(void)\r
501 {\r
502         unsigned int offs1024 = 0;\r
503         int cdda_on;\r
504 \r
505         cdda_on = (PicoAHW & PAHW_MCD) && (PicoOpt&0x800) && !(Pico_mcd->s68k_regs[0x36] & 1) &&\r
506                         (Pico_mcd->scd.Status_CDC & 1) && loaded_mp3;\r
507 \r
508         if (cdda_on) {\r
509                 offs1024  = shared_ctl->mp3_offs << 7;\r
510                 offs1024 /= shared_ctl->mp3_len  >> 3;\r
511         }\r
512         printf("offs1024=%u (%i/%i)\n", offs1024, shared_ctl->mp3_offs, shared_ctl->mp3_len);\r
513 \r
514         return offs1024;\r
515 }\r
516 \r
517 \r