make forced_exit work regardless of loader name
[ginge.git] / loader / emu.c
1 /*
2  * GINGE - GINGE Is Not Gp2x Emulator
3  * (C) notaz, 2010-2011
4  *
5  * This work is licensed under the MAME license, see COPYING file for details.
6  */
7 // a "gentle" reminder
8 #ifdef __ARM_EABI__
9 #error loader is meant to be OABI!
10 #endif
11 #include <stdio.h>
12 #include <stdlib.h>
13 #include <string.h>
14 #include <alloca.h>
15 #include <ctype.h>
16 #include <sys/types.h>
17 #include <sys/stat.h>
18 #include <fcntl.h>
19 #include <sys/mman.h>
20 #include <sys/types.h>
21 #include <unistd.h>
22 #include <signal.h>
23 #include <asm/ucontext.h>
24 #include <pthread.h>
25 #include <errno.h>
26 #include <time.h>
27 #include <sys/resource.h>
28 #include <sys/ioctl.h>
29 #include <linux/soundcard.h>
30 #include <linux/fb.h>
31
32 #include "header.h"
33 #include "../common/host_fb.h"
34 #include "../common/cmn.h"
35 #include "sys_cacheflush.h"
36 #include "realfuncs.h"
37
38 #if (DBG & 2) && !(DBG & 4)
39 #define LOG_IO_UNK
40 #endif
41 #if (DBG & 4)
42 #define LOG_IO
43 #endif
44 //#define LOG_SEGV
45
46 #ifdef LOG_IO
47 #define iolog log_io
48 #else
49 #define iolog(...)
50 #endif
51
52 #ifdef LOG_IO_UNK
53 #define iolog_unh log_io
54 #else
55 #define iolog_unh(...)
56 #endif
57
58 #ifdef LOG_SEGV
59 #define segvlog printf
60 #else
61 #define segvlog(...)
62 #endif
63
64 #if defined(LOG_IO) || defined(LOG_IO_UNK)
65 #include "mmsp2-regs.h"
66 #endif
67
68 typedef unsigned long long u64;
69 typedef unsigned int   u32;
70 typedef unsigned short u16;
71 typedef unsigned char  u8;
72
73 static pthread_mutex_t fb_mutex = PTHREAD_MUTEX_INITIALIZER;
74 static pthread_cond_t fb_cond = PTHREAD_COND_INITIALIZER;
75
76 static struct {
77   u32 dstctrl;
78   u32 dstaddr;
79   u32 dststride;
80   u32 srcctrl;
81   u32 srcaddr;          //
82   u32 srcstride;
83   u32 srcforcolor;
84   u32 srcbackcolor;
85   u32 patctrl;          //
86   u32 patforcolor;
87   u32 patbackcolor;
88   u32 size;
89   u32 ctrl;             //
90   u32 run;
91   u32 intc;
92   u32 srcfifo;
93 } blitter;
94
95 #define SRCCTRL_INVIDEO         (1 << 8)
96 #define SRCCTRL_SRCENB          (1 << 7)
97 #define CTRL_TRANSPARENCYENB    (1 << 11)
98
99 static struct {
100   // mmsp2
101   u16 mlc_stl_cntl;
102   union {
103     u32 mlc_stl_adr; // mlcaddress for pollux
104     struct {
105       u16 mlc_stl_adrl;
106       u16 mlc_stl_adrh;
107     };
108   };
109   u16 mlc_stl_pallt_a;
110   union {
111     u16 mlc_stl_pallt_d[256*2];
112     u32 mlc_stl_pallt_d32[256];
113   };
114
115   // pollux
116   u32 mlccontrol;
117   u16 mlcpalette[256];
118
119   // state
120   void *umem;
121   u32 old_mlc_stl_adr;
122   u32 btn_state; // as seen through /dev/GPIO: 0PVdVu YXBA RLSeSt 0Ri0Dn 0Le0Up
123   struct {
124     u32 width, height;
125     u32 stride;
126     u32 bpp;
127     u32 dirty_pal:2;
128   } v;
129 } mmsp2;
130 #define pollux mmsp2 // so that code doesn't look that weird
131 enum {
132   DIRTY_PAL_MMSP2 = 1,
133   DIRTY_PAL_POLLUX = 2,
134 };
135
136
137 #if defined(LOG_IO) || defined(LOG_IO_UNK)
138 static void log_io(const char *pfx, u32 a, u32 d, int size)
139 {
140   const char *fmt, *reg = "";
141   switch (size) {
142   case  8: fmt = "%s %08x       %02x %s\n"; d &= 0xff; break;
143   case 32: fmt = "%s %08x %08x %s\n";       break;
144   default: fmt = "%s %08x     %04x %s\n";   d &= 0xffff; break;
145   }
146
147   if ((a & ~0xffff) == 0x7f000000)
148     reg = regnames[a & 0xffff];
149
150   printf(fmt, pfx, a, d, reg);
151 }
152 #endif
153
154 static void memset16(void *dst, u32 pattern, int count)
155 {
156   u32 *dl;
157   u16 *d;
158   
159   d = (u16 *)((long)dst & ~1);
160   if ((long)d & 2) {
161     *d++ = pattern;
162     count--;
163   }
164   dl = (void *)d;
165   pattern |= pattern << 16;
166
167   while (count >= 2) {
168     *dl++ = pattern;
169     count -= 2;
170   }
171   if (count)
172     *(u16 *)dl = pattern;
173 }
174
175 static void blt_tr(void *dst, void *src, u32 trc, int w)
176 {
177   u16 *d = (u16 *)((long)dst & ~1);
178   u16 *s = (u16 *)((long)src & ~1);
179
180   // XXX: optimize
181   for (; w > 0; d++, s++, w--)
182     if (*s != trc)
183       *d = *s;
184 }
185
186 #define dump_blitter() \
187 { \
188   u32 *r = &blitter.dstctrl; \
189   int i; \
190   for (i = 0; i < 4*4; i++, r++) { \
191     printf("%08x ", *r); \
192     if ((i & 3) == 3) \
193       printf("\n"); \
194   } \
195 }
196
197 static void *uppermem_lookup(u32 addr, u8 **mem_end)
198 {
199   // XXX: maybe support mirroring?
200   if ((addr & 0xfe000000) != 0x02000000)
201     return NULL;
202
203   *mem_end = (u8 *)mmsp2.umem + 0x02000000;
204   return (u8 *)mmsp2.umem - 0x02000000 + addr;
205 }
206
207 static void blitter_do(void)
208 {
209   u8 *dst, *dste, *src = NULL, *srce = NULL;
210   int w, h, sstrd, dstrd;
211   int to_screen = 0;
212   u32 bpp, addr;
213
214   w = blitter.size & 0x7ff;
215   h = (blitter.size >> 16) & 0x7ff;
216   sstrd = blitter.srcstride;
217   dstrd = blitter.dststride;
218
219   // XXX: need to confirm this..
220   addr = (blitter.dstaddr & ~3) | ((blitter.dstctrl & 0x1f) >> 3);
221
222   // use dst bpp.. How does it do blits with different src bpp?
223   bpp = (blitter.dstctrl & 0x20) ? 16 : 8;
224
225   // maybe the screen?
226   if (((w == 320 && h == 240) || // blit whole screen
227        (w * h >= 320*240/2)) &&  // ..or at least half of the area
228        mmsp2.mlc_stl_adr <= addr && addr < mmsp2.mlc_stl_adr + 320*240*2)
229     to_screen = 1;
230
231   dst = uppermem_lookup(addr, &dste);
232
233   // XXX: assume fill if no SRCENB, but it could be pattern blit..
234   if (blitter.srcctrl & SRCCTRL_SRCENB) {
235     if (!(blitter.srcctrl & SRCCTRL_INVIDEO))
236       goto bad_blit;
237
238     addr = (blitter.srcaddr & ~3) | ((blitter.srcctrl & 0x1f) >> 3);
239     src = uppermem_lookup(addr, &srce);
240     if (src == NULL)
241       goto bad_blit;
242
243     if (src + sstrd * h > srce) {
244       err("blit %08x->%08x %dx%d did not fit src\n",
245         blitter.srcaddr, blitter.dstaddr, w, h);
246       h = (srce - src) / sstrd;
247     }
248   }
249
250   if (dst == NULL)
251     goto bad_blit;
252
253   if (dst + dstrd * h > dste) {
254     err("blit %08x->%08x %dx%d did not fit dst\n",
255       blitter.srcaddr, blitter.dstaddr, w, h);
256     h = (dste - dst) / dstrd;
257   }
258
259   if (src != NULL) {
260     // copy
261     if (bpp == 16 && (blitter.ctrl & CTRL_TRANSPARENCYENB)) {
262       u32 trc = blitter.ctrl >> 16;
263       for (; h > 0; h--, dst += dstrd, src += sstrd)
264         blt_tr(dst, src, trc, w);
265     }
266     else {
267       for (; h > 0; h--, dst += dstrd, src += sstrd)
268         memcpy(dst, src, w * bpp / 8);
269     }
270   }
271   else {
272     // fill. Assume the pattern is cleared and bg color is used
273     u32 bgc = blitter.patbackcolor & 0xffff;
274     if (bpp == 16) {
275       for (; h > 0; h--, dst += dstrd)
276         memset16(dst, bgc, w);
277     }
278     else {
279       for (; h > 0; h--, dst += dstrd)
280         memset(dst, bgc, w); // bgc?
281     }
282   }
283
284   if (to_screen)
285     pthread_cond_signal(&fb_cond);
286   return;
287
288 bad_blit:
289   err("blit %08x->%08x %dx%d translated to %p->%p\n",
290     blitter.srcaddr, blitter.dstaddr, w, h, src, dst);
291   dump_blitter();
292 }
293
294 // FIXME: pass real dimensions to blitters
295 static void mlc_flip(void *src, int bpp, int stride)
296 {
297   static int old_bpp;
298
299   // only pass pal to host if it's dirty
300   if (bpp <= 8 && mmsp2.v.dirty_pal) {
301     if (mmsp2.v.dirty_pal == DIRTY_PAL_MMSP2)
302       host_video_update_pal32(mmsp2.mlc_stl_pallt_d32);
303     else
304       host_video_update_pal16(mmsp2.mlcpalette);
305     mmsp2.v.dirty_pal = 0;
306   }
307
308   if (bpp != old_bpp) {
309     host_video_change_bpp(bpp);
310     old_bpp = bpp;
311   }
312
313   switch (bpp) {
314   case  4:
315     host_video_blit4(src, 320, 240, stride);
316     break;
317
318   case  8:
319     host_video_blit8(src, 320, 240, stride);
320     break;
321
322   case 16:
323     host_video_blit16(src, 320, 240, stride);
324     break;
325
326   case 24:
327     // TODO
328     break;
329   }
330 }
331
332 #define ts_add_nsec(ts, ns) { \
333   ts.tv_nsec += ns; \
334   if (ts.tv_nsec >= 1000000000) { \
335     ts.tv_sec++; \
336     ts.tv_nsec -= 1000000000; \
337   } \
338 }
339
340 static int fb_sync_thread_paused;
341
342 static void *fb_sync_thread(void *arg)
343 {
344   int invalid_fb_addr = 1;
345   int manual_refresh = 0;
346   int frame_counter = 0;
347   struct timespec ts;
348   int ret, wait_ret;
349
350   //ret = pthread_setschedprio(pthread_self(), -1);
351   //log("pthread_setschedprio %d\n", ret);
352   //ret = setpriority(PRIO_PROCESS, 0, -1);
353   //log("setpriority %d\n", ret);
354
355   ret = clock_gettime(CLOCK_REALTIME, &ts);
356   if (ret != 0) {
357     perror(PFX "clock_gettime");
358     exit(1);
359   }
360
361   while (1) {
362     u8 *gp2x_fb, *gp2x_fb_end;
363
364     ret =  pthread_mutex_lock(&fb_mutex);
365     wait_ret = pthread_cond_timedwait(&fb_cond, &fb_mutex, &ts);
366     ret |= pthread_mutex_unlock(&fb_mutex);
367
368     if (ret != 0) {
369       err("fb_thread: mutex error: %d\n", ret);
370       sleep(1);
371       goto check_keys;
372     }
373     if (wait_ret != 0 && wait_ret != ETIMEDOUT) {
374       err("fb_thread: cond error: %d\n", wait_ret);
375       sleep(1);
376       goto check_keys;
377     }
378     if (fb_sync_thread_paused) {
379       ts_add_nsec(ts, 100000000);
380       goto check_keys;
381     }
382
383     if (wait_ret != ETIMEDOUT) {
384       clock_gettime(CLOCK_REALTIME, &ts);
385       ts_add_nsec(ts, 50000000);
386       manual_refresh++;
387       if (manual_refresh == 2)
388         dbg("fb_thread: switch to manual refresh\n");
389     } else {
390       ts_add_nsec(ts, 16666667);
391       if (manual_refresh > 1)
392         dbg("fb_thread: switch to auto refresh\n");
393       manual_refresh = 0;
394     }
395
396     gp2x_fb = uppermem_lookup(mmsp2.mlc_stl_adr, &gp2x_fb_end);
397     if (gp2x_fb == NULL || gp2x_fb + 320*240 * mmsp2.v.bpp / 8 > gp2x_fb_end) {
398       if (!invalid_fb_addr) {
399         err("fb_thread: %08x is out of range\n", mmsp2.mlc_stl_adr);
400         invalid_fb_addr = 1;
401       }
402       continue;
403     }
404
405     invalid_fb_addr = 0;
406     mlc_flip(gp2x_fb, mmsp2.v.bpp, mmsp2.v.stride);
407
408     frame_counter++;
409     if (frame_counter & 0x0f)
410       continue;
411
412 check_keys:
413     // this is to check for kill key, in case main thread hung
414     // or something else went wrong.
415     pollux.btn_state = host_read_btns();
416   }
417 }
418
419 static void fb_thread_pause(void)
420 {
421   fb_sync_thread_paused = 1;
422   // wait until it finishes last refresh
423   // that it might be doing now
424   usleep(10000);
425 }
426
427 static void fb_thread_resume(void)
428 {
429   fb_sync_thread_paused = 0;
430 }
431
432 static u32 xread32_io_cmn(u32 a, u32 *handled)
433 {
434   u32 d = 0;
435
436   *handled = 1;
437   switch (a) {
438   // Wiz stuff
439   case 0x402c: // MLCVSTRIDE0
440   case 0x4060: // MLCVSTRIDE1
441     d = pollux.v.stride;
442     break;
443   case 0x4038: // MLCADDRESS0
444   case 0x406c: // MLCADDRESS1
445     d = pollux.mlc_stl_adr;
446     break;
447   // wiz_lib reads:
448   //  ???? ???? YXBA DURiLe ???? VdVuMS LR?? ????
449   // |     GPIOC[31:16]    |    GPIOB[31:16]     |
450   case 0xa058: // GPIOBPAD
451     d =  (pollux.btn_state >> 1) & 0x0100;
452     d |= (pollux.btn_state << 1) & 0x0200;
453     d |= (pollux.btn_state >> 3) & 0x0080;
454     d |= (pollux.btn_state >> 5) & 0x0040;
455     d |= (pollux.btn_state >> 6) & 0x0c00;
456     d <<= 16;
457     d = ~d;
458     break;
459   case 0xa098: // GPIOCPAD
460     pollux.btn_state = host_read_btns();
461     d =  (pollux.btn_state >> 8) & 0x00f0;
462     d |= (pollux.btn_state >> 1) & 0x0008;
463     d |= (pollux.btn_state << 2) & 0x0004;
464     d |= (pollux.btn_state >> 5) & 0x0002;
465     d |= (pollux.btn_state >> 2) & 0x0001;
466     d <<= 16;
467     d = ~d;
468     break;
469   default:
470     *handled = 0;
471     break;
472   }
473
474   return d;
475 }
476
477 static u32 xread8(u32 a)
478 {
479   iolog("r8 ", a, 0, 8);
480   iolog_unh("r8 ", a, 0, 8);
481   return 0;
482 }
483
484 static u32 xread16(u32 a)
485 {
486   static u32 fudge, old_a;
487   u32 d = 0, t;
488
489   if ((a & 0xffff0000) == 0x7f000000) {
490     u32 a_ = a & 0xffff;
491     switch (a_) {
492     case 0x0910: // FPLL
493     case 0x0912:
494       d = 0x9407;
495       break;
496     // minilib reads as:
497     //  0000 P000 VuVd00 0000 YXBA RLSeSt 0Ri0D 0Le0U
498     // |        GPIOD        |GPIOC[8:15]|GPIOM[0:7] |
499     // /dev/GPIO:
500     //             ... 0PVdVu ...
501     case 0x1184: // GPIOC
502       d = ~mmsp2.btn_state & 0xff00;
503       d |= 0x00ff;
504       break;
505     case 0x1186: // GPIOD
506       t = ~mmsp2.btn_state;
507       d  = (t >> 9)  & 0x0080;
508       d |= (t >> 11) & 0x0040;
509       d |= (t >> 7)  & 0x0800;
510       d |= 0x373b;
511       break;
512     case 0x1198: // GPIOM
513       mmsp2.btn_state = host_read_btns();
514       d = ~mmsp2.btn_state & 0xff;
515       d |= 0x01aa;
516       break;
517     case 0x1836: // reserved
518       d = 0x2330;
519       break;
520     case 0x2816: // DPC_X_MAX
521       d = 319;
522       break;
523     case 0x2818: // DPC_Y_MAX
524       d = 239;
525       break;
526     case 0x28da:
527       d = mmsp2.mlc_stl_cntl;
528       break;
529     case 0x290e:
530     case 0x2912:
531       d = mmsp2.mlc_stl_adrl;
532       break;
533     case 0x2910:
534     case 0x2914:
535       d = mmsp2.mlc_stl_adrh;
536       break;
537     case 0x2958:
538       d = mmsp2.mlc_stl_pallt_a;
539       break;
540
541     default:
542       d = xread32_io_cmn(a_, &t);
543       if (!t)
544         goto unk;
545       if (!(a_ & 2))
546         d >>= 16;
547       break;
548     }
549     goto out;
550   }
551
552 unk:
553   if (a == old_a) {
554     d = fudge;
555     fudge = ~fudge;
556   }
557   old_a = a;
558   iolog_unh("r16", a, d & 0xffff, 16);
559
560 out:
561   d &= 0xffff;
562   iolog("r16", a, d, 16);
563   return d;
564 }
565
566 static u32 xread32(u32 a)
567 {
568   u32 d = 0;
569   if ((a & 0xfff00000) == 0x7f000000) {
570     u32 a_ = a & 0xffff;
571     struct timespec ts;
572     u64 t64;
573     u32 t;
574
575     switch (a_) {
576     case 0x0a00: // TCOUNT, 1/7372800s
577       clock_gettime(CLOCK_REALTIME, &ts);
578       t64 = (u64)ts.tv_sec * 1000000000 + ts.tv_nsec;
579       // t * 7372800.0 / 1000000000 * 0x100000000 ~= t * 31665935
580       t64 *= 31665935;
581       d = t64 >> 32;
582       break;
583
584     default:
585       d = xread32_io_cmn(a_, &t);
586       if (!t)
587         goto unh;
588       break;
589     }
590     goto out;
591   }
592   if ((a & 0xfff00000) == 0x7f100000) {
593     u32 *bl = &blitter.dstctrl;
594     u32 a_ = a & 0xfff;
595     if (a_ < 0x40) {
596       d = bl[a_ / 4];
597       if (a_ == 0x34)
598         d = 0; // not busy
599       goto out;
600     }
601   }
602
603 unh:
604   iolog_unh("r32", a, d, 32);
605
606 out:
607   iolog("r32", a, d, 32);
608   return d;
609 }
610
611 static void xwrite8(u32 a, u32 d)
612 {
613   iolog("w8 ", a, d, 8);
614   iolog_unh("w8 ", a, d, 8);
615 }
616
617 static void xwrite16(u32 a, u32 d)
618 {
619   iolog("w16", a, d, 16);
620   if ((a & 0xfff00000) == 0x7f000000) {
621     u32 a_ = a & 0xffff;
622     switch (a_) {
623       case 0x28da: {
624         int mode;
625         mmsp2.mlc_stl_cntl = d | 0xaa;
626         mode = (d >> 9) & 3;
627         mmsp2.v.bpp = mode ? mode * 8 : 4;
628         break;
629       }
630       case 0x290c:
631         mmsp2.v.stride = d;
632         return;
633       case 0x290e:
634       case 0x2910:
635         // odd addresses don't affect LCD. What about TV?
636         return;
637       case 0x2912:
638         mmsp2.mlc_stl_adrl = d;
639         return;
640       case 0x2914:
641         mmsp2.mlc_stl_adrh = d;
642         if (mmsp2.mlc_stl_adr != mmsp2.old_mlc_stl_adr)
643           // ask for refresh
644           pthread_cond_signal(&fb_cond);
645         mmsp2.old_mlc_stl_adr = mmsp2.mlc_stl_adr;
646         return;
647       case 0x2958:
648         mmsp2.mlc_stl_pallt_a = d & 0x1ff;
649         return;
650       case 0x295a:
651         mmsp2.mlc_stl_pallt_d[mmsp2.mlc_stl_pallt_a++] = d;
652         mmsp2.mlc_stl_pallt_a &= 0x1ff;
653         mmsp2.v.dirty_pal = DIRTY_PAL_MMSP2;
654         return;
655     }
656   }
657   iolog_unh("w16", a, d, 16);
658 }
659
660 static void xwrite32(u32 a, u32 d)
661 {
662   iolog("w32", a, d, 32);
663
664   if ((a & 0xfff00000) == 0x7f000000) {
665     u32 a_ = a & 0xffff;
666     switch (a_) {
667     // Wiz
668     case 0x4024: // MLCCONTROL0
669     case 0x4058: // MLCCONTROL1
670       pollux.mlccontrol = d;
671       if (!(d & 0x20))
672         return; // layer not enabled
673       if ((d >> 16) == 0x443A)
674         pollux.v.bpp = 8;
675       else
676         pollux.v.bpp = 16;
677       return;
678     case 0x402c: // MLCVSTRIDE0
679     case 0x4060: // MLCVSTRIDE1
680       pollux.v.stride = d;
681       return;
682     case 0x4038: // MLCADDRESS0
683     case 0x406c: // MLCADDRESS1
684       pollux.mlc_stl_adr = d;
685       if (d != mmsp2.old_mlc_stl_adr)
686         // ask for refresh
687         pthread_cond_signal(&fb_cond);
688       mmsp2.old_mlc_stl_adr = d;
689       return;
690     case 0x403c: // MLCPALETTE0
691     case 0x4070: // MLCPALETTE1
692       pollux.mlcpalette[d >> 24] = d;
693       pollux.v.dirty_pal = DIRTY_PAL_POLLUX;
694       return;
695     }
696   }
697   if ((a & 0xfff00000) == 0x7f100000) {
698     u32 *bl = &blitter.dstctrl;
699     u32 a_ = a & 0xfff;
700     if (a_ < 0x40) {
701       bl[a_ / 4] = d;
702       if (a_ == 0x34 && (d & 1))
703         blitter_do();
704       return;
705     }
706   }
707   iolog_unh("w32", a, d, 32);
708 }
709
710 #define LINKPAGE_SIZE 0x1000
711 #define LINKPAGE_COUNT 4
712 #define LINKPAGE_ALLOC (LINKPAGE_SIZE * LINKPAGE_COUNT)
713
714 struct op_context {
715   u32 pc;
716   u32 op;
717   u32 code[0];
718 };
719
720 struct op_linkpage {
721   void (*handler)(struct op_context *op_ctx);
722   u32 code[0];
723 };
724
725 struct op_stackframe {
726   u32 saved_regs[15];
727   u32 cpsr;
728 };
729
730 static struct op_linkpage *g_linkpage;
731 static u32 *g_code_ptr;
732 static int g_linkpage_count;
733
734 #define BIT_SET(v, b) (v & (1 << (b)))
735
736 void emu_handle_op(struct op_context *op_ctx, struct op_stackframe *sframe)
737 {
738   u32 *regs = sframe->saved_regs;
739   u32 op = op_ctx->op;
740   u32 t, shift, ret, addr;
741   int rn, rd;
742
743   rd = (op & 0x0000f000) >> 12;
744   rn = (op & 0x000f0000) >> 16;
745
746   if ((op & 0x0f200090) == 0x01000090) { // AM3: LDRH, STRH
747     if (!BIT_SET(op, 5)) // !H
748       goto unhandled;
749     if (BIT_SET(op, 6) && !BIT_SET(op, 20)) // S && !L
750       goto unhandled;
751
752     if (BIT_SET(op, 22))                // imm offset
753       t = ((op & 0xf00) >> 4) | (op & 0x0f);
754     else                                // reg offset
755       t = regs[op & 0x000f];
756
757     if (!BIT_SET(op, 23))
758       t = -t;
759     addr = regs[rn] + t;
760
761     if (BIT_SET(op, 20)) { // Load
762       ret = xread16(addr);
763       if (BIT_SET(op, 6)) { // S
764         ret <<= 16;
765         ret = (signed int)ret >> 16;
766       }
767       regs[rd] = ret;
768     }
769     else
770       xwrite16(addr, regs[rd]);
771   }
772   else if ((op & 0x0d200000) == 0x05000000) { // AM2: LDR[B], STR[B]
773     if (BIT_SET(op, 25)) {              // reg offs
774       if (BIT_SET(op, 4))
775         goto unhandled;
776
777       t = regs[op & 0x000f];
778       shift = (op & 0x0f80) >> 7;
779       switch ((op & 0x0060) >> 5) {
780         case 0: t = t << shift; break;
781         case 1: t = t >> (shift + 1); break;
782         case 2: t = (signed int)t >> (shift + 1); break;
783         case 3: goto unhandled; // I'm just lazy
784       }
785     }
786     else                                // imm offs
787       t = op & 0x0fff;
788
789     if (!BIT_SET(op, 23))
790       t = -t;
791     addr = regs[rn] + t;
792
793     if (BIT_SET(op, 20)) { // Load
794       if (BIT_SET(op, 22)) // Byte
795         ret = xread8(addr);
796       else
797         ret = xread32(addr);
798       regs[rd] = ret;
799     }
800     else {
801       if (BIT_SET(op, 22)) // Byte
802         xwrite8(addr, regs[rd]);
803       else
804         xwrite32(addr, regs[rd]);
805     }
806   }
807   else
808     goto unhandled;
809
810 #if 0
811   if (addr != addr_check) {
812     fprintf(stderr, "bad calculated addr: %08x vs %08x\n", addr, addr_check);
813     abort();
814   }
815 #endif
816   return;
817
818 unhandled:
819   err("unhandled IO op %08x @ %08x\n", op, op_ctx->pc);
820 }
821
822 static u32 make_offset12(u32 *pc, u32 *target)
823 {
824   int lp_offs, u = 1;
825
826   lp_offs = (char *)target - (char *)pc - 2*4;
827   if (lp_offs < 0) {
828     lp_offs = -lp_offs;
829     u = 0;
830   }
831   if (lp_offs >= LINKPAGE_SIZE) {
832     err("linkpage too far: %d\n", lp_offs);
833     abort();
834   }
835
836   return (u << 23) | lp_offs;
837 }
838
839 static u32 make_jmp(u32 *pc, u32 *target, int bl)
840 {
841   int jmp_val;
842
843   jmp_val = target - pc - 2;
844   if (jmp_val < (int)0xff000000 || jmp_val > 0x00ffffff) {
845     err("jump out of range (%p -> %p)\n", pc, target);
846     abort();
847   }
848
849   return 0xea000000 | (bl << 24) | (jmp_val & 0x00ffffff);
850 }
851
852 static void emit_op(u32 op)
853 {
854   *g_code_ptr++ = op;
855 }
856
857 static void emit_op_io(u32 op, u32 *target)
858 {
859   op |= make_offset12(g_code_ptr, target);
860   emit_op(op);
861 }
862
863 static void init_linkpage(void)
864 {
865   g_linkpage->handler = emu_call_handle_op;
866   g_code_ptr = g_linkpage->code;
867 }
868
869 static void segv_sigaction(int num, siginfo_t *info, void *ctx)
870 {
871   struct ucontext *context = ctx;
872   u32 *regs = (u32 *)&context->uc_mcontext.arm_r0;
873   u32 *pc = (u32 *)regs[15];
874   struct op_context *op_ctx;
875   int i, lp_size;
876
877   if (((regs[15] ^ (u32)&segv_sigaction) & 0xff000000) == 0 ||         // PC is in our segment or
878       (((regs[15] ^ (u32)g_linkpage) & ~(LINKPAGE_ALLOC - 1)) == 0) || // .. in linkpage
879       ((long)info->si_addr & 0xffe00000) != 0x7f000000)                // faulting not where expected
880   {
881     // real crash - time to die
882     err("segv %d %p @ %08x\n", info->si_code, info->si_addr, regs[15]);
883     for (i = 0; i < 8; i++)
884       dbg(" r%d=%08x r%2d=%08x\n", i, regs[i], i+8, regs[i+8]);
885     signal(num, SIG_DFL);
886     raise(num);
887     return;
888   }
889   segvlog("segv %d %p @ %08x\n", info->si_code, info->si_addr, regs[15]);
890
891   // spit PC and op
892   op_ctx = (void *)g_code_ptr;
893   op_ctx->pc = (u32)pc;
894   op_ctx->op = *pc;
895   g_code_ptr = &op_ctx->code[0];
896
897   // emit jump to code ptr
898   *pc = make_jmp(pc, g_code_ptr, 0);
899
900   // generate code:
901   emit_op   (0xe50d0000 + 0xf00 - 4 * 0);                        // str r0, [sp, #(-0xf00 + r0_offs)]
902   emit_op   (0xe50de000 + 0xf00 - 4 * 14);                       // str lr, [sp, #(-0xf00 + lr_offs)]
903   emit_op   (0xe24f0000 + (g_code_ptr - (u32 *)op_ctx + 2) * 4); // sub r0, pc, #op_ctx
904   emit_op   (0xe1a0e00f);                                        // mov lr, pc
905   emit_op_io(0xe51ff000, (u32 *)&g_linkpage->handler);           // ldr pc, =handle_op
906   emit_op   (0xe51de000 + 0xf00 - 4 * 14);                       // ldr lr, [sp, #(-0xf00 + lr_offs)]
907   emit_op   (make_jmp(g_code_ptr, pc + 1, 0));                   // jmp <back>
908
909   // sync caches
910   sys_cacheflush(pc, pc + 1);
911   sys_cacheflush(g_linkpage, g_code_ptr);
912
913   lp_size = (char *)g_code_ptr - (char *)g_linkpage;
914   segvlog("code #%d %d/%d\n", g_linkpage_count, lp_size, LINKPAGE_SIZE);
915
916   if (lp_size + 13*4 > LINKPAGE_SIZE) {
917     g_linkpage_count++;
918     if (g_linkpage_count >= LINKPAGE_COUNT) {
919       err("too many linkpages needed\n");
920       abort();
921     }
922     g_linkpage = (void *)((char *)g_linkpage + LINKPAGE_SIZE);
923     init_linkpage();
924   }
925   //handle_op(regs[15], op, regs, (u32)info->si_addr);
926   //regs[15] += 4;
927 }
928
929 void emu_init(void *map_bottom)
930 {
931   sigaction_t segv_action = {
932     .sa_sigaction = segv_sigaction,
933     .sa_flags = SA_SIGINFO,
934   };
935   pthread_t tid;
936   void *pret;
937   int ret;
938
939 #ifdef PND
940   if (geteuid() == 0) {
941     fprintf(stderr, "don't try to run as root, device registers or memory "
942                     "might get trashed crashing the OS or even damaging the device.\n");
943     exit(1);
944   }
945 #endif
946
947   g_linkpage = (void *)(((u32)map_bottom - LINKPAGE_ALLOC) & ~0xfff);
948   pret = mmap(g_linkpage, LINKPAGE_ALLOC, PROT_READ|PROT_WRITE,
949               MAP_PRIVATE|MAP_ANONYMOUS|MAP_FIXED, -1, 0);
950   if (pret != g_linkpage) {
951     perror(PFX "mmap linkpage");
952     exit(1);
953   }
954   log("linkpages @ %p\n", g_linkpage);
955   init_linkpage();
956
957   // host stuff
958   ret = host_init();
959   if (ret != 0) {
960     err("can't init host\n");
961     exit(1);
962   }
963
964   ret = host_video_init(NULL, 0);
965   if (ret != 0) {
966     err("can't init host video\n");
967     exit(1);
968   }
969
970   // TODO: check if this really fails on Wiz..
971   mmsp2.umem = mmap(NULL, 0x2000000, PROT_READ|PROT_WRITE|PROT_EXEC,
972                     MAP_PRIVATE|MAP_ANONYMOUS, -1, 0);
973 #ifdef WIZ
974   if (mmsp2.umem == MAP_FAILED) {
975     // we are short on memmory on Wiz, need special handling
976     extern void *host_mmap_upper(void);
977     mmsp2.umem = host_mmap_upper();
978   }
979 #endif
980   if (mmsp2.umem == MAP_FAILED) {
981     perror(PFX "mmap upper mem");
982     exit(1);
983   }
984
985   ret = pthread_create(&tid, NULL, fb_sync_thread, NULL);
986   if (ret != 0) {
987     err("failed to create fb_sync_thread: %d\n", ret);
988     exit(1);
989   }
990   pthread_detach(tid);
991
992   // defaults
993   mmsp2.mlc_stl_adr = 0x03101000; // fb2 is at 0x03381000
994   mmsp2.mlc_stl_cntl = 0x4ab; // 16bpp, region 1 active
995   mmsp2.v.width = 320;
996   mmsp2.v.height = 240;
997   mmsp2.v.stride = 320*2;
998   mmsp2.v.bpp = 16;
999   mmsp2.v.dirty_pal = 1;
1000
1001   sigemptyset(&segv_action.sa_mask);
1002   sigaction(SIGSEGV, &segv_action, NULL);
1003 }
1004
1005 int emu_read_gpiodev(void *buf, int count)
1006 {
1007   if (count <= 0) {
1008     err("gpiodev read %d?\n", count);
1009     return -1;
1010   }
1011   if (count > 4)
1012     count = 4;
1013
1014   mmsp2.btn_state = host_read_btns();
1015   memcpy(buf, &mmsp2.btn_state, count);
1016   return count;
1017 }
1018
1019 static void *emu_mmap_dev(unsigned int length, int prot, int flags, unsigned int offset)
1020 {
1021   u8 *umem, *umem_end;
1022
1023   // SoC regs
1024   if ((offset & ~0x1ffff) == 0xc0000000) {
1025     return mmap((void *)0x7f000000, length, PROT_NONE,
1026       MAP_PRIVATE|MAP_ANONYMOUS|MAP_FIXED|MAP_NORESERVE, -1, 0);
1027   }
1028   // MMSP2 blitter
1029   if ((offset & ~0xffff) == 0xe0020000) {
1030     return mmap((void *)0x7f100000, length, PROT_NONE,
1031       MAP_PRIVATE|MAP_ANONYMOUS|MAP_FIXED|MAP_NORESERVE, -1, 0);
1032   }
1033   // upper mem
1034   if ((offset & 0xfe000000) != 0x02000000) {
1035     err("unexpected devmem mmap @ %08x\n", offset);
1036     errno = EINVAL;
1037     return MAP_FAILED;
1038   }
1039
1040   umem = uppermem_lookup(offset, &umem_end);
1041   if (umem + length > umem_end)
1042     err("warning: uppermem @ %08x overflows by %d bytes\n",
1043         offset, umem + length - umem_end);
1044
1045   dbg("upper mem @ %08x %d\n", offset, length);
1046   return umem;
1047 }
1048
1049 void *emu_do_mmap(unsigned int length, int prot, int flags, int fd, unsigned int offset)
1050 {
1051   if (fd == FAKEDEV_MEM)
1052     return emu_mmap_dev(length, prot, flags, offset);
1053
1054   if (fd == FAKEDEV_FB0)
1055     return emu_mmap_dev(length, prot, flags, offset + 0x03101000);
1056
1057   if (fd == FAKEDEV_FB1)
1058     return emu_mmap_dev(length, prot, flags, offset + 0x03381000);
1059
1060   err("bad/ni mmap(?, %d, %x, %x, %d, %08x)\n", length, prot, flags, fd, offset);
1061   errno = EINVAL;
1062   return MAP_FAILED;
1063 }
1064
1065 static void emu_sound_open(int fd)
1066 {
1067 #ifdef PND
1068   int ret, frag;
1069
1070   // set default buffer size to 16 * 1K
1071   frag = (16<<16) | 10; // 16K
1072   ret = ioctl(fd, SNDCTL_DSP_SETFRAGMENT, &frag);
1073   if (ret != 0) {
1074     err("snd ioctl SETFRAGMENT %08x: ", frag);
1075     perror(NULL);
1076   }
1077 #endif
1078 }
1079
1080 static int emu_sound_ioctl(int fd, int request, void *argp)
1081 {
1082   int *arg = argp;
1083
1084 #if 0
1085   dbg("snd ioctl(%d, %08x, %p)", fd, request, argp);
1086   if (arg != NULL)
1087     dbg_c(" [%d]", *arg);
1088   dbg_c("\n");
1089 #endif
1090
1091   /* People set strange frag settings on GP2X, which even manage
1092    * to break audio on pandora (causes writes to fail).
1093    * Catch this and set to something that works. */
1094   switch(request) {
1095     case SNDCTL_DSP_SETFRAGMENT: {
1096       int ret, bsize, frag, frag_cnt;
1097       if (arg == NULL)
1098         break;
1099
1100       frag = *arg & 0xffff;
1101       frag_cnt = *arg >> 16;
1102       bsize = frag_cnt << frag;
1103       if (frag < 10 || bsize < 4096*4 || bsize > 4096*4*2) {
1104         /*
1105          * ~4ms. gpSP wants small buffers or else it stutters
1106          * because of it's audio thread sync stuff
1107          * XXX: hardcoding, as low samplerates will result in small fragment size,
1108          * which itself causes ALSA stall and hangs the program.
1109          * Also some apps change samplerate without reopening /dev/dsp,
1110          * which causes ALSA to reject SNDCTL_DSP_SETFRAGMENT.
1111          */
1112         bsize = 44100 / 250 * 4;
1113
1114         for (frag = 0; bsize; bsize >>= 1, frag++)
1115           ;
1116
1117         frag_cnt = 16;
1118       }
1119
1120       frag |= frag_cnt << 16;
1121       ret = ioctl(fd, SNDCTL_DSP_SETFRAGMENT, &frag);
1122       if (ret != 0) {
1123         err("snd ioctl SETFRAGMENT %08x: ", frag);
1124         perror(NULL);
1125       }
1126       // indicate success even if we fail (because of ALSA mostly),
1127       // things like MikMod will bail out otherwise.
1128       return 0;
1129     }
1130     case SNDCTL_DSP_SYNC:
1131       // Franxis tends to use sync/write loops, bad idea under ALSA
1132       return 0;
1133     default:
1134       break;
1135   }
1136
1137   return ioctl(fd, request, argp);
1138 }
1139
1140 int emu_do_ioctl(int fd, int request, void *argp)
1141 {
1142   if (fd == emu_interesting_fds[IFD_SOUND].fd)
1143     return emu_sound_ioctl(fd, request, argp);
1144
1145   switch (fd) {
1146   /* *********************** */
1147   case FAKEDEV_FB0:
1148   case FAKEDEV_FB1:
1149     if (argp == NULL)
1150       goto fail;
1151
1152     switch (request) {
1153       case FBIOGET_FSCREENINFO: {
1154         struct fb_fix_screeninfo *fix = argp;
1155
1156         memset(fix, 0, sizeof(*fix));
1157         strcpy(fix->id, "mmsp2_RGB0");
1158         fix->type         = FB_TYPE_PACKED_PIXELS;
1159         fix->accel        = FB_ACCEL_NONE;
1160         fix->visual       = FB_VISUAL_TRUECOLOR;
1161         fix->line_length  = 320*2;
1162         fix->smem_start   = (fd == FAKEDEV_FB0) ? 0x03101000 : 0x03381000;
1163         fix->smem_len     = 320*240*2;
1164         return 0;
1165       }
1166       case FBIOGET_VSCREENINFO: {
1167         struct fb_var_screeninfo *var = argp;
1168         static const struct fb_bitfield fbb_red   = { offset: 11, length: 5, };
1169         static const struct fb_bitfield fbb_green = { offset:  5, length: 6, };
1170         static const struct fb_bitfield fbb_blue  = { offset:  0, length: 5, };
1171
1172         memset(var, 0, sizeof(*var));
1173         var->activate     = FB_ACTIVATE_NOW;
1174         var->xres         =
1175         var->xres_virtual = 320;
1176         var->yres         =
1177         var->yres_virtual = 240;
1178         var->width        =
1179         var->height       = -1;
1180         var->vmode        = FB_VMODE_NONINTERLACED;
1181         var->bits_per_pixel = 16;
1182         var->red          = fbb_red;
1183         var->green        = fbb_green;
1184         var->blue         = fbb_blue;
1185         return 0;
1186       }
1187       case FBIOPUT_VSCREENINFO: {
1188         struct fb_var_screeninfo *var = argp;
1189         dbg(" put vscreen: %dx%d@%d\n", var->xres, var->yres, var->bits_per_pixel);
1190         if (var->xres != 320 || var->yres != 240 || var->bits_per_pixel != 16)
1191           return -1;
1192         return 0;
1193       }
1194     }
1195
1196   /* *********************** */
1197   case FAKEDEV_TTY0:
1198     // fake tty0 to make GPH SDL happy
1199     if (request == 0x4b46) // KDGKBENT
1200       return -1;
1201     return 0;
1202   }
1203
1204 fail:
1205   err("bad/ni ioctl(%d, %08x, %p)\n", fd, request, argp);
1206   errno = EINVAL;
1207   return -1;
1208 }
1209
1210 struct dev_fd_t emu_interesting_fds[] = {
1211   [IFD_SOUND] = { "/dev/dsp", -1, emu_sound_open },
1212   { NULL, 0, NULL },
1213 };
1214
1215 static const struct {
1216   const char *from;
1217   const char *to;
1218 } path_map[] = {
1219   { "/mnt/tmp", "./tmp" },
1220 };
1221
1222 static const char *wrap_path(const char *path)
1223 {
1224   char *buff, *p;
1225   size_t size;
1226   int i, len;
1227
1228   // do only path mapping for now
1229   for (i = 0; i < ARRAY_SIZE(path_map); i++) {
1230     p = strstr(path, path_map[i].from);
1231     if (p != NULL) {
1232       size = strlen(path) + strlen(path_map[i].to) + 1;
1233       buff = malloc(size);
1234       if (buff == NULL)
1235         break;
1236       len = p - path;
1237       strncpy(buff, path, len);
1238       snprintf(buff + len, size - len, "%s%s", path_map[i].to,
1239         path + len + strlen(path_map[i].from));
1240       dbg("mapped path \"%s\" -> \"%s\"\n", path, buff);
1241       return buff;
1242     }
1243   }
1244
1245   return path;
1246 }
1247
1248 static void wrap_path_free(const char *w_path, const char *old_path)
1249 {
1250   if (w_path != old_path)
1251     free((void *)w_path);
1252 }
1253
1254 void *emu_do_fopen(const char *path, const char *mode)
1255 {
1256   const char *w_path;
1257   FILE *ret;
1258
1259   w_path = wrap_path(path);
1260   ret = fopen(w_path, mode);
1261   wrap_path_free(w_path, path);
1262
1263   return ret;
1264 }
1265
1266 // FIXME: threads..
1267 int emu_do_system(const char *command)
1268 {
1269   static char tmp_path[512];
1270   int need_ginge = 0;
1271   const char *p2;
1272   char *p;
1273   int ret;
1274
1275   if (command == NULL)
1276     return -1;
1277
1278   for (p2 = command; *p2 && isspace(*p2); p2++)
1279     ;
1280
1281   if (*p2 == '.') // relative path?
1282     need_ginge = 1;
1283   else if (*p2 == '/' && strncmp(p2, "/bin", 4) && strncmp(p2, "/lib", 4)
1284            && strncmp(p2, "/sbin", 4) && strncmp(p2, "/usr", 4))
1285     // absolute path, but not a system command
1286     need_ginge = 1;
1287
1288   p2 = wrap_path(command);
1289   if (need_ginge) {
1290     make_local_path(tmp_path, sizeof(tmp_path), "ginge_prep");
1291     p = tmp_path + strlen(tmp_path);
1292
1293     snprintf(p, sizeof(tmp_path) - (p - tmp_path), " --nomenu %s", p2);
1294   }
1295   else
1296     snprintf(tmp_path, sizeof(tmp_path), "%s", p2);
1297   wrap_path_free(p2, command);
1298
1299   dbg("system: \"%s\"\n", tmp_path);
1300
1301   // the app might want the screen too..
1302   fb_thread_pause();
1303   ret = system(tmp_path);
1304   fb_thread_resume();
1305   return ret;
1306 }
1307
1308 int emu_do_execve(const char *filename, char *const argv[], char *const envp[])
1309 {
1310   const char **new_argv;
1311   char *prep_path;
1312   int i, ret, argc;
1313
1314   if (filename == NULL)
1315     return -1;
1316
1317   if (strstr(filename, "/gp2xmenu") != NULL)
1318     exit(0);
1319
1320   for (i = 0; argv[i] != NULL; i++)
1321     ;
1322   argc = i + 1;
1323
1324   new_argv = calloc(argc + 2, sizeof(new_argv[0]));
1325   if (new_argv == NULL)
1326     return -1;
1327
1328   prep_path = malloc(512);
1329   if (prep_path == NULL)
1330     return -1;
1331
1332   make_local_path(prep_path, 512, "ginge_prep");
1333   new_argv[0] = prep_path;
1334   new_argv[1] = "--nomenu";
1335   new_argv[2] = wrap_path(filename);
1336
1337   if (argv[0] != NULL)
1338     for (i = 1; argv[i] != NULL; i++)
1339       new_argv[i + 2] = argv[i];
1340
1341   dbg("execve \"%s\" %s \"%s\"\n", new_argv[0], new_argv[1], new_argv[2]);
1342   ret = execve(new_argv[0], (char **)new_argv, envp);
1343   perror("execve");
1344   return ret;
1345 }
1346
1347 // vim:shiftwidth=2:expandtab