dd507ff01c85251ac2dcfb83116e2cdeb6bc0b6f
[ginge.git] / loader / emu.c
1 // vim:shiftwidth=2:expandtab
2 #include <stdio.h>
3 #include <stdlib.h>
4 #include <string.h>
5 #include <alloca.h>
6 #include <sys/types.h>
7 #include <sys/stat.h>
8 #include <fcntl.h>
9 #include <sys/mman.h>
10 #include <sys/types.h>
11 #include <unistd.h>
12 #include <signal.h>
13 #include <asm/ucontext.h>
14 #include <pthread.h>
15 #include <errno.h>
16 #include <time.h>
17 #include <sys/resource.h>
18 #include <sys/ioctl.h>
19 #include <linux/soundcard.h>
20 #include <linux/fb.h>
21
22 #include "header.h"
23 #include "../common/host_fb.h"
24 #include "../common/cmn.h"
25 #include "sys_cacheflush.h"
26 #include "realfuncs.h"
27
28 #if (DBG & 2) && !(DBG & 4)
29 #define LOG_IO_UNK
30 #endif
31 #if (DBG & 4)
32 #define LOG_IO
33 #endif
34 //#define LOG_SEGV
35
36 #ifdef LOG_IO
37 #define iolog log_io
38 #else
39 #define iolog(...)
40 #endif
41
42 #ifdef LOG_IO_UNK
43 #define iolog_unh log_io
44 #else
45 #define iolog_unh(...)
46 #endif
47
48 #ifdef LOG_SEGV
49 #define segvlog printf
50 #else
51 #define segvlog(...)
52 #endif
53
54 #if defined(LOG_IO) || defined(LOG_IO_UNK)
55 #include "mmsp2-regs.h"
56 #endif
57
58 typedef unsigned long long u64;
59 typedef unsigned int   u32;
60 typedef unsigned short u16;
61 typedef unsigned char  u8;
62
63 static pthread_mutex_t fb_mutex = PTHREAD_MUTEX_INITIALIZER;
64 static pthread_cond_t fb_cond = PTHREAD_COND_INITIALIZER;
65
66 static struct {
67   u32 dstctrl;
68   u32 dstaddr;
69   u32 dststride;
70   u32 srcctrl;
71   u32 srcaddr;          //
72   u32 srcstride;
73   u32 srcforcolor;
74   u32 srcbackcolor;
75   u32 patctrl;          //
76   u32 patforcolor;
77   u32 patbackcolor;
78   u32 size;
79   u32 ctrl;             //
80   u32 run;
81   u32 intc;
82   u32 srcfifo;
83 } blitter;
84
85 #define SRCCTRL_INVIDEO         (1 << 8)
86 #define SRCCTRL_SRCENB          (1 << 7)
87 #define CTRL_TRANSPARENCYENB    (1 << 11)
88
89 static struct {
90   // mmsp2
91   u16 mlc_stl_cntl;
92   union {
93     u32 mlc_stl_adr; // mlcaddress for pollux
94     struct {
95       u16 mlc_stl_adrl;
96       u16 mlc_stl_adrh;
97     };
98   };
99   u16 mlc_stl_pallt_a;
100   union {
101     u16 mlc_stl_pallt_d[256*2];
102     u32 mlc_stl_pallt_d32[256];
103   };
104
105   // pollux
106   u32 mlccontrol;
107   u16 mlcpalette[256];
108
109   // state
110   void *umem;
111   u32 old_mlc_stl_adr;
112   u32 btn_state; // as seen through /dev/GPIO: 0PVdVu YXBA RLSeSt 0Ri0Dn 0Le0Up
113   struct {
114     u32 width, height;
115     u32 stride;
116     u32 bpp;
117     u32 dirty_pal:2;
118   } v;
119 } mmsp2;
120 #define pollux mmsp2 // so that code doesn't look that weird
121 enum {
122   DIRTY_PAL_MMSP2 = 1,
123   DIRTY_PAL_POLLUX = 2,
124 };
125
126
127 #if defined(LOG_IO) || defined(LOG_IO_UNK)
128 static void log_io(const char *pfx, u32 a, u32 d, int size)
129 {
130   const char *fmt, *reg = "";
131   switch (size) {
132   case  8: fmt = "%s %08x       %02x %s\n"; d &= 0xff; break;
133   case 32: fmt = "%s %08x %08x %s\n";       break;
134   default: fmt = "%s %08x     %04x %s\n";   d &= 0xffff; break;
135   }
136
137   if ((a & ~0xffff) == 0x7f000000)
138     reg = regnames[a & 0xffff];
139
140   printf(fmt, pfx, a, d, reg);
141 }
142 #endif
143
144 static void memset16(void *dst, u32 pattern, int count)
145 {
146   u32 *dl;
147   u16 *d;
148   
149   d = (u16 *)((long)dst & ~1);
150   if ((long)d & 2) {
151     *d++ = pattern;
152     count--;
153   }
154   dl = (void *)d;
155   pattern |= pattern << 16;
156
157   while (count >= 2) {
158     *dl++ = pattern;
159     count -= 2;
160   }
161   if (count)
162     *(u16 *)dl = pattern;
163 }
164
165 static void blt_tr(void *dst, void *src, u32 trc, int w)
166 {
167   u16 *d = (u16 *)((long)dst & ~1);
168   u16 *s = (u16 *)((long)src & ~1);
169
170   // XXX: optimize
171   for (; w > 0; d++, s++, w--)
172     if (*s != trc)
173       *d = *s;
174 }
175
176 #define dump_blitter() \
177 { \
178   u32 *r = &blitter.dstctrl; \
179   int i; \
180   for (i = 0; i < 4*4; i++, r++) { \
181     printf("%08x ", *r); \
182     if ((i & 3) == 3) \
183       printf("\n"); \
184   } \
185 }
186
187 static void *uppermem_lookup(u32 addr, u8 **mem_end)
188 {
189   // XXX: maybe support mirroring?
190   if ((addr & 0xfe000000) != 0x02000000)
191     return NULL;
192
193   *mem_end = (u8 *)mmsp2.umem + 0x02000000;
194   return (u8 *)mmsp2.umem - 0x02000000 + addr;
195 }
196
197 static void blitter_do(void)
198 {
199   u8 *dst, *dste, *src = NULL, *srce = NULL;
200   int w, h, sstrd, dstrd;
201   int to_screen = 0;
202   u32 bpp, addr;
203
204   w = blitter.size & 0x7ff;
205   h = (blitter.size >> 16) & 0x7ff;
206   sstrd = blitter.srcstride;
207   dstrd = blitter.dststride;
208
209   // XXX: need to confirm this..
210   addr = (blitter.dstaddr & ~3) | ((blitter.dstctrl & 0x1f) >> 3);
211
212   // use dst bpp.. How does it do blits with different src bpp?
213   bpp = (blitter.dstctrl & 0x20) ? 16 : 8;
214
215   // maybe the screen?
216   if (((w == 320 && h == 240) || // blit whole screen
217        (w * h >= 320*240/2)) &&  // ..or at least half of the area
218        mmsp2.mlc_stl_adr <= addr && addr < mmsp2.mlc_stl_adr + 320*240*2)
219     to_screen = 1;
220
221   dst = uppermem_lookup(addr, &dste);
222
223   // XXX: assume fill if no SRCENB, but it could be pattern blit..
224   if (blitter.srcctrl & SRCCTRL_SRCENB) {
225     if (!(blitter.srcctrl & SRCCTRL_INVIDEO))
226       goto bad_blit;
227
228     addr = (blitter.srcaddr & ~3) | ((blitter.srcctrl & 0x1f) >> 3);
229     src = uppermem_lookup(addr, &srce);
230     if (src == NULL)
231       goto bad_blit;
232
233     if (src + sstrd * h > srce) {
234       err("blit %08x->%08x %dx%d did not fit src\n",
235         blitter.srcaddr, blitter.dstaddr, w, h);
236       h = (srce - src) / sstrd;
237     }
238   }
239
240   if (dst == NULL)
241     goto bad_blit;
242
243   if (dst + dstrd * h > dste) {
244     err("blit %08x->%08x %dx%d did not fit dst\n",
245       blitter.srcaddr, blitter.dstaddr, w, h);
246     h = (dste - dst) / dstrd;
247   }
248
249   if (src != NULL) {
250     // copy
251     if (bpp == 16 && (blitter.ctrl & CTRL_TRANSPARENCYENB)) {
252       u32 trc = blitter.ctrl >> 16;
253       for (; h > 0; h--, dst += dstrd, src += sstrd)
254         blt_tr(dst, src, trc, w);
255     }
256     else {
257       for (; h > 0; h--, dst += dstrd, src += sstrd)
258         memcpy(dst, src, w * bpp / 8);
259     }
260   }
261   else {
262     // fill. Assume the pattern is cleared and bg color is used
263     u32 bgc = blitter.patbackcolor & 0xffff;
264     if (bpp == 16) {
265       for (; h > 0; h--, dst += dstrd)
266         memset16(dst, bgc, w);
267     }
268     else {
269       for (; h > 0; h--, dst += dstrd)
270         memset(dst, bgc, w); // bgc?
271     }
272   }
273
274   if (to_screen)
275     pthread_cond_signal(&fb_cond);
276   return;
277
278 bad_blit:
279   err("blit %08x->%08x %dx%d translated to %p->%p\n",
280     blitter.srcaddr, blitter.dstaddr, w, h, src, dst);
281   dump_blitter();
282 }
283
284 // FIXME: pass real dimensions to blitters
285 static void mlc_flip(void *src, int bpp, int stride)
286 {
287   static int old_bpp;
288
289   // only pass pal to host if it's dirty
290   if (bpp <= 8 && mmsp2.v.dirty_pal) {
291     if (mmsp2.v.dirty_pal == DIRTY_PAL_MMSP2)
292       host_video_update_pal32(mmsp2.mlc_stl_pallt_d32);
293     else
294       host_video_update_pal16(mmsp2.mlcpalette);
295     mmsp2.v.dirty_pal = 0;
296   }
297
298   if (bpp != old_bpp) {
299     host_video_change_bpp(bpp);
300     old_bpp = bpp;
301   }
302
303   switch (bpp) {
304   case  4:
305     host_video_blit4(src, 320, 240, stride);
306     break;
307
308   case  8:
309     host_video_blit8(src, 320, 240, stride);
310     break;
311
312   case 16:
313     host_video_blit16(src, 320, 240, stride);
314     break;
315
316   case 24:
317     // TODO
318     break;
319   }
320 }
321
322 #define ts_add_nsec(ts, ns) { \
323   ts.tv_nsec += ns; \
324   if (ts.tv_nsec >= 1000000000) { \
325     ts.tv_sec++; \
326     ts.tv_nsec -= 1000000000; \
327   } \
328 }
329
330 static int fb_sync_thread_paused;
331
332 static void *fb_sync_thread(void *arg)
333 {
334   int invalid_fb_addr = 1;
335   int manual_refresh = 0;
336   int frame_counter = 0;
337   struct timespec ts;
338   int ret, wait_ret;
339
340   //ret = pthread_setschedprio(pthread_self(), -1);
341   //log("pthread_setschedprio %d\n", ret);
342   //ret = setpriority(PRIO_PROCESS, 0, -1);
343   //log("setpriority %d\n", ret);
344
345   ret = clock_gettime(CLOCK_REALTIME, &ts);
346   if (ret != 0) {
347     perror(PFX "clock_gettime");
348     exit(1);
349   }
350
351   while (1) {
352     u8 *gp2x_fb, *gp2x_fb_end;
353
354     ret =  pthread_mutex_lock(&fb_mutex);
355     wait_ret = pthread_cond_timedwait(&fb_cond, &fb_mutex, &ts);
356     ret |= pthread_mutex_unlock(&fb_mutex);
357
358     if (ret != 0) {
359       err("fb_thread: mutex error: %d\n", ret);
360       sleep(1);
361       goto check_keys;
362     }
363     if (wait_ret != 0 && wait_ret != ETIMEDOUT) {
364       err("fb_thread: cond error: %d\n", wait_ret);
365       sleep(1);
366       goto check_keys;
367     }
368     if (fb_sync_thread_paused) {
369       ts_add_nsec(ts, 100000000);
370       goto check_keys;
371     }
372
373     if (wait_ret != ETIMEDOUT) {
374       clock_gettime(CLOCK_REALTIME, &ts);
375       ts_add_nsec(ts, 50000000);
376       manual_refresh++;
377       if (manual_refresh == 2)
378         dbg("fb_thread: switch to manual refresh\n");
379     } else {
380       ts_add_nsec(ts, 16666667);
381       if (manual_refresh > 1)
382         dbg("fb_thread: switch to auto refresh\n");
383       manual_refresh = 0;
384     }
385
386     gp2x_fb = uppermem_lookup(mmsp2.mlc_stl_adr, &gp2x_fb_end);
387     if (gp2x_fb == NULL || gp2x_fb + 320*240 * mmsp2.v.bpp / 8 > gp2x_fb_end) {
388       if (!invalid_fb_addr) {
389         err("fb_thread: %08x is out of range\n", mmsp2.mlc_stl_adr);
390         invalid_fb_addr = 1;
391       }
392       continue;
393     }
394
395     invalid_fb_addr = 0;
396     mlc_flip(gp2x_fb, mmsp2.v.bpp, mmsp2.v.stride);
397
398     frame_counter++;
399     if (frame_counter & 0x0f)
400       continue;
401
402 check_keys:
403     // this is to check for kill key, in case main thread hung
404     // or something else went wrong.
405     pollux.btn_state = host_read_btns();
406   }
407 }
408
409 static void fb_thread_pause(void)
410 {
411   fb_sync_thread_paused = 1;
412   // wait until it finishes last refresh
413   // that it might be doing now
414   usleep(10000);
415 }
416
417 static void fb_thread_resume(void)
418 {
419   fb_sync_thread_paused = 0;
420 }
421
422 static u32 xread32_io_cmn(u32 a, u32 *handled)
423 {
424   u32 d = 0;
425
426   *handled = 1;
427   switch (a) {
428   // Wiz stuff
429   case 0x402c: // MLCVSTRIDE0
430   case 0x4060: // MLCVSTRIDE1
431     d = pollux.v.stride;
432     break;
433   case 0x4038: // MLCADDRESS0
434   case 0x406c: // MLCADDRESS1
435     d = pollux.mlc_stl_adr;
436     break;
437   // wiz_lib reads:
438   //  ???? ???? YXBA DURiLe ???? VdVuMS LR?? ????
439   // |     GPIOC[31:16]    |    GPIOB[31:16]     |
440   case 0xa058: // GPIOBPAD
441     d =   pollux.btn_state & 0x0300;
442     d |= (pollux.btn_state >> 3) & 0x0080;
443     d |= (pollux.btn_state >> 5) & 0x0040;
444     d |= (pollux.btn_state >> 6) & 0x0c00;
445     d <<= 16;
446     d = ~d;
447     break;
448   case 0xa098: // GPIOCPAD
449     pollux.btn_state = host_read_btns();
450     d =  (pollux.btn_state >> 8) & 0x00f0;
451     d |= (pollux.btn_state >> 1) & 0x0008;
452     d |= (pollux.btn_state << 2) & 0x0004;
453     d |= (pollux.btn_state >> 5) & 0x0002;
454     d |= (pollux.btn_state >> 2) & 0x0001;
455     d <<= 16;
456     d = ~d;
457     break;
458   default:
459     *handled = 0;
460     break;
461   }
462
463   return d;
464 }
465
466 static u32 xread8(u32 a)
467 {
468   iolog("r8 ", a, 0, 8);
469   iolog_unh("r8 ", a, 0, 8);
470   return 0;
471 }
472
473 static u32 xread16(u32 a)
474 {
475   static u32 fudge, old_a;
476   u32 d = 0, t;
477
478   if ((a & 0xffff0000) == 0x7f000000) {
479     u32 a_ = a & 0xffff;
480     switch (a_) {
481     case 0x0910: // FPLL
482     case 0x0912:
483       d = 0x9407;
484       break;
485     // minilib reads as:
486     //  0000 P000 VuVd00 0000 YXBA RLSeSt 0Ri0D 0Le0U
487     // |        GPIOD        |GPIOC[8:15]|GPIOM[0:7] |
488     // /dev/GPIO:
489     //             ... 0PVdVu ...
490     case 0x1184: // GPIOC
491       d = ~mmsp2.btn_state & 0xff00;
492       d |= 0x00ff;
493       break;
494     case 0x1186: // GPIOD
495       t = ~mmsp2.btn_state;
496       d  = (t >> 9)  & 0x0080;
497       d |= (t >> 11) & 0x0040;
498       d |= (t >> 7)  & 0x0800;
499       d |= 0x373b;
500       break;
501     case 0x1198: // GPIOM
502       mmsp2.btn_state = host_read_btns();
503       d = ~mmsp2.btn_state & 0xff;
504       d |= 0x01aa;
505       break;
506     case 0x1836: // reserved
507       d = 0x2330;
508       break;
509     case 0x2816: // DPC_X_MAX
510       d = 319;
511       break;
512     case 0x2818: // DPC_Y_MAX
513       d = 239;
514       break;
515     case 0x28da:
516       d = mmsp2.mlc_stl_cntl;
517       break;
518     case 0x290e:
519     case 0x2912:
520       d = mmsp2.mlc_stl_adrl;
521       break;
522     case 0x2910:
523     case 0x2914:
524       d = mmsp2.mlc_stl_adrh;
525       break;
526     case 0x2958:
527       d = mmsp2.mlc_stl_pallt_a;
528       break;
529
530     default:
531       d = xread32_io_cmn(a_, &t);
532       if (!t)
533         goto unk;
534       if (!(a_ & 2))
535         d >>= 16;
536       break;
537     }
538     goto out;
539   }
540
541 unk:
542   if (a == old_a) {
543     d = fudge;
544     fudge = ~fudge;
545   }
546   old_a = a;
547   iolog_unh("r16", a, d & 0xffff, 16);
548
549 out:
550   d &= 0xffff;
551   iolog("r16", a, d, 16);
552   return d;
553 }
554
555 static u32 xread32(u32 a)
556 {
557   u32 d = 0;
558   if ((a & 0xfff00000) == 0x7f000000) {
559     u32 a_ = a & 0xffff;
560     struct timespec ts;
561     u64 t64;
562     u32 t;
563
564     switch (a_) {
565     case 0x0a00: // TCOUNT, 1/7372800s
566       clock_gettime(CLOCK_REALTIME, &ts);
567       t64 = (u64)ts.tv_sec * 1000000000 + ts.tv_nsec;
568       // t * 7372800.0 / 1000000000 * 0x100000000 ~= t * 31665935
569       t64 *= 31665935;
570       d = t64 >> 32;
571       break;
572
573     default:
574       d = xread32_io_cmn(a_, &t);
575       if (!t)
576         goto unh;
577       break;
578     }
579     goto out;
580   }
581   if ((a & 0xfff00000) == 0x7f100000) {
582     u32 *bl = &blitter.dstctrl;
583     u32 a_ = a & 0xfff;
584     if (a_ < 0x40) {
585       d = bl[a_ / 4];
586       if (a_ == 0x34)
587         d = 0; // not busy
588       goto out;
589     }
590   }
591
592 unh:
593   iolog_unh("r32", a, d, 32);
594
595 out:
596   iolog("r32", a, d, 32);
597   return d;
598 }
599
600 static void xwrite8(u32 a, u32 d)
601 {
602   iolog("w8 ", a, d, 8);
603   iolog_unh("w8 ", a, d, 8);
604 }
605
606 static void xwrite16(u32 a, u32 d)
607 {
608   iolog("w16", a, d, 16);
609   if ((a & 0xfff00000) == 0x7f000000) {
610     u32 a_ = a & 0xffff;
611     switch (a_) {
612       case 0x28da: {
613         int mode;
614         mmsp2.mlc_stl_cntl = d | 0xaa;
615         mode = (d >> 9) & 3;
616         mmsp2.v.bpp = mode ? mode * 8 : 4;
617         break;
618       }
619       case 0x290c:
620         mmsp2.v.stride = d;
621         return;
622       case 0x290e:
623       case 0x2910:
624         // odd addresses don't affect LCD. What about TV?
625         return;
626       case 0x2912:
627         mmsp2.mlc_stl_adrl = d;
628         return;
629       case 0x2914:
630         mmsp2.mlc_stl_adrh = d;
631         if (mmsp2.mlc_stl_adr != mmsp2.old_mlc_stl_adr)
632           // ask for refresh
633           pthread_cond_signal(&fb_cond);
634         mmsp2.old_mlc_stl_adr = mmsp2.mlc_stl_adr;
635         return;
636       case 0x2958:
637         mmsp2.mlc_stl_pallt_a = d & 0x1ff;
638         return;
639       case 0x295a:
640         mmsp2.mlc_stl_pallt_d[mmsp2.mlc_stl_pallt_a++] = d;
641         mmsp2.mlc_stl_pallt_a &= 0x1ff;
642         mmsp2.v.dirty_pal = DIRTY_PAL_MMSP2;
643         return;
644     }
645   }
646   iolog_unh("w16", a, d, 16);
647 }
648
649 static void xwrite32(u32 a, u32 d)
650 {
651   iolog("w32", a, d, 32);
652
653   if ((a & 0xfff00000) == 0x7f000000) {
654     u32 a_ = a & 0xffff;
655     switch (a_) {
656     // Wiz
657     case 0x4024: // MLCCONTROL0
658     case 0x4058: // MLCCONTROL1
659       pollux.mlccontrol = d;
660       if (!(d & 0x20))
661         return; // layer not enabled
662       if ((d >> 16) == 0x443A)
663         pollux.v.bpp = 8;
664       else
665         pollux.v.bpp = 16;
666       return;
667     case 0x402c: // MLCVSTRIDE0
668     case 0x4060: // MLCVSTRIDE1
669       pollux.v.stride = d;
670       return;
671     case 0x4038: // MLCADDRESS0
672     case 0x406c: // MLCADDRESS1
673       pollux.mlc_stl_adr = d;
674       if (d != mmsp2.old_mlc_stl_adr)
675         // ask for refresh
676         pthread_cond_signal(&fb_cond);
677       mmsp2.old_mlc_stl_adr = d;
678       return;
679     case 0x403c: // MLCPALETTE0
680     case 0x4070: // MLCPALETTE1
681       pollux.mlcpalette[d >> 24] = d;
682       pollux.v.dirty_pal = DIRTY_PAL_POLLUX;
683       return;
684     }
685   }
686   if ((a & 0xfff00000) == 0x7f100000) {
687     u32 *bl = &blitter.dstctrl;
688     u32 a_ = a & 0xfff;
689     if (a_ < 0x40) {
690       bl[a_ / 4] = d;
691       if (a_ == 0x34 && (d & 1))
692         blitter_do();
693       return;
694     }
695   }
696   iolog_unh("w32", a, d, 32);
697 }
698
699 #define LINKPAGE_SIZE 0x1000
700 #define LINKPAGE_COUNT 4
701 #define LINKPAGE_ALLOC (LINKPAGE_SIZE * LINKPAGE_COUNT)
702
703 struct op_context {
704   u32 pc;
705   u32 op;
706   u32 code[0];
707 };
708
709 struct op_linkpage {
710   void (*handler)(struct op_context *op_ctx);
711   u32 code[0];
712 };
713
714 struct op_stackframe {
715   u32 saved_regs[15];
716   u32 cpsr;
717 };
718
719 static struct op_linkpage *g_linkpage;
720 static u32 *g_code_ptr;
721 static int g_linkpage_count;
722
723 #define BIT_SET(v, b) (v & (1 << (b)))
724
725 void emu_handle_op(struct op_context *op_ctx, struct op_stackframe *sframe)
726 {
727   u32 *regs = sframe->saved_regs;
728   u32 op = op_ctx->op;
729   u32 t, shift, ret, addr;
730   int rn, rd;
731
732   rd = (op & 0x0000f000) >> 12;
733   rn = (op & 0x000f0000) >> 16;
734
735   if ((op & 0x0f200090) == 0x01000090) { // AM3: LDRH, STRH
736     if (!BIT_SET(op, 5)) // !H
737       goto unhandled;
738     if (BIT_SET(op, 6) && !BIT_SET(op, 20)) // S && !L
739       goto unhandled;
740
741     if (BIT_SET(op, 22))                // imm offset
742       t = ((op & 0xf00) >> 4) | (op & 0x0f);
743     else                                // reg offset
744       t = regs[op & 0x000f];
745
746     if (!BIT_SET(op, 23))
747       t = -t;
748     addr = regs[rn] + t;
749
750     if (BIT_SET(op, 20)) { // Load
751       ret = xread16(addr);
752       if (BIT_SET(op, 6)) { // S
753         ret <<= 16;
754         ret = (signed int)ret >> 16;
755       }
756       regs[rd] = ret;
757     }
758     else
759       xwrite16(addr, regs[rd]);
760   }
761   else if ((op & 0x0d200000) == 0x05000000) { // AM2: LDR[B], STR[B]
762     if (BIT_SET(op, 25)) {              // reg offs
763       if (BIT_SET(op, 4))
764         goto unhandled;
765
766       t = regs[op & 0x000f];
767       shift = (op & 0x0f80) >> 7;
768       switch ((op & 0x0060) >> 5) {
769         case 0: t = t << shift; break;
770         case 1: t = t >> (shift + 1); break;
771         case 2: t = (signed int)t >> (shift + 1); break;
772         case 3: goto unhandled; // I'm just lazy
773       }
774     }
775     else                                // imm offs
776       t = op & 0x0fff;
777
778     if (!BIT_SET(op, 23))
779       t = -t;
780     addr = regs[rn] + t;
781
782     if (BIT_SET(op, 20)) { // Load
783       if (BIT_SET(op, 22)) // Byte
784         ret = xread8(addr);
785       else
786         ret = xread32(addr);
787       regs[rd] = ret;
788     }
789     else {
790       if (BIT_SET(op, 22)) // Byte
791         xwrite8(addr, regs[rd]);
792       else
793         xwrite32(addr, regs[rd]);
794     }
795   }
796   else
797     goto unhandled;
798
799 #if 0
800   if (addr != addr_check) {
801     fprintf(stderr, "bad calculated addr: %08x vs %08x\n", addr, addr_check);
802     abort();
803   }
804 #endif
805   return;
806
807 unhandled:
808   err("unhandled IO op %08x @ %08x\n", op, op_ctx->pc);
809 }
810
811 static u32 make_offset12(u32 *pc, u32 *target)
812 {
813   int lp_offs, u = 1;
814
815   lp_offs = (char *)target - (char *)pc - 2*4;
816   if (lp_offs < 0) {
817     lp_offs = -lp_offs;
818     u = 0;
819   }
820   if (lp_offs >= LINKPAGE_SIZE) {
821     err("linkpage too far: %d\n", lp_offs);
822     abort();
823   }
824
825   return (u << 23) | lp_offs;
826 }
827
828 static u32 make_jmp(u32 *pc, u32 *target, int bl)
829 {
830   int jmp_val;
831
832   jmp_val = target - pc - 2;
833   if (jmp_val < (int)0xff000000 || jmp_val > 0x00ffffff) {
834     err("jump out of range (%p -> %p)\n", pc, target);
835     abort();
836   }
837
838   return 0xea000000 | (bl << 24) | (jmp_val & 0x00ffffff);
839 }
840
841 static void emit_op(u32 op)
842 {
843   *g_code_ptr++ = op;
844 }
845
846 static void emit_op_io(u32 op, u32 *target)
847 {
848   op |= make_offset12(g_code_ptr, target);
849   emit_op(op);
850 }
851
852 static void init_linkpage(void)
853 {
854   g_linkpage->handler = emu_call_handle_op;
855   g_code_ptr = g_linkpage->code;
856 }
857
858 static void segv_sigaction(int num, siginfo_t *info, void *ctx)
859 {
860   struct ucontext *context = ctx;
861   u32 *regs = (u32 *)&context->uc_mcontext.arm_r0;
862   u32 *pc = (u32 *)regs[15];
863   struct op_context *op_ctx;
864   int i, lp_size;
865
866   if (((regs[15] ^ (u32)&segv_sigaction) & 0xff000000) == 0 ||         // PC is in our segment or
867       (((regs[15] ^ (u32)g_linkpage) & ~(LINKPAGE_ALLOC - 1)) == 0) || // .. in linkpage
868       ((long)info->si_addr & 0xffe00000) != 0x7f000000)                // faulting not where expected
869   {
870     // real crash - time to die
871     err("segv %d %p @ %08x\n", info->si_code, info->si_addr, regs[15]);
872     for (i = 0; i < 8; i++)
873       dbg(" r%d=%08x r%2d=%08x\n", i, regs[i], i+8, regs[i+8]);
874     signal(num, SIG_DFL);
875     raise(num);
876     return;
877   }
878   segvlog("segv %d %p @ %08x\n", info->si_code, info->si_addr, regs[15]);
879
880   // spit PC and op
881   op_ctx = (void *)g_code_ptr;
882   op_ctx->pc = (u32)pc;
883   op_ctx->op = *pc;
884   g_code_ptr = &op_ctx->code[0];
885
886   // emit jump to code ptr
887   *pc = make_jmp(pc, g_code_ptr, 0);
888
889   // generate code:
890   emit_op   (0xe50d0000 + 0xf00 - 4 * 0);                        // str r0, [sp, #(-0xf00 + r0_offs)]
891   emit_op   (0xe50de000 + 0xf00 - 4 * 14);                       // str lr, [sp, #(-0xf00 + lr_offs)]
892   emit_op   (0xe24f0000 + (g_code_ptr - (u32 *)op_ctx + 2) * 4); // sub r0, pc, #op_ctx
893   emit_op   (0xe1a0e00f);                                        // mov lr, pc
894   emit_op_io(0xe51ff000, (u32 *)&g_linkpage->handler);           // ldr pc, =handle_op
895   emit_op   (0xe51de000 + 0xf00 - 4 * 14);                       // ldr lr, [sp, #(-0xf00 + lr_offs)]
896   emit_op   (make_jmp(g_code_ptr, pc + 1, 0));                   // jmp <back>
897
898   // sync caches
899   sys_cacheflush(pc, pc + 1);
900   sys_cacheflush(g_linkpage, g_code_ptr);
901
902   lp_size = (char *)g_code_ptr - (char *)g_linkpage;
903   segvlog("code #%d %d/%d\n", g_linkpage_count, lp_size, LINKPAGE_SIZE);
904
905   if (lp_size + 13*4 > LINKPAGE_SIZE) {
906     g_linkpage_count++;
907     if (g_linkpage_count >= LINKPAGE_COUNT) {
908       err("too many linkpages needed\n");
909       abort();
910     }
911     g_linkpage = (void *)((char *)g_linkpage + LINKPAGE_SIZE);
912     init_linkpage();
913   }
914   //handle_op(regs[15], op, regs, (u32)info->si_addr);
915   //regs[15] += 4;
916 }
917
918 void emu_init(void *map_bottom)
919 {
920   sigaction_t segv_action = {
921     .sa_sigaction = segv_sigaction,
922     .sa_flags = SA_SIGINFO,
923   };
924   pthread_t tid;
925   void *pret;
926   int ret;
927
928   g_linkpage = (void *)(((u32)map_bottom - LINKPAGE_ALLOC) & ~0xfff);
929   pret = mmap(g_linkpage, LINKPAGE_ALLOC, PROT_READ|PROT_WRITE,
930               MAP_PRIVATE|MAP_ANONYMOUS|MAP_FIXED, -1, 0);
931   if (pret != g_linkpage) {
932     perror(PFX "mmap linkpage");
933     exit(1);
934   }
935   log("linkpages @ %p\n", g_linkpage);
936   init_linkpage();
937
938   // host stuff
939   ret = host_init();
940   if (ret != 0) {
941     err("can't init host\n");
942     exit(1);
943   }
944
945   ret = host_video_init(NULL, 0);
946   if (ret != 0) {
947     err("can't init host video\n");
948     exit(1);
949   }
950
951 #ifdef WIZ
952   // we are short on memmory on Wiz, need special handling
953   extern void *host_mmap_upper(void);
954   mmsp2.umem = host_mmap_upper();
955 #else
956   mmsp2.umem = mmap(NULL, 0x2000000, PROT_READ|PROT_WRITE|PROT_EXEC,
957                     MAP_PRIVATE|MAP_ANONYMOUS, -1, 0);
958 #endif
959   if (mmsp2.umem == MAP_FAILED) {
960     perror(PFX "mmap upper mem");
961     exit(1);
962   }
963
964   ret = pthread_create(&tid, NULL, fb_sync_thread, NULL);
965   if (ret != 0) {
966     err("failed to create fb_sync_thread: %d\n", ret);
967     exit(1);
968   }
969   pthread_detach(tid);
970
971   // defaults
972   mmsp2.mlc_stl_adr = 0x03101000; // fb2 is at 0x03381000
973   mmsp2.mlc_stl_cntl = 0x4ab; // 16bpp, region 1 active
974   mmsp2.v.width = 320;
975   mmsp2.v.height = 240;
976   mmsp2.v.stride = 320*2;
977   mmsp2.v.bpp = 16;
978   mmsp2.v.dirty_pal = 1;
979
980   sigemptyset(&segv_action.sa_mask);
981   sigaction(SIGSEGV, &segv_action, NULL);
982 }
983
984 int emu_read_gpiodev(void *buf, int count)
985 {
986   if (count <= 0) {
987     err("gpiodev read %d?\n", count);
988     return -1;
989   }
990   if (count > 4)
991     count = 4;
992
993   mmsp2.btn_state = host_read_btns();
994   memcpy(buf, &mmsp2.btn_state, count);
995   return count;
996 }
997
998 static void *emu_mmap_dev(unsigned int length, int prot, int flags, unsigned int offset)
999 {
1000   u8 *umem, *umem_end;
1001
1002   // SoC regs
1003   if ((offset & ~0x1ffff) == 0xc0000000) {
1004     return mmap((void *)0x7f000000, length, PROT_NONE,
1005       MAP_PRIVATE|MAP_ANONYMOUS|MAP_FIXED|MAP_NORESERVE, -1, 0);
1006   }
1007   // MMSP2 blitter
1008   if ((offset & ~0xffff) == 0xe0020000) {
1009     return mmap((void *)0x7f100000, length, PROT_NONE,
1010       MAP_PRIVATE|MAP_ANONYMOUS|MAP_FIXED|MAP_NORESERVE, -1, 0);
1011   }
1012   // upper mem
1013   if ((offset & 0xfe000000) != 0x02000000) {
1014     err("unexpected devmem mmap @ %08x\n", offset);
1015     errno = EINVAL;
1016     return MAP_FAILED;
1017   }
1018
1019   umem = uppermem_lookup(offset, &umem_end);
1020   if (umem + length > umem_end)
1021     err("warning: uppermem @ %08x overflows by %d bytes\n",
1022         offset, umem + length - umem_end);
1023
1024   dbg("upper mem @ %08x %d\n", offset, length);
1025   return umem;
1026 }
1027
1028 void *emu_do_mmap(unsigned int length, int prot, int flags, int fd, unsigned int offset)
1029 {
1030   if (fd == FAKEDEV_MEM)
1031     return emu_mmap_dev(length, prot, flags, offset);
1032
1033   if (fd == FAKEDEV_FB0)
1034     return emu_mmap_dev(length, prot, flags, offset + 0x03101000);
1035
1036   if (fd == FAKEDEV_FB1)
1037     return emu_mmap_dev(length, prot, flags, offset + 0x03381000);
1038
1039   err("bad/ni mmap(?, %d, %x, %x, %d, %08x)\n", length, prot, flags, fd, offset);
1040   errno = EINVAL;
1041   return MAP_FAILED;
1042 }
1043
1044 static void emu_sound_open(int fd)
1045 {
1046 #ifdef PND
1047   int ret, frag;
1048
1049   // set default buffer size to 16 * 1K
1050   frag = (16<<16) | 10; // 16K
1051   ret = ioctl(fd, SNDCTL_DSP_SETFRAGMENT, &frag);
1052   if (ret != 0) {
1053     err("snd ioctl SETFRAGMENT %08x: ", frag);
1054     perror(NULL);
1055   }
1056 #endif
1057 }
1058
1059 static int emu_sound_ioctl(int fd, int request, void *argp)
1060 {
1061   int *arg = argp;
1062
1063 #if 0
1064   dbg("snd ioctl(%d, %08x, %p)", fd, request, argp);
1065   if (arg != NULL)
1066     dbg_c(" [%d]", *arg);
1067   dbg_c("\n");
1068 #endif
1069
1070   /* People set strange frag settings on GP2X, which even manage
1071    * to break audio on pandora (causes writes to fail).
1072    * Catch this and set to something that works. */
1073   switch(request) {
1074     case SNDCTL_DSP_SETFRAGMENT: {
1075       int ret, bsize, frag, frag_cnt;
1076       if (arg == NULL)
1077         break;
1078
1079       frag = *arg & 0xffff;
1080       frag_cnt = *arg >> 16;
1081       bsize = frag_cnt << frag;
1082       if (frag < 10 || bsize < 4096*4 || bsize > 4096*4*2) {
1083         /*
1084          * ~4ms. gpSP wants small buffers or else it stutters
1085          * because of it's audio thread sync stuff
1086          * XXX: hardcoding, as low samplerates will result in small fragment size,
1087          * which itself causes ALSA stall and hangs the program.
1088          * Also some apps change samplerate without reopening /dev/dsp,
1089          * which causes ALSA to reject SNDCTL_DSP_SETFRAGMENT.
1090          */
1091         bsize = 44100 / 250 * 4;
1092
1093         for (frag = 0; bsize; bsize >>= 1, frag++)
1094           ;
1095
1096         frag_cnt = 16;
1097       }
1098
1099       frag |= frag_cnt << 16;
1100       ret = ioctl(fd, SNDCTL_DSP_SETFRAGMENT, &frag);
1101       if (ret != 0) {
1102         err("snd ioctl SETFRAGMENT %08x: ", frag);
1103         perror(NULL);
1104       }
1105       // indicate success even if we fail (because of ALSA mostly),
1106       // things like MikMod will bail out otherwise.
1107       return 0;
1108     }
1109     case SNDCTL_DSP_SYNC:
1110       // Franxis tends to use sync/write loops, bad idea under ALSA
1111       return 0;
1112     default:
1113       break;
1114   }
1115
1116   return ioctl(fd, request, argp);
1117 }
1118
1119 int emu_do_ioctl(int fd, int request, void *argp)
1120 {
1121   if (fd == emu_interesting_fds[IFD_SOUND].fd)
1122     return emu_sound_ioctl(fd, request, argp);
1123
1124   switch (fd) {
1125   /* *********************** */
1126   case FAKEDEV_FB0:
1127   case FAKEDEV_FB1:
1128     if (argp == NULL)
1129       goto fail;
1130
1131     switch (request) {
1132       case FBIOGET_FSCREENINFO: {
1133         struct fb_fix_screeninfo *fix = argp;
1134
1135         memset(fix, 0, sizeof(*fix));
1136         strcpy(fix->id, "mmsp2_RGB0");
1137         fix->type         = FB_TYPE_PACKED_PIXELS;
1138         fix->accel        = FB_ACCEL_NONE;
1139         fix->visual       = FB_VISUAL_TRUECOLOR;
1140         fix->line_length  = 320*2;
1141         fix->smem_start   = (fd == FAKEDEV_FB0) ? 0x03101000 : 0x03381000;
1142         fix->smem_len     = 320*240*2;
1143         return 0;
1144       }
1145       case FBIOGET_VSCREENINFO: {
1146         struct fb_var_screeninfo *var = argp;
1147         static const struct fb_bitfield fbb_red   = { offset: 11, length: 5, };
1148         static const struct fb_bitfield fbb_green = { offset:  5, length: 6, };
1149         static const struct fb_bitfield fbb_blue  = { offset:  0, length: 5, };
1150
1151         memset(var, 0, sizeof(*var));
1152         var->activate     = FB_ACTIVATE_NOW;
1153         var->xres         =
1154         var->xres_virtual = 320;
1155         var->yres         =
1156         var->yres_virtual = 240;
1157         var->width        =
1158         var->height       = -1;
1159         var->vmode        = FB_VMODE_NONINTERLACED;
1160         var->bits_per_pixel = 16;
1161         var->red          = fbb_red;
1162         var->green        = fbb_green;
1163         var->blue         = fbb_blue;
1164         return 0;
1165       }
1166       case FBIOPUT_VSCREENINFO: {
1167         struct fb_var_screeninfo *var = argp;
1168         dbg(" put vscreen: %dx%d@%d\n", var->xres, var->yres, var->bits_per_pixel);
1169         if (var->xres != 320 || var->yres != 240 || var->bits_per_pixel != 16)
1170           return -1;
1171         return 0;
1172       }
1173     }
1174
1175   /* *********************** */
1176   case FAKEDEV_TTY0:
1177     // fake tty0 to make GPH SDL happy
1178     if (request == 0x4b46) // KDGKBENT
1179       return -1;
1180     return 0;
1181   }
1182
1183 fail:
1184   err("bad/ni ioctl(%d, %08x, %p)\n", fd, request, argp);
1185   errno = EINVAL;
1186   return -1;
1187 }
1188
1189 struct dev_fd_t emu_interesting_fds[] = {
1190   [IFD_SOUND] = { "/dev/dsp", -1, emu_sound_open },
1191   { NULL, 0, NULL },
1192 };
1193
1194 static const struct {
1195   const char *from;
1196   const char *to;
1197 } path_map[] = {
1198   { "/mnt/tmp/", "/tmp/" },
1199 };
1200
1201 static const char *wrap_path(const char *path)
1202 {
1203   char *buff;
1204   size_t size;
1205   int i, len;
1206
1207   // do only path mapping for now
1208   for (i = 0; i < ARRAY_SIZE(path_map); i++) {
1209     len = strlen(path_map[i].from);
1210     if (strncmp(path, path_map[i].from, len) == 0) {
1211       size = strlen(path) + strlen(path_map[i].to) + 1;
1212       buff = malloc(size);
1213       if (buff == NULL)
1214         break;
1215       snprintf(buff, size, "%s%s", path_map[i].to, path + len);
1216       dbg("mapped path \"%s\" -> \"%s\"\n", path, buff);
1217       return buff;
1218     }
1219   }
1220
1221   return path;
1222 }
1223
1224 static void wrap_path_free(const char *w_path, const char *old_path)
1225 {
1226   if (w_path != old_path)
1227     free((void *)w_path);
1228 }
1229
1230 void *emu_do_fopen(const char *path, const char *mode)
1231 {
1232   const char *w_path;
1233   FILE *ret;
1234
1235   w_path = wrap_path(path);
1236   ret = fopen(w_path, mode);
1237   wrap_path_free(w_path, path);
1238
1239   return ret;
1240 }
1241
1242 // FIXME: threads..
1243 int emu_do_system(const char *command)
1244 {
1245   static char tmp_path[512];
1246   const char *p2;
1247   char *p;
1248   int ret;
1249
1250   if (command == NULL)
1251     return -1;
1252
1253   // pass through stuff in PATH
1254   p = strchr(command, ' ');
1255   p2 = strchr(command, '/');
1256   if (p2 == NULL || (p != NULL && p2 > p))
1257     return system(command);
1258
1259   make_local_path(tmp_path, sizeof(tmp_path), "ginge_prep");
1260   p = tmp_path + strlen(tmp_path);
1261
1262   p2 = wrap_path(command);
1263   snprintf(p, sizeof(tmp_path) - (p - tmp_path), " --nomenu %s", p2);
1264   wrap_path_free(p2, command);
1265
1266   dbg("system: \"%s\"\n", tmp_path);
1267
1268   // the app might want the screen too..
1269   fb_thread_pause();
1270   ret = system(tmp_path);
1271   fb_thread_resume();
1272   return ret;
1273 }
1274
1275 int emu_do_execve(const char *filename, char *const argv[], char *const envp[])
1276 {
1277   const char **new_argv;
1278   char *prep_path;
1279   int i, ret, argc;
1280
1281   if (filename == NULL)
1282     return -1;
1283
1284   if (strstr(filename, "/gp2xmenu") != NULL)
1285     exit(0);
1286
1287   for (i = 0; argv[i] != NULL; i++)
1288     ;
1289   argc = i + 1;
1290
1291   new_argv = calloc(argc + 2, sizeof(new_argv[0]));
1292   if (new_argv == NULL)
1293     return -1;
1294
1295   prep_path = malloc(512);
1296   if (prep_path == NULL)
1297     return -1;
1298
1299   make_local_path(prep_path, 512, "ginge_prep");
1300   new_argv[0] = prep_path;
1301   new_argv[1] = "--nomenu";
1302   new_argv[2] = wrap_path(filename);
1303
1304   if (argv[0] != NULL)
1305     for (i = 1; argv[i] != NULL; i++)
1306       new_argv[i + 2] = argv[i];
1307
1308   dbg("execve \"%s\" %s \"%s\"\n", new_argv[0], new_argv[1], new_argv[2]);
1309   ret = execve(new_argv[0], (char **)new_argv, envp);
1310   perror("execve");
1311   return ret;
1312 }
1313