get rid of some libc deps
[ginge.git] / loader / emu.c
1 /*
2  * GINGE - GINGE Is Not Gp2x Emulator
3  * (C) notaz, 2010-2011,2016
4  *
5  * This work is licensed under the MAME license, see COPYING file for details.
6  */
7 // a "gentle" reminder
8 #ifdef __ARM_EABI__
9 #error loader is meant to be OABI!
10 #endif
11 #include <stdio.h>
12 #include <stdlib.h>
13 #include <string.h>
14 #include <alloca.h>
15 #include <ctype.h>
16 #include <sys/types.h>
17 #include <sys/stat.h>
18 #include <fcntl.h>
19 #include <sys/mman.h>
20 #include <sys/types.h>
21 #include <unistd.h>
22 #include <signal.h>
23 #include <asm/ucontext.h>
24 #include <errno.h>
25 #include <time.h>
26 #include <sched.h>
27 #include <sys/resource.h>
28 #include <sys/ioctl.h>
29 #include <sys/syscall.h>
30 #include <linux/soundcard.h>
31 #include <linux/fb.h>
32 #include <linux/futex.h>
33
34 #include "header.h"
35 #include "../common/host_fb.h"
36 #include "../common/cmn.h"
37 #include "syscalls.h"
38 #include "realfuncs.h"
39 #include "llibc.h"
40
41 #if (DBG & 2) && !(DBG & 4)
42 #define LOG_IO_UNK
43 #endif
44 #if (DBG & 4)
45 #define LOG_IO
46 #endif
47 //#define LOG_SEGV
48
49 #ifdef LOG_IO
50 #define iolog log_io
51 #else
52 #define iolog(...)
53 #endif
54
55 #ifdef LOG_IO_UNK
56 #define iolog_unh log_io
57 #else
58 #define iolog_unh(...)
59 #endif
60
61 #ifdef LOG_SEGV
62 #define segvlog g_printf
63 #else
64 #define segvlog(...)
65 #endif
66
67 #if defined(LOG_IO) || defined(LOG_IO_UNK)
68 #include "mmsp2-regs.h"
69 #endif
70
71 typedef unsigned long long u64;
72 typedef unsigned int   u32;
73 typedef unsigned short u16;
74 typedef unsigned char  u8;
75
76 #define THREAD_STACK_SIZE 0x200000
77
78 static int fb_sync_thread_paused;
79 static int fb_sync_thread_futex;
80
81 static struct {
82   u32 dstctrl;
83   u32 dstaddr;
84   u32 dststride;
85   u32 srcctrl;
86   u32 srcaddr;          //
87   u32 srcstride;
88   u32 srcforcolor;
89   u32 srcbackcolor;
90   u32 patctrl;          //
91   u32 patforcolor;
92   u32 patbackcolor;
93   u32 size;
94   u32 ctrl;             //
95   u32 run;
96   u32 intc;
97   u32 srcfifo;
98 } blitter;
99
100 #define SRCCTRL_INVIDEO         (1 << 8)
101 #define SRCCTRL_SRCENB          (1 << 7)
102 #define CTRL_TRANSPARENCYENB    (1 << 11)
103
104 static struct {
105   // mmsp2
106   u16 mlc_stl_cntl;
107   union {
108     u32 mlc_stl_adr; // mlcaddress for pollux
109     struct {
110       u16 mlc_stl_adrl;
111       u16 mlc_stl_adrh;
112     };
113   };
114   u16 mlc_stl_pallt_a;
115   union {
116     u16 mlc_stl_pallt_d[256*2];
117     u32 mlc_stl_pallt_d32[256];
118   };
119
120   // pollux
121   u32 mlccontrol;
122   u16 mlcpalette[256];
123
124   // state
125   void *umem;
126   u32 old_mlc_stl_adr;
127   u32 btn_state; // as seen through /dev/GPIO: 0PVdVu YXBA RLSeSt 0Ri0Dn 0Le0Up
128   struct {
129     u32 width, height;
130     u32 stride;
131     u32 bpp;
132     u32 dirty_pal:2;
133   } v;
134 } mmsp2;
135 #define pollux mmsp2 // so that code doesn't look that weird
136 enum {
137   DIRTY_PAL_MMSP2 = 1,
138   DIRTY_PAL_POLLUX = 2,
139 };
140
141
142 #if defined(LOG_IO) || defined(LOG_IO_UNK)
143 static void log_io(const char *pfx, u32 a, u32 d, int size)
144 {
145   const char *fmt, *reg = "";
146   switch (size) {
147   case  8: fmt = "%s %08x       %02x %s\n"; d &= 0xff; break;
148   case 32: fmt = "%s %08x %08x %s\n";       break;
149   default: fmt = "%s %08x     %04x %s\n";   d &= 0xffff; break;
150   }
151
152   if ((a & ~0xffff) == 0x7f000000)
153     reg = regnames[a & 0xffff];
154
155   g_printf(fmt, pfx, a, d, reg);
156 }
157 #endif
158
159 static void memset16(void *dst, u32 pattern, int count)
160 {
161   u32 *dl;
162   u16 *d;
163   
164   d = (u16 *)((long)dst & ~1);
165   if ((long)d & 2) {
166     *d++ = pattern;
167     count--;
168   }
169   dl = (void *)d;
170   pattern |= pattern << 16;
171
172   while (count >= 2) {
173     *dl++ = pattern;
174     count -= 2;
175   }
176   if (count)
177     *(u16 *)dl = pattern;
178 }
179
180 static void blt_tr(void *dst, void *src, u32 trc, int w)
181 {
182   u16 *d = (u16 *)((long)dst & ~1);
183   u16 *s = (u16 *)((long)src & ~1);
184
185   // XXX: optimize
186   for (; w > 0; d++, s++, w--)
187     if (*s != trc)
188       *d = *s;
189 }
190
191 #define dump_blitter() \
192 { \
193   u32 *r = &blitter.dstctrl; \
194   int i; \
195   for (i = 0; i < 4*4; i++, r++) { \
196     g_printf("%08x ", *r); \
197     if ((i & 3) == 3) \
198       g_printf("\n"); \
199   } \
200 }
201
202 static void *uppermem_lookup(u32 addr, u8 **mem_end)
203 {
204   // XXX: maybe support mirroring?
205   if ((addr & 0xfe000000) != 0x02000000)
206     return NULL;
207
208   *mem_end = (u8 *)mmsp2.umem + 0x02000000;
209   return (u8 *)mmsp2.umem - 0x02000000 + addr;
210 }
211
212 static void blitter_do(void)
213 {
214   u8 *dst, *dste, *src = NULL, *srce = NULL;
215   int w, h, sstrd, dstrd;
216   int to_screen = 0;
217   u32 bpp, addr;
218
219   w = blitter.size & 0x7ff;
220   h = (blitter.size >> 16) & 0x7ff;
221   sstrd = blitter.srcstride;
222   dstrd = blitter.dststride;
223
224   // XXX: need to confirm this..
225   addr = (blitter.dstaddr & ~3) | ((blitter.dstctrl & 0x1f) >> 3);
226
227   // use dst bpp.. How does it do blits with different src bpp?
228   bpp = (blitter.dstctrl & 0x20) ? 16 : 8;
229
230   // maybe the screen?
231   if (((w == 320 && h == 240) || // blit whole screen
232        (w * h >= 320*240/2)) &&  // ..or at least half of the area
233        mmsp2.mlc_stl_adr <= addr && addr < mmsp2.mlc_stl_adr + 320*240*2)
234     to_screen = 1;
235
236   dst = uppermem_lookup(addr, &dste);
237
238   // XXX: assume fill if no SRCENB, but it could be pattern blit..
239   if (blitter.srcctrl & SRCCTRL_SRCENB) {
240     if (!(blitter.srcctrl & SRCCTRL_INVIDEO))
241       goto bad_blit;
242
243     addr = (blitter.srcaddr & ~3) | ((blitter.srcctrl & 0x1f) >> 3);
244     src = uppermem_lookup(addr, &srce);
245     if (src == NULL)
246       goto bad_blit;
247
248     if (src + sstrd * h > srce) {
249       err("blit %08x->%08x %dx%d did not fit src\n",
250         blitter.srcaddr, blitter.dstaddr, w, h);
251       h = (srce - src) / sstrd;
252     }
253   }
254
255   if (dst == NULL)
256     goto bad_blit;
257
258   if (dst + dstrd * h > dste) {
259     err("blit %08x->%08x %dx%d did not fit dst\n",
260       blitter.srcaddr, blitter.dstaddr, w, h);
261     h = (dste - dst) / dstrd;
262   }
263
264   if (src != NULL) {
265     // copy
266     if (bpp == 16 && (blitter.ctrl & CTRL_TRANSPARENCYENB)) {
267       u32 trc = blitter.ctrl >> 16;
268       for (; h > 0; h--, dst += dstrd, src += sstrd)
269         blt_tr(dst, src, trc, w);
270     }
271     else {
272       for (; h > 0; h--, dst += dstrd, src += sstrd)
273         memcpy(dst, src, w * bpp / 8);
274     }
275   }
276   else {
277     // fill. Assume the pattern is cleared and bg color is used
278     u32 bgc = blitter.patbackcolor & 0xffff;
279     if (bpp == 16) {
280       for (; h > 0; h--, dst += dstrd)
281         memset16(dst, bgc, w);
282     }
283     else {
284       for (; h > 0; h--, dst += dstrd)
285         memset(dst, bgc, w); // bgc?
286     }
287   }
288
289   if (to_screen) {
290     fb_sync_thread_futex = 1;
291     g_futex_raw(&fb_sync_thread_futex, FUTEX_WAKE, 1, NULL);
292   }
293   return;
294
295 bad_blit:
296   err("blit %08x->%08x %dx%d translated to %p->%p\n",
297     blitter.srcaddr, blitter.dstaddr, w, h, src, dst);
298   dump_blitter();
299 }
300
301 // FIXME: pass real dimensions to blitters
302 static void mlc_flip(void *src, int bpp, int stride)
303 {
304   static int old_bpp;
305
306   // only pass pal to host if it's dirty
307   if (bpp <= 8 && mmsp2.v.dirty_pal) {
308     if (mmsp2.v.dirty_pal == DIRTY_PAL_MMSP2)
309       host_video_update_pal32(mmsp2.mlc_stl_pallt_d32);
310     else
311       host_video_update_pal16(mmsp2.mlcpalette);
312     mmsp2.v.dirty_pal = 0;
313   }
314
315   if (bpp != old_bpp) {
316     host_video_change_bpp(bpp);
317     old_bpp = bpp;
318   }
319
320   switch (bpp) {
321   case  4:
322     host_video_blit4(src, 320, 240, stride);
323     break;
324
325   case  8:
326     host_video_blit8(src, 320, 240, stride);
327     break;
328
329   case 16:
330     host_video_blit16(src, 320, 240, stride);
331     break;
332
333   case 24:
334     // TODO
335     break;
336   }
337 }
338
339 static void *fb_sync_thread(void *arg)
340 {
341   unsigned long sigmask[2] = { ~0ul, ~0ul };
342   struct timespec ts = { 0, 0 };
343   int invalid_fb_addr = 1;
344   int manual_refresh = 0;
345   int frame_counter = 0;
346   int wait_ret;
347
348   // this thread can't run any signal handlers since the
349   // app's stack/tls stuff will never be set up here
350   sigmask[0] &= ~(1ul << (SIGSEGV - 1));
351   g_rt_sigprocmask_raw(SIG_SETMASK, sigmask, NULL, sizeof(sigmask));
352
353   //ret = setpriority(PRIO_PROCESS, 0, -1);
354   //log("setpriority %d\n", ret);
355
356   // tell the main thread we're done init
357   fb_sync_thread_futex = 0;
358   g_futex_raw(&fb_sync_thread_futex, FUTEX_WAKE, 1, NULL);
359
360   while (1) {
361     u8 *gp2x_fb, *gp2x_fb_end;
362
363     wait_ret = g_futex_raw(&fb_sync_thread_futex, FUTEX_WAIT, 0, &ts);
364
365     // this is supposed to be done atomically, but to make life
366     // easier ignore it for now, race impact is low anyway
367     fb_sync_thread_futex = 0;
368
369     if (wait_ret != 0 && wait_ret != -EWOULDBLOCK
370         && wait_ret != -ETIMEDOUT)
371     {
372       err("fb_thread: futex error: %d\n", wait_ret);
373       sleep(1);
374       goto check_keys;
375     }
376     if (fb_sync_thread_paused) {
377       ts.tv_nsec = 100000000;
378       goto check_keys;
379     }
380
381     if (wait_ret == 0) {
382       ts.tv_nsec = 50000000;
383       manual_refresh++;
384       if (manual_refresh == 2)
385         dbg("fb_thread: switch to manual refresh\n");
386     } else {
387       ts.tv_nsec = 16666667;
388       if (manual_refresh > 1)
389         dbg("fb_thread: switch to auto refresh\n");
390       manual_refresh = 0;
391     }
392
393     gp2x_fb = uppermem_lookup(mmsp2.mlc_stl_adr, &gp2x_fb_end);
394     if (gp2x_fb == NULL || gp2x_fb + 320*240 * mmsp2.v.bpp / 8 > gp2x_fb_end) {
395       if (!invalid_fb_addr) {
396         err("fb_thread: %08x is out of range\n", mmsp2.mlc_stl_adr);
397         invalid_fb_addr = 1;
398       }
399       continue;
400     }
401
402     invalid_fb_addr = 0;
403     mlc_flip(gp2x_fb, mmsp2.v.bpp, mmsp2.v.stride);
404
405     frame_counter++;
406     if (frame_counter & 0x0f)
407       continue;
408
409 check_keys:
410     // this is to check for kill key, in case main thread hung
411     // or something else went wrong.
412     pollux.btn_state = host_read_btns();
413   }
414 }
415
416 static void fb_thread_pause(void)
417 {
418   fb_sync_thread_paused = 1;
419   // wait until it finishes last refresh
420   // that it might be doing now
421   usleep(10000);
422 }
423
424 static void fb_thread_resume(void)
425 {
426   fb_sync_thread_paused = 0;
427 }
428
429 static u32 xread32_io_cmn(u32 a, u32 *handled)
430 {
431   u32 d = 0;
432
433   *handled = 1;
434   switch (a) {
435   // Wiz stuff
436   case 0x402c: // MLCVSTRIDE0
437   case 0x4060: // MLCVSTRIDE1
438     d = pollux.v.stride;
439     break;
440   case 0x4038: // MLCADDRESS0
441   case 0x406c: // MLCADDRESS1
442     d = pollux.mlc_stl_adr;
443     break;
444   // wiz_lib reads:
445   //  ???? ???? YXBA DURiLe ???? VdVuMS LR?? ????
446   // |     GPIOC[31:16]    |    GPIOB[31:16]     |
447   case 0xa058: // GPIOBPAD
448     d =  (pollux.btn_state >> 1) & 0x0100;
449     d |= (pollux.btn_state << 1) & 0x0200;
450     d |= (pollux.btn_state >> 3) & 0x0080;
451     d |= (pollux.btn_state >> 5) & 0x0040;
452     d |= (pollux.btn_state >> 6) & 0x0c00;
453     d <<= 16;
454     d = ~d;
455     break;
456   case 0xa098: // GPIOCPAD
457     pollux.btn_state = host_read_btns();
458     d =  (pollux.btn_state >> 8) & 0x00f0;
459     d |= (pollux.btn_state >> 1) & 0x0008;
460     d |= (pollux.btn_state << 2) & 0x0004;
461     d |= (pollux.btn_state >> 5) & 0x0002;
462     d |= (pollux.btn_state >> 2) & 0x0001;
463     d <<= 16;
464     d = ~d;
465     break;
466   default:
467     *handled = 0;
468     break;
469   }
470
471   return d;
472 }
473
474 static u32 xread8(u32 a)
475 {
476   iolog("r8 ", a, 0, 8);
477   iolog_unh("r8 ", a, 0, 8);
478   return 0;
479 }
480
481 static u32 xread16(u32 a)
482 {
483   static u32 fudge, old_a;
484   u32 d = 0, t;
485
486   if ((a & 0xffff0000) == 0x7f000000) {
487     u32 a_ = a & 0xffff;
488     switch (a_) {
489     case 0x0910: // FPLL
490     case 0x0912:
491       d = 0x9407;
492       break;
493     // minilib reads as:
494     //  0000 P000 VuVd00 0000 YXBA RLSeSt 0Ri0D 0Le0U
495     // |        GPIOD        |GPIOC[8:15]|GPIOM[0:7] |
496     // /dev/GPIO:
497     //             ... 0PVdVu ...
498     case 0x1184: // GPIOC
499       d = ~mmsp2.btn_state & 0xff00;
500       d |= 0x00ff;
501       break;
502     case 0x1186: // GPIOD
503       t = ~mmsp2.btn_state;
504       d  = (t >> 9)  & 0x0080;
505       d |= (t >> 11) & 0x0040;
506       d |= (t >> 7)  & 0x0800;
507       d |= 0x373b;
508       break;
509     case 0x1198: // GPIOM
510       mmsp2.btn_state = host_read_btns();
511       d = ~mmsp2.btn_state & 0xff;
512       d |= 0x01aa;
513       break;
514     case 0x1836: // reserved
515       d = 0x2330;
516       break;
517     case 0x2816: // DPC_X_MAX
518       d = 319;
519       break;
520     case 0x2818: // DPC_Y_MAX
521       d = 239;
522       break;
523     case 0x28da:
524       d = mmsp2.mlc_stl_cntl;
525       break;
526     case 0x290e:
527     case 0x2912:
528       d = mmsp2.mlc_stl_adrl;
529       break;
530     case 0x2910:
531     case 0x2914:
532       d = mmsp2.mlc_stl_adrh;
533       break;
534     case 0x2958:
535       d = mmsp2.mlc_stl_pallt_a;
536       break;
537
538     default:
539       d = xread32_io_cmn(a_, &t);
540       if (!t)
541         goto unk;
542       if (!(a_ & 2))
543         d >>= 16;
544       break;
545     }
546     goto out;
547   }
548
549 unk:
550   if (a == old_a) {
551     d = fudge;
552     fudge = ~fudge;
553   }
554   old_a = a;
555   iolog_unh("r16", a, d & 0xffff, 16);
556
557 out:
558   d &= 0xffff;
559   iolog("r16", a, d, 16);
560   return d;
561 }
562
563 static u32 xread32(u32 a)
564 {
565   u32 d = 0;
566   if ((a & 0xfff00000) == 0x7f000000) {
567     u32 a_ = a & 0xffff;
568     struct timespec ts;
569     u64 t64;
570     u32 t;
571
572     switch (a_) {
573     case 0x0a00: // TCOUNT, 1/7372800s
574       g_clock_gettime_raw(CLOCK_REALTIME, &ts);
575       t64 = (u64)ts.tv_sec * 1000000000 + ts.tv_nsec;
576       // t * 7372800.0 / 1000000000 * 0x100000000 ~= t * 31665935
577       t64 *= 31665935;
578       d = t64 >> 32;
579       break;
580
581     default:
582       d = xread32_io_cmn(a_, &t);
583       if (!t)
584         goto unh;
585       break;
586     }
587     goto out;
588   }
589   if ((a & 0xfff00000) == 0x7f100000) {
590     u32 *bl = &blitter.dstctrl;
591     u32 a_ = a & 0xfff;
592     if (a_ < 0x40) {
593       d = bl[a_ / 4];
594       if (a_ == 0x34)
595         d = 0; // not busy
596       goto out;
597     }
598   }
599
600 unh:
601   iolog_unh("r32", a, d, 32);
602
603 out:
604   iolog("r32", a, d, 32);
605   return d;
606 }
607
608 static void xwrite8(u32 a, u32 d)
609 {
610   iolog("w8 ", a, d, 8);
611   iolog_unh("w8 ", a, d, 8);
612 }
613
614 static void xwrite16(u32 a, u32 d)
615 {
616   iolog("w16", a, d, 16);
617   if ((a & 0xfff00000) == 0x7f000000) {
618     u32 a_ = a & 0xffff;
619     switch (a_) {
620       case 0x28da: {
621         int mode;
622         mmsp2.mlc_stl_cntl = d | 0xaa;
623         mode = (d >> 9) & 3;
624         mmsp2.v.bpp = mode ? mode * 8 : 4;
625         break;
626       }
627       case 0x290c:
628         mmsp2.v.stride = d;
629         return;
630       case 0x290e:
631       case 0x2910:
632         // odd addresses don't affect LCD. What about TV?
633         return;
634       case 0x2912:
635         mmsp2.mlc_stl_adrl = d;
636         return;
637       case 0x2914:
638         mmsp2.mlc_stl_adrh = d;
639         if (mmsp2.mlc_stl_adr != mmsp2.old_mlc_stl_adr) {
640           // ask for refresh
641           fb_sync_thread_futex = 1;
642           g_futex_raw(&fb_sync_thread_futex, FUTEX_WAKE, 1, NULL);
643         }
644         mmsp2.old_mlc_stl_adr = mmsp2.mlc_stl_adr;
645         return;
646       case 0x2958:
647         mmsp2.mlc_stl_pallt_a = d & 0x1ff;
648         return;
649       case 0x295a:
650         mmsp2.mlc_stl_pallt_d[mmsp2.mlc_stl_pallt_a++] = d;
651         mmsp2.mlc_stl_pallt_a &= 0x1ff;
652         mmsp2.v.dirty_pal = DIRTY_PAL_MMSP2;
653         return;
654     }
655   }
656   iolog_unh("w16", a, d, 16);
657 }
658
659 static void xwrite32(u32 a, u32 d)
660 {
661   iolog("w32", a, d, 32);
662
663   if ((a & 0xfff00000) == 0x7f000000) {
664     u32 a_ = a & 0xffff;
665     switch (a_) {
666     // Wiz
667     case 0x4024: // MLCCONTROL0
668     case 0x4058: // MLCCONTROL1
669       pollux.mlccontrol = d;
670       if (!(d & 0x20))
671         return; // layer not enabled
672       if ((d >> 16) == 0x443A)
673         pollux.v.bpp = 8;
674       else
675         pollux.v.bpp = 16;
676       return;
677     case 0x402c: // MLCVSTRIDE0
678     case 0x4060: // MLCVSTRIDE1
679       pollux.v.stride = d;
680       return;
681     case 0x4038: // MLCADDRESS0
682     case 0x406c: // MLCADDRESS1
683       pollux.mlc_stl_adr = d;
684       if (d != mmsp2.old_mlc_stl_adr) {
685         // ask for refresh
686         fb_sync_thread_futex = 1;
687         g_futex_raw(&fb_sync_thread_futex, FUTEX_WAKE, 1, NULL);
688       }
689       mmsp2.old_mlc_stl_adr = d;
690       return;
691     case 0x403c: // MLCPALETTE0
692     case 0x4070: // MLCPALETTE1
693       pollux.mlcpalette[d >> 24] = d;
694       pollux.v.dirty_pal = DIRTY_PAL_POLLUX;
695       return;
696     }
697   }
698   if ((a & 0xfff00000) == 0x7f100000) {
699     u32 *bl = &blitter.dstctrl;
700     u32 a_ = a & 0xfff;
701     if (a_ < 0x40) {
702       bl[a_ / 4] = d;
703       if (a_ == 0x34 && (d & 1))
704         blitter_do();
705       return;
706     }
707   }
708   iolog_unh("w32", a, d, 32);
709 }
710
711 #define LINKPAGE_SIZE 0x1000
712 #define LINKPAGE_COUNT 4
713 #define LINKPAGE_ALLOC (LINKPAGE_SIZE * LINKPAGE_COUNT)
714
715 struct op_context {
716   u32 pc;
717   u32 op;
718   u32 code[0];
719 };
720
721 struct op_linkpage {
722   void (*handler)(struct op_context *op_ctx);
723   u32 code[0];
724 };
725
726 struct op_stackframe {
727   u32 saved_regs[15];
728   u32 cpsr;
729 };
730
731 static struct op_linkpage *g_linkpage;
732 static u32 *g_code_ptr;
733 static int g_linkpage_count;
734
735 enum opcond {
736   C_EQ, C_NE, C_CS, C_CC, C_MI, C_PL, C_VS, C_VC,
737   C_HI, C_LS, C_GE, C_LT, C_GT, C_LE, C_AL,
738 };
739 enum cpsr_cond {
740   CPSR_N = (1u << 31),
741   CPSR_Z = (1u << 30),
742   CPSR_C = (1u << 29),
743   CPSR_V = (1u << 28),
744 };
745
746 #define BIT_SET(v, b) (v & (1 << (b)))
747
748 void emu_handle_op(struct op_context *op_ctx, struct op_stackframe *sframe)
749 {
750   u32 *regs = sframe->saved_regs;
751   u32 cpsr = sframe->cpsr;
752   u32 op = op_ctx->op;
753   u32 t, shift, ret, addr;
754   int i, rn, rd, cond;
755
756   cond = (op & 0xf0000000) >> 28;
757   rd = (op & 0x0000f000) >> 12;
758   rn = (op & 0x000f0000) >> 16;
759
760   if (cond != 0x0e) {
761     switch (cond) {
762     case C_EQ: if ( (cpsr & CPSR_Z)) break; return;
763     case C_NE: if (!(cpsr & CPSR_Z)) break; return;
764     case C_CS: if ( (cpsr & CPSR_C)) break; return;
765     case C_CC: if (!(cpsr & CPSR_C)) break; return;
766     case C_MI: if ( (cpsr & CPSR_N)) break; return;
767     case C_PL: if (!(cpsr & CPSR_N)) break; return;
768     case C_VS: if ( (cpsr & CPSR_V)) break; return;
769     case C_VC: if (!(cpsr & CPSR_V)) break; return;
770     default:
771       goto unhandled;
772     }
773   }
774
775   if ((op & 0x0f200090) == 0x01000090) { // AM3: LDRH, STRH
776     if (!BIT_SET(op, 5)) // !H
777       goto unhandled;
778     if (BIT_SET(op, 6) && !BIT_SET(op, 20)) // S && !L
779       goto unhandled;
780
781     if (BIT_SET(op, 22))                // imm offset
782       t = ((op & 0xf00) >> 4) | (op & 0x0f);
783     else                                // reg offset
784       t = regs[op & 0x000f];
785
786     if (!BIT_SET(op, 23))
787       t = -t;
788     addr = regs[rn] + t;
789
790     if (BIT_SET(op, 20)) { // Load
791       ret = xread16(addr);
792       if (BIT_SET(op, 6)) { // S
793         ret <<= 16;
794         ret = (signed int)ret >> 16;
795       }
796       regs[rd] = ret;
797     }
798     else
799       xwrite16(addr, regs[rd]);
800   }
801   else if ((op & 0x0c000000) == 0x04000000) { // load/store word/byte
802     if (BIT_SET(op, 21))
803       goto unhandled;                   // unprivileged
804     if (BIT_SET(op, 25)) {              // reg offs
805       if (BIT_SET(op, 4))
806         goto unhandled;                 // nah it's media
807
808       t = regs[op & 0x000f];
809       shift = (op & 0x0f80) >> 7;
810       switch ((op & 0x0060) >> 5) {
811         case 0: t = t << shift; break;
812         case 1: t = t >> (shift + 1); break;
813         case 2: t = (signed int)t >> (shift + 1); break;
814         case 3: goto unhandled; // I'm just lazy
815       }
816     }
817     else                                // imm offs
818       t = op & 0x0fff;
819
820     if (!BIT_SET(op, 23))
821       t = -t;
822
823     addr = regs[rn];
824     if (BIT_SET(op, 24))   // pre-indexed
825       addr += t;
826     if (!BIT_SET(op, 24) || BIT_SET(op, 21))
827       regs[rn] += t;       // writeback
828
829     if (BIT_SET(op, 20)) { // Load
830       if (BIT_SET(op, 22)) // Byte
831         ret = xread8(addr);
832       else
833         ret = xread32(addr);
834       regs[rd] = ret;
835     }
836     else {
837       if (BIT_SET(op, 22)) // Byte
838         xwrite8(addr, regs[rd]);
839       else
840         xwrite32(addr, regs[rd]);
841     }
842   }
843   else
844     goto unhandled;
845
846 #if 0
847   if (addr != addr_check) {
848     fprintf(stderr, "bad calculated addr: %08x vs %08x\n", addr, addr_check);
849     abort();
850   }
851 #endif
852   return;
853
854 unhandled:
855   err("unhandled IO op %08x @ %08x\n", op, op_ctx->pc);
856   for (i = 0; i < 8-1; i++)
857     err(" r%d=%08x  r%-2d=%08x\n", i, regs[i], i+8, regs[i+8]);
858   err(" r%d=%08x cpsr=%08x\n", i, regs[i], cpsr);
859   abort();
860 }
861
862 static u32 make_offset12(u32 *pc, u32 *target)
863 {
864   int lp_offs, u = 1;
865
866   lp_offs = (char *)target - (char *)pc - 2*4;
867   if (lp_offs < 0) {
868     lp_offs = -lp_offs;
869     u = 0;
870   }
871   if (lp_offs >= LINKPAGE_SIZE) {
872     err("linkpage too far: %d\n", lp_offs);
873     abort();
874   }
875
876   return (u << 23) | lp_offs;
877 }
878
879 static u32 make_jmp(u32 *pc, u32 *target, int bl)
880 {
881   int jmp_val;
882
883   jmp_val = target - pc - 2;
884   if (jmp_val < (int)0xff000000 || jmp_val > 0x00ffffff) {
885     err("jump out of range (%p -> %p)\n", pc, target);
886     abort();
887   }
888
889   return 0xea000000 | (bl << 24) | (jmp_val & 0x00ffffff);
890 }
891
892 static void emit_op(u32 op)
893 {
894   *g_code_ptr++ = op;
895 }
896
897 static void emit_op_io(u32 op, u32 *target)
898 {
899   op |= make_offset12(g_code_ptr, target);
900   emit_op(op);
901 }
902
903 static void init_linkpage(void)
904 {
905   g_linkpage->handler = emu_call_handle_op;
906   g_code_ptr = g_linkpage->code;
907 }
908
909 static void segv_sigaction(int num, siginfo_t *info, void *ctx)
910 {
911   struct ucontext *context = ctx;
912   u32 *regs = (u32 *)&context->uc_mcontext.arm_r0;
913   u32 *pc = (u32 *)regs[15];
914   struct op_context *op_ctx;
915   int i, lp_size;
916
917   if (((regs[15] ^ (u32)&segv_sigaction) & 0xff000000) == 0 ||         // PC is in our segment or
918       (((regs[15] ^ (u32)g_linkpage) & ~(LINKPAGE_ALLOC - 1)) == 0) || // .. in linkpage
919       ((long)info->si_addr & 0xffe00000) != 0x7f000000)                // faulting not where expected
920   {
921     // real crash - time to die
922     err("segv %d %p @ %08x\n", info->si_code, info->si_addr, regs[15]);
923     for (i = 0; i < 8; i++)
924       dbg(" r%d=%08x r%-2d=%08x\n", i, regs[i], i+8, regs[i+8]);
925     signal(num, SIG_DFL);
926     raise(num);
927     return;
928   }
929   segvlog("segv %d %p @ %08x\n", info->si_code, info->si_addr, regs[15]);
930
931   // spit PC and op
932   op_ctx = (void *)g_code_ptr;
933   op_ctx->pc = (u32)pc;
934   op_ctx->op = *pc;
935   g_code_ptr = &op_ctx->code[0];
936
937   // emit jump to code ptr
938   *pc = make_jmp(pc, g_code_ptr, 0);
939
940   // generate code:
941   emit_op   (0xe50d0000 + 0xf00 - 4 * 0);                        // str r0, [sp, #(-0xf00 + r0_offs)]
942   emit_op   (0xe50de000 + 0xf00 - 4 * 14);                       // str lr, [sp, #(-0xf00 + lr_offs)]
943   emit_op   (0xe24f0000 + (g_code_ptr - (u32 *)op_ctx + 2) * 4); // sub r0, pc, #op_ctx
944   emit_op   (0xe1a0e00f);                                        // mov lr, pc
945   emit_op_io(0xe51ff000, (u32 *)&g_linkpage->handler);           // ldr pc, =handle_op
946   emit_op   (0xe51de000 + 0xf00 - 4 * 14);                       // ldr lr, [sp, #(-0xf00 + lr_offs)]
947   emit_op   (make_jmp(g_code_ptr, pc + 1, 0));                   // jmp <back>
948
949   // sync caches
950   sys_cacheflush(pc, pc + 1);
951   sys_cacheflush(g_linkpage, g_code_ptr);
952
953   lp_size = (char *)g_code_ptr - (char *)g_linkpage;
954   segvlog("code #%d %d/%d\n", g_linkpage_count, lp_size, LINKPAGE_SIZE);
955
956   if (lp_size + 13*4 > LINKPAGE_SIZE) {
957     g_linkpage_count++;
958     if (g_linkpage_count >= LINKPAGE_COUNT) {
959       err("too many linkpages needed\n");
960       abort();
961     }
962     g_linkpage = (void *)((char *)g_linkpage + LINKPAGE_SIZE);
963     init_linkpage();
964   }
965   //handle_op(regs[15], op, regs, (u32)info->si_addr);
966   //regs[15] += 4;
967 }
968
969 void emu_init(void *map_bottom)
970 {
971   sigaction_t segv_action = {
972     .sa_sigaction = segv_sigaction,
973     .sa_flags = SA_SIGINFO,
974   };
975   void *pret;
976   int ret;
977
978 #ifdef PND
979   if (geteuid() == 0) {
980     err("don't try to run as root, device registers or memory "
981         "might get trashed crashing the OS or even damaging the device.\n");
982     exit(1);
983   }
984 #endif
985
986   g_linkpage = (void *)(((u32)map_bottom - LINKPAGE_ALLOC) & ~0xfff);
987   pret = mmap(g_linkpage, LINKPAGE_ALLOC, PROT_READ|PROT_WRITE,
988               MAP_PRIVATE|MAP_ANONYMOUS|MAP_FIXED, -1, 0);
989   if (pret != g_linkpage) {
990     perror(PFX "mmap linkpage");
991     exit(1);
992   }
993   log("linkpages @ %p\n", g_linkpage);
994   init_linkpage();
995
996   // host stuff
997   ret = host_init();
998   if (ret != 0) {
999     err("can't init host\n");
1000     exit(1);
1001   }
1002
1003   ret = host_video_init(NULL, 0);
1004   if (ret != 0) {
1005     err("can't init host video\n");
1006     exit(1);
1007   }
1008
1009   // TODO: check if this really fails on Wiz..
1010   mmsp2.umem = mmap(NULL, 0x2000000, PROT_READ|PROT_WRITE|PROT_EXEC,
1011                     MAP_PRIVATE|MAP_ANONYMOUS, -1, 0);
1012 #ifdef WIZ
1013   if (mmsp2.umem == MAP_FAILED) {
1014     // we are short on memmory on Wiz, need special handling
1015     extern void *host_mmap_upper(void);
1016     mmsp2.umem = host_mmap_upper();
1017   }
1018 #endif
1019   if (mmsp2.umem == MAP_FAILED) {
1020     perror(PFX "mmap upper mem");
1021     exit(1);
1022   }
1023
1024   pret = mmap(NULL, THREAD_STACK_SIZE, PROT_READ|PROT_WRITE|PROT_EXEC,
1025               MAP_PRIVATE|MAP_ANONYMOUS|MAP_GROWSDOWN, -1, 0);
1026   if (mmsp2.umem == MAP_FAILED) {
1027     perror(PFX "mmap thread stack");
1028     exit(1);
1029   }
1030   fb_sync_thread_futex = 1;
1031   ret = g_clone(CLONE_VM | CLONE_FS | CLONE_FILES
1032                 | CLONE_SIGHAND | CLONE_THREAD,
1033                 (char *)pret + THREAD_STACK_SIZE, 0, 0, 0,
1034                 fb_sync_thread);
1035   if (ret == 0 || ret == -1) {
1036     perror(PFX "start fb thread");
1037     exit(1);
1038   }
1039   g_futex_raw(&fb_sync_thread_futex, FUTEX_WAIT, 1, NULL);
1040
1041   // defaults
1042   mmsp2.mlc_stl_adr = 0x03101000; // fb2 is at 0x03381000
1043   mmsp2.mlc_stl_cntl = 0x4ab; // 16bpp, region 1 active
1044   mmsp2.v.width = 320;
1045   mmsp2.v.height = 240;
1046   mmsp2.v.stride = 320*2;
1047   mmsp2.v.bpp = 16;
1048   mmsp2.v.dirty_pal = 1;
1049
1050   sigemptyset(&segv_action.sa_mask);
1051   sigaction(SIGSEGV, &segv_action, NULL);
1052 }
1053
1054 long emu_read_gpiodev(void *buf, int count)
1055 {
1056   if (count <= 0) {
1057     err("gpiodev read %d?\n", count);
1058     return -EINVAL;
1059   }
1060   if (count > 4)
1061     count = 4;
1062
1063   mmsp2.btn_state = host_read_btns();
1064   memcpy(buf, &mmsp2.btn_state, count);
1065   return count;
1066 }
1067
1068 static long emu_mmap_dev(unsigned int length, int prot, int flags, unsigned int offset)
1069 {
1070   u8 *umem, *umem_end;
1071
1072   // SoC regs
1073   if ((offset & ~0x1ffff) == 0xc0000000) {
1074     return g_mmap2_raw((void *)0x7f000000, length, PROT_NONE,
1075       MAP_PRIVATE|MAP_ANONYMOUS|MAP_FIXED|MAP_NORESERVE, -1, 0);
1076   }
1077   // MMSP2 blitter
1078   if ((offset & ~0xffff) == 0xe0020000) {
1079     return g_mmap2_raw((void *)0x7f100000, length, PROT_NONE,
1080       MAP_PRIVATE|MAP_ANONYMOUS|MAP_FIXED|MAP_NORESERVE, -1, 0);
1081   }
1082   // upper mem
1083   if ((offset & 0xfe000000) != 0x02000000) {
1084     err("unexpected devmem mmap @ %08x\n", offset);
1085     return -EINVAL;
1086   }
1087
1088   umem = uppermem_lookup(offset, &umem_end);
1089   if (umem + length > umem_end)
1090     err("warning: uppermem @ %08x overflows by %d bytes\n",
1091         offset, umem + length - umem_end);
1092
1093   dbg("upper mem @ %08x %x = %p\n", offset, length, umem);
1094   return (long)umem;
1095 }
1096
1097 long emu_do_mmap(unsigned int length, int prot, int flags, int fd,
1098   unsigned int offset)
1099 {
1100   if (fd == FAKEDEV_MEM)
1101     return emu_mmap_dev(length, prot, flags, offset);
1102
1103   if (fd == FAKEDEV_FB0)
1104     return emu_mmap_dev(length, prot, flags, offset + 0x03101000);
1105
1106   if (fd == FAKEDEV_FB1)
1107     return emu_mmap_dev(length, prot, flags, offset + 0x03381000);
1108
1109   err("bad/ni mmap(?, %d, %x, %x, %d, %08x)\n", length, prot, flags, fd, offset);
1110   return -EINVAL;
1111 }
1112
1113 long emu_do_munmap(void *addr, unsigned int length)
1114 {
1115   u8 *p = addr;
1116
1117   // don't allow to unmap upper mem
1118   if ((u8 *)mmsp2.umem <= p && p < (u8 *)mmsp2.umem + 0x2000000) {
1119     dbg("ignoring munmap: %p %x\n", addr, length);
1120     return 0;
1121   }
1122
1123   return -EAGAIN;
1124 }
1125
1126 static void emu_sound_open(int fd)
1127 {
1128 #ifdef PND
1129   int ret, frag;
1130
1131   // set default buffer size to 16 * 1K
1132   frag = (16<<16) | 10; // 16K
1133   ret = g_ioctl_raw(fd, SNDCTL_DSP_SETFRAGMENT, &frag);
1134   if (ret != 0)
1135     err("snd ioctl SETFRAGMENT %08x: %d\n", frag, ret);
1136 #endif
1137 }
1138
1139 static long emu_sound_ioctl(int fd, int request, void *argp)
1140 {
1141   int *arg = argp;
1142
1143 #if 0
1144   dbg("snd ioctl(%d, %08x, %p)", fd, request, argp);
1145   if (arg != NULL)
1146     dbg_c(" [%d]", *arg);
1147   dbg_c("\n");
1148 #endif
1149
1150   /* People set strange frag settings on GP2X, which even manage
1151    * to break audio on pandora (causes writes to fail).
1152    * Catch this and set to something that works. */
1153   switch(request) {
1154     case SNDCTL_DSP_SETFRAGMENT: {
1155       int bsize, frag, frag_cnt;
1156       long ret;
1157
1158       if (arg == NULL)
1159         break;
1160
1161       frag = *arg & 0xffff;
1162       frag_cnt = *arg >> 16;
1163       bsize = frag_cnt << frag;
1164       if (frag < 10 || bsize < 4096*4 || bsize > 4096*4*2) {
1165         /*
1166          * ~4ms. gpSP wants small buffers or else it stutters
1167          * because of it's audio thread sync stuff
1168          * XXX: hardcoding, as low samplerates will result in small fragment size,
1169          * which itself causes ALSA stall and hangs the program.
1170          * Also some apps change samplerate without reopening /dev/dsp,
1171          * which causes ALSA to reject SNDCTL_DSP_SETFRAGMENT.
1172          */
1173         bsize = 44100 / 250 * 4;
1174
1175         for (frag = 0; bsize; bsize >>= 1, frag++)
1176           ;
1177
1178         frag_cnt = 16;
1179       }
1180
1181       frag |= frag_cnt << 16;
1182       ret = g_ioctl_raw(fd, SNDCTL_DSP_SETFRAGMENT, &frag);
1183       if (ret != 0)
1184         err("snd ioctl SETFRAGMENT %08x: %ld\n", frag, ret);
1185       // indicate success even if we fail (because of ALSA mostly),
1186       // things like MikMod will bail out otherwise.
1187       return 0;
1188     }
1189     case SNDCTL_DSP_SYNC:
1190       // Franxis tends to use sync/write loops, bad idea under ALSA
1191       return 0;
1192     default:
1193       break;
1194   }
1195
1196   return g_ioctl_raw(fd, request, argp);
1197 }
1198
1199 long emu_do_ioctl(int fd, int request, void *argp)
1200 {
1201   if (fd == emu_interesting_fds[IFD_SOUND].fd)
1202     return emu_sound_ioctl(fd, request, argp);
1203
1204   switch (fd) {
1205   /* *********************** */
1206   case FAKEDEV_FB0:
1207   case FAKEDEV_FB1:
1208     if (argp == NULL)
1209       goto fail;
1210
1211     switch (request) {
1212       case FBIOGET_FSCREENINFO: {
1213         struct fb_fix_screeninfo *fix = argp;
1214
1215         memset(fix, 0, sizeof(*fix));
1216         strcpy(fix->id, "mmsp2_RGB0");
1217         fix->type         = FB_TYPE_PACKED_PIXELS;
1218         fix->accel        = FB_ACCEL_NONE;
1219         fix->visual       = FB_VISUAL_TRUECOLOR;
1220         fix->line_length  = 320*2;
1221         fix->smem_start   = (fd == FAKEDEV_FB0) ? 0x03101000 : 0x03381000;
1222         fix->smem_len     = 320*240*2;
1223         return 0;
1224       }
1225       case FBIOGET_VSCREENINFO: {
1226         struct fb_var_screeninfo *var = argp;
1227         static const struct fb_bitfield fbb_red   = { offset: 11, length: 5, };
1228         static const struct fb_bitfield fbb_green = { offset:  5, length: 6, };
1229         static const struct fb_bitfield fbb_blue  = { offset:  0, length: 5, };
1230
1231         memset(var, 0, sizeof(*var));
1232         var->activate     = FB_ACTIVATE_NOW;
1233         var->xres         =
1234         var->xres_virtual = 320;
1235         var->yres         =
1236         var->yres_virtual = 240;
1237         var->width        =
1238         var->height       = -1;
1239         var->vmode        = FB_VMODE_NONINTERLACED;
1240         var->bits_per_pixel = 16;
1241         var->red          = fbb_red;
1242         var->green        = fbb_green;
1243         var->blue         = fbb_blue;
1244         return 0;
1245       }
1246       case FBIOPUT_VSCREENINFO: {
1247         struct fb_var_screeninfo *var = argp;
1248         dbg(" put vscreen: %dx%d@%d\n", var->xres, var->yres, var->bits_per_pixel);
1249         if (var->xres != 320 || var->yres != 240 || var->bits_per_pixel != 16)
1250           return -1;
1251         return 0;
1252       }
1253     }
1254
1255   /* *********************** */
1256   case FAKEDEV_TTY0:
1257     // fake tty0 to make GPH SDL happy
1258     if (request == 0x4b46) // KDGKBENT
1259       return -1;
1260     return 0;
1261   }
1262
1263 fail:
1264   err("bad/ni ioctl(%d, %08x, %p)\n", fd, request, argp);
1265   return -EINVAL;
1266 }
1267
1268 struct dev_fd_t emu_interesting_fds[] = {
1269   [IFD_SOUND] = { "/dev/dsp", -1, emu_sound_open },
1270   { NULL, 0, NULL },
1271 };
1272
1273 static const struct {
1274   const char *from;
1275   const char *to;
1276 } path_map[] = {
1277   { "/mnt/tmp", "./tmp" },
1278 };
1279
1280 static const char *wrap_path(const char *path)
1281 {
1282   char *buff, *p;
1283   size_t size;
1284   int i, len;
1285
1286   // do only path mapping for now
1287   for (i = 0; i < ARRAY_SIZE(path_map); i++) {
1288     p = strstr(path, path_map[i].from);
1289     if (p != NULL) {
1290       size = strlen(path) + strlen(path_map[i].to) + 1;
1291       buff = malloc(size);
1292       if (buff == NULL)
1293         break;
1294       len = p - path;
1295       strncpy(buff, path, len);
1296       snprintf(buff + len, size - len, "%s%s", path_map[i].to,
1297         path + len + strlen(path_map[i].from));
1298       dbg("mapped path \"%s\" -> \"%s\"\n", path, buff);
1299       return buff;
1300     }
1301   }
1302
1303   return path;
1304 }
1305
1306 static void wrap_path_free(const char *w_path, const char *old_path)
1307 {
1308   if (w_path != old_path)
1309     free((void *)w_path);
1310 }
1311
1312 void *emu_do_fopen(const char *path, const char *mode)
1313 {
1314   const char *w_path;
1315   FILE *ret;
1316
1317   w_path = wrap_path(path);
1318   ret = fopen(w_path, mode);
1319   wrap_path_free(w_path, path);
1320
1321   return ret;
1322 }
1323
1324 // FIXME: threads..
1325 int emu_do_system(const char *command)
1326 {
1327   static char tmp_path[512];
1328   int need_ginge = 0;
1329   const char *p2;
1330   char *p;
1331   int ret;
1332
1333   if (command == NULL)
1334     return -1;
1335
1336   for (p2 = command; *p2 && isspace(*p2); p2++)
1337     ;
1338
1339   if (*p2 == '.') // relative path?
1340     need_ginge = 1;
1341   else if (*p2 == '/' && strncmp(p2, "/bin", 4) && strncmp(p2, "/lib", 4)
1342            && strncmp(p2, "/sbin", 4) && strncmp(p2, "/usr", 4))
1343     // absolute path, but not a system command
1344     need_ginge = 1;
1345
1346   p2 = wrap_path(command);
1347   if (need_ginge) {
1348     make_local_path(tmp_path, sizeof(tmp_path), "ginge_prep");
1349     p = tmp_path + strlen(tmp_path);
1350
1351     snprintf(p, sizeof(tmp_path) - (p - tmp_path), " --nomenu %s", p2);
1352   }
1353   else
1354     snprintf(tmp_path, sizeof(tmp_path), "%s", p2);
1355   wrap_path_free(p2, command);
1356
1357   dbg("system: \"%s\"\n", tmp_path);
1358
1359   // the app might want the screen too..
1360   fb_thread_pause();
1361   ret = system(tmp_path);
1362   fb_thread_resume();
1363   return ret;
1364 }
1365
1366 int emu_do_execve(const char *filename, char *const argv[], char *const envp[])
1367 {
1368   const char **new_argv;
1369   char *prep_path;
1370   int i, ret, argc;
1371
1372   if (filename == NULL)
1373     return -1;
1374
1375   if (strstr(filename, "/gp2xmenu") != NULL)
1376     exit(0);
1377
1378   for (i = 0; argv[i] != NULL; i++)
1379     ;
1380   argc = i + 1;
1381
1382   new_argv = calloc(argc + 2, sizeof(new_argv[0]));
1383   if (new_argv == NULL)
1384     return -1;
1385
1386   prep_path = malloc(512);
1387   if (prep_path == NULL)
1388     return -1;
1389
1390   make_local_path(prep_path, 512, "ginge_prep");
1391   new_argv[0] = prep_path;
1392   new_argv[1] = "--nomenu";
1393   new_argv[2] = wrap_path(filename);
1394
1395   if (argv[0] != NULL)
1396     for (i = 1; argv[i] != NULL; i++)
1397       new_argv[i + 2] = argv[i];
1398
1399   dbg("execve \"%s\" %s \"%s\"\n", new_argv[0], new_argv[1], new_argv[2]);
1400   ret = execve(new_argv[0], (char **)new_argv, envp);
1401   perror("execve");
1402   return ret;
1403 }
1404
1405 // vim:shiftwidth=2:expandtab