lots of win32 port work
[picodrive.git] / Pico / Draw.s
index e31ba0b..3a3da81 100644 (file)
@@ -6,6 +6,7 @@
 @ (c) Copyright 2007, Grazvydas "notaz" Ignotas\r
 @ All Rights Reserved\r
 \r
+.include "port_config.s"\r
 \r
 .extern Pico\r
 .extern PicoOpt\r
@@ -317,11 +318,18 @@ DrawLayer:
     add     r8, r8, r9, lsr #8   @ tilex+=cellskip\r
     add     r7, r7, r9, lsr #5   @ dx+=cellskip<<3;\r
     sub     r10,r10,r9, lsl #16  @ cells-=cellskip\r
-    mvn     r9, #0               @ r9=prevcode=-1\r
 \r
     @ cache some stuff to avoid mem access\r
+.if OVERRIDE_HIGHCOL\r
     ldr     r11,=HighCol\r
     mov     r0, #0xf\r
+    ldr     r11,[r11]\r
+.else\r
+    ldr     r11,=HighCol\r
+    mov     r0, #0xf\r
+.endif\r
+\r
+    mvn     r9, #0               @ r9=prevcode=-1\r
     add     r1, r11, r7         @ r1=pdest\r
 \r
 \r
@@ -463,13 +471,19 @@ DrawLayer:
     add     r8, r8, r9, lsr #8   @ tilex+=cellskip\r
     add     r7, r7, r9, lsr #5   @ dx+=cellskip<<3;\r
     add     r10,r10,r9, lsl #16  @ cell+=cellskip\r
-    mvn     r9, #0               @ r9=prevcode=-1\r
 \r
     @ cache some stuff to avoid mem access\r
+.if OVERRIDE_HIGHCOL\r
     ldr     r11,=HighCol\r
     mov     r0, #0xf\r
-    add     r1, r11, r7         @ r1=pdest\r
+    ldr     r11,[r11]\r
+.else\r
+    ldr     r11,=HighCol\r
+    mov     r0, #0xf\r
+.endif\r
 \r
+    mvn     r9, #0               @ r9=prevcode=-1\r
+    add     r1, r11, r7          @ r1=pdest\r
 \r
     @ r4 & r7 are scratch in this loop\r
 .dsloop_vs_subr1:\r
@@ -639,10 +653,18 @@ DrawLayer:
 BackFill:\r
     stmfd   sp!, {r4-r9,lr}\r
 \r
+.if OVERRIDE_HIGHCOL\r
+    ldr     lr, =HighCol\r
+    mov     r0, r0, lsl #26\r
+    ldr     lr, [lr]\r
+    mov     r0, r0, lsr #26\r
+    add     lr, lr, #8\r
+.else\r
     ldr     lr, =(HighCol+8)\r
-\r
     mov     r0, r0, lsl #26\r
     mov     r0, r0, lsr #26\r
+.endif\r
+\r
     orr     r0, r0, r1, lsl #6\r
     orr     r0, r0, r0, lsl #8\r
     orr     r0, r0, r0, lsl #16\r
@@ -680,9 +702,15 @@ DrawTilesFromCache:
     stmfd   sp!, {r4-r8,r11,lr}\r
 \r
     @ cache some stuff to avoid mem access\r
+.if OVERRIDE_HIGHCOL\r
     ldr     r11,=HighCol\r
-    ldr     lr, =(Pico+0x10000) @ lr=Pico.vram\r
     mov     r12,#0xf\r
+    ldr     r11,[r11]\r
+.else\r
+    ldr     r11,=HighCol\r
+    mov     r12,#0xf\r
+.endif\r
+    ldr     lr, =(Pico+0x10000) @ lr=Pico.vram\r
 \r
     mvn     r5, #0         @ r5=prevcode=-1\r
     ands    r8, r1, #1\r
@@ -874,11 +902,17 @@ DrawSpritesFromCache:
     stmfd   sp!, {r4-r11,lr}\r
 \r
     @ cache some stuff to avoid mem access\r
+.if OVERRIDE_HIGHCOL\r
     ldr     r11,=HighCol\r
+    mov     r12,#0xf\r
+    ldr     r11,[r11]\r
+.else\r
+    ldr     r11,=HighCol\r
+    mov     r12,#0xf\r
+.endif\r
     ldr     lr, =(Pico+0x10000) @ lr=Pico.vram\r
     mov     r6, r1, lsl #31\r
     orr     r6, r6, #1<<30\r
-    mov     r12,#0xf\r
 \r
     mov     r10, r0\r
 \r
@@ -1042,9 +1076,15 @@ DrawSprite:
     bne     .dspr_cache       @ if(code&0x8000) // high priority - cache it\r
 \r
     @ cache some stuff to avoid mem access\r
+.if OVERRIDE_HIGHCOL\r
     ldr     r11,=HighCol\r
-    ldr     lr, =(Pico+0x10000) @ lr=Pico.vram\r
     mov     r12,#0xf\r
+    ldr     r11,[r11]\r
+.else\r
+    ldr     r11,=HighCol\r
+    mov     r12,#0xf\r
+.endif\r
+    ldr     lr, =(Pico+0x10000) @ lr=Pico.vram\r
 \r
     mov     r5, r5, lsl #4     @ delta<<=4; // Delta of address\r
     and     r4, r9, #0x6000\r
@@ -1202,12 +1242,19 @@ DrawWindow:
     orr     r6, r6, r3, lsl #8    @ shadow mode\r
 \r
     sub     r8, r1, r0\r
-    mov     r8, r8, lsl #1        @ cells\r
-\r
-    mvn     r9, #0                @ r9=prevcode=-1\r
 \r
     @ cache some stuff to avoid mem access\r
+.if OVERRIDE_HIGHCOL\r
+    ldr     r11,=HighCol\r
+    mov     r8, r8, lsl #1        @ cells\r
+    ldr     r11,[r11]\r
+    mvn     r9, #0                @ r9=prevcode=-1\r
+    add     r11,r11,#8\r
+.else\r
     ldr     r11,=(HighCol+8)\r
+    mov     r8, r8, lsl #1        @ cells\r
+    mvn     r9, #0                @ r9=prevcode=-1\r
+.endif\r
     add     r1, r11, r0, lsl #4 @ r1=pdest\r
     mov     r0, #0xf\r
     b       .dwloop_enter\r
@@ -1408,9 +1455,17 @@ FinalizeLineBGR444:
 \r
 \r
 .fl_noshBGR444:\r
+.if OVERRIDE_HIGHCOL\r
+    ldr     r1, =HighCol\r
+    mov     lr, #0xff\r
+    ldr     r1, [r1]\r
+    mov     lr, lr, lsl #1\r
+    add     r1, r1, #8\r
+.else\r
     ldr     r1, =(HighCol+8)\r
     mov     lr, #0xff\r
     mov     lr, lr, lsl #1\r
+.endif\r
 \r
 .fl_loopBGR444:\r
 \r
@@ -1480,14 +1535,16 @@ FinalizeLineBGR444:
     orr     \reg, \reg, r3           @ add blue back\r
 .endm\r
 \r
+.global vidConvCpyRGB565\r
+\r
 vidConvCpyRGB565: @ void *to, void *from, int pixels\r
     stmfd   sp!, {r4-r9,lr}\r
 \r
-    mov     r12, r2, lsr #3 @ repeats\r
+    mov     r12, r2, lsr #3  @ repeats\r
     mov     lr, #0x001c0000\r
     orr     lr, lr,  #0x01c  @ lr == pattern 0x001c001c\r
     mov     r8, #0x00030000\r
-    orr     r8, r8,  #0x003  @ lr == pattern 0x001c001c\r
+    orr     r8, r8,  #0x003\r
 \r
 .loopRGB565:\r
     ldmia   r1!, {r4-r7}\r
@@ -1562,9 +1619,17 @@ FinalizeLineRGB555:
     sub     r3, r3, #0x40*2\r
 \r
 .fl_noshRGB555:\r
+.if OVERRIDE_HIGHCOL\r
+    ldr     r1, =HighCol\r
+    ldr     r0, =DrawLineDest\r
+    ldr     r1, [r1]\r
+    ldr     r0, [r0]\r
+    add     r1, r1, #8\r
+.else\r
     ldr     r0, =DrawLineDest\r
     ldr     r1, =(HighCol+8)\r
     ldr     r0, [r0]\r
+.endif\r
 \r
     ldrb    r12, [r8, #12]\r
     mov     lr, #0xff\r
@@ -1582,8 +1647,14 @@ FinalizeLineRGB555:
     addeq   r0, r0, #32*2\r
 \r
 .fl_no32colRGB555:\r
-.fl_loopRGB555:\r
 \r
+.if UNALIGNED_DRAWLINEDEST\r
+    @ this is basically for Gizmondo, which has unaligned odd lines in the framebuffer\r
+    tst     r0, #2\r
+    bne     .fl_RGB555u\r
+.endif\r
+\r
+.fl_loopRGB555:\r
     ldr     r12, [r1], #4\r
     ldr     r7,  [r1], #4\r
 \r
@@ -1605,12 +1676,12 @@ FinalizeLineRGB555:
     ldrh    r6, [r3, r6]\r
     and     r12,lr, r7, lsr #15\r
     ldrh    r12,[r3, r12]\r
+    and     r7, lr, r7, lsr #23\r
+    ldrh    r7, [r3, r7]\r
     orr     r8, r8, r6, lsl #16\r
 \r
-    and     r6, lr, r7, lsr #23\r
-    ldrh    r6, [r3, r6]             @ 1 cycle interlock here (r6)\r
     subs    r2, r2, #1\r
-    orr     r12,r12, r6, lsl #16\r
+    orr     r12,r12, r7, lsl #16\r
 \r
     stmia   r0!, {r4,r5,r8,r12}\r
     bne     .fl_loopRGB555\r
@@ -1624,6 +1695,11 @@ FinalizeLineRGB555:
     mov     r9, #0x3900 @ f800 07e0 001f | e000 0780 001c | 3800 01e0 0007\r
     orr     r9, r9, #0x00e7\r
 \r
+.if UNALIGNED_DRAWLINEDEST\r
+    tst     r0, #2\r
+    bne     .fl_32scale_RGB555u\r
+.endif\r
+\r
 .fl_loop32scale_RGB555:\r
     ldr     r12, [r1], #4\r
     ldr     r7,  [r1], #4\r
@@ -1680,6 +1756,121 @@ FinalizeLineRGB555:
     ldmfd   sp!, {r4-r8,lr}\r
     bx      lr\r
 \r
+.if UNALIGNED_DRAWLINEDEST\r
+    @ unaligned versions of loops\r
+    @ warning: starts drawing 2bytes before dst\r
+\r
+.fl_RGB555u:\r
+    sub     r0, r0, #2              @ initial adjustment\r
+    mov     r8, #0\r
+\r
+.fl_loopRGB555u:\r
+    ldr     r12, [r1], #4\r
+    ldr     r7,  [r1], #4\r
+\r
+    and     r6, lr, r12,lsl #1\r
+    ldrh    r6, [r3, r6]\r
+    and     r5, lr, r12,lsr #7\r
+    ldrh    r5, [r3, r5]\r
+    orr     r4, r8, r6, lsl #16\r
+\r
+    and     r6, lr, r12,lsr #15\r
+    ldrh    r6, [r3, r6]\r
+    and     r8, lr, r12,lsr #23\r
+    ldrh    r8, [r3, r8]\r
+    orr     r5, r5, r6, lsl #16\r
+\r
+    and     r6, lr, r7, lsl #1\r
+    ldrh    r6, [r3, r6]\r
+    and     r12,lr, r7, lsr #7\r
+    ldrh    r12,[r3, r12]\r
+    orr     r6, r8, r6, lsl #16\r
+\r
+    and     r8, lr, r7, lsr #15\r
+    ldrh    r8, [r3, r8]\r
+    and     r7, lr, r7, lsr #23\r
+\r
+    subs    r2, r2, #1\r
+    orr     r12,r12,r8, lsl #16\r
+    ldrh    r8, [r3, r7]\r
+\r
+    stmia   r0!, {r4,r5,r6,r12}\r
+    bne     .fl_loopRGB555u\r
+\r
+    strh    r8, [r0], #2\r
+\r
+    ldmfd   sp!, {r4-r8,lr}\r
+    bx      lr\r
+\r
+\r
+.fl_32scale_RGB555u:\r
+    sub     r0, r0, #2              @ initial adjustment\r
+    mov     r4, #0\r
+\r
+    @ r9  f800 07e0 001f | e000 0780 001c | 3800 01e0 0007\r
+.fl_loop32scale_RGB555u:\r
+    ldr     r12, [r1], #4\r
+    ldr     r7,  [r1], #4\r
+\r
+    and     r6, lr, r12,lsl #1\r
+    ldrh    r6, [r3, r6]\r
+    and     r5, lr, r12,lsr #7\r
+    ldrh    r5, [r3, r5]\r
+    and     r6, r6, r9, lsl #2\r
+    orr     r4, r4, r6, lsl #16       @ r4 = pix_d -1, 0\r
+\r
+    and     r5, r5, r9, lsl #2\r
+    sub     r8, r5, r5, lsr #2        @ r8 = 3/4 pix_s 1\r
+    add     r6, r8, r6, lsr #2        @ r6 = (1/4 pix_s 0) + (3/4 pix_s 1)\r
+    orr     r5, r6, r5, lsl #15\r
+\r
+    and     r6, lr, r12,lsr #15\r
+    ldrh    r6, [r3, r6]\r
+    and     r12,lr, r12,lsr #23\r
+    ldrh    r12,[r3, r12]\r
+    and     r6, r6, r9, lsl #2\r
+    add     r5, r5, r6, lsl #15       @ r5 = pix_d 1, 2\r
+\r
+    and     r8, lr, r7, lsl #1\r
+    ldrh    r8, [r3, r8]\r
+    and     r10,lr, r7, lsr #7\r
+    ldrh    r10,[r3, r10]\r
+    and     r12,r12,r9, lsl #2\r
+    sub     r6, r6, r6, lsr #2        @ r6 = 3/4 pix_s 2\r
+    add     r6, r6, r12,lsr #2\r
+    orr     r6, r6, r12,lsl #16       @ r6 = pix_d 3, 4\r
+\r
+    and     r8, r8, r9, lsl #2\r
+    and     r10,r10,r9, lsl #2\r
+    sub     r12,r10,r10,lsr #2        @ r12 = 3/4 pix_s 5\r
+    orr     r8, r8, r8, lsl #14\r
+    add     r8, r8, r12,lsl #16       @ r8 = pix_d 5, 6\r
+    and     r12,lr, r7, lsr #15\r
+    ldrh    r12,[r3, r12]\r
+    and     r7, lr, r7, lsr #23\r
+    ldrh    r7, [r3, r7]\r
+    and     r12,r12,r9, lsl #2\r
+    add     r10,r10,r12\r
+    mov     r10,r10,    lsr #1\r
+    sub     r12,r12,r12,lsr #2        @ r12 = 3/4 pix_s 6\r
+    orr     r10,r10,r12,lsl #16\r
+    and     r7, r7, r9, lsl #2\r
+    add     r10,r10,r7, lsl #14       @ r10 = pix_d 7, 8\r
+\r
+    subs    r2, r2, #1\r
+\r
+    stmia   r0!, {r4,r5,r6,r8,r10}\r
+    mov     r4, r7\r
+    bne     .fl_loop32scale_RGB555u\r
+\r
+    strh    r4, [r0], #2\r
+\r
+    ldmfd   sp!, {r9,r10}\r
+    ldmfd   sp!, {r4-r8,lr}\r
+    bx      lr\r
+\r
+.endif @ UNALIGNED_DRAWLINEDEST\r
+\r
 \r
 @ @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@\r
 \r