drc: fix an old memhandler oversight
[pcsx_rearmed.git] / libpcsxcore / new_dynarec / linkage_arm64.S
index 060ac48..7075ebd 100644 (file)
 #include "assem_arm64.h"
 #include "linkage_offsets.h"
 
+#if (LO_mem_wtab & 7)
+#error misligned pointers
+#endif
+
 .bss
        .align  4
        .global dynarec_local
@@ -73,7 +77,7 @@ DRC_VAR(psxH_ptr, 8)
 DRC_VAR(invc_ptr, 8)
 DRC_VAR(zeromem_ptr, 8)
 DRC_VAR(scratch_buf_ptr, 8)
-#DRC_VAR(align1, 16) /* unused/alignment */
+DRC_VAR(ram_offset, 8)
 DRC_VAR(mini_ht, 256)
 DRC_VAR(restore_candidate, 512)
 
@@ -111,18 +115,6 @@ FUNCTION(dyna_linker_ds):
        dyna_linker_main
        .size   dyna_linker_ds, .-dyna_linker_ds
 
-       .align  2
-
-FUNCTION(verify_code_ds):
-       bl      abort
-FUNCTION(verify_code):
-       /* r1 = source */
-       /* r2 = target */
-       /* r3 = length */
-       bl      abort
-       .size   verify_code, .-verify_code
-       .size   verify_code_ds, .-verify_code_ds
-
        .align  2
 FUNCTION(cc_interrupt):
        ldr     w0, [rFP, #LO_last_count]
@@ -172,13 +164,13 @@ FUNCTION(cc_interrupt):
 FUNCTION(fp_exception):
        mov     w2, #0x10000000
 0:
-       ldr     w1, [fp, #LO_reg_cop0+48] /* Status */
+       ldr     w1, [rFP, #LO_reg_cop0+48] /* Status */
        mov     w3, #0x80000000
-       str     w0, [fp, #LO_reg_cop0+56] /* EPC */
+       str     w0, [rFP, #LO_reg_cop0+56] /* EPC */
        orr     w1, w1, #2
        add     w2, w2, #0x2c
-       str     w1, [fp, #LO_reg_cop0+48] /* Status */
-       str     w2, [fp, #LO_reg_cop0+52] /* Cause */
+       str     w1, [rFP, #LO_reg_cop0+48] /* Status */
+       str     w2, [rFP, #LO_reg_cop0+52] /* Cause */
        add     w0, w3, #0x80
        bl      get_addr_ht
        br      x0
@@ -191,45 +183,30 @@ FUNCTION(fp_exception_ds):
 
        .align  2
 FUNCTION(jump_syscall):
-       ldr     w1, [fp, #LO_reg_cop0+48] /* Status */
+       ldr     w1, [rFP, #LO_reg_cop0+48] /* Status */
        mov     w3, #0x80000000
-       str     w0, [fp, #LO_reg_cop0+56] /* EPC */
+       str     w0, [rFP, #LO_reg_cop0+56] /* EPC */
        orr     w1, w1, #2
        mov     w2, #0x20
-       str     w1, [fp, #LO_reg_cop0+48] /* Status */
-       str     w2, [fp, #LO_reg_cop0+52] /* Cause */
+       str     w1, [rFP, #LO_reg_cop0+48] /* Status */
+       str     w2, [rFP, #LO_reg_cop0+52] /* Cause */
        add     w0, w3, #0x80
        bl      get_addr_ht
        br      x0
        .size   jump_syscall, .-jump_syscall
        .align  2
 
-       .align  2
-FUNCTION(jump_syscall_hle):
-       bl      abort
-
        /* note: psxException might do recursive recompiler call from it's HLE code,
         * so be ready for this */
-pcsx_return:
-       bl      abort // w10
-       ldr     w1, [fp, #LO_next_interupt]
-       ldr     w10, [fp, #LO_cycle]
-       ldr     w0, [fp, #LO_pcaddr]
-       sub     w10, w10, w1
-       str     w1, [fp, #LO_last_count]
+FUNCTION(jump_to_new_pc):
+       ldr     w1, [rFP, #LO_next_interupt]
+       ldr     rCC, [rFP, #LO_cycle]
+       ldr     w0, [rFP, #LO_pcaddr]
+       sub     rCC, rCC, w1
+       str     w1, [rFP, #LO_last_count]
        bl      get_addr_ht
        br      x0
-       .size   jump_syscall_hle, .-jump_syscall_hle
-
-       .align  2
-FUNCTION(jump_hlecall):
-       bl      abort
-       .size   jump_hlecall, .-jump_hlecall
-
-       .align  2
-FUNCTION(jump_intcall):
-       bl      abort
-       .size   jump_intcall, .-jump_intcall
+       .size   jump_to_new_pc, .-jump_to_new_pc
 
        /* stack must be aligned by 16, and include space for save_regs() use */
        .align  2
@@ -276,10 +253,10 @@ FUNCTION(new_dyna_leave):
 .endm
 
 .macro memhandler_post
-       ldr     w2, [rFP, #LO_next_interupt]
-       ldr     w1, [rFP, #LO_cycle]
-       sub     w0, w1, w2
-       str     w2, [rFP, #LO_last_count]
+       ldr     w0, [rFP, #LO_next_interupt]
+       ldr     w2, [rFP, #LO_cycle]        // memhandlers can modify cc, like dma
+       str     w0, [rFP, #LO_last_count]
+       sub     w0, w2, w0
 .endm
 
 FUNCTION(do_memhandler_pre):
@@ -292,7 +269,6 @@ FUNCTION(do_memhandler_post):
 
 .macro pcsx_read_mem readop tab_shift
        /* w0 = address, x1 = handler_tab, w2 = cycles */
-       stp     xzr, x30, [sp, #-16]!
        ubfm    w4, w0, #\tab_shift, #11
        ldr     x3, [x1, w4, uxtw #3]
        adds    x3, x3, x3
@@ -300,17 +276,18 @@ FUNCTION(do_memhandler_post):
        \readop w0, [x3, w4, uxtw #\tab_shift]
        ret
 0:
+       stp     xzr, x30, [sp, #-16]!
        memhandler_pre
        blr     x3
 .endm
 
 FUNCTION(jump_handler_read8):
-       add     x1, x1, #0x1000/4*4 + 0x1000/2*4  /* shift to r8 part */
+       add     x1, x1, #0x1000/4*8 + 0x1000/2*8  /* shift to r8 part */
        pcsx_read_mem ldrb, 0
        b       handler_read_end
 
 FUNCTION(jump_handler_read16):
-       add     x1, x1, #0x1000/4*4               /* shift to r16 part */
+       add     x1, x1, #0x1000/4*8               /* shift to r16 part */
        pcsx_read_mem ldrh, 1
        b       handler_read_end
 
@@ -323,29 +300,28 @@ handler_read_end:
 
 .macro pcsx_write_mem wrtop movop tab_shift
        /* w0 = address, w1 = data, w2 = cycles, x3 = handler_tab */
-       stp     xzr, x30, [sp, #-16]!
        ubfm    w4, w0, #\tab_shift, #11
        ldr     x3, [x3, w4, uxtw #3]
-       str     w0, [rFP, #LO_address]    /* some handlers still need it... */
        adds    x3, x3, x3
-#      str     lr, [rFP, #0]
        bcs     0f
        mov     w0, w2                    /* cycle return */
        \wrtop  w1, [x3, w4, uxtw #\tab_shift]
        ret
 0:
+       stp     xzr, x30, [sp, #-16]!
+       str     w0, [rFP, #LO_address]    /* some handlers still need it... */
        \movop  w0, w1
        memhandler_pre
        blr     x3
 .endm
 
 FUNCTION(jump_handler_write8):
-       add     x3, x3, #0x1000/4*4 + 0x1000/2*4  /* shift to r8 part */
+       add     x3, x3, #0x1000/4*8 + 0x1000/2*8  /* shift to r8 part */
        pcsx_write_mem strb uxtb 0
        b       handler_write_end
 
 FUNCTION(jump_handler_write16):
-       add     x3, x3, #0x1000/4*4               /* shift to r16 part */
+       add     x3, x3, #0x1000/4*8               /* shift to r16 part */
        pcsx_write_mem strh uxth 1
        b       handler_write_end
 
@@ -358,8 +334,81 @@ handler_write_end:
        ret
 
 FUNCTION(jump_handle_swl):
+       /* w0 = address, w1 = data, w2 = cycles */
+       ldr     x3, [rFP, #LO_mem_wtab]
+       mov     w4, w0, lsr #12
+       ldr     x3, [x3, w4, uxtw #3]
+       adds    x3, x3, x3
+       bcs     4f
+       add     x3, x0, x3
+       mov     w0, w2
+       tbz     x3, #1, 10f     // & 2
+       tbz     x3, #0, 2f      // & 1
+3:
+       stur    w1, [x3, #-3]
+       ret
+2:
+       lsr     w2, w1, #8
+       lsr     w1, w1, #24
+       sturh   w2, [x3, #-2]
+       strb    w1, [x3]
+       ret
+10:
+       tbz     x3, #0, 0f      // & 1
+1:
+       lsr     w1, w1, #16
+       sturh   w1, [x3, #-1]
+       ret
+0:
+       lsr     w2, w1, #24
+       strb    w2, [x3]
+       ret
+4:
+       mov     w0, w2          // todo
        bl      abort
+       ret
 
 FUNCTION(jump_handle_swr):
+       /* w0 = address, w1 = data, w2 = cycles */
+       ldr     x3, [rFP, #LO_mem_wtab]
+       mov     w4, w0, lsr #12
+       ldr     x3, [x3, w4, uxtw #3]
+       adds    x3, x3, x3
+       bcs     4f
+       add     x3, x0, x3
+       mov     w0, w2
+       tbz     x3, #1, 10f     // & 2
+       tbz     x3, #0, 2f      // & 1
+3:
+       strb    w1, [x3]
+       ret
+2:
+       strh    w1, [x3]
+       ret
+10:
+       tbz     x3, #0, 0f      // & 1
+1:
+       lsr     w2, w1, #8
+       strb    w1, [x3]
+       sturh   w2, [x3, #1]
+       ret
+0:
+       str     w1, [x3]
+       ret
+4:
+       mov     w0, w2          // todo
        bl      abort
+       ret
+
+FUNCTION(call_gteStall):
+       /* w0 = op_cycles, w1 = cycles */
+       ldr     w2, [rFP, #LO_last_count]
+       str     lr, [rFP, #LO_saved_lr]
+       add     w1, w1, w2
+       str     w1, [rFP, #LO_cycle]
+       add     x1, rFP, #LO_psxRegs
+       bl      gteCheckStallRaw
+       ldr     lr, [rFP, #LO_saved_lr]
+       add     rCC, rCC, w0
+       ret