drc: arm64 wip
[pcsx_rearmed.git] / libpcsxcore / new_dynarec / linkage_arm64.S
index 1220787..060ac48 100644 (file)
@@ -46,12 +46,13 @@ DRC_VAR(cycle_count, 4)
 DRC_VAR(last_count, 4)
 DRC_VAR(pending_exception, 4)
 DRC_VAR(stop, 4)
-DRC_VAR(invc_ptr, 4)
+DRC_VAR(branch_target, 4)
 DRC_VAR(address, 4)
+#DRC_VAR(align0, 16) /* unused/alignment */
 DRC_VAR(psxRegs, LO_psxRegs_end - LO_psxRegs)
 
 /* psxRegs */
-DRC_VAR(reg, 128)
+#DRC_VAR(reg, 128)
 DRC_VAR(lo, 4)
 DRC_VAR(hi, 4)
 DRC_VAR(reg_cop0, 128)
@@ -64,15 +65,15 @@ DRC_VAR(pcaddr, 4)
 #DRC_VAR(intCycle, 256)
 
 DRC_VAR(rcnts, 7*4*4)
-DRC_VAR(mem_rtab, 4)
-DRC_VAR(mem_wtab, 4)
-DRC_VAR(psxH_ptr, 4)
-DRC_VAR(zeromem_ptr, 4)
 DRC_VAR(inv_code_start, 4)
 DRC_VAR(inv_code_end, 4)
-DRC_VAR(branch_target, 4)
-DRC_VAR(scratch_buf_ptr, 4)
-#DRC_VAR(align0, 12) /* unused/alignment */
+DRC_VAR(mem_rtab, 8)
+DRC_VAR(mem_wtab, 8)
+DRC_VAR(psxH_ptr, 8)
+DRC_VAR(invc_ptr, 8)
+DRC_VAR(zeromem_ptr, 8)
+DRC_VAR(scratch_buf_ptr, 8)
+#DRC_VAR(align1, 16) /* unused/alignment */
 DRC_VAR(mini_ht, 256)
 DRC_VAR(restore_candidate, 512)
 
@@ -83,7 +84,7 @@ DRC_VAR(restore_candidate, 512)
 /* r0 = virtual target address */
 /* r1 = instruction to patch */
 .macro dyna_linker_main
-       /* XXX: should be able to do better than this... */
+       /* XXX TODO: should be able to do better than this... */
        bl      get_addr_ht
        br      x0
 .endm
@@ -112,33 +113,61 @@ FUNCTION(dyna_linker_ds):
 
        .align  2
 
-FUNCTION(jump_vaddr):
-       bl      abort
-       .size   jump_vaddr, .-jump_vaddr
-
-       .align  2
-
 FUNCTION(verify_code_ds):
        bl      abort
-FUNCTION(verify_code_vm):
 FUNCTION(verify_code):
        /* r1 = source */
        /* r2 = target */
        /* r3 = length */
        bl      abort
        .size   verify_code, .-verify_code
-       .size   verify_code_vm, .-verify_code_vm
+       .size   verify_code_ds, .-verify_code_ds
 
        .align  2
 FUNCTION(cc_interrupt):
-       bl      abort
+       ldr     w0, [rFP, #LO_last_count]
+       mov     w2, #0x1fc
+       add     rCC, w0, rCC
+       str     wzr, [rFP, #LO_pending_exception]
+       and     w2, w2, rCC, lsr #17
+       add     x3, rFP, #LO_restore_candidate
+       str     rCC, [rFP, #LO_cycle]           /* PCSX cycles */
+#      str     rCC, [rFP, #LO_reg_cop0+36]     /* Count */
+       ldr     w19, [x3, w2, uxtw]
+       mov     x21, lr
+       cbnz    w19, 4f
+1:
+       bl      gen_interupt
+       mov     lr, x21
+       ldr     rCC, [rFP, #LO_cycle]
+       ldr     w0, [rFP, #LO_next_interupt]
+       ldr     w1, [rFP, #LO_pending_exception]
+       ldr     w2, [rFP, #LO_stop]
+       str     w0, [rFP, #LO_last_count]
+       sub     rCC, rCC, w0
+       cbnz    w2, new_dyna_leave
+       cbnz    w1, 2f
+       ret
+2:
+       ldr     w0, [rFP, #LO_pcaddr]
+       bl      get_addr_ht
+       br      x0
+4:
+       /* Move 'dirty' blocks to the 'clean' list */
+       lsl     w20, w2, #3
+       str     wzr, [x3, w2, uxtw]
+5:
+       mov     w0, w20
+       add     w20, w20, #1
+       tbz     w19, #0, 6f
+       bl      clean_blocks
+6:
+       lsr     w19, w19, #1
+       tst     w20, #31
+       bne     5b
+       b       1b
        .size   cc_interrupt, .-cc_interrupt
 
-       .align  2
-FUNCTION(do_interrupt):
-       bl      abort
-       .size   do_interrupt, .-do_interrupt
-
        .align  2
 FUNCTION(fp_exception):
        mov     w2, #0x10000000
@@ -202,9 +231,10 @@ FUNCTION(jump_intcall):
        bl      abort
        .size   jump_intcall, .-jump_intcall
 
+       /* stack must be aligned by 16, and include space for save_regs() use */
        .align  2
 FUNCTION(new_dyna_start):
-       stp     x29, x30, [sp, #-96]!   // must be aligned by 16
+       stp     x29, x30, [sp, #-SSP_ALL]!
        ldr     w1,  [x0, #LO_next_interupt]
        ldr     w2,  [x0, #LO_cycle]
        stp     x19, x20, [sp, #16*1]
@@ -230,7 +260,7 @@ FUNCTION(new_dyna_leave):
        ldp     x23, x24, [sp, #16*3]
        ldp     x25, x26, [sp, #16*4]
        ldp     x27, x28, [sp, #16*5]
-       ldp     x29, x30, [sp], #96
+       ldp     x29, x30, [sp], #SSP_ALL
        ret
        .size   new_dyna_leave, .-new_dyna_leave
 
@@ -238,26 +268,94 @@ FUNCTION(new_dyna_leave):
 
 .align 2
 
+.macro memhandler_pre
+       /* w0 = adddr/data, x1 = rhandler, w2 = cycles, x3 = whandler */
+       ldr     w4, [rFP, #LO_last_count]
+       add     w4, w4, w2
+       str     w4, [rFP, #LO_cycle]
+.endm
+
+.macro memhandler_post
+       ldr     w2, [rFP, #LO_next_interupt]
+       ldr     w1, [rFP, #LO_cycle]
+       sub     w0, w1, w2
+       str     w2, [rFP, #LO_last_count]
+.endm
+
+FUNCTION(do_memhandler_pre):
+       memhandler_pre
+       ret
+
+FUNCTION(do_memhandler_post):
+       memhandler_post
+       ret
+
+.macro pcsx_read_mem readop tab_shift
+       /* w0 = address, x1 = handler_tab, w2 = cycles */
+       stp     xzr, x30, [sp, #-16]!
+       ubfm    w4, w0, #\tab_shift, #11
+       ldr     x3, [x1, w4, uxtw #3]
+       adds    x3, x3, x3
+       bcs     0f
+       \readop w0, [x3, w4, uxtw #\tab_shift]
+       ret
+0:
+       memhandler_pre
+       blr     x3
+.endm
+
 FUNCTION(jump_handler_read8):
-       bl      abort
+       add     x1, x1, #0x1000/4*4 + 0x1000/2*4  /* shift to r8 part */
+       pcsx_read_mem ldrb, 0
+       b       handler_read_end
 
 FUNCTION(jump_handler_read16):
-       bl      abort
+       add     x1, x1, #0x1000/4*4               /* shift to r16 part */
+       pcsx_read_mem ldrh, 1
+       b       handler_read_end
 
 FUNCTION(jump_handler_read32):
-       bl      abort
+       pcsx_read_mem ldr, 2
+
+handler_read_end:
+       ldp     xzr, x30, [sp], #16
+       ret
+
+.macro pcsx_write_mem wrtop movop tab_shift
+       /* w0 = address, w1 = data, w2 = cycles, x3 = handler_tab */
+       stp     xzr, x30, [sp, #-16]!
+       ubfm    w4, w0, #\tab_shift, #11
+       ldr     x3, [x3, w4, uxtw #3]
+       str     w0, [rFP, #LO_address]    /* some handlers still need it... */
+       adds    x3, x3, x3
+#      str     lr, [rFP, #0]
+       bcs     0f
+       mov     w0, w2                    /* cycle return */
+       \wrtop  w1, [x3, w4, uxtw #\tab_shift]
+       ret
+0:
+       \movop  w0, w1
+       memhandler_pre
+       blr     x3
+.endm
 
 FUNCTION(jump_handler_write8):
-       bl      abort
+       add     x3, x3, #0x1000/4*4 + 0x1000/2*4  /* shift to r8 part */
+       pcsx_write_mem strb uxtb 0
+       b       handler_write_end
 
 FUNCTION(jump_handler_write16):
-       bl      abort
+       add     x3, x3, #0x1000/4*4               /* shift to r16 part */
+       pcsx_write_mem strh uxth 1
+       b       handler_write_end
 
 FUNCTION(jump_handler_write32):
-       bl      abort
+       pcsx_write_mem str mov 2
 
-FUNCTION(jump_handler_write_h):
-       bl      abort
+handler_write_end:
+       memhandler_post
+       ldp     xzr, x30, [sp], #16
+       ret
 
 FUNCTION(jump_handle_swl):
        bl      abort