X-Git-Url: https://notaz.gp2x.de/cgi-bin/gitweb.cgi?a=blobdiff_plain;ds=sidebyside;f=frontend%2Fcspace_neon.S;h=342876f05dc16b4ba2c61f56ca71441ed843c117;hb=288e55cb4784f2313821551ef97addffce49eb99;hp=5d1502b3f3c81ad4c2e79b249f41406c3e4ce1de;hpb=e5ed711cd97ac448e8378db562515698a4961f69;p=pcsx_rearmed.git diff --git a/frontend/cspace_neon.S b/frontend/cspace_neon.S index 5d1502b3..342876f0 100644 --- a/frontend/cspace_neon.S +++ b/frontend/cspace_neon.S @@ -10,11 +10,16 @@ #include "arm_features.h" +/* sanity check */ +#ifndef __ARM_NEON__ +#error Compiling NEON code, but appropriate preprocessor flag is missing +#error This usually means -mfpu=neon or -mfloat-abi= is not correctly specified +#endif + .text .align 2 -.global bgr555_to_rgb565 -bgr555_to_rgb565: +FUNCTION(bgr555_to_rgb565): @ dst, src, bytes pld [r1] mov r3, #0x07c0 vdup.16 q15, r3 @@ -23,23 +28,23 @@ bgr555_to_rgb565: 0: pld [r1, #64*2] vldmia r1!, {q0-q3} - vshl.u16 q4, q0, #11 - vshl.u16 q5, q1, #11 - vshl.u16 q6, q2, #11 - vshl.u16 q7, q3, #11 - vsri.u16 q4, q0, #10 - vsri.u16 q5, q1, #10 - vsri.u16 q6, q2, #10 - vsri.u16 q7, q3, #10 - vshl.u16 q0, q0, #1 - vshl.u16 q1, q1, #1 - vshl.u16 q2, q2, #1 - vshl.u16 q3, q3, #1 - vbit q4, q0, q15 - vbit q5, q1, q15 - vbit q6, q2, q15 - vbit q7, q3, q15 - vstmia r0!, {q4-q7} + vshl.u16 q8, q0, #11 + vshl.u16 q9, q1, #11 + vshl.u16 q10, q2, #11 + vshl.u16 q11, q3, #11 + vsri.u16 q8, q0, #10 + vsri.u16 q9, q1, #10 + vsri.u16 q10, q2, #10 + vsri.u16 q11, q3, #10 + vshl.u16 q0, q0, #1 + vshl.u16 q1, q1, #1 + vshl.u16 q2, q2, #1 + vshl.u16 q3, q3, #1 + vbit q8, q0, q15 + vbit q9, q1, q15 + vbit q10, q2, q15 + vbit q11, q3, q15 + vstmia r0!, {q8-q11} subs r2, r2, #64 bge 0b @@ -76,8 +81,7 @@ btr16_end16: bx lr -.global bgr888_to_rgb888 -bgr888_to_rgb888: +FUNCTION(bgr888_to_rgb888): @ dst, src, bytes pld [r1] @ r2 /= 48 mov r2, r2, lsr #4 @@ -98,8 +102,7 @@ bgr888_to_rgb888: bx lr -.global bgr888_to_rgb565 -bgr888_to_rgb565: +FUNCTION(bgr888_to_rgb565): @ dst, src, bytes pld [r1] @ r2 /= 48 mov r2, r2, lsr #4 @@ -131,8 +134,7 @@ bgr888_to_rgb565: bx lr -.global rgb888_to_rgb565 -rgb888_to_rgb565: +FUNCTION(rgb888_to_rgb565): @ dst, src, bytes pld [r1] @ r2 /= 48 mov r2, r2, lsr #4