some optimizations
[picodrive.git] / cpu / Cyclone / Ea.cpp
index 39ed8a2..22e5939 100644 (file)
@@ -123,7 +123,7 @@ static int EaCalcReg(int r,int ea,int mask,int forceor,int shift,int noshift=0)
 // EaCalc - ARM Register 'a' = Effective Address\r
 // Trashes r0,r2 and r3\r
 // size values 0, 1, 2 ~ byte, word, long\r
-int EaCalc(int a,int mask,int ea,int size,int top)\r
+int EaCalc(int a,int mask,int ea,int size,int top,int sign_extend)\r
 {\r
   char text[32]="";\r
   int func=0;\r
@@ -134,7 +134,7 @@ int EaCalc(int a,int mask,int ea,int size,int top)
   if (ea<0x10)\r
   {\r
     int noshift=0;\r
-    if (size>=2||(size==0&&top)) noshift=1; // Saves one opcode\r
+    if (size>=2||(size==0&&(top||!sign_extend))) noshift=1; // Saves one opcode\r
 \r
     ot(";@ EaCalc : Get register index into r%d:\n",a);\r
 \r
@@ -180,8 +180,8 @@ int EaCalc(int a,int mask,int ea,int size,int top)
 \r
   if (ea<0x30) // ($nn,An) (di)\r
   {\r
-    EaCalcReg(2,8,mask,0,0);\r
     ot("  ldrsh r0,[r4],#2 ;@ Fetch offset\n"); pc_dirty=1;\r
+    EaCalcReg(2,8,mask,0,0);\r
     ot("  ldr r2,[r7,r2,lsl #2]\n");\r
     ot("  add r%d,r0,r2 ;@ Add on offset\n",a);\r
     Cycles+=size<2 ? 8:12; // Extra cycles\r
@@ -277,9 +277,10 @@ int EaCalc(int a,int mask,int ea,int size,int top)
 // 'a' and 'v' can be anything but 0 is generally best (for both)\r
 // If (ea<0x10) nothing is trashed, else r0-r3 is trashed\r
 // If 'top' is given, the ARM register v shifted to the top, e.g. 0xc000 -> 0xc0000000\r
-// Otherwise the ARM register v is sign extended, e.g. 0xc000 -> 0xffffc000\r
+// If top is 0 and sign_extend is not, then ARM register v is sign extended,\r
+// e.g. 0xc000 -> 0xffffc000 (else it may or may not be sign extended)\r
 \r
-int EaRead(int a,int v,int ea,int size,int mask,int top)\r
+int EaRead(int a,int v,int ea,int size,int mask,int top,int sign_extend)\r
 {\r
   char text[32]="";\r
   int shift=0;\r
@@ -291,7 +292,7 @@ int EaRead(int a,int v,int ea,int size,int mask,int top)
   if (ea<0x10)\r
   {\r
     int lsl=0,low=0,i;\r
-    if (size>=2||(size==0&&top)) {\r
+    if (size>=2||(size==0&&(top||!sign_extend))) {\r
       if(mask)\r
         for (i=mask|0x8000; (i&1)==0; i>>=1) low++; // Find out how high up the EA mask is\r
       lsl=2-low; // Having a lsl #2 here saves one opcode\r
@@ -316,18 +317,35 @@ int EaRead(int a,int v,int ea,int size,int mask,int top)
 \r
     if (top) asl=shift;\r
 \r
-    if (v!=a || asl) ot("  mov r%d,r%d,asl #%d\n",v,a,asl);\r
+    if (asl) ot("  mov r%d,r%d,asl #%d\n",v,a,asl);\r
+    else if (v!=a) ot("  mov r%d,r%d\n",v,a);\r
     ot("\n"); return 0;\r
   }\r
 \r
   if (ea>=0x3a && ea<=0x3b) MemHandler(2,size,a); // Fetch\r
   else                      MemHandler(0,size,a); // Read\r
 \r
-  if (v!=0 || shift) {\r
-    if (shift) ot("  mov r%d,r0,asl #%d\n",v,shift);\r
-    else       ot("  mov r%d,r0\n",v);\r
+  if (sign_extend)\r
+  {\r
+    int d_reg=0;\r
+    if (shift) {\r
+      ot("  mov r%d,r%d,asl #%d\n",v,d_reg,shift);\r
+      d_reg=v;\r
+    }\r
+    if (!top && shift) {\r
+      ot("  mov r%d,r%d,asr #%d\n",v,d_reg,shift);\r
+      d_reg=v;\r
+    }\r
+    if (d_reg != v)\r
+      ot("  mov r%d,r%d\n",v,d_reg);\r
+  }\r
+  else\r
+  {\r
+    if (top && shift)\r
+      ot("  mov r%d,r0,asl #%d\n",v,shift);\r
+    else if (v!=0)\r
+      ot("  mov r%d,r0\n",v);\r
   }\r
-  if (top==0 && shift) ot("  mov r%d,r%d,asr #%d\n",v,v,shift);\r
 \r
   ot("\n"); return 0;\r
 }\r
@@ -352,7 +370,7 @@ int EaCanRead(int ea,int size)
 // Write effective address (ARM Register 'a') with ARM register 'v'\r
 // Trashes r0-r3,r12,lr; 'a' can be 0 or 2+, 'v' can be 1 or higher\r
 // If a==0 and v==1 it's faster though.\r
-int EaWrite(int a,int v,int ea,int size,int mask,int top)\r
+int EaWrite(int a,int v,int ea,int size,int mask,int top,int sign_extend_ea)\r
 {\r
   char text[32]="";\r
   int shift=0;\r
@@ -366,7 +384,7 @@ int EaWrite(int a,int v,int ea,int size,int mask,int top)
   if (ea<0x10)\r
   {\r
     int lsl=0,low=0,i;\r
-    if (size>=2||(size==0&&top)) {\r
+    if (size>=2||(size==0&&(top||!sign_extend_ea))) {\r
       if(mask)\r
         for (i=mask|0x8000; (i&1)==0; i>>=1) low++; // Find out how high up the EA mask is\r
       lsl=2-low; // Having a lsl #x here saves one opcode\r
@@ -386,7 +404,8 @@ int EaWrite(int a,int v,int ea,int size,int mask,int top)
 \r
   if (ea==0x3c) { ot("Error! Write EA=0x%x\n\n",ea); return 1; }\r
 \r
-  if (v!=1 || shift) ot("  mov r1,r%d,asr #%d\n",v,shift);\r
+  if (shift)     ot("  mov r1,r%d,asr #%d\n",v,shift);\r
+  else if (v!=1) ot("  mov r1,r%d\n",v);\r
 \r
   MemHandler(1,size,a); // Call write handler\r
 \r