new faster sprite priority and sh/hi hadling
[picodrive.git] / Pico / Draw.c
index 7c092de..019fdc0 100644 (file)
@@ -36,6 +36,7 @@ static int  HighCacheA[41+1];   // caches for high layers
 static int  HighCacheB[41+1];\r
 static int  HighCacheS[80+1];   // and sprites\r
 static int  HighPreSpr[80*2+1]; // slightly preprocessed sprites\r
+int *HighCacheS_ptr;\r
 \r
 int rendstatus = 0;\r
 int Scanline = 0; // Scanline\r
@@ -62,7 +63,7 @@ struct TileStrip
 #ifdef _ASM_DRAW_C\r
 void DrawWindow(int tstart, int tend, int prio, int sh);\r
 void BackFill(int reg7, int sh);\r
-void DrawSprite(int *sprite, int **hc, int sh, int as);\r
+void DrawSprite(int *sprite, int sh, int as);\r
 void DrawTilesFromCache(int *hc, int sh, int rlim);\r
 void DrawSpritesFromCache(int *hc, int maxwidth, int prio, int sh);\r
 void DrawLayer(int plane_sh, int *hcache, int cellskip, int maxcells);\r
@@ -82,202 +83,115 @@ void blockcpy_or(void *dst, void *src, size_t n, int pat)
 #endif\r
 \r
 \r
-#ifdef _ASM_DRAW_C_AMIPS\r
-int TileNorm(int sx,int addr,int pal);\r
-int TileFlip(int sx,int addr,int pal);\r
-#else\r
-static int TileNorm(int sx,int addr,int pal)\r
-{\r
-  unsigned char *pd = HighCol+sx;\r
-  unsigned int pack=0; unsigned int t=0;\r
-\r
-  pack=*(unsigned int *)(Pico.vram+addr); // Get 8 pixels\r
-  if (pack)\r
-  {\r
-    t=pack&0x0000f000; if (t) pd[0]=(unsigned char)(pal|(t>>12));\r
-    t=pack&0x00000f00; if (t) pd[1]=(unsigned char)(pal|(t>> 8));\r
-    t=pack&0x000000f0; if (t) pd[2]=(unsigned char)(pal|(t>> 4));\r
-    t=pack&0x0000000f; if (t) pd[3]=(unsigned char)(pal|(t    ));\r
-    t=pack&0xf0000000; if (t) pd[4]=(unsigned char)(pal|(t>>28));\r
-    t=pack&0x0f000000; if (t) pd[5]=(unsigned char)(pal|(t>>24));\r
-    t=pack&0x00f00000; if (t) pd[6]=(unsigned char)(pal|(t>>20));\r
-    t=pack&0x000f0000; if (t) pd[7]=(unsigned char)(pal|(t>>16));\r
-    return 0;\r
-  }\r
-\r
-  return 1; // Tile blank\r
+#define TileNormMaker(funcname,pix_func)                     \\r
+static int funcname(int sx,int addr,int pal)                 \\r
+{                                                            \\r
+  unsigned char *pd = HighCol+sx;                            \\r
+  unsigned int pack=0; unsigned int t=0;                     \\r
+                                                             \\r
+  pack=*(unsigned int *)(Pico.vram+addr); /* Get 8 pixels */ \\r
+  if (pack)                                                  \\r
+  {                                                          \\r
+    t=(pack&0x0000f000)>>12; pix_func(0);                    \\r
+    t=(pack&0x00000f00)>> 8; pix_func(1);                    \\r
+    t=(pack&0x000000f0)>> 4; pix_func(2);                    \\r
+    t=(pack&0x0000000f)    ; pix_func(3);                    \\r
+    t=(pack&0xf0000000)>>28; pix_func(4);                    \\r
+    t=(pack&0x0f000000)>>24; pix_func(5);                    \\r
+    t=(pack&0x00f00000)>>20; pix_func(6);                    \\r
+    t=(pack&0x000f0000)>>16; pix_func(7);                    \\r
+    return 0;                                                \\r
+  }                                                          \\r
+                                                             \\r
+  return 1; /* Tile blank */                                 \\r
 }\r
 \r
-static int TileFlip(int sx,int addr,int pal)\r
-{\r
-  unsigned char *pd = HighCol+sx;\r
-  unsigned int pack=0; unsigned int t=0;\r
 \r
-  pack=*(unsigned int *)(Pico.vram+addr); // Get 8 pixels\r
-  if (pack)\r
-  {\r
-    t=pack&0x000f0000; if (t) pd[0]=(unsigned char)(pal|(t>>16));\r
-    t=pack&0x00f00000; if (t) pd[1]=(unsigned char)(pal|(t>>20));\r
-    t=pack&0x0f000000; if (t) pd[2]=(unsigned char)(pal|(t>>24));\r
-    t=pack&0xf0000000; if (t) pd[3]=(unsigned char)(pal|(t>>28));\r
-    t=pack&0x0000000f; if (t) pd[4]=(unsigned char)(pal|(t    ));\r
-    t=pack&0x000000f0; if (t) pd[5]=(unsigned char)(pal|(t>> 4));\r
-    t=pack&0x00000f00; if (t) pd[6]=(unsigned char)(pal|(t>> 8));\r
-    t=pack&0x0000f000; if (t) pd[7]=(unsigned char)(pal|(t>>12));\r
-    return 0;\r
-  }\r
-  return 1; // Tile blank\r
+#define TileFlipMaker(funcname,pix_func)                     \\r
+static int funcname(int sx,int addr,int pal)                 \\r
+{                                                            \\r
+  unsigned char *pd = HighCol+sx;                            \\r
+  unsigned int pack=0; unsigned int t=0;                     \\r
+                                                             \\r
+  pack=*(unsigned int *)(Pico.vram+addr); /* Get 8 pixels */ \\r
+  if (pack)                                                  \\r
+  {                                                          \\r
+    t=(pack&0x000f0000)>>16; pix_func(0);                    \\r
+    t=(pack&0x00f00000)>>20; pix_func(1);                    \\r
+    t=(pack&0x0f000000)>>24; pix_func(2);                    \\r
+    t=(pack&0xf0000000)>>28; pix_func(3);                    \\r
+    t=(pack&0x0000000f)    ; pix_func(4);                    \\r
+    t=(pack&0x000000f0)>> 4; pix_func(5);                    \\r
+    t=(pack&0x00000f00)>> 8; pix_func(6);                    \\r
+    t=(pack&0x0000f000)>>12; pix_func(7);                    \\r
+    return 0;                                                \\r
+  }                                                          \\r
+                                                             \\r
+  return 1; /* Tile blank */                                 \\r
 }\r
-#endif\r
 \r
-// tile renderers for hacky operator sprite support\r
-#define sh_pix(x) \\r
-  if(!t); \\r
-  else if(t==0xe) pd[x]=(unsigned char)((pd[x]&0x3f)|0x80); /* hilight */ \\r
-  else if(t==0xf) pd[x]=(unsigned char)( pd[x]      |0xc0); /* shadow  */ \\r
-  else pd[x]=(unsigned char)(pal|t)\r
 \r
-#ifndef _ASM_DRAW_C\r
-static int TileNormSH(int sx,int addr,int pal)\r
-{\r
-  unsigned int pack=0; unsigned int t=0;\r
-  unsigned char *pd = HighCol+sx;\r
-\r
-  pack=*(unsigned int *)(Pico.vram+addr); // Get 8 pixels\r
-  if (pack)\r
-  {\r
-    t=(pack&0x0000f000)>>12; sh_pix(0);\r
-    t=(pack&0x00000f00)>> 8; sh_pix(1);\r
-    t=(pack&0x000000f0)>> 4; sh_pix(2);\r
-    t=(pack&0x0000000f)    ; sh_pix(3);\r
-    t=(pack&0xf0000000)>>28; sh_pix(4);\r
-    t=(pack&0x0f000000)>>24; sh_pix(5);\r
-    t=(pack&0x00f00000)>>20; sh_pix(6);\r
-    t=(pack&0x000f0000)>>16; sh_pix(7);\r
-    return 0;\r
-  }\r
+#ifdef _ASM_DRAW_C_AMIPS\r
+int TileNorm(int sx,int addr,int pal);\r
+int TileFlip(int sx,int addr,int pal);\r
+#else\r
 \r
-  return 1; // Tile blank\r
-}\r
+#define pix_just_write(x) \\r
+  if (t) pd[x]=pal|t\r
 \r
-static int TileFlipSH(int sx,int addr,int pal)\r
-{\r
-  unsigned int pack=0; unsigned int t=0;\r
-  unsigned char *pd = HighCol+sx;\r
+TileNormMaker(TileNorm,pix_just_write)\r
+TileFlipMaker(TileFlip,pix_just_write)\r
 \r
-  pack=*(unsigned int *)(Pico.vram+addr); // Get 8 pixels\r
-  if (pack)\r
-  {\r
-    t=(pack&0x000f0000)>>16; sh_pix(0);\r
-    t=(pack&0x00f00000)>>20; sh_pix(1);\r
-    t=(pack&0x0f000000)>>24; sh_pix(2);\r
-    t=(pack&0xf0000000)>>28; sh_pix(3);\r
-    t=(pack&0x0000000f)    ; sh_pix(4);\r
-    t=(pack&0x000000f0)>> 4; sh_pix(5);\r
-    t=(pack&0x00000f00)>> 8; sh_pix(6);\r
-    t=(pack&0x0000f000)>>12; sh_pix(7);\r
-    return 0;\r
-  }\r
-  return 1; // Tile blank\r
-}\r
 #endif\r
 \r
-#define tilepixelAS(mask,index,shift) \\r
-  if (!(pd[index]&0xc0)) { t=pack&mask; if (t) pd[index]=(pal|(t>>shift)); }\r
+// draw a sprite pixel, process operator colors\r
+#define pix_sh(x) \\r
+  if (!t); \\r
+  else if (t==0xe) pd[x]=(pd[x]&0x3f)|0x80; /* hilight */ \\r
+  else if (t==0xf) pd[x]= pd[x]      |0xc0; /* shadow  */ \\r
+  else pd[x]=pal|t\r
 \r
-static int TileNormAS(int sx,int addr,int pal)\r
-{\r
-  unsigned char *pd = HighCol+sx;\r
-  unsigned int pack=0; unsigned int t=0;\r
+TileNormMaker(TileNormSH, pix_sh)\r
+TileFlipMaker(TileFlipSH, pix_sh)\r
 \r
-  pack=*(unsigned int *)(Pico.vram+addr); // Get 8 pixels\r
-  if (pack)\r
-  {\r
-    tilepixelAS(0x0000f000, 0, 12);\r
-    tilepixelAS(0x00000f00, 1,  8);\r
-    tilepixelAS(0x000000f0, 2,  4);\r
-    tilepixelAS(0x0000000f, 3,  0);\r
-    tilepixelAS(0xf0000000, 4, 28);\r
-    tilepixelAS(0x0f000000, 5, 24);\r
-    tilepixelAS(0x00f00000, 6, 20);\r
-    tilepixelAS(0x000f0000, 7, 16);\r
-    return 0;\r
-  }\r
+#ifndef _ASM_DRAW_C\r
+// draw a sprite pixel ignoring operator colors\r
+#define pix_sh_noop(x) \\r
+  if (t && t < 0xe) \\r
+    pd[x]=pal|t\r
 \r
-  return 1; // Tile blank\r
-}\r
+TileNormMaker(TileNormSH_noop, pix_sh_noop)\r
+TileFlipMaker(TileFlipSH_noop, pix_sh_noop)\r
+#endif\r
 \r
-static int TileFlipAS(int sx,int addr,int pal)\r
-{\r
-  unsigned char *pd = HighCol+sx;\r
-  unsigned int pack=0; unsigned int t=0;\r
+// process operator pixels only, apply only on low pri tiles\r
+#define pix_sh_onlyop(x) \\r
+  if      (t==0xe && (pd[x]&0x40)) pd[x]=(pd[x]&0x3f)|0x80; /* hilight */ \\r
+  else if (t==0xf && (pd[x]&0x40)) pd[x]= pd[x]      |0xc0; /* shadow  */\r
 \r
-  pack=*(unsigned int *)(Pico.vram+addr); // Get 8 pixels\r
-  if (pack)\r
-  {\r
-    tilepixelAS(0x000f0000, 0, 16);\r
-    tilepixelAS(0x00f00000, 1, 20);\r
-    tilepixelAS(0x0f000000, 2, 24);\r
-    tilepixelAS(0xf0000000, 3, 28);\r
-    tilepixelAS(0x0000000f, 4,  0);\r
-    tilepixelAS(0x000000f0, 5,  4);\r
-    tilepixelAS(0x00000f00, 6,  8);\r
-    tilepixelAS(0x0000f000, 7, 12);\r
-    return 0;\r
-  }\r
-  return 1; // Tile blank\r
-}\r
+TileNormMaker(TileNormSH_onlyop_lp, pix_sh_onlyop)\r
+TileFlipMaker(TileFlipSH_onlyop_lp, pix_sh_onlyop)\r
 \r
-// there is a problem with transparent hi pri tiles (on layer), it will clear high bits\r
-// and sprite tiles will be drawn needlessly. Hopefully that won't happen much..\r
-#define sh_pixAS(x) \\r
-  if(!t); \\r
-  else if(t==0xe) pd[x]=(unsigned char)((pd[x]&0x3f)|0x80); /* hilight */ \\r
-  else if(t==0xf) pd[x]=(unsigned char)( pd[x]      |0xc0); /* shadow  */ \\r
-  else if(!(pd[x]&0xc0)) pd[x]=(unsigned char)(pal|t)\r
+// draw a sprite pixel (AS)\r
+#define pix_as(x) \\r
+  if (t && !(pd[x]&0x80)) pd[x]=pal|t\r
 \r
-static int TileNormSHAS(int sx,int addr,int pal)\r
-{\r
-  unsigned int pack=0; unsigned int t=0;\r
-  unsigned char *pd = HighCol+sx;\r
+TileNormMaker(TileNormAS, pix_as)\r
+TileFlipMaker(TileFlipAS, pix_as)\r
 \r
-  pack=*(unsigned int *)(Pico.vram+addr); // Get 8 pixels\r
-  if (pack)\r
-  {\r
-    t=(pack&0x0000f000)>>12; sh_pixAS(0);\r
-    t=(pack&0x00000f00)>> 8; sh_pixAS(1);\r
-    t=(pack&0x000000f0)>> 4; sh_pixAS(2);\r
-    t=(pack&0x0000000f)    ; sh_pixAS(3);\r
-    t=(pack&0xf0000000)>>28; sh_pixAS(4);\r
-    t=(pack&0x0f000000)>>24; sh_pixAS(5);\r
-    t=(pack&0x00f00000)>>20; sh_pixAS(6);\r
-    t=(pack&0x000f0000)>>16; sh_pixAS(7);\r
-    return 0;\r
-  }\r
+// draw a sprite pixel, skip operator colors (AS)\r
+#define pix_sh_as_noop(x) \\r
+  if (t && t < 0xe && !(pd[x]&0x80)) pd[x]=pal|t\r
 \r
-  return 1; // Tile blank\r
-}\r
+TileNormMaker(TileNormAS_noop, pix_sh_as_noop)\r
+TileFlipMaker(TileFlipAS_noop, pix_sh_as_noop)\r
 \r
-static int TileFlipSHAS(int sx,int addr,int pal)\r
-{\r
-  unsigned int pack=0; unsigned int t=0;\r
-  unsigned char *pd = HighCol+sx;\r
+// mark pixel as sprite pixel (AS)\r
+#define pix_sh_as_onlymark(x) \\r
+  if (t) pd[x]|=0x80\r
 \r
-  pack=*(unsigned int *)(Pico.vram+addr); // Get 8 pixels\r
-  if (pack)\r
-  {\r
-    t=(pack&0x000f0000)>>16; sh_pixAS(0);\r
-    t=(pack&0x00f00000)>>20; sh_pixAS(1);\r
-    t=(pack&0x0f000000)>>24; sh_pixAS(2);\r
-    t=(pack&0xf0000000)>>28; sh_pixAS(3);\r
-    t=(pack&0x0000000f)    ; sh_pixAS(4);\r
-    t=(pack&0x000000f0)>> 4; sh_pixAS(5);\r
-    t=(pack&0x00000f00)>> 8; sh_pixAS(6);\r
-    t=(pack&0x0000f000)>>12; sh_pixAS(7);\r
-    return 0;\r
-  }\r
-  return 1; // Tile blank\r
-}\r
+TileNormMaker(TileNormAS_onlymark, pix_sh_as_onlymark)\r
+TileFlipMaker(TileFlipAS_onlymark, pix_sh_as_onlymark)\r
 \r
 \r
 // --------------------------------------------\r
@@ -512,7 +426,7 @@ static void DrawLayer(int plane_sh, int *hcache, int cellskip, int maxcells)
 static void DrawWindow(int tstart, int tend, int prio, int sh) // int *hcache\r
 {\r
   struct PicoVideo *pvid=&Pico.video;\r
-  int tilex=0,ty=0,nametab,code=0;\r
+  int tilex,ty,nametab,code=0;\r
   int blank=-1; // The tile we know is blank\r
 \r
   // Find name table line:\r
@@ -528,9 +442,6 @@ static void DrawWindow(int tstart, int tend, int prio, int sh) // int *hcache
   }\r
 \r
   tilex=tstart<<1;\r
-  tend<<=1;\r
-\r
-  ty=(Scanline&7)<<1; // Y-Offset into tile\r
 \r
   if (!(rendstatus & PDRAW_WND_DIFF_PRIO)) {\r
     // check the first tile code\r
@@ -539,6 +450,9 @@ static void DrawWindow(int tstart, int tend, int prio, int sh) // int *hcache
     if ((code>>15) != prio) return;\r
   }\r
 \r
+  tend<<=1;\r
+  ty=(Scanline&7)<<1; // Y-Offset into tile\r
+\r
   // Draw tiles across screen:\r
   if (!sh)\r
   {\r
@@ -571,7 +485,7 @@ static void DrawWindow(int tstart, int tend, int prio, int sh) // int *hcache
     for (; tilex < tend; tilex++)\r
     {\r
       int addr=0,zero=0;\r
-      int pal, tmp, *zb;\r
+      int pal;\r
 \r
       code=Pico.vram[nametab+tilex];\r
       if(code==blank) continue;\r
@@ -582,15 +496,10 @@ static void DrawWindow(int tstart, int tend, int prio, int sh) // int *hcache
 \r
       pal=((code>>9)&0x30);\r
 \r
-      zb = (int *)(HighCol+8+(tilex<<3));\r
-      if(prio) {\r
-        tmp = *zb;\r
-        if(!(tmp&0x00000080)) tmp&=~0x000000c0; if(!(tmp&0x00008000)) tmp&=~0x0000c000;\r
-        if(!(tmp&0x00800000)) tmp&=~0x00c00000; if(!(tmp&0x80000000)) tmp&=~0xc0000000;\r
-        *zb++=tmp; tmp = *zb;\r
-        if(!(tmp&0x00000080)) tmp&=~0x000000c0; if(!(tmp&0x00008000)) tmp&=~0x0000c000;\r
-        if(!(tmp&0x00800000)) tmp&=~0x00c00000; if(!(tmp&0x80000000)) tmp&=~0xc0000000;\r
-        *zb++=tmp;\r
+      if (prio) {\r
+        int *zb = (int *)(HighCol+8+(tilex<<3));\r
+        *zb++ &= 0x3f3f3f3f;\r
+        *zb   &= 0x3f3f3f3f;\r
       } else {\r
         pal |= 0x40;\r
       }\r
@@ -617,14 +526,7 @@ static void DrawTilesFromCacheShPrep(void)
   rendstatus |= PDRAW_SHHI_DONE;\r
   while (c--)\r
   {\r
-    int tmp = *zb;\r
-    if (!(tmp & 0x80808080)) *zb=tmp&0x3f3f3f3f;\r
-    else {\r
-      if(!(tmp&0x00000080)) tmp&=~0x000000c0; if(!(tmp&0x00008000)) tmp&=~0x0000c000;\r
-      if(!(tmp&0x00800000)) tmp&=~0x00c00000; if(!(tmp&0x80000000)) tmp&=~0xc0000000;\r
-      *zb=tmp;\r
-    }\r
-    zb++;\r
+    *zb++ &= 0x3f3f3f3f;\r
   }\r
 }\r
 \r
@@ -671,10 +573,8 @@ static void DrawTilesFromCache(int *hc, int sh, int rlim)
       addr+=(unsigned int)code>>25; // y offset into tile\r
       dx=(code>>16)&0x1ff;\r
       zb = HighCol+dx;\r
-      if(!(*zb&0x80)) *zb&=0x3f; zb++; if(!(*zb&0x80)) *zb&=0x3f; zb++;\r
-      if(!(*zb&0x80)) *zb&=0x3f; zb++; if(!(*zb&0x80)) *zb&=0x3f; zb++;\r
-      if(!(*zb&0x80)) *zb&=0x3f; zb++; if(!(*zb&0x80)) *zb&=0x3f; zb++;\r
-      if(!(*zb&0x80)) *zb&=0x3f; zb++; if(!(*zb&0x80)) *zb&=0x3f; zb++;\r
+      *zb++ &= 0x3f; *zb++ &= 0x3f; *zb++ &= 0x3f; *zb++ &= 0x3f;\r
+      *zb++ &= 0x3f; *zb++ &= 0x3f; *zb++ &= 0x3f; *zb++ &= 0x3f;\r
 \r
       pal=((code>>9)&0x30);\r
       if (rlim-dx < 0) goto last_cut_tile;\r
@@ -726,7 +626,7 @@ last_cut_tile:
 // Index + 0  :    hhhhvvvv ab--hhvv yyyyyyyy yyyyyyyy // a: offscreen h, b: offs. v, h: horiz. size\r
 // Index + 4  :    xxxxxxxx xxxxxxxx pccvhnnn nnnnnnnn // x: x coord + 8\r
 \r
-static void DrawSprite(int *sprite, int **hc, int sh, int as)\r
+static void DrawSprite(int *sprite, int sh, int as)\r
 {\r
   int width=0,height=0;\r
   int row=0,code=0;\r
@@ -747,25 +647,27 @@ static void DrawSprite(int *sprite, int **hc, int sh, int as)
 \r
   if (code&0x1000) row=(height<<3)-1-row; // Flip Y\r
 \r
-  tile=code&0x7ff; // Tile number\r
-  tile+=row>>3; // Tile number increases going down\r
+  tile=code + (row>>3); // Tile number increases going down\r
   delta=height; // Delta to increase tile by going right\r
   if (code&0x0800) { tile+=delta*(width-1); delta=-delta; } // Flip X\r
 \r
-  tile<<=4; tile+=(row&7)<<1; // Tile address\r
+  tile &= 0x7ff; tile<<=4; tile+=(row&7)<<1; // Tile address\r
+\r
+  pal=(code>>9)&0x30;\r
 \r
-  if (code&0x8000) { // high priority - cache it\r
-    *(*hc)++ = (tile<<16)|((code&0x0800)<<5)|((sx<<6)&0x0000ffc0)|((code>>9)&0x30)|((sprite[0]>>16)&0xf);\r
-    // we need all for accurate sprites, cached will be used to recover ones overwritten by high layer\r
-    if (!as) return;\r
+  // assume there will be no sprites with both normal and operator pixels..\r
+  if ((code&0x8000) || (sh && pal == 0x30) || as) {\r
+    *HighCacheS_ptr++ = ((code&0x8000)<<16)|(tile<<16)|((code&0x0800)<<5)|((sx<<6)&0x0000ffc0)|pal|((sprite[0]>>16)&0xf);\r
+    // we need all for accurate sprites, cached will be used to do proper priorities\r
+    if (!as && (code&0x8000)) return;\r
   }\r
 \r
   delta<<=4; // Delta of address\r
-  pal=((code>>9)&0x30)|((sh|as)<<6);\r
+  pal|=((sh|as)<<6);\r
 \r
   if (sh && (code&0x6000) == 0x6000) {\r
-    if(code&0x0800) fTileFunc=TileFlipSH;\r
-    else            fTileFunc=TileNormSH;\r
+    if(code&0x0800) fTileFunc=TileFlipSH_noop;\r
+    else            fTileFunc=TileNormSH_noop;\r
   } else {\r
     if(code&0x0800) fTileFunc=TileFlip;\r
     else            fTileFunc=TileNorm;\r
@@ -880,21 +782,29 @@ static void DrawSpritesFromCache(int *hc, int maxwidth, int prio, int sh)
   int pal;\r
   int (*fTileFunc)(int sx,int addr,int pal);\r
 \r
-  // *(*hc)++ = (tile<<16)|((code&0x0800)<<5)|((sx<<6)&0x0000ffc0)|((code>>9)&0x30)|((sprite[0]>>24)&0xf);\r
+  // prio[31]:tile[30:17]:flipx[16]:sx[15:6]:pal[5:4]:delta_width[3:0]\r
 \r
-  while((code=*hc++)) {\r
+  while ((code=*hc++))\r
+  {\r
     pal=(code&0x30);\r
     delta=code&0xf;\r
     width=delta>>2; delta&=3;\r
     width++; delta++; // Width and height in tiles\r
     if (code&0x10000) delta=-delta; // Flip X\r
     delta<<=4;\r
-    tile=((unsigned int)code>>17)<<1;\r
+    tile=((unsigned int)code>>17)<<1; // also has prio\r
     sx=(code<<16)>>22; // sx can be negative (start offscreen), so sign extend\r
 \r
-    if(sh && pal == 0x30) { //\r
-      if(code&0x10000) fTileFunc=TileFlipSH;\r
-      else             fTileFunc=TileNormSH;\r
+    if (sh && pal == 0x30)\r
+    {\r
+      if (code & 0x80000000) // hi priority\r
+      {\r
+        if(code&0x10000) fTileFunc=TileFlipSH;\r
+        else             fTileFunc=TileNormSH;\r
+      } else {\r
+        if(code&0x10000) fTileFunc=TileFlipSH_onlyop_lp;\r
+        else             fTileFunc=TileNormSH_onlyop_lp;\r
+      }\r
     } else {\r
       if(code&0x10000) fTileFunc=TileFlip;\r
       else             fTileFunc=TileNorm;\r
@@ -915,12 +825,16 @@ static void DrawSpritesFromCache(int *hc, int maxwidth, int prio, int sh)
 static void DrawSpritesFromCacheAS(int *hc, int maxwidth, int prio, int sh)\r
 {\r
   int code, tile, sx, delta, width;\r
-  int pal;\r
+  int pal, *hce, *hco;\r
   int (*fTileFunc)(int sx,int addr,int pal);\r
 \r
-  // *(*hc)++ = (tile<<16)|((code&0x0800)<<5)|((sx<<6)&0x0000ffc0)|((code>>9)&0x30)|((sprite[0]>>24)&0xf);\r
+  // prio[31]:tile[30:17]:flipx[16]:sx[15:6]:pal[5:4]:delta_width[3:0]\r
 \r
-  while((code=*hc++)) {\r
+  /* walk the sprite cache backwards.. */\r
+  hco = hce = HighCacheS_ptr;\r
+  while (hce > hc)\r
+  {\r
+    code=*(--hce);\r
     pal=(code&0x30);\r
     delta=code&0xf;\r
     width=delta>>2; delta&=3;\r
@@ -930,14 +844,67 @@ static void DrawSpritesFromCacheAS(int *hc, int maxwidth, int prio, int sh)
     tile=((unsigned int)code>>17)<<1;\r
     sx=(code<<16)>>22; // sx can be negative (start offscreen), so sign extend\r
 \r
-    if(sh && pal == 0x30) { //\r
-      if(code&0x10000) fTileFunc=TileFlipSHAS;\r
-      else             fTileFunc=TileNormSHAS;\r
+    if (code & 0x80000000) // hi priority\r
+    {\r
+      if (sh && pal == 0x30)\r
+      {\r
+        if(code&0x10000) fTileFunc=TileFlipAS_noop;\r
+        else             fTileFunc=TileNormAS_noop;\r
+        *(--hco) = code; /* save for later */\r
+      } else {\r
+        if(code&0x10000) fTileFunc=TileFlipAS;\r
+        else             fTileFunc=TileNormAS;\r
+      }\r
     } else {\r
-      if(code&0x10000) fTileFunc=TileFlipAS;\r
-      else             fTileFunc=TileNormAS;\r
+      if(code&0x10000) fTileFunc=TileFlipAS_onlymark;\r
+      else             fTileFunc=TileNormAS_onlymark;\r
     }\r
 \r
+    pal |= 0x80;\r
+    for (; width; width--,sx+=8,tile+=delta)\r
+    {\r
+      if(sx<=0)   continue;\r
+      if(sx>=328) break; // Offscreen\r
+\r
+      tile&=0x7fff; // Clip tile address\r
+      fTileFunc(sx,tile,pal);\r
+    }\r
+  }\r
+\r
+  if (!sh) return;\r
+\r
+  /* nasty 1: remove 'sprite' flags */\r
+  {\r
+    int c = 320/4, *zb = (int *)(HighCol+8);\r
+    while (c--)\r
+    {\r
+      *zb++ &= 0x7f7f7f7f;\r
+    }\r
+  }\r
+\r
+  /* nasty 2: loop once more and do operator colors */\r
+  while ((code=*hco++))\r
+  {\r
+    pal=(code&0x30);\r
+    if (pal != 0x30) continue;\r
+    delta=code&0xf;\r
+    width=delta>>2; delta&=3;\r
+    width++; delta++;\r
+    if (code&0x10000) delta=-delta; // Flip X\r
+    delta<<=4;\r
+    tile=((unsigned int)code>>17)<<1;\r
+    sx=(code<<16)>>22;\r
+\r
+    if (code & 0x80000000)\r
+    {\r
+      if(code&0x10000) fTileFunc=TileFlipSH;\r
+      else             fTileFunc=TileNormSH;\r
+    } else {\r
+      if(code&0x10000) fTileFunc=TileFlipSH_onlyop_lp;\r
+      else             fTileFunc=TileNormSH_onlyop_lp;\r
+    }\r
+\r
+    pal |= 0x80;\r
     for (; width; width--,sx+=8,tile+=delta)\r
     {\r
       if(sx<=0)   continue;\r
@@ -950,6 +917,7 @@ static void DrawSpritesFromCacheAS(int *hc, int maxwidth, int prio, int sh)
 }\r
 \r
 \r
+\r
 // Index + 0  :    ----hhvv -lllllll -------y yyyyyyyy\r
 // Index + 4  :    -------x xxxxxxxx pccvhnnn nnnnnnnn\r
 // v\r
@@ -1062,6 +1030,7 @@ static void DrawAllSprites(int *hcache, int maxwidth, int prio, int sh)
   if (PicoOpt & POPT_DIS_SPRITE_LIM)\r
     max_line_sprites = 80;\r
 \r
+  HighCacheS_ptr = hcache;\r
   ps = HighPreSpr;\r
 \r
   // Index + 0  :    hhhhvvvv ab--hhvv yyyyyyyy yyyyyyyy // a: offscreen h, b: offs. v, h: horiz. size\r
@@ -1108,10 +1077,10 @@ static void DrawAllSprites(int *hcache, int maxwidth, int prio, int sh)
 \r
   // Go through sprites backwards:\r
   for (i--; i>=0; i--)\r
-    DrawSprite(sprites[i],&hcache,sh,n);\r
+    DrawSprite(sprites[i],sh,n);\r
 \r
   // terminate cache list\r
-  *hcache = 0;\r
+  *HighCacheS_ptr = 0;\r
 }\r
 \r
 \r
@@ -1349,7 +1318,7 @@ static int DrawDisplay(int sh, int as)
     DrawWindow((win&0x80) ? edge : 0, (win&0x80) ? maxcells>>1 : edge, 1, sh);\r
   } else\r
     if (HighCacheA[0]) DrawTilesFromCache(HighCacheA, sh, 328);\r
-  DrawAllSpritesHiPri(HighCacheS, maxw, 1, sh);\r
+  if (HighCacheS[0]) DrawAllSpritesHiPri(HighCacheS, maxw, 1, sh);\r
 \r
 #if 0\r
   {\r