gpu_neon: fix some missing ebuf updates
[pcsx_rearmed.git] / plugins / gpu_neon / psx_gpu / psx_gpu_parse.c
1 /*
2  * Copyright (C) 2011 Gilead Kutnick "Exophase" <exophase@gmail.com>
3  *
4  * This program is free software; you can redistribute it and/or
5  * modify it under the terms of the GNU General Public License as
6  * published by the Free Software Foundation; either version 2 of
7  * the License, or (at your option) any later version.
8  *
9  * This program is distributed in the hope that it will be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
12  * General Public License for more details.
13  */
14
15 #include <stdio.h>
16
17 #include "common.h"
18
19 #ifndef command_lengths
20 const u8 command_lengths[256] =
21 {
22         0,  0,  2,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,   // 00
23         0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,   // 10
24         3,  3,  3,  3,  6,  6,  6,  6,  4,  4,  4,  4,  8,  8,  8,  8,   // 20
25         5,  5,  5,  5,  8,  8,  8,  8,  7,  7,  7,  7,  11, 11, 11, 11,  // 30
26         2,  2,  2,  2,  2,  2,  2,  2,  3,  3,  3,  3,  3,  3,  3,  3,   // 40
27         3,  3,  3,  3,  3,  3,  3,  3,  4,  4,  4,  4,  4,  4,  4,  4,   // 50
28         2,  2,  2,  2,  3,  3,  3,  3,  1,  1,  1,  1,  0,  0,  0,  0,   // 60
29         1,  1,  1,  1,  2,  2,  2,  2,  1,  1,  1,  1,  2,  2,  2,  2,   // 70
30         3,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,   // 80
31         0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,   // 90
32         2,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,   // a0
33         0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,   // b0
34         2,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,   // c0
35         0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,   // d0
36         0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,   // e0
37         0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0    // f0
38 };
39 #endif
40
41 void update_texture_ptr(psx_gpu_struct *psx_gpu)
42 {
43   u8 *texture_base;
44   u8 *texture_ptr;
45
46   switch((psx_gpu->render_state_base >> 8) & 0x3)
47   {
48     case TEXTURE_MODE_4BPP:
49       texture_base = psx_gpu->texture_4bpp_cache[psx_gpu->current_texture_page];
50
51       texture_ptr = texture_base;
52       texture_ptr += psx_gpu->texture_window_x & 0xF;
53       texture_ptr += (psx_gpu->texture_window_y & 0xF) << 4;
54       texture_ptr += (psx_gpu->texture_window_x >> 4) << 8;
55       texture_ptr += (psx_gpu->texture_window_y >> 4) << 12;
56       break;
57
58     case TEXTURE_MODE_8BPP:
59       if(psx_gpu->current_texture_page & 0x1)
60       {
61         texture_base =
62          psx_gpu->texture_8bpp_odd_cache[psx_gpu->current_texture_page >> 1];
63       }
64       else
65       {
66         texture_base =
67          psx_gpu->texture_8bpp_even_cache[psx_gpu->current_texture_page >> 1];
68       }
69       
70       texture_ptr = texture_base;
71       texture_ptr += psx_gpu->texture_window_x & 0xF;
72       texture_ptr += (psx_gpu->texture_window_y & 0xF) << 4;
73       texture_ptr += (psx_gpu->texture_window_x >> 4) << 8;
74       texture_ptr += (psx_gpu->texture_window_y >> 4) << 12;
75       break;
76
77     default:
78     case TEXTURE_MODE_16BPP:
79       texture_base = (u8 *)(psx_gpu->vram_ptr);
80       texture_base += (psx_gpu->current_texture_page & 0xF) * 128;
81       texture_base += ((psx_gpu->current_texture_page >> 4) * 256) * 2048;
82
83       texture_ptr = texture_base;
84       texture_ptr += psx_gpu->texture_window_x * 2;
85       texture_ptr += (psx_gpu->texture_window_y) * 2048;
86       break;
87   }
88
89   psx_gpu->texture_page_base = texture_base;
90   psx_gpu->texture_page_ptr = texture_ptr;  
91 }
92
93 void set_texture(psx_gpu_struct *psx_gpu, u32 texture_settings)
94 {
95   texture_settings &= 0x1FF;
96   if(psx_gpu->texture_settings != texture_settings)
97   {
98     u32 new_texture_page = texture_settings & 0x1F;
99     u32 texture_mode = (texture_settings >> 7) & 0x3;
100     u32 render_state_base = psx_gpu->render_state_base;
101
102     flush_render_block_buffer(psx_gpu);
103
104     render_state_base &= ~(0xF << 6);
105     render_state_base |= ((texture_settings >> 5) & 0xF) << 6;
106
107     psx_gpu->render_state_base = render_state_base;
108
109     psx_gpu->current_texture_mask = 0x1 << new_texture_page;
110
111     if(texture_mode == TEXTURE_MODE_8BPP)
112     {     
113       // In 8bpp mode 256x256 takes up two pages. If it's on the right edge it
114       // wraps back around to the left edge.
115       u32 adjacent_texture_page = ((texture_settings + 1) & 0xF) | (texture_settings & 0x10);
116       psx_gpu->current_texture_mask |= 0x1 << adjacent_texture_page;
117
118       if((psx_gpu->last_8bpp_texture_page ^ new_texture_page) & 0x1)
119       {
120         u32 dirty_textures_8bpp_alternate_mask =
121          psx_gpu->dirty_textures_8bpp_alternate_mask;
122         psx_gpu->dirty_textures_8bpp_alternate_mask =
123          psx_gpu->dirty_textures_8bpp_mask;
124         psx_gpu->dirty_textures_8bpp_mask = dirty_textures_8bpp_alternate_mask;
125       }
126
127       psx_gpu->last_8bpp_texture_page = new_texture_page;
128     }
129
130     psx_gpu->current_texture_page = new_texture_page;
131     psx_gpu->texture_settings = texture_settings;
132
133     update_texture_ptr(psx_gpu);
134   }
135 }
136
137 void set_clut(psx_gpu_struct *psx_gpu, u32 clut_settings)
138 {
139   if(psx_gpu->clut_settings != clut_settings)
140   {
141     flush_render_block_buffer(psx_gpu);
142     psx_gpu->clut_settings = clut_settings;
143     psx_gpu->clut_ptr = psx_gpu->vram_ptr + ((clut_settings & 0x7FFF) * 16);
144   }
145 }
146
147 void set_triangle_color(psx_gpu_struct *psx_gpu, u32 triangle_color)
148 {
149   if(psx_gpu->triangle_color != triangle_color)
150   {
151     flush_render_block_buffer(psx_gpu);
152     psx_gpu->triangle_color = triangle_color;
153   }
154 }
155
156 static void do_fill(psx_gpu_struct *psx_gpu, u32 x, u32 y,
157  u32 width, u32 height, u32 color)
158 {
159   x &= ~0xF;
160   width = ((width + 0xF) & ~0xF);
161
162   flush_render_block_buffer(psx_gpu);
163
164   if(unlikely((x + width) > 1024))
165   {
166     u32 width_a = 1024 - x;
167     u32 width_b = width - width_a;
168
169     if(unlikely((y + height) > 512))
170     {
171       u32 height_a = 512 - y;
172       u32 height_b = height - height_a;
173
174       render_block_fill(psx_gpu, color, x, y, width_a, height_a);
175       render_block_fill(psx_gpu, color, 0, y, width_b, height_a);
176       render_block_fill(psx_gpu, color, x, 0, width_a, height_b);
177       render_block_fill(psx_gpu, color, 0, 0, width_b, height_b);
178     }
179     else
180     {
181       render_block_fill(psx_gpu, color, x, y, width_a, height);
182       render_block_fill(psx_gpu, color, 0, y, width_b, height);
183     }
184   }
185   else
186   {
187     if(unlikely((y + height) > 512))
188     {
189       u32 height_a = 512 - y;
190       u32 height_b = height - height_a;
191
192       render_block_fill(psx_gpu, color, x, y, width, height_a);
193       render_block_fill(psx_gpu, color, x, 0, width, height_b);
194     }
195     else
196     {
197       render_block_fill(psx_gpu, color, x, y, width, height);
198     }
199   }
200 }
201
202 #define sign_extend_12bit(value)                                               \
203   (((s32)((value) << 20)) >> 20)                                               \
204
205 #define sign_extend_11bit(value)                                               \
206   (((s32)((value) << 21)) >> 21)                                               \
207
208 #define sign_extend_10bit(value)                                               \
209   (((s32)((value) << 22)) >> 22)                                               \
210
211
212 #define get_vertex_data_xy(vertex_number, offset16)                            \
213   vertexes[vertex_number].x =                                                  \
214    sign_extend_12bit(list_s16[offset16]) + psx_gpu->offset_x;                  \
215   vertexes[vertex_number].y =                                                  \
216    sign_extend_12bit(list_s16[(offset16) + 1]) + psx_gpu->offset_y;            \
217
218 #define get_vertex_data_uv(vertex_number, offset16)                            \
219   vertexes[vertex_number].u = list_s16[offset16] & 0xFF;                       \
220   vertexes[vertex_number].v = (list_s16[offset16] >> 8) & 0xFF                 \
221
222 #define get_vertex_data_rgb(vertex_number, offset32)                           \
223   vertexes[vertex_number].r = list[offset32] & 0xFF;                           \
224   vertexes[vertex_number].g = (list[offset32] >> 8) & 0xFF;                    \
225   vertexes[vertex_number].b = (list[offset32] >> 16) & 0xFF                    \
226
227 #define get_vertex_data_xy_uv(vertex_number, offset16)                         \
228   get_vertex_data_xy(vertex_number, offset16);                                 \
229   get_vertex_data_uv(vertex_number, (offset16) + 2)                            \
230
231 #define get_vertex_data_xy_rgb(vertex_number, offset16)                        \
232   get_vertex_data_rgb(vertex_number, (offset16) / 2);                          \
233   get_vertex_data_xy(vertex_number, (offset16) + 2);                           \
234
235 #define get_vertex_data_xy_uv_rgb(vertex_number, offset16)                     \
236   get_vertex_data_rgb(vertex_number, (offset16) / 2);                          \
237   get_vertex_data_xy(vertex_number, (offset16) + 2);                           \
238   get_vertex_data_uv(vertex_number, (offset16) + 4);                           \
239
240 #define set_vertex_color_constant(vertex_number, color)                        \
241   vertexes[vertex_number].r = color & 0xFF;                                    \
242   vertexes[vertex_number].g = (color >> 8) & 0xFF;                             \
243   vertexes[vertex_number].b = (color >> 16) & 0xFF                             \
244
245 #define get_vertex_data_xy_rgb_constant(vertex_number, offset16, color)        \
246   get_vertex_data_xy(vertex_number, offset16);                                 \
247   set_vertex_color_constant(vertex_number, color)                              \
248
249 #ifndef SET_Ex
250 #define SET_Ex(r, v)
251 #endif
252
253 u32 gpu_parse(psx_gpu_struct *psx_gpu, u32 *list, u32 size, u32 *last_command)
254 {
255   vertex_struct vertexes[4] __attribute__((aligned(16))) = {};
256   u32 current_command = 0, command_length;
257
258   u32 *list_start = list;
259   u32 *list_end = list + (size / 4);
260
261   for(; list < list_end; list += 1 + command_length)
262   {
263         s16 *list_s16 = (void *)list;
264         current_command = *list >> 24;
265         command_length = command_lengths[current_command];
266         if (list + 1 + command_length > list_end) {
267           current_command = (u32)-1;
268           break;
269         }
270
271         switch(current_command)
272         {
273                 case 0x00:
274                         break;
275   
276                 case 0x02:
277       {
278         u32 x = list_s16[2] & 0x3FF;
279         u32 y = list_s16[3] & 0x1FF;
280         u32 width = list_s16[4] & 0x3FF;
281         u32 height = list_s16[5] & 0x1FF;
282         u32 color = list[0] & 0xFFFFFF;
283
284         do_fill(psx_gpu, x, y, width, height, color);
285                         break;
286       }
287   
288                 case 0x20 ... 0x23:
289       {
290         set_triangle_color(psx_gpu, list[0] & 0xFFFFFF);
291   
292         get_vertex_data_xy(0, 2);
293         get_vertex_data_xy(1, 4);
294         get_vertex_data_xy(2, 6);
295           
296         render_triangle(psx_gpu, vertexes, current_command);
297                         break;
298       }
299   
300                 case 0x24 ... 0x27:
301       {
302         set_clut(psx_gpu, list_s16[5]);
303         set_texture(psx_gpu, list_s16[9]);
304         set_triangle_color(psx_gpu, list[0] & 0xFFFFFF);
305   
306         get_vertex_data_xy_uv(0, 2);
307         get_vertex_data_xy_uv(1, 6);
308         get_vertex_data_xy_uv(2, 10);
309   
310         render_triangle(psx_gpu, vertexes, current_command);
311                         break;
312       }
313   
314                 case 0x28 ... 0x2B:
315       {
316         set_triangle_color(psx_gpu, list[0] & 0xFFFFFF);
317   
318         get_vertex_data_xy(0, 2);
319         get_vertex_data_xy(1, 4);
320         get_vertex_data_xy(2, 6);
321         get_vertex_data_xy(3, 8);
322   
323         render_triangle(psx_gpu, vertexes, current_command);
324         render_triangle(psx_gpu, &(vertexes[1]), current_command);
325                         break;
326       }
327   
328                 case 0x2C ... 0x2F:
329       {
330         set_clut(psx_gpu, list_s16[5]);
331         set_texture(psx_gpu, list_s16[9]);
332         set_triangle_color(psx_gpu, list[0] & 0xFFFFFF);
333   
334         get_vertex_data_xy_uv(0, 2);   
335         get_vertex_data_xy_uv(1, 6);   
336         get_vertex_data_xy_uv(2, 10);  
337         get_vertex_data_xy_uv(3, 14);
338   
339         render_triangle(psx_gpu, vertexes, current_command);
340         render_triangle(psx_gpu, &(vertexes[1]), current_command);
341                         break;
342       }
343   
344                 case 0x30 ... 0x33:
345       {
346         get_vertex_data_xy_rgb(0, 0);
347         get_vertex_data_xy_rgb(1, 4);
348         get_vertex_data_xy_rgb(2, 8);
349   
350         render_triangle(psx_gpu, vertexes, current_command);
351                         break;
352       }
353   
354                 case 0x34:
355                 case 0x35:
356                 case 0x36:
357                 case 0x37:
358       {
359         set_clut(psx_gpu, list_s16[5]);
360         set_texture(psx_gpu, list_s16[11]);
361   
362         get_vertex_data_xy_uv_rgb(0, 0);
363         get_vertex_data_xy_uv_rgb(1, 6);
364         get_vertex_data_xy_uv_rgb(2, 12);
365
366         render_triangle(psx_gpu, vertexes, current_command);
367                         break;
368       }
369   
370                 case 0x38:
371                 case 0x39:
372                 case 0x3A:
373                 case 0x3B:
374       {
375         get_vertex_data_xy_rgb(0, 0);
376         get_vertex_data_xy_rgb(1, 4);
377         get_vertex_data_xy_rgb(2, 8);
378         get_vertex_data_xy_rgb(3, 12);
379   
380         render_triangle(psx_gpu, vertexes, current_command);
381         render_triangle(psx_gpu, &(vertexes[1]), current_command);
382                         break;
383       }
384   
385                 case 0x3C:
386                 case 0x3D:
387                 case 0x3E:
388                 case 0x3F:
389       {
390         set_clut(psx_gpu, list_s16[5]);
391         set_texture(psx_gpu, list_s16[11]);
392   
393         get_vertex_data_xy_uv_rgb(0, 0);
394         get_vertex_data_xy_uv_rgb(1, 6);
395         get_vertex_data_xy_uv_rgb(2, 12);
396         get_vertex_data_xy_uv_rgb(3, 18);
397   
398         render_triangle(psx_gpu, vertexes, current_command);
399         render_triangle(psx_gpu, &(vertexes[1]), current_command);
400                         break;
401       }
402   
403                 case 0x40 ... 0x47:
404       {
405         vertexes[0].x = list_s16[2] + psx_gpu->offset_x;
406         vertexes[0].y = list_s16[3] + psx_gpu->offset_y;
407         vertexes[1].x = list_s16[4] + psx_gpu->offset_x;
408         vertexes[1].y = list_s16[5] + psx_gpu->offset_y;
409
410         render_line(psx_gpu, vertexes, current_command, list[0], 0);
411                         break;
412       }
413   
414                 case 0x48 ... 0x4F:
415       {
416         u32 num_vertexes = 1;
417         u32 *list_position = &(list[2]);
418         u32 xy = list[1];
419
420         vertexes[1].x = (xy & 0xFFFF) + psx_gpu->offset_x;
421         vertexes[1].y = (xy >> 16) + psx_gpu->offset_y;
422       
423         xy = *list_position;
424         while(1)
425         {
426           vertexes[0] = vertexes[1];
427
428           vertexes[1].x = (xy & 0xFFFF) + psx_gpu->offset_x;
429           vertexes[1].y = (xy >> 16) + psx_gpu->offset_y;
430
431           render_line(psx_gpu, vertexes, current_command, list[0], 0);
432
433           list_position++;
434           num_vertexes++;
435
436           if(list_position >= list_end)
437           {
438             current_command = (u32)-1;
439             goto breakloop;
440           }
441
442           xy = *list_position;
443           if((xy & 0xF000F000) == 0x50005000)
444             break;
445         }
446
447         command_length += (num_vertexes - 2);
448         break;
449       }
450   
451                 case 0x50 ... 0x57:
452       {
453         vertexes[0].r = list[0] & 0xFF;
454         vertexes[0].g = (list[0] >> 8) & 0xFF;
455         vertexes[0].b = (list[0] >> 16) & 0xFF;
456         vertexes[0].x = list_s16[2] + psx_gpu->offset_x;
457         vertexes[0].y = list_s16[3] + psx_gpu->offset_y;
458
459         vertexes[1].r = list[2] & 0xFF;
460         vertexes[1].g = (list[2] >> 8) & 0xFF;
461         vertexes[1].b = (list[2] >> 16) & 0xFF;
462         vertexes[1].x = list_s16[6] + psx_gpu->offset_x;
463         vertexes[1].y = list_s16[7] + psx_gpu->offset_y;
464
465         render_line(psx_gpu, vertexes, current_command, 0, 0);
466                         break;
467       }
468  
469       case 0x58 ... 0x5F:
470       {
471         u32 num_vertexes = 1;
472         u32 *list_position = &(list[2]);
473         u32 color = list[0];
474         u32 xy = list[1];
475
476         vertexes[1].r = color & 0xFF;
477         vertexes[1].g = (color >> 8) & 0xFF;
478         vertexes[1].b = (color >> 16) & 0xFF;
479         vertexes[1].x = (xy & 0xFFFF) + psx_gpu->offset_x;
480         vertexes[1].y = (xy >> 16) + psx_gpu->offset_y;
481       
482         color = list_position[0];
483         while(1)
484         {
485           xy = list_position[1];
486
487           vertexes[0] = vertexes[1];
488
489           vertexes[1].r = color & 0xFF;
490           vertexes[1].g = (color >> 8) & 0xFF;
491           vertexes[1].b = (color >> 16) & 0xFF;
492           vertexes[1].x = (xy & 0xFFFF) + psx_gpu->offset_x;
493           vertexes[1].y = (xy >> 16) + psx_gpu->offset_y;
494
495           render_line(psx_gpu, vertexes, current_command, 0, 0);
496
497           list_position += 2;
498           num_vertexes++;
499
500           if(list_position >= list_end)
501           {
502             current_command = (u32)-1;
503             goto breakloop;
504           }
505
506           color = list_position[0];
507           if((color & 0xF000F000) == 0x50005000)
508             break;
509         }
510
511         command_length += ((num_vertexes - 2) * 2);
512         break;
513       }
514   
515                 case 0x60 ... 0x63:
516       {        
517         u32 x = sign_extend_11bit(list_s16[2] + psx_gpu->offset_x);
518         u32 y = sign_extend_11bit(list_s16[3] + psx_gpu->offset_y);
519         u32 width = list_s16[4] & 0x3FF;
520         u32 height = list_s16[5] & 0x1FF;
521
522         render_sprite(psx_gpu, x, y, 0, 0, width, height, current_command, list[0]);
523                         break;
524       }
525   
526                 case 0x64 ... 0x67:
527       {        
528         u32 x = sign_extend_11bit(list_s16[2] + psx_gpu->offset_x);
529         u32 y = sign_extend_11bit(list_s16[3] + psx_gpu->offset_y);
530         u32 uv = list_s16[4];
531         u32 width = list_s16[6] & 0x3FF;
532         u32 height = list_s16[7] & 0x1FF;
533
534         set_clut(psx_gpu, list_s16[5]);
535
536         render_sprite(psx_gpu, x, y, uv & 0xFF, (uv >> 8) & 0xFF, width, height,
537          current_command, list[0]);
538                         break;
539       }
540   
541                 case 0x68:
542                 case 0x69:
543                 case 0x6A:
544                 case 0x6B:
545       {
546         s32 x = sign_extend_11bit(list_s16[2] + psx_gpu->offset_x);
547         s32 y = sign_extend_11bit(list_s16[3] + psx_gpu->offset_y);
548
549         render_sprite(psx_gpu, x, y, 0, 0, 1, 1, current_command, list[0]);
550                         break;
551       }
552   
553                 case 0x70:
554                 case 0x71:
555                 case 0x72:
556                 case 0x73:
557       {        
558         s32 x = sign_extend_11bit(list_s16[2] + psx_gpu->offset_x);
559         s32 y = sign_extend_11bit(list_s16[3] + psx_gpu->offset_y);
560
561         render_sprite(psx_gpu, x, y, 0, 0, 8, 8, current_command, list[0]);
562                         break;
563       }
564   
565                 case 0x74:
566                 case 0x75:
567                 case 0x76:
568                 case 0x77:
569       {        
570         s32 x = sign_extend_11bit(list_s16[2] + psx_gpu->offset_x);
571         s32 y = sign_extend_11bit(list_s16[3] + psx_gpu->offset_y);
572         u32 uv = list_s16[4];
573
574         set_clut(psx_gpu, list_s16[5]);
575
576         render_sprite(psx_gpu, x, y, uv & 0xFF, (uv >> 8) & 0xFF, 8, 8,
577          current_command, list[0]);
578                         break;
579       }
580   
581                 case 0x78:
582                 case 0x79:
583                 case 0x7A:
584                 case 0x7B:
585       {        
586         s32 x = sign_extend_11bit(list_s16[2] + psx_gpu->offset_x);
587         s32 y = sign_extend_11bit(list_s16[3] + psx_gpu->offset_y);
588
589         render_sprite(psx_gpu, x, y, 0, 0, 16, 16, current_command, list[0]);
590                         break;
591       }
592   
593                 case 0x7C:
594                 case 0x7D:
595                 case 0x7E:
596                 case 0x7F:
597       {        
598         s32 x = sign_extend_11bit(list_s16[2] + psx_gpu->offset_x);
599         s32 y = sign_extend_11bit(list_s16[3] + psx_gpu->offset_y);
600         u32 uv = list_s16[4];
601
602         set_clut(psx_gpu, list_s16[5]);
603
604         render_sprite(psx_gpu, x, y, uv & 0xFF, (uv >> 8) & 0xFF, 16, 16,
605          current_command, list[0]);
606                         break;
607       }
608   
609 #ifdef PCSX
610       case 0x80 ... 0x9F:          //  vid -> vid
611       case 0xA0 ... 0xBF:          //  sys -> vid
612       case 0xC0 ... 0xDF:          //  vid -> sys
613         goto breakloop;
614 #else
615       case 0x80 ... 0x9F:          //  vid -> vid
616       {
617         u32 sx = list_s16[2] & 0x3FF;
618         u32 sy = list_s16[3] & 0x1FF;
619         u32 dx = list_s16[4] & 0x3FF;
620         u32 dy = list_s16[5] & 0x1FF;
621         u32 w = ((list_s16[6] - 1) & 0x3FF) + 1;
622         u32 h = ((list_s16[7] - 1) & 0x1FF) + 1;
623
624         if (sx == dx && sy == dy && psx_gpu->mask_msb == 0)
625           break;
626
627         render_block_move(psx_gpu, sx, sy, dx, dy, w, h);
628         break;
629       } 
630
631       case 0xA0 ... 0xBF:          //  sys -> vid
632       {
633         u32 load_x = list_s16[2] & 0x3FF;
634         u32 load_y = list_s16[3] & 0x1FF;
635         u32 load_width = list_s16[4] & 0x3FF;
636         u32 load_height = list_s16[5] & 0x1FF;
637         u32 load_size = load_width * load_height;
638   
639         command_length += load_size / 2;
640
641         if(load_size & 1)
642           command_length++;
643
644         render_block_copy(psx_gpu, (u16 *)&(list_s16[6]), load_x, load_y,
645          load_width, load_height, load_width);
646                         break;
647       }
648
649       case 0xC0 ... 0xDF:          //  vid -> sys
650         break;
651 #endif
652
653                 case 0xE1:
654         set_texture(psx_gpu, list[0]);
655
656         if(list[0] & (1 << 9))
657           psx_gpu->render_state_base |= RENDER_STATE_DITHER;
658         else
659           psx_gpu->render_state_base &= ~RENDER_STATE_DITHER;
660
661         psx_gpu->display_area_draw_enable = (list[0] >> 10) & 0x1;
662                         SET_Ex(1, list[0]);
663                         break;
664   
665                 case 0xE2:
666       {
667         // TODO: Clean
668         u32 texture_window_settings = list[0];
669         u32 tmp, x, y, w, h;
670
671         if(texture_window_settings != psx_gpu->texture_window_settings)
672         {
673           tmp = (texture_window_settings & 0x1F) | 0x20;
674           for(w = 8; (tmp & 1) == 0; tmp >>= 1, w <<= 1);
675
676           tmp = ((texture_window_settings >> 5) & 0x1f) | 0x20;
677           for (h = 8; (tmp & 1) == 0; tmp >>= 1, h <<= 1);
678
679           tmp = 32 - (w >> 3);
680           x = ((texture_window_settings >> 10) & tmp) << 3;
681
682           tmp = 32 - (h >> 3);
683           y = ((texture_window_settings >> 15) & tmp) << 3;
684
685           flush_render_block_buffer(psx_gpu);
686           
687           psx_gpu->texture_window_settings = texture_window_settings;
688           psx_gpu->texture_window_x = x;
689           psx_gpu->texture_window_y = y;
690           psx_gpu->texture_mask_width = w - 1;
691           psx_gpu->texture_mask_height = h - 1;
692
693           update_texture_ptr(psx_gpu);
694         }
695         SET_Ex(2, list[0]);
696         break;
697       }
698
699       case 0xE3:
700       {
701         s16 viewport_start_x = list[0] & 0x3FF;
702         s16 viewport_start_y = (list[0] >> 10) & 0x1FF;
703
704         if(viewport_start_x == psx_gpu->viewport_start_x &&
705          viewport_start_y == psx_gpu->viewport_start_y)
706         {
707           break;
708         }
709   
710         psx_gpu->viewport_start_x = viewport_start_x;
711         psx_gpu->viewport_start_y = viewport_start_y;
712
713 #ifdef TEXTURE_CACHE_4BPP
714         psx_gpu->viewport_mask =
715          texture_region_mask(psx_gpu->viewport_start_x,
716          psx_gpu->viewport_start_y, psx_gpu->viewport_end_x,
717          psx_gpu->viewport_end_y);
718 #endif
719         SET_Ex(3, list[0]);
720         break;
721       }
722
723       case 0xE4:
724       {
725         s16 viewport_end_x = list[0] & 0x3FF;
726         s16 viewport_end_y = (list[0] >> 10) & 0x1FF;
727
728         if(viewport_end_x == psx_gpu->viewport_end_x &&
729          viewport_end_y == psx_gpu->viewport_end_y)
730         {
731           break;
732         }
733
734         psx_gpu->viewport_end_x = viewport_end_x;
735         psx_gpu->viewport_end_y = viewport_end_y;
736
737 #ifdef TEXTURE_CACHE_4BPP
738         psx_gpu->viewport_mask =
739          texture_region_mask(psx_gpu->viewport_start_x,
740          psx_gpu->viewport_start_y, psx_gpu->viewport_end_x,
741          psx_gpu->viewport_end_y);
742 #endif
743         SET_Ex(4, list[0]);
744         break;
745       }
746   
747       case 0xE5:
748       {
749         s32 offset_x = list[0] << 21;
750         s32 offset_y = list[0] << 10;
751         psx_gpu->offset_x = offset_x >> 21;
752         psx_gpu->offset_y = offset_y >> 21; 
753   
754                         SET_Ex(5, list[0]);
755                         break;
756                 }
757
758                 case 0xE6:
759       {
760         u32 mask_settings = list[0];
761         u16 mask_msb = mask_settings << 15;
762
763         if(list[0] & 0x2)
764           psx_gpu->render_state_base |= RENDER_STATE_MASK_EVALUATE;
765         else
766           psx_gpu->render_state_base &= ~RENDER_STATE_MASK_EVALUATE;
767
768         if(mask_msb != psx_gpu->mask_msb)
769         {
770           flush_render_block_buffer(psx_gpu);
771           psx_gpu->mask_msb = mask_msb;
772         }
773
774                         SET_Ex(6, list[0]);
775                         break;
776       }
777   
778                 default:
779                         break;
780         }
781   }
782
783 breakloop:
784   if (last_command != NULL)
785     *last_command = current_command;
786   return list - list_start;
787 }
788
789 #ifdef PCSX
790
791 // this thing has become such a PITA, should just handle the 2048 width really
792 static void update_enhancement_buf_scanouts(psx_gpu_struct *psx_gpu,
793     int x, int y, int w, int h)
794 {
795   int max_bufs = ARRAY_SIZE(psx_gpu->enhancement_scanouts);
796   struct psx_gpu_scanout *s;
797   int i, sel, right, bottom;
798   u32 tol_x = 48, tol_y = 16;
799   u32 intersection;
800
801   //w = (w + 15) & ~15;
802   psx_gpu->saved_hres = w;
803   assert(!(max_bufs & (max_bufs - 1)));
804   for (i = 0; i < max_bufs; i++) {
805     s = &psx_gpu->enhancement_scanouts[i];
806     if (s->x == x && s->y == y && w - s->w <= tol_x && h - s->h <= tol_y)
807       return;
808   }
809
810   // evict any scanout that intersects
811   right = x + w;
812   bottom = y + h;
813   for (i = 0, sel = -1; i < max_bufs; i++) {
814     s = &psx_gpu->enhancement_scanouts[i];
815     if (s->x >= right) continue;
816     if (s->x + s->w <= x) continue;
817     if (s->y >= bottom) continue;
818     if (s->y + s->h <= y) continue;
819     // ... but allow upto 16 pixels intersection that some games do
820     if ((intersection = s->x + s->w - x) - 1u <= tol_x) {
821       s->w -= intersection;
822       continue;
823     }
824     if ((intersection = s->y + s->h - y) - 1u <= tol_y) {
825       s->h -= intersection;
826       continue;
827     }
828     //printf("%4d%4d%4dx%d evicted\n", s->x, s->y, s->w, s->h);
829     s->w = 0;
830     sel = i;
831     break;
832   }
833   if (sel >= 0) {
834     // 2nd intersection check
835     for (i = 0; i < max_bufs; i++) {
836       s = &psx_gpu->enhancement_scanouts[i];
837       if (!s->w)
838         continue;
839       if ((intersection = right - s->x) - 1u <= tol_x) {
840         w -= intersection;
841         break;
842       }
843       if ((intersection = bottom - s->y) - 1u <= tol_y) {
844         h -= intersection;
845         break;
846       }
847     }
848   }
849   else
850     sel = psx_gpu->enhancement_scanout_eselect++;
851   psx_gpu->enhancement_scanout_eselect &= max_bufs - 1;
852   s = &psx_gpu->enhancement_scanouts[sel];
853   s->x = x;
854   s->y = y;
855   s->w = w;
856   s->h = h;
857
858   sync_enhancement_buffers(x, y, w, h);
859 #if 0
860   printf("scanouts:\n");
861   for (i = 0; i < ARRAY_SIZE(psx_gpu->enhancement_scanouts); i++) {
862     s = &psx_gpu->enhancement_scanouts[i];
863     if (s->w)
864       printf("%4d%4d%4dx%d\n", s->x, s->y, s->w, s->h);
865   }
866 #endif
867 }
868
869 static int select_enhancement_buf_index(psx_gpu_struct *psx_gpu, s32 x, s32 y)
870 {
871   int i;
872   for (i = 0; i < ARRAY_SIZE(psx_gpu->enhancement_scanouts); i++) {
873     const struct psx_gpu_scanout *s = &psx_gpu->enhancement_scanouts[i];
874     if (s->x <= x && x < s->x + s->w &&
875         s->y <= y && y < s->y + s->h)
876       return i;
877   }
878   return -1;
879 }
880
881 #define select_enhancement_buf_by_index(psx_gpu_, i_) \
882   ((psx_gpu_)->enhancement_buf_ptr + ((i_) << 20))
883
884 static void *select_enhancement_buf_ptr(psx_gpu_struct *psx_gpu, s32 x, s32 y)
885 {
886   int i = select_enhancement_buf_index(psx_gpu, x, y);
887   return i >= 0 ? select_enhancement_buf_by_index(psx_gpu, i) : NULL;
888 }
889
890 static void select_enhancement_buf(psx_gpu_struct *psx_gpu)
891 {
892   s32 x = psx_gpu->saved_viewport_start_x + 16;
893   s32 y = psx_gpu->saved_viewport_start_y + 16;
894   psx_gpu->enhancement_current_buf_ptr = select_enhancement_buf_ptr(psx_gpu, x, y);
895 }
896
897 #define enhancement_disable() { \
898   psx_gpu->vram_out_ptr = psx_gpu->vram_ptr; \
899   psx_gpu->viewport_start_x = psx_gpu->saved_viewport_start_x; \
900   psx_gpu->viewport_start_y = psx_gpu->saved_viewport_start_y; \
901   psx_gpu->viewport_end_x = psx_gpu->saved_viewport_end_x; \
902   psx_gpu->viewport_end_y = psx_gpu->saved_viewport_end_y; \
903   psx_gpu->uvrgb_phase = 0x8000; \
904 }
905
906 static int enhancement_enable(psx_gpu_struct *psx_gpu)
907 {
908   if (!psx_gpu->enhancement_current_buf_ptr)
909     return 0;
910   psx_gpu->vram_out_ptr = psx_gpu->enhancement_current_buf_ptr;
911   psx_gpu->viewport_start_x = psx_gpu->saved_viewport_start_x * 2;
912   psx_gpu->viewport_start_y = psx_gpu->saved_viewport_start_y * 2;
913   psx_gpu->viewport_end_x = psx_gpu->saved_viewport_end_x * 2 + 1;
914   psx_gpu->viewport_end_y = psx_gpu->saved_viewport_end_y * 2 + 1;
915   if (psx_gpu->viewport_end_x - psx_gpu->viewport_start_x + 1 > 1024)
916     psx_gpu->viewport_end_x = psx_gpu->viewport_start_x + 1023;
917   psx_gpu->uvrgb_phase = 0x7fff;
918   return 1;
919 }
920
921 #define shift_vertices3(v) { \
922   v[0]->x <<= 1; \
923   v[0]->y <<= 1; \
924   v[1]->x <<= 1; \
925   v[1]->y <<= 1; \
926   v[2]->x <<= 1; \
927   v[2]->y <<= 1; \
928 }
929
930 #define unshift_vertices3(v) { \
931   v[0]->x >>= 1; \
932   v[0]->y >>= 1; \
933   v[1]->x >>= 1; \
934   v[1]->y >>= 1; \
935   v[2]->x >>= 1; \
936   v[2]->y >>= 1; \
937 }
938
939 #define shift_triangle_area() \
940   psx_gpu->triangle_area *= 4
941
942 #ifndef NEON_BUILD
943 void scale2x_tiles8(void *dst, const void *src, int w8, int h)
944 {
945   uint16_t* d = (uint16_t*)dst;
946   const uint16_t* s = (const uint16_t*)src;
947
948   while ( h-- )
949   {
950     uint16_t* d_save = d;
951     const uint16_t* s_save = s;
952     int w = w8;
953
954     while ( w-- )
955     {
956       d[    0 ] = *s;
957       d[    1 ] = *s;
958       d[ 1024 ] = *s;
959       d[ 1025 ] = *s;
960       d += 2; s++;
961
962       d[    0 ] = *s;
963       d[    1 ] = *s;
964       d[ 1024 ] = *s;
965       d[ 1025 ] = *s;
966       d += 2; s++;
967
968       d[    0 ] = *s;
969       d[    1 ] = *s;
970       d[ 1024 ] = *s;
971       d[ 1025 ] = *s;
972       d += 2; s++;
973
974       d[    0 ] = *s;
975       d[    1 ] = *s;
976       d[ 1024 ] = *s;
977       d[ 1025 ] = *s;
978       d += 2; s++;
979
980       d[    0 ] = *s;
981       d[    1 ] = *s;
982       d[ 1024 ] = *s;
983       d[ 1025 ] = *s;
984       d += 2; s++;
985
986       d[    0 ] = *s;
987       d[    1 ] = *s;
988       d[ 1024 ] = *s;
989       d[ 1025 ] = *s;
990       d += 2; s++;
991
992       d[    0 ] = *s;
993       d[    1 ] = *s;
994       d[ 1024 ] = *s;
995       d[ 1025 ] = *s;
996       d += 2; s++;
997
998       d[    0 ] = *s;
999       d[    1 ] = *s;
1000       d[ 1024 ] = *s;
1001       d[ 1025 ] = *s;
1002       d += 2; s++;
1003     }
1004
1005     d = d_save + 2048;
1006     s = s_save + 1024; /* or 512? */
1007   }
1008 }
1009 #endif
1010
1011 static int disable_main_render;
1012
1013 // simple check for a case where no clipping is used
1014 //  - now handled by adjusting the viewport
1015 static int check_enhanced_range(psx_gpu_struct *psx_gpu, int x, int y)
1016 {
1017   return 1;
1018 }
1019
1020 static int is_in_array(int val, int array[], int len)
1021 {
1022   int i;
1023   for (i = 0; i < len; i++)
1024     if (array[i] == val)
1025       return 1;
1026   return 0;
1027 }
1028
1029 static int make_members_unique(int array[], int len)
1030 {
1031   int i, j;
1032   for (i = j = 1; i < len; i++)
1033     if (!is_in_array(array[i], array, j))
1034       array[j++] = array[i];
1035
1036   if (array[0] > array[1]) {
1037     i = array[0]; array[0] = array[1]; array[1] = i;
1038   }
1039   return j;
1040 }
1041
1042 static void patch_u(vertex_struct *vertex_ptrs, int count, int old, int new)
1043 {
1044   int i;
1045   for (i = 0; i < count; i++)
1046     if (vertex_ptrs[i].u == old)
1047       vertex_ptrs[i].u = new;
1048 }
1049
1050 static void patch_v(vertex_struct *vertex_ptrs, int count, int old, int new)
1051 {
1052   int i;
1053   for (i = 0; i < count; i++)
1054     if (vertex_ptrs[i].v == old)
1055       vertex_ptrs[i].v = new;
1056 }
1057
1058 static void uv_hack(vertex_struct *vertex_ptrs, int vertex_count)
1059 {
1060   int i, u[4], v[4];
1061
1062   for (i = 0; i < vertex_count; i++) {
1063     u[i] = vertex_ptrs[i].u;
1064     v[i] = vertex_ptrs[i].v;
1065   }
1066   if (make_members_unique(u, vertex_count) == 2 && u[1] - u[0] >= 8) {
1067     if ((u[0] & 7) == 7) {
1068       patch_u(vertex_ptrs, vertex_count, u[0], u[0] + 1);
1069       //printf("u hack: %3u-%3u -> %3u-%3u\n", u[0], u[1], u[0]+1, u[1]);
1070     }
1071     else if ((u[1] & 7) == 0 || u[1] - u[0] > 128) {
1072       patch_u(vertex_ptrs, vertex_count, u[1], u[1] - 1);
1073       //printf("u hack: %3u-%3u -> %3u-%3u\n", u[0], u[1], u[0], u[1]-1);
1074     }
1075   }
1076   if (make_members_unique(v, vertex_count) == 2 && ((v[0] - v[1]) & 7) == 0) {
1077     if ((v[0] & 7) == 7) {
1078       patch_v(vertex_ptrs, vertex_count, v[0], v[0] + 1);
1079       //printf("v hack: %3u-%3u -> %3u-%3u\n", v[0], v[1], v[0]+1, v[1]);
1080     }
1081     else if ((v[1] & 7) == 0) {
1082       patch_v(vertex_ptrs, vertex_count, v[1], v[1] - 1);
1083       //printf("v hack: %3u-%3u -> %3u-%3u\n", v[0], v[1], v[0], v[1]-1);
1084     }
1085   }
1086 }
1087
1088 static void do_triangle_enhanced(psx_gpu_struct *psx_gpu,
1089  vertex_struct *vertexes, u32 current_command)
1090 {
1091   vertex_struct *vertex_ptrs[3];
1092
1093   if (!prepare_triangle(psx_gpu, vertexes, vertex_ptrs))
1094     return;
1095
1096   if (!disable_main_render)
1097     render_triangle_p(psx_gpu, vertex_ptrs, current_command);
1098
1099   if (!check_enhanced_range(psx_gpu, vertex_ptrs[0]->x, vertex_ptrs[2]->x))
1100     return;
1101
1102   if (!enhancement_enable(psx_gpu))
1103     return;
1104
1105   shift_vertices3(vertex_ptrs);
1106   shift_triangle_area();
1107   render_triangle_p(psx_gpu, vertex_ptrs, current_command);
1108   unshift_vertices3(vertex_ptrs);
1109 }
1110
1111 static void do_quad_enhanced(psx_gpu_struct *psx_gpu, vertex_struct *vertexes,
1112  u32 current_command)
1113 {
1114   do_triangle_enhanced(psx_gpu, vertexes, current_command);
1115   enhancement_disable();
1116   do_triangle_enhanced(psx_gpu, &vertexes[1], current_command);
1117 }
1118
1119 #if 0
1120
1121 #define fill_vertex(i, x_, y_, u_, v_, rgb_) \
1122   vertexes[i].x = x_; \
1123   vertexes[i].y = y_; \
1124   vertexes[i].u = u_; \
1125   vertexes[i].v = v_; \
1126   vertexes[i].r = rgb_; \
1127   vertexes[i].g = (rgb_) >> 8; \
1128   vertexes[i].b = (rgb_) >> 16
1129
1130 static void do_sprite_enhanced(psx_gpu_struct *psx_gpu, int x, int y,
1131  u32 u, u32 v, u32 w, u32 h, u32 cmd_rgb)
1132 {
1133   vertex_struct *vertex_ptrs[3];
1134   u32 flags = (cmd_rgb >> 24);
1135   u32 color = cmd_rgb & 0xffffff;
1136   u32 render_state_base_saved = psx_gpu->render_state_base;
1137   int x1, y1;
1138   u8 u1, v1;
1139
1140   flags &=
1141    (RENDER_FLAGS_MODULATE_TEXELS | RENDER_FLAGS_BLEND |
1142    RENDER_FLAGS_TEXTURE_MAP);
1143
1144   set_triangle_color(psx_gpu, color);
1145   if(color == 0x808080)
1146     flags |= RENDER_FLAGS_MODULATE_TEXELS;
1147
1148   psx_gpu->render_state_base &= ~RENDER_STATE_DITHER;
1149   enhancement_enable();
1150
1151   x1 = x + w;
1152   y1 = y + h;
1153   u1 = u + w;
1154   v1 = v + h;
1155   // FIXME..
1156   if (u1 < u) u1 = 0xff;
1157   if (v1 < v) v1 = 0xff;
1158
1159   // 0-2
1160   // |/
1161   // 1
1162   fill_vertex(0, x,  y,  u,  v,  color);
1163   fill_vertex(1, x,  y1, u,  v1, color);
1164   fill_vertex(2, x1, y,  u1, v,  color);
1165   if (prepare_triangle(psx_gpu, vertexes, vertex_ptrs)) {
1166     shift_vertices3(vertex_ptrs);
1167     shift_triangle_area();
1168     render_triangle_p(psx_gpu, vertex_ptrs, flags);
1169   }
1170
1171   //   0
1172   //  /|
1173   // 1-2
1174   fill_vertex(0, x1, y,  u1, v,  color);
1175   fill_vertex(1, x,  y1, u,  v1, color);
1176   fill_vertex(2, x1, y1, u1, v1, color);
1177   if (prepare_triangle(psx_gpu, vertexes, vertex_ptrs)) {
1178     shift_vertices3(vertex_ptrs);
1179     shift_triangle_area();
1180     render_triangle_p(psx_gpu, vertex_ptrs, flags);
1181   }
1182
1183   psx_gpu->render_state_base = render_state_base_saved;
1184 }
1185 #else
1186 static void do_sprite_enhanced(psx_gpu_struct *psx_gpu, int x, int y,
1187  u32 u, u32 v, u32 w, u32 h, u32 cmd_rgb)
1188 {
1189   u32 flags = (cmd_rgb >> 24);
1190   u32 color = cmd_rgb & 0xffffff;
1191
1192   render_sprite_4x(psx_gpu, x, y, u, v, w, h, flags, color);
1193 }
1194 #endif
1195
1196 u32 gpu_parse_enhanced(psx_gpu_struct *psx_gpu, u32 *list, u32 size,
1197  u32 *last_command)
1198 {
1199   vertex_struct vertexes[4] __attribute__((aligned(16))) = {};
1200   u32 current_command = 0, command_length;
1201
1202   u32 *list_start = list;
1203   u32 *list_end = list + (size / 4);
1204
1205   psx_gpu->saved_viewport_start_x = psx_gpu->viewport_start_x;
1206   psx_gpu->saved_viewport_start_y = psx_gpu->viewport_start_y;
1207   psx_gpu->saved_viewport_end_x = psx_gpu->viewport_end_x;
1208   psx_gpu->saved_viewport_end_y = psx_gpu->viewport_end_y;
1209   select_enhancement_buf(psx_gpu);
1210
1211   for(; list < list_end; list += 1 + command_length)
1212   {
1213     s16 *list_s16 = (void *)list;
1214     current_command = *list >> 24;
1215     command_length = command_lengths[current_command];
1216     if (list + 1 + command_length > list_end) {
1217       current_command = (u32)-1;
1218       break;
1219     }
1220
1221     enhancement_disable();
1222
1223     switch(current_command)
1224     {
1225       case 0x00:
1226         break;
1227   
1228       case 0x02:
1229       {
1230         u32 x = list_s16[2] & 0x3FF;
1231         u32 y = list_s16[3] & 0x1FF;
1232         u32 width = list_s16[4] & 0x3FF;
1233         u32 height = list_s16[5] & 0x1FF;
1234         u32 color = list[0] & 0xFFFFFF;
1235         s32 i1, i2;
1236
1237         x &= ~0xF;
1238         width = ((width + 0xF) & ~0xF);
1239         if (width == 0 || height == 0)
1240           break;
1241
1242         do_fill(psx_gpu, x, y, width, height, color);
1243
1244         i1 = select_enhancement_buf_index(psx_gpu, x, y);
1245         i2 = select_enhancement_buf_index(psx_gpu, x + width - 1, y + height - 1);
1246         if (i1 < 0 || i1 != i2) {
1247           sync_enhancement_buffers(x, y, width, height);
1248           break;
1249         }
1250
1251         psx_gpu->vram_out_ptr = select_enhancement_buf_by_index(psx_gpu, i1);
1252         x *= 2;
1253         y *= 2;
1254         width *= 2;
1255         height *= 2;
1256         render_block_fill_enh(psx_gpu, color, x, y, width, height);
1257         break;
1258       }
1259   
1260       case 0x20 ... 0x23:
1261       {
1262         set_triangle_color(psx_gpu, list[0] & 0xFFFFFF);
1263   
1264         get_vertex_data_xy(0, 2);
1265         get_vertex_data_xy(1, 4);
1266         get_vertex_data_xy(2, 6);
1267
1268         do_triangle_enhanced(psx_gpu, vertexes, current_command);
1269         break;
1270       }
1271   
1272       case 0x24 ... 0x27:
1273       {
1274         set_clut(psx_gpu, list_s16[5]);
1275         set_texture(psx_gpu, list_s16[9]);
1276         set_triangle_color(psx_gpu, list[0] & 0xFFFFFF);
1277   
1278         get_vertex_data_xy_uv(0, 2);
1279         get_vertex_data_xy_uv(1, 6);
1280         get_vertex_data_xy_uv(2, 10);
1281   
1282         do_triangle_enhanced(psx_gpu, vertexes, current_command);
1283         break;
1284       }
1285   
1286       case 0x28 ... 0x2B:
1287       {
1288         set_triangle_color(psx_gpu, list[0] & 0xFFFFFF);
1289   
1290         get_vertex_data_xy(0, 2);
1291         get_vertex_data_xy(1, 4);
1292         get_vertex_data_xy(2, 6);
1293         get_vertex_data_xy(3, 8);
1294
1295         do_quad_enhanced(psx_gpu, vertexes, current_command);
1296         break;
1297       }
1298   
1299       case 0x2C ... 0x2F:
1300       {
1301         set_clut(psx_gpu, list_s16[5]);
1302         set_texture(psx_gpu, list_s16[9]);
1303         set_triangle_color(psx_gpu, list[0] & 0xFFFFFF);
1304   
1305         get_vertex_data_xy_uv(0, 2);   
1306         get_vertex_data_xy_uv(1, 6);   
1307         get_vertex_data_xy_uv(2, 10);  
1308         get_vertex_data_xy_uv(3, 14);
1309   
1310         uv_hack(vertexes, 4);
1311         do_quad_enhanced(psx_gpu, vertexes, current_command);
1312         break;
1313       }
1314   
1315       case 0x30 ... 0x33:
1316       {
1317         get_vertex_data_xy_rgb(0, 0);
1318         get_vertex_data_xy_rgb(1, 4);
1319         get_vertex_data_xy_rgb(2, 8);
1320   
1321         do_triangle_enhanced(psx_gpu, vertexes, current_command);
1322         break;
1323       }
1324   
1325       case 0x34:
1326       case 0x35:
1327       case 0x36:
1328       case 0x37:
1329       {
1330         set_clut(psx_gpu, list_s16[5]);
1331         set_texture(psx_gpu, list_s16[11]);
1332   
1333         get_vertex_data_xy_uv_rgb(0, 0);
1334         get_vertex_data_xy_uv_rgb(1, 6);
1335         get_vertex_data_xy_uv_rgb(2, 12);
1336
1337         do_triangle_enhanced(psx_gpu, vertexes, current_command);
1338         break;
1339       }
1340   
1341       case 0x38:
1342       case 0x39:
1343       case 0x3A:
1344       case 0x3B:
1345       {
1346         get_vertex_data_xy_rgb(0, 0);
1347         get_vertex_data_xy_rgb(1, 4);
1348         get_vertex_data_xy_rgb(2, 8);
1349         get_vertex_data_xy_rgb(3, 12);
1350   
1351         do_quad_enhanced(psx_gpu, vertexes, current_command);
1352         break;
1353       }
1354   
1355       case 0x3C:
1356       case 0x3D:
1357       case 0x3E:
1358       case 0x3F:
1359       {
1360         set_clut(psx_gpu, list_s16[5]);
1361         set_texture(psx_gpu, list_s16[11]);
1362   
1363         get_vertex_data_xy_uv_rgb(0, 0);
1364         get_vertex_data_xy_uv_rgb(1, 6);
1365         get_vertex_data_xy_uv_rgb(2, 12);
1366         get_vertex_data_xy_uv_rgb(3, 18);
1367
1368         uv_hack(vertexes, 4);
1369         do_quad_enhanced(psx_gpu, vertexes, current_command);
1370         break;
1371       }
1372   
1373       case 0x40 ... 0x47:
1374       {
1375         vertexes[0].x = list_s16[2] + psx_gpu->offset_x;
1376         vertexes[0].y = list_s16[3] + psx_gpu->offset_y;
1377         vertexes[1].x = list_s16[4] + psx_gpu->offset_x;
1378         vertexes[1].y = list_s16[5] + psx_gpu->offset_y;
1379
1380         render_line(psx_gpu, vertexes, current_command, list[0], 0);
1381         if (enhancement_enable(psx_gpu))
1382           render_line(psx_gpu, vertexes, current_command, list[0], 1);
1383         break;
1384       }
1385   
1386       case 0x48 ... 0x4F:
1387       {
1388         u32 num_vertexes = 1;
1389         u32 *list_position = &(list[2]);
1390         u32 xy = list[1];
1391
1392         vertexes[1].x = (xy & 0xFFFF) + psx_gpu->offset_x;
1393         vertexes[1].y = (xy >> 16) + psx_gpu->offset_y;
1394       
1395         xy = *list_position;
1396         while(1)
1397         {
1398           vertexes[0] = vertexes[1];
1399
1400           vertexes[1].x = (xy & 0xFFFF) + psx_gpu->offset_x;
1401           vertexes[1].y = (xy >> 16) + psx_gpu->offset_y;
1402
1403           enhancement_disable();
1404           render_line(psx_gpu, vertexes, current_command, list[0], 0);
1405           if (enhancement_enable(psx_gpu))
1406             render_line(psx_gpu, vertexes, current_command, list[0], 1);
1407
1408           list_position++;
1409           num_vertexes++;
1410
1411           if(list_position >= list_end)
1412           {
1413             current_command = (u32)-1;
1414             goto breakloop;
1415           }
1416
1417           xy = *list_position;
1418           if((xy & 0xF000F000) == 0x50005000)
1419             break;
1420         }
1421
1422         command_length += (num_vertexes - 2);
1423         break;
1424       }
1425   
1426       case 0x50 ... 0x57:
1427       {
1428         vertexes[0].r = list[0] & 0xFF;
1429         vertexes[0].g = (list[0] >> 8) & 0xFF;
1430         vertexes[0].b = (list[0] >> 16) & 0xFF;
1431         vertexes[0].x = list_s16[2] + psx_gpu->offset_x;
1432         vertexes[0].y = list_s16[3] + psx_gpu->offset_y;
1433
1434         vertexes[1].r = list[2] & 0xFF;
1435         vertexes[1].g = (list[2] >> 8) & 0xFF;
1436         vertexes[1].b = (list[2] >> 16) & 0xFF;
1437         vertexes[1].x = list_s16[6] + psx_gpu->offset_x;
1438         vertexes[1].y = list_s16[7] + psx_gpu->offset_y;
1439
1440         render_line(psx_gpu, vertexes, current_command, 0, 0);
1441         if (enhancement_enable(psx_gpu))
1442           render_line(psx_gpu, vertexes, current_command, 0, 1);
1443         break;
1444       }
1445  
1446       case 0x58 ... 0x5F:
1447       {
1448         u32 num_vertexes = 1;
1449         u32 *list_position = &(list[2]);
1450         u32 color = list[0];
1451         u32 xy = list[1];
1452
1453         vertexes[1].r = color & 0xFF;
1454         vertexes[1].g = (color >> 8) & 0xFF;
1455         vertexes[1].b = (color >> 16) & 0xFF;
1456         vertexes[1].x = (xy & 0xFFFF) + psx_gpu->offset_x;
1457         vertexes[1].y = (xy >> 16) + psx_gpu->offset_y;
1458       
1459         color = list_position[0];
1460         while(1)
1461         {
1462           xy = list_position[1];
1463
1464           vertexes[0] = vertexes[1];
1465
1466           vertexes[1].r = color & 0xFF;
1467           vertexes[1].g = (color >> 8) & 0xFF;
1468           vertexes[1].b = (color >> 16) & 0xFF;
1469           vertexes[1].x = (xy & 0xFFFF) + psx_gpu->offset_x;
1470           vertexes[1].y = (xy >> 16) + psx_gpu->offset_y;
1471
1472           enhancement_disable();
1473           render_line(psx_gpu, vertexes, current_command, 0, 0);
1474           if (enhancement_enable(psx_gpu))
1475             render_line(psx_gpu, vertexes, current_command, 0, 1);
1476
1477           list_position += 2;
1478           num_vertexes++;
1479
1480           if(list_position >= list_end)
1481           {
1482             current_command = (u32)-1;
1483             goto breakloop;
1484           }
1485
1486           color = list_position[0];
1487           if((color & 0xF000F000) == 0x50005000)
1488             break;
1489         }
1490
1491         command_length += ((num_vertexes - 2) * 2);
1492         break;
1493       }
1494   
1495       case 0x60 ... 0x63:
1496       {        
1497         u32 x = sign_extend_11bit(list_s16[2] + psx_gpu->offset_x);
1498         u32 y = sign_extend_11bit(list_s16[3] + psx_gpu->offset_y);
1499         u32 width = list_s16[4] & 0x3FF;
1500         u32 height = list_s16[5] & 0x1FF;
1501
1502         render_sprite(psx_gpu, x, y, 0, 0, width, height, current_command, list[0]);
1503
1504         if (check_enhanced_range(psx_gpu, x, x + width))
1505           do_sprite_enhanced(psx_gpu, x, y, 0, 0, width, height, list[0]);
1506         break;
1507       }
1508   
1509       case 0x64 ... 0x67:
1510       {        
1511         u32 x = sign_extend_11bit(list_s16[2] + psx_gpu->offset_x);
1512         u32 y = sign_extend_11bit(list_s16[3] + psx_gpu->offset_y);
1513         u8 u = list_s16[4];
1514         u8 v = list_s16[4] >> 8;
1515         u32 width = list_s16[6] & 0x3FF;
1516         u32 height = list_s16[7] & 0x1FF;
1517
1518         set_clut(psx_gpu, list_s16[5]);
1519
1520         render_sprite(psx_gpu, x, y, u, v, width, height,
1521          current_command, list[0]);
1522
1523         if (check_enhanced_range(psx_gpu, x, x + width))
1524           do_sprite_enhanced(psx_gpu, x, y, u, v, width, height, list[0]);
1525         break;
1526       }
1527   
1528       case 0x68:
1529       case 0x69:
1530       case 0x6A:
1531       case 0x6B:
1532       {
1533         s32 x = sign_extend_11bit(list_s16[2] + psx_gpu->offset_x);
1534         s32 y = sign_extend_11bit(list_s16[3] + psx_gpu->offset_y);
1535
1536         render_sprite(psx_gpu, x, y, 0, 0, 1, 1, current_command, list[0]);
1537
1538         if (check_enhanced_range(psx_gpu, x, x + 1))
1539           do_sprite_enhanced(psx_gpu, x, y, 0, 0, 1, 1, list[0]);
1540         break;
1541       }
1542   
1543       case 0x70:
1544       case 0x71:
1545       case 0x72:
1546       case 0x73:
1547       {        
1548         s32 x = sign_extend_11bit(list_s16[2] + psx_gpu->offset_x);
1549         s32 y = sign_extend_11bit(list_s16[3] + psx_gpu->offset_y);
1550
1551         render_sprite(psx_gpu, x, y, 0, 0, 8, 8, current_command, list[0]);
1552
1553         if (check_enhanced_range(psx_gpu, x, x + 8))
1554           do_sprite_enhanced(psx_gpu, x, y, 0, 0, 8, 8, list[0]);
1555         break;
1556       }
1557   
1558       case 0x74:
1559       case 0x75:
1560       case 0x76:
1561       case 0x77:
1562       {        
1563         s32 x = sign_extend_11bit(list_s16[2] + psx_gpu->offset_x);
1564         s32 y = sign_extend_11bit(list_s16[3] + psx_gpu->offset_y);
1565         u8 u = list_s16[4];
1566         u8 v = list_s16[4] >> 8;
1567
1568         set_clut(psx_gpu, list_s16[5]);
1569
1570         render_sprite(psx_gpu, x, y, u, v, 8, 8,
1571          current_command, list[0]);
1572
1573         if (check_enhanced_range(psx_gpu, x, x + 8))
1574           do_sprite_enhanced(psx_gpu, x, y, u, v, 8, 8, list[0]);
1575         break;
1576       }
1577   
1578       case 0x78:
1579       case 0x79:
1580       case 0x7A:
1581       case 0x7B:
1582       {        
1583         s32 x = sign_extend_11bit(list_s16[2] + psx_gpu->offset_x);
1584         s32 y = sign_extend_11bit(list_s16[3] + psx_gpu->offset_y);
1585
1586         render_sprite(psx_gpu, x, y, 0, 0, 16, 16, current_command, list[0]);
1587
1588         if (check_enhanced_range(psx_gpu, x, x + 16))
1589           do_sprite_enhanced(psx_gpu, x, y, 0, 0, 16, 16, list[0]);
1590         break;
1591       }
1592   
1593       case 0x7C:
1594       case 0x7D:
1595       case 0x7E:
1596       case 0x7F:
1597       {        
1598         s32 x = sign_extend_11bit(list_s16[2] + psx_gpu->offset_x);
1599         s32 y = sign_extend_11bit(list_s16[3] + psx_gpu->offset_y);
1600         u8 u = list_s16[4];
1601         u8 v = list_s16[4] >> 8;
1602
1603         set_clut(psx_gpu, list_s16[5]);
1604
1605         render_sprite(psx_gpu, x, y, u, v, 16, 16, current_command, list[0]);
1606
1607         if (check_enhanced_range(psx_gpu, x, x + 16))
1608           do_sprite_enhanced(psx_gpu, x, y, u, v, 16, 16, list[0]);
1609         break;
1610       }
1611
1612       case 0x80 ... 0x9F:          //  vid -> vid
1613       case 0xA0 ... 0xBF:          //  sys -> vid
1614       case 0xC0 ... 0xDF:          //  vid -> sys
1615         goto breakloop;
1616
1617       case 0xE1:
1618         set_texture(psx_gpu, list[0]);
1619
1620         if(list[0] & (1 << 9))
1621           psx_gpu->render_state_base |= RENDER_STATE_DITHER;
1622         else
1623           psx_gpu->render_state_base &= ~RENDER_STATE_DITHER;
1624
1625         psx_gpu->display_area_draw_enable = (list[0] >> 10) & 0x1;
1626         SET_Ex(1, list[0]);
1627         break;
1628   
1629       case 0xE2:
1630       {
1631         // TODO: Clean
1632         u32 texture_window_settings = list[0];
1633         u32 tmp, x, y, w, h;
1634
1635         if(texture_window_settings != psx_gpu->texture_window_settings)
1636         {
1637           tmp = (texture_window_settings & 0x1F) | 0x20;
1638           for(w = 8; (tmp & 1) == 0; tmp >>= 1, w <<= 1);
1639
1640           tmp = ((texture_window_settings >> 5) & 0x1f) | 0x20;
1641           for (h = 8; (tmp & 1) == 0; tmp >>= 1, h <<= 1);
1642
1643           tmp = 32 - (w >> 3);
1644           x = ((texture_window_settings >> 10) & tmp) << 3;
1645
1646           tmp = 32 - (h >> 3);
1647           y = ((texture_window_settings >> 15) & tmp) << 3;
1648
1649           flush_render_block_buffer(psx_gpu);
1650           
1651           psx_gpu->texture_window_settings = texture_window_settings;
1652           psx_gpu->texture_window_x = x;
1653           psx_gpu->texture_window_y = y;
1654           psx_gpu->texture_mask_width = w - 1;
1655           psx_gpu->texture_mask_height = h - 1;
1656
1657           update_texture_ptr(psx_gpu);
1658         }
1659         SET_Ex(2, list[0]);
1660         break;
1661       }
1662   
1663       case 0xE3:
1664       {
1665         s16 viewport_start_x = list[0] & 0x3FF;
1666         s16 viewport_start_y = (list[0] >> 10) & 0x1FF;
1667
1668         if(viewport_start_x == psx_gpu->viewport_start_x &&
1669          viewport_start_y == psx_gpu->viewport_start_y)
1670         {
1671           break;
1672         }
1673         psx_gpu->viewport_start_x = viewport_start_x;
1674         psx_gpu->viewport_start_y = viewport_start_y;
1675         psx_gpu->saved_viewport_start_x = viewport_start_x;
1676         psx_gpu->saved_viewport_start_y = viewport_start_y;
1677
1678         select_enhancement_buf(psx_gpu);
1679
1680 #ifdef TEXTURE_CACHE_4BPP
1681         psx_gpu->viewport_mask =
1682          texture_region_mask(psx_gpu->viewport_start_x,
1683          psx_gpu->viewport_start_y, psx_gpu->viewport_end_x,
1684          psx_gpu->viewport_end_y);
1685 #endif
1686         SET_Ex(3, list[0]);
1687         break;
1688       }
1689
1690       case 0xE4:
1691       {
1692         s16 viewport_end_x = list[0] & 0x3FF;
1693         s16 viewport_end_y = (list[0] >> 10) & 0x1FF;
1694
1695         if(viewport_end_x == psx_gpu->viewport_end_x &&
1696          viewport_end_y == psx_gpu->viewport_end_y)
1697         {
1698           break;
1699         }
1700
1701         psx_gpu->viewport_end_x = viewport_end_x;
1702         psx_gpu->viewport_end_y = viewport_end_y;
1703         psx_gpu->saved_viewport_end_x = viewport_end_x;
1704         psx_gpu->saved_viewport_end_y = viewport_end_y;
1705
1706         select_enhancement_buf(psx_gpu);
1707 #if 0
1708         if (!psx_gpu->enhancement_current_buf_ptr)
1709           log_anomaly("vp %3d,%3d %3d,%d - no buf\n",
1710               psx_gpu->viewport_start_x, psx_gpu->viewport_start_y,
1711               viewport_end_x, viewport_end_y);
1712 #endif
1713 #ifdef TEXTURE_CACHE_4BPP
1714         psx_gpu->viewport_mask =
1715          texture_region_mask(psx_gpu->viewport_start_x,
1716          psx_gpu->viewport_start_y, psx_gpu->viewport_end_x,
1717          psx_gpu->viewport_end_y);
1718 #endif
1719         SET_Ex(4, list[0]);
1720         break;
1721       }
1722   
1723       case 0xE5:
1724       {
1725         s32 offset_x = list[0] << 21;
1726         s32 offset_y = list[0] << 10;
1727         psx_gpu->offset_x = offset_x >> 21;
1728         psx_gpu->offset_y = offset_y >> 21; 
1729   
1730         SET_Ex(5, list[0]);
1731         break;
1732       }
1733
1734       case 0xE6:
1735       {
1736         u32 mask_settings = list[0];
1737         u16 mask_msb = mask_settings << 15;
1738
1739         if(list[0] & 0x2)
1740           psx_gpu->render_state_base |= RENDER_STATE_MASK_EVALUATE;
1741         else
1742           psx_gpu->render_state_base &= ~RENDER_STATE_MASK_EVALUATE;
1743
1744         if(mask_msb != psx_gpu->mask_msb)
1745         {
1746           flush_render_block_buffer(psx_gpu);
1747           psx_gpu->mask_msb = mask_msb;
1748         }
1749
1750         SET_Ex(6, list[0]);
1751         break;
1752       }
1753   
1754       default:
1755         break;
1756     }
1757   }
1758
1759   enhancement_disable();
1760
1761 breakloop:
1762   if (last_command != NULL)
1763     *last_command = current_command;
1764   return list - list_start;
1765 }
1766
1767 #endif /* PCSX */
1768
1769 // vim:ts=2:shiftwidth=2:expandtab