gpu_neon: try to patch more pal vs enhancement trouble
[pcsx_rearmed.git] / plugins / gpu_neon / psx_gpu_if.c
1 /*
2  * (C) GraÅžvydas "notaz" Ignotas, 2011
3  *
4  * This work is licensed under the terms of any of these licenses
5  * (at your option):
6  *  - GNU GPL, version 2 or later.
7  *  - GNU LGPL, version 2.1 or later.
8  * See the COPYING file in the top-level directory.
9  */
10
11 #include <stdio.h>
12 #include <assert.h>
13 #include <sys/mman.h>
14
15 #define ARRAY_SIZE(x) (sizeof(x) / sizeof((x)[0]))
16 #ifndef min
17 #define min(a, b) ((a) < (b) ? (a) : (b))
18 #endif
19 #ifndef max
20 #define max(a, b) ((a) > (b) ? (a) : (b))
21 #endif
22
23 extern const unsigned char cmd_lengths[256];
24 #define command_lengths cmd_lengths
25
26 static unsigned int *ex_regs;
27 static int initialized;
28
29 #define PCSX
30 #define SET_Ex(r, v) \
31   ex_regs[r] = v
32
33 static __attribute__((noinline)) void
34 sync_enhancement_buffers(int x, int y, int w, int h);
35
36 #include "../gpulib/gpu.h"
37 #include "psx_gpu/psx_gpu.c"
38 #include "psx_gpu/psx_gpu_parse.c"
39
40 static psx_gpu_struct egpu __attribute__((aligned(256)));
41
42 int do_cmd_list(uint32_t *list, int count, int *cycles, int *last_cmd)
43 {
44   int ret;
45
46 #if defined(__arm__) && defined(NEON_BUILD) && !defined(SIMD_BUILD)
47   // the asm doesn't bother to save callee-save vector regs, so do it here
48   __asm__ __volatile__("":::"q4","q5","q6","q7");
49 #endif
50
51   if (gpu.state.enhancement_active)
52     ret = gpu_parse_enhanced(&egpu, list, count * 4, cycles, (u32 *)last_cmd);
53   else
54     ret = gpu_parse(&egpu, list, count * 4, cycles, (u32 *)last_cmd);
55
56 #if defined(__arm__) && defined(NEON_BUILD) && !defined(SIMD_BUILD)
57   __asm__ __volatile__("":::"q4","q5","q6","q7");
58 #endif
59
60   ex_regs[1] &= ~0x1ff;
61   ex_regs[1] |= egpu.texture_settings & 0x1ff;
62   return ret;
63 }
64
65 #define ENHANCEMENT_BUF_SIZE (1024 * 1024 * 2 * 4 + 4096 * 2)
66
67 static void *get_enhancement_bufer(int *x, int *y, int *w, int *h,
68  int *vram_h)
69 {
70   uint16_t *ret = select_enhancement_buf_ptr(&egpu, *x, *y);
71   if (ret == NULL)
72     return NULL;
73
74   *x *= 2;
75   *y *= 2;
76   *w = *w * 2;
77   *h = *h * 2;
78   *vram_h = 1024;
79   return ret;
80 }
81
82 static void map_enhancement_buffer(void)
83 {
84   // currently we use 4x 1024*1024 buffers instead of single 2048*1024
85   // to be able to reuse 1024-width code better (triangle setup,
86   // dithering phase, lines).
87   egpu.enhancement_buf_ptr = gpu.mmap(ENHANCEMENT_BUF_SIZE);
88   if (egpu.enhancement_buf_ptr == NULL) {
89     fprintf(stderr, "failed to map enhancement buffer\n");
90     gpu.get_enhancement_bufer = NULL;
91   }
92   else {
93     egpu.enhancement_buf_ptr += 4096 / 2;
94     gpu.get_enhancement_bufer = get_enhancement_bufer;
95   }
96 }
97
98 int renderer_init(void)
99 {
100   if (gpu.vram != NULL) {
101     initialize_psx_gpu(&egpu, gpu.vram);
102     initialized = 1;
103   }
104
105   if (gpu.mmap != NULL && egpu.enhancement_buf_ptr == NULL)
106     map_enhancement_buffer();
107
108   ex_regs = gpu.ex_regs;
109   return 0;
110 }
111
112 void renderer_finish(void)
113 {
114   if (egpu.enhancement_buf_ptr != NULL) {
115     egpu.enhancement_buf_ptr -= 4096 / 2;
116     gpu.munmap(egpu.enhancement_buf_ptr, ENHANCEMENT_BUF_SIZE);
117   }
118   egpu.enhancement_buf_ptr = NULL;
119   egpu.enhancement_current_buf_ptr = NULL;
120   initialized = 0;
121 }
122
123 static __attribute__((noinline)) void
124 sync_enhancement_buffers(int x, int y, int w, int h)
125 {
126   int i, right = x + w, bottom = y + h;
127   const u16 *src = gpu.vram;
128   // use these because the scanout struct may hold reduced w, h
129   // due to intersection stuff, see the update_enhancement_buf_scanouts() mess
130   int s_w = max(gpu.screen.hres, gpu.screen.w);
131   int s_h = gpu.screen.vres;
132   if (gpu.screen.y < 0)
133     s_h -= gpu.screen.y;
134   s_w = min(s_w, 512);
135   for (i = 0; i < ARRAY_SIZE(egpu.enhancement_scanouts); i++) {
136     const struct psx_gpu_scanout *s = &egpu.enhancement_scanouts[i];
137     u16 *dst = select_enhancement_buf_by_index(&egpu, i);
138     int x1, x2, y1, y2;
139     if (s->w == 0) continue;
140     if (s->x >= right) continue;
141     if (s->x + s_w <= x) continue;
142     if (s->y >= bottom) continue;
143     if (s->y + s_h <= y) continue;
144     x1 = max(x, s->x);
145     x2 = min(right, s->x + s_w);
146     y1 = max(y, s->y);
147     y2 = min(bottom, s->y + s_h);
148     // 16-byte align for the asm version
149     x2 += x1 & 7;
150     x1 &= ~7;
151     scale2x_tiles8(dst + y1 * 1024*2 + x1 * 2,
152         src + y1 * 1024 + x1, (x2 - x1 + 7) / 8u, y2 - y1);
153   }
154 }
155
156 void renderer_sync_ecmds(uint32_t *ecmds)
157 {
158   s32 dummy0 = 0;
159   u32 dummy1 = 0;
160   gpu_parse(&egpu, ecmds + 1, 6 * 4, &dummy0, &dummy1);
161 }
162
163 void renderer_update_caches(int x, int y, int w, int h, int state_changed)
164 {
165   update_texture_cache_region(&egpu, x, y, x + w - 1, y + h - 1);
166
167   if (gpu.state.enhancement_active) {
168     if (state_changed) {
169       int vres = gpu.screen.vres;
170       if (gpu.screen.y < 0)
171         vres -= gpu.screen.y;
172       memset(egpu.enhancement_scanouts, 0, sizeof(egpu.enhancement_scanouts));
173       egpu.enhancement_scanout_eselect = 0;
174       update_enhancement_buf_scanouts(&egpu,
175         gpu.screen.src_x, gpu.screen.src_y, gpu.screen.hres, vres);
176       return;
177     }
178     sync_enhancement_buffers(x, y, w, h);
179   }
180 }
181
182 void renderer_flush_queues(void)
183 {
184   flush_render_block_buffer(&egpu);
185 }
186
187 void renderer_set_interlace(int enable, int is_odd)
188 {
189   egpu.render_mode &= ~(RENDER_INTERLACE_ENABLED|RENDER_INTERLACE_ODD);
190   if (enable)
191     egpu.render_mode |= RENDER_INTERLACE_ENABLED;
192   if (is_odd)
193     egpu.render_mode |= RENDER_INTERLACE_ODD;
194 }
195
196 void renderer_notify_res_change(void)
197 {
198   renderer_notify_scanout_change(gpu.screen.src_x, gpu.screen.src_y);
199 }
200
201 void renderer_notify_scanout_change(int x, int y)
202 {
203   int vres = gpu.screen.vres;
204   if (!gpu.state.enhancement_active || !egpu.enhancement_buf_ptr)
205     return;
206
207   if (gpu.screen.y < 0)
208     vres -= gpu.screen.y;
209   update_enhancement_buf_scanouts(&egpu, x, y, gpu.screen.hres, vres);
210 }
211
212 #include "../../frontend/plugin_lib.h"
213
214 void renderer_set_config(const struct rearmed_cbs *cbs)
215 {
216   if (!initialized) {
217     initialize_psx_gpu(&egpu, gpu.vram);
218     initialized = 1;
219   }
220   if (cbs->pl_set_gpu_caps)
221     cbs->pl_set_gpu_caps(GPU_CAP_SUPPORTS_2X);
222
223   disable_main_render = cbs->gpu_neon.enhancement_no_main;
224   if (gpu.state.enhancement_enable) {
225     if (gpu.mmap != NULL && egpu.enhancement_buf_ptr == NULL)
226       map_enhancement_buffer();
227   }
228 }
229
230 // vim:ts=2:sw=2:expandtab