Merge pull request #665 from QuarkTheAwesome/libretro-merge-be
[pcsx_rearmed.git] / frontend / cspace.c
1 /*
2  * (C) GraÅžvydas "notaz" Ignotas, 2011,2012
3  *
4  * This work is licensed under the terms of any of these licenses
5  * (at your option):
6  *  - GNU GPL, version 2 or later.
7  *  - GNU LGPL, version 2.1 or later.
8  * See the COPYING file in the top-level directory.
9  */
10
11 #include "cspace.h"
12
13 /*
14  * note: these are intended for testing and should be avoided
15  * in favor of NEON version or platform-specific conversion
16  */
17
18 #if __BYTE_ORDER__ == __ORDER_BIG_ENDIAN__
19 #define SWAP16(x) __builtin_bswap16(x)
20 #define LE16TOHx2(x) ((SWAP16((x) >> 16) << 16) | SWAP16(x))
21 #else
22 #define LE16TOHx2(x) (x)
23 #endif
24
25 #ifndef __arm__
26
27 void bgr555_to_rgb565(void *dst_, const void *src_, int bytes)
28 {
29     const unsigned int *src = src_;
30     unsigned int *dst = dst_;
31     unsigned int x, p, r, g, b;
32
33     for (x = 0; x < bytes / 4; x++) {
34         p = LE16TOHx2(src[x]);
35
36         r = (p & 0x001f001f) << 11;
37         g = (p & 0x03e003e0) << 1;
38         b = (p & 0x7c007c00) >> 10;
39
40         dst[x] = r | g | b;
41     }
42 }
43
44 #endif
45
46 #ifdef __arm64__
47
48 void bgr888_to_rgb565(void *dst_, const void *src_, int bytes)
49 {
50     const unsigned char *src = src_;
51     unsigned int *dst = dst_;
52     unsigned int r1, g1, b1, r2, g2, b2;
53
54     for (; bytes >= 6; bytes -= 6, src += 6, dst++) {
55         r1 = src[0] & 0xf8;
56         g1 = src[1] & 0xfc;
57         b1 = src[2] & 0xf8;
58         r2 = src[3] & 0xf8;
59         g2 = src[4] & 0xfc;
60         b2 = src[5] & 0xf8;
61         *dst = (r2 << 24) | (g2 << 19) | (b2 << 13) |
62                (r1 << 8) | (g1 << 3) | (b1 >> 3);
63     }
64 }
65
66 #endif
67
68 #ifndef __ARM_NEON__
69
70 void bgr888_to_rgb565(void *dst_, const void *src_, int bytes)
71 {
72     const unsigned char *src = src_;
73     unsigned int *dst = dst_;
74     unsigned int r1, g1, b1, r2, g2, b2;
75
76     for (; bytes >= 6; bytes -= 6, src += 6, dst++) {
77         r1 = src[0] & 0xf8;
78         g1 = src[1] & 0xfc;
79         b1 = src[2] & 0xf8;
80         r2 = src[3] & 0xf8;
81         g2 = src[4] & 0xfc;
82         b2 = src[5] & 0xf8;
83 #if __BYTE_ORDER__ == __ORDER_BIG_ENDIAN__
84         *dst = (r1 << 24) | (g1 << 19) | (b1 << 13) |
85                (r2 << 8) | (g2 << 3) | (b2 >> 3);
86 #else
87         *dst = (r2 << 24) | (g2 << 19) | (b2 << 13) |
88                (r1 << 8) | (g1 << 3) | (b1 >> 3);
89 #endif
90     }
91 }
92
93 // TODO?
94 void rgb888_to_rgb565(void *dst, const void *src, int bytes) {}
95 void bgr888_to_rgb888(void *dst, const void *src, int bytes) {}
96
97 #endif // __ARM_NEON__
98
99 /* YUV stuff */
100 static int yuv_ry[32], yuv_gy[32], yuv_by[32];
101 static unsigned char yuv_u[32 * 2], yuv_v[32 * 2];
102
103 void bgr_to_uyvy_init(void)
104 {
105   int i, v;
106
107   /* init yuv converter:
108     y0 = (int)((0.299f * r0) + (0.587f * g0) + (0.114f * b0));
109     y1 = (int)((0.299f * r1) + (0.587f * g1) + (0.114f * b1));
110     u = (int)(8 * 0.565f * (b0 - y0)) + 128;
111     v = (int)(8 * 0.713f * (r0 - y0)) + 128;
112   */
113   for (i = 0; i < 32; i++) {
114     yuv_ry[i] = (int)(0.299f * i * 65536.0f + 0.5f);
115     yuv_gy[i] = (int)(0.587f * i * 65536.0f + 0.5f);
116     yuv_by[i] = (int)(0.114f * i * 65536.0f + 0.5f);
117   }
118   for (i = -32; i < 32; i++) {
119     v = (int)(8 * 0.565f * i) + 128;
120     if (v < 0)
121       v = 0;
122     if (v > 255)
123       v = 255;
124     yuv_u[i + 32] = v;
125     v = (int)(8 * 0.713f * i) + 128;
126     if (v < 0)
127       v = 0;
128     if (v > 255)
129       v = 255;
130     yuv_v[i + 32] = v;
131   }
132 }
133
134 void rgb565_to_uyvy(void *d, const void *s, int pixels)
135 {
136   unsigned int *dst = d;
137   const unsigned short *src = s;
138   const unsigned char *yu = yuv_u + 32;
139   const unsigned char *yv = yuv_v + 32;
140   int r0, g0, b0, r1, g1, b1;
141   int y0, y1, u, v;
142
143   for (; pixels > 0; src += 2, dst++, pixels -= 2)
144   {
145     r0 = (src[0] >> 11) & 0x1f;
146     g0 = (src[0] >> 6) & 0x1f;
147     b0 =  src[0] & 0x1f;
148     r1 = (src[1] >> 11) & 0x1f;
149     g1 = (src[1] >> 6) & 0x1f;
150     b1 =  src[1] & 0x1f;
151     y0 = (yuv_ry[r0] + yuv_gy[g0] + yuv_by[b0]) >> 16;
152     y1 = (yuv_ry[r1] + yuv_gy[g1] + yuv_by[b1]) >> 16;
153     u = yu[b0 - y0];
154     v = yv[r0 - y0];
155     // valid Y range seems to be 16..235
156     y0 = 16 + 219 * y0 / 31;
157     y1 = 16 + 219 * y1 / 31;
158
159     *dst = (y1 << 24) | (v << 16) | (y0 << 8) | u;
160   }
161 }
162
163 void bgr555_to_uyvy(void *d, const void *s, int pixels)
164 {
165   unsigned int *dst = d;
166   const unsigned short *src = s;
167   const unsigned char *yu = yuv_u + 32;
168   const unsigned char *yv = yuv_v + 32;
169   int r0, g0, b0, r1, g1, b1;
170   int y0, y1, u, v;
171
172   for (; pixels > 0; src += 2, dst++, pixels -= 2)
173   {
174     b0 = (src[0] >> 10) & 0x1f;
175     g0 = (src[0] >> 5) & 0x1f;
176     r0 =  src[0] & 0x1f;
177     b1 = (src[1] >> 10) & 0x1f;
178     g1 = (src[1] >> 5) & 0x1f;
179     r1 =  src[1] & 0x1f;
180     y0 = (yuv_ry[r0] + yuv_gy[g0] + yuv_by[b0]) >> 16;
181     y1 = (yuv_ry[r1] + yuv_gy[g1] + yuv_by[b1]) >> 16;
182     u = yu[b0 - y0];
183     v = yv[r0 - y0];
184     y0 = 16 + 219 * y0 / 31;
185     y1 = 16 + 219 * y1 / 31;
186
187     *dst = (y1 << 24) | (v << 16) | (y0 << 8) | u;
188   }
189 }
190
191 void bgr888_to_uyvy(void *d, const void *s, int pixels)
192 {
193   unsigned int *dst = d;
194   const unsigned char *src8 = s;
195   const unsigned char *yu = yuv_u + 32;
196   const unsigned char *yv = yuv_v + 32;
197   int r0, g0, b0, r1, g1, b1;
198   int y0, y1, u, v;
199
200   for (; pixels > 0; src8 += 3*2, dst++, pixels -= 2)
201   {
202     r0 = src8[0], g0 = src8[1], b0 = src8[2];
203     r1 = src8[3], g1 = src8[4], b1 = src8[5];
204     y0 = (r0 * 19595 + g0 * 38470 + b0 * 7471) >> 16;
205     y1 = (r1 * 19595 + g1 * 38470 + b1 * 7471) >> 16;
206     u = yu[(b0 - y0) / 8];
207     v = yv[(r0 - y0) / 8];
208     y0 = 16 + 219 * y0 / 255;
209     y1 = 16 + 219 * y1 / 255;
210
211     *dst = (y1 << 24) | (v << 16) | (y0 << 8) | u;
212   }
213 }