win32 stuff, SIMPLE_WRITE_SOUND
[picodrive.git] / Pico / sound / mix.s
1 @ vim:filetype=armasm
2
3 @ Generic routines for mixing audio samples
4 @ (c) Copyright 2007, Grazvydas "notaz" Ignotas
5
6
7 .text
8 .align 4
9
10 @ this assumes src is word aligned
11 .global mix_16h_to_32 @ int *dest, short *src, int count
12
13 mix_16h_to_32:
14     stmfd   sp!, {r4-r6,lr}
15 /*
16     tst     r1, #2
17     beq     m16_32_mo_unalw
18     ldrsh   r4, [r1], #2
19     ldr     r3, [r0]
20     sub     r2, r2, #1
21     add     r3, r3, r4, asr #1
22     str     r3, [r0], #4
23 */
24 m16_32_mo_unalw:
25     subs    r2, r2, #4
26     bmi     m16_32_end
27
28 m16_32_loop:
29     ldmia   r0, {r3-r6}
30     ldmia   r1!,{r12,lr}
31     subs    r2, r2, #4
32     add     r4, r4, r12,asr #17 @ we use half volume
33     mov     r12,r12,lsl #16
34     add     r3, r3, r12,asr #17
35     add     r6, r6, lr, asr #17
36     mov     lr, lr, lsl #16
37     add     r5, r5, lr, asr #17
38     stmia   r0!,{r3-r6}
39     bpl     m16_32_loop
40
41 m16_32_end:
42     tst     r2, #2
43     beq     m16_32_no_unal2
44     ldr     r5, [r1], #4
45     ldmia   r0, {r3,r4}
46     mov     r12,r5, lsl #16
47     add     r3, r3, r12,asr #17
48     add     r4, r4, r5, asr #17
49     stmia   r0!,{r3,r4}
50
51 m16_32_no_unal2:
52     tst     r2, #1
53     ldmeqfd sp!, {r4-r6,pc}
54     ldrsh   r4, [r1], #2
55     ldr     r3, [r0]
56     add     r3, r3, r4, asr #1
57     str     r3, [r0], #4
58
59     ldmfd   sp!, {r4-r6,lr}
60     bx      lr
61
62
63
64 .global mix_16h_to_32_s1 @ int *dest, short *src, int count
65
66 mix_16h_to_32_s1:
67     stmfd   sp!, {r4-r6,lr}
68
69     subs    r2, r2, #4
70     bmi     m16_32_s1_end
71
72 m16_32_s1_loop:
73     ldmia   r0, {r3-r6}
74     ldr     r12,[r1], #8
75     ldr     lr, [r1], #8
76     subs    r2, r2, #4
77     add     r4, r4, r12,asr #17
78     mov     r12,r12,lsl #16
79     add     r3, r3, r12,asr #17 @ we use half volume
80     add     r6, r6, lr, asr #17
81     mov     lr, lr, lsl #16
82     add     r5, r5, lr, asr #17
83     stmia   r0!,{r3-r6}
84     bpl     m16_32_s1_loop
85
86 m16_32_s1_end:
87     tst     r2, #2
88     beq     m16_32_s1_no_unal2
89     ldr     r5, [r1], #8
90     ldmia   r0, {r3,r4}
91     mov     r12,r5, lsl #16
92     add     r3, r3, r12,asr #17
93     add     r4, r4, r5, asr #17
94     stmia   r0!,{r3,r4}
95
96 m16_32_s1_no_unal2:
97     tst     r2, #1
98     ldmeqfd sp!, {r4-r6,pc}
99     ldrsh   r4, [r1], #2
100     ldr     r3, [r0]
101     add     r3, r3, r4, asr #1
102     str     r3, [r0], #4
103
104     ldmfd   sp!, {r4-r6,lr}
105     bx      lr
106
107
108
109 .global mix_16h_to_32_s2 @ int *dest, short *src, int count
110
111 mix_16h_to_32_s2:
112     stmfd   sp!, {r4-r6,lr}
113
114     subs    r2, r2, #4
115     bmi     m16_32_s2_end
116
117 m16_32_s2_loop:
118     ldmia   r0, {r3-r6}
119     ldr     r12,[r1], #16
120     ldr     lr, [r1], #16
121     subs    r2, r2, #4
122     add     r4, r4, r12,asr #17
123     mov     r12,r12,lsl #16
124     add     r3, r3, r12,asr #17 @ we use half volume
125     add     r6, r6, lr, asr #17
126     mov     lr, lr, lsl #16
127     add     r5, r5, lr, asr #17
128     stmia   r0!,{r3-r6}
129     bpl     m16_32_s2_loop
130
131 m16_32_s2_end:
132     tst     r2, #2
133     beq     m16_32_s2_no_unal2
134     ldr     r5, [r1], #16
135     ldmia   r0, {r3,r4}
136     mov     r12,r5, lsl #16
137     add     r3, r3, r12,asr #17
138     add     r4, r4, r5, asr #17
139     stmia   r0!,{r3,r4}
140
141 m16_32_s2_no_unal2:
142     tst     r2, #1
143     ldmeqfd sp!, {r4-r6,pc}
144     ldrsh   r4, [r1], #2
145     ldr     r3, [r0]
146     add     r3, r3, r4, asr #1
147     str     r3, [r0], #4
148
149     ldmfd   sp!, {r4-r6,lr}
150     bx      lr
151
152
153
154 @ limit
155 @ reg=int_sample, lr=1, r3=tmp, kills flags
156 .macro Limit reg
157     add     r3, lr, \reg, asr #15
158     bics    r3, r3, #1                  @ in non-overflow conditions r3 is 0 or 1
159     movne   \reg, #0x8000
160     subpl   \reg, \reg, #1
161 .endm
162
163
164 @ limit and shift up by 16
165 @ reg=int_sample, lr=1, r3=tmp, kills flags
166 .macro Limitsh reg
167 @    movs    r4, r3, asr #16
168 @    cmnne   r4, #1
169 @    beq     c32_16_no_overflow
170 @    tst     r4, r4
171 @    mov     r3, #0x8000
172 @    subpl   r3, r3, #1
173
174     add     r3, lr, \reg, asr #15
175     bics    r3, r3, #1                  @ in non-overflow conditions r3 is 0 or 1
176     moveq   \reg, \reg, lsl #16
177     movne   \reg, #0x80000000
178     subpl   \reg, \reg, #0x00010000
179 .endm
180
181
182 @ mix 32bit audio (with 16bits really used, upper bits indicate overflow) with normal 16 bit audio with left channel only
183 @ warning: this function assumes dest is word aligned
184 .global mix_32_to_16l_stereo @ short *dest, int *src, int count
185
186 mix_32_to_16l_stereo:
187     stmfd   sp!, {r4-r8,lr}
188
189     mov     lr, #1
190
191     mov     r2, r2, lsl #1
192     subs    r2, r2, #4
193     bmi     m32_16l_st_end
194
195 m32_16l_st_loop:
196     ldmia   r0,  {r8,r12}
197     ldmia   r1!, {r4-r7}
198     mov     r8, r8, lsl #16
199     mov     r12,r12,lsl #16
200     add     r4, r4, r8, asr #16
201     add     r5, r5, r8, asr #16
202     add     r6, r6, r12,asr #16
203     add     r7, r7, r12,asr #16
204     Limitsh r4
205     Limitsh r5
206     Limitsh r6
207     Limitsh r7
208     subs    r2, r2, #4
209     orr     r4, r5, r4, lsr #16
210     orr     r5, r7, r6, lsr #16
211     stmia   r0!, {r4,r5}
212     bpl     m32_16l_st_loop
213
214 m32_16l_st_end:
215     @ check for remaining bytes to convert
216     tst     r2, #2
217     beq     m32_16l_st_no_unal2
218     ldrsh   r6, [r0]
219     ldmia   r1!,{r4,r5}
220     add     r4, r4, r6
221     add     r5, r5, r6
222     Limitsh r4
223     Limitsh r5
224     orr     r4, r5, r4, lsr #16
225     str     r4, [r0], #4
226
227 m32_16l_st_no_unal2:
228     ldmfd   sp!, {r4-r8,lr}
229     bx      lr
230
231
232 @ mix 32bit audio (with 16bits really used, upper bits indicate overflow) with normal 16 bit audio (for mono sound)
233 .global mix_32_to_16_mono @ short *dest, int *src, int count
234
235 mix_32_to_16_mono:
236     stmfd   sp!, {r4-r8,lr}
237
238     mov     lr, #1
239
240     @ check if dest is word aligned
241     tst     r0, #2
242     beq     m32_16_mo_no_unalw
243     ldrsh   r5, [r0]
244     ldr     r4, [r1], #4
245     sub     r2, r2, #1
246     add     r4, r4, r5
247     Limit   r4
248     strh    r4, [r0], #2
249
250 m32_16_mo_no_unalw:
251     subs    r2, r2, #4
252     bmi     m32_16_mo_end
253
254 m32_16_mo_loop:
255     ldmia   r0,  {r8,r12}
256     ldmia   r1!, {r4-r7}
257     add     r5, r5, r8, asr #16
258     mov     r8, r8, lsl #16
259     add     r4, r4, r8, asr #16
260     add     r7, r7, r12,asr #16
261     mov     r12,r12,lsl #16
262     add     r6, r6, r12,asr #16
263     Limitsh r4
264     Limitsh r5
265     Limitsh r6
266     Limitsh r7
267     subs    r2, r2, #4
268     orr     r4, r5, r4, lsr #16
269     orr     r5, r7, r6, lsr #16
270     stmia   r0!, {r4,r5}
271     bpl     m32_16_mo_loop
272
273 m32_16_mo_end:
274     @ check for remaining bytes to convert
275     tst     r2, #2
276     beq     m32_16_mo_no_unal2
277     ldr     r6, [r0]
278     ldmia   r1!,{r4,r5}
279     add     r5, r5, r6, asr #16
280     mov     r6, r6, lsl #16
281     add     r4, r4, r6, asr #16
282     Limitsh r4
283     Limitsh r5
284     orr     r4, r5, r4, lsr #16
285     str     r4, [r0], #4
286
287 m32_16_mo_no_unal2:
288     tst     r2, #1
289     ldmeqfd sp!, {r4-r8,pc}
290     ldrsh   r5, [r0]
291     ldr     r4, [r1], #4
292     add     r4, r4, r5
293     Limit   r4
294     strh    r4, [r0], #2
295
296     ldmfd   sp!, {r4-r8,lr}
297     bx      lr
298
299
300
301 .data
302 .align 4
303
304 .global mix_32_to_16l_level
305 mix_32_to_16l_level:
306     .word   0
307
308 .text
309 .align 4
310
311 @ same as mix_32_to_16l_stereo, but with additional shift
312 .global mix_32_to_16l_stereo_lvl @ short *dest, int *src, int count
313
314 mix_32_to_16l_stereo_lvl:
315     stmfd   sp!, {r4-r9,lr}
316
317     ldr     r9, =mix_32_to_16l_level
318     mov     lr, #1
319     ldr     r9, [r9]
320
321     mov     r2, r2, lsl #1
322     subs    r2, r2, #4
323     bmi     m32_16l_st_l_end
324
325 m32_16l_st_l_loop:
326     ldmia   r0,  {r8,r12}
327     ldmia   r1!, {r4-r7}
328     mov     r8, r8, lsl #16
329     mov     r12,r12,lsl #16
330     add     r4, r4, r8, asr #16
331     add     r5, r5, r8, asr #16
332     add     r6, r6, r12,asr #16
333     add     r7, r7, r12,asr #16
334     mov     r4, r4, asr r9
335     mov     r5, r5, asr r9
336     mov     r6, r6, asr r9
337     mov     r7, r7, asr r9
338     Limitsh r4
339     Limitsh r5
340     Limitsh r6
341     Limitsh r7
342     subs    r2, r2, #4
343     orr     r4, r5, r4, lsr #16
344     orr     r5, r7, r6, lsr #16
345     stmia   r0!, {r4,r5}
346     bpl     m32_16l_st_l_loop
347
348 m32_16l_st_l_end:
349     @ check for remaining bytes to convert
350     tst     r2, #2
351     beq     m32_16l_st_l_no_unal2
352     ldrsh   r6, [r0]
353     ldmia   r1!,{r4,r5}
354     add     r4, r4, r6
355     add     r5, r5, r6
356     mov     r4, r4, asr r9
357     mov     r5, r5, asr r9
358     Limitsh r4
359     Limitsh r5
360     orr     r4, r5, r4, lsr #16
361     str     r4, [r0], #4
362
363 m32_16l_st_l_no_unal2:
364     ldmfd   sp!, {r4-r9,lr}
365     bx      lr
366
367