[ginge.git] / common / wiz_video_arm.s

@ vim:filetype=armasm

@ input: r2-r5
@ output: r7,r8
@ trash: r6
.macro rb_line_low
    mov     r6, r2, lsl #16
    mov     r7, r3, lsl #16
    orr     r7, r7, r6, lsr #16
    mov     r6, r4, lsl #16
    mov     r8, r5, lsl #16
    orr     r8, r8, r6, lsr #16
.endm

.macro rb_line_hi
    mov     r6, r2, lsr #16
    mov     r7, r3, lsr #16
    orr     r7, r6, r7, lsl #16
    mov     r6, r4, lsr #16
    mov     r8, r5, lsr #16
    orr     r8, r6, r8, lsl #16
.endm

.global rotated_blit16 @ void *dst, void *linesx4
rotated_blit16:
    stmfd   sp!,{r4-r8,lr}

    sub     r0, r0, #240*2 @ adjust
    mov     lr, #240/4

rotated_blit_loop16_o:
    orr     lr, lr, #((320/4)-1) << 16
    add     r0, r0, #(240*320)*2

rotated_blit_loop16:
    ldr     r2, [r1, #320*0*2]
    ldr     r3, [r1, #320*1*2]
    ldr     r4, [r1, #320*2*2]
    ldr     r5, [r1, #320*3*2]
    rb_line_low
    stmia   r0, {r7,r8}
    sub     r0, r0, #240*2
    rb_line_hi
    stmia   r0, {r7,r8}
    sub     r0, r0, #240*2

    ldr     r2, [r1, #320*0*2+4]
    ldr     r3, [r1, #320*1*2+4]
    ldr     r4, [r1, #320*2*2+4]
    ldr     r5, [r1, #320*3*2+4]
    rb_line_low
    stmia   r0, {r7,r8}
    sub     r0, r0, #240*2
    rb_line_hi
    stmia   r0, {r7,r8}
    sub     r0, r0, #240*2

    subs    lr, lr, #1<<16
    add     r1, r1, #8
    bpl     rotated_blit_loop16

    add     lr, lr, #1<<16
    subs    lr, lr, #1

    add     r0, r0, #4*2
    add     r1, r1, #(320*3)*2
    bgt     rotated_blit_loop16_o

    ldmfd   sp!,{r4-r8,pc}


.global rotated_blit8 @ void *dst, void *linesx4
rotated_blit8:
    stmfd   sp!,{r4-r8,lr}

    mov     r8, #320
    sub     r0, r0, #240	@ adjust
    mov     lr, #240/4

rotated_blit8_loop_o:
    orr     lr, lr, #((320/4)-1) << 16
    add     r0, r0, #(240*320)

rotated_blit8_loop:
    mov     r6, r1
    ldr     r2, [r6], r8
    ldr     r3, [r6], r8
    ldr     r4, [r6], r8
    ldr     r5, [r6], r8

    mov     r6, r2, lsl #24
    mov     r6, r6, lsr #8
    orr     r6, r6, r3, lsl #24
    mov     r6, r6, lsr #8
    orr     r6, r6, r4, lsl #24
    mov     r6, r6, lsr #8
    orr     r6, r6, r5, lsl #24
    str     r6, [r0], #-240

    and     r6, r3, #0xff00
    and     r7, r2, #0xff00
    orr     r6, r6, r7, lsr #8
    and     r7, r4, #0xff00
    orr     r6, r6, r7, lsl #8
    and     r7, r5, #0xff00
    orr     r6, r6, r7, lsl #16
    str     r6, [r0], #-240

    and     r6, r4, #0xff0000
    and     r7, r2, #0xff0000
    orr     r6, r6, r7, lsr #16
    and     r7, r3, #0xff0000
    orr     r6, r6, r7, lsr #8
    and     r7, r5, #0xff0000
    orr     r6, r6, r7, lsl #8
    str     r6, [r0], #-240

    mov     r6, r5, lsr #24
    mov     r6, r6, lsl #8
    orr     r6, r6, r4, lsr #24
    mov     r6, r6, lsl #8
    orr     r6, r6, r3, lsr #24
    mov     r6, r6, lsl #8
    orr     r6, r6, r2, lsr #24
    str     r6, [r0], #-240

    subs    lr, lr, #1<<16
    add     r1, r1, #4
    bpl     rotated_blit8_loop

    add     lr, lr, #1<<16
    subs    lr, lr, #1

    add     r0, r0, #4
    add     r1, r1, #320*3
    bgt     rotated_blit8_loop_o

    ldmfd   sp!,{r4-r8,pc}
Commit	Line	Data
	1	@ vim:filetype=armasm
	2
	3	@ input: r2-r5
	4	@ output: r7,r8
	5	@ trash: r6
	6	.macro rb_line_low
	7	mov r6, r2, lsl #16
	8	mov r7, r3, lsl #16
	9	orr r7, r7, r6, lsr #16
	10	mov r6, r4, lsl #16
	11	mov r8, r5, lsl #16
	12	orr r8, r8, r6, lsr #16
	13	.endm
	14
	15	.macro rb_line_hi
	16	mov r6, r2, lsr #16
	17	mov r7, r3, lsr #16
	18	orr r7, r6, r7, lsl #16
	19	mov r6, r4, lsr #16
	20	mov r8, r5, lsr #16
	21	orr r8, r6, r8, lsl #16
	22	.endm
	23
	24	.global rotated_blit16 @ void dst, void linesx4
	25	rotated_blit16:
	26	stmfd sp!,{r4-r8,lr}
	27
	28	sub r0, r0, #240*2 @ adjust
	29	mov lr, #240/4
	30
	31	rotated_blit_loop16_o:
	32	orr lr, lr, #((320/4)-1) << 16
	33	add r0, r0, #(240320)2
	34
	35	rotated_blit_loop16:
	36	ldr r2, [r1, #32002]
	37	ldr r3, [r1, #32012]
	38	ldr r4, [r1, #32022]
	39	ldr r5, [r1, #32032]
	40	rb_line_low
	41	stmia r0, {r7,r8}
	42	sub r0, r0, #240*2
	43	rb_line_hi
	44	stmia r0, {r7,r8}
	45	sub r0, r0, #240*2
	46
	47	ldr r2, [r1, #32002+4]
	48	ldr r3, [r1, #32012+4]
	49	ldr r4, [r1, #32022+4]
	50	ldr r5, [r1, #32032+4]
	51	rb_line_low
	52	stmia r0, {r7,r8}
	53	sub r0, r0, #240*2
	54	rb_line_hi
	55	stmia r0, {r7,r8}
	56	sub r0, r0, #240*2
	57
	58	subs lr, lr, #1<<16
	59	add r1, r1, #8
	60	bpl rotated_blit_loop16
	61
	62	add lr, lr, #1<<16
	63	subs lr, lr, #1
	64
	65	add r0, r0, #4*2
	66	add r1, r1, #(3203)2
	67	bgt rotated_blit_loop16_o
	68
	69	ldmfd sp!,{r4-r8,pc}
	70
	71
	72	.global rotated_blit8 @ void dst, void linesx4
	73	rotated_blit8:
	74	stmfd sp!,{r4-r8,lr}
	75
	76	mov r8, #320
	77	sub r0, r0, #240 @ adjust
	78	mov lr, #240/4
	79
	80	rotated_blit8_loop_o:
	81	orr lr, lr, #((320/4)-1) << 16
	82	add r0, r0, #(240*320)
	83
	84	rotated_blit8_loop:
	85	mov r6, r1
	86	ldr r2, [r6], r8
	87	ldr r3, [r6], r8
	88	ldr r4, [r6], r8
	89	ldr r5, [r6], r8
	90
	91	mov r6, r2, lsl #24
	92	mov r6, r6, lsr #8
	93	orr r6, r6, r3, lsl #24
	94	mov r6, r6, lsr #8
	95	orr r6, r6, r4, lsl #24
	96	mov r6, r6, lsr #8
	97	orr r6, r6, r5, lsl #24
	98	str r6, [r0], #-240
	99
	100	and r6, r3, #0xff00
	101	and r7, r2, #0xff00
	102	orr r6, r6, r7, lsr #8
	103	and r7, r4, #0xff00
	104	orr r6, r6, r7, lsl #8
	105	and r7, r5, #0xff00
	106	orr r6, r6, r7, lsl #16
	107	str r6, [r0], #-240
	108
	109	and r6, r4, #0xff0000
	110	and r7, r2, #0xff0000
	111	orr r6, r6, r7, lsr #16
	112	and r7, r3, #0xff0000
	113	orr r6, r6, r7, lsr #8
	114	and r7, r5, #0xff0000
	115	orr r6, r6, r7, lsl #8
	116	str r6, [r0], #-240
	117
	118	mov r6, r5, lsr #24
	119	mov r6, r6, lsl #8
	120	orr r6, r6, r4, lsr #24
	121	mov r6, r6, lsl #8
	122	orr r6, r6, r3, lsr #24
	123	mov r6, r6, lsl #8
	124	orr r6, r6, r2, lsr #24
	125	str r6, [r0], #-240
	126
	127	subs lr, lr, #1<<16
	128	add r1, r1, #4
	129	bpl rotated_blit8_loop
	130
	131	add lr, lr, #1<<16
	132	subs lr, lr, #1
	133
	134	add r0, r0, #4
	135	add r1, r1, #320*3
	136	bgt rotated_blit8_loop_o
	137
	138	ldmfd sp!,{r4-r8,pc}
	139