[picodrive.git] / platform / gizmondo / asm_utils.s

@ vim:filetype=armasm


.global vidCpy8to16 @ void *dest, void *src, short *pal, int lines|(is32col<<8)

vidCpy8to16:
    stmfd   sp!, {r4-r8,lr}

    tst     r3, #0x100
    and     r3, r3, #0xff
    mov     r3, r3, lsr #1
    orr     r3, r3, r3, lsl #8
    orreq   r3, r3, #(320/8-1)<<24 @ 40 col mode
    orrne   r3, r3, #(256/8-1)<<24 @ 32 col mode
    orrne   r3, r3, #0x10000
    addne   r0, r0, #32*2
    add     r1, r1, #8
    mov     lr, #0xff
    mov     lr, lr, lsl #1

    @ even lines first
vcloop_aligned:
    ldr     r12, [r1], #4
    ldr     r7,  [r1], #4

    and     r4, lr, r12,lsl #1
    ldrh    r4, [r2, r4]
    and     r5, lr, r12,lsr #7
    ldrh    r5, [r2, r5]
    and     r6, lr, r12,lsr #15
    ldrh    r6, [r2, r6]
    orr     r4, r4, r5, lsl #16

    and     r5, lr, r12,lsr #23
    ldrh    r5, [r2, r5]
    and     r8, lr, r7, lsl #1
    ldrh    r8, [r2, r8]
    orr     r5, r6, r5, lsl #16

    and     r6, lr, r7, lsr #7
    ldrh    r6, [r2, r6]
    and     r12,lr, r7, lsr #15
    ldrh    r12,[r2, r12]
    and     r7, lr, r7, lsr #23
    ldrh    r7, [r2, r7]
    orr     r8, r8, r6, lsl #16

    subs    r3, r3, #1<<24
    orr     r12,r12, r7, lsl #16

    stmia   r0!, {r4,r5,r8,r12}
    bpl     vcloop_aligned

    tst     r3, #0x10000
    add     r1, r1, #336             @ skip a line and 1 col
    addne   r1, r1, #64              @ skip more for 32col mode
    add     r0, r0, #(320+2)*2
    addne   r0, r0, #64*2
    addeq   r3, r3, #(320/8)<<24
    addne   r3, r3, #(256/8)<<24
    sub     r3, r3, #1
    tst     r3, #0xff
    bne     vcloop_aligned

    and     r4, r3, #0xff00
    orr     r3, r3, r4, lsr #8
    mov     r4, r4, lsr #7
    sub     r6, r4, #1
    mov     r5, #320*2
    add     r5, r5, #2
    mul     r4, r5, r6
    sub     r0, r0, r4
    mov     r5, #328
    mul     r4, r5, r6
    sub     r1, r1, r4

    sub     r0, r0, #2
    mov     r8, #0

vcloop_unaligned:
    ldr     r12, [r1], #4
    ldr     r7,  [r1], #4

    and     r6, lr, r12, lsl #1
    ldrh    r6, [r2, r6]
    and     r5, lr, r12, lsr #7
    ldrh    r5, [r2, r5]
    orr     r4, r8, r6, lsl #16

    and     r6, lr, r12, lsr #15
    ldrh    r6, [r2, r6]
    and     r8, lr, r12, lsr #23
    ldrh    r8, [r2, r8]
    orr     r5, r5, r6, lsl #16

    and     r6, lr, r7, lsl #1
    ldrh    r6, [r2, r6]
    and     r12,lr, r7, lsr #7
    ldrh    r12,[r2, r12]
    orr     r6, r8, r6, lsl #16

    and     r8, lr, r7, lsr #15
    ldrh    r8, [r2, r8]

    subs    r3, r3, #1<<24
    and     r7, lr, r7, lsr #23
    orr     r12,r12,r8, lsl #16

    ldrh    r8, [r2, r7]

    stmia   r0!, {r4,r5,r6,r12}
    bpl     vcloop_unaligned

    strh    r8, [r0]
    mov     r8, #0

    tst     r3, #0x10000
    add     r1, r1, #336             @ skip a line and 1 col
    addne   r1, r1, #64              @ skip more for 32col mode
    add     r0, r0, #(320+2)*2
    addne   r0, r0, #64*2
    addeq   r3, r3, #(320/8)<<24
    addne   r3, r3, #(256/8)<<24
    sub     r3, r3, #1
    tst     r3, #0xff
    bne     vcloop_unaligned

    ldmfd   sp!, {r4-r8,lr}
    bx      lr
Commit	Line	Data
ea8c405f	1	@ vim:filetype=armasm
	2
	3
9839d126	4	.global vidCpy8to16 @ void dest, void src, short *pal, int lines\|(is32col<<8)
ea8c405f	5
9839d126	6	vidCpy8to16:
9839d126	7	stmfd sp!, {r4-r8,lr}
ea8c405f	8
9839d126	9	tst r3, #0x100
9839d126	10	and r3, r3, #0xff
ea8c405f	11	mov r3, r3, lsr #1
ea8c405f	12	orr r3, r3, r3, lsl #8
9839d126	13	orreq r3, r3, #(320/8-1)<<24 @ 40 col mode
	14	orrne r3, r3, #(256/8-1)<<24 @ 32 col mode
	15	orrne r3, r3, #0x10000
	16	addne r0, r0, #32*2
2ec14aec	17	add r1, r1, #8
	18	mov lr, #0xff
	19	mov lr, lr, lsl #1
ea8c405f	20
9839d126	21	@ even lines first
9839d126	22	vcloop_aligned:
ea8c405f	23	ldr r12, [r1], #4
	24	ldr r7, [r1], #4
	25
9839d126	26	and r4, lr, r12,lsl #1
ea8c405f	27	ldrh r4, [r2, r4]
9839d126	28	and r5, lr, r12,lsr #7
ea8c405f	29	ldrh r5, [r2, r5]
9839d126	30	and r6, lr, r12,lsr #15
ea8c405f	31	ldrh r6, [r2, r6]
	32	orr r4, r4, r5, lsl #16
	33
9839d126	34	and r5, lr, r12,lsr #23
ea8c405f	35	ldrh r5, [r2, r5]
	36	and r8, lr, r7, lsl #1
	37	ldrh r8, [r2, r8]
	38	orr r5, r6, r5, lsl #16
	39
	40	and r6, lr, r7, lsr #7
	41	ldrh r6, [r2, r6]
	42	and r12,lr, r7, lsr #15
	43	ldrh r12,[r2, r12]
9839d126	44	and r7, lr, r7, lsr #23
9839d126	45	ldrh r7, [r2, r7]
ea8c405f	46	orr r8, r8, r6, lsl #16
	47
	48	subs r3, r3, #1<<24
9839d126	49	orr r12,r12, r7, lsl #16
ea8c405f	50
ea8c405f	51	stmia r0!, {r4,r5,r8,r12}
9839d126	52	bpl vcloop_aligned
ea8c405f	53
9839d126	54	tst r3, #0x10000
ea8c405f	55	add r1, r1, #336 @ skip a line and 1 col
9839d126	56	addne r1, r1, #64 @ skip more for 32col mode
	57	add r0, r0, #(320+2)*2
	58	addne r0, r0, #64*2
	59	addeq r3, r3, #(320/8)<<24
	60	addne r3, r3, #(256/8)<<24
ea8c405f	61	sub r3, r3, #1
ea8c405f	62	tst r3, #0xff
9839d126	63	bne vcloop_aligned
ea8c405f	64
	65	and r4, r3, #0xff00
	66	orr r3, r3, r4, lsr #8
	67	mov r4, r4, lsr #7
fd34fdd0	68	sub r6, r4, #1
ea8c405f	69	mov r5, #320*2
ea8c405f	70	add r5, r5, #2
fd34fdd0	71	mul r4, r5, r6
ea8c405f	72	sub r0, r0, r4
ea8c405f	73	mov r5, #328
fd34fdd0	74	mul r4, r5, r6
ea8c405f	75	sub r1, r1, r4
ea8c405f	76
9839d126	77	sub r0, r0, #2
9839d126	78	mov r8, #0
499a0be3	79
9839d126	80	vcloop_unaligned:
499a0be3	81	ldr r12, [r1], #4
	82	ldr r7, [r1], #4
	83
	84	and r6, lr, r12, lsl #1
	85	ldrh r6, [r2, r6]
	86	and r5, lr, r12, lsr #7
	87	ldrh r5, [r2, r5]
9839d126	88	orr r4, r8, r6, lsl #16
499a0be3	89
ea8c405f	90	and r6, lr, r12, lsr #15
ea8c405f	91	ldrh r6, [r2, r6]
9839d126	92	and r8, lr, r12, lsr #23
9839d126	93	ldrh r8, [r2, r8]
499a0be3	94	orr r5, r5, r6, lsl #16
ea8c405f	95
9839d126	96	and r6, lr, r7, lsl #1
ea8c405f	97	ldrh r6, [r2, r6]
9839d126	98	and r12,lr, r7, lsr #7
ea8c405f	99	ldrh r12,[r2, r12]
9839d126	100	orr r6, r8, r6, lsl #16
	101
	102	and r8, lr, r7, lsr #15
	103	ldrh r8, [r2, r8]
ea8c405f	104
fd34fdd0	105	subs r3, r3, #1<<24
9839d126	106	and r7, lr, r7, lsr #23
	107	orr r12,r12,r8, lsl #16
	108
	109	ldrh r8, [r2, r7]
ea8c405f	110
9839d126	111	stmia r0!, {r4,r5,r6,r12}
9839d126	112	bpl vcloop_unaligned
ea8c405f	113
9839d126	114	strh r8, [r0]
9839d126	115	mov r8, #0
499a0be3	116
9839d126	117	tst r3, #0x10000
ea8c405f	118	add r1, r1, #336 @ skip a line and 1 col
9839d126	119	addne r1, r1, #64 @ skip more for 32col mode
	120	add r0, r0, #(320+2)*2
	121	addne r0, r0, #64*2
	122	addeq r3, r3, #(320/8)<<24
	123	addne r3, r3, #(256/8)<<24
ea8c405f	124	sub r3, r3, #1
ea8c405f	125	tst r3, #0xff
9839d126	126	bne vcloop_unaligned
ea8c405f	127
9839d126	128	ldmfd sp!, {r4-r8,lr}
ea8c405f	129	bx lr
	130
	131