ARM汇编基础详解
ARM汇编基础详解
我们在进⾏嵌⼊式 Linux 开发的时候是绝对要掌握基本的 ARM 汇编,因为 Cortex-A 芯⽚⼀上电 SP 指针还没初始化,C 环境还没准备好,所以肯定不能运⾏ C 代码,必须先⽤汇编语⾔设置好 C 环境,⽐如初始化 DDR、设置 SP指针等等,当汇编把 C 环境设置好了以后才可以运⾏ C 代码。所以 Cortex-A ⼀开始肯定是汇编代码,其实 STM32 也⼀样的,⼀开始也是汇编,以 STM32F103 为例,启动⽂件
startup_stm32f10x_hd.s 就是汇编⽂件,只是这个⽂件 ST 已经写好了,我们根本不⽤去修改,所以⼤部分学习者都没有深⼊的去研究。汇编的知识很庞⼤,本章我们只讲解最常⽤的⼀些指令,满⾜我们后续学习即可、
1.GNU 汇编语法
如果⼤家使⽤过 STM32 的话就会知道 MDK 和 IAR 下的启动⽂件 startup_stm32f10x_hd.s其中的汇编语法是有所不同的,将 MDK 下的汇编⽂件直接复制到 IAR 下去编译就会出错,因为 MDK 和 IAR 的编译器不同,因此对于汇编的语法就有⼀些⼩区别。我们要编写的是ARM汇编,编译使⽤的 GCC 交叉编译器,所以我们的汇编代码要符合 GNU 语法。
GNU 汇编语法适⽤于所有的架构,并不是 ARM 独享的,GNU 汇编由⼀系列的语句组成,
每⾏⼀条语句,每条语句有三个可选部分,如下:
label:instruction @ comment
label 即标号,表⽰地址位置,有些指令前⾯可能会有标号,这样就可以通过这个标号得到
指令的地址,标号也可以⽤来表⽰数据地址。注意 label 后⾯的“:”,任何以“:”结尾的标识
符都会被识别为⼀个标号。
instruction 即指令,也就是汇编指令或伪指令
@符号,表⽰后⾯的是注释,就跟 C 语⾔⾥⾯的“/”和“/”⼀样,其实在 GNU 汇编⽂
件中我们也可以使⽤“/”和“/”来注释。
comment 就是注释内容。
⽐如如下代码:
add:
MOVS R0, #0X12        @设置 R0=0X12
上⾯代码中“add:”就是标号,“MOVS R0,#0X12”就是指令,最后的“@设置 R0=0X12”就是注释。
注意!ARM 中的指令、伪指令、伪操作、寄存器名等可以全部使⽤⼤写,也可以全部使⽤
⼩写,但是不能⼤⼩写混⽤。
⽤户可以使⽤.section 伪操作来定义⼀个段,每个段以段名开始,以下⼀段名或者⽂件结尾结束,⽐如:
.section .testsection @定义⼀个 testsetcion 段
汇编系统预定义了⼀些段名:
定义段名
.text表⽰代码段。
.data初始化的数据段。
.bss未初始化的数据段。
.rodata只读数据段。
汇编程序的默认⼊⼝标号是_start,不过我们也可以在链接脚本中使⽤ ENTRY 来指明其它的⼊⼝点,下⾯的代码就是使⽤_start 作为⼊⼝标号:
.global _start
_start:
ldr r0, =0x12 @r0=0x12
上⾯代码中.global 是伪操作,表⽰_start 是⼀个全局标号,类似 C 语⾔⾥⾯的全局变量⼀样,常见的伪操作有:伪操作含义
.byte定义单字节数据,⽐如.byte 0x12。
.short定义双字节数据,⽐如.short 0x1234。
.long定义⼀个 4 字节数据,⽐如.long 0x12345678。
.equ赋值语句,格式为:.equ 变量名,表达式,⽐如.equ num, 0x12,表⽰ num=0x12。
.align数据字节对齐,⽐如:.align 4 表⽰ 4 字节对齐。
.end表⽰源⽂件结束。
.global定义⼀个全局符号,格式为:.global symbol,⽐如:.global _start。
GNU 汇编还有其它的伪操作,但是最常见的就是上⾯这些,如果想详细的了解全部的伪操作,可以参考《ARM Cortex-A(armV7)编程⼿册 V4.0.pdf》的 57 页。
GNU 汇编同样也⽀持函数,函数格式如下
函数名:
函数体
返回语句
GNU 汇编函数返回语句不是必须的,如下代码就是⽤汇编写的 Cortex-A7 中断服务函数:
汇编函数的定义
/* 未定义中断 */
Undefined_Handler:
ldr r0, =Undefined_Handler
bx r0
/* SVC 中断 */
SVC_Handler:
ldr r0, =SVC_Handler
bx r0
/* 预取终⽌中断 */
PrefAbort_Handler:
ldr r0, =PrefAbort_Handler
bx r0
上述代码中定义了三个汇编函数:Undefined_Handler、SVC_Handler 和PrefAbort_Handler。以函数 Undefined_Handler 为例我们来看⼀下汇编函数组成,“Undefined_Handler”就是函数名,“ldr r0, =Undefined_Handler”是函数体,“bx r0”是函数返回语句,“bx”指令是返回指令,函数返回语句不是必须的。
2.Cortex-A7 常⽤汇编指令
介绍⼀些常⽤的 Cortex-A7 汇编指令,如果想系统的了解 Cortex-A7 的所有汇编指令请参考《ARM ArchitectureReference Manual ARMv7-A and ARMv7-R edition.pdf》的 A4章节。
2.1 处理器内部数据传输指令
使⽤处理器做的最多事情就是在处理器内部来回的传递数据,常见的操作有:
①、将数据从⼀个寄存器传递到另外⼀个寄存器。
②、将数据从⼀个寄存器传递到特殊寄存器,如 CPSR 和 SPSR 寄存器。
③、将⽴即数传递到寄存器。
数据传输常⽤的指令有三个:MOV、MRS 和 MSR,这三个指令的⽤法如表 7.2.1.1 所⽰:
指令⽬的源描述
MOV R0R1将 R1 ⾥⾯的数据复制到 R0 中。
MRS R0CPSR将特殊寄存器 CPSR ⾥⾯的数据复制到 R0 中。
MSR CPSR R1将 R1 ⾥⾯的数据复制到特殊寄存器 CPSR ⾥中。
分别来详细的介绍⼀下如何使⽤这三个指令:
1 、MOV 指令
MOV 指令⽤于将数据从⼀个寄存器拷贝到另外⼀个寄存器,或者将⼀个⽴即数传递到寄存器⾥⾯,使⽤⽰例如下:
MOV    R0,R1                      @将寄存器 R1 中的数据传递给 R0,即 R0=R1
MOV    R0, #0X12                  @将⽴即数 0X12 传递给 R0 寄存器,即 R0=0X12
2 、MRS 指令
MRS 指令⽤于将特殊寄存器(如 CPSR 和 SPSR)中的数据传递给通⽤寄存器,要读取特殊寄存器的数据只能使⽤ MRS 指令!使⽤⽰例如下:
MRS    R0, CPSR      @将特殊寄存器 CPSR ⾥⾯的数据传递给 R0,即 R0=CPSR
3 、MSR 指令
MSR 指令和 MRS 刚好相反,MSR 指令⽤来将普通寄存器的数据传递给特殊寄存器,也就是写特殊寄存器,写特殊寄存器只能使⽤MSR,使⽤⽰例如下:
MSR    CPSR, R0            @将 R0 中的数据复制到 CPSR 中,即 CPSR=R0
2.2 存储器访问指令
ARM 不能直接访问存储器,⽐如 RAM 中的数据,I.MX6UL 中的寄存器就是 RAM 类型的,我们⽤汇编来配置 I.MX6UL 寄存器的时候需要借助存储器访问指令,⼀般先将要配置的值写⼊到 Rx(x=0~12)寄存器中,然后借助存储器访问指令将 Rx 中的数据写⼊到 I.MX6UL 寄存器中。读取 I.MX6UL 寄存器也是⼀样的,只是过程相反。常⽤的存储器访问指令有两种:LDR 和STR,⽤法如表:
指令描述
LDR Rd, [Rn , #offset]从存储器 Rn+offset 的位置读取数据存放到 Rd 中。
STR Rd, [Rn, #offset]将 Rd 中的数据写⼊到存储器中的 Rn+offset 位置。
分别来详细的介绍⼀下如何使⽤这两个指令:
1 、LDR 指令
LDR 主要⽤于从存储加载数据到寄存器 Rx 中,LDR 也可以将⼀个⽴即数加载到寄存器 Rx中,LDR 加载⽴即数的时候要使⽤“=”,⽽不是“#”。在嵌⼊式开发中,LDR 最常⽤的就是读取 CPU 的寄存器值,⽐如 I.MX6UL 有个寄存器 GPIO1_GDIR,其地址为
0X0209C004,我们现在要读取这个寄存器中的数据,⽰例代码如下:
⽰例代码  LDR 指令使⽤
LDR  R0, =0X0209C004      @将寄存器地址 0X0209C004 加载到 R0 中,即 R0=0X0209C004
LDR  R1, [R0]            @读取地址 0X0209C004 中的数据到 R1 寄存器中
上述代码就是读取寄存器 GPIO1_GDIR 中的值,读取到的寄存器值保存在 R1 寄存器中,上⾯代码中
offset 是 0,也就是没有⽤到offset。
2 、STR 指令
LDR 是从存储器读取数据,STR 就是将数据写⼊到存储器中,同样以 I.MX6UL 寄存器GPIO1_GDIR 为例,现在我们要配置寄存器
GPIO1_GDIR 的值为 0X2000002,⽰例代码如下:
⽰例代码  STR 指令使⽤
LDR    R0, =0X0209C004    @将寄存器地址 0X0209C004 加载到 R0 中,即 R0=0X0209C004
LDR  R1, =0X20000002    @R1 保存要写⼊到寄存器的值,即 R1=0X20000002
STR  R1, [R0]        @将 R1 中的值写⼊到 R0 中所保存的地址中
LDR 和 STR 都是按照字进⾏读取和写⼊的,也就是操作的 32 位数据,如果要按照字节、半字进⾏操作的话可以在指令“LDR”后⾯加上B 或 H,⽐如按字节操作的指令就是 LDRB 和STRB,按半字操作的指令就是 LDRH 和 STRH。
2.3 压栈和出栈指令
我们通常会在 A 函数中调⽤ B 函数,当 B 函数执⾏完以后再回到 A 函数继续执⾏。要想在跳回 A 函数以后代码能够接着正常运⾏,那就必须在跳到 B 函数之前将当前处理器状态保存起来(就是保存 R0~R15 这些寄存器值),当 B 函数执⾏完成以后再⽤前⾯保存的寄存器值恢复R0~R15 即可。保存 R0~R15 寄存器的操作就叫做现场保护,恢复 R0~R15 寄存器的操作就叫做恢复现场。在进⾏现场保护的时候需要进⾏压栈(⼊栈)操作,恢复现场就要进⾏出栈操作。压栈的指令为 PUSH,出栈的指令为 POP,PUSH 和 POP 是⼀种多存储和多加载指令,即可以⼀次操作多个寄存器数据,他们利⽤当前的栈指针 SP 来⽣成地址,PUSH 和 POP 的⽤法如表所⽰:
指令描述
PUSH将寄存器列表存⼊栈中。
POP从栈中恢复寄存器列表。
假如我们现在要将 R0~R3 和 R12 这 5 个寄存器压栈,当前的 SP 指针指向 0X80000000,处理器的堆栈是向下增长的,使⽤的汇编代码如下:
PUSH  {R0~R3, R12}  @将 R0~R3 和 R12 压栈
压栈完成以后的堆栈如图所⽰:
就是分两步对 R0~R3,R2 和 LR 进⾏压栈以后的堆栈模型,如果我们要出栈的话就是使⽤如下代码:
POP  {LR}          @先恢复 LR
POP  {R0~R3,R12}  @在恢复 R0~R3,R12
出栈的就是从栈顶,也就是 SP 当前执⾏的位置开始,地址依次减⼩来提取堆栈中的数据到要恢复的寄存器列表中。PUSH 和 POP 的另外⼀种写法是“STMFD SP!”和“LDMFD SP!”,
因此上⾯的汇编代码可以改为:
STMFD  SP!,{R0~R3, R12}  @R0~R3,R12 ⼊栈
STMFD  SP!,{LR}    @LR ⼊栈
LDMFD  SP!, {LR}    @先恢复 LR
LDMFD  SP!, {R0~R3, R12}  @再恢复 R0~R3, R12
汇编语言要什么基础STMFD 可以分为两部分:STM 和 FD,同理,LDMFD 也可以分为 LDM 和 FD。看到 STM和 LDM 有没有觉得似曾相识(不是 STM32啊啊啊啊),前⾯我们讲了 LDR 和 STR,这两个是数据加载和存储指令,但是每次只能读写存储器中的⼀个数据。STM 和 LDM 就是多存储和多加载,可以连续的读写存储器中的多个连续数据。FD 是 Full Descending 的缩写,即满递减的意思。根据 ATPCS 规则,ARM 使⽤的 FD 类型的堆栈,SP 指向最后⼀个⼊栈的数值,堆栈是由⾼地址向下增长的,也就是前⾯说的向下增长的堆栈,因此最常⽤的指令就是STMFD 和 LDMFD。STM 和 LDM 的指令寄存器列表中编号⼩的对应低地址,编号⾼的对应⾼地址。
2.4 跳转指令

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。