ARM64体系结构编程与实践

ARM64体系结构编程与实践

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

编辑推荐

1.内容系统,突出动手实践基于树莓派4B开发板,系统介绍ARM64体系结构,内容由浅入深,帮助读者开发运行小型的OS2.以问题为导向,提高学习效率深入浅出的问题导向式学习方法,各大公司高频面试题,提高读者阅读兴趣3.趣味案例,常见陷阱总结基于树莓派4B开发板和QEMU实验平台,总结了众多一线工程师在实际项目中遇到的陷阱与经验,让你不再害怕踩雷4.海量资源随书赠送本书赠送配套VMware开发环境,Linux软件包,QEMU+ARM64实验平台仓库,芯片资料,实验参考代码和配套资料以及配套教学视频供读者参考学习

内容简介

本书旨在详细介绍ARM64体系结构的相关技术。本书首先介绍了ARM64体系结构的基础知识、搭建树莓派实验环境的方法,然后讲述了ARM64指令集中的加载与存储指令、算术与移位指令、比较与跳转指令以及ARM64指令集中的陷阱,接着讨论了GNU汇编器、链接程序、GCC内嵌汇编、异常处理、中断处理、GIC中断控制器,最后剖析了内存管理、高速缓存基础知识、缓存一致性、TLB管理、内存屏障、高速缓存、原子操作、操作系统等内容。

作者简介

奔跑吧Linux社区 由一群志同道合的工程师组成,致力于Linux等开源软件与推广,为广大工程师和读者提供深入的开源知识分享。

章节目录

目 录





第 1章 ARM64体系结构基础知识 1


1.1 ARM介绍 1


1.2 ARMv8体系结构基础知识 2


1.2.1 ARMv8体系结构 2


1.2.2 采用ARMv8体系结构的常见处理器内核 3


1.2.3 ARMv8体系结构中的基本概念 3


1.2.4 A64指令集 4


1.2.5 ARMv8处理器执行状态 4


1.2.6 ARMv8支持的数据宽度 5


1.3 ARMv8寄存器 5


1.3.1 通用寄存器 5


1.3.2 处理器状态 6


1.3.3 特殊寄存器 7


1.3.4 系统寄存器 10


1.4 Cortex-A72处理器介绍 10


1.5 ARMv9体系结构介绍 13


第 2章 搭建树莓派实验环境 14


2.1 树莓派介绍 14


2.2 搭建树莓派实验环境 15


2.2.1 配置串口线 16


2.2.2 安装树莓派官方OS 18


2.2.3 实验2-1:输出“Welcome BenOS!” 19


2.2.4 实验2-2:使用GDB与QEMU虚拟机调试BenOS 20


2.2.5 实验2-3:使用J-Link EDU仿真器调试树莓派 21


2.3 BenOS基础实验代码解析 27


2.4 QEMU虚拟机与ARM64实验平台 32


第3章 A64指令集1——加载与存储指令 35


3.1 A64指令集介绍 36


3.2 A64指令编码格式 37


3.3 加载与存储指令 38


3.3.1 基于基地址的寻址模式 39


3.3.2 变基模式 41


3.3.3 PC相对地址模式 42


3.3.4 LDR伪指令 43


3.4 加载与存储指令的变种 44


3.4.1 不同位宽的加载与存储指令 44


3.4.2 不可扩展的加载和存储指令 45


3.4.3 多字节内存加载和存储指令 46


3.4.4 独占内存访问指令 48


3.4.5 隐含加载-获取/存储-释放


内存屏障原语 48


3.4.6 非特权访问级别的加载和存储指令 48


3.5 入栈与出栈 49


3.6 MOV指令 51


3.7 陷阱:你用对加载与存储指令了吗 52


3.8 实验 53


3.8.1 实验3-1:熟悉MOV和LDR指令 53


3.8.2 实验3-2:前变基与后变基寻址模式1 53


3.8.3 实验3-3:前变基与后变基寻址模式2 54


3.8.4 实验3-4:PC相对地址寻址 54


3.8.5 实验3-5:memcpy()函数的实现 54


3.8.6 实验3-6:LDP和STP指令的使用 55


第4章 A64指令集2——算术与移位指令 56


4.1 条件操作码 57


4.2 加法与减法指令 57


4.2.1 ADD指令 58


4.2.2 ADDS指令 60


4.2.3 ADC指令 61


4.2.4 SUB指令 61


4.2.5 SUBS指令 64


4.2.6 SBC指令 64


4.3 CMP指令 65


4.4 关于条件标志位的示例 67


4.5 移位指令 68


4.6 位操作指令 68


4.6.1 与操作指令 68


4.6.2 或操作指令 69


4.6.3 位清除操作指令 71


4.6.4 CLZ指令 71


4.7 位段操作指令 71


4.7.1 位段插入操作指令 71


4.7.2 位段提取操作指令 72


4.8 实验 73


4.8.1 实验4-1:测试ADDS和CMP指令的C标志位 73


4.8.2 实验4-2:条件标志位的使用 74


4.8.3 实验4-3:测试ANDS指令以及Z标志位 74


4.8.4 实验4-4:测试位段操作指令 74


4.8.5 实验4-5:使用位段指令来读取寄存器 74


第5章 A64指令集3——比较指令与跳转指令 76


5.1 比较指令 76


5.1.1 CMN指令 76


5.1.2 CSEL指令 77


5.1.3 CSET指令 78


5.1.4 CSINC指令 78


5.2 跳转与返回指令 79


5.2.1 跳转指令 79


5.2.2 返回指令 80


5.2.3 比较并跳转指令 80


5.3 陷阱:为什么在RET指令之后系统就崩溃了 80


5.4 实验 82


5.4.1 实验5-1:CMP和CMN指令 82


5.4.2 实验5-2:条件选择指令 82


5.4.3 实验5-3:子函数跳转 82


第6章 A64指令集4——其他重要指令 83


6.1 PC相对地址加载指令 83


6.2 LDR和ADRP指令的区别 85


6.3 内存独占访问指令 85


6.4 异常处理指令 86


6.5 系统寄存器访问指令 87


6.6 内存屏障指令 88


6.7 实验 88


6.7.1 实验6-1:测试ADRP和LDR伪指令 88


6.7.2 实验6-2:ADRP和LDR伪指令的陷阱 89


6.7.3 实验6-3:LDXR和STXR指令的使用1 90


6.7.4 实验6-4:LDXR和STXR指令的使用2 90


第7章 A64指令集的陷阱 91


7.1 案例7-1:加载宏标签 91


7.2 案例7-2:加载字符串 92


7.3 案例7-3:读写寄存器导致树莓派4B死机 93


7.4 案例7-4:LDXR指令导致树莓派4B死机 94


7.5 汇编大作业7-1:在汇编中实现串口输出功能 95


7.6 汇编大作业7-2:分析Linux 5.0的启动汇编代码 95


第8章 GNU汇编器 96


8.1 编译流程与ELF文件 97


8.2 一个简单的汇编程序 99


8.3 汇编语法 102


8.3.1 注释 102


8.3.2 符号 102


8.4 常用的伪指令 103


8.4.1 对齐伪指令 103


8.4.2 数据定义伪指令 103


8.4.3 与函数相关的伪指令 104


8.4.4 与段相关的伪指令 105


8.4.5 与宏相关的伪指令 106


8.5 AArch64依赖特性 108


8.5.1 AArch64特有的命令行选项 108


8.5.2 语法 108


8.5.3 AArch64特有的伪指令 109


8.5.4 LDR伪指令 109


8.6 实验 110


8.6.1 实验8-1:汇编语言练习——求最大数 110


8.6.2 实验8-2:汇编语言练习——通过C语言调用汇编函数 110


8.6.3 实验8-3:汇编语言练习——通过汇编语言调用C函数 110


8.6.4 实验8-4:使用汇编伪操作来实现一张表 110


8.6.5 实验8-5:汇编宏的使用 111


第9章 链接器与链接脚本 112


9.1 链接器介绍 112


9.2 链接脚本 114


9.2.1 一个简单的链接程序 114


9.2.2 设置入口点 115


9.2.3 基本概念 115


9.2.4 符号赋值与引用 115


9.2.5 当前位置计数器 117


9.2.6 SECTIONS命令 117


9.2.7 常用的内建函数 120


9.3 重定位 121


9.3.1 BenOS重定位 121


9.3.2 UBoot和Linux内核重定位 124


9.4 实验 126


9.4.1 实验9-1:分析链接脚本文件 126


9.4.2 实验9-2:输出每个段的内存布局 127


9.4.3 实验9-3:加载地址不等于运行地址 127


9.4.4 实验9-4:分析Linux 5.0内核的链接脚本文件 127


第 10章 GCC内嵌汇编代码 128


10.1 内嵌汇编代码基本用法 128


10.1.1 基础内嵌汇编代码 128


10.1.2 扩展内嵌汇编代码 128


10.1.3 内嵌汇编代码的修饰符和约束符 130


10.1.4 使用汇编符号名 132


10.1.5 内嵌汇编函数与宏的结合 133


10.1.6 使用goto修饰词 133


10.2 案例分析 134


10.3 实验 138


10.3.1 实验10-1:实现简单的memcpy 函数 138


10.3.2 实验10-2:使用汇编符号名编写内嵌汇编代码 138


10.3.3 实验10-3:使用内嵌汇编代码完善__memset_16bytes 汇编函数 138


10.3.4 实验10-4:使用内嵌汇编代码与宏 138


10.3.5 实验10-5:实现读和写系统寄存器的宏 139


10.3.6 实验10-6:goto模板的内嵌汇编函数 139


第 11章 异常处理 140


11.1 异常处理的基本概念 140


11.1.1 异常类型 140


11.1.2 异常等级 141


11.1.3 同步异常和异步异常 141


11.2 异常处理与返回 142


11.2.1 异常入口 142


11.2.2 异常返回 142


11.2.3 异常返回地址 143


11.2.4 异常处理路由 143


11.2.5 栈的选择 145


11.2.6 异常处理的执行状态 145


11.2.7 异常返回的执行状态 146


11.3 异常向量表 146


11.3.1 ARMv8异常向量表 146


11.3.2 Linux 5.0内核的异常向量表 147


11.3.3 VBAR_ELx 148


11.4 异常现场 149


11.5 同步异常的解析 149


11.5.1 异常类型 150


11.5.2 数据异常 151


11.6 案例分析 153


11.6.1 从EL2切换到EL1 153


11.6.2 指令不对齐的同步异常处理 154


11.7 实验 156


11.7.1 实验11-1:切换到EL1 156


11.7.2 实验11-2:建立异常向量表 157


11.7.3 实验11-3:寻找树莓派4B上触发异常的指令 157


11.7.4 实验11-4:解析数据异常的信息 158


第 12章 中断处理 159


12.1 中断处理背景知识 159


12.1.1 中断引脚 159


12.1.2 中断控制器 159


12.1.3 中断处理过程 160


12.2 树莓派4B上的传统中断控制器 160


12.3 ARM内核上的通用定时器 163


12.4 中断现场 165


12.4.1 保存中断现场 165


12.4.2 恢复中断现场 165


12.5 案例分析:在树莓派4B上实现 一个定时器 166


12.5.1 中断现场的保存 166


12.5.2 修改异常向量表 169


12.5.3 通用定时器初始化 170


12.5.4 IRQ处理 170


12.5.5 打开本地中断 171


12.6 实验 172


12.6.1 实验12-1:在树莓派4B上 实现通用定时器中断 172


12.6.2 实验12-2:使用汇编函数保存和恢复中断现场 173


第 13章 GIC-V2 174


13.1 GIC发展历史 174


13.2 中断状态、中断触发方式和 硬件中断号 175


13.3 GIC-V2 175


13.3.1 GIC-V2概要 175


13.3.2 GIC-V2内部结构 176


13.3.3 中断流程 176


13.3.4 GIC-V2寄存器 178


13.3.5 中断路由 179


13.4 树莓派4B上的GIC-400 180


13.4.1 中断号分配 180


13.4.2 访问GIC-400寄存器 181


13.4.3 中断处理流程 181


13.5 实验 182


13.5.1 实验13-1:实现通用定时器中断 182


13.5.2 实验13-2:实现树莓派4B上的系统定时器 183


第 14章 内存管理 184


14.1 内存管理基础知识 184


14.1.1 内存管理的“远古时代” 184


14.1.2 地址空间的抽象 186


14.1.3 分段机制 187


14.1.4 分页机制 187


14.2 ARM64内存管理 190


14.2.1 页表 192


14.2.2 页表映射 192


14.2.3 页面粒度 194


14.2.4 两套页表 195


14.2.5 页表项描述符 196


14.2.6 页表属性 198


14.2.7 连续块表项 201


14.3 硬件管理访问位和脏位 201


14.3.1 访问位的硬件管理机制 201


14.3.2 脏位的硬件管理机制 201


14.4 与地址转换相关的控制寄存器 202


14.4.1 TCR 202


14.4.2 SCTLR 204


14.4.3 TTBR 204


14.5 内存属性 204


14.5.1 普通类型内存 204


14.5.2 设备类型内存 204


14.6 案例分析:在BenOS里实现恒等映射 207


14.6.1 页表定义 208


14.6.2 页表数据结构 211


14.6.3 创建页表 211


14.6.4 打开MMU 217


14.6.5 测试MMU 218


14.7 实验 220


14.7.1 实验14-1:建立恒等映射 220


14.7.2 实验14-2:为什么MMU 无法运行 220


14.7.3 实验14-3:实现一个 MMU页表的转储功能 220


14.7.4 实验14-4:修改页面属性导致的系统死机 221


14.7.5 实验14-5:使用汇编语言来建立恒等映射和打开MMU 222


14.7.6 实验14-6:验证LDXR和 STXR指令 222


14.7.7 实验14-7:AT指令 223


第 15章 高速缓存基础知识 224


15.1 为什么需要高速缓存 224


15.2 高速缓存的访问延时 225


15.3 高速缓存的工作原理 227


15.4 高速缓存的映射方式 229


15.4.1 直接映射 229


15.4.2 全相连映射 230


15.4.3 组相连映射 230


15.4.4 组相连的高速缓存的例子 231


15.5 虚拟高速缓存与物理高速缓存 232


15.5.1 物理高速缓存 232


15.5.2 虚拟高速缓存 232


15.5.3 VIPT和PIPT 232


15.6 重名和同名问题 233


15.6.1 重名问题 233


15.6.2 同名问题 234


15.6.3 VIPT产生的重名问题 235


15.7 高速缓存策略 236


15.8 高速缓存的共享属性 238


15.8.1 共享属性 238


15.8.2 PoU和PoC的区别 239


15.9 高速缓存的维护指令 241


15.10 高速缓存枚举 242


15.11 实验 245


15.11.1 实验15-1:枚举高速缓存 245


15.11.2 实验15-2:清理高速缓存 245


第 16章 缓存一致性 246


16.1 为什么需要缓存一致性 246


16.2 缓存一致性的分类 247


16.2.1 ARM处理器缓存一致性发展历程 247


16.2.2 缓存一致性分类 248


16.2.3 系统缓存一致性问题 249


16.3 缓存一致性的解决方案 250


16.3.1 关闭高速缓存 250


16.3.2 软件维护缓存一致性 250


16.3.3 硬件维护缓存一致性 250


16.4 MESI协议 251


16.4.1 MESI协议简介 252


16.4.2 本地读写与总线操作 252


16.4.3 MESI状态转换图 253


16.4.4 初始状态为I 253


16.4.5 初始状态为M 256


16.4.6 初始状态为S 257


16.4.7 初始状态为E 258


16.4.8 总结与案例分析 258


16.4.9 MOESI协议 260


16.5 高速缓存伪共享 261


16.6 CCI和CCN缓存一致性控制器 262


16.6.1 CCI缓存一致性控制器 262


16.6.2 CCN缓存一致性控制器 263


16.7 案例分析16-1:伪共享的避免 264


16.8 案例分析16-2:DMA和 高速缓存的一致性 265


16.8.1 从内存到设备的 FIFO缓冲区 266


16.8.2 从设备的FIFO缓冲区到 内存 266


16.9 案例分析16-3:自修改代码的 一致性 267


16.10 实验 268


16.10.1 实验16-1:高速缓存伪共享 268


16.10.2 实验16-2:使用Perf C2C 发现高速缓存伪共享 268


第 17章 TLB管理 269


17.1 TLB基础知识 270


17.2 TLB重名与同名问题 273


17.2.1 重名问题 273


17.2.2 同名问题 274


17.3 ASID 274


17.4 TLB管理指令 276


17.4.1 TLB维护指令介绍 277


17.4.2 TLB广播 278


17.4.3 TLB维护指令的执行次序 278


17.5 TLB案例分析 278


17.5.1 TLB在Linux内核中的应用 278


17.5.2 ASID在Linux内核中的应用 281


17.5.3 Linux内核中的TLB 维护操作 282


17.5.4 BBM机制 284


第 18章 内存屏障指令 287


18.1 内存屏障指令产生的原因 287


18.1.1 顺序一致性内存模型 288


18.1.2 处理器一致性内存模型 289


18.1.3 弱一致性内存模型 289


18.1.4 ARM64处理器的内存模型 290


18.2 ARM64中的内存屏障指令 290


18.2.1 使用内存屏障指令的场景 290


18.2.2 ARM64里的内存屏障指令 291


18.2.3 DMB指令 291


18.2.4 DSB指令 293


18.2.5 DMB和DSB指令的参数 294


18.2.6 单方向内存屏障原语 294


18.2.7 ISB指令 297


18.2.8 高速缓存维护指令与内存屏障指令 299


18.3 案例分析 300


18.3.1 消息传递问题 301


18.3.2 单方向内存屏障与自旋锁 302


18.3.3 邮箱传递消息 304


18.3.4 与数据高速缓存相关的案例 305


18.3.5 与指令高速缓存相关的案例 307


18.3.6 与TLB相关的案例 309


18.3.7 DMA案例 310


18.3.8 Linux内核中使指令高速缓存失效 310


第 19章 合理使用内存屏障指令 312


19.1 存储缓冲区与写内存屏障指令 313


19.2 无效队列与读内存屏障指令 318


19.3 内存屏障指令总结 321


19.4 ARM64的内存屏障指令的区别 322


19.5 案例分析:Linux内核中的内存屏障指令 323


19.5.1 第 一次使用内存屏障指令 324


19.5.2 第二次使用内存屏障指令 326


19.5.3 第三次使用内存屏障指令 329


19.5.4 第四次使用内存屏障指令 330


19.5.5 总结:内存屏障指令的使用 331


第 20章 原子操作 332


20.1 原子操作介绍 332


20.2 独占内存访问指令 333


20.3 独占内存访问工作原理 334


20.3.1 独占监视器 334


20.3.2 独占监视器与缓存一致性 336


20.3.3 独占监视器的粒度 338


20.4 原子内存访问操作指令 338


20.5 比较并交换指令 341


20.6 WFE指令在自旋锁中的应用 342


第 21章 操作系统相关话题 344


21.1 C语言常见陷阱 344


21.1.1 数据模型 344


21.1.2 数据类型转换与整型提升 346


21.1.3 移位操作 348


21.2 函数调用标准 349


21.3 栈布局 351


21.4 创建进程 352


21.4.1 进程控制块 352


21.4.2 0号进程 353


21.4.3 do_fork函数的实现 354


21.4.4 进程上下文切换 355


21.4.5 新进程的第 一次执行 357


21.5 简易进程调度器 357


21.5.1 扩展进程控制块 358


21.5.2 就绪队列run_queue 358


21.5.3 调度队列类 358


21.5.4 简易调度器的实现 360


21.5.5 自愿调度 360


21.5.6 抢占调度 362


21.5.7 测试用例 363


21.6 系统调用 364


21.6.1 系统调用介绍 364


21.6.2 用户态调用SVC指令 364


21.6.3 内核态对系统调用的处理 365


21.6.4 系统调用表 366


21.7 系统启动 367


21.8 实验 368


21.8.1 实验21-1:观察栈布局 368


21.8.2 实验21-2:进程创建 369


21.8.3 实验21-3:进程调度 369


21.8.4 实验21-4:新增一个 malloc()系统调用 369


21.8.5 实验21-5:新增一个clone() 系统调用 370


第 22章 浮点运算与NEON指令 371


22.1 数据模型 371


22.2 浮点运算 373


22.2.1 浮点数 373


22.2.2 浮点控制寄存器与浮点状态寄存器 375


22.2.3 浮点数的条件操作码 377


22.2.4 常用浮点运算指令 377


22.3 NEON指令集 378


22.3.1 SISD和SIMD 378


22.3.2 矢量运算与标量运算 379


22.3.3 加载与存储指令LD1与 ST1 380


22.3.4 加载与存储指令LD2和 ST2 382


22.3.5 加载与存储指令LD3和 ST3 383


22.3.6 加载与存储指令LD4和 ST4 385


22.3.7 加载指令的特殊用法 385


22.3.8 搬移指令 386


22.3.9 反转指令 388


22.3.10 提取指令 389


22.3.11 交错变换指令 390


22.3.12 查表指令 391


22.3.13 乘加指令 391


22.3.14 矢量算术指令 393


22.4 案例分析22-1:RGB24转BGR24 …..393


22.4.1 使用C语言实现RGB24转 BGR24 394


22.4.2 手工编写NEON汇编函数 394


22.4.3 使用NEON内建函数 395


22.4.4 测试 395


22.5 案例分析22-2:4×4矩阵乘法运算 397


22.5.1 使用C语言实现4×4矩阵乘法运算 397


22.5.2 手工编写NEON汇编函数 398


22.5.3 使用NEON内建函数 401


22.5.4 测试 403


22.6 自动矢量优化 404


22.7 实验 406


22.7.1 实验22-1:浮点运算 406


22.7.2 实验22-2:RGB24转BGR32…… 407


22.7.3 实验22-3:8×8矩阵乘法 运算….. 407


第 23章 可伸缩矢量计算与优化 408


23.1 SVE指令介绍 408


23.1.1 SVE寄存器组 408


23.1.2 SVE指令语法 410


23.2 搭建SVE运行和调试环境 410


23.3 SVE特有的编程模式 412


23.3.1 断言指令 412


23.3.2 聚合加载和离散存储 414


23.3.3 基于断言的循环控制 415


23.3.4 基于软件推测的向量分区 421


23.4 SVE与SVE2指令集 422


23.5 案例分析23-1:使用SVE指令优化strcmp()函数 422


23.5.1 使用纯汇编方式 423


23.5.2 测试 425


23.6 案例分析23-2:RGB24转BGR24 ….425


23.6.1 使用纯汇编方式 426


23.6.2 使用内嵌汇编方式 426


23.6.3 测试 427


23.7 案例分析23-3:4×4矩阵乘法运算 428


23.7.1 使用内嵌汇编方式 428


23.7.2 测试 430


23.8 实验 431


23.8.1 实验23-1:RGB24转BGR32 431


23.8.2 实验23-2:8×8矩阵乘法运算 432


23.8.3 实验23-3:使用SVE指令优化strcpy()函数 432

ARM64体系结构编程与实践是2022年由人民邮电出版社出版,作者奔跑吧Linux社区。

得书感谢您对《ARM64体系结构编程与实践》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
PythonQtGUI与数据可视化编程 电子书
Python PyQt5编写GUI应用程序及数据可视化方法
数控编程与操作(第2版) 电子书
本书以数控车床、数控铣床(加工中心)、数控电火花线切割的编程与操作为核心,以FANUC数控系统和华中数控系统为主,按照学习与教学的规律,深入浅出地详细介绍数控加工工艺、数控车削与铣削的编程、数控电火花线切割的编程、数控机床的操作以及典型零件的应用实例等内容。所有零件加工程序语句都附有详细、清晰的注释说明。各章后设有习题,便于学生更好地掌握所学内容;书的**后附有FANUC和华中世纪之星数控车削指令
HBase入门与实践 电子书
大数据时代快速上手HBase行动指南。
Flink原理与实践 电子书
本书围绕大数据流处理领域,介绍FlinkDataStreamAPI、时间和窗口、状态和检查点、TableAPI&SQL等知识。书中以实践为导向,使用大量真实业务场景案例来演示如何基于Flink进行流处理。
Kafka入门与实践 电子书
本书适合应用Kafka的专业技术人员阅读,包括但不限于大数据相关应用的开发者、运维者和爱好者。