AI嵌入式系统:算法优化与实现

AI嵌入式系统:算法优化与实现

站内搜索
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

嵌入式系统高效嵌入智能的必读参考书。

内容简介

本书介绍嵌入式系统中的机器学习算法优化原理、设计方法及其实现技术。内容涵盖通用嵌入式优化技术,包括基于SIMD指令集的优化、内存访问模式优化、参数量化等,并在此基础上介绍了信号处理层面的优化、AI推理算法优化及基于神经网络的AI算法训练—推理联合的优化理论与方法。

其中信号处理层面优化介绍了基于线性代数的快速近似算法、基于多项式的快速卷积构造技术、基于数据二进制结构的快速乘法算法等;在AI推理层面,介绍了机器学习推理模型共性结构、运算图中各个算子的计算优化途径;对基于神经网络的AI算法,阐述了如何将推理阶段的运算量约束以及底层数据量化约束加入训练代价函数,从算法训练端减少运算量以提升AI嵌入式系统的运行效率。

此外,本书还通过多个自动搜索优化参数并生成C代码的例子介绍了通用的嵌入式环境下机器学习算法自动优化和部署工具开发的基本知识,通过应用示例和大量代码说明了AI算法在通用嵌入式系统中的实现方法,力求让读者在理解算法的基础上,通过实践掌握高效的AI嵌入式系统开发的知识与技能。

作者简介

应忍冬

上海交通大学电子信息与电气工程学院副教授,硕士生导师。长期从事嵌入式系统和数字电路教学与科研工作。主要研究领域包括数字信号处理VLSI架构、3D视觉信号处理、类脑智能算法及嵌入式实现技术等。主持或参加过多项国家重点科研项目,在数字信号处理理论和工程实现方面拥有丰富经验。


刘佩林

上海交通大学电子信息与电气工程学院教授,博士生导师。研究领域包括音频、视频、3D信号处理与智能分析,面向机器人的环境感知、人机交互、定位与导航,以及类脑计算与低功耗电路设计等。2017年起任上海交通大学类脑智能应用技术研究中心主任。


章节目录

版权信息

作者简介

前言

第1章 绪论

1.1 AI嵌入式系统的概念与特点

1.2 机器学习在嵌入式系统中的实现

1.3 本书内容概述

第2章 嵌入式软件编程模式和优化

2.1 嵌入式软件编程模式

2.1.1 基于周期调用的运行模式

2.1.2 基于中断的前后台运行模式

2.1.3 基于事件队列的运行模式

2.1.4 带时间信息的事件队列运行模式

2.1.5 计算图运行模式

2.2 通用软件优化方法

2.2.1 循环结构优化

2.2.2 时间空间平衡

2.2.3 运算精度和性能平衡

2.2.4 底层运算的快速实现算法

2.2.5 内存使用优化

2.3 小结

参考文献

第3章 机器学习算法概述

3.1 高斯朴素贝叶斯分类器

3.1.1 原理概述

3.1.2 模型训练和推理

3.2 感知器

3.2.1 原理概述

3.2.2 模型训练和推理

3.3 SVM分类器

3.3.1 原理概述

3.3.2 模型训练和推理

3.4 决策树

3.4.1 原理概述

3.4.2 模型训练和推理

3.4.3 决策树分类器的代码实现

3.5 线性数据降维

3.5.1 原理概述

3.5.2 模型训练和推理

3.6 神经网络

3.6.1 原理概述

3.6.2 模型训练和推理

3.7 小结

参考文献

第4章 数值的表示和运算

4.1 浮点数

4.1.1 单精度和双精度浮点数

4.1.2 16位浮点数

4.2 定点数

4.2.1 定点数的二进制表示形式

4.2.2 定点数的运算

4.2.3 给定算法的定点化方法

4.3 仿射映射量化

4.3.1 量化数据表示

4.3.2 量化数据运算

4.3.3 基于量化数据的矩阵运算

4.4 常数整数乘法优化

4.4.1 基于正则有符号数的常数整数乘法优化

4.4.2 基于运算图的常数整数乘法优化

4.4.3 多常数整数乘法优化

4.4.4 浮点数和整数常数乘法优化

4.4.5 常数整数乘法优化的应用

4.5 小结

参考文献

第5章 卷积运算优化

5.1 卷积运算的定义

5.1.1 一维线性卷积

5.1.2 一维循环卷积

5.1.3 二维线性卷积

5.1.4 二维循环卷积

5.2 快速卷积算法

5.2.1 一维循环卷积频域快速算法

5.2.2 短序列一维线性卷积快速算法

5.2.3 长序列一维线性卷积的构建

5.2.4 快速FIR滤波器算法

5.2.5 二维快速卷积算法

5.3 近似卷积算法

5.3.1 基于卷积核低秩分解的二维快速卷积

5.3.2 矩形卷积核近似卷积

5.3.3 分段线性卷积核近似

5.3.4 卷积核的分段近似

5.3.5 基于IIR滤波器的近似卷积

5.3.6 基于卷积核低秩近似的二维近似快速卷积

5.3.7 基于二维矩形卷积核的近似快速卷积

5.4 小结

参考文献

第6章 矩阵乘法优化

6.1 机器学习算法中的矩阵乘法

6.2 Strassen矩阵相乘算法

6.3 Winograd矩阵相乘算法

6.4 低秩矩阵乘法

6.5 循环矩阵乘法

6.6 近似矩阵乘法

6.6.1 基于矩阵低秩近似的矩阵乘法

6.6.2 基于数据统计相关性的近似矩阵乘法

6.6.3 基于向量量化的近似矩阵乘法

6.7 小结

参考文献

第7章 神经网络的实现与优化

7.1 神经网络基本运算及软件实现

7.1.1 全连接层运算

7.1.2 卷积层运算

7.1.3 BN层运算

7.1.4 激活层运算

7.1.5 池化层运算

7.1.6 神经网络示例

7.2 神经网络的权重系数优化

7.2.1 权重系数二值化

7.2.2 权重系数的定点数量化

7.2.3 权重系数量化和神经网络训练结合

7.3 神经网络结构优化

7.3.1 剪枝优化

7.3.2 卷积结构优化

7.3.3 知识蒸馏

7.4 小结

参考文献

第8章 ARM平台上的机器学习编程

8.1 CMSIS软件框架概述

8.2 CMSIS-DSP软件框架和编程

8.2.1 矩阵运算

8.2.2 高斯朴素贝叶斯算法实现

8.2.3 SVM算法实现

8.2.4 数据降维

8.3 基于CMSIS-NN的神经网络编程

8.3.1 基于卷积神经网络的手写数字识别算法

8.3.2 CMSIS-NN的卷积神经网络实现

8.3.3 卷积神经网络的定点化

8.3.4 数据存储和格式转换

8.4 ARM Compute Library软件框架和编程

8.4.1 基于ACL库的图像处理编程

8.4.2 基于ACL库的神经网络编程

8.5 ARM NN软件框架和编程

8.5.1 基于ARM NN运行神经网络模型

8.5.2 基于ONNX格式的机器学习模型构建

8.6 ARM的SIMD指令编程

8.6.1 NEON编程的基本概念和数据寄存器

8.6.2 基于C语言的NEON编程

8.7 小结

附录A 补充数据和列表

附录B 技术术语表

AI嵌入式系统:算法优化与实现是2021年由机械工业出版社出版,作者应忍冬,刘佩林。

得书感谢您对《AI嵌入式系统:算法优化与实现》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
基于STM32的嵌入式系统应用 电子书
本书介绍了意法半导体公司出品的基于ArmCortex-M3内核的STM32F103微控制器在工程实践中的应用。全书分为基础篇和应用篇。基础篇介绍了嵌入式系统的基本概念、实训使用的软硬件平台、STM32的标准外设库、嵌入式C语言编程的特点、STM32系统时钟、彩色LCD显示基础、字符编码和显示字库等内容;应用篇依托STM32微控制器的主要外设、常用外围器件以及典型应用等设计了11个实训项目。本书适合
嵌入式系统设计大学教程(第2版) 电子书
本书以嵌入式系统开发为主线,以Linux操作系统为软件平台,系统介绍了嵌入式系统开发的基本知识、基本流程和基本方法。全书共分9章,分别对嵌入式系统基础知识、嵌入式硬件开发技术、嵌入式系统软件程序设计内容进行详细介绍,并附以一个完整的嵌入式系统设计案例。本书内容丰富,结构合理,概念清晰,既可作为高等院校计算机及相关专业嵌入式课程的教材,也可供工程技术人员自学参考。
龙芯嵌入式系统软硬件平台设计 电子书
嵌入式系统平台设计核心指南。
动力电池管理系统核心算法 电子书
本书可作为相关领域技术人员的参考用书,也可以作为汽车专业的高年级本科生和研究生的专业课教科书。
差分进化算法及其高维多目标优化应用 电子书
本书从群智能优化算法和高维多目标优化两方面入手,一方面系统地介绍了差分进化算法的基本原理及国内外研究现状,通过分析算法的模型、关键步骤及参数设置,设计和构建了高性能的改进算法,并将其应用于医学图像处理、电子商务等实际工程领域;另一方面,深入分析了高维多目标优化算法的基本原理、国内外研究现状及关键技术难点,详细描述了基于差分进化算法的高维多目标优化算法设计、构建与实验分析,以及其在智能交通系统中的实