深度学习计算机视觉实战

深度学习计算机视觉实战

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书理论与实践相结合,真正一站式搞定理论学习、算法开发到模型部署上线。

内容简介

全书内容共分为四个部分。第一部分包括第1、2章,主要讲解深度学习和计算机视觉基础,如计算机视觉领域的经典网络和常见的目标检测算法;第二部分包括第3~6章,主要讲解图像处理知识,结合应用案例,对知识点进行分析说明;第三部分包括第7~11章,主要讲解计算机视觉中的实战项目,对实现细节做了追本溯源的讲解;第四部分包括第12~13章,主要讲解模型的落地部署,该部分的讲解基于TensorFlow Lite框架,该框架受众广、热度高,且在各种平台都有对应的支持与优化加速方案,方便读者使用。

本书中的上百个知识点与50多个案例都是作者工程应用中的经验总结,适合计算机视觉的初学者、计算机视觉算法开发人员、对深度学习有兴趣的用户或者亟须工程落地使用的用户,也适合作为高校相关专业的学生教材使用。

作者简介

作者肖铃,硕士,现任南方海洋科学与工程广东省实验室工程师。2016年毕业于中国科学技术大学与中国科学院合肥物质科学研究院安徽光机所大气光学研究中心,曾就职于中兴通讯股份有限公司和珠海金山办公软件有限公司,长期从事图像处理、深度学习计算机视觉算法,以及基于TensorFlow Lite的AI模型部署研究。

章节目录

版权信息

内容简介

前言

第1章 深度学习基础

1.1 神经网络

1.1.1 感知机

1.1.2 神经网络原理

1.2 卷积神经网络

1.2.1 CNN基本操作

1.2.2 CNN原理

1.3 循环神经网络

1.3.1 RNN

1.3.2 LSTM与GRU

1.4 经典网络

1.4.1 AlexNet

1.4.2 VGG

1.4.3 GoogLeNet

1.4.4 ResNet

1.4.5 MobileNet

1.5 进阶必备:如何学习深度学习并“落地”求职

1.5.1 深度学习如何快速入门

1.5.2 深度学习行业求职技巧

第2章 计算机视觉基础

2.1 目标检测Two-stage算法

2.1.1 R-CNN算法

2.1.2 Fast R-CNN算法

2.1.3 Faster R-CNN算法

2.2 目标检测One-stage算法

2.2.1 YOLO系列算法

2.2.2 SSD算法

2.3 图像分割算法

2.3.1 FCN算法

2.3.2 U-Net算法

2.3.3 DeepLab系列算法

2.3.4 Mask R-CNN算法

2.4 进阶必备:计算机视觉方向知多少

第3章 基础图像处理

3.1 线性滤波

3.1.1 案例1:使用方框滤波

3.1.2 案例2:使用均值滤波

3.1.3 案例3:使用高斯滤波

3.2 非线性滤波

3.2.1 案例4:使用中值滤波

3.2.2 案例5:使用双边滤波

3.3 OpenCV形态学运算

3.3.1 案例6:进行膨胀操作

3.3.2 案例7:进行腐蚀操作

3.3.3 案例8:使用形态学运算

3.4 案例9:使用漫水填充

3.5 图像金字塔

3.5.1 案例10:使用高斯金字塔

3.5.2 案例11:使用拉普拉斯金字塔

3.6 阈值化

3.6.1 案例12:使用基本阈值

3.6.2 案例13:使用自适应阈值

3.7 进阶必备:选择一款合适的图像处理工具

3.7.1 OpenCV

3.7.2 MATLAB

第4章 图像变换

4.1 边缘检测

4.1.1 案例14:Sobel算法

4.1.2 案例15:Scharr算法

4.1.3 案例16:Laplacian算法

4.1.4 案例17:Canny算法

4.2 案例18:绘制轮廓

4.3 霍夫变换

4.3.1 案例19:霍夫线变换

4.3.2 案例20:霍夫圆变换

4.4 案例21:重映射

4.5 案例22:仿射变换

4.6 案例23:透视变换

4.7 直方图

4.7.1 案例24:直方图的计算与绘制

4.7.2 案例25:直方图均衡化

4.8 进阶必备:图像变换应用之文本图像矫正

4.8.1 图像变换知识总结

4.8.2 案例26:文本图像矫正

第5章 角点检测

5.1 案例27:Harris角点检测

5.2 案例28:Shi-Tomasi角点检测

5.3 案例29:亚像素级角点检测

5.4 进阶必备:角点检测知识总结

第6章 特征点检测与匹配

6.1 特征点检测

6.1.1 opencv-contrib环境安装

6.1.2 案例30:SIFT特征点检测

6.1.3 案例31:SURF特征点检测

6.2 特征匹配

6.2.1 案例32:BruteForce匹配

6.2.2 案例33:FLANN匹配

6.3 案例34:ORB特征提取

6.4 进阶必备:利用特征点拼接图像

6.4.1 特征点检测算法汇总

6.4.2 案例35:基于特征点检测与匹配的图像拼接

第7章 手写数字识别

7.1 Keras的应用

7.1.1 Keras模型

7.1.2 Keras层

7.1.3 模型编译

7.1.4 模型训练

7.2 LeNet算法

7.3 案例36:使用Keras实现手写数字识别

7.3.1 模型训练

7.3.2 手写数字识别模型推理

7.4 进阶必备:算法模型开发流程

7.4.1 数据准备

7.4.2 网络搭建

7.4.3 模型训练

第8章 CIFAR-10图像分类

8.1 图像分类数据集

8.1.1 CIFAR-10数据集和CIFAR-100数据集

8.1.2 ImageNet数据集

8.1.3 PASCAL VOC数据集

8.2 案例37:CIFAR-10图像分类

8.2.1 模型训练过程

8.2.2 模型推理

8.3 进阶必备:COCO数据集与使用HOG+SVM方法实现图像分类

8.3.1 COCO数据集

8.3.2 案例38:使用HOG+SVM方法实现图像分类

第9章 验证码识别

9.1 TensorFlow应用

9.1.1 案例39:TensorFlow的基本使用

9.1.2 TensorFlow的常用模块

9.2 案例40:验证码识别

9.2.1 生成验证码图片

9.2.2 基于TensorFlow的验证码识别

9.3 进阶必备:算法模型开发技巧

9.3.1 数据预处理技巧

9.3.2 网络搭建技巧

9.3.3 模型训练技巧

第10章 文本检测

10.1 文本检测算法

10.1.1 CTPN算法

10.1.2 EAST算法

10.2 案例41:基于EAST算法的文本检测

10.2.1 数据预处理

10.2.2 网络搭建

10.2.3 模型训练

10.2.4 文本检测验证

10.3 进阶必备:在不同场景下文本检测的应对方式

10.3.1 复杂场景文本检测

10.3.2 案例42:使用形态学运算实现简单场景文本检测

10.3.3 案例43:使用MSER+NMS实现简单场景文本检测

第11章 文本识别

11.1 文本识别算法

11.1.1 CRNN算法

11.1.2 Attention OCR算法

11.2 案例44:基于CRNN算法的文本识别

11.2.1 数据预处理

11.2.2 网络搭建

11.2.3 模型训练

11.2.4 文本识别验证

11.3 进阶必备:单字OCR

11.3.1 OCR探究

11.3.2 案例45:文本图片字符切割

第12章 TensorFlow Lite

12.1 TensorFlow Lite介绍

12.1.1 TensorFlow Lite基础

12.1.2 TensorFlow Lite源码分析

12.2 模型转换

12.2.1 FlatBuffers文件格式

12.2.2 案例46:其他格式转换为.tflite模型

12.3 模型量化

12.3.1 案例47:量化感知训练

12.3.2 案例48:训练后量化

12.4 进阶必备:模型转换与模型部署优化答疑

12.4.1 模型转换问题

12.4.2 模型部署优化

第13章 基于TensorFlow Lite的AI功能部署实战

13.1 部署流程

13.2 案例49:移动端部署

13.2.1 搭建开发环境

13.2.2 编译运行项目

13.2.3 调用过程解析

13.3 PC端部署

13.3.1 案例50:Windows平台部署

13.3.2 案例51:Linux平台部署

13.3.3 案例52:ARM平台部署

13.3.4 案例53:MIPS平台部署

13.4 进阶必备:推理框架拓展与OpenCV编译部署

13.4.1 其他深度学习推理框架

13.4.2 OpenCV编译

其 他

深度学习计算机视觉实战是2021年由电子工业出版社出版,作者刘东。

得书感谢您对《深度学习计算机视觉实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
深度学习程序设计实战 电子书
本书以Python语言和Tensorflow为工具,由浅入深地讲述了深度学习程序设计的基本原理、算法和思考问题的方法,内容包括自顶向下的程序设计、递归程序设计、面向对象的程序设计、反向传播算法、三层神经网络、卷积神经网络、循环神经网络、生成式对抗网络和目标检测等。
PaddlePaddleFluid深度学习入门与实战 电子书
本书全面讲解PaddlePaddle Fluid框架在深度学习领域的应用。
深度学习 电子书
深度学习是机器学习的一个分支,它能够使计算机通过层次概念来学习经验和理解世界。
深度学习 电子书
本书介绍了深度学习的基本概念、算法原理以及实现框架。全书共9章,分别介绍了深度学习的发展历史、神经网络与深度神经网络、卷积神经网络、循环神经网络、深度学习在目标检测和图像描述中的应用、生成对抗网络、深度迁移学习和深度强化学习等,并提供了应用实例。
深度学习与飞桨PaddlePaddle Fluid实战 电子书
飞桨PaddlePaddle是百度推出的深度学习框架,不仅支撑了百度公司的很多业务和应用,而且随着其开源过程的推进,在其他行业得到普及和应用。 本书基于2019年7月4日发布的飞桨PaddlePaddle Fluid 1.5版本(后续版本会兼容旧版本),以真实案例介绍如何应用飞桨PaddlePaddle解决主流的深度学习问题。 本书适合对人工智能感兴趣的学生、从事机器学习相关工作的读者阅读,尤其适合想要通过飞桨PaddlePaddle掌握深度学习应用技术的研究者和从业者参考。 本书包括以下内容: ● 飞桨PaddlePaddle 的核心设计思想; ● PaddlePaddle在MNIST上进行手写数字识别; ● 图像分类网络实现案例; ● “天网”中目标检测和像素级物体分割的实现; ● NLP技术应用案例 :word2vec、情感分析、语义角色标注及机器翻译; ● Paddle-Mobile与Anakin框架等高级主题; ● 飞桨PaddlePaddle与TensorFlow、Caffe框架的常用层对比。