编辑推荐
全面系统地阐述现代计算机视觉实用技术、方法和实践,涵盖50多个计算机视觉问题。
内容简介
全书分为四部分:第一部分(第1~3章)介绍神经网络和PyTorch的基础知识,以及如何使用PyTorch构建并训练神经网络,包括输入数据缩放、批归一化、超参数调整等;
第二部分(第4~10章)介绍如何使用卷积神经网络、迁移学习等技术解决更复杂的视觉相关问题,包括图像分类、目标检测和图像分割等;
第三部分(第11~13章)介绍各种图像处理技术,包括自编码器模型和各种类型的GAN模型;
第四部分(第14~18章)探讨将计算机视觉技术与NLP、强化学习和OpenCV等技术相结合来解决传统问题的新方法。
章节目录
版权信息
译者序
前言
第一部分 面向计算机视觉的深度学习基础知识
第1章 人工神经网络基础
1.1 比较人工智能与传统机器学习
1.2 人工神经网络的构建模块
1.3 实现前向传播
1.4 实现反向传播
1.5 整合前向传播与反向传播
1.6 理解学习率的影响
1.7 总结神经网络的训练过程
1.8 小结
1.9 课后习题
第2章 PyTorch基础
2.1 安装PyTorch
2.2 PyTorch张量
2.3 使用PyTorch构建神经网络
2.4 使用序贯方法构建神经网络
2.5 保存并加载PyTorch模型
2.6 小结
2.7 课后习题
第3章 使用PyTorch构建深度神经网络
3.1 表示图像
3.2 为什么要使用神经网络进行图像分析
3.3 为图像分类准备数据
3.4 训练神经网络
3.5 缩放数据集以提升模型准确度
3.6 理解不同批大小的影响
3.7 理解不同损失优化器的影响
3.8 理解不同学习率的影响
3.9 理解不同学习率衰减的影响
3.10 构建更深的神经网络
3.11 理解不同批归一化的影响
3.12 过拟合的概念
3.13 小结
3.14 课后习题
第二部分 物体分类与目标检测
第4章 卷积神经网络
4.1 传统深度神经网络的问题
4.2 CNN的构建模块
4.3 实现CNN
4.4 使用深度CNN分类图像
4.5 实现数据增强
4.6 特征学习结果的可视化
4.7 构建对真实图像进行分类的CNN
4.8 小结
4.9 课后习题
第5章 面向图像分类的迁移学习
5.1 迁移学习简介
5.2 理解VGG16架构
5.3 理解ResNet架构
5.4 实现人脸关键点检测
5.5 多任务学习——实现年龄估计和性别分类
5.6 torch_snippets库简介
5.7 小结
5.8 课后习题
第6章 图像分类的实战技术
6.1 生成CAM
6.2 数据增强和批归一化
6.3 模型实现的实践要点
6.4 小结
6.5 课后习题
第7章 目标检测基础
7.1 目标检测简介
7.2 为训练图像样本创建真值
7.3 理解区域建议
7.4 理解IoU
7.5 非极大抑制
7.6 mAP
7.7 训练基于R-CNN的定制目标检测器
7.8 训练基于Fast R-CNN的定制目标检测器
7.9 小结
7.10 课后习题
第8章 目标检测进阶
8.1 现代目标检测算法的组成
8.2 基于定制数据集训练Faster R-CNN
8.3 YOLO的工作细节
8.4 基于定制数据集训练YOLO
8.5 SSD模型的工作细节
8.6 基于定制数据集训练SSD模型
8.7 小结
8.8 课后习题
第9章 图像分割
9.1 探索U-Net架构
9.2 使用U-Net实现语义分割
9.3 探索Mask R-CNN架构
9.4 使用Mask R-CNN实现实例分割
9.5 小结
9.6 课后习题
第10章 目标检测与分割的应用
10.1 多目标实例分割
10.2 人体姿态检测
10.3 人群计数
10.4 图像着色
10.5 面向点云的三维目标检测
10.6 小结
第三部分 图像处理
第11章 自编码器与图像处理
11.1 理解自编码器
11.2 理解卷积自编码器
11.3 理解变分自编码器
11.4 图像对抗性攻击
11.5 图像风格迁移
11.6 生成深度虚拟图像
11.7 小结
11.8 课后习题
第12章 基于GAN的图像生成
12.1 GAN模型简介
12.2 使用GAN生成手写数字
12.3 使用DCGAN生成人脸图像
12.4 实现条件GAN模型
12.5 小结
12.6 课后习题
第13章 高级GAN图像处理
13.1 使用Pix2Pix GAN模型
13.2 使用CycleGAN模型
13.3 在定制图像上使用StyleGAN模型
13.4 超分辨率GAN
13.5 小结
13.6 课后习题
第四部分 计算机视觉与其他技术
第14章 使用小样本进行模型训练
14.1 实现零样本学习
14.2 实现小样本学习
14.3 小结
14.4 课后习题
第15章 计算机视觉与NLP
15.1 RNN模型简介
15.2 LSTM架构简介
15.3 生成图像标题
15.4 转录手写图像
15.5 使用DETR进行目标检测
15.6 小结
15.7 课后习题
第16章 计算机视觉与强化学习
16.1 强化学习基础知识
16.2 实现Q学习
16.3 实现深度Q学习
16.4 目标固定的深度Q学习
16.5 实现自动驾驶智能体
16.6 小结
16.7 课后习题
第17章 模型的实际应用部署
17.1 API基础知识
17.2 在本地服务器上创建API并进行预测
17.3 将API部署到云端
17.4 小结
第18章 使用OpenCV实用程序进行图像分析
18.1 图像中的单词检测
18.2 图像中的车道线检测
18.3 基于颜色的目标检测
18.4 构建全景图像
18.5 图像中的车牌检测
18.6 小结
附录 课后习题答案
PyTorch计算机视觉实战:目标检测、图像处理与深度学习是2023年由机械工业出版社有限公司出版,作者[印] V·基肖尔·阿耶德瓦拉。
得书感谢您对《PyTorch计算机视觉实战:目标检测、图像处理与深度学习》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。