类似推荐
编辑推荐
一本书入门计算机视觉,将深度学习理论融入视觉识别案例,搭建理论与实践的桥梁。
内容简介
《Python计算机视觉与深度学习实战》立足实践,从机器学习的基础技能出发,深入浅出地介绍了如何使用 Python 进行基于深度学习的计算机视觉项目开发。开篇介绍了基于传统机器学习及图像处理方法的计算机视觉技术;然后重点就图像分类、目标检测、图像分割、图像搜索、图像压缩及文本识别等常见的计算机视觉项目做了理论结合实践的讲解;最后探索了深度学习项目落地时会用到的量化、剪枝等技术,并提供了模型服务端部署案例。
《Python计算机视觉与深度学习实战》适合有一定的Python 编程基础,初学深度学习的读者阅读。
作者简介
作者郭卡,安徽外国语学院计算机讲师,省级自然科学基金重点项目“基于大数据与人工智能技术的在线学习评价系统”主持人,《Python数据爬取技术与实战手册》主编,参与多项人工智能研究项目并发表相关论文两篇。
章节目录
版权信息
前言
第1章 机器学习与sklearn
1.1 sklearn环境配置
1.1.1 环境要求
1.1.2 安装方法
1.1.3 修改pip源
1.1.4 安装Jupyter Notebook
1.2 数据集
1.2.1 自带的小型数据集
1.2.2 在线下载的数据集
1.2.3 计算机生成的数据集
1.3 分类
1.3.1 加载数据与模型
1.3.2 建立分类模型
1.3.3 模型的训练及预测
1.3.4 模型评价
1.4 回归
1.4.1 线性回归
1.4.2 回归模型评价
1.5 聚类
1.5.1 K-means
1.5.2 DBSCAN
1.5.3 聚类实例
1.6 降维
1.6.1 PCA降维
1.6.2 LDA降维
1.7 模型验证
1.8 模型持久化
1.8.1 joblib
1.8.2 pickle
1.9 小结
第2章 传统图像处理方法
2.1 图像分类
2.1.1 HOG的原理
2.1.2 工具介绍
2.1.3 CIFAR-10分类
2.1.4 手写字符分类
2.2 目标检测
2.3 图像分割
2.4 图像搜索
2.5 小结
第3章 深度学习与PyTorch
3.1 框架介绍
3.2 环境配置
3.3 运算基本单元
3.3.1 Tensor数据类型
3.3.2 Tensor与ndarray
3.3.3 CPU与GPU运算
3.3.4 PyTorch实现K-means
3.4 自动求导
3.5 数据加载
3.5.1 Dataset
3.5.2 DataLoader
3.6 神经网络工具包
3.6.1 Module模块
3.6.2 线性层
3.6.3 卷积层
3.6.4 池化层
3.6.5 BatchNorm层
3.6.6 激活层
3.6.7 神经网络各层输出的可视化
3.6.8 循环神经网络
3.6.9 Sequential和ModuleList
3.6.10 损失函数
3.7 模型优化器optim
3.7.1 optim用法
3.7.2 优化器的选择
3.7.3 学习率的选择
3.8 参数初始化init
3.9 模型持久化
3.10 JIT编译器
3.11 模型迁移ONNX
3.12 数据可视化TensorBoard
3.13 机器视觉工具包torchvision
3.13.1 数据
3.13.2 模型
3.13.3 图像处理
3.14 小结
第4章 卷积神经网络中的分类与回归
4.1 卷积神经网络中的分类问题
4.1.1 CIFAR-10图像分类
4.1.2 卷积神经网络的发展
4.1.3 分类网络的实现
4.1.4 模型训练
4.1.5 模型展示
4.1.6 多标签分类
4.2 卷积神经网络中的回归问题
4.2.1 生成数据集
4.2.2 模型训练
4.2.3 模型展示
4.3 小结
第5章 目标检测
5.1 深度学习物体检测算法
5.1.1 两段式检测
5.1.2 一段式检测
5.2 数据集构建
5.2.1 选择目标物体图片
5.2.2 背景图片下载
5.2.3 图片合成
5.3 数据加载
5.4 数据标记与损失函数构建
5.4.1 数据标记
5.4.2 损失函数
5.5 模型搭建与训练
5.6 模型预测
5.7 小结
第6章 图像分割
6.1 数据加载
6.2 模型搭建
6.3 模型训练
6.4 模型展示
6.5 智能弹幕
6.6 像素级回归问题:超分辨率重建
6.6.1 超分辨率重建算法的发展
6.6.2 数据加载
6.6.3 模型搭建与训练
6.6.4 模型展示
6.7 小结
第7章 图像搜索
7.1 分类网络的特征
7.2 深度学习人脸识别技术
7.2.1 FaceNet
7.2.2 CosFace和ArcFace
7.3 数据处理
7.3.1 数据下载
7.3.2 数据检查
7.3.3 数据提取
7.4 模型训练
7.4.1 普通分类模型
7.4.2 CosFace
7.5 图像搜索
7.5.1 图像比对
7.5.2 KD-Tree搜索
7.6 小结
第8章 图像压缩
8.1 AutoEncoder
8.1.1 AutoEncoder的原理
8.1.2 AutoEncoder模型搭建
8.1.3 数据加载
8.1.4 模型训练
8.1.5 结果展示
8.2 GAN
8.2.1 GAN原理
8.2.2 GAN训练流程
8.2.3 GAN随机生成人脸图片
8.2.4 GAN与AutoEncoder的结合
8.2.5 图像修复
8.3 小结
第9章 不定长文本识别
9.1 循环神经网络概述
9.2 时间序列预测
9.2.1 创建模型
9.2.2 生成数据
9.2.3 模型训练
9.2.4 模型预测
9.3 CRNN模型
9.3.1 CRNN算法简介
9.3.2 CTCLoss函数
9.3.3 模型结构
9.3.4 数据预处理
9.3.5 模型训练
9.3.6 模型预测
9.4 小结
第10章 神经网络压缩与部署
10.1 剪枝
10.1.1 模型设计
10.1.2 训练基础模型
10.1.3 模型稀疏化
10.1.4 压缩模型通道
10.2 量化
10.3 混合精度训练
10.4 深度学习模型的服务端部署
10.4.1 创建接口
10.4.2 访问接口
10.5 小结
作者简介
Python计算机视觉与深度学习实战是2021年由人民邮电出版社出版,作者戴亮。
得书感谢您对《Python计算机视觉与深度学习实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。