Python计算机视觉与深度学习实战

Python计算机视觉与深度学习实战

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

编辑推荐

一本书入门计算机视觉,将深度学习理论融入视觉识别案例,搭建理论与实践的桥梁。

内容简介

《Python计算机视觉与深度学习实战》立足实践,从机器学习的基础技能出发,深入浅出地介绍了如何使用 Python 进行基于深度学习的计算机视觉项目开发。开篇介绍了基于传统机器学习及图像处理方法的计算机视觉技术;然后重点就图像分类、目标检测、图像分割、图像搜索、图像压缩及文本识别等常见的计算机视觉项目做了理论结合实践的讲解;最后探索了深度学习项目落地时会用到的量化、剪枝等技术,并提供了模型服务端部署案例。

《Python计算机视觉与深度学习实战》适合有一定的Python 编程基础,初学深度学习的读者阅读。

作者简介

作者郭卡,安徽外国语学院计算机讲师,省级自然科学基金重点项目“基于大数据与人工智能技术的在线学习评价系统”主持人,《Python数据爬取技术与实战手册》主编,参与多项人工智能研究项目并发表相关论文两篇。

章节目录

版权信息

前言

第1章 机器学习与sklearn

1.1 sklearn环境配置

1.1.1 环境要求

1.1.2 安装方法

1.1.3 修改pip源

1.1.4 安装Jupyter Notebook

1.2 数据集

1.2.1 自带的小型数据集

1.2.2 在线下载的数据集

1.2.3 计算机生成的数据集

1.3 分类

1.3.1 加载数据与模型

1.3.2 建立分类模型

1.3.3 模型的训练及预测

1.3.4 模型评价

1.4 回归

1.4.1 线性回归

1.4.2 回归模型评价

1.5 聚类

1.5.1 K-means

1.5.2 DBSCAN

1.5.3 聚类实例

1.6 降维

1.6.1 PCA降维

1.6.2 LDA降维

1.7 模型验证

1.8 模型持久化

1.8.1 joblib

1.8.2 pickle

1.9 小结

第2章 传统图像处理方法

2.1 图像分类

2.1.1 HOG的原理

2.1.2 工具介绍

2.1.3 CIFAR-10分类

2.1.4 手写字符分类

2.2 目标检测

2.3 图像分割

2.4 图像搜索

2.5 小结

第3章 深度学习与PyTorch

3.1 框架介绍

3.2 环境配置

3.3 运算基本单元

3.3.1 Tensor数据类型

3.3.2 Tensor与ndarray

3.3.3 CPU与GPU运算

3.3.4 PyTorch实现K-means

3.4 自动求导

3.5 数据加载

3.5.1 Dataset

3.5.2 DataLoader

3.6 神经网络工具包

3.6.1 Module模块

3.6.2 线性层

3.6.3 卷积层

3.6.4 池化层

3.6.5 BatchNorm层

3.6.6 激活层

3.6.7 神经网络各层输出的可视化

3.6.8 循环神经网络

3.6.9 Sequential和ModuleList

3.6.10 损失函数

3.7 模型优化器optim

3.7.1 optim用法

3.7.2 优化器的选择

3.7.3 学习率的选择

3.8 参数初始化init

3.9 模型持久化

3.10 JIT编译器

3.11 模型迁移ONNX

3.12 数据可视化TensorBoard

3.13 机器视觉工具包torchvision

3.13.1 数据

3.13.2 模型

3.13.3 图像处理

3.14 小结

第4章 卷积神经网络中的分类与回归

4.1 卷积神经网络中的分类问题

4.1.1 CIFAR-10图像分类

4.1.2 卷积神经网络的发展

4.1.3 分类网络的实现

4.1.4 模型训练

4.1.5 模型展示

4.1.6 多标签分类

4.2 卷积神经网络中的回归问题

4.2.1 生成数据集

4.2.2 模型训练

4.2.3 模型展示

4.3 小结

第5章 目标检测

5.1 深度学习物体检测算法

5.1.1 两段式检测

5.1.2 一段式检测

5.2 数据集构建

5.2.1 选择目标物体图片

5.2.2 背景图片下载

5.2.3 图片合成

5.3 数据加载

5.4 数据标记与损失函数构建

5.4.1 数据标记

5.4.2 损失函数

5.5 模型搭建与训练

5.6 模型预测

5.7 小结

第6章 图像分割

6.1 数据加载

6.2 模型搭建

6.3 模型训练

6.4 模型展示

6.5 智能弹幕

6.6 像素级回归问题:超分辨率重建

6.6.1 超分辨率重建算法的发展

6.6.2 数据加载

6.6.3 模型搭建与训练

6.6.4 模型展示

6.7 小结

第7章 图像搜索

7.1 分类网络的特征

7.2 深度学习人脸识别技术

7.2.1 FaceNet

7.2.2 CosFace和ArcFace

7.3 数据处理

7.3.1 数据下载

7.3.2 数据检查

7.3.3 数据提取

7.4 模型训练

7.4.1 普通分类模型

7.4.2 CosFace

7.5 图像搜索

7.5.1 图像比对

7.5.2 KD-Tree搜索

7.6 小结

第8章 图像压缩

8.1 AutoEncoder

8.1.1 AutoEncoder的原理

8.1.2 AutoEncoder模型搭建

8.1.3 数据加载

8.1.4 模型训练

8.1.5 结果展示

8.2 GAN

8.2.1 GAN原理

8.2.2 GAN训练流程

8.2.3 GAN随机生成人脸图片

8.2.4 GAN与AutoEncoder的结合

8.2.5 图像修复

8.3 小结

第9章 不定长文本识别

9.1 循环神经网络概述

9.2 时间序列预测

9.2.1 创建模型

9.2.2 生成数据

9.2.3 模型训练

9.2.4 模型预测

9.3 CRNN模型

9.3.1 CRNN算法简介

9.3.2 CTCLoss函数

9.3.3 模型结构

9.3.4 数据预处理

9.3.5 模型训练

9.3.6 模型预测

9.4 小结

第10章 神经网络压缩与部署

10.1 剪枝

10.1.1 模型设计

10.1.2 训练基础模型

10.1.3 模型稀疏化

10.1.4 压缩模型通道

10.2 量化

10.3 混合精度训练

10.4 深度学习模型的服务端部署

10.4.1 创建接口

10.4.2 访问接口

10.5 小结

作者简介

Python计算机视觉与深度学习实战是2021年由人民邮电出版社出版,作者戴亮。

得书感谢您对《Python计算机视觉与深度学习实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
TensorFlow技术解析与实战 电子书
TensorFlow是谷歌公司开发的深度学习框架,也是目前深度学习的主流框架之一。
深度学习与飞桨PaddlePaddle Fluid实战 电子书
飞桨PaddlePaddle是百度推出的深度学习框架,不仅支撑了百度公司的很多业务和应用,而且随着其开源过程的推进,在其他行业得到普及和应用。 本书基于2019年7月4日发布的飞桨PaddlePaddle Fluid 1.5版本(后续版本会兼容旧版本),以真实案例介绍如何应用飞桨PaddlePaddle解决主流的深度学习问题。 本书适合对人工智能感兴趣的学生、从事机器学习相关工作的读者阅读,尤其适合想要通过飞桨PaddlePaddle掌握深度学习应用技术的研究者和从业者参考。 本书包括以下内容: ● 飞桨PaddlePaddle 的核心设计思想; ● PaddlePaddle在MNIST上进行手写数字识别; ● 图像分类网络实现案例; ● “天网”中目标检测和像素级物体分割的实现; ● NLP技术应用案例 :word2vec、情感分析、语义角色标注及机器翻译; ● Paddle-Mobile与Anakin框架等高级主题; ● 飞桨PaddlePaddle与TensorFlow、Caffe框架的常用层对比。
Python机器学习经典实例 电子书
用流行的Python库scikitlearn解决机器学习问题。
机器学习与Python实践 电子书
机器学习理论实践全书,12章内容丰富,适合各层次读者。
机器学习实战 电子书
《机器学习实战》面向日常任务的高效实战内容,介绍并实现机器学习的主流算法。