深度学习之图像识别:核心技术与案例实战

深度学习之图像识别:核心技术与案例实战

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书全面介绍了深度学习在图像处理领域中的核心技术与应用。

内容简介

书中不但重视基础理论的讲解,而且从第4章开始的每章都提供了一到两个不同难度的案例供读者实践,读者可以在已有代码的基础上进行修改和改进,从而加深对所学知识的理解。

本书共10章,首先从深度学习的基础概念开始,介绍了神经网络的基础知识和深度学习中的优化技术;然后系统地介绍了深度学习中与数据相关的知识,包括经典数据集的设计、数据集的增强以及数据的获取与整理;接着重点针对图像开发领域,用3章内容系统地介绍了深度学习在图像分类、图像分割和目标检测3个领域的核心技术与应用,这些内容的讲解均结合实战案例展开;另外,还对深度学习中损失函数的发展、数据和模型的可视化以及模型的压缩和优化进行了详细介绍,为读者设计和训练更加实用的模型提供了指导;最后以微信小程序平台为依托,介绍了微信小程序前后端开发技术,完成了深度学习的模型部署,让本书的内容形成了一个完整的闭环。本书理论与实践结合,深度与广度兼具,特别适合深度学习领域的相关技术人员与爱好者阅读,尤其适合基于深度学习的图像从业人员阅读,以全方位了解深度学习在图像领域中的技术全貌。另外,本书还适合作为相关培训机构的深度学习教材使用。

作者简介

作者言有三,真名龙鹏。2012年本科毕业于华中科技大学,后保研至并于2015年毕业。先后在奇虎360人工智能研究院和陌陌深度学习实验室从事与计算机视觉相关的工作,积累了丰富的传统图像处理算法和深度学习项目实战经验。运营微信公众号《有三AI》,内容覆盖深度学习的理论、实战经验、开源框架、模型架构,以及深度学习在各应用领域的技术分析,还提供国内外AI研究院的核心技术报导及AI工程师成长路线的完整规划。在知乎上开设专栏《有三AI学院》和其他子方向专栏。在GitChat和网易云课堂上开设若干图文和视频课程。

章节目录

版权信息

前言

第1章 神经网络基础

1.1 神经网络的生物基础与数学模型

1.1.1 神经元

1.1.2 感知机

1.1.3 BP算法

1.2 卷积神经网络基础

1.2.1 卷积神经网络的基本结构

1.2.2 卷积与权值共享

1.2.3 感受野与池化

第2章 深度学习优化基础

2.1 深度学习主流开源框架

2.1.1 Caffe简介

2.1.2 TensorFlow简介

2.1.3 PyTorch简介

2.1.4 Theano简介

2.1.5 Keras简介

2.1.6 MXNet简介

2.1.7 Chainer简介

2.2 网络优化参数

2.2.1 常用激活函数

2.2.2 参数初始化方法

2.2.3 最优化方法

2.2.4 归一化方法

2.2.5 正则化方法

第3章 深度学习中的数据

3.1 深度学习通用数据集的发展

3.1.1 MNIST数据集

3.1.2 CIFAR10和CIFAR100数据集

3.1.3 PASCAL数据集

3.1.4 ImageNet数据集

3.1.5 Microsoft COCO数据集

3.2 常见的计算机视觉任务数据集

3.2.1 人脸数据集

3.2.2 自动驾驶数据集

3.2.3 医学数据集

3.3 数据增强

3.3.1 有监督数据增强

3.3.2 无监督数据增强

3.4 数据的收集与标注

3.4.1 数据收集

3.4.2 数据标注

3.4.3 数据清洗与整理

第4章 图像分类

4.1 图像分类基础

4.1.1 图像分类问题

4.1.2 深度学习图像分类发展简史

4.1.3 评测指标与优化目标

4.1.4 图像分类的挑战

4.2 移动端实时表情分类实战

4.2.1 项目背景

4.2.2 数据预处理

4.2.3 项目方案

4.2.4 模型训练与测试

4.2.5 项目总结

4.3 细粒度图像分类实战

4.3.1 项目背景

4.3.2 项目方案

4.3.3 模型训练与测试

4.3.4 参数调试

4.3.5 项目总结

第5章 图像分割

5.1 传统图像分割方法

5.1.1 阈值法

5.1.2 区域生长法与超像素

5.1.3 图切割

5.1.4 活动轮廓模型

5.2 深度学习图像分割

5.2.1 基本流程

5.2.2 反卷积

5.2.3 多尺度与感受野

5.2.4 CRF方法

5.2.5 Image Matting与图像融合

5.3 移动端实时图像分割项目

5.3.1 项目背景

5.3.2 项目方案

5.3.3 模型训练与总结

5.4 一个实时肖像换背景项目

5.4.1 项目背景

5.4.2 项目方案

5.4.3 模型训练与测试

5.4.4 项目总结

第6章 目标检测

6.1 目标检测基础

6.1.1 检测窗口选择

6.1.2 特征提取

6.1.3 分类器

6.1.4 V-J人脸检测算法

6.2 深度学习目标检测方法

6.2.1 Selective search与R-CNN

6.2.2 RoI Pooling与SPPNet

6.2.3 Fast R-CNN与Faster R-CNN

6.2.4 YOLO方法

6.2.5 SSD方法

6.2.6 目标检测中的关键技术

6.3 实战Faster-R-CNN目标检测

6.3.1 项目背景

6.3.2 py-faster-rcnn框架解读

6.3.3 模型定义与分析

6.3.4 模型训练与测试

6.3.5 项目总结

第7章 数据与模型可视化

7.1 数据可视化

7.1.1 低维数据可视化

7.1.2 高维数据可视化

7.2 模型可视化

7.2.1 模型结构可视化

7.2.2 模型权重可视化

7.2.3 特征图可视化

7.3 可视化案例

7.3.1 项目背景

7.3.2 数据接口定义

7.3.3 网络结构定义

7.3.4 可视化代码添加

7.3.5 可视化训练指标

第8章 模型压缩

8.1 模型压缩方法

8.1.1 模型设计压缩

8.1.2 网络剪枝与量化

8.1.3 张量分解

8.1.4 模型蒸馏与迁移学习

8.2 模型压缩实战

8.2.1 网络分析

8.2.2 输入尺度和第一层卷积设计

8.2.3 网络宽度与深度压缩

8.2.4 弥补通道损失

8.2.5 总结

第9章 损失函数

9.1 分类任务损失

9.1.1 什么是0-1 loss

9.1.2 熵与交叉熵loss

9.1.3 softmax loss及其变种

9.1.4 KL散度

9.1.5 Hinge loss简介

9.1.6 Exponential loss与Logistic loss

9.1.7 多标签分类任务loss

9.2 回归任务损失

9.2.1 L1 loss与L2 loss

9.2.2 L1 loss与L2 loss的改进

9.3 常见图像任务与loss使用

9.3.1 图像基础任务

9.3.2 风格化与图像复原,超分辨重建

9.3.3 生成对抗网络

9.3.4 总结

第10章 模型部署与上线

10.1 微信小程序前端开发

10.1.1 小程序的技术特点与定位

10.1.2 Web前端基础

10.1.3 小程序开发工具

10.1.4 小程序前端目录

10.1.5 小程序前端开发

10.2 微信小程序服务端开发

10.2.1 域名注册与管理

10.2.2 服务端框架简介

10.2.3 算法搭建与实现

10.3 Caffe环境配置

10.3.1 依赖库安装

10.3.2 Caffe编译安装

深度学习之图像识别:核心技术与案例实战是2019年由机械工业出版社华章分社出版,作者言有三。

得书感谢您对《深度学习之图像识别:核心技术与案例实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Python深度学习与项目实战 电子书
本书基于Python以及两个深度学习框架Keras与TensorFlow,讲述深度学习在实际项目中的应用。本书共10章,首先介绍线性回归模型、逻辑回归模型、Softmax多分类器,然后讲述全连接神经网络、神经网络模型的优化、卷积神经网络、循环神经网络,最后讨论自编码模型、对抗生成网络、深度强化学习。
PaddlePaddleFluid深度学习入门与实战 电子书
本书全面讲解PaddlePaddle Fluid框架在深度学习领域的应用。
PyTorch深度学习实战 电子书
1.PyTorch核心开发者教你使用PyTorch创建神经网络和深度学习系统的实用指南。2.详细讲解整个深度学习管道的关键实践,包括PyTorch张量API、用Python加载数据、监控训练以及对结果进行可视化。3.PyTorch核心知识+真实、完整的案例项目,快速提升读者动手能力:a.全面掌握PyTorch相关的API的使用方法以及系统掌握深度学习的理论和方法;b.快速从零开始构建一个真实示例:肿瘤图像分类器;c.轻松学会使用PyTorch实现各种神经网络模型来解决具体的深度学习问题;d.章尾附有“练习题”,巩固提升所学知识;更有配套的代码文件可下载并动手实现。4.PyTorch联合创作者SoumithChintala作序推荐!5.书中所有代码都是基于Python3.6及以上的版本编写的,提供源代码下载。
深度强化学习实战 电子书
详解深度强化学习,从入门到实战。
TensorFlow 2深度学习实战 电子书
本书以深度学习的常用技术与TensorFlow2真实案例相结合的方式,深入浅出地介绍TensorFlow2实现深度学习的重要内容。全书共7章,分为基础篇(第1~3章)和实战篇(第4~7章),基础篇内容包括深度学习概述、TensorFlow2快速入门、深度神经网络原理及实现等基础知识;实战篇内容包括4个案例,分别为基于CNN的门牌号识别、基于LSTM网络的语音识别、基于CycleGAN的图像风格转换