计算机视觉之深度学习：使用TensorFlow和Keras训练高级神经网络

[美] 拉贾林加帕·尚穆加马尼

计算机与互联网类型

146千字字数

查阅电子书

手机扫码

微信扫一扫

关注微信公众号

因版权原因待上架

类似推荐

电子书


Python计算机视觉与深度学习实战

戴亮
电子书


深度学习原理与 TensorFlow实践

黄理灿
电子书


深度学习入门与TensorFlow实践

林炳清
电子书


TensorFlow深度学习项目实战（深度学习系列）

[美] 卢卡·马萨罗
电子书


深度学习：基于Python语言和TensorFlow平台（视频讲解版）

谢琼

编辑推荐

本书将带你使用流行的Python库（例如TensorFlow和Keras）探索计算机视觉应用程序，从而掌握各种深度学习算法及其实现。

内容简介

本书开门见山，直接帮助你准备好训练高效深度学习模型的环境，以完成各种计算机视觉任务。书中介绍了常见的深度学习架构，如卷积神经网络和递归神经网络；讲述了如何利用深度学习进行图像分类、图像检索、目标检测、语义分割等内容。读完本书，你将能够开发和训练自己的深度学习模型，并用它们解决计算机视觉难题。

作者简介

作者拉贾林加帕·尚穆加马尼（Rajalingappaa Shanmugamani），目前在Kairos担任技术经理。在此之前，曾在新加坡SAP公司担任深度学习主管，也在创业公司从事过计算机视觉产品的开发和咨询工作。在同行评审的期刊和会议上多次发表文章，并在机器学习领域申请了专利。与他人合著出版了Hands-On Natural Language Processing with Python、Python Reinforcement Learning、Python: Advanced Guide to Artificial Intelligence、TensorFlow Deep Learning Projects等书。

章节目录

版权信息

内容提要

译者序

序

前言

第1章入门

1.1 理解深度学习

1.1.1 感知机

1.1.2 激活函数

1.1.3 人工神经网络

1.1.4 训练神经网络

1.1.5 尝试TensorFlow游乐场

1.1.6 卷积神经网络

1.1.7 循环神经网络

1.1.8 长短期记忆网络

1.2 计算机视觉深度学习

1.2.1 分类

1.2.2 检测或定位与分割

1.2.3 相似性学习

1.2.4 图像题注

1.2.5 生成模型

1.2.6 视频分析

1.3 建立开发环境

1.3.1 硬件和操作系统

1.3.2 安装软件包

1.4 小结

第2章图像分类

2.1 在TensorFlow中训练MNIST模型

2.1.1 MNIST数据集

2.1.2 加载MNIST数据

2.1.3 建立一个感知机

2.1.4 构建多层卷积网络

2.2 在Keras中训练MNIST模型

2.2.1 准备数据集

2.2.2 构建模型

2.3 其他流行的图像测试数据集

2.3.1 CIFAR数据集

2.3.2 Fashion-MNIST数据集

2.3.3 ImageNet数据集和竞赛

2.4 更大的深度学习模型

2.4.1 AlexNet 模型

2.4.2 VGG-16模型

2.4.3 谷歌Inception-V3模型

2.4.4 微软ResNet-50模型

2.4.5 SqueezeNet模型

2.4.6 空间变换网络模型

2.4.7 DenseNet模型

2.5 训练猫与狗的模型

2.5.1 准备数据

2.5.2 使用简单CNN进行基准测试

2.5.3 增强数据集

2.5.4 迁移学习或微调模型

2.5.5 在深度学习中微调一些层

2.6 开发现实世界的应用

2.6.1 选择正确的模型

2.6.2 处理欠拟合和过拟合场景

2.6.3 从面部检测性别和年龄

2.6.4 微调服装模型

2.6.5 品牌安全

2.7 小结

第3章图像检索

3.1 理解视觉特征

3.1.1 深度学习模型的可视化激活

3.1.2 嵌入可视化

3.1.3 DeepDream

3.1.4 对抗样本

3.2 模型推断

3.2.1 导出模型

3.2.2 提供训练好的模型

3.3 基于内容的图像检索

3.3.1 构建检索流水线

3.3.2 有效的检索

3.3.3 使用自编码器去噪

3.4 小结

第4章目标检测

4.1 检测图像中的目标

4.2 探索数据集

4.2.1 ImageNet数据集

4.2.2 PASCAL VOC挑战

4.2.3 COCO目标检测挑战

4.2.4 使用指标评估数据集

4.3 目标定位算法

4.3.1 使用滑动窗口定位目标

4.3.2 将定位看作回归问题

4.4 检测目标

4.4.1 R-CNN（区域卷积神经网络）

4.4.2 Fast R-CNN

4.4.3 Faster R-CNN

4.4.4 SSD（单射多框探测器）

4.5 目标检测API

4.5.1 安装和设置

4.5.2 预训练模型

4.5.3 重新训练目标检测模型

4.5.4 为自动驾驶汽车训练行人检测

4.6 YOLO目标检测算法

4.7 小结

第5章语义分割

5.1 预测像素

5.1.1 诊断医学图像

5.1.2 通过卫星图像了解地球

5.1.3 提供机器人视觉

5.2 数据集

5.3 语义分割算法

5.3.1 全卷积网络

5.3.2 SegNet架构

5.3.3 膨胀卷积

5.3.4 DeepLab

5.3.5 RefiNet

5.3.6 PSPnet

5.3.7 大卷积核的重要性

5.3.8 DeepLab v3

5.4 超神经分割

5.5 分割卫星图像

为分割建模FCN

5.6 分割实例

5.7 小结

第6章相似性学习

6.1 相似性学习算法

6.1.1 孪生网络

6.1.2 FaceNet模型

6.1.3 DeepNet模型

6.1.4 DeepRank 模型

6.1.5 视觉推荐系统

6.2 人脸分析

6.2.1 人脸检测

6.2.2 人脸特征点和属性

6.2.3 人脸识别

6.2.4 人脸聚类

6.3 小结

第7章图像题注

7.1 了解问题和数据集

7.2 理解图像题注的自然语言处理

7.2.1 用向量形式表达词

7.2.2 将词转换为向量

7.2.3 训练一个嵌入

7.3 图像题注和相关问题的方法

7.3.1 使用条件随机场来链接图像和文本

7.3.2 在CNN特征上使用RNN生成题注

7.3.3 使用图像排序创建题注

7.3.4 从图像检索题注与从题注检索图像

7.3.5 密集题注

7.3.6 使用RNN生成题注

7.3.7 使用多模态度量空间

7.3.8 使用注意网络生成题注

7.3.9 知道什么时候查看

7.4 实现基于注意力的图像题注

7.5 小结

第8章生成模型

8.1 生成模型的应用

8.1.1 艺术风格迁移

8.1.2 预测视频中的下一帧

8.1.3 图像的超分辨率

8.1.4 交互式图像生成

8.1.5 图像到图像的翻译

8.1.6 文本到图像的生成

8.1.7 图像修复

8.1.8 图像混合

8.1.9 转换属性

8.1.10 创建训练数据

8.1.11 创建新的动画角色

8.1.12 照片3D模型

8.2 神经艺术风格迁移

8.2.1 内容损失

8.2.2 使用Gram矩阵的风格损失

8.2.3 风格迁移

8.3 生成对抗网络

8.3.1 vanilla GAN

8.3.2 条件GAN

8.3.3 对抗损失

8.3.4 图像翻译

8.3.5 InfoGAN

8.3.6 GAN的缺点

8.4 视觉对话模型

VDM算法

8.5 小结

第9章视频分类

9.1 了解视频和视频分类

9.1.1 探索视频分类数据集

9.1.2 将视频分割成帧

9.1.3 视频分类方法

9.2 将基于图像的方法扩展到视频

9.2.1 人体姿态回归

9.2.2 视频分割

9.2.3 视频题注

9.2.4 视频生成

9.3 小结

第10章部署

10.1 模型的性能

10.1.1 量化模型

10.1.2 MobileNets

10.2 云部署

10.2.1 AWS

10.2.2 Google云平台

10.3 在设备中部署模型

10.3.1 Jetson TX2

10.3.2 Android

10.3.3 iPhone

10.4 小结

计算机视觉之深度学习：使用TensorFlow和Keras训练高级神经网络是2020年由人民邮电出版社·图灵出品出版,作者[美] 拉贾林加帕·尚穆加马尼。

得书感谢您对《计算机视觉之深度学习：使用TensorFlow和Keras训练高级神经网络》关注和支持，如本书内容有不良信息或侵权等情形的，请联系本网站。

得书 - 好书推荐、正版图书免费阅读