计算机视觉之深度学习:使用TensorFlow和Keras训练高级神经网络

计算机视觉之深度学习:使用TensorFlow和Keras训练高级神经网络

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书将带你使用流行的Python库(例如TensorFlow和Keras)探索计算机视觉应用程序,从而掌握各种深度学习算法及其实现。

内容简介

本书开门见山,直接帮助你准备好训练高效深度学习模型的环境,以完成各种计算机视觉任务。书中介绍了常见的深度学习架构,如卷积神经网络和递归神经网络;讲述了如何利用深度学习进行图像分类、图像检索、目标检测、语义分割等内容。读完本书,你将能够开发和训练自己的深度学习模型,并用它们解决计算机视觉难题。

作者简介

作者拉贾林加帕·尚穆加马尼(Rajalingappaa Shanmugamani),目前在Kairos担任技术经理。在此之前,曾在新加坡SAP公司担任深度学习主管,也在创业公司从事过计算机视觉产品的开发和咨询工作。在同行评审的期刊和会议上多次发表文章,并在机器学习领域申请了专利。与他人合著出版了Hands-On Natural Language Processing with Python、Python Reinforcement Learning、Python: Advanced Guide to Artificial Intelligence、TensorFlow Deep Learning Projects等书。

章节目录

版权信息

数字版权声明

内容提要

版权声明

译者序

前言

第1章 入门

1.1 理解深度学习

1.1.1 感知机

1.1.2 激活函数

1.1.3 人工神经网络

1.1.4 训练神经网络

1.1.5 尝试TensorFlow游乐场

1.1.6 卷积神经网络

1.1.7 循环神经网络

1.1.8 长短期记忆网络

1.2 计算机视觉深度学习

1.2.1 分类

1.2.2 检测或定位与分割

1.2.3 相似性学习

1.2.4 图像题注

1.2.5 生成模型

1.2.6 视频分析

1.3 建立开发环境

1.3.1 硬件和操作系统

1.3.2 安装软件包

1.4 小结

第2章 图像分类

2.1 在TensorFlow中训练MNIST模型

2.1.1 MNIST数据集

2.1.2 加载MNIST数据

2.1.3 建立一个感知机

2.1.4 构建多层卷积网络

2.2 在Keras中训练MNIST模型

2.2.1 准备数据集

2.2.2 构建模型

2.3 其他流行的图像测试数据集

2.3.1 CIFAR数据集

2.3.2 Fashion-MNIST数据集

2.3.3 ImageNet数据集和竞赛

2.4 更大的深度学习模型

2.4.1 AlexNet 模型

2.4.2 VGG-16模型

2.4.3 谷歌Inception-V3模型

2.4.4 微软ResNet-50模型

2.4.5 SqueezeNet模型

2.4.6 空间变换网络模型

2.4.7 DenseNet模型

2.5 训练猫与狗的模型

2.5.1 准备数据

2.5.2 使用简单CNN进行基准测试

2.5.3 增强数据集

2.5.4 迁移学习或微调模型

2.5.5 在深度学习中微调一些层

2.6 开发现实世界的应用

2.6.1 选择正确的模型

2.6.2 处理欠拟合和过拟合场景

2.6.3 从面部检测性别和年龄

2.6.4 微调服装模型

2.6.5 品牌安全

2.7 小结

第3章 图像检索

3.1 理解视觉特征

3.1.1 深度学习模型的可视化激活

3.1.2 嵌入可视化

3.1.3 DeepDream

3.1.4 对抗样本

3.2 模型推断

3.2.1 导出模型

3.2.2 提供训练好的模型

3.3 基于内容的图像检索

3.3.1 构建检索流水线

3.3.2 有效的检索

3.3.3 使用自编码器去噪

3.4 小结

第4章 目标检测

4.1 检测图像中的目标

4.2 探索数据集

4.2.1 ImageNet数据集

4.2.2 PASCAL VOC挑战

4.2.3 COCO目标检测挑战

4.2.4 使用指标评估数据集

4.3 目标定位算法

4.3.1 使用滑动窗口定位目标

4.3.2 将定位看作回归问题

4.4 检测目标

4.4.1 R-CNN(区域卷积神经网络)

4.4.2 Fast R-CNN

4.4.3 Faster R-CNN

4.4.4 SSD(单射多框探测器)

4.5 目标检测API

4.5.1 安装和设置

4.5.2 预训练模型

4.5.3 重新训练目标检测模型

4.5.4 为自动驾驶汽车训练行人检测

4.6 YOLO目标检测算法

4.7 小结

第5章 语义分割

5.1 预测像素

5.1.1 诊断医学图像

5.1.2 通过卫星图像了解地球

5.1.3 提供机器人视觉

5.2 数据集

5.3 语义分割算法

5.3.1 全卷积网络

5.3.2 SegNet架构

5.3.3 膨胀卷积

5.3.4 DeepLab

5.3.5 RefiNet

5.3.6 PSPnet

5.3.7 大卷积核的重要性

5.3.8 DeepLab v3

5.4 超神经分割

5.5 分割卫星图像

为分割建模FCN

5.6 分割实例

5.7 小结

第6章 相似性学习

6.1 相似性学习算法

6.1.1 孪生网络

6.1.2 FaceNet模型

6.1.3 DeepNet模型

6.1.4 DeepRank 模型

6.1.5 视觉推荐系统

6.2 人脸分析

6.2.1 人脸检测

6.2.2 人脸特征点和属性

6.2.3 人脸识别

6.2.4 人脸聚类

6.3 小结

第7章 图像题注

7.1 了解问题和数据集

7.2 理解图像题注的自然语言处理

7.2.1 用向量形式表达词

7.2.2 将词转换为向量

7.2.3 训练一个嵌入

7.3 图像题注和相关问题的方法

7.3.1 使用条件随机场来链接图像和文本

7.3.2 在CNN特征上使用RNN生成题注

7.3.3 使用图像排序创建题注

7.3.4 从图像检索题注与从题注检索图像

7.3.5 密集题注

7.3.6 使用RNN生成题注

7.3.7 使用多模态度量空间

7.3.8 使用注意网络生成题注

7.3.9 知道什么时候查看

7.4 实现基于注意力的图像题注

7.5 小结

第8章 生成模型

8.1 生成模型的应用

8.1.1 艺术风格迁移

8.1.2 预测视频中的下一帧

8.1.3 图像的超分辨率

8.1.4 交互式图像生成

8.1.5 图像到图像的翻译

8.1.6 文本到图像的生成

8.1.7 图像修复

8.1.8 图像混合

8.1.9 转换属性

8.1.10 创建训练数据

8.1.11 创建新的动画角色

8.1.12 照片3D模型

8.2 神经艺术风格迁移

8.2.1 内容损失

8.2.2 使用Gram矩阵的风格损失

8.2.3 风格迁移

8.3 生成对抗网络

8.3.1 vanilla GAN

8.3.2 条件GAN

8.3.3 对抗损失

8.3.4 图像翻译

8.3.5 InfoGAN

8.3.6 GAN的缺点

8.4 视觉对话模型

VDM算法

8.5 小结

第9章 视频分类

9.1 了解视频和视频分类

9.1.1 探索视频分类数据集

9.1.2 将视频分割成帧

9.1.3 视频分类方法

9.2 将基于图像的方法扩展到视频

9.2.1 人体姿态回归

9.2.2 视频分割

9.2.3 视频题注

9.2.4 视频生成

9.3 小结

第10章 部署

10.1 模型的性能

10.1.1 量化模型

10.1.2 MobileNets

10.2 云部署

10.2.1 AWS

10.2.2 Google云平台

10.3 在设备中部署模型

10.3.1 Jetson TX2

10.3.2 Android

10.3.3 iPhone

10.4 小结

计算机视觉之深度学习:使用TensorFlow和Keras训练高级神经网络是2020年由人民邮电出版社·图灵出品出版,作者[美] 拉贾林加帕·尚穆加马尼。

得书感谢您对《计算机视觉之深度学习:使用TensorFlow和Keras训练高级神经网络》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
深度学习 电子书
深度学习是机器学习的一个分支,它能够使计算机通过层次概念来学习经验和理解世界。
深度学习 电子书
本书介绍了深度学习的基本概念、算法原理以及实现框架。全书共9章,分别介绍了深度学习的发展历史、神经网络与深度神经网络、卷积神经网络、循环神经网络、深度学习在目标检测和图像描述中的应用、生成对抗网络、深度迁移学习和深度强化学习等,并提供了应用实例。
JavaScript深度学习 电子书
深度学习扛鼎之作《Python深度学习》姊妹篇,前端工程师不可错过的AI入门书。
深度学习与围棋 电子书
深入浅出的深度学习入门书,从零实现AlphaGo,为AI理论和应用打下基础。
PyTorch深度学习实战 电子书
1.PyTorch核心开发者教你使用PyTorch创建神经网络和深度学习系统的实用指南。2.详细讲解整个深度学习管道的关键实践,包括PyTorch张量API、用Python加载数据、监控训练以及对结果进行可视化。3.PyTorch核心知识+真实、完整的案例项目,快速提升读者动手能力:a.全面掌握PyTorch相关的API的使用方法以及系统掌握深度学习的理论和方法;b.快速从零开始构建一个真实示例:肿瘤图像分类器;c.轻松学会使用PyTorch实现各种神经网络模型来解决具体的深度学习问题;d.章尾附有“练习题”,巩固提升所学知识;更有配套的代码文件可下载并动手实现。4.PyTorch联合创作者SoumithChintala作序推荐!5.书中所有代码都是基于Python3.6及以上的版本编写的,提供源代码下载。