深度学习与计算机视觉:算法原理、框架应用与代码实现

深度学习与计算机视觉:算法原理、框架应用与代码实现

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

让机器也能“看懂”图像,为人工智能插上翅膀。

内容简介

全书共13章,分为2篇。第1篇基础知识,介绍了人工智能发展里程、计算机视觉概要、深度学习和计算机视觉中的基础数学知识、神经网络及其相关的机器学习基础、卷积神经网络及其一些常见结构,最后对最前沿的趋势进行了简单探讨。第2篇实例精讲,介绍了Python基础、OpneCV基础、最简单的分类神经网络、图像识别、利用Caffe做回归、迁移学习和模型微调、目标检测、度量学习和图像风格迁移等常见的计算机视觉应用场景。从第5章开始包含了很多有趣和实用的代码示例。从第7章开始的所有实例都基于当前最流行的深度学习框架中的Caffe和MXNet,其中包含了作者原创的大量代码和搜集的数据,这些代码和作者训练好的部分模型已分享到本书github页面上供读者自行下载。

作者简介

作者叶韵,现在京东从事深度学习和计算机视觉算法研发。加入京东之前,曾在ProPlus Design Solutions硅谷和北京研发中心任职研发经理,负责统计建模算法研发,后加入Siemens Corporate Technology担任Research Scientist,专注计算影像和计算机视觉的研究。叶博士于2007年7月获得北京大学微电子学士学位,2011年4月获得Arizona State University的Electrical Engineering博士学位。

章节目录

版权信息

序言

前言

第1篇 基础知识

第1章 引言

1.1 人工智能的新焦点——深度学习

1.2 给计算机一双眼睛——计算机视觉

1.3 基于深度学习的计算机视觉

第2章 深度学习和计算机视觉中的基础数学知识

2.1 线性变换和非线性变换

2.2 概率论及相关基础知识

2.3 维度的诅咒

2.4 卷积

2.5 数学优化基础

第3章 神经网络和机器学习基础

3.1 感知机

3.2 神经网络基础

3.3 后向传播算法

3.4 随机梯度下降和批量梯度下降

3.5 数据、训练策略和规范化

3.6 监督学习、非监督学习、半监督学习和强化学习

第4章 深度卷积神经网络

4.1 卷积神经网络

4.2 LeNet——第一个卷积神经网络

4.3 新起点——AlexNet

4.4 更深的网络——GoogLeNet

4.5 更深的网络——ResNet

第2篇 实例精讲

第5章 Python基础

5.1 Python简介

5.2 Python基本语法

5.3 Python的科学计算包——NumPy

5.4 Python的可视化包——matplotlib

第6章 OpenCV基础

6.1 OpenCV简介

6.2 Python-OpenCV基础

6.3 用OpenCV实现数据增加小工具

6.4 用OpenCV实现物体标注小工具

第7章 Hello World!

7.1 用MXNet实现一个神经网络

7.2 用Caffe实现一个神经网络

第8章 最简单的图片分类——手写数字识别

8.1 准备数据——MNIST

8.2 基于Caffe的实现

8.3 基于MXNet的实现

第9章 利用Caffe做回归

9.1 回归的原理

9.2 预测随机噪声的频率

第10章 迁移学习和模型微调

10.1 吃货必备——通过Python采集美食图片

10.2 美食分类模型

第11章 目标检测

11.1 目标检测算法简介

11.2 基于PASCAL VOC数据集训练SSD模型

第12章 度量学习

12.1 距离和度量学习

12.2 用MNIST训练Siamese网络

第13章 图像风格迁移

13.1 风格迁移算法简介

13.2 MXNet中的图像风格迁移例子

深度学习与计算机视觉:算法原理、框架应用与代码实现是2017年由机械工业出版社华章分社出版,作者叶韵。

得书感谢您对《深度学习与计算机视觉:算法原理、框架应用与代码实现》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
深度学习与围棋 电子书
深入浅出的深度学习入门书,从零实现AlphaGo,为AI理论和应用打下基础。
vBRAS原理、实现与部署 电子书
本书介绍了BRAS的技术背景和传统BRAS的基本原理,从而介绍vBRAS的基本原理和相关关键技术,包括SDN、NFV、云计算使能技术,软、硬件加速技术,以及主要的接口协议和开源控制器。探讨了vBRAS设备实现、主要应用场景以及vBRAS的组网技术和组网模式,最后列举了基于OpenBRAS开源社区的vBRAS开源情况。
C++模板元编程实战:一个深度学习框架的初步实现 电子书
元编程在深度学习框架中的实践与性能优化。
深度学习之摄影图像处理:核心算法与案例精粹 电子书
本书内容涉及摄影学、计算机视觉、深度学习3个领域,系统地介绍了计算机视觉在图像质量和摄影学各个领域的核心算法和应用,包括传统的图像处理算法和深度学习核心算法。本书理论知识体系完备,同时提供大量实例,供读者实战演练。本书融合摄影学和计算机视觉的内容,覆盖面非常广。第1章简单介绍摄影的历史、摄影与图像的基本概念和摄影中的许多基本技巧。从第2章开始,本书对摄影学中图像处理算法的各个重要方向进行介绍,包括
深度学习在动态媒体中的应用与实践 电子书
本书是一本深度学习的基础入门读物,对深度学习的基本理论进行了介绍,主要以Ubuntu系统为例搭建了三大主流框架——Caffe、TensorFlow、Torch,然后分别在3个框架下,通过3个实战项目掌握了框架的使用方法,并详细描述了生产流程,最后讲述了通过集群部署深度学习的项目以及如何进行运营维护的注意事项。本书适合对深度学习有浓厚兴趣的读者、希望用深度学习完成设计的计算机专业或电子信息专业的高校