类似推荐
编辑推荐
本书根据当前人工智能RNN深度学习的发展成果,具体设计基于RNN的模型算法,并给出了具体实现,算法流程及Python代码实现。
内容简介
全书主要内容包括:基于深度学习的图像处理的20个案例,基于Python的具体实现,本书图文并茂,丰富实用,深入浅出,易学易用。
作者简介
作者李永华,现执教于北京邮电大学,拥有超过10年的嵌入式开发经验,致力于物联网、云计算与大数据的研究工作。在教学中善于以兴趣为导向,激发学生的创造性:以素质为基础,提高自身教学水平:以科研为手段,促进教学理念的转变。在研发及教学实践中指导学生实现300个创新案例,参与了30余项国家课题与企业课题的研究工作,在国内外学术期刊以及会议发表论文60余篇,申请专利40余项,出版教材10余部。
章节目录
版权信息
作者简介
内容简介
前言 PREFACE
项目1 PROJECT 1 基于插帧和超分辨率的视频增强应用
1.1 总体设计
1.1.1 系统整体结构
1.1.2 系统流程
1.2 运行环境
1.2.1 Python环境
1.2.2 PyTorch环境
1.2.3 FFmpeg使用
1.2.4 百度AI Studio使用
1.3 模块实现
1.3.1 视频处理模块
1.3.2 超分辨率模块
1.3.3 插帧模块
1.3.4 GUI模块
1.4 系统测试
1.4.1 算法训练
1.4.2 GUI界面效果
1.4.3 输出效果展示
项目2 PROJECT 2 基于Pix2Pix的快速图像风格迁移
2.1 总体设计
2.1.1 系统整体结构
2.1.2 系统流程
2.2 运行环境
2.2.1 Python环境
2.2.2 TensorFlow环境
2.2.3 Flask环境
2.2.4 微信小程序环境
2.3 模块实现
2.3.1 数据预处理
2.3.2 创建模型与编译
2.3.3 模型训练及保存
2.3.4 构建Pix2Pix数据集
2.3.5 Pix2Pix模型构建
2.3.6 Pix2Pix模型训练及保存
2.3.7 后端搭建
2.4 系统测试
2.4.1 训练效果
2.4.2 测试效果
2.4.3 模型应用
项目3 PROJECT 3 常见花卉识别
3.1 总体设计
3.1.1 系统整体结构
3.1.2 系统流程
3.2 运行环境
3.2.1 Python环境
3.2.2 TensorFlow环境
3.2.3 Android环境
3.3 模块实现
3.3.1 数据预处理
3.3.2 创建模型并编译
3.3.3 模型训练及保存
3.3.4 模型生成
3.4 系统测试
3.4.1 训练准确率
3.4.2 测试效果
3.4.3 模型应用
项目4 PROJECT 4 基于Keras的狗狗分类与人脸相似检测器
4.1 总体设计
4.1.1 系统整体结构
4.1.2 系统流程
4.2 运行环境
4.2.1 Python环境
4.2.2 TensorFlow环境
4.2.3 Keras环境
4.2.4 安装库
4.3 模块实现
4.3.1 数据预处理
4.3.2 模型编译主体
4.3.3 图像检测
4.3.4 文本数据翻译与爬虫
4.3.5 模型训练评估与生成
4.3.6 前端界面
4.4 系统测试
4.4.1 前端界面展示
4.4.2 程序功能介绍
4.4.3 识别狗狗效果展示
4.4.4 识别人脸效果展示
项目5 PROJECT 5 猫猫相机
5.1 总体设计
5.1.1 系统整体结构
5.1.2 系统流程
5.2 运行环境
5.2.1 Python环境
5.2.2 mxnet环境
5.2.3 OpenCV环境
5.3 模块实现
5.3.1 数据预处理
5.3.2 创建模型并编译
5.3.3 模型训练及保存
5.3.4 模型测试
5.4 系统测试
5.4.1 训练准确率
5.4.2 测试效果
5.4.3 模型应用
项目6 PROJECT 6 基于Mask R-CNN的动物识别分割及渲染
6.1 总体设计
6.1.1 系统整体结构
6.1.2 系统流程
6.2 运行环境
6.2.1 Python环境
6.2.2 TensorFlow-GPU环境
6.2.3 Keras环境
6.2.4 pycocotools2.0环境
6.2.5 其他依赖库
6.3 模块实现
6.3.1 数据预处理
6.3.2 数据集处理
6.3.3 模型训练及保存
6.3.4 渲染效果实现
6.3.5 GUI设计
6.4 系统测试
6.4.1 模型评估
6.4.2 测试效果
6.4.3 模型应用
项目7 PROJECT 7 新冠肺炎辅助诊断系统
7.1 总体设计
7.1.1 系统整体结构
7.1.2 系统流程
7.2 运行环境
7.2.1 Python环境
7.2.2 PaddlePaddle环境
7.2.3 在线运行
7.3 模块实现
7.3.1 定义待测数据
7.3.2 加载预训练模型
7.3.3 数据预处理
7.3.4 可视化操作
7.4 系统测试
7.4.1 DICOM图像
7.4.2 预处理后的图像
7.4.3 肺部分割
7.4.4 病灶分割
7.4.5 分割结果
7.4.6 统计输出结果
项目8 PROJECT 8 Stroke-Controllable快速风格迁移在网页端应用
8.1 总体设计
8.1.1 系统整体结构
8.1.2 系统流程
8.2 运行环境
8.2.1 Python环境
8.2.2 TensorFlow环境
8.2.3 Linux环境
8.2.4 网页配置环境
8.3 模块实现
8.3.1 数据预处理
8.3.2 模型构建
8.3.3 模型训练及保存
8.3.4 模型测试
8.4 系统测试
8.4.1 训练准确率
8.4.2 测试效果
8.4.3 模型应用
项目9 PROJECT 9 SRGAN网络在网站默认头像生成中的应用
9.1 总体设计
9.1.1 系统整体结构
9.1.2 系统流程
9.2 运行环境
9.2.1 TensorFlow环境
9.2.2 网页服务器开发环境
9.3 模块实现
9.3.1 数据预处理
9.3.2 模型构建
9.3.3 模型训练及保存
9.3.4 网站搭建
9.4 系统测试
项目10 PROJECT 10 乱序成语验证码识别
10.1 总体设计
10.1.1 系统整体结构
10.1.2 系统流程
10.2 运行环境
10.2.1 Python环境
10.2.2 TensorFlow环境
10.2.3 安装所需的包
10.3 模块实现
10.3.1 数据预处理
10.3.2 模型一的构建和训练
10.3.3 模型二的构建和训练
10.3.4 乱序成语验证码识别
10.3.5 可视化界面的实现
10.4 系统测试
10.4.1 训练准确率
10.4.2 测试效果
10.4.3 可视化界面应用
项目11 PROJECT 11 基于CNN的SNEAKERS识别
11.1 总体设计
11.1.1 系统整体结构
11.1.2 系统流程
11.2 运行环境
11.2.1 Python环境与Flask框架
11.2.2 环境配置与工具包
11.2.3 微信小程序环境
11.3 模块实现
11.3.1 数据制作
11.3.2 数据构建
11.3.3 模型训练及保存
11.3.4 模型测试
11.3.5 前端与后台搭建
11.4 系统测试
11.4.1 训练准确率
11.4.2 测试效果
11.4.3 模型应用
项目12 PROJECT 12 基于SRGAN的单图像超分辨率
12.1 总体设计
12.1.1 系统整体结构
12.1.2 系统流程
12.2 运行环境
12.2.1 Python环境
12.2.2 PyTorch环境
12.2.3 网页端Flask框架
12.2.4 PyQt环境配置
12.3 模块实现
12.3.1 数据预处理
12.3.2 数据导入
12.3.3 定义模型
12.3.4 定义损失函数
12.3.5 模型训练及保存
12.3.6 服务器端架构
12.3.7 本地单机程序
12.4 系统测试
项目13 PROJECT 13 滤镜复制
13.1 总体设计
13.1.1 系统整体结构
13.1.2 系统流程
13.2 运行环境
13.2.1 Anaconda环境
13.2.2 TensorFlow环境
13.2.3 Keras环境
13.3 模块实现
13.3.1 模式选择
13.3.2 任意风格模式
13.3.3 固定风格模式
13.4 系统测试
13.4.1 任意风格模式测试结果
13.4.2 固定风格模式测试结果
项目14 PROJECT 14 基于PyTorch的快速风格迁移
14.1 总体设计
14.1.1 系统整体结构
14.1.2 系统流程
14.2 运行环境
14.2.1 Python环境
14.2.2 PyTorch环境
14.2.3 PyQt5环境
14.3 模块实现
14.3.1 数据预处理
14.3.2 模型构建
14.3.3 模型训练及保存
14.3.4 界面化及应用
14.4 系统测试
14.4.1 训练准确率
14.4.2 测试效果
14.4.3 程序应用
项目15 PROJECT 15 CASIA-HWDB手写汉字识别
15.1 总体设计
15.1.1 系统整体结构
15.1.2 系统流程
15.2 运行环境
15.2.1 Python环境
15.2.2 TensorFlow环境
15.2.3 wxPython和OpenCV环境
15.2.4 pyttsx3环境
15.3 模块实现
15.3.1 数据预处理
15.3.2 模型构建
15.3.3 模型训练及保存
15.3.4 前端界面
15.4 系统测试
15.4.1 测试效果
15.4.2 模型应用
项目16 PROJECT 16 图像智能修复
16.1 总体设计
16.1.1 系统整体结构
16.1.2 系统流程
16.2 运行环境
16.2.1 Python环境
16.2.2 TensorFlow环境
16.2.3 OpenFace环境
16.3 模块实现
16.3.1 数据预处理
16.3.2 模型构建
16.3.3 模型训练
16.3.4 程序实现
16.3.5 GUI设计
16.3.6 程序打包
16.4 系统测试
16.4.1 GAN网络损失变化
16.4.2 测试效果
项目17 PROJECT 17 黑白图像自动着色
17.1 总体设计
17.1.1 系统整体结构
17.1.2 系统流程
17.2 运行环境
17.3 模块实现
17.3.1 数据预处理
17.3.2 模型构建与训练
17.3.3 模型调用与结果优化
17.3.4 结果展示
17.4 系统测试
项目18 PROJECT 18 深度神经网络压缩与加速技术在风格迁移中的应用
18.1 总体设计
18.1.1 系统整体结构
18.1.2 系统流程
18.2 运行环境
18.2.1 Python环境
18.2.2 GPU环境
18.3 模块实现
18.3.1 数据预处理
18.3.2 创建模型
18.3.3 模型训练及保存
18.3.4 模型测试
18.4 系统测试
18.4.1 风格迁移效果
18.4.2 网络的加速与压缩
项目19 PROJECT 19 迁移学习的狗狗分类器
19.1 总体设计
19.1.1 系统整体结构
19.1.2 系统流程
19.2 运行环境
19.2.1 Python环境
19.2.2 TensorFlow环境
19.2.3 Keras环境
19.2.4 wxPython的安装
19.3 模块实现
19.3.1 数据预处理
19.3.2 模型构建
19.3.3 模型训练
19.3.4 API调用
19.3.5 模型生成
19.4 系统测试
19.4.1 训练准确率
19.4.2 测试效果
19.4.3 模型应用
项目20 PROJECT 20 基于TensorFlow的人脸检测及追踪
20.1 总体设计
20.1.1 系统整体结构
20.1.2 系统流程
20.2 运行环境
20.2.1 Python环境
20.2.2 TensorFlow环境
20.2.3 models环境
20.3 模块实现
20.3.1 数据预处理
20.3.2 模型构建
20.3.3 模型训练及保存
20.4 系统测试
AI源码解读:数字图像处理案例(Python版)是2021年由清华大学出版社出版,作者李永华。
得书感谢您对《AI源码解读:数字图像处理案例(Python版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。