阿里云天池大赛赛题解析――深度学习篇(博文视点出品)

阿里云天池大赛赛题解析――深度学习篇(博文视点出品)

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

类似推荐

内容简介

本书聚焦深度学习算法建模及相关技术,选取医疗、视频、工业三个非常有行业代表性的赛题:瑞金医院MMC人工智能辅助构建知识图谱、阿里巴巴优酷视频增强和超分辨率挑战赛和布匹疵点智能识别,介绍赛题涉及的技术知识和选手的创新思路与模型,对赛题的解决方案从0到1层层拆解。 本书从经典行业案例出发,内容由浅入深、层层递进,既可以作为专业开发者用书,也可以作为参考选手的实战手册。

作者简介

阿里云天池作为国内**的竞赛平台和AI社区,自诞生以来就一直秉持着让更多人公平获得大数据的理念。也正因此,天池每场经典赛事沉淀的课题和数据集都会永久保留和开放。截至目前,天池平台已举办了超过200场来自真实业务场景的数据竞赛,覆盖政府、金融、交通、物流、航空、电力、医疗等多个领域。

章节目录

目  录
赛题一  瑞金医院MMC人工智能辅助构建知识图谱
0  技术背景 3
0.1  技术现状 3
0.2  实验室介绍 3
1  赛题解读 7
1.1  赛题背景 7
1.2  知识图谱 7
1.2.1  知识图谱的发展历史 7
1.2.2  如何表达知识 9
1.2.3  如何构建知识图谱 11
1.2.4  如何进行知识推理 13
1.3  数据介绍 15
1.3.1  初赛数据 16
1.3.2  复赛数据 17
1.4  评测指标 18
2  数据处理 19
2.1  自然语言处理基础 19
2.1.1  词向量 19
2.1.2  语言模型 20
2.1.3  自然语言处理中的深度学习 24
2.2  数据预处理 29
2.2.1  .txt文件 29
2.2.2  .ann文件 30
2.2.3  使用Python解析文件 32
3  初赛赛题――实体识别 35
3.1  实体识别任务 35
3.2  传统机器学习方法 36
3.2.1  概率图模型 36
3.2.2  隐马尔可夫模型 38
3.2.3  最大熵马尔可夫模型 39
3.2.4  条件随机场模型 40
3.3  深度学习方法 41
3.3.1  双向循环神经网络 41
3.3.2  双向循环神经网络+条件随机场模型 43
3.4  初赛方案 44
3.4.1  数据集构建 44
3.4.2  特征工程 46
3.4.3  模型构建 47
4  复赛赛题――关系抽取 53
4.1  关系抽取任务 53
4.2  传统方法 53
4.2.1  基于模板的抽取 53
4.2.2  基于依存句法的抽取 54
4.2.3  基于统计机器学习的抽取 55
4.3  深度学习方法 56
4.3.1  监督学习 56
4.3.2  半监督学习 57
4.4  复赛方案 59
4.4.1  数据集构建 59
4.4.2  特征工程 62
4.4.3  模型构建 63
5  Neo4j存储知识图谱 69
5.1  Neo4j介绍 69
5.2  Neo4j配置 70
5.2.1  安装 70
5.2.2  Web管理平台 71
5.2.3  Neo4j-shell 72
5.3  数据库构建 72
5.3.1  准备工作 72
5.3.2  创建数据库 72
5.3.3  事务 73
5.3.4  创建节点 73
5.3.5  创建关系 74
5.3.6  查询 74
5.4  Cypher查询 75
5.4.1  读语句 76
5.4.2  写语句 76
5.4.3  通用语句 78
6  赛题进阶讨论 80
6.1  数据标注方法 80
6.1.1  指针标注 80
6.1.2  片段排列 81
6.2  联合抽取 82
6.2.1  共享参数 82
6.2.2  联合标注 84
6.3  大规模预训练语言模型 86
6.3.1  ELMo模型 86
6.3.2  GPT模型 87
6.3.3  BERT模型 89
6.3.4  使用BERT模型进行实体识别与关系抽取 90
赛题二  阿里巴巴优酷视频增强和超分辨率挑战赛
0  技术背景 95
0.1  业界应用 95
0.2  文娱行业面临的画质问题 95
0.3  实验室介绍和技术手段 96
0.4  重点模块 97
0.5  处理效果 98
1  赛题解读 100
1.1  赛题背景 100
1.2  赛题目标 100
1.3  数据概览 100
1.4  评估指标 101
1.5  解题思路 102
1.6  赛题模型 103
2  数据处理 105
2.1  视频和图像处理 105
2.1.1  图像基本概念 105
2.1.2  视频基本概念 106
2.1.3  视频分帧 107
2.1.4  图像处理 108
2.1.5  图片合成视频 110
2.2  工具包 111
2.2.1  OpenCV库 111
2.2.2  FFmpeg库 112
2.3  数据处理 112
2.3.1  安装工具包 112
2.3.2  导入工具包 112
2.3.3  视频转图片函数 112
2.3.4  读取图片并获取大小 113
2.3.5  读取图片并进行灰度处理 114
2.3.6  分帧后的图片灰度处理 114
2.3.7  图片转视频函数 115
3  传统插值方法 117
3.1  插值方法 117
3.1.1  插值方法的基本概念 117
3.1.2  插值原理 118
3.2  插值算法 118
3.2.1  最近邻插值算法 119
3.2.2  双线性插值算法 119
3.2.3  双三次插值算法 120
3.3  几种传统插值算法结果对比 121
3.4  数据处理 122
3.4.1  导入工具包 122
3.4.2  读取图片 122
3.4.3  最近邻插值算法 122
3.4.4  双线性插值算法 123
3.4.5  基于4px×4px邻域的三次插值算法 123
3.4.6  不同插值函数计算PSNR 123
3.4.7  传统插值方法效果对比 123
3.4.8  Bicubic插值算法 124
4  深度插值方法 126
4.1  深度学习 126
4.1.1  卷积神经网络 126
4.1.2  使用SRCNN实现超清分辨率 132
4.2  赛题实践 132
4.2.1  导入工具包 132
4.2.2  读取图片 133
4.2.3  使用Bicubic插值放大至目标尺寸 133
4.2.4  实现SRCNN 133
4.2.5  SRCNN模型训练 133
4.2.6  SRCNN模型验证 135
4.2.7  SRCNN模型预测 135
4.2.8  保存图片 135
5  深度学习方法改进 136
5.1  FSRCNN实现超清分辨率 136
5.2  ESPCN实现超清分辨率 138
5.3  赛题实践 140
5.3.1  导入工具包 140
5.3.2  读取图片 140
5.3.3  FSRCNN 140
5.3.4  ESPCN 142
6  深度学习方法进阶 145
6.1  GAN基本概念 145
6.1.1  GAN生成手写数字 146
6.1.2  GAN训练 147
6.1.3  GAN算法数学形式 148
6.2  CGAN 149
6.3  VGGNet 150
6.4  ResNet 153
6.5  SRGAN结构 156
6.5.1  SRGAN损失函数 157
6.5.2  SRGAN效果 157
6.6  SRGAN实现超清分辨率 158
6.6.1  导入工具包 158
6.6.2  读取图片 159
6.6.3  实现SRGAN 159
6.6.4  SRGAN模型训练 163
6.6.5  SRGAN模型验证 163
6.6.6  SRGAN模型预测 163
6.6.7  保存图片 163
赛题三  布匹疵点智能识别
(2019广东工业智造创新大赛  赛场一)
0  技术背景 167
0.1  行业背景 167
0.2  实验室产品介绍 168
0.3  赛题背景 170
0.4  初赛数据示例 171
0.5  复赛数据示例 172
1  赛题解析 173
1.1  赛题背景分析 173
1.2  计算机视觉 174
1.2.1  计算机视觉简介 174
1.2.2  计算机视觉发展历史 175
1.2.3  计算机视觉方法 177
1.3  数据集介绍 178
1.4  赛题指标介绍 179
1.5  赛题初步分析 181
2  深度学习基础 182
2.1  感知机 182
2.2  梯度下降法 184
2.3  多层感知机 186
2.4  反向传播 189
2.5  深度神经网络PyTorch实现 189
3  卷积神经网络与数据处理 193
3.1  卷积运算与互相关运算 193
3.2  卷积神经网络 195
3.3  卷积神经网络的反向传播算法 198
3.4  卷积神经网络PyTorch实现 199
3.4.1  卷积神经网络简单实现示例 199
3.4.2  竞赛数据预训练模型 202
4  区域卷积神经网络系列算法 204
4.1  目标检测的基本概念 204
4.2  区域卷积神经网络 205
4.3  Fast R-CNN算法 210
4.4  Faster R-CNN算法 214
4.5  目标检测Faster R-CNN算法实战 218
5  实例分割Mask R-CNN算法 226
5.1  实例分割 226
5.2  Mask R-CNN算法 226
5.3  PyTorch实现实例分割 230
6  赛题最优算法与提升思路 237
6.1  级联区域卷积神经网络 237
6.2  目标检测赛题提升思路 239
6.3  mm-detection框架下的算法实现 241
参考文献 242

阿里云天池大赛赛题解析――深度学习篇(博文视点出品)是2021年由电子工业出版社出版,作者天池平台。

得书感谢您对《阿里云天池大赛赛题解析――深度学习篇(博文视点出品)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
深度学习原理与实践 电子书
(1)大量图例,简单易懂。作者亲自绘制了大量插图,力求还原深度学习的算法思想,分解和剖析晦涩的算法,用图例来表示复杂的问题。生动的图例也能给读者带来阅读乐趣,快乐地学习算法知识,体会深度学习的算法本质。 (2)简化公式,生动比喻。深度学习和机器学习类的书中通常会有大量复杂冗长的算法公式,为了避免出现读者读不懂的情况,本书尽可能地统一了公式和符号,简化相关公式,并加以生动的比喻进行解析。在启发读者的同时,锻炼读者分析问题和解决问题的能力。 (3)算法原理,代码实现。在介绍深度学习及相关算法的原理时,不仅给出了对应的公式,还给出了实现和求解公式的代码,让读者明确该算法的作用、输入和输出。原理与代码相结合,使得读者对深度学习的算法实现更加具有亲切感。 (4)深入浅出,精心剖析。理解深度学习需要一定的机器学习知识,本书在D1章介绍了深度学习与机器学习的关系,并简要介绍了机器学习的内容。在内容安排上,每章依次介绍模型框架的应用场景、结构和使用方式,最后通过真实的案例去全面分析该模型结构。目的是让读者可以抓住深度学习的本质。 (5)入门实践,案例重现。每一章最后的真实案例不是直接堆砌代码,而是讲解使用该算法模型的原因和好处。从简单的背景知识出发,使用前文讲解过的深度学习知识实现一个实际的工程项目。实践可以用于及时检验读者对所学知识的掌握程度,为读者奠定深度学习的实践基础。 将一本技术书籍写得通俗易懂谈何容易,但《深度学习原理与实践》这本书确实做到了。书中对近年来火热的深度学习理论知识进行简单剖析,化繁为简,没有局限于坐而论道,而是将实例和数学理论相结合,让读者能够快速理解各种模型并上手实践,值得细读。 --唐春明 广州大学数学与信息学科学院副院长 本书从原理、方法、实践这 3 个维度系统地介绍了深度学习的方方面面,内容详实,解读清晰,细节与全貌兼顾,既适合初学者阅读,也可以作为深入研究的参考用书。 --杨刚 西安电子科技大学教授 近年来出版的深度学习相关图书中,本书是我见过非常有指导意义的中文书籍之一。本书对 ANN、CNN、RNN 等模型进行深入浅出的介绍,引入大量图例和简化后的公式,让算法浅显易懂。每一章的实践内容都给人惊喜,强烈推荐! --吴健之 腾讯音乐高级工程师 作为产品经理,我能看懂的深度学习书籍实在太少了。本书恰到好处,插图丰富直观,数学公式简练,很喜欢此类风格的图书,易懂好学。即使你不是程序员或算法专家,该书也值得一看! --张瑞 中软国际高级产品经理
深度强化学习实战 电子书
详解深度强化学习,从入门到实战。
Spring源码深度解析(第2版) 电子书
一本实践与理论并重、广度与深度兼顾的Spring源码开发指南。
PaddlePaddleFluid深度学习入门与实战 电子书
本书全面讲解PaddlePaddle Fluid框架在深度学习领域的应用。
深度学习程序设计实战 电子书
本书以Python语言和Tensorflow为工具,由浅入深地讲述了深度学习程序设计的基本原理、算法和思考问题的方法,内容包括自顶向下的程序设计、递归程序设计、面向对象的程序设计、反向传播算法、三层神经网络、卷积神经网络、循环神经网络、生成式对抗网络和目标检测等。