机器学习

机器学习

编辑推荐

内容全面;结构合理;叙述清楚;深入浅出。人工智能领域中文的开山之作!

内容简介

机器学习是计算机科学与人工智能的重要分支领域. 本书作为该领域的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面.

全书共16 章,大致分为3 个部分:

第1 部分(第1~3 章)介绍机器学习的基础知识;

第2 部分(第4~10 章)讨论一些经典而常用的机器学习方法(决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习);

第3 部分(第11~16 章)为进阶知识,内容涉及特征选择与稀疏学习、计算学习理论、半监督学习、概率图模型、规则学习以及强化学习等. 每章都附有习题并介绍了相关阅读材料,以便有兴趣的读者进一步钻研探索。

本书可作为高等院校计算机、自动化及相关专业的本科生或研究生教材,也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。

作者简介

周志华,南京大学计算机系教授,ACM杰出科学家,IEEE Fellow, IAPR Fellow, IET/IEE Fellow, 中国计算机学会会士。国家杰出青年科学基金获得者、长江学者特聘教授。先后担任多种SCI(E)期刊执行主编、副主编、副编辑、编委等。中国计算机学会人工智能与模式识别专业委员会主任,中国人工智能学会机器学习专业委员会主任,IEEE计算智能学会数据挖掘技术委员会副主席。

章节目录

目录

第1章 1

1.1 引言1

1.2 基本术 2

1.3 假设空间 4

1.4 归纳偏好6

1.5 发展历程 10

1.6 应用现状 13

1.7 阅读材料 16

习题 19

参考文献 20

休息一会儿 22

第2章 模型评估与选择23

2.1 经验误差与过拟合23

2.2 评估方法24

2.2.1 留出法25

2.2.2 交叉验证法26

2.2.3 自助法27

2.2.4 调参与最终模型28

2.3 性能度量28

2.3.1 错误率与精度29

2.3.2 查准率、查全率与F130

2.3.3 ROC与AUC33

2.3.4 代价敏感错误率与代价曲线35

2.4 比较检验37

2.4.1 假设检验37

2.4.2 交叉验证t检验40

2.4.3 McNemar检验41

2.4.4 Friedman检验与后续检验42

2.5 偏差与方差44

2.6 阅读材料46

习题48

参考文献49

休息一会儿51

第3章 线性模型53

3.1 基本形式53

3.2 线性回归53

3.3 对数几率回归57

3.4 线性判别分析60

3.5 多分类学习63

3.6 类别不平衡问题66

3.7 阅读材料67

习题 69

参考文献 70

休息一会儿 72

第4章 决策树73

4.1 基本流程73

4.2 划分选择75

4.2.1 信息增益75

4.2.2 增益率77

4.2.3 基尼指数79

4.3 剪枝处理79

4.3.1 预剪枝80

4.3.2 后剪枝82

4.4 连续与缺失值83

4.4.1 连续值处理83

4.4.2 缺失值处理85

4.5 多变量决策树88

4.6 阅读材料92

习题 93

参考文献 94

休息一会儿 95

第5章神经网络97

5.1 神经元模型97

5.2 感知机与多层网络98

5.3 误差逆传播算法101

5.4 全局最小与局部极小106

5.5 其他常见神经网络108

5.5.1 RBF网络108

5.5.2 ART网络108

5.5.3 SOM网络109

5.5.4 级联相关网络110

5.5.5 Elman网络111

5.5.6 Boltzmann机111

5.6 深度学习113

5.7 阅读材料115

习题 116

参考文献 117

休息一会儿 120

第6章支持向量机121

6.1 间隔与支持向量121

6.2 对偶问题123

6.3 核函数126

6.4 软间隔与正则化129

6.5 支持向量回归133

6.6 核方法137

6.7 阅读材料139

习题 141

参考文献 142

休息一会儿 145

第7章 贝叶斯分类器147

7.1 贝叶斯决策论147

7.2 极大似然估计149

7.3 朴素贝叶斯分类器150

7.4 半朴素贝叶斯分类器154

7.5 贝叶斯网156

7.5.1 结构157

7.5.2 学习159

7.5.3 推断161

7.6 EM算法162

7.7 阅读材料164

习题 166

参考文献 167

休息一会儿 169

第8章 集成学习171

8.1 个体与集成171

8.2 Boosting173

8.3 Bagging与随机森林178

8.3.1 Bagging178

8.3.2 随机森林179

8.4 结合策略181

8.4.1 平均法181

8.4.2 投票法182

8.4.3 学习法183

8.5 多样性185

8.5.1 误差--分歧分解185

8.5.2 多样性度量186

8.5.3 多样性增强188

8.6 阅读材料190

习题 192

参考文献 193

休息一会儿 196

第9章聚类197

9.1 聚类任务197

9.2 性能度量197

9.3 距离计算199

9.4 原型聚类202

9.4.1 k均值算法202

9.4.2 学习向量量化204

9.4.3 高斯混合聚类206

9.5 密度聚类211

9.6 层次聚类214

9.7 阅读材料217

习题 220

参考文献 221

休息一会儿 224

第10章 降维与度量学习225

10.1 k近邻学习225

10.2 低维嵌入226

10.3 主成分分析229

10.4 核化线性降维232

10.5 流形学习234

10.5.1 等度量映射234

10.5.2 局部线性嵌入235

10.6 度量学习237

10.7 阅读材料240

习题 242

参考文献 243

休息一会儿 246

第11章特征选择与稀疏学习247

11.1 子集搜索与评价247

11.2 过滤式选择249

11.3 包裹式选择250

11.4 嵌入式选择与L$_1$正则化252

11.5 稀疏表示与字典学习254

11.6 压缩感知257

11.7 阅读材料260

习题 262

参考文献 263

休息一会儿 266

第12章计算学习理论267

12.1 基础知识267

12.2 PAC学习268

12.3 有限假设空间270

12.3.1 可分情形270

12.3.2 不可分情形272

12.4 VC维273

12.5 Rademacher复杂度279

12.6 稳定性284

12.7 阅读材料287

习题 289

参考文献 290

休息一会儿 292

第13章 半监督学习293

13.1 未标记样本293

13.2 生成式方法295

13.3 半监督SVM298

13.4 图半监督学习300

13.5 基于分歧的方法304

13.6 半监督聚类307

13.7 阅读材料311

习题 313

参考文献 314

休息一会儿 317

第14章概率图模型319

14.1 隐马尔可夫模型319

14.2 马尔可夫随机场322

14.3 条件随机场325

14.4 学习与推断328

14.4.1 变量消去328

14.4.2 信念传播330

14.5 近似推断331

14.5.1 MCMC采样331

14.5.2 变分推断334

14.6 话题模型337

14.7 阅读材料339

习题 341

参考文献 342

休息一会儿 345

第15章规则学习347

15.1 基本概念347

15.2 序贯覆盖349

15.3 剪枝优化352

15.4 一阶规则学习354

15.5 归纳逻辑程序设计357

15.5.1 最小一般泛化358

15.5.2 逆归结359

15.6 阅读材料363

习题 365

参考文献 366

休息一会儿 369

第16章 强化学习371

16.1 任务与奖赏371

16.2 $K$-摇臂赌博机373

16.2.1 探索与利用373

16.2.2 $\epsilon $-贪心374

16.2.3 Softmax375

16.3 有模型学习377

16.3.1 策略评估377

16.3.2 策略改进379

16.3.3 策略迭代与值迭代381

16.4 免模型学习382

16.4.1 蒙特卡罗强化学习383

16.4.2 时序差分学习386

16.5 值函数近似388

16.6 模仿学习390

16.6.1 直接模仿学习391

16.6.2 逆强化学习391

16.7 阅读材料393

习题 394

参考文献 395

休息一会儿 397

附录399

A 矩阵399

B 优化403

C 概率分布409

后记417

索引419

机器学习是2016年由清华大学出版社出版,作者周志华。

得书感谢您对《机器学习》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
R语言入门与实践 电子书

本书适合立志成为数据科学家的R语言初学者阅读。
统计思维:程序员数学之概率统计(第2版) 电子书

本书介绍了如何借助计算而非数学方法,使用Python语言对数据进行统计分析。
跟着迪哥学:Python数据分析与机器学习实战 电子书

本书适合对人工智能、机器学习、数据分析等方向感兴趣的初学者和爱好者。
HBase入门与实践 电子书

大数据时代快速上手HBase行动指南。
机器学习 电子书

机器学习基础与高级内容全面讲解,实例丰富,易于学习巩固。
Python机器学习经典实例 电子书

用流行的Python库scikitlearn解决机器学习问题。
百面深度学习 算法工程师带你去面试 电子书

适读人群:本书适合相关专业的在校学生检查和加强对所学知识点的掌握程度,求职者快速复习和补充相关的深度学习知识,以及算法工程师作为工具书随时参阅。此外,非相关专业、但对人工智能或...