编辑推荐
一部通过R语言掌握数据科学技能的快速入门指南。
内容简介
随着R语言的流行,从数据中学习比过去更加轻松。本书是通过R语言掌握数据科学技能的快速入门指南,书中一步一步地介绍如何在免费和流行的R统计包中建立每一种类型的模型。书中的案例描述得很清楚,几乎所有的代码都可以使用。读完本书,读者将可以在自己专注的某个领域把书中所介绍的技术付诸实践。
本书适合数据科学入门的读者阅读,尤其是通过R语言实现数据建模和分析方法的读者学习。
作者简介
作者尼格尔·刘易斯,一位数据科学和预测领域的讲师、作者和研究者。他在华尔街和伦敦从事投资管理工作多年,编著了统计、数据科学和量化模型方面的数本图书,并且在大学里开设深度学习、机器学习和数据分析应用等方面的课程。
章节目录
版权信息
内容提要
致谢
译者简介
前言
其他资源
阅读本书的建议
第1章 简明学习问题
1.1 归纳推理和演绎推理的基础
1.1.1 你曾遇到过这些事情吗?
1.1.2 释放归纳的力量
1.1.3 推断的阴阳之道
1.2 学习问题的三大要素
1.3 从数据中学习的目标
1.3.1 阐明选择标准
1.3.2 学习任务的选择
第2章 监督学习
2.1 有效分类的基本要素
2.2 如何确定假设类别的答案
2.3 监督学习的两个核心方法
2.3.1 生成算法的关键
2.3.2 理解判别算法
2.4 什么是贝叶斯分类器
误差下界
2.5 评估贝叶斯误差的两种简单技巧
2.5.1 Mahalanobis技巧
2.5.2 Bhattacharyya技巧
2.6 如何释放朴素贝叶斯分类器的力量
一个建立直觉的例子
2.7 朴素贝叶斯分类器的R极简建立方法
2.7.1 一个模拟的例子
2.7.2 甲状腺数据的分析
2.8 如何利用k-近邻算法的价值
深化理解的例子
2.9 k近邻的R直接方法
如何决定k的最优值
2.10 线性判别分析的关键
求解广义特征值问题
2.11 R判别分析的基本要素
2.11.1 检查你想要的模型类型
2.11.2 不要止步于线性判别分析
2.12 逻辑回归分类的秘密
2.13 建立R逻辑回归分类器的简便方法
2.14 激励创意和激情的超级好主意
第3章 无监督学习
3.1 无监督学习简介
3.2 两种核心方法及其工作原理
3.3 无监督学习的应用技术及R实现
3.4 无监督学习的典型例子,你可以模仿学习
3.4.1 数据(图像)预处理
3.4.2 处理图像中的噪声
3.4.3 颅骨“剥离”
3.4.4 完美组合
第4章 半监督学习
4.1 未标记数据的作用
4.2 一致性假设
4.3 尝试半监督学习的极简方法
4.4 自学习算法
4.5 基于半监督模型的R学习
4.6 使用土地分类掌握这种实践说明
第5章 统计学习理论
5.1 Vapnik-Chervonenkis泛化界
5.2 什么是Vapnik-Chervonenkis维
5.3 结构风险最小化的关键
5.4 实践中使用统计学习理论的最佳建议
5.5 如何精通支持向量机
5.5.1 支持向量机的本质
5.5.2 松弛的处理
5.5.3 如何建立R支持向量机
第6章 模型选择
6.1 模型的快速改进
6.2 一个价值500万美元的小错误
6.3 “天下没有免费午餐”定理之三大关键教训
6.4 什么是偏差和方差权衡
6.4.1 可约误差
6.4.2 偏差
6.4.3 方差
6.5 你的模型犯过这种错吗?
6.6 留出技术的秘密
6.7 有效交叉验证的艺术
6.7.1 k-折交叉验证
6.7.2 一个R案例
6.7.3 留一验证
恭喜你!
机器学习实践指南:基于R语言是2018年由人民邮电出版社出版,作者[英]尼格尔·刘易斯。
得书感谢您对《机器学习实践指南:基于R语言》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。