精通机器学习:基于R(第2版)

精通机器学习:基于R(第2版)

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

一本通俗易懂的机器学习和数据分析技巧参考书。

内容简介

机器学习是近年来的热门技术话题,R语言是处理其中大量数据的有力工具。本书为读者提供机器学习和R语言的坚实算法基础和业务基础,内容包括机器学习基本概念、线性回归、逻辑回归和判别分析、线性模型的高级选择特性、K最近邻和支持向量机等,力图平衡实践中的技术和理论两方面。

本书适合试图理解和表述机器学习算法的IT人士、想在分析中发挥R强大威力的统计学专家。即使是同时精通IT技术和统计学的读者,在本书中仍然可以发现一些有用的窍门和技巧。

作者简介

作者Cory Leismester,具有十多年量化管理经验,目前在银行业担任高级量化管理经理,负责构建市场营销和监管模型。曾在礼来公司任职16年,负责销售、市场调查、精益六西格玛、营销分析、新产品预测等工作。

章节目录

版权信息

前言

本书内容

准备工作

目标读者

排版约定

读者反馈

客户支持

下载示例代码

勘误

反盗版

问题

电子书

第1版前言

定义机器学习

机器学习注意事项

失败的特征工程

过拟合与欠拟合

因果关系

本书内容

准备工作

目标读者

排版约定

读者反馈

客户支持

下载示例代码

勘误

反盗版

问题

第1章 成功之路

1.1 流程

1.2 业务理解

1.2.1 确定业务目标

1.2.2 现状评估

1.2.3 确定分析目标

1.2.4 建立项目计划

1.3 数据理解

1.4 数据准备

1.5 建模

1.6 评价

1.7 部署

1.8 算法流程图

1.9 小结

第2章 线性回归:机器学习基础技术

2.1 单变量回归

业务理解

2.2 多变量线性回归

2.2.1 业务理解

2.2.2 数据理解和数据准备

2.2.3 模型构建与模型评价

2.3 线性模型中的其他问题

2.3.1 定性特征

2.3.2 交互项

2.4 小结

第3章 逻辑斯蒂回归与判别分析

3.1 分类方法与线性回归

3.2 逻辑斯蒂回归

3.2.1 业务理解

3.2.2 数据理解和数据准备

3.2.3 模型构建与模型评价

3.3 判别分析概述

判别分析应用

3.4 多元自适应回归样条方法

3.5 模型选择

3.6 小结

第4章 线性模型中的高级特征选择技术

4.1 正则化简介

4.1.1 岭回归

4.1.2 LASSO

4.1.3 弹性网络

4.2 商业案例

4.2.1 业务理解

4.2.2 数据理解和数据准备

4.3 模型构建与模型评价

4.3.1 最优子集

4.3.2 岭回归

4.3.3 LASSO

4.3.4 弹性网络

4.3.5 使用glmnet进行交叉验证

4.4 模型选择

4.5 正则化与分类问题

逻辑斯蒂回归示例

4.6 小结

第5章 更多分类技术:K最近邻与支持向量机

5.1 K最近邻

5.2 支持向量机

5.3 商业案例

5.3.1 业务理解

5.3.2 数据理解和数据准备

5.3.3 模型构建与模型评价

5.3.4 模型选择

5.4 SVM中的特征选择

5.5 小结

第6章 分类回归树

6.1 本章技术概述

6.1.1 回归树

6.1.2 分类树

6.1.3 随机森林

6.1.4 梯度提升

6.2 商业案例

6.2.1 模型构建与模型评价

6.2.2 模型选择

6.2.3 使用随机森林进行特征选择

6.3 小结

第7章 神经网络与深度学习

7.1 神经网络介绍

7.2 深度学习简介

深度学习资源与高级方法

7.3 业务理解

7.4 数据理解和数据准备

7.5 模型构建与模型评价

7.6 深度学习示例

7.6.1 H2O背景介绍

7.6.2 将数据上载到H2O平台

7.6.3 建立训练数据集和测试数据集

7.6.4 模型构建

7.7 小结

第8章 聚类分析

8.1 层次聚类

距离的计算

8.2 K均值聚类

8.3 果瓦系数与围绕中心的划分

8.3.1 果瓦系数

8.3.2 PAM

8.4 随机森林

8.5 业务理解

8.6 数据理解与数据准备

8.7 模型构建与模型评价

8.7.1 层次聚类

8.7.2 K均值聚类

8.7.3 果瓦系数和PAM

8.7.4 随机森林与PAM

8.8 小结

第9章 主成分分析

9.1 主成分简介

主成分旋转

9.2 业务理解

数据理解与数据准备

9.3 模型构建与模型评价

9.3.1 主成分抽取

9.3.2 正交旋转与解释

9.3.3 根据主成分建立因子得分

9.3.4 回归分析

9.4 小结

第10章 购物篮分析、推荐引擎与序列分析

10.1 购物篮分析简介

10.2 业务理解

10.3 数据理解和数据准备

10.4 模型构建与模型评价

10.5 推荐引擎简介

10.5.1 基于用户的协同过滤

10.5.2 基于项目的协同过滤

10.5.3 奇异值分解和主成分分析

10.6 推荐系统的业务理解

10.7 推荐系统的数据理解与数据准备

10.8 推荐系统的建模与评价

10.9 序列数据分析

序列分析应用

10.10 小结

第11章 创建集成多类分类

11.1 集成模型

11.2 业务理解与数据理解

11.3 模型评价与模型选择

11.4 多类分类

11.5 业务理解与数据理解

11.6 模型评价与模型选择

11.6.1 随机森林

11.6.2 岭回归

11.7 MLR集成模型

11.8 小结

第12章 时间序列与因果关系

12.1 单变量时间序列分析

理解格兰杰因果关系

12.2 业务理解

数据理解与数据准备

12.3 模型构建与模型评价

12.3.1 单变量时间序列预测

12.3.2 检查因果关系

12.4 小结

第13章 文本挖掘

13.1 文本挖掘框架与方法

13.2 主题模型

其他定量分析

13.3 业务理解

数据理解与数据准备

13.4 模型构建与模型评价

13.4.1 词频分析与主题模型

13.4.2 其他定量分析

13.5 小结

第14章 在云上使用R语言

14.1 创建AWS账户

14.1.1 启动虚拟机

14.1.2 启动Rstudio

14.2 小结

附录 R语言基础

精通机器学习:基于R(第2版)是2018年由人民邮电出版社·图灵出品出版,作者[美] Cory Lesmeister。

得书感谢您对《精通机器学习:基于R(第2版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
机器学习公式详解 电子书
适读人群 :(1)高等院校人工智能、计算机、自动化等相关专业机器学习方向的学生;(2)学术界机器学习领域的研究人员和教师;(3)工业界对机器学习感兴趣的专业人员和工程师。 1.周志华教授“西瓜书”《机器学习》公式完全解析指南! “南瓜书”系Datawhale成员自学笔记,对“西瓜书”中250个重难点公式做了详细解析和推导(重难点公式覆盖率达99%),旨在解决机器学习中的数学难题。 2.机器学习初学小白提升数学基础能力的必备练习册! 以本科数学基础视角对“西瓜书”里比较难理解的公式加以解析和推导细节,补充大量重、难点数学知识和参考材料,分享在学习中遇到的“坑”以及跳过这个“坑”的方法,对于初学机器学习的小白也能上手练习! 3.俞勇、王斌、李沐、程明明、陈光(博主@爱可可-爱生活)、徐亦达等人工智能领域大咖亲笔推荐
机器学习工程实战 电子书
机器学习入门手册《机器学习精讲》姊妹篇,人工智能和机器学习领域专业人士的多年实践结晶,深入浅出讲解机器学习应用和工程实践。
机器学习案例实战 电子书
机器学习已经广泛地应用于各行各业,深度学习的兴起再次推动了人工智能的热潮。本书结合项目实践,首先讨论了TensorFlow、PySpark、TI-ONE等主流机器学习平台的主要特点;然后结合Tableau介绍了数据可视化在银行客户用卡行为分析的应用。在此基础上,利用上述介绍的这些平台,通过多个项目案例,详细地分析了决策树、随机森林、支持向量机、逻辑回归、贝叶斯网络、卷积神经网络、循环神经网络、对抗
Arduino创意机器人入门——基于ArduBlock(第2版) 电子书
机器人教育融机械、传感与控制等内容为一体,让学生在手脑并用解决实际问题的过程中,有效地提高逻辑思维能力、判断能力、动手能力和创新能力,是实施素质教育的一个重要平台。作为面向中小学的选修课程,《Arduino创意机器人》设计了大量需要学生动手实践的任务或者实验,引导学生在玩中学、做中学,由浅入深地逐步理解和掌握机器人技术。本书课程为浙江省教育科学规划课题《基于Arduino的高中机器人课程建设研究》
Python机器学习经典实例 电子书
用流行的Python库scikitlearn解决机器学习问题。