统计学习导论 基于R应用

统计学习导论 基于R应用

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

内容简介

  统计学习是一套以复杂数据建模和数据理解为目的的工具集,是近期才发展起来的统计学的一个新领域。本书出自统计学习领域声名显赫的几位专家,结合R语言介绍了分析大数据必不可少的工具,提供一些重要的建模和预测技术,并借助丰富的实验来解释如何用R语言实现统计学习方法。论题包括线性回归、分类、重抽样方法、压缩方法、基于树的方法、支持向量机、聚类等,作者借助彩图和实际案例直观解释这些方法。为了读者更好地理解书中内容,每章后还配有丰富的概念性和应用性练习题。

  书中内容与《The Elements of Statistical Learning》的大部分内容相同,但是本书起点低,弱化了数学推导的细节,更注重方法的应用,所以更适合作为入门教材。当然,这本《统计学习导论》不仅是优秀的“统计学习”或“机器学习”课程的教材,也是数据挖掘、数据分析等相关从业者不可或缺的参考书。

作者简介

  Gareth James 斯坦福大学统计学博士毕业,师从Trevor Hastie。现为南加州大学马歇尔商学院统计学教授,美国统计学会会士,数理统计协会终身会员,新西兰统计协会会员。《Statistica Sinica》、《Applications and Case Studies》、《Theory and Methods》等期刊的副主编。

  Daniela Witten 斯坦福大学统计学博士毕业,师从Robert Tibshirani。现为华盛顿大学生物统计学副教授,美国统计学会和国际数理统计协会会士,《Journal of Computational and Graphical Statistics》和《Biometrika》等期刊副主编。

  Trevor Hastie 美国统计学家和计算机科学家,斯坦福大学统计学教授,英国皇家统计学会、国际数理统计协会和美国统计学会会士。Hastie参与开发了 R 中的大部分统计建模软件和环境,发明了主曲线和主曲面。

  Robert Tibshirani 斯坦福大学统计学教授,国际数理统计协会、美国统计学会和加拿大皇家学会会士,1996年COPSS总统奖得主,提出lasso方法。Hastie和Tibshirani都是统计学习领域的泰山北斗,两人合著《The Elements of Statistical Learning》,还合作讲授斯坦福大学的公开课《统计学习》。

章节目录

中文版序

译者序

前言

第1章导论

1.1统计学习概述

1.2统计学习简史

1.3关于这本书

1.4这本书适用的读者群

1.5记号与简单的矩阵代数

1.6本书的内容安排

1.7用于实验和习题的数据集

1.8本书网站

1.9致谢

第2章统计学习

2.1什么是统计学习

2.2评价模型精度

2.3实验: R语言简介

2.4习题

第3章线性回归

3.1简单线性回归

3.2多元线性回归

3.3回归模型中的其他注意事项

3.4营销计划

3.5线性回归与K最近邻法的比较

3.6实验:线性回归

3.7习题

第4章分类

4.1分类问题概述

4.2为什么线性回归不可用

4.3逻辑斯谛回归

4.4线性判别分析

4.5分类方法的比较

4.6R实验:逻辑斯谛回归、LDA、QDA和KNN

4.7习题

第5章重抽样方法

5.1交叉验证法

5.2自助法

5.3实验:交叉验证法和自助法

5.4习题

第6章线性模型选择与正则化

6.1子集选择

6.2压缩估计方法

6.3降维方法

6.4高维问题

6.5实验1:子集选择方法

6.6实验2:岭回归和lasso

6.7实验3:PCR和PLS回归

6.8习题

第7章非线性模型

7.1多项式回归

7.2阶梯函数

7.3基函数

7.4回归样条

7.5光滑样条

7.6局部回归

7.7广义可加模型

7.8实验:非线性建模

7.9习题

第8章基于树的方法

8.1决策树基本原理

8.2装袋法、随机森林和提升法

8.3实验:决策树

8.4习题

第9章支持向量机

9.1最大间隔分类器

9.2支持向量分类器

9.3狭义的支持向量机

9.4多分类的SVM

9.5与逻辑斯谛回归的关系

9.6实验:支持向量机

9.7习题

第10章无指导学习

10.1无指导学习的挑战

10.2主成分分析

10.3聚类分析方法

10.4实验1:主成分分析

10.5实验2:聚类分析

10.6实验3:以NCI60数据为例

10.7习题

统计学习导论 基于R应用是2015年由机械工业出版社出版,作者。

得书感谢您对《统计学习导论 基于R应用》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
基于机器学习的工作流活动推荐 电子书
随着云计算、大数据等的快速发展,越来越多的组织用信息化手段进行流程管理。如何提升流程执行的智能化程度、动态性和柔性,以提高对非标准业务的管理效率,是流程管理面临的一个重要问题。本书基于流程管理系统积累的日志,提出了3种流程管理的工作流活动推荐方法,分别为基于用户类别近邻的活动推荐方法、基于Pearson相关系数的活动推荐方法和基于协同过滤的活动推荐方法,并介绍了一种流程信息的可视化算法,实现了一个
CINEMA 4D R17 完全学习手册(第2版) 电子书
《CINEMA4DR17完全学习手册(第2版)》全面阐述了Cinema4DR17的建模、材质、灯光、渲染、粒子、动力学、毛发、布料、动画、关节、运动图形、效果器、Xpresso、ThinkingParticles、BodyPaint、雕刻、场次等方面的知识(第1~第14章讲解的是Cinema4DR17的基础部分,第15~第27章讲解的是Cinema4DR17的高级部分)。其中雕刻和场次的功能较之前
基于Kotlin的Android应用程序开发 电子书
书籍的核心内容被化分成10个章节,所涉及技术点包含:Kotlin语言、Android界面技术、多线程技术、数据持久化和系统服务等,相关内容的讨论和结果可为基本的Android应用程序开发提供技术指导和支持。本书以案例驱动方式介绍相关程序的实现方法和过程,本书还通过示例程序版本迭代的方式,逐渐升入讨论核心技术和实现方法。
机器学习及应用(在线实验+在线自测) 电子书
机器学习原理与实例代码,包括决策树、神经网络等11章。
R语言编程基础 电子书
《R语言学习手册》:7章全面介绍R语言及Rattle工具,附课后习题。