数据科学与机器学习:数学与统计方法

数据科学与机器学习:数学与统计方法

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

一本系统展示现代机器学习技术背后数学思想的参考书。

内容简介

本书侧重于数学理解,书中有独立、易懂且全面的演示,及大量的习题和范例,还有很多用Python代码实现的具体算法。

本书旨在为有兴趣更好地理解数学和统计的学生提供一个可访问的、全面的教科书。

作者简介

作者迪尔克·P.克洛泽,博士,昆士兰大学数学和统计学教授,著名交叉熵方法的先驱。他在数学、统计学、数据科学、机器学习和蒙特卡罗方法等领域发表了120多篇论文,出版了5本专著。

章节目录

版权信息

译者序

前言

数学符号

第1章 导入、汇总和可视化数据

1.1 简介

1.2 类型结构特征

1.3 汇总表

1.4 汇总统计量

1.5 数据可视化

1.5.1 定性变量绘图

1.5.2 定量变量绘图

1.5.3 双变量的数据可视化

1.6 扩展阅读

1.7 习题

第2章 统计学习

2.1 简介

2.2 监督学习和无监督学习

2.3 训练损失和测试损失

2.4 统计学习中的权衡处理

2.5 估计风险

2.5.1 样本内风险

2.5.2 交叉验证

2.6 数据建模

2.7 多元正态模型

2.8 正态线性模型

2.9 贝叶斯学习

2.10 扩展阅读

2.11 习题

第3章 蒙特卡罗方法

3.1 简介

3.2 蒙特卡罗抽样

3.2.1 生成随机数

3.2.2 模拟随机变量

3.2.3 模拟随机向量和随机过程

3.2.4 重采样

3.2.5 马尔可夫链蒙特卡罗

3.3 蒙特卡罗估计

3.3.1 朴素蒙特卡罗

3.3.2 自举法

3.3.3 方差缩减

3.4 蒙特卡罗优化

3.4.1 模拟退火

3.4.2 交叉熵方法

3.4.3 分裂优化

3.4.4 噪声优化

3.5 扩展阅读

3.6 习题

第4章 无监督学习

4.1 简介

4.2 无监督学习的风险和损失

4.3 期望最大化算法

4.4 经验分布和密度估计

4.5 通过混合模型聚类

4.5.1 混合模型

4.5.2 混合模型的EM算法

4.6 向量量化聚类

4.6.1 K均值

4.6.2 通过连续多极值优化进行聚类

4.7 层次聚类

4.8 主成分分析

4.8.1 动机:椭球体的主轴

4.8.2 PCA和奇异值分解

4.9 扩展阅读

4.10 习题

第5章 回归

5.1 简介

5.2 线性回归

5.3 线性模型分析

5.3.1 参数估计

5.3.2 模型选择和预测

5.3.3 交叉验证与预测残差平方和

5.3.4 样本内风险和赤池信息准则

5.3.5 分类特征

5.3.6 嵌套模型

5.3.7 决定系数

5.4 正态线性模型的推理

5.4.1 比较两个正态线性模型

5.4.2 置信区间和预测区间

5.5 非线性回归模型

5.6 用Python实现线性模型

5.6.1 建模

5.6.2 分析

5.6.3 方差分析

5.6.4 置信区间和预测区间

5.6.5 模型验证

5.6.6 变量选择

5.7 广义线性模型

5.8 扩展阅读

5.9 习题

第6章 正则化和核方法

6.1 简介

6.2 正则化

6.3 再生核希尔伯特空间

6.4 再生核的构造

6.4.1 通过特征映射构造再生核

6.4.2 根据特征函数构造再生核

6.4.3 利用正交特征构造再生核

6.4.4 通过核构造再生核

6.5 表示定理

6.6 平滑三次样条

6.7 高斯过程回归

6.8 核PCA

6.9 扩展阅读

6.10 习题

第7章 分类

7.1 简介

7.2 分类评价指标

7.3 基于贝叶斯规则的分类

7.4 线性判别分析和二次判别分析

7.5 逻辑回归和softmax分类

7.6 K近邻分类

7.7 支持向量机

7.8 使用Scikit-Learn进行分类

7.9 扩展阅读

7.10 习题

第8章 决策树和集成方法

8.1 简介

8.2 自顶向下的决策树构建方法

8.2.1 区域预测函数

8.2.2 分裂规则

8.2.3 终止条件

8.2.4 基本实现

8.3 其他考虑因素

8.3.1 二叉树与非二叉树

8.3.2 数据预处理

8.3.3 替代分裂规则

8.3.4 类别变量

8.3.5 缺失值

8.4 控制树形

8.4.1 代价复杂度剪枝

8.4.2 决策树的优点和局限性

8.5 自举聚合

8.6 随机森林

8.7 提升法

8.8 扩展阅读

8.9 习题

第9章 深度学习

9.1 简介

9.2 前馈神经网络

9.3 反向传播

9.4 训练方法

9.4.1 最速下降法

9.4.2 Levenberg-Marquardt方法

9.4.3 受限内存BFGS方法

9.4.4 自适应梯度法

9.5 Python示例

9.5.1 简单多项式回归

9.5.2 图像分类

9.6 扩展阅读

9.7 习题

附录A 线性代数与泛函分析

A.1 向量空间、基和矩阵

A.2 内积

A.3 复向量和复矩阵

A.4 正交投影

A.5 特征值和特征向量

A.6 矩阵分解

A.6.1 (P)LU分解

A.6.2 伍德伯里恒等式

A.6.3 Cholesky分解

A.6.4 QR分解与格拉姆-施密特过程

A.6.5 奇异值分解

A.6.6 求解结构化矩阵方程

A.7 泛函分析

A.8 傅里叶变换

A.8.1 离散傅里叶变换

A.8.2 快速傅里叶变换

附录B 多元微分与优化问题

B.1 多元微分

B.1.1 泰勒展开

B.1.2 链式法则

B.2 优化理论

B.2.1 凸性和优化

B.2.2 拉格朗日方法

B.2.3 对偶

B.3 数值寻根和最小化

B.3.1 牛顿类方法

B.3.2 拟牛顿法

B.3.3 正态近似法

B.3.4 非线性最小二乘法

B.4 通过惩罚函数进行约束最小化

附录C 概率与统计

C.1 随机实验和概率空间

C.2 随机变量和概率分布

C.3 期望

C.4 联合分布

C.5 条件分布与独立分布

C.5.1 条件概率

C.5.2 独立性

C.5.3 期望和协方差

C.5.4 条件密度和条件期望

C.6 随机变量的函数

C.7 多元正态分布

C.8 随机变量的收敛性

C.9 大数定律和中心极限定理

C.10 马尔可夫链

C.11 统计学

C.12 估计

C.12.1 矩方法

C.12.2 最大似然法

C.13 置信区间

C.14 假设检验

附录D Python入门

D.1 入门指南

D.2 Python对象

D.3 类型和运算符

D.4 函数和方法

D.5 模块

D.6 流程控制

D.7 迭代

D.8 类

D.9 文件

D.10 NumPy

D.10.1 数组创建和塑形

D.10.2 切片

D.10.3 数组操作

D.10.4 随机数

D.11 matplotlib

D.12 Pandas

D.12.1 Series和DataFrame

D.12.2 数据帧的操作

D.12.3 提取信息

D.12.4 绘图

D.13 Scikit-Learn

D.13.1 数据分割

D.13.2 归一化

D.13.3 拟合和预测

D.13.4 模型测试

D.14 系统调用、URL访问和加速

参考文献

数据科学与机器学习:数学与统计方法是2022年由机械工业出版社出版,作者[澳] 迪尔克·P.克洛泽。

得书感谢您对《数据科学与机器学习:数学与统计方法》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
机器学习与Python实践 电子书
机器学习理论实践全书,12章内容丰富,适合各层次读者。
Python高手修炼之道:数据处理与机器学习实战 电子书
适读人群 :1.没有编程知识的新手 不同于一般的基础语法讲解教程,本书并未将Python 开发限定于某个集成开发工具(IDE)中,而是采用交互式编程的方式来强化读者对语言特性的理解,帮助新手读者真正理解Python 语言和Python 编程。2.从未接触过Python 语言,但了解一点编程知识的初学者 本书通过对基础知识高度的提炼和概括,以避免初学者陷入低级且冗长的细节知识点而心生懈怠;同时,本书为初学者规划了从初级到高级的编程技能提升路线图。3.具有一定基础的Python 程序员 本书可以作为案头工具书来使用。本书从基础语法、基本技能讲起,涵盖了科学计算、数据处理、机器学习等领域,示例代码涉及30 余个模块的使用。 构建从Python入门到数据分析到机器学习的路线图,入门有章可循; 1.讲解独到,常见盲点趣解析 作者基于多年的经验积累,善于总结概括初学Python过程中的误区。 2.内容全面,常用工具全涵盖 书中介绍的Python工具包覆盖Numpy、Matplotlib、Pandas、SciPy、Scikit-Learn,方便读者拓展实用技能、掌握工作利器。 3.拓展训练,重点知识有强化 语感训练100题、Python内置函数(类)手册、从新手到高手的100个模块,强化知识点的掌握。 4.代码完整,随时动手可复现 本书提供了完整、可验证的代码,方便读者动手练习并强化理解。
数据科学的数学基础 电子书
本书共11章,主要内容包括:线性代数基础、线性空间与线性变换、向量与矩阵范数、矩阵分解、概率统计基础、随机过程等。
Python机器学习入门与实战 电子书
本书以零基础讲解为特色,用实例引导读者学习,深入浅出地介绍Python机器学习的相关知识和实战技能。
Python机器学习编程与实战 电子书
本书共8章,内容包括Python概述、NumPy数值计算、pandas基础、pandas进阶、Matplotlib绘图、scikit-learn、餐饮企业综合分析与预测、通信运营商客户流失分析与预测。前6章设置了选择题、填空题和操作题,后两章设置了操作题,希望通过练习和操作实践,读者可以巩固所学的内容。