机器学习基础:从入门到求职

机器学习基础:从入门到求职

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

一本机器学习算法方面的理论+实践读物。

内容简介

本书主要包含机器学习基础理论、回归模型、分类模型、聚类模型、降维模型和深度学习模型六大部分。

机器学习基础理论部分包含第1、2章,主要介绍机器学习的理论基础和工程实践基础。第3章是回归模型部分,主要包括模型的建立、学习策略的确定和优化算法的求解过程,最后结合三种常见的线性回归模型实现了一个房价预测的案例。

第4至11章详细介绍了几种常见的分类模型,包括朴素贝叶斯模型、K近邻模型、决策树模型、Logistic回归模型、支持向量机模型、随机森林模型、AdaBoost模型和提升树模型,每一个模型都给出了较为详细的推导过程和实际应用案例。

第12章系统介绍了五种常见的聚类模型,包括K-Means聚类、层次聚类、密度聚类、谱聚类和高斯混合聚类,每一个模型的原理、优缺点和工程应用实践都给出了较为详细的说明。第13章系统介绍了四种常用的降维方式,包括奇异值分解、主成分分析、线性判别分析和局部线性嵌入,同样给出了详细的理论推导和分析。

最后两章分别是词向量模型和深度神经网络模型,其中,词向量模型详细介绍了Word2Vec和Doc2Vec模型的原理推导和应用;深度神经网络模型系统介绍了深度学习相关的各类基础知识。

本书适合对人工智能和机器学习感兴趣的学生、求职者和已工作人士,以及想要使用机器学习这一工具的跨行业者(有最基本的高等数学、线性代数、概率基础即可),具体判别方法建议您阅读本书的前言。

作者简介

编著者胡欢武,毕业于上海交通大学电子与通信工程专业,研究机器学习和数据挖掘方面近4年。运营有数据科学方面的知乎专栏和微信公众号。

章节目录

版权信息

前言

第1章 机器学习概述

1.1 机器学习介绍

1.1.1 机器学习的特点

1.1.2 机器学习的对象

1.1.3 机器学习的应用

1.2 机器学习分类

1.2.1 按任务类型分类

1.2.2 按学习方式分类

1.2.3 生成模型与判别模型

1.3 机器学习方法三要素

1.3.1 模型

1.3.2 策略

1.3.3 算法

1.3.4 小结

第2章 机器学习工程实践

2.1 模型评估指标

2.1.1 回归模型的评估指标

2.1.2 分类模型的评估指标

2.1.3 聚类模型的评估指标

2.1.4 常用距离公式

2.2 模型复杂度度量

2.2.1 偏差与方差

2.2.2 过拟合与正则化

2.3 特征工程与模型调优

2.3.1 数据挖掘项目流程

2.3.2 特征工程

2.3.3 模型选择与模型调优

第3章 线性回归

3.1 问题引入

3.2 线性回归模型

3.2.1 模型建立

3.2.2 策略确定

3.2.3 算法求解

3.2.4 线性回归模型流程

3.3 线性回归的scikit-learn实现

3.3.1 普通线性回归

3.3.2 Lasso回归

3.3.3 岭回归

3.3.4 ElasticNet回归

3.4 线性回归实例

3.5 小结

第4章 朴素贝叶斯

4.1 概述

4.2 相关原理

4.2.1 朴素贝叶斯基本原理

4.2.2 原理的进一步阐述

4.2.3 后验概率最大化的含义

4.2.4 拉普拉斯平滑

4.3 朴素贝叶斯的三种形式及scikit-learn实现

4.3.1 高斯型

4.3.2 多项式型

4.3.3 伯努利型

4.4 中文文本分类项目

4.4.1 项目简介

4.4.2 项目过程

4.4.3 完整程序实现

4.5 小结

第5章 K近邻

5.1 概述

5.2 K近邻分类原理

5.2.1 K值的选择

5.2.2 距离度量

5.2.3 分类决策规则

5.2.4 K近邻分类算法过程

5.3 K近邻回归原理

5.3.1 回归决策规则

5.3.2 K近邻回归算法过程

5.4 搜索优化——KD树

5.4.1 构造KD树

5.4.2 搜索KD树

5.5 K近邻的scikit-learn实现

5.5.1 K近邻分类

5.5.2 K近邻回归

5.6 K近邻应用实例

5.7 小结

第6章 决策树

6.1 概述

6.2 特征选择

6.2.1 信息增益

6.2.2 信息增益比

6.2.3 基尼系数

6.3 决策树的生成

6.3.1 ID3决策树

6.3.2 C4.5决策树

6.3.3 CART决策树

6.4 决策树的剪枝

6.5 决策树的scikit-learn实现

6.6 决策树应用于文本分类

6.7 小结

第7章 Logistic回归

7.1 Logistic回归概述

7.2 Logistic回归原理

7.2.1 Logistic回归模型

7.2.2 Logistic回归学习策略

7.2.3 Logistic回归优化算法

7.3 多项Logistic回归

7.4 Logistic回归的scikit-learn实现

7.5 Logistic回归实例

7.6 小结

第8章 支持向量机

8.1 感知机

8.1.1 感知机模型

8.1.2 感知机学习策略

8.1.3 感知机优化算法

8.1.4 感知机模型整体流程

8.1.5 小结

8.2 硬间隔支持向量机

8.2.1 引入

8.2.2 推导

8.3 软间隔支持向量机

8.4 合页损失函数

8.5 非线性支持向量机

8.6 SVM模型的scikit-learn实现

8.6.1 线性SVM模型

8.6.2 非线性SVM模型

8.7 SVM模型实例

8.8 小结

第9章 随机森林

9.1 Bagging模型

9.2 随机森林

9.3 RF的推广——extra trees

9.4 RF的scikit-learn实现

9.5 RF的scikit-learn使用实例

9.5.1 程序

9.5.2 结果及分析

9.5.3 扩展

9.6 小结

第10章 AdaBoost

10.1 AdaBoost的结构

10.1.1 AdaBoost的工作过程

10.1.2 AdaBoost多分类问题

10.1.3 AdaBoost的回归问题

10.2 AdaBoost的原理

10.3 AdaBoost的scikit-learn实现

10.4 AdaBoost使用实例

10.5 AdaBoost的优/缺点

第11章 提升树

11.1 提升树的定义

11.2 梯度提升树

11.2.1 梯度提升树的原理推导

11.2.2 GBDT和GBRT模型的处理过程

11.2.3 梯度提升模型的scikit-learn实现

11.2.4 梯度提升模型的scikit-learn使用实例

11.2.5 GBDT模型的优/缺点

11.3 XGBoost

11.3.1 XGBoost的原理

11.3.2 XGBoost调参

11.3.3 XGBoost与GBDT的比较

第12章 聚类

12.1 聚类问题介绍

12.2 K-Means聚类

12.2.1 K-Means聚类过程和原理

12.2.2 K-Means算法优化

12.2.3 小结

12.2.4 K-Means应用实例

12.3 层次聚类

12.3.1 层次聚类的过程和原理

12.3.2 小结

12.3.3 层次聚类应用实例

12.4 密度聚类

12.4.1 密度聚类过程和原理

12.4.2 小结

12.4.3 密度聚类应用实例

12.5 谱聚类

12.5.1 谱聚类的过程和原理

12.5.2 小结

12.5.3 谱聚类应用实例

12.6 高斯混合聚类

12.6.1 高斯混合聚类过程和原理

12.6.2 EM算法

12.6.3 小结

12.6.4 GMM应用实例

第13章 降维

13.1 奇异值分解

13.1.1 矩阵的特征分解

13.1.2 奇异值分解

13.2 主成分分析

13.2.1 PCA原理推导

13.2.2 核化PCA

13.2.3 PCA/KPCA的scikit-learn实现

13.3 线性判别分析

13.3.1 LDA原理推导

13.3.2 LDA与PCA的比较

13.3.3 LDA应用实例

13.4 局部线性嵌入

13.4.1 局部线性嵌入介绍

13.4.2 局部线性嵌入过程和原理

13.4.3 LLE应用实例

第14章 Word2Vec和Doc2Vec词向量模型

14.1 Word2Vec

14.1.1 Word2Vec概述

14.1.2 基于Hierarchical Softmax方法的CBOW模型

14.1.3 基于Hierarchical Softmax方法的Skip-Gram模型

14.1.4 基于Negative Sampling方法的CBOW模型

14.1.5 基于Negative Sampling方法的Skip-Gram模型

14.1.6 Word2Vec应用实例

14.2 Doc2Vec模型

14.2.1 Doc2Vec模型原理

14.2.2 Doc2Vec应用实例

第15章 深度神经网络模型

15.1 深度学习

15.1.1 概述

15.1.2 深度学习发展历史

15.2 神经网络原理

15.2.1 前向传播

15.2.2 反向传播

15.2.3 实例

15.2.4 几种常用激活函数

15.2.5 梯度消失与梯度爆炸

15.2.6 几种常用的优化算法

15.3 神经网络应用实例

15.4 小结

机器学习基础:从入门到求职是2019年由电子工业出版社出版,作者胡欢武 编著。

得书感谢您对《机器学习基础:从入门到求职》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
TensorFlow深度学习从入门到进阶 电子书
TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其支持多种客户端语言下的安装和运行。本书以TensorFlow为导线,进行机器学习,书中每章节都是以理论引出,TensorFlow应用巩固结束,理论与实践相结合,让读者快速掌握TensorFlow机器学习。本书共10章,主要包括内容有:TensorFlow介绍、TensorFlow编辑基础、TensorFlow进阶
素描基础技法从入门到精通 电子书
漫画以奇美绚丽的画风、高于现实的表现手法而受到绘画爱好者的青睐。在观赏漫画作品时,相信每个人心中都构想了一个完美的漫画世界,并经常想拿笔画出自己设想或倾慕的画面和角色,但是限于绘画水平而止步于想法。“新手漫画教程”系列是专为漫画新手提升绘画水平而策划出版的优秀教学用书,共四册,分别从漫画素描基础技法、萌少女、美少年、Q版角色四个方面教大家如何绘制漫画作品。《新手漫画教程:素描基础技法从入门到精通》
PowerPoint 2019从入门到精通(移动学习版) 电子书
写作特色  ·从零开始,快速上手 无论读者是否接触过PowerPoint 2019,都能从本书获益,快速掌握软件操作方法。·面向实际,精选案例 全书内容均以真实案例为主线,在此基础上适当扩展知识点,真正实现学以致用。  ·全彩展示,一步一图 本书通过全彩排版,有效突出了重点、难点。所有实例的每一步操作,均配有对应的插图和注释,以便读者在学习过程中能够直观、清晰地看到操作过程和效果,提高学习效率。  ·单双混排,超大容量 本书采用单、双栏混排的形式,大大扩充了信息容量,在有限的篇幅中为读者奉送了更多的知识和实战案例。  ·高手支招,举一反三 本书大多数章节有两个特色栏目。其中,“高手私房菜”提炼了各种操作技巧,而“举一反三”则为知识点的扩展应用提供了思路。  ·视频教程,手册辅助 本书配套的视频教程内容与书中的知识点紧密结合并相互补充,帮助读者体验实际应用环境,并借此掌握日常所需的技能和各种问题的处理方法,达到学以致用的目的。  配套资源  ·全程同步视频教程 视频教程涵盖本书所有知识点,详细讲解每个实战案例的操作过程及关键步骤,帮助读者更轻松地掌握书中所有的知识内容和操作技巧。  ·超值学习资源 本书还额外赠送了大量相关学习内容的视频教程、扩展学习电子书及本书所有案例的配套素材和结果文件等,以方便读者扩展学习。 ·赠送资源 赠送资源1 Windows 10操作系统安装视频教程 赠送资源2 9小时Windows 10视频教程 赠送资源3 移动办公技巧手册 赠送资源4 2000个Word精选文档模板 赠送资源5 1800个Excel典型表格模板 赠送资源6 1500个PPT精美演示模板 赠送资源7 Office快捷键查询手册 赠送资源8 电脑维护与故障处理技巧查询手册
Excel 2019从入门到精通(移动学习版) 电子书
写作特色  ·从零开始,快速上手 无论读者是否接触过电脑,都能从本书获益,快速掌握软件操作方法。  ·面向实际,精选案例 全部内容均以真实案例为主线,在此基础上适当扩展知识点,真正实现学以致用。  ·全彩展示,一步一图 本书通过全彩排版,有效突出重点、难点。所有实例的每一步操作,均配有对应的插图和注释,以便读者在学习过程中能够直观、清晰地看到操作过程和效果,提高学习效率。  ·单双混排,超大容量 本书采用单、双栏混排的形式,大大扩充了信息容量,在有限的篇幅中为读者奉送更多的知识和实战案例。  ·高手支招,举一反三 本书在每章后的“高手私房菜”栏目中提炼了各种操作技巧,为知识点的扩展应用提供了思路。  ·视频教程,互动教学 在视频教程中,我们采用工作、生活中的真实案例,帮助读者体验实际应用环境,从而全面理解知识点的运用方法。  配套资源  ·全程同步视频教程 本书配套的同步视频教程详细讲解每个实战案例的操作过程及关键步骤,帮助读者更轻松地掌握书中所有的知识内容和操作技巧。  ·学习资源 本书赠送大量相关学习内容的视频教程、扩展学习电子书及本书所有案例的配套素材和结果文件等,以方便读者扩展学习。 赠送资源1 Windows 10操作系统安装视频教程 赠送资源2 9小时Windows 10视频教程 赠送资源3 电脑维护与故障处理技巧查询手册 赠送资源4 移动办公技巧手册 赠送资源5 2000个Word精选文档模板 赠送资源6 1800个Excel典型表格模板 赠送资源7 1500个PPT精美演示模板 赠送资源8 Office快捷键查询手册
算法学习与应用从入门到精通 电子书
一本书的容量,讲解了入门类、范例类和项目实战类三类图书的内容。