Python机器学习算法与实战

余本国

科学与自然类型

340千字字数

我想读

手机扫码

微信扫一扫

关注微信公众号

因版权原因待上架

类似推荐

编辑推荐

近百个实战案例，系统讲解Python机器学习算法、理论与关键技术实现。

内容简介

本书基于Python语言，结合实际的数据集，介绍如何使用机器学习与深度学习算法，对数据进行实战分析。

本书在内容上循序渐进，先介绍了Python的基础内容，以及如何利用Python中的第三方库对数据进行预处理和探索可视化的相关操作，然后结合实际数据集，分章节介绍了机器学习与深度学习的相关算法应用。

本书为读者提供了源程序和使用的数据集，方便读者在阅读时同步运行程序，在增强学习效果的同时为读者节省了编写程序的时间。

源程序使用Notebook的形式进行组织，每个小节注释清晰，讲解透彻。同时为程序配备了相应的视频讲解，辅助读者对程序能很好地理解和消化。

本书在简明扼要地介绍算法原理的同时，更加注重实战应用和对结果的解读。

作者简介

作者孙玉林，西安电子科技大学人工智能学院博士在读。长期从事大数据统计分析、机器学习与计算机视觉等方面的研究，曾多次获得数学建模与数据挖掘比赛一等奖。出版《Python在机器学习中的应用》《R语言统计分析与机器学习》《PyTorch深度学习入门与实战》等著作。

章节目录

版权信息

内容简介

前言

第1章 Python机器学习入门

1.1 机器学习简介

1.1.1 机器学习是什么

1.1.2 机器学习算法分类

1.2 安装Anaconda（Python）

1.2.1 Spyder

1.2.2 Jupyter Notebook

1.2.3 JupyterLab

1.3 Python快速入门

1.3.1 列表、元组和字典

1.3.2 条件判断、循环和函数

1.4 Python基础库入门实战

1.4.1 NumPy库应用入门

1.4.2 pandas库应用入门

1.4.3 Matplotlib库应用入门

1.5 机器学习模型初探

1.6 本章小结

第2章数据探索与可视化

2.1 缺失值处理

2.1.1 简单的缺失值处理方法

2.1.2 复杂的缺失值填充方法

2.2 数据描述与异常值发现

2.2.1 数据描述统计

2.2.2 发现异常值的基本方法

2.3 可视化分析数据关系

2.3.1 连续变量间关系可视化分析

2.3.2 分类变量间关系可视化分析

2.3.3 连续变量和分类变量间关系可视化分析

2.3.4 其他类型数据可视化分析

2.4 数据样本间的距离

2.5 本章小结

第3章特征工程

3.1 特征变换

3.1.1 数据的无量纲化处理

3.1.2 数据特征变换

3.2 特征

3.2.1 分类特征重新编码

3.2.2 数值特征重新编码

3.2.3 文本数据的特征构建

3.3 特征选择

3.3.1 基于统计方法

3.3.2 基于递归消除特征法

3.3.3 基于机器学习的方法

3.4 特征提取和降维

3.4.1 主成分分析

3.4.2 核主成分分析

3.4.3 流形学习

3.4.4 t-SNE

3.4.5 多维尺度分析

3.5 数据平衡方法

3.5.1 基于过采样算法

3.5.2 基于欠采样算法

3.5.3 基于过采样和欠采样的综合算法

3.6 本章小结

第4章模型选择和评估

4.1 模型拟合效果

4.1.1 欠拟合与过拟合表现方式

4.1.2 避免欠拟合与过拟合的方法

4.2 模型训练技巧

4.2.1 交叉验证

4.2.2 参数网络搜索

4.3 模型的评价指标

4.3.1 分类效果评价

4.3.2 回归效果评价

4.3.3 聚类效果评价

4.4 本章小结

第5章假设检验和回归分析

5.1 假设检验

5.1.1 数据分布检验

5.1.2 t检验

5.1.3 方差分析

5.2 一元回归

5.2.1 一元线性回归

5.2.2 一元非线性回归

5.3 多元回归

5.3.1 多元线性回归

5.3.2 逐步回归

5.3.3 多元自适应回归样条

5.4 正则化回归分析

5.4.1 Ridge回归分析

5.4.2 LASSO回归分析

5.4.3 弹性网络回归

5.5 Logistic回归分析

5.5.1 数据准备与可视化

5.5.2 逻辑回归分类

5.6 本章小结

第6章时间序列分析

6.1 时间序列数据的相关检验

6.1.1 白噪声检验

6.1.2 平稳性检验

6.1.3 自相关分析和偏自相关分析

6.2 移动平均算法

6.2.1 简单移动平均法

6.2.2 简单指数平滑法

6.2.3 霍尔特线性趋势法

6.2.4 Holt-Winters季节性预测模型

6.3 ARIMA模型

6.3.1 AR模型

6.3.2 ARMA模型

6.3.3 ARIMA模型

6.4 SARIMA模型

6.5 Prophet模型预测时间序列

6.5.1 数据准备

6.5.2 模型建立与数据预测

6.6 多元时间序列ARIMAX模型

6.6.1 数据准备与可视化

6.6.2 ARIMAX模型建立与预测

6.7 时序数据的异常值检测

6.7.1 数据准备与可视化

6.7.2 时序数据异常值检测

6.8 本章小结

第7章聚类算法与异常值检测

7.1 模型简介

7.1.1 常用的聚类算法

7.1.2 常用的异常值检测算法

7.2 数据聚类分析

7.2.1 K-均值与K-中值聚类算法

7.2.2 层次聚类

7.2.3 谱聚类与模糊聚类

7.2.4 密度聚类（DBSCAN）

7.2.5 高斯混合模型聚类

7.2.6 亲和力传播聚类

7.2.7 BIRCH聚类

7.3 数据异常值检测分析

7.3.1 LOF和COF算法

7.3.2 带有异常值的高维数据探索

7.3.3 基于PCA与SOD的异常值检测方法

7.3.4 孤立森林异常值检测

7.3.5 支持向量机异常值检测

7.4 本章小结

第8章决策树和集成学习

8.1 模型简介与数据准备

8.1.1 决策树与集成学习算法思想

8.1.2 数据准备和探索

8.2 决策树模型

8.2.1 决策树模型数据分类

8.2.2 决策树模型数据回归

8.3 随机森林模型

8.3.1 随机森林模型数据分类

8.3.2 随机森林模型数据回归

8.4 AdaBoost模型

8.4.1 AdaBoost模型数据分类

8.4.2 AdaBoost模型数据回归

8.5 梯度提升树（GBDT）

8.5.1 GBDT模型数据分类

8.5.2 GBDT模型数据回归

8.6 本章小结

第9章贝叶斯算法和K-近邻算法

9.1 模型简介

9.2 贝叶斯分类算法

9.2.1 文本数据准备与可视化

9.2.2 朴素贝叶斯文本分类

9.3 贝叶斯网络数据分类

9.3.1 自定义贝叶斯网络结构

9.3.2 搜索所有网络结构

9.3.3 启发式搜索网络结构

9.4 K-近邻算法

9.4.1 K-近邻数据分类

9.4.2 K-近邻数据回归

9.5 本章小结

第10章支持向量机和人工神经网络

10.1 模型简介

10.2 支持向量机模型

10.2.1 支持向量机数据分类

10.2.2 支持向量机数据回归

10.3 全连接神经网络模型

10.3.1 单隐藏层全连接神经网络数据分类

10.3.2 多隐藏层全连接神经网络数据分类

10.3.3 全连接神经网络数据回归

10.4 本章小结

第11章关联规则与文本挖掘

11.1 模型简介

11.1.1 关联规则

11.1.2 文本挖掘

11.2 数据关联规则挖掘

11.2.1 FPGrowth关联规则挖掘

11.2.2 Apriori关联规则挖掘

11.3 文本数据预处理

11.3.1 英文文本预处理

11.3.2 《三国演义》文本预处理

11.4 文本聚类分析

11.4.1 文本数据特征获取

11.4.2 常用的聚类算法

11.4.3 LDA主题模型

11.5 《三国演义》人物关系分析

11.5.1 人物重要性时序分析

11.5.2 人物关系可视化分析

11.6 本章小结

第12章深度学习入门

12.1 深度学习介绍

12.1.1 卷积和池化

12.1.2 卷积神经网络

12.1.3 循环神经网络

12.1.4 自编码网络

12.2 PyTorch入门

12.2.1 张量的使用

12.2.2 常用的层

12.3 卷积神经网络识别草书

12.3.1 草书数据预处理与可视化

12.3.2 ResNet18网络识别草书

12.4 循环神经网络新闻分类

12.4.1 数据准备

12.4.2 LSTM网络文本分类

12.5 自编码网络重构图像

12.5.1 数据准备

12.5.2 自编码网络重构手写数字

12.6 本章小结

参考文献

Python机器学习算法与实战是2021年由电子工业出版社出版,作者余本国。

得书感谢您对《Python机器学习算法与实战》关注和支持，如本书内容有不良信息或侵权等情形的，请联系本网站。