编辑推荐
机器学习入门进阶书:理论实践结合,Python编写,全面覆盖主要算法。
内容简介
机器学习是人工智能研究领域中的一个极其重要的方向,利用机器学习将数据中有用的信息萃取出来,使得研究数据的这一领域越来越为人们所瞩目。本书是一本机器学习的入门与进阶读物,注重理论与实践相结合,书中以Python3.6.5为编写平台,共分13章,主要包括机器学习绪论、线性模型、树回归、K—means聚类算法、朴素贝叶斯、数据降维、支持向量机、随机森林、人工神经网络、协同过滤算法、基于矩阵分解的推荐算法、集成学习、数据预处理等内容。
章节目录
封面
书名页
内容简介
版权页
前言
目录
第1章 机器学习绪论
1.1 机器学习的定义
1.1.1 概论
1.1.2 机器学习发展历程
1.1.3 机器学习算法的分类
1.1.4 通用机器学习算法
1.2 学习算法
1.2.1 监督学习
1.2.2 无监督学习
1.3 机器学习应用程序的步骤
1.4 Python语言
1.4.1 Python的风格
1.4.2 Python的优势
1.4.3 Python语言的缺点
1.5 Python的环境搭建
1.5.1 安装
1.5.2 使用pip安装第三方库
1.6 NumPy函数库基础
1.7 Python的基础知识
1.7.1 数和表达式
1.7.2 Python的标识符
1.7.3 Python的保留字符
1.7.4 行和缩进
1.7.5 多行语句
1.7.6 Python引号
1.7.7 Python空行
1.7.8 同一行显示多条语句
1.7.9 Print输出
第2章 线性模型
2.1 一般线性回归
2.1.1 线性回归公式表示法
2.1.2 线性回归的Python实现
2.2 局部加权线性回归
2.3 广义线性模型
2.4 逻辑回归分析
2.5 牛顿法
2.5.1 基本牛顿法的原理
2.5.2 基本牛顿法的流程
2.5.3 全局牛顿法
2.5.4 Armijo搜索
2.5.5 全局牛顿法求解线性回归模型
2.6 缩减法
2.6.1 岭回归
2.6.2 lasso回归
2.6.3 前向逐步线性回归
2.7 利用线性回归进行预测
2.7.1 训练线性回归模型
2.7.2 对新数据的预测
第3章 树回归
3.1 构建决策树的准备工作
3.1.1 特征选择
3.1.2 决策树的生成和修剪
3.2 Matplotlib注释绘制树形图
3.3 使用决策树执行分类
3.4 决策树的存储
3.5 Sklearn使用决策树预测隐形眼镜类型
3.5.1 实战背景
3.5.2 使用Sklearn构建决策树
3.6 复杂数据的局部性建模
3.7 连续型和离散型特征的树构建
3.8 分类回归树
3.8.1 构建树
3.8.2 剪枝
3.8.3 模型树
3.8.4 分类回归的Python实现
第4章 K-means聚类算法
4.1 K-means聚类算法概述
4.2 相似性的度量
4.2.1 闵可夫斯基距离
4.2.2 曼哈顿距离
4.2.3 欧氏距离
4.3 K-means聚类算法的原理
4.3.1 K-means聚类算法的步骤
4.3.2 K-means聚类算法与矩阵分解
4.3.3 K-means聚类算法的实现
4.4 K-近邻算法
4.5 各种聚类算法
4.5.1 划分聚类法
4.5.2 层次聚类法
4.5.3 密度聚类法
4.5.4 谱聚类法
4.5.5 Birch聚类法
4.5.6 混合高斯模型
4.6 K-means++算法
4.6.1 K-means算法存在的问题
4.6.2 K-means++算法的思路
第5章 朴素贝叶斯
5.1 朴素贝叶斯理论
5.1.1 贝叶斯决策理论
5.1.2 条件概率
5.1.3 全概率公式
5.1.4 贝叶斯推断
5.1.5 朴素贝叶斯推断
5.2 朴素贝叶斯算法
5.3 朴素贝叶斯算法的优缺点
第6章 数据降维
6.1 维度灾难与降维
6.2 高维数据降维的方法
6.2.1 线性降维
6.2.2 非线性降维
6.2.3 SVD降维
6.2.4 流形学习降维
6.2.5 多维缩放降维
第7章 支持向量机
7.1 支持向量机概述
7.2 分类间隔
7.2.1 函数间距
7.2.2 几何间距
7.3 拉格朗日乘子
7.3.1 拉格朗日对偶性
7.3.2 优化间隔分类器
7.4 核函数
7.4.1 核函数的选择
7.4.2 松弛变量与软间隔最大化
7.5 SOM算法
7.5.1 坐标上升算法
7.5.2 SOM
7.6 SVM的优缺点
7.7 SVM的Python实现
第8章 随机森林
8.1 什么是随机森林
8.2 集成学习
8.2.1 集成学习的思想
8.2.2 集成学习中的典型方法
8.3 Stacking学习算法
8.3.1 Stacking的基本思想
8.3.2 Stacking学习的实现
8.4 随机森林算法
8.4.1 随机森林的特点
8.4.2 随机森林算法流程
8.5 随机森林算法实践
8.6 美国人口普查的例子
8.6.1 数据预处理
8.6.2 模型训练及验证
第9章 人工神经网络
9.1 感知机模型
9.1.1 感知机的定义
9.1.2 感知机的学习策略
9.1.3 感知机学习算法
9.1.4 感知机的Python实现
9.2 从感知机到神经网络
9.3 多层前馈神经网络
9.3.1 BP网络算法
9.3.2 BP神经网络的学习过程
9.3.3 BP神经网络中参数的设置
9.4 神经网络的Python实现
第10章 协同过滤算法
10.1 协同过滤的核心
10.2 协同过滤的分类
10.3 相似性的度量方法
10.3.1 欧氏距离
10.3.2 皮尔逊相关系数
10.3.3 余弦相似度
10.3.4 用Python实现余弦相似度的计算
10.4 基于用户的协同过滤算法
10.4.1 基于物品的协同过滤算法
10.4.2 基于矩阵分解的协同过滤算法
10.4.3 Python实现
10.5 基于项的协同过滤算法
10.6 利用协同过滤算法进行推荐
10.6.1 导入用户-商品数据
10.6.2 利用基于用户的协同过滤算法进行推荐
10.6.3 利用基于项的协同过滤算法进行推荐
第11章 基于矩阵分解的推荐算法
11.1 矩阵分解
11.2 利用矩阵分解进行预测
11.2.1 损失函数
11.2.2 损失函数的求解
11.2.3 加入正则项的损失函数及求解方法
11.2.4 预测
11.2.5 程序实现
11.3 非负矩阵分解
11.3.1 非负矩阵分解的形式定义
11.3.2 损失函数
11.3.3 优化问题的求解
11.3.4 利用乘法规则进行分解和预测
11.4 基于矩阵分解的推荐方法
11.4.1 LFM法
11.4.2 SVD法
11.4.3 SVD++法
第12章 集成学习
12.1 集成学习的原理及误差
12.2 集成学习方法
12.2.1 Boosting算法
12.2.2 AdaBoost算法
12.2.3 AdaBoost与加法模型
12.2.4 提升树
12.2.5 Bagging算法
12.2.6 误差-分歧分解
12.2.7 多样性增强
12.2.8 Stacking算法
12.3 Python实现
第13章 数据预处理
13.1 数据预处理概述
13.1.1 为什么要对数据进行预处理
13.1.2 数据预处理的主要任务
13.2 去除唯一属性
13.3 处理缺失值
13.3.1 直接使用
13.3.2 删除特征
13.3.3 缺失值补全
13.3.4 数据清理
13.3.5 特征编码
13.3.6 数据标准化
13.3.7 正则化
13.3.8 特征选择
13.3.9 稀疏表示和字典学习
13.4 Python实现
参考文献
反侵权盗版声明
封底
Python机器学习核心算法编程实例是2019年由电子工业出版社出版,作者丁伟雄。
得书感谢您对《Python机器学习核心算法编程实例》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。