Python机器学习开发实战

Python机器学习开发实战

立即阅读
手机扫码
  • 微信扫一扫

    关注微信公众号

编辑推荐

Python机器学习入门,以实战为重点,配有大量代码和案例,简单、快速、易学。

内容简介

本书内容主要包括Python语言的基础知识、实践中最常用的机器学习算法及其原理,以及实践中的机器学习算法应用,还有一些深度学习框架的讲解和应用。

作者简介

作者王新宇,本科毕业于清华大学,美国管理技术大学项目管理硕士,清华大学EMBA,原中外运长航集团人力资源部副总经理,10年人力资源管理经验,面试数千人,成功率达到90%以上。有丰富的面试经验,并且形成了一套独特的面试方法。因为其成功的面试和独到的经验,经常受邀为各类大型企业人力资源部门做培训和同行交流。

章节目录

版权信息

内容提要

前言

第1章 环境配置与准备知识

1.1 环境配置

1.2 机器学习相关概念

1.2.1 机器学习中的数据

1.2.2 训练集和测试集

1.2.3 欠拟合与过度拟合

1.2.4 人工智能、机器学习、深度学习

第2章 Python基础知识

2.1 hello world!

2.2 变量

2.3 操作符

2.3.1 基本运算符

2.3.2 比较运算符

2.3.3 逻辑运算符

2.4 字符串

2.4.1 基础

2.4.2 转义字符

2.4.3 索引和切片

2.4.4 字符串方法

2.5 列表

2.6 集合

2.7 字典

2.8 循环语句

2.9 判断语句

2.10 函数

2.11 面向对象编程

第3章 数值计算扩展工具——Numpy

3.1 创建数组

3.1.1 创建元素为0或1的数组

3.1.2 将列表转换为数组

3.1.3 生成一串数字

3.1.4 生成特殊数组

3.2 数组索引

3.3 排序与查询

3.4 随机数生成器

3.5 数学函数

3.5.1 三角函数

3.5.2 指数与对数

3.5.3 约数

3.5.4 数组自身加乘

3.5.5 算术运算

3.6 统计函数

3.7 线性代数

第4章 数据分析工具——Pandas

4.1 序列对象Series

4.1.1 创建Series对象

4.1.2 Series索引

4.1.3 查看Series相关属性

4.1.4 二元运算

4.1.5 统计方法

4.1.6 缺失值处理

4.1.7 排序

4.1.8 计数与重复

4.1.9 其他

4.2 数据框对象DataFrame

4.2.1 创建数据框

4.2.2 行操作

4.2.3 列操作

4.3 分组对象GroupBy

4.3.1 基本函数

4.3.2 统计函数

第5章 可视化展示库——Matplotlib

5.1 作图类命令

5.1.1 折线图

5.1.2 柱状图和条形图

5.1.3 散点图

5.1.4 饼图

5.1.5 面积图

5.2 坐标轴控制

5.2.1 axis

5.2.2 xlim与ylim

5.2.3 xticks与yticks

5.2.4 xlabel与ylabel

5.3 其他设置

第6章 通用型开源机器学习库——Scikit

6.1 预处理

6.1.1 标准化

6.1.2 非线性转换

6.1.3 归一化

6.1.4 二值化

6.1.5 分类特征编码

6.1.6 缺失值插补

6.1.7 生成多项式特征

6.2 降维

6.3 有监督学习与无监督学习

6.4 模型评估

6.4.1 测试集评分

6.4.2 交叉验证迭代器

6.4.3 分层交叉验证迭代器

6.4.4 分组迭代器

6.4.5 时间序列交叉验证

第7章 机器学习常用数据集

7.1 boston房价数据集

7.1.1 数据集基本信息描述

7.1.2 数据探索

7.2 diabetes糖尿病数据集

7.2.1 数据基本信息描述

7.2.2 数据探索

7.3 digits手写字体识别数据集

7.3.1 数据集基本信息描述

7.3.2 数据集探索

7.4 iris鸢尾花数据集

7.4.1 数据集基本信息描述

7.4.2 数据探索

7.5 wine红酒数据集

7.5.1 数据集基本信息描述

7.5.2 数据探索

第8章 线性回归算法

8.1 从二次函数到机器学习

8.1.1 二次函数最优求解方法

8.1.2 梯度下降

8.1.3 梯度下降的Python实现

8.1.4 初始值与学习速率α的选择

8.2 深入理解线性回归算法

8.2.1 回归曲线的数学解释

8.2.2 梯度下降方法求解最优直线

8.2.3 理解“机器学习”中的“学习”

8.2.4 导数求解与梯度下降

8.2.5 学习速率α与迭代次数的设置

8.3 线性回归算法实战——糖尿病患者病情预测

第9章 逻辑回归算法

9.1 逻辑回归算法的基础知识

9.1.1 直线分割平面

9.1.2 逻辑函数

9.2 深入理解逻辑回归算法

9.2.1 直线分类器与逻辑回归的结合

9.2.2 Sigmoid函数的作用

9.2.3 逻辑回归模型

9.3 逻辑回归算法实战——二维鸢尾花分类

第10章 神经网络算法

10.1 神经网络算法的基础知识

10.1.1 逻辑回归与神经网络的关系

10.1.2 激活函数

10.2 深入理解神经网络算法

10.2.1 神经网络的表示

10.2.2 做回归的神经网络

10.2.3 做二分类的神经网络

10.2.4 做多分类的神经网络

10.3 神经网络的应用

10.3.1 MLPClassifier分类

10.3.2 MLPRegressor回归

第11章 线性判别算法

11.1 线性判别算法的核心知识

11.1.1 方差

11.1.2 投影

11.1.3 投影方式与方差的关系

11.2 线性判别算法详解

11.2.1 投影的实际应用

11.2.2 另一种思路解决重叠问题

11.2.3 线性判别算法的实质

11.3 线性判别算法实战——花卉分类

第12章 K最近邻算法

12.1 K最近邻算法的核心知识

12.1.1 两点的距离公式

12.1.2 权重

12.2 K最近邻算法详解

12.2.1 K最近邻算法原理

12.2.2 K最近邻算法的关键——k的选择

12.2.3 距离加权最近邻算法

12.3 K最近邻算法实战——手写字体识别

第13章 决策树方法与随机森林

13.1 决策树方法的基本知识

13.2 决策树方法的原理

13.2.1 信息熵

13.2.2 分割数据

13.2.3 计算信息增益

13.3 决策树方法实战——红酒分类

13.4 随机森林

第14章 贝叶斯算法

14.1 贝叶斯算法的基础知识

14.1.1 概率

14.1.2 条件概率

14.1.3 联合概率

14.1.4 贝叶斯定理

14.2 深入理解贝叶斯算法

14.2.1 先验概率和后验概率

14.2.2 词向量

14.2.3 贝叶斯模型

14.3 贝叶斯算法实战——文本分类

第15章 支持向量机

15.1 支持向量机的基础知识

15.1.1 向量

15.1.2 点积

15.1.3 投影

15.1.4 向量与代数直线的关系

15.2 深入理解支持向量机

15.2.1 超平面

15.2.2 支持向量机在二维空间的超平面

15.2.3 计算最优超平面

15.3 支持向量机实战——鸢尾花分类

第16章 PCA降维算法

16.1 PCA降维算法的核心知识

16.1.1 矩阵的直观理解

16.1.2 特征向量的本质

16.1.3 协方差

16.1.4 协方差矩阵

16.2 PCA降维算法详解

16.2.1 协方差矩阵的特征向量

16.2.2 PCA降维算法的Python实现

16.3 PCA降维算法实战——iris数据集可视化

第17章 SVD奇异值分解

17.1 SVD奇异值分解的相关知识

17.2 深入理解矩阵作用

17.2.1 矩阵作用

17.2.2 将矩阵作用分解为特征向量作用

17.2.3 将矩阵作用分解为奇异矩阵作用

17.3 SVD奇异值分解的应用

17.3.1 U矩阵的理解

17.3.2 V矩阵的理解

17.3.3 S矩阵的理解

第18章 聚类算法

18.1 深入理解K均值聚类算法

18.2 Scikit库中的K均值聚类算法

18.3 其他聚类算法

第19章 深度学习框架及其应用

19.1 TensorFlow

19.1.1 TensorFlow的基本概念

19.1.2 TensorFlow的应用

19.2 Keras

19.3 PyTorch

19.4 Caffe

Python机器学习开发实战是2020年由人民邮电出版社出版,作者王新宇。

得书感谢您对《Python机器学习开发实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。