Python科学与工程数据分析实战

Python科学与工程数据分析实战

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书深入浅出地介绍Python数据分析的相关知识和应用。

内容简介

全书共9章,主要内容包括Python概述、科学计算库、开源科学集、数据分析利器、数据分析的可视化、基于回归的数据分析、基于分类的数据分析、基于聚类的数据分析、数据特征分析等。通过学习本书,读者可领略到Python的简单、易学、易读、易维护等特点,同时也可感受到利用Python实现数据分析应用领域广泛,功能强大。

章节目录

版权信息

内容简介

前言

第1章 掀开Python面纱

1.1 Python环境搭建

1.1.1 Python的安装

1.1.2 pip安装第三方库

1.1.3 编辑器Jupyter Notebook

1.2 寻求帮助

1.3 基本命令

1.3.1 数字

1.3.2 变量

1.3.3 运算符

1.4 数据类型

1.5 字符串操作

1.6 元素的集合

1.6.1 列表

1.6.2 元组

1.6.3 字典

1.6.4 集合

第2章 科学计算库

2.1 必需库的安装

2.2 NumPy概述

2.3 NumPy的数据类型

2.4 NumPy数组

2.4.1 NumPy数组的创建

2.4.2 NumPy切片

2.4.3 NumPy索引

2.4.4 NumPy迭代

2.4.5 NumPy数组操作

2.4.6 NumPy算术函数

2.5 NumPy统计函数

2.6 NumPy排序

2.7 NumPy线性代数

2.7.1 矩阵和向量积

2.7.2 行列式

2.7.3 求解线性方程

2.7.4 矩阵特征值和特征向量

2.8 矩阵分解

2.8.1 Cholesky分解

2.8.2 QR分解

2.8.3 SVD(奇异值)分解

2.9 范数和秩

2.9.1 矩阵的范数

2.9.2 矩阵的秩

第3章 开源科学集

3.1 SciPy常量模块

3.1.1 常量

3.1.2 单位类型

3.2 SciPy优化器

3.3 SciPy稀疏矩阵

3.3.1 coo_matrix存储方式

3.3.2 csr_matrix存储方式

3.3.3 csc_matrix存储方式

3.3.4 lil_matrix存储方式

3.3.5 dok_matrix存储方式

3.3.6 dia_matrix存储方式

3.3.7 bsr_matrix存储方式

3.4 SciPy图结构

3.4.1 邻接矩阵

3.4.2 连接组件

3.4.3 Dijkstra最短路径

3.4.4 Floyd Warshall算法

3.4.5 Bellman-Ford算法

3.5 SciPy空间数据

3.5.1 三角测量

3.5.2 凸包

3.5.3 K-D树

3.5.4 距离矩阵

3.6 SciPy插值

3.6.1 一维插值

3.6.2 二维插值

3.6.3 样条插值

3.7 SciPy显著性检验

3.7.1 统计假设

3.7.2 t检验

3.7.3 KS检验

3.8 边缘检测

第4章 数据分析利器

4.1 Pandas数据结构

4.1.1 系列

4.1.2 数据结构

4.1.3 面板

4.2 统计性描述

4.3 Pandas重建索引

4.4 Pandas迭代与排序

4.4.1 Pandas迭代

4.4.2 Pandas排序

4.5 Pandas统计函数

4.6 Pandas分组与聚合

4.7 数据缺失

4.7.1 数据缺失的原因

4.7.2 检查缺失值

4.7.3 缺失值的计算

4.7.4 清理/填充缺失数据

4.7.5 丢失缺失的值

4.7.6 替换丢失/通用值

4.8 Pandas连接

4.9 Pandas CSV文件

4.10 Pandas的JSON文件

第5章 数据分析的可视化

5.1 初识Matplotlib

5.2 基本二维绘图

5.2.1 折线图

5.2.2 散点图

5.2.3 条形图

5.2.4 饼图

5.2.5 箱线图

5.2.6 等高线图

5.3 三维绘图

5.3.1 三维坐标轴

5.3.2 三维点和线

5.3.3 三维等高线图

5.3.4 表面三角测量

5.3.5 非结构化图像

5.3.6 三维体元素

5.4 小提琴图

第6章 基于回归的数据分析

6.1 简单线性回归

6.1.1 线性回归概述

6.1.2 简单线性回归的实现

6.2 多元回归

6.2.1 多项式回归概述

6.2.2 多项式回归的实现

6.3 广义线性回归

6.3.1 函数模型

6.3.2 边界决策函数

6.3.3 广义回归的实现

6.4 岭回归

6.5 套索回归

6.5.1 全子集算法

6.5.2 贪心算法

6.5.3 正则化

6.6 非线性回归

6.6.1 K最近邻回归

6.6.2 核回归

第7章 基于分类的数据分析

7.1 KNN分类器

7.2 线性分类器

7.3 逻辑分类

7.3.1 逻辑回归概述

7.3.2 逻辑回归原理

7.3.3 逻辑分类的实现

7.4 贝叶斯分类

7.4.1 贝叶斯分类相关知识

7.4.2 贝叶斯原理

7.4.3 贝叶斯分类的实现

7.5 决策树

7.5.1 决策树概述

7.5.2 树的相关术语

7.5.3 决策树算法

7.5.4 信息熵

7.5.5 信息增益

7.5.6 信息增益率

7.5.7 决策树的应用

7.6 随机森林

7.6.1 随机森林概述

7.6.2 特征重要评估

7.6.3 随机森林的实现

第8章 基于聚类的数据分析

8.1 聚类的分类

8.2 k-means聚类

8.2.1 k-means聚类的基本原理

8.2.2 算法流程

8.2.3 随机分配聚类质心

8.2.4 k-means算法的优缺点

8.2.5 k-means算法的变体

8.3 Mean Shift聚类

8.3.1 Mean Shift算法介绍

8.3.2 Mean Shift算法的思想

8.3.3 概率密度梯度

8.3.4 Mean Shift向量的修正

8.3.5 Mean Shift算法流程

8.4 谱聚类

8.4.1 谱聚类的原理

8.4.2 谱聚类算法描述

8.4.3 谱聚类算法中的重要属性

8.4.4 谱聚类的实现

8.5 层次聚类算法

8.5.1 自顶向下的层次聚类算法

8.5.2 自底向上的层次聚类算法

8.5.3 簇间相似度的计算方法

8.5.4 层次聚类算法的实现

8.6 密度聚类

8.6.1 密度聚类的原理

8.6.2 DBSCAN密度定义

8.6.3 DBSCAN密度聚类的思想

8.6.4 DBSCAN聚类算法

8.6.5 DBSCAN聚类的实现

第9章 数据特征分析

9.1 数据表达

9.1.1 哑变量转换类型特征

9.1.2 数据的装箱处理

9.1.3 数据的分箱处理

9.2 交互式与多项式特征

9.2.1 添加交互式特征

9.2.2 添加多项式特征

9.3 自动化特征选择

9.3.1 单变量特征选择

9.3.2 基于模型的特征选择

参考文献

Python科学与工程数据分析实战是2024年由清华大学出版社出版,作者李晓东 编著。

得书感谢您对《Python科学与工程数据分析实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。