Python数据科学指南

Python数据科学指南

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

Python数据分析编程入门,60多个实用的开发技巧。

内容简介

Python作为一种高级程序设计语言,凭借其简洁、易读及可扩展性日渐成为程序设计领域备受推崇的语言,并成为数据科学家的必读之一。

本书详细介绍了Python在数据科学中的应用,包括数据探索、数据分析与挖掘、机器学习、大规模机器学习等主题。每一章都为读者提供了足够的数学知识和代码示例来理解不同深度的算法功能,帮助读者更好地掌握各个知识点。

作者简介

作者Gopi Subramanian,数据科学家,他在数据挖掘与机器学习领域有着超过15年经验。在过去的10年中,他设计、构思、开发并领导了数据挖掘、文本挖掘、自然语言处理、信息提取和检索等多个项目,涉及不同领域和商务垂直系统。他在美国和印度的专利局共计申请了10多项专利,并以自己的名义出版了许多书籍。

章节目录

版权信息

内容提要

译者简介

作者简介

审稿人简介

前言

第1章 Python在数据科学中的应用

1.1 简介

1.2 使用字典对象

1.2.1 准备工作

1.2.2 操作方法

1.2.3 工作原理

1.2.4 更多内容

1.2.5 参考资料

1.3 使用字典的字典

1.3.1 准备工作

1.3.2 操作方法

1.3.3 工作原理

1.3.4 参考资料

1.4 使用元组

1.4.1 准备工作

1.4.2 操作方法

1.4.3 工作原理

1.4.4 更多内容

1.4.5 参考资料

1.5 使用集合

1.5.1 准备工作

1.5.2 操作方法

1.5.3 工作原理

1.5.4 更多内容

1.6 写一个列表

1.6.1 准备工作

1.6.2 操作方法

1.6.3 工作原理

1.6.4 更多内容

1.7 从另一个列表创建列表——列表推导

1.7.1 准备工作

1.7.2 操作方法

1.7.3 工作原理

1.7.4 更多内容

1.8 使用迭代器

1.8.1 准备工作

1.8.2 操作方法

1.8.3 工作原理

1.8.4 更多内容

1.9 生成一个迭代器和生成器

1.9.1 准备工作

1.9.2 操作方法

1.9.3 工作原理

1.9.4 更多内容

1.10 使用可迭代对象

1.10.1 准备工作

1.10.2 操作方法

1.10.3 工作原理

1.10.4 参考资料

1.11 将函数作为变量传递

1.11.1 准备工作

1.11.2 操作方法

1.11.3 工作原理

1.12 在函数中嵌入函数

1.12.1 准备工作

1.12.2 操作方法

1.12.3 工作原理

1.13 将函数作为参数传递

1.13.1 准备工作

1.13.2 操作方法

1.13.3 工作原理

1.14 返回一个函数

1.14.1 准备工作

1.14.2 操作方法

1.14.3 工作原理

1.14.4 更多内容

1.15 使用装饰器改变函数行为

1.15.1 准备工作

1.15.2 操作方法

1.15.3 工作原理

1.16 使用lambda创造匿名函数

1.16.1 准备工作

1.16.2 操作方法

1.16.3 工作原理

1.17 使用映射函数

1.17.1 准备工作

1.17.2 操作方法

1.17.3 工作原理

1.17.4 更多内容

1.18 使用过滤器

1.18.1 准备工作

1.18.2 操作方法

1.18.3 工作原理

1.19 使用zip和izip函数

1.19.1 准备工作

1.19.2 操作方法

1.19.3 工作原理

1.19.4 更多内容

1.19.5 参考资料

1.20 从表格数据使用数组

1.20.1 准备工作

1.20.2 操作方法

1.20.3 工作原理

1.20.4 更多内容

1.21 对列进行预处理

1.21.1 准备工作

1.21.2 操作方法

1.21.3 工作原理

1.21.4 更多内容

1.22 列表排序

1.22.1 准备工作

1.22.2 操作方法

1.22.3 工作原理

1.22.4 更多内容

1.23 采用键排序

1.23.1 准备工作

1.23.2 操作方法

1.23.3 工作原理

1.23.4 更多内容

1.24 使用itertools

1.24.1 准备工作

1.24.2 操作方法

1.24.3 工作原理

第2章 Python环境

2.1 简介

2.2 使用NumPy库

2.2.1 准备工作

2.2.2 操作方法

2.2.3 工作原理

2.2.4 更多内容

2.2.5 参考资料

2.3 使用matplotlib进行绘画

2.3.1 准备工作

2.3.2 操作方法

2.3.3 工作原理

2.3.4 更多内容

2.4 使用scikit-learn进行机器学习

2.4.1 准备工作

2.4.2 操作方法

2.4.3 工作原理

2.4.4 更多内容

2.4.5 参考资料

第3章 数据分析——探索与争鸣

3.1 简介

3.2 用图表分析单变量数据

3.2.1 准备工作

3.2.2 操作方法

3.2.3 工作原理

3.2.4 参考资料

3.3 数据分组和使用点阵图

3.3.1 准备工作

3.3.2 操作方法

3.3.3 工作原理

3.3.4 参考资料

3.4 为多变量数据绘制散点阵图

3.4.1 准备工作

3.4.2 操作方法

3.4.3 工作原理

3.4.4 参考资料

3.5 使用热图

3.5.1 准备工作

3.5.2 操作方法

3.5.3 工作原理

3.5.4 更多内容

3.5.5 参考资料

3.6 实施概要统计及绘图

3.6.1 准备工作

3.6.2 操作方法

3.6.3 工作原理

3.6.4 参考资料

3.7 使用箱须图

3.7.1 准备工作

3.7.2 操作方法

3.7.3 工作原理

3.7.4 更多内容

3.8 修补数据

3.8.1 准备工作

3.8.2 操作方法

3.8.3 工作原理

3.8.4 更多内容

3.8.5 参考资料

3.9 实施随机采样

3.9.1 准备工作

3.9.2 操作方法

3.9.3 工作原理

3.9.4 更多内容

3.10 缩放数据

3.10.1 准备工作

3.10.2 操作方法

3.10.3 工作原理

3.10.4 更多内容

3.11 数据标准化

3.11.1 准备工作

3.11.2 操作方法

3.11.3 工作原理

3.11.4 更多内容

3.12 实施分词化

3.12.1 准备工作

3.12.2 操作方法

3.12.3 工作原理

3.12.4 更多内容

3.12.5 参考资料

3.13 删除停用词

3.13.1 操作方法

3.13.2 工作原理

3.13.3 更多内容

3.13.4 参考资料

3.14 词提取

3.14.1 准备工作

3.14.2 操作方法

3.14.3 工作原理

3.14.4 更多内容

3.14.5 参考资料

3.15 执行词形还原

3.15.1 准备工作

3.15.2 操作方法

3.15.3 工作原理

3.15.4 更多内容

3.15.5 参考资料

3.16 词袋模型表示文本

3.16.1 准备工作

3.16.2 操作方法

3.16.3 工作原理

3.16.4 更多内容

3.16.5 参考资料

3.17 计算词频和反文档频率

3.17.1 准备工作

3.17.2 操作方法

3.17.3 工作原理

3.17.4 更多内容

第4章 数据分析——深入理解

4.1 简介

4.2 抽取主成分

4.2.1 准备工作

4.2.2 操作方法

4.2.3 工作原理

4.2.4 更多内容

4.2.5 参考资料

4.3 使用核PCA

4.3.1 准备工作

4.3.2 操作方法

4.3.3 工作原理

4.3.4 更多内容

4.4 使用奇异值分解抽取特征

4.4.1 准备工作

4.4.2 操作方法

4.4.3 工作原理

4.4.4 更多内容

4.5 用随机映射给数据降维

4.5.1 准备工作

4.5.2 操作方法

4.5.3 工作原理

4.5.4 更多内容

4.5.5 参考资料

4.6 用NMF分解特征矩阵

4.6.1 准备工作

4.6.2 操作方法

4.6.3 工作原理

4.6.4 更多内容

4.6.5 参考资料

第5章 数据挖掘——海底捞针

5.1 简介

5.2 使用距离度量

5.2.1 准备工作

5.2.2 操作方法

5.2.3 工作原理

5.2.4 更多内容

5.2.5 参考资料

5.3 学习和使用核方法

5.3.1 准备工作

5.3.2 操作方法

5.3.3 工作原理

5.3.4 更多内容

5.3.5 参考资料

5.4 用k-means进行数据聚类

5.4.1 准备工作

5.4.2 操作方法

5.4.3 工作原理

5.4.4 更多内容

5.4.5 参考资料

5.5 学习向量量化

5.5.1 准备工作

5.5.2 操作方法

5.5.3 工作原理

5.5.4 更多内容

5.5.5 参考资料

5.6 在单变量数据中找出异常点

5.6.1 准备工作

5.6.2 操作方法

5.6.3 工作原理

5.6.4 更多内容

5.6.5 参考资料

5.7 使用局部异常因子方法发现异常点

5.7.1 准备工作

5.7.2 操作方法

5.7.3 工作原理

5.7.4 更多内容

第6章 机器学习1

6.1 简介

6.2 为建模准备数据

6.2.1 准备工作

6.2.2 操作方法

6.2.3 工作原理

6.2.4 更多内容

6.3 查找最近邻

6.3.1 准备工作

6.3.2 操作方法

6.3.3 工作原理

6.3.4 更多内容

6.3.5 参考资料

6.4 用朴素贝叶斯分类文档

6.4.1 准备工作

6.4.2 操作方法

6.4.3 工作原理

6.4.4 更多内容

6.4.5 参考资料

6.5 构建决策树解决多类问题

6.5.1 准备工作

6.5.2 操作方法

6.5.3 工作原理

6.5.4 更多内容

6.5.5 参考资料

第7章 机器学习2

7.1 简介

7.2 回归方法预测实数值

7.2.1 准备工作

7.2.2 操作方法

7.2.3 工作原理

7.2.4 更多内容

7.2.5 参考资料

7.3 学习L2缩减回归——岭回归

7.3.1 准备工作

7.3.2 操作方法

7.3.3 工作原理

7.3.4 更多内容

7.3.5 参考资料

7.4 学习L1缩减回归——LASSO

7.4.1 准备工作

7.4.2 操作方法

7.4.3 工作原理

7.4.4 更多内容

7.4.5 参考资料

7.5 L1和L2缩减交叉验证迭代

7.5.1 准备工作

7.5.2 操作方法

7.5.3 工作原理

7.5.4 更多内容

7.5.5 参考资料

第8章 集成方法

8.1 简介

8.2 理解集成——挂袋法

8.2.1 准备工作

8.2.2 操作方法

8.2.3 工作原理

8.2.4 更多内容

8.2.5 参考资料

8.3 理解集成——提升法

8.3.1 准备工作

8.3.2 操作方法

8.3.3 工作原理

8.3.4 更多内容

8.3.5 参考资料

8.4 理解集成——梯度提升

8.4.1 准备工作

8.4.2 操作方法

8.4.3 工作原理

8.4.4 更多内容

8.4.5 参考资料

第9章 生长树

9.1 简介

9.2 从生长树到生长森林——随机森林

9.2.1 准备工作

9.2.2 操作方法

9.2.3 工作原理

9.2.4 更多内容

9.2.5 参考资料

9.3 生成超随机树

9.3.1 准备工作

9.3.2 操作方法

9.3.3 工作原理

9.3.4 更多内容

9.3.5 参考资料

9.4 生成旋转森林

9.4.1 准备工作

9.4.2 操作方法

9.4.3 工作原理

9.4.4 更多内容

9.4.5 参考资料

第10章 大规模机器学习——在线学习

10.1 简介

10.2 用感知器作为在线学习算法

10.2.1 准备工作

10.2.2 操作方法

10.2.3 工作原理

10.2.4 更多内容

10.2.5 参考资料

10.3 用随机梯度下降解决回归问题

10.3.1 准备工作

10.3.2 操作方法

10.3.3 工作原理

10.3.4 更多内容

10.3.5 参考资料

10.4 用随机梯度下降解决分类问题

10.4.1 准备工作

10.4.2 操作方法

10.4.3 工作原理

10.4.4 更多内容

10.4.5 参考资料

Python数据科学指南是2016年由人民邮电出版社出版,作者印度。

得书感谢您对《Python数据科学指南》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
用Python轻松处理Excel数据 电子书
本书旨在帮助读者掌握如何用Python高效地处理Excel数据,实现办公自动化。本书首先介绍开发环境的搭建和Excel模块的安装,接着讲解编写代码前的准备,然后介绍如何使用openpyxl和pandas这两个模块编写员工信息表查询案例,最后介绍PyInstaller模块与.py文件的编译,以及如何快速移植本书案例的代码。本书不仅适合办公人员阅读,还适合想要了解openpyxl模块和pandas模块
Python数据分析基础教程 电子书
从数据处理的角度来讲解统计分析。
Python数据分析入门与实战 电子书
掌握数据分析技巧,运用强大的Python工具,解决工作中繁琐的数据问题。
Python金融数据分析与挖掘实战 电子书
深入浅出地为你介绍如何使用Python进行金融数据分析、挖掘和量化投资的全过程。
Python+Excel职场办公数据分析 电子书
一本适合编程小白学习的职场数据分析宝典。