Python数据分析(第2版)

Python数据分析(第2版)

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

经典数据分析图书再升级,让你轻松应对大数据分析任务,掌握信号处理、时间序列、文本数据分析、机器学习等技能。

内容简介

Python作为一种程序设计语言,凭借其简洁、易读及可扩展性日渐成为程序设计领域备受推崇的语言。同时,Python语言的数据分析功能也逐渐为大众所认可。

全书共12章,从Python程序库入门、NumPy数组和Pandas入门开始,陆续介绍了数据的检索、数据加工与存储、数据可视化等内容。同时,本书还介绍了信号处理与时间序列、应用数据库、分析文本数据与社交媒体、预测性分析与机器学习、Python生态系统的外部环境和云计算、性能优化及分析、并发性等内容。在本书的最后,还采用3个附录的形式为读者补充了一些重要概念、常用函数以及在线资源等重要内容。

本书延续了上一版示例丰富、简单易懂的优点,非常适合对Python语言感兴趣或者想要使用Python语言进行数据分析的读者参考阅读。

作者简介

作者阿曼多·凡丹戈,Epic工程咨询集团首席数据科学家,负责与国防和政府机构有关的保密项目。Armando是一位技术精湛的技术人员,拥有全球初创企业和大型公司的工作经历和高级管理经验。他的工作涉及金融、生物信息学、广告技术、基础设施、交通运输等多种行业。Armando在预测分析、数据科学、机器学习、大数据等项目中工作了十多年。他的研究兴趣横跨机器学习、深度学习和科学计算等领域。

章节目录

版权信息

内容提要

作者简介

技术审稿人简介

前言

本书内容

读者须知

目标读者

排版约定

资源与支持

配套资源

提交勘误

与我们联系

关于异步社区和异步图书

第1章 Python程序库入门

1.1 安装Python 3

1.1.1 安装数据分析程序库

1.1.2 Linux平台或Mac OS X平台

1.1.3 Windows平台

1.2 将IPython用作shell

1.3 学习手册页

1.4 Jupyter Notebook

1.5 NumPy数组

1.6 一个简单的应用

1.7 从何处寻求帮助和参考资料

1.8 查看Python库中包含的模块

1.9 通过Matplotlib实现数据的可视化

1.10 小结

第2章 NumPy数组

2.1 NumPy数组对象

NumPy数组的优势

2.2 创建多维数组

2.3 选择NumPy数组元素

2.4 NumPy的数值类型

2.4.1 数据类型对象

2.4.2 字符码

2.4.3 dtype构造函数

2.4.4 dtype属性

2.5 一维数组的切片与索引

2.6 处理数组形状

2.6.1 堆叠数组

2.6.2 拆分NumPy数组

2.6.3 NumPy数组的属性

2.6.4 数组的转换

2.7 创建数组的视图和拷贝

2.8 花式索引

2.9 基于位置列表的索引方法

2.10 用布尔型变量索引NumPy数组

2.11 NumPy数组的广播

2.12 小结

2.13 参考资料

第3章 Pandas入门

3.1 Pandas的安装与概览

3.2 Pandas数据结构之DataFrame

3.3 Pandas数据结构之Series

3.4 利用Pandas查询数据

3.5 利用Pandas的DataFrame进行统计计算

3.6 利用Pandas的DataFrame实现数据聚合

3.7 DataFrame的串联与附加操作

3.8 连接DataFrames

3.9 处理缺失数据问题

3.10 处理日期数据

3.11 数据透视表

3.12 小结

3.13 参考资料

第4章 统计学与线性代数

4.1 用NumPy进行简单的描述性统计计算

4.2 用NumPy进行线性代数运算

4.2.1 用NumPy求矩阵的逆

4.2.2 用NumPy解线性方程组

4.3 用NumPy计算特征值和特征向量

4.4 NumPy随机数

4.4.1 用二项式分布进行博弈

4.4.2 正态分布采样

4.4.3 用SciPy进行正态检验

4.5 创建掩码式NumPy数组

4.6 忽略负值和极值

4.7 小结

第5章 数据的检索、加工与存储

5.1 利用NumPy和pandas对CSV文件进行写操作

5.2 二进制.npy与pickle格式

5.3 使用PyTables存储数据

5.4 Pandas DataFrame与HDF5仓库之间的读写操作

5.5 使用Pandas读写Excel文件

5.6 使用REST Web服务和JSON

5.7 使用Pandas读写JSON

5.8 解析RSS和Atom订阅

5.9 使用Beautiful Soup解析HTML

5.10 小结

5.11 参考资料

第6章 数据可视化

6.1 Matplotlib的子库

6.2 Matplotlib绘图入门

6.3 对数图

6.4 散点图

6.5 图例和注解

6.6 三维图

6.7 Pandas绘图

6.8 时滞图

6.9 自相关图

6.10 Plot.ly

6.11 小结

第7章 信号处理与时间序列

7.1 statsmodels模块

7.2 移动平均值

7.3 窗口函数

7.4 协整的定义

7.5 自相关

7.6 自回归模型

7.7 ARMA模型

7.8 生成周期信号

7.9 傅里叶分析

7.10 谱分析

7.11 滤波

7.12 小结

第8章 应用数据库

8.1 基于sqlite3的轻量级访问

8.2 通过Pandas访问数据库

8.3 SQLAlchemy

8.3.1 SQLAlchemy的安装和配置

8.3.2 通过SQLAlchemy填充数据库

8.3.3 通过SQLAlchemy查询数据库

8.4 Pony ORM

8.5 Dataset:懒人数据库

8.6 PyMongo与MongoDB

8.7 利用Redis存储数据

8.8 利用memcache存储数据

8.9 Apache Cassandra

8.10 小结

第9章 分析文本数据和社交媒体

9.1 安装NLTK

9.2 NLTK简介

9.3 滤除停用字、姓名和数字

9.4 词袋模型

9.5 词频分析

9.6 朴素贝叶斯分类

9.7 情感分析

9.8 创建词云

9.9 社交网络分析

9.10 小结

第10章 预测性分析与机器学习

10.1 预处理

10.2 基于逻辑回归的分类

10.3 基于支持向量机的分类

10.4 基于ElasticNetCV的回归分析

10.5 支持向量回归

10.6 基于相似性传播算法的聚类分析

10.7 均值漂移算法

10.8 遗传算法

10.9 神经网络

10.10 决策树

10.11 小结

第11章 Python生态系统的外部环境和云计算

11.1 与MATLAB/Octave交换信息

11.2 安装rpy2

11.3 连接R

11.4 为Java传递NumPy数组

11.5 集成SWIG和NumPy

11.6 集成Boost和Python

11.7 通过f2py使用Fortran代码

11.8 PythonAnywhere云

11.9 小结

第12章 性能优化、性能分析与并发性

12.1 代码的性能分析

12.2 安装Cython

12.3 调用C代码

12.4 利用multiprocessing创建进程池

12.5 通过Joblib提高for循环的并发性

12.6 比较Bottleneck函数与NumPy函数

12.7 通过Jug实现MapReduce

12.8 安装MPI for Python

12.9 IPython Parallel

12.10 小结

附录A 重要概念

附录B 常用函数

Matplotlib

NumPy

Pandas

Scikit-learn

SciPy

Python数据分析(第2版)是2018年由人民邮电出版社出版,作者。

得书感谢您对《Python数据分析(第2版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
简明临床血气分析(第3版) 电子书
对与临床攸关的血气分析基础理论作了重点阐述。
数值分析简明教程(第2版) 电子书
本书共7章,具体包括:绪论、非线性方程的求根方法、线性方程组的解法、求矩阵特征值和特征向量的方法、插值与拟合方法、数值积分与数值微分方法、常微分方程初值问题数值解法。本书可以作为非数学专业理工科大学生和研究生学习数值分析课程的教材,也可以供相关科研人员和对数值分析感兴趣的读者参考。
数据结构(C语言版)(第2版) 电子书
适读人群 :普通高校电子信息大类本科生学习、考研,同时也适合零售和培训。   采用“案例驱动”的编写模式。书中结合实际应用,将各章按照“案例引入——数据结构及其操作——案例分析与实现”的案例驱动思路来展开。每章使用一个有趣的“问题案例”开头,由该案例逐步引入新的数据结构,然后给出该数据结构的存储表示及各种基本操作的实现,之后进一步分析此案例,最终利用该数据结构来实现此案例。   算法讲解更加细致。新版教材中对每个算法思想进行详细阐述,将用文字描述的算法步骤与用类C语言表述的算法描述一一对应。   优化教材内容。参考计算机专业全新的全国统考考研大纲,增加了大纲近两年新增的考点内容,如分块查找、外部排序等,有助于考研学生复习备考使用。
地球科学中的大数据分析与挖掘算法手册 电子书
本书以数据分析与挖掘思想为主线,深入剖析关联、分类、回归、聚类、顺序模式挖掘、深度学习以及异常检测等算法的原理、实现、相似算法、改进思路以及地学案例,具有很强的系统性、完整性以及落地性,可以作为各行业特别是地球科学领域中希望驾驭大数据并发掘其价值的科研人员和工程人员的参考书,读者既可以通过本书系统掌握大数据分析挖掘的思想方法,也可以将其作为算法工具书查阅。
对话大数据:政府/工业/金融/医疗/人才行业创新与应用案例分析 电子书
26位在大数据相关行业享有盛誉的知名企业家和权威学者分享关于大数据创新与应用的宝贵观点。