利用Python进行数据分析 原书第2版

利用Python进行数据分析 原书第2版

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

一本数据分析的入门必读书。

内容简介

本书由Python pandas项目创始人Wes McKinney亲笔撰写,详细介绍利用Python进行操作、处理、清洗和规整数据等方面的具体细节和基本要点。第2版针对Python 3.6进行全面修订和更新,涵盖新版的pandas、NumPy、IPython和Jupyter,并增加大量实际案例,可以帮助你高效解决一系列数据分析问题。

第2版中的主要更新包括:

·所有的代码,包括把Python的教程更新到了Python 3.6版本(第1版中使用的是Python 2.7)

·更新了Python第三方发布版Anaconda和其他所需Python包的安装指引

·更新pandas库到2017年的新版

·新增一章,关于更多高级pandas工具和一些使用提示

·新增statsmodels和scikit-learn的简明使用介绍

作者简介

Wes McKinney 是流行的Python开源数据分析库pandas的创始人。他是一名活跃的演讲者,也是Python数据社区和Apache软件基金会的Python/C开源开发者。目前他在纽约从事软件架构师工作

章节目录

前言1

第1章 准备工作7

1.1 本书内容7

1.1.1 什么类型的数据7

1.2 为何利用Python进行数据分析8

1.2.1 Python作为胶水8

1.2.2 解决“双语言”难题8

1.2.3 为何不使用Python9

1.3 重要的Python库9

1.3.1 NumPy9

1.3.2 pandas10

1.3.3 matplotlib11

1.3.4 IPython与Jupyter11

1.3.5 SciPy12

1.3.6 scikit-learn12

1.3.7 statsmodels13

1.4 安装与设置13

1.4.1 Windows14

1.4.2 Apple(OS X和macOS)14

1.4.3 GNU/Linux14

1.4.4 安装及更新Python包15

1.4.5 Python 2和Python 316

1.4.6 集成开发环境和文本编辑器16

1.5 社区和会议17

1.6 快速浏览本书17

1.6.1 代码示例18

1.6.2 示例数据18

1.6.3导入约定18

1.6.4术语19

第2章 Python语言基础、IPython及Jupyter notebook20

2.1 Python解释器21

2.2 IPython基础22

2.2.1 运行IPython命令行22

2.2.2 运行 Jupyter notebook23

2.2.3 Tab补全25

2.2.4 内省27

2.2.5 %run命令28

2.2.6 执行剪贴板中的程序30

2.2.7 终端快捷键30

2.2.8 关于魔术命令31

2.2.9 matplotlib集成33

2.3 Python语言基础34

2.3.1 语言语义34

2.3.2 标量类型42

2.3.3 控制流49

第3章 内建数据结构、函数及文件54

3.1 数据结构和序列54

3.1.1 元组54

3.1.2 列表57

3.1.3 内建序列函数61

3.1.4 字典64

3.1.5集合67

3.1.6 列表、集合和字典的推导式69

3.2 函数72

3.2.1 命名空间、作用域和本地函数72

3.2.2 返回多个值73

3.2.3 函数是对象74

3.2.4 匿名(Lambda)函数75

3.2.5 柯里化:部分参数应用76

3.2.6 生成器77

3.2.7 错误和异常处理79

3.3 文件与操作系统82

3.3.1 字节与Unicode文件85

3.4 本章小结86

第4章 NumPy基础:数组与向量化计算87

4.1 NumPy ndarray:多维数组对象89

4.1.1 生成ndarray90

4.1.2 ndarray的数据类型92

4.1.3 NumPy数组算术94

4.1.4 基础索引与切片95

4.1.5 布尔索引100

4.1.6 神奇索引103

4.1.7 数组转置和换轴104

4.2 通用函数:快速的逐元素数组函数106

4.3 使用数组进行面向数组编程109

4.3.1 将条件逻辑作为数组操作110

4.3.2 数学和统计方法111

4.3.3 布尔值数组的方法113

4.3.4 排序114

4.3.5 唯一值与其他集合逻辑115

4.4 使用数组进行文件输入和输出115

4.5 线性代数116

4.6 伪随机数生成118

4.7 示例:随机漫步120

4.7.1 一次性模拟多次随机漫步121

4.8 本章小结122

第5章 pandas入门123

5.1 pandas数据结构介绍123

5.1.1 Series123

5.1.2 DataFrame128

5.1.3 索引对象134

5.2 基本功能135

......

利用Python进行数据分析 原书第2版是2018年由机械工业出版社出版,作者[美]韦斯·麦金尼。

得书感谢您对《利用Python进行数据分析 原书第2版》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
IBM SPSS Modeler 18.0数据挖掘权威指南 电子书
联袂推荐 暨南大学教授、博士生导师刘建平,暨南大学研究生院副院长、经济学院统计学系副主任、教授、博士生导师陈光慧,天善智能创始人梁勇,IBM技术专家刘咏梅,IBM数据科学家钟云飞,广东省环保厅环境咨询专家委员会专家、广东柯内特环境科技有限公司总经理朱斌 本书特色 内容全面:涉及数据读取、数据处理、数据可视化、统计分析与检验、数据挖掘算法、自动建模、集成与扩展、模型部署、性能优化、数据挖掘方法论等诸多内容; 讲解透彻:既有理论的讲解,又涵盖应用的实践,而且在工具的介绍上,尽可能包括每一个选项的内容和应用形式,力求让读者“吃透”每一章节的内容; 突出实战:集行业经验、项目实践、算法剖析、应用技巧于一身,配套提供数据文件以及数据模型文件,方便读者动手实践。
PowerBI零售数据分析实战 电子书
一本讲解如何将Power BI应用于零售业务领域的实战指南。
Python金融数据分析与挖掘实战 电子书
深入浅出地为你介绍如何使用Python进行金融数据分析、挖掘和量化投资的全过程。
Excel商务数据处理与分析(微课版 第2版) 电子书
本书主要讲解商务数据的处理与分析,深入浅出地介绍了使用Excel编辑、分析和管理商务数据的方法,帮助读者快速、高效地完成商务数据的处理与分析工作。全书共11章:第1章主要介绍商务数据分析的基础知识;第2~5章主要介绍编辑与处理数据的方法;第6~11章主要介绍实际工作中不同类型数据的分析方法,并对Excel的常用函数、公式和数据分析工具等进行详细讲解。本书内容翔实、结构清晰、图文并茂,通过实际工作中
Elasticsearch数据搜索与分析实战 电子书
深入描述了Elasticsearch的各种运行机制。