类似推荐
编辑推荐
展示了如何用Python程序将不同格式的数据处理和分析任务规模化和自动化。
内容简介
本书主要内容包括:Python基础知识以及分析任意数量的文本文件、CSV文件、Excel文件和数据库中数据的方法;如何从这些数据源中选择特定的行与列,如何聚合数据并计算基本统计量,以及如何将结果写入输出文件;常见的商业分析应用;如何通过一些扩展模块创建最常用的统计图表,如何通过StatsModels包来估计回归模型和分类模型;如何按计划自动定期运行脚本。
作者简介
作者克林顿·布朗利,博士,Facebook数据科学家,负责大数据流水线、统计建模和数据可视化项目,并为大型基础设施建设提供数据驱动的决策建议。
章节目录
版权信息
O'Reilly Media, Inc. 介绍
业界评论
前言
为什么要读这本书,为什么要学习这些技能
目标读者
为什么使用Windows
为什么使用Python
基础Python和pandas
Anaconda Python
安装Anaconda Python(Windows或Mac)
文本编辑器
下载本书资料
各章内容简介
排版约定
使用示例代码
Safari® Books Online
联系我们
致谢
电子书
第1章 Python基础
1.1 创建Python脚本
1.2 运行Python脚本
1.3 与命令行进行交互的几项技巧
1.4 Python语言基础要素
1.4.1 数值
1.4.2 字符串
1.4.3 正则表达式与模式匹配
1.4.4 日期
1.4.5 列表
1.4.6 元组
1.4.7 字典
1.4.8 控制流
1.5 读取文本文件
1.5.1 创建文本文件
1.5.2 脚本和输入文件在同一位置
1.5.3 读取文件的新型语法
1.6 使用glob读取多个文本文件
创建另一个文本文件
1.7 写入文本文件
1.7.1 向first_script.py添加代码
1.7.2 写入CSV文件
1.8 print语句
1.9 本章练习
第2章 CSV文件
2.1 基础Python与pandas
2.1.1 读写CSV文件(第1部分)
2.1.2 基本字符串分析是如何失败的
2.1.3 读写CSV文件(第2部分)
2.2 筛选特定的行
2.2.1 行中的值满足某个条件
2.2.2 行中的值属于某个集合
2.2.3 行中的值匹配于某个模式/正则表达式
2.3 选取特定的列
2.3.1 列索引值
2.3.2 列标题
2.4 选取连续的行
2.5 添加标题行
2.6 读取多个CSV文件
文件计数与文件中的行列计数
2.7 从多个文件中连接数据
2.8 计算每个文件中值的总和与均值
2.9 本章练习
第3章 Excel文件
3.1 内省Excel工作簿
3.2 处理单个工作表
3.2.1 读写Excel文件
3.2.2 筛选特定行
3.2.3 选取特定列
3.3 读取工作簿中的所有工作表
3.3.1 在所有工作表中筛选特定行
3.3.2 在所有工作表中选取特定列
3.4 在Excel工作簿中读取一组工作表
在一组工作表中筛选特定行
3.5 处理多个工作簿
3.5.1 工作表计数以及每个工作表中的行列计数
3.5.2 从多个工作簿中连接数据
3.5.3 为每个工作簿和工作表计算总数和均值
3.6 本章练习
第4章 数据库
4.1 Python内置的sqlite3模块
4.1.1 向表中插入新记录
4.1.2 更新表中记录
4.2 MySQL数据库
4.2.1 向表中插入新记录
4.2.2 查询一个表并将输出写入CSV文件
4.2.3 更新表中记录
4.3 本章练习
第5章 应用程序
5.1 在一个大文件集合中查找一组项目
5.2 为CSV文件中数据的任意数目分类计算统计量
5.3 为文本文件中数据的任意数目分类计算统计量
5.4 本章练习
第6章 图与图表
6.1 matplotlib
6.1.1 条形图
6.1.2 直方图
6.1.3 折线图
6.1.4 散点图
6.1.5 箱线图
6.2 pandas
6.3 ggplot
6.4 seaborn
第7章 描述性统计与建模
7.1 数据集
7.1.1 葡萄酒质量
7.1.2 客户流失
7.2 葡萄酒质量
7.2.1 描述性统计
7.2.2 分组、直方图与t 检验
7.2.3 成对变量之间的关系和相关性
7.2.4 使用最小二乘估计进行线性回归
7.2.5 系数解释
7.2.6 自变量标准化
7.2.7 预测
7.3 客户流失
7.3.1 逻辑斯蒂回归
7.3.2 系数解释
7.3.3 预测
第8章 按计划自动运行脚本
8.1 任务计划程序(Windows系统)
8.2 cron工具(macOS系统和Unix系统)
8.2.1 cron表文件:一次性设置
8.2.2 向cron表文件中添加cron任务
第9章 从这里启航
9.1 更多的标准库模块和内置函数
9.1.1 Python标准库(PSL):更多的标准模块
9.1.2 内置函数
9.2 Python包索引(PyPI):更多的扩展模块
9.2.1 NumPy
9.2.2 SciPy
9.2.3 Scikit-Learn
9.2.4 更多的扩展包
9.3 更多的数据结构
9.3.1 栈
9.3.2 队列
9.3.3 图
9.3.4 树
9.4 从这里启航
附录A 下载指南
A.1 下载Python 3
A.1.1 Windows
A.1.2 macOS
A.2 下载xlrd扩展包
A.2.1 Windows
A.2.2 macOS
A.3 下载MySQL数据库服务器
A.3.1 Windows
A.3.2 macOS
A.3.3 启动MySQL
A.4 下载mysqlclient(Python 3.x)/MySQLpython(Python 2.x)
A.4.1 Windows
A.4.2 macOS
附录B 练习答案
第1章
练习1
练习2
练习3
作者介绍
封面介绍
看完了
Python数据分析基础是2017年由人民邮电出版社出版,作者[美]克林顿·布朗利(Clinton。
得书感谢您对《Python数据分析基础》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。