Python数据科学手册

Python数据科学手册

编辑推荐

从计算环境配置到机器学习的实战书籍,带你掌握计算机工具高效存储和分析数据,切实解决工作痛点 。

内容简介

一本对以数据深度需求为中心的科学、研究以及针对计算和统计方法的参考书。如何将数据格式读取到脚本中?如何操作、改变、清洗数据?如何对数据可视化?如何使用数据获得更深的洞察力、解答问题,或者开发统计或机器学习模型?本书涵盖了有效处理计算和统计的技巧,以常见用例为讲解手段,展示了可被用作分析、操作、可视化以及学习数据的众多开源Python工具。

作者简介

作者杰克·万托布拉斯,Python科学栈的深度用户和开发人员,目前是华盛顿大学eScience学院物理科学研究院院长,研究方向为天文学。同时,他还为很多领域的科学家提供建议和咨询。

章节目录

版权信息

O'Reilly Media, Inc. 介绍

业界评论

译者序

前言

什么是数据科学

目标读者

为什么用Python

内容概览

使用代码示例

软件安装注意事项

O'Reilly Safari

联系我们

电子书

第1章 IPython:超越Python

1.1 shell还是Notebook

1.2 IPython的帮助和文档

1.3 IPython shell中的快捷键

1.4 IPython魔法命令

1.5 输入和输出历史

1.6 IPython和shell命令

1.7 与shell相关的魔法命令

1.8 错误和调试

1.9 代码的分析和计时

1.10 IPython参考资料

第2章 NumPy入门

2.1 理解Python中的数据类型

2.2 NumPy数组基础

2.3 NumPy数组的计算:通用函数

2.4 聚合:最小值、最大值和其他值

2.5 数组的计算:广播

2.6 比较、掩码和布尔逻辑

2.7 花哨的索引

2.8 数组的排序

2.9 结构化数据:NumPy的结构化数组

第3章 Pandas数据处理

3.1 安装并使用Pandas

3.2 Pandas对象简介

3.3 数据取值与选择

3.4 Pandas数值运算方法

3.5 处理缺失值

3.6 层级索引

3.7 合并数据集:Concat与Append操作

3.8 合并数据集:合并与连接

3.9 累计与分组

3.10 数据透视表

3.11 向量化字符串操作

3.12 处理时间序列

3.13 高性能Pandas:eval()与query()

3.14 参考资料

第4章 Matplotlib数据可视化

4.1 Matplotlib常用技巧

4.2 两种画图接口

4.3 简易线形图

4.4 简易散点图

4.5 可视化异常处理

4.6 密度图与等高线图

4.7 频次直方图、数据区间划分和分布密度

4.8 配置图例

4.9 配置颜色条

4.10 多子图

4.11 文字与注释

4.12 自定义坐标轴刻度

4.13 Matplotlib自定义:配置文件与样式表

4.14 用Matplotlib画三维图

4.15 用Basemap可视化地理数据

4.16 用Seaborn做数据可视化

4.17 参考资料

第5章 机器学习

5.1 什么是机器学习

5.2 Scikit-Learn简介

5.3 超参数与模型验证

5.4 特征工程

5.5 专题:朴素贝叶斯分类

5.6 专题:线性回归

5.7 专题:支持向量机

5.8 专题:决策树与随机森林

5.9 专题:主成分分析

5.10 专题:流形学习

5.11 专题:k-means聚类

5.12 专题:高斯混合模型

5.13 专题:核密度估计

5.14 应用:人脸识别管道

5.15 机器学习参考资料

关于作者

关于封面

看完了

Python数据科学手册是2018年由人民邮电出版社出版,作者[美]杰克·万托布拉斯(JakeVanderPla。

得书感谢您对《Python数据科学手册》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
统计思维:程序员数学之概率统计(第2版) 电子书

本书介绍了如何借助计算而非数学方法,使用Python语言对数据进行统计分析。
大数据技术原理与应用(第2版) 电子书

国内高校大数据课程知名教师倾心之作,带你“零基础”学习大数据。
跟着迪哥学:Python数据分析与机器学习实战 电子书

本书适合对人工智能、机器学习、数据分析等方向感兴趣的初学者和爱好者。
Spark快速大数据分析(第2版) 电子书

涵盖Spark3.0的新特性,着重展示如何利用机器学习算法执行大数据分析。
Spark快速大数据分析 电子书

本书从零开始讲解Spark。
数据压缩入门 电子书

谷歌开发高手通俗讲解数据压缩算法,高效传输和存储海量数据,打造流畅的用户体验。
Python编程 电子书

第2版上线,沿袭第1版讲解清晰透彻、循序渐进的特点,并全面升级。