零基础学Python数据分析(升级版)

零基础学Python数据分析(升级版)

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书全面介绍了Python数据分析必备入门知识。

内容简介

全书共10章,包括数据分析基础、搭建Python数据分析环境、Pandas入门、Pandas进阶、可视化数据分析图表、图解数组计算模块NumPy、数据统计分析案例、机器学习Scikit-Learn、Python股票数据分析(Jupyter Notebook版)、京东电商销售数据分析与预测。

作者简介

明日科技,专业从事软件开发、教育培训以及软件开发教育资源整合的高科技公司,其编写的教材既注重选取软件开发中的必需、常用内容,又注重内容的易学、方便以及相关知识的拓展,深受读者喜爱。其编写的图书主要有“从入门到精通”“软件开发视频大讲堂”“软件开发实战1200例”“软件工程师开发大系”等多个系列。多次荣获“全行业优秀畅销品种”“中国大学出版社优秀畅销书”等奖项,多个品种长期位居同类图书销售排行榜的前列。

章节目录

版权信息

内容简介

前言

第1章 数据分析基础

1.1 什么是数据分析

1.2 数据分析的重要性

1.3 数据分析的基本流程

1.3.1 熟悉工具

1.3.2 明确目的

1.3.3 获取数据

1.3.4 数据处理

1.3.5 数据分析

1.3.6 验证结果

1.3.7 结果呈现

1.3.8 数据应用

1.4 数据分析的常用工具

1.4.1 Excel工具

1.4.2 Python语言

1.5 小结

第2章 搭建Python数据分析环境

2.1 快速了解Python

2.1.1 Python简介

2.1.2 Python的版本

2.1.3 Python的应用领域

2.2 搭建Python开发环境

2.2.1 下载和安装Python

2.2.2 第一个Python程序“hello world”

2.3 集成开发环境PyCharm

2.3.1 下载PyCharm

2.3.2 安装PyCharm

2.3.3 运行PyCharm

2.3.4 在PyCharm中创建一组学生成绩数据

2.4 数据分析标准环境Anaconda

2.4.1 下载Anaconda

2.4.2 安装Anaconda

2.5 Jupyter Notebook开发工具

2.5.1 认识Jupyter Notebook

2.5.2 新建一个Jupyter Notebook文件

2.5.3 在Jupyter Notebook中绘制7日天气走势图

2.6 小结

第3章 Pandas入门

3.1 认识Pandas

3.1.1 什么是Pandas

3.1.2 Pandas的功能与优势

3.1.3 安装Pandas模块

3.1.4 牛刀小试——轻松导入Excel数据

3.2 Series对象

3.2.1 图解Series对象

3.2.2 创建一个Series对象

3.2.3 手动设置Series对象的索引

3.2.4 Series对象的索引

3.2.5 获取Series对象的索引和值

3.3 DataFrame对象

3.3.1 图解DataFrame对象

3.3.2 创建一个DataFrame对象

3.3.3 DataFrame对象的重要属性和函数

3.4 外部数据读取

3.4.1 读取Excel文件

3.4.2 读取CSV文件

3.4.3 读取文本文件

3.4.4 读取HTML网页数据

3.5 数据抽取

3.5.1 抽取一行数据

3.5.2 抽取多行数据

3.5.3 抽取指定列数据

3.5.4 抽取指定行列数据

3.5.5 按指定条件抽取数据

3.6 数据的增加、修改和删除

3.6.1 增加数据

3.6.2 修改数据

3.6.3 删除数据

3.7 数据清洗

3.7.1 缺失值查看与处理

3.7.2 重复值处理

3.7.3 异常值的检测与处理

3.8 索引设置

3.8.1 索引的作用

3.8.2 重新设置索引

3.8.3 设置某列为行索引

3.8.4 数据清洗后重新设置连续的行索引

3.9 数据排序与排名

3.9.1 数据排序

3.9.2 数据排名

3.10 小结

第4章 Pandas进阶

4.1 数据计算

4.1.1 求和(sum()方法)

4.1.2 求均值(mean()方法)

4.1.3 求最大值(max()方法)

4.1.4 求最小值(min()方法)

4.1.5 求中位数(median()方法)

4.1.6 求众数(mode()方法)

4.1.7 求方差(var()方法)

4.1.8 求标准差(std()方法)

4.1.9 求分位数(quantile()方法)

4.2 数据格式化

4.2.1 设置小数位数

4.2.2 设置百分比

4.2.3 设置千位分隔符

4.3 数据分组统计

4.3.1 groupby()方法

4.3.2 对分组数据进行迭代

4.3.3 对分组的某列或多列使用聚合函数

4.3.4 通过字典和Series对象进行分组统计

4.4 数据移位

4.5 数据转换

4.5.1 一列数据转换为多列数据

4.5.2 行列转换

4.5.3 DataFrame转换为字典

4.5.4 DataFrame转换为列表

4.5.5 Excel数据转换为HTML网页格式

4.6 数据合并

4.6.1 merge()方法

4.6.2 concat()方法

4.7 数据导出

4.7.1 导出数据到Excel文件

4.7.2 导出数据到CSV文件

4.7.3 导出数据到多个工作表

4.8 日期数据处理

4.8.1 DataFrame的日期数据转换

4.8.2 dt()函数的使用

4.8.3 获取日期区间的数据

4.8.4 按不同时期统计并显示数据

4.9 时间序列

4.9.1 重采样处理

4.9.2 降采样处理

4.9.3 升采样处理

4.9.4 时间序列数据汇总(ohlc()方法)

4.9.5 移动窗口数据计算(rolling()方法)

4.10 小结

第5章 可视化数据分析图表

5.1 数据分析图表的作用

5.2 图表的基本组成

5.3 Matplotlib概述

5.3.1 Matplotlib简介

5.3.2 安装Matplotlib

5.3.3 Matplotlib图表之初体验

5.4 图表的常用设置

5.4.1 基本绘图plot()函数

5.4.2 设置画布

5.4.3 设置坐标轴

5.4.4 添加文本标签

5.4.5 设置标题和图例

5.4.6 添加注释

5.5 常用图表的绘制

5.5.1 绘制折线图

5.5.2 绘制柱形图

5.5.3 绘制直方图

5.5.4 绘制饼形图

5.5.5 绘制散点图

5.5.6 绘制面积图

5.5.7 绘制热力图

5.5.8 绘制箱形图

5.5.9 绘制3D图表

5.5.10 绘制多个子图表

5.6 小结

第6章 图解数组计算模块NumPy

6.1 初识NumPy

6.1.1 NumPy概述

6.1.2 安装NumPy

6.1.3 数组相关概念

6.2 创建数组

6.2.1 创建简单的数组

6.2.2 不同方式创建数组

6.2.3 按照数值范围创建数组

6.2.4 生成随机数组

6.2.5 从已有的数组中创建数组

6.3 数组的基本操作

6.3.1 数据类型

6.3.2 数组运算

6.3.3 数组的索引和切片

6.3.4 数组重塑

6.3.5 数组的增、删、改、查

6.4 NumPy矩阵基本操作

6.4.1 创建矩阵

6.4.2 矩阵运算

6.4.3 矩阵转换

6.5 NumPy常用统计分析函数

6.5.1 数学运算函数

6.5.2 统计分析函数

6.5.3 数组的排序

6.6 小结

第7章 数据统计分析案例

7.1 对比分析

7.2 同比、定比和环比分析

7.3 贡献度分析

7.4 差异化分析

7.5 相关性分析

7.6 时间序列分析

7.7 小 结

第8章 机器学习Scikit-Learn

8.1 Scikit-Learn简介

8.2 安装Scikit-Learn

8.3 线性模型

8.3.1 最小二乘法回归

8.3.2 岭回归

8.4 支持向量机

8.5 聚类

8.5.1 什么是聚类

8.5.2 聚类算法

8.5.3 聚类模块

8.5.4 聚类数据生成器

8.6 小结

第9章 Python股票数据分析(Jupyter Notebook版)

9.1 概述

9.2 项目效果预览

9.3 项目开发环境

9.4 前期准备

9.4.1 安装第三方模块

9.4.2 新建Jupyter Notebook文件

9.4.3 导入必要的库

9.4.4 获取股票历史数据

9.5 数据预处理

9.5.1 数据查看与缺失性分析

9.5.2 描述性统计分析

9.5.3 数据处理

9.5.4 异常值分析

9.5.5 数据归一化处理

9.6 数据统计分析

9.6.1 可视化股票走势图

9.6.2 股票收盘价格走势图

9.6.3 股票成交量时间序列图

9.6.4 股票涨跌情况分析图

9.6.5 股票k线走势图

9.7 关键技术

9.8 小结

第10章 京东电商销售数据分析与预测

10.1 概述

10.2 项目效果预览

10.3 项目开发环境

10.4 分析方法

10.5 项目实现过程

10.5.1 数据处理

10.5.2 日期数据统计并显示

10.5.3 销售收入分析

10.5.4 销售收入与广告费相关性分析

10.5.5 销售收入预测

10.5.6 预测评分

10.6 小结

零基础学Python数据分析(升级版)是2024年由电子工业出版社出版,作者明日科技 编著。

得书感谢您对《零基础学Python数据分析(升级版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Python程序设计——编程基础、Web开发及数据分析 电子书
《Python程序设计——编程基础、Web开发及数据分析》系统讲述了Python程序设计的基础知识。全书共15章,内容包括:Python概述、Python基本语法、Python的基本流程控制、Python的四种典型序列结构、Python函数、Python文件和数据库操作、面向对象程序设计、模块和包、字符串操作与正则表达式的使用、错误及异常处理、GUI编程、网络和多线程编程、基于Flask框架的We
跟着迪哥学:Python数据分析与机器学习实战 电子书
本书适合对人工智能、机器学习、数据分析等方向感兴趣的初学者和爱好者。
从零开始学Excel数据分析:职场加强版 电子书
Excel是现代商务办公中使用率极高的工具之一,但很多职场人士并不知道它强大的功能和操作方法。本书能让读者学会诸多Excel数据分析的实用技巧,进而解决工作和学习中的难题。《从零开始学Excel数据分析(职场加强版)》一书系统、全面地介绍了Excel数据分析的操作方法以及基本知识点,并配以丰富、典型的应用实例进行说明。全书共分为8章,第1章详细介绍了Excel和数据分析的基本操作及概念;第2~6章
Python金融数据分析与挖掘实战 电子书
深入浅出地为你介绍如何使用Python进行金融数据分析、挖掘和量化投资的全过程。
Python+Excel职场办公数据分析 电子书
一本适合编程小白学习的职场数据分析宝典。