Python大数据分析与应用实战

Python大数据分析与应用实战

我想读
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书是介绍如何用Python进行数据处理和分析的学习实战指南。

内容简介

本书主要内容包括Python语言基础、数据处理、数据分析、数据可视化图形的制作,以及利用Python对数据库的的贝叶斯操作、利用深度学习技术对模型进行优化等内容。本书主要分为3部分:第1部分包括第1章主要讲解Python的基础知识,第2部分包括第2~6章为实战案例,第3部分包括第7~8章主要讲解利用深度学习和协同过滤技术对大数据分析进行为拓展与延伸。

作者简介

作者余本国,博士,硕士研究生导师。2001年毕业于石河子大学数学系,同年到中北大学(原华北工学院)任教,主讲线性代数、高等数学、微积分、概率统计、数学实验、Python语言、大数据分析基础等课程。2012年到加拿大York University做访问学者。现工作于海南医学院生物医学信息与工程学院。作品有《Python数据分析基础》《基于Python的大数据分析基础及实战》等书。

章节目录

版权信息

内容简介

前言

第1章 Python语法基础

1.1 安装Anaconda

1.1.1 代码提示

1.1.2 变量浏览

1.1.3 安装第三方库

1.2 语法基础

1.2.1 字符串、列表、元组、字典和集合

1.2.2 条件判断、循环和函数

1.2.3 异常

1.2.4 特殊函数

1.3 Python基础库应用入门

1.3.1 NumPy库应用入门

1.3.2 Pandas库应用入门

1.3.3 Matplotlib库应用入门

1.4 本章小结

第2章 天气数据的获取与建模分析

2.1 准备工作

2.2 利用抓取方法获取天气数据

2.2.1 网页解析

2.2.2 抓取一个静态页面中的天气数据

2.2.3 抓取历史天气数据

2.3 天气数据可视化

2.3.1 查看数据基本信息

2.3.2 变换数据格式

2.3.3 气温走势的折线图

2.3.4 历年气温对比图

2.3.5 天气情况的柱状图

2.3.6 使用Tableau制作天气情况的气泡云图

2.3.7 风向占比的饼图

2.3.8 使用windrose库绘制风玫瑰图

2.4 机器学习在天气预报中的应用

2.4.1 线性回归的基本概念

2.4.2 使用一元线性回归预测气温

2.4.3 使用多元线性回归预测气温

2.5 本章小结

第3章 养成游戏中人物的数据搭建

3.1 准备工作

3.2 利用Pyecharts库进行数据基本情况分析

3.2.1 感染人数分布图

3.2.2 病情分布图

3.2.3 病症情况堆叠图

3.2.4 绘制出院、死亡情况折线图

3.2.5 病情热力图

3.2.6 病情分布象形图

3.2.7 人口流动示意图

3.3 感染病例分析

3.3.1 基本信息统计

3.3.2 使用直方图展示感染周期

3.3.3 使用词云图展示死亡病例情况

3.4 疫情趋势预测

3.4.1 利用逻辑方程预测感染人数

3.4.2 利用SIR模型进行疫情预测

3.4.3 Logistic模型和SIR模型的对比

3.5 本章小结

第4章 航空数据分析

4.1 准备工作

4.2 基本情况统计分析

4.2.1 查看数据的基本信息

4.2.2 航空公司、机型分布

4.2.3 展示各个城市航班数量的3D地图

4.2.4 从首都机场出发的桑基图

4.2.5 通过关系图展示航线

4.3 利用Floyd算法计算最短飞行时间

4.3.1 Floyd算法简介

4.3.2 Floyd算法的流程

4.3.3 算法程序实现

4.3.4 结果分析

4.4 本章小结

第5章 市民服务热线文本数据分析

5.1 准备工作

5.2 基本情况分析

5.2.1 数据分布基本信息

5.2.2 每日平均工单量分析

5.2.3 来电时间分析

5.2.4 工单类型分析

5.3 利用词云图展示工单内容

5.3.1 工单分词

5.3.2 去除停用词

5.3.3 词频统计

5.3.4 市民反映问题词云图

5.3.5 保存数据

5.4 基于朴素贝叶斯的工单自动分类转办

5.4.1 需求概述

5.4.2 朴素贝叶斯模型的基本概念

5.4.3 朴素贝叶斯文本分类算法的流程

5.4.4 程序实现

5.5 基于K-Means算法和PCA方法降维的热点问题挖掘

5.5.1 应用场景

5.5.2 K-Means算法和PCA方法的基本原理

5.5.3 热点问题挖掘算法的流程

5.5.4 程序实现

5.6 本章小结

第6章 决策树信贷风险控制

6.1 准备工作

6.2 数据集基本情况分析

6.2.1 查看数据大小和缺失情况

6.2.2 绘制直方图查看数据的分布情况

6.2.3 绘制直方图的3种方法

6.2.4 通过箱型图查看异常值的情况

6.2.5 异常值和缺失值的处理

6.2.6 使用小提琴图展示预处理后的数据

6.3 利用决策树进行信贷数据建模

6.3.1 决策树原理简介

6.3.2 决策树信贷建模流程

6.3.3 利用scikit-learn库实现决策树风险控制算法

6.3.4 模型优化

6.4 本章小结

第7章 利用深度学习进行垃圾图片分类

7.1 准备工作

7.2 深度学习的基本原理

7.2.1 CNN的基本原理

7.2.2 Keras库简介

7.3 利用Keras库实现基于CNN的垃圾图片分类

7.3.1 算法流程

7.3.2 数据预处理

7.3.3 CNN模型实现

7.4 优化CNN模型

7.4.1 选择优化器

7.4.2 选择损失函数

7.4.3 调整模型

7.4.4 图片增强

7.4.5 改变学习率

7.5 模型应用

7.6 本章小结

第8章 协同过滤和矩阵分解推荐算法分析

8.1 准备工作

8.2 基于协同过滤算法的短视频完播情况分析

8.2.1 基于用户的协同过滤算法的原理

8.2.2 算法流程

8.2.3 程序实现

8.3 基于矩阵分解算法的短视频完播情况预测

8.3.1 算法原理

8.3.2 利用Surprise库实现SVD算法

8.4 几种方法在测试集中的表现

8.5 本章小结

第9章 《红楼梦》文本数据分析

9.1 准备工作

9.1.1 编程环境

9.1.2 数据情况简介

9.2 分词

9.2.1 读取数据

9.2.2 数据预处理

9.2.3 分词及去除停用词

9.2.4 制作词云图

9.3 文本聚类分析

9.3.1 构建分词TF-IDF矩阵

9.3.2 K-Means聚类

9.3.3 MDS降维

9.3.4 PCA降维

9.3.5 HC聚类

9.3.6 t-SNE高维数据可视化

9.4 LDA主题模型

9.5 人物社交网络分析

9.6 本章小结

附录A 抓取数据请求头查询

附录B GraphViz库的安装方法

附录C 在Windows 10中安装TensorFlow的方法

参考文献

致谢

Python大数据分析与应用实战是2021年由电子工业出版社出版,作者刘宁。

得书感谢您对《Python大数据分析与应用实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
从0到1:Python数据分析 电子书

本书详尽介绍了Pytho数据分析的基础知识,以及开发技巧。
Python+Excel职场办公数据分析 电子书

一本适合编程小白学习的职场数据分析宝典。
Python3快速入门与实战 电子书

理论与实战相结合,结合大量案例系统为你介绍Python。
Python算法交易实战 电子书

本书由浅入深地讲解了算法交易的相关知识。
实战大数据(Hadoop+Spark+Flink)从平台构建到交互式数据分析(离线/实时) 电子书

面向大数据开发工程师,大数据运维工程师围绕Hadoop、Spark、Flink三大主流平台,详解大数据平台的搭建及数据分析(离线/实时)随书配备全套数据集、安装包、配置文件、海...
大数据技术原理与应用(第2版) 电子书

国内高校大数据课程知名教师倾心之作,带你“零基础”学习大数据。
大数据技术原理与应用(第3版) 电子书

本书系统介绍了大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。