巧用ChatGPT进行数据分析与挖掘

巧用ChatGPT进行数据分析与挖掘

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

教你使用ChatGPT进行Python数据分析与挖掘实操。

内容简介

从读者对象的角度看,本书既大大降低了没有编程经验的读者学习Python数据分析的门槛,又为有经验的Python数据分析师提供了大量实用的AI数据分析技巧,帮助他们快速转型为具备AI能力的数据分析师。

从核心内容的角度看,本书不仅讲解了如何在数据预处理、数据清洗、数据可视化等基础的数据分析环节使用AI工具,而且还讲解了如何在聚类分析、预测分析等高级的数据建模环节使用AI工具。

本书采用由浅入深的写作方式,既确保了内容的可理解性,又保持了足够的深度,配有详细的代码示例和实践指导,确保每位读者能够轻松上手并从中获益,提升自己的分析效率和洞察能力。

本书采用案例驱动的写作方式,通过实际业务案例详细拆解AI技术在各个场景中的应用步骤和技巧。语言简洁易懂,理论与实践结合,注重实用性和可操作性,帮助读者快速掌握核心知识。提供丰富的实际案例和操作指南,涵盖多种AI工具和交互技巧,确保读者能够学以致用。

作者简介

作者谢佳标,资深R语言专家,多次于中国R语言大会发表演讲,具有十余年的数据挖掘实战经验。目前于某上市互联网游戏公司,任高级数据分析师,负责大数据挖掘及可视化。培训过的精品课程有:《R语言基础培训》《数据分析之R语言实战》《机器学习与R语言实践》等。

章节目录

版权信息

前言

第1章 数据分析及ChatGPT概述

1.1 数据分析概述

1.1.1 用ChatGPT快速了解数据分析

1.1.2 数据分析与数据挖掘

1.1.3 机器学习算法概述

1.2 常用AIGC工具的注册及使用

1.2.1 如何使用OpenAI的GPT-3.5

1.2.2 如何使用百度的文心一言

1.2.3 如何使用科大讯飞的星火认知大模型

1.3 使用ChatGPT辅助工具安装

1.3.1 Anaconda的安装

1.3.2 Jupyter Notebook的使用

1.4 使用ChatGPT辅助Python入门

1.4.1 使用ChatGPT学习Python数据对象

1.4.2 使用ChatGPT学习NumPy

1.4.3 使用ChatGPT学习Pandas

1.5 本章小结

第2章 使用ChatGPT学习数据操作

2.1 使用ChatGPT学习数据的基本管理

2.1.1 数据去重

2.1.2 数据排序

2.1.3 数据合并

2.1.4 数据分箱

2.2 使用ChatGPT学习描述统计分析

2.2.1 描述统计分析概述

2.2.2 中心趋势分析

2.2.3 离散程度分析

2.2.4 分布形状分析

2.2.5 频数分布分析

2.3 使用ChatGPT学习中文文本操作

2.3.1 Jieba分词

2.3.2 添加自定义词典

2.3.3 关键词提取

2.3.4 词性标注

2.4 使用ChatGPT学习图像数据操作

2.4.1 图像的读取、显示及保存

2.4.2 图像像素的获取和编辑

2.4.3 图像的几何变换操作

2.5 本章小结

第3章 使用ChatGPT学习数据预处理

3.1 使用ChatGPT学习数据抽样

3.1.1 常用的数据抽样方法

3.1.2 简单随机抽样

3.1.3 数据分区

3.1.4 分层随机抽样

3.1.5 数据类失衡处理

3.2 使用ChatGPT学习数据清洗

3.2.1 缺失值的识别及处理

3.2.2 异常值的识别及处理

3.3 使用ChatGPT学习数据变换

3.3.1 数据标准化处理

3.3.2 数据独热编码处理

3.4 本章小结

第4章 使用ChatGPT学习数据静态可视化

4.1 使用ChatGPT了解数据可视化工具

4.2 使用ChatGPT学习Matplotlib数据可视化

4.2.1 Matplotlib绘图基础

4.2.2 使用Matplotlib绘制图形

4.3 使用ChatGPT学习Pandas数据可视化

4.3.1 Pandas绘图方法

4.3.2 使用Pandas绘制图形

4.4 使用ChatGPT学习Seaborn数据可视化

4.4.1 Seaborn绘图方法

4.4.2 使用Seaborn绘制图形

4.5 使用ChatGPT学习plotnine数据可视化

4.5.1 plotnine绘图方法

4.5.2 使用plotnine绘制图形

4.6 本章小结

第5章 使用ChatGPT学习交互数据可视化

5.1 使用ChatGPT学习Plotly数据可视化

5.1.1 Plotly交互可视化绘图方法

5.1.2 使用graph_objs进行交互可视化

5.1.3 使用express进行交互可视化

5.2 使用ChatGPT学习Bokeh数据可视化

5.2.1 Bokeh交互可视化绘图方法

5.2.2 使用Bokeh进行交互可视化

5.3 使用ChatGPT学习Pyecharts数据可视化

5.3.1 Pyecharts交互可视化绘图方法

5.3.2 使用Pyecharts进行交互可视化

5.4 本章小结

第6章 使用ChatGPT学习聚类分析

6.1 使用ChatGPT了解无监督学习

6.2 聚类分析方法概述

6.3 k均值聚类

6.3.1 k均值聚类的原理

6.3.2 k均值聚类的Python实现

6.3.3 案例:对iris数据集进行k均值聚类

6.3.4 使用统计方法寻找最佳聚类簇数

6.4 层次聚类

6.4.1 层次聚类的原理

6.4.2 层次聚类的Python实现

6.4.3 案例:对USArrests数据集进行层次聚类

6.4.4 使用轮廓系数寻找最佳聚类簇数

6.5 密度聚类

6.5.1 密度聚类的原理

6.5.2 密度聚类的Python实现

6.5.3 案例:对multishapes数据集进行密度聚类

6.6 本章小结

第7章 使用ChatGPT学习降维算法及关联规则分析

7.1 使用ChatGPT了解降维算法

7.2 主成分分析

7.2.1 主成分分析的原理

7.2.2 主成分分析的Python实现

7.2.3 案例:对iris数据集进行主成分分析

7.3 关联规则分析

7.3.1 关联规则分析的原理

7.3.2 关联规则分析的Python实现

7.3.3 案例:对用户购买物品的行为进行关联规则分析

7.4 本章小结

第8章 使用ChatGPT学习回归分析

8.1 使用ChatGPT了解常用的有监督学习算法

8.2 一元线性回归

8.2.1 一元线性回归的原理

8.2.2 使用scikit-learn实现一元线性回归

8.2.3 案例:对women数据集进行一元线性回归

8.3 多元线性回归

8.3.1 多元线性回归的原理

8.3.2 案例:对个人医疗费用进行多元线性回归

8.4 对自变量中有定性变量的数据集进行线性回归

8.4.1 对自变量中有定性变量的数据集建立线性回归模型

8.4.2 回归模型的效果评估

8.5 通过逐步回归寻找最优模型

8.6 逻辑回归

8.6.1 逻辑回归的原理

8.6.2 逻辑回归的Python实现

8.6.3 案例:对iris数据集进行逻辑回归

8.7 本章小结

第9章 使用ChatGPT学习决策树算法及随机森林算法

9.1 决策树算法的原理

9.1.1 决策树算法概述

9.1.2 常用的决策树算法

9.2 决策树算法的Python实现

9.2.1 实现决策树算法的常用库

9.2.2 基于scikit-learn实现决策树分类

9.3 案例:对iris数据集进行决策树分类

9.3.1 构建决策树

9.3.2 查看生成的决策规则

9.3.3 决策树可视化

9.3.4 绘制决策边界

9.4 案例:对乳腺癌数据集进行决策树分类

9.4.1 构建决策树分类模型

9.4.2 对决策树分类模型进行调优

9.5 随机森林算法的原理及实现

9.5.1 常用的集成学习算法

9.5.2 基于scikit-learn实现随机森林分类

9.5.3 案例:对乳腺癌数据集进行随机森林分类

9.6 本章小结

第10章 使用ChatGPT学习k近邻算法及支持向量机算法

10.1 k近邻算法的原理

10.1.1 k近邻算法的思想

10.1.2 k近邻算法的推导过程

10.1.3 距离的度量方法

10.2 k近邻算法的Python实现

10.2.1 基于scikit-learn实现k近邻分类

10.2.2 案例:对乳腺癌数据集进行k近邻分类

10.3 支持向量机算法的原理

10.3.1 了解支持向量机

10.3.2 常见的支持向量机模型

10.4 支持向量机算法的Python实现

10.4.1 基于scikit-learn实现支持向量机分类

10.4.2 案例:对乳腺癌数据集进行支持向量机分类

10.5 本章小结

第11章 使用ChatGPT学习神经网络算法

11.1 神经网络算法的理论基础

11.1.1 了解神经网络算法

11.1.2 神经网络的拓扑结构

11.1.3 常用的激活函数

11.1.4 常用的神经网络模型

11.2 前馈神经网络

11.2.1 了解前馈神经网络

11.2.2 前馈神经网络的scikit-learn实现

11.2.3 案例:对乳腺癌数据集进行前馈神经网络分类

11.3 卷积神经网络

11.3.1 卷积神经网络的原理

11.3.2 卷积层的原理

11.3.3 卷积层的TensorFlow实现

11.3.4 池化层的原理

11.3.5 池化层的TensorFlow实现

11.3.6 全连接层

11.3.7 案例:使用卷积神经网络实现手写数字识别

11.4 本章小结

第12章 使用ChatGPT学习模型性能评估及优化

12.1 模型性能评估

12.1.1 数值预测的评估方法及其scikit-learn实现

12.1.2 分类预测的评估方法及其scikit-learn实现

12.2 模型参数优化

12.2.1 正则化

12.2.2 数据分区

12.2.3 K折交叉验证

12.2.4 网格搜索

12.2.5 Dropout

12.2.6 梯度下降法

12.3 案例:对乳腺癌数据集寻找最优模型

12.4 本章小结

巧用ChatGPT进行数据分析与挖掘是2024年由机械工业出版社出版,作者谢佳标。

得书感谢您对《巧用ChatGPT进行数据分析与挖掘》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Python数据分析与应用 电子书
本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开介绍相关的理论知识点,推导生成可行的解决方案, 后落实在任务实现环节。 全书大部分章节紧扣任务需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施。通过从任务需求到实现这一完整工作流程的体验,帮助读者真正理解与消化Python数据分析与应用。 书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握大数据相关技能。
Excel数据分析与处理 电子书
全书分为4篇:第1篇为应用基础篇,主要介绍Excel的基本功能和基本操作;第2篇为数据处理篇,主要介绍使用公式和函数实现数据处理的方法,以及直观显示数据的方法;第3篇为数据分析篇,主要介绍Excel数据管理、数据分析方面的基本功能和分析方法;第4篇为拓展应用篇,主要介绍宏和协同功能。
pandas数据处理与分析 电子书
本书以Python中的pandas库为主线,介绍各类数据处理与分析方法。
Elasticsearch数据搜索与分析实战 电子书
深入描述了Elasticsearch的各种运行机制。
IBM SPSS Modeler 18.0数据挖掘权威指南 电子书
联袂推荐 暨南大学教授、博士生导师刘建平,暨南大学研究生院副院长、经济学院统计学系副主任、教授、博士生导师陈光慧,天善智能创始人梁勇,IBM技术专家刘咏梅,IBM数据科学家钟云飞,广东省环保厅环境咨询专家委员会专家、广东柯内特环境科技有限公司总经理朱斌 本书特色 内容全面:涉及数据读取、数据处理、数据可视化、统计分析与检验、数据挖掘算法、自动建模、集成与扩展、模型部署、性能优化、数据挖掘方法论等诸多内容; 讲解透彻:既有理论的讲解,又涵盖应用的实践,而且在工具的介绍上,尽可能包括每一个选项的内容和应用形式,力求让读者“吃透”每一章节的内容; 突出实战:集行业经验、项目实践、算法剖析、应用技巧于一身,配套提供数据文件以及数据模型文件,方便读者动手实践。