Python预测分析实战

Python预测分析实战

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书先介绍预测分析的重要概念和原则,然后给出一系列的代码示例和算法讲解,进而用Python工具构建高性能的预测分析解决方案。

内容简介

本书先介绍预测分析的重要概念和原则,然后给出一系列的代码示例和算法讲解,引导读者了解完整的预测分析流程,进而用Python工具构建高性能的预测分析解决方案。全书所涵盖的内容包括预测分析过程、理解问题和准备数据、理解数据集—探索性数据分析、基于机器学习的数值预测、基于机器学习的类别预测、调整模型和提高性能、基于Dash的模型实现等。本书适合想要学习预测建模并对用Python工具实现预测分析解决方案感兴趣的数据分析师、数据科学家、数据工程师和Python开发人员阅读,也适合对预测分析感兴趣的读者参考。

作者简介

作者阿尔瓦罗·富恩特斯,资深数据分析师,在分析行业的从业经验超过12年,拥有应用数学的硕士学位和数量经济学的学士学位。

他在银行工作过多年,担任经济分析师。他后来创建了Quant公司,主要提供与数据科学相关的咨询和培训服务,并为许多项目做过顾问,涉及商业、教育、医药和大众传媒等领域。

他是一名Python的深度爱好者,有5年的Python工作经验,从事过分析数据、构建模型、生成报告、进行预测以及构建从数据到智能决策的智能转换交互式应用等工作。

章节目录

版权信息

内容提要

前言

审阅者简介

译者简介

作者简介

第1章 预测分析过程

1.1 技术要求

1.2 什么是预测分析

1.3 回顾预测分析的重要概念

1.4 预测分析过程

1.4.1 理解问题和定义问题

1.4.2 收集数据和准备数据

1.4.3 使用EDA挖掘数据信息

1.4.4 构建模型

1.4.5 评价模型

1.4.6 沟通以及/或者部署

1.4.7 CRISP-DM和其他方法

1.5 Python数据科学栈概述

1.5.1 Anaconda

1.5.2 Jupyter Notebook

1.5.3 NumPy

1.5.4 SciPy

1.5.5 pandas

1.5.6 Matplotlib

1.5.7 Seaborn

1.5.8 scikit-learn

1.5.9 TensorFlow和Keras

1.5.10 Dash

1.6 小结

扩展阅读

第2章 理解问题和准备数据

2.1 技术要求

2.2 理解业务问题并提出解决方案

2.2.1 背景决定一切

2.2.2 定义预测内容

2.2.3 明确项目需要的数据

2.2.4 考虑数据访问

2.2.5 提出解决方案

2.3 实践项目

2.3.1 钻石的价格——理解问题和定义问题

2.3.2 更多背景知识

2.3.3 钻石的价格——提出解决方案

2.3.4 钻石的价格——收集数据和准备数据

2.4 实践项目

2.4.1 信用卡违约——理解问题和定义问题

2.4.2 信用卡违约——提出解决方案

2.4.3 信用卡违约——收集数据和准备数据

2.5 小结

扩展阅读

第3章 理解数据集

3.1 技术要求

3.2 什么是EDA

3.3 一元EDA

3.3.1 数值特征的一元EDA

3.3.2 分类特征的一元EDA

3.4 二元EDA

3.4.1 两个数值特征

3.4.2 两个分类特征

3.4.3 一个数值特征和一个分类特征

3.5 图形化的多元EDA

3.6 小结

扩展阅读

第4章 基于机器学习的数值预测

4.1 技术要求

4.2 机器学习简介

4.2.1 监督学习中的任务

4.2.2 创建第一个机器学习模型

4.2.3 机器学习的目标——泛化

4.2.4 过拟合

4.2.5 评价函数和最优化

4.3 建模之前的实际考虑

4.3.1 scikit-learn简介

4.3.2 进一步的特征变换

4.4 多元线性回归

4.5 LASSO回归

4.6 kNN

4.7 训练与测试误差

4.8 小结

扩展阅读

第5章 基于机器学习的分类预测

5.1 技术要求

5.2 分类任务

预测分类和概率

5.3 信用卡违约数据集

5.4 逻辑回归

5.4.1 一个简单的逻辑回归模型

5.4.2 完整的逻辑回归模型

5.5 分类树

5.5.1 分类树的工作原理

5.5.2 分类树的优点和缺点

5.5.3 训练更大的分类树

5.6 随机森林

5.7 训练误差对测试误差

5.8 多元分类

5.9 朴素贝叶斯分类器

5.9.1 条件概率

5.9.2 贝叶斯定理

5.9.3 回到分类问题

5.9.4 高斯朴素贝叶斯

5.10 小结

扩展阅读

第6章 面向预测分析的神经网络简介

6.1 技术要求

6.2 引入神经网络模型

6.2.1 深度学习

6.2.2 MLP的结构——神经网络模型的组成部分

6.2.3 MLP的学习原理

6.3 TensorFlow和Keras简介

6.3.1 TensorFlow

6.3.2 Keras——以人为本的深度学习

6.4 基于神经网络的回归

6.4.1 构建预测钻石价格的MLP

6.4.2 训练MLP

6.4.3 基于神经网络的预测

6.5 基于神经网络的分类

6.5.1 构建预测信用卡违约的MLP

6.5.2 评价预测

6.6 训练神经网络模型的“黑暗艺术”

6.6.1 决策太多,时间太少

6.6.2 神经网络的正则化

6.6.3 训练神经网络模型的实用技巧

6.7 小结

扩展阅读

第7章 模型评价

7.1 技术要求

7.2 回归模型的评价

7.2.1 评价回归模型的指标

7.2.2 评价回归模型的可视化方法

7.3 评价分类模型

7.3.1 混淆矩阵及相关指标

7.3.2 评价分类模型的可视化方法

7.4 k折交叉验证

7.5 小结

扩展阅读

第8章 调整模型和提高性能

8.1 技术要求

8.2 超参数调整

8.2.1 优化单个超参数

8.2.2 优化多个超参数

8.3 提高性能

8.3.1 改进钻石价格预测

8.3.2 是技术问题,更是业务问题

8.4 小结

第9章 基于Dash的模型实现

9.1 技术要求

9.2 模型沟通和/或部署阶段

9.2.1 使用技术报告

9.2.2 说明现有应用程序的功能

9.2.3 分析应用程序

9.3 Dash简介

9.3.1 什么是Dash

9.3.2 Plotly

9.3.3 安装

9.3.4 应用程序布局

9.3.5 构建基本的静态App

9.3.6 构建基本的交互式App

9.4 将预测模型实现为网络应用程序

9.4.1 生成预测模型对象

9.4.2 构建网络应用程序

9.5 小结

扩展阅读

Python预测分析实战是2022年由人民邮电出版社出版,作者[美] 阿尔瓦罗·富恩特斯。

得书感谢您对《Python预测分析实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Python游戏设计案例实战 电子书
本书以Python3.5为编程环境,从基本的程序设计思想入手,逐步展开Python语言教学,是一本面向广大编程学习者的程序设计类教材。基础篇主要讲解Python的基础语法知识、控制语句、函数、文件、面向对象编程基础、Tkinter图形界面设计、网络编程和多线程、Python数据库应用等内容,并以小游戏案例作为各章的阶段性任务。实战篇和提高篇综合应用前面章节中介绍的技术,重现各个经典游戏的开发过程。
Python机器学习开发实战 电子书
Python机器学习入门,以实战为重点,配有大量代码和案例,简单、快速、易学。
Python数据分析与应用 电子书
本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开介绍相关的理论知识点,推导生成可行的解决方案, 后落实在任务实现环节。 全书大部分章节紧扣任务需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施。通过从任务需求到实现这一完整工作流程的体验,帮助读者真正理解与消化Python数据分析与应用。 书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握大数据相关技能。
Python医学数据分析入门 电子书
数据分析是当今大数据时代最关键的技术,其广泛应用于包括医学在内的各个领域。
Python核心技术实战详解 电子书
1.内容讲解深入。 本书对Python的核心知识进行了深入剖析,循序渐进地讲解了核心功能模块的开发技术,帮助读者快速步入Python开发高手之列。 2.提供更为广泛的解决方案。 本书深入讲解了10个不同的主题模块,每一个主题涵盖了特定应用开发领域。在书中不仅给出了案例讲解,还包含了更多的拓展知识,能够帮助读者使用Python 开发各种类型的应用程序。 3.通过网站论坛形成互帮互学的朋友圈。 为了方便给读者答疑,特提供了网站论坛等支持,并且随时在线与读者互动,让大家在互学互帮中形成一个良好的学习编程的氛围。