数据挖掘实用案例分析

数据挖掘实用案例分析

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

数据分析实用教材:方法、思路、关键问题及案例分析

内容简介

本教材针对数据分析类课程实用性人才的培养需求,主要从作者亲自参加的多个企业合作项目中,总结素材,从中揭示数据分析的核心过程和问题。具体内容包括常用数据分析方法和思路、数据分析过程的关键问题以及电商客户管理、制造企业质量数据分析、酒店客户的情感分析、银行客户的偏好分析、移动用户的营销方案制定等项目分析过程,使读者体会数据分析的难点并参与实践。

章节目录

封面页

书名页

版权页

内容简介

前言

目录

第1章 数据分析过程的主要问题

1.1 业务理解

1.2 数据理解

1.3 数据质量问题与预处理

1.4 数据分析常见陷阱

1.5 数据分析方法的选择

1.5.1 分类算法

1.5.2 聚类算法

1.5.3 关联分析

1.5.4 回归分析

1.5.5 深度学习

1.5.6 统计方法

1.6 数据分析结果的评价

1.6.1 分类算法的评价

1.6.2 聚类结果的评价

1.6.3 关联分析的评价

1.6.4 回归分析结果的评价

1.6.5 深度学习的评价

1.7 数据分析团队的组建

1.7.1 项目经理

1.7.2 业务专家

1.7.3 数据工程师

1.7.4 数据建模人员

1.7.5 可视化人员

1.7.6 评估人员

1.8 数据分析人才培养的难题

1.8.1 数理要求高

1.8.2 跨学科综合能力

1.8.3 国内技术资料少

1.8.4 实践机会少

第2章 十几万健身房的选择——保险产品推荐

2.1 业务理解

2.2 数据分析目标

2.3 数据探索

2.3.1 数据质量评估

2.3.2 探索数据统计特性

2.3.3 数据降维

2.4 模型选择过程

2.4.1 算法初选

2.4.2 算法验证

2.4.3 算法优化

2.4.4 平衡数据集

2.4.5 修改模型参数

2.5 总结

第3章 常用可视化的多维分析

3.1 箱图

3.2 雷达图

3.3 标签云

3.4 气泡图

3.5 树图

3.6 地图

3.7 高低图

3.8 双轴图

3.9 关系图

3.10 热图

第4章 SPSS Modeler建模组件介绍

4.1 数据预处理组件

4.1.1 数据清理组件

4.1.2 数据集成组件

4.1.3 数据选择组件

4.1.4 数据变换组件

4.2 数据挖掘建模组件

4.2.1 模型筛选

4.2.2 自动建模

4.2.3 决策树模型

4.2.4 贝叶斯网络模型

4.2.5 神经网络模型

4.2.6 支持向量机模型

4.2.7 时间序列模型

4.2.8 统计模型

4.2.9 聚类模型

4.2.10 关联分析

4.2.11 KNN模型

4.2.12 数据挖掘模式评估

4.3 知识表示

4.3.1 图形节点

4.3.2 数据输出

4.3.3 数据导出

第5章 香水销售分析

5.1 香水销售数据预处理

5.2 香水销售数据统计分析

5.3 影响香水销量的因素分析

5.4 香水适用场所关联分析

5.5 香水聚类分析

5.6 香水营销建议

第6章 银行信用卡欺诈与拖欠行为分析

6.1 客户信用等级影响因素

6.1.1 客户信用卡申请数据预处理

6.1.2 信用卡申请成功影响因素

6.2 信用卡客户信用等级影响因素

6.3 基于消费的信用等级影响因素

6.4 信用卡欺诈判断模型

6.4.1 基于Apriori算法的欺诈模型

6.4.2 基于判别的欺诈模型

6.4.3 基于分类算法的欺诈模型

6.5 欺诈人口属性分析

6.5.1 欺诈人口属性统计分析

6.5.2 基于逻辑回归的欺诈人口属性分析

6.5.3 逾期还款的客户特征

6.5.4 基于决策树分析逾期客户特征

6.5.5 基于回归分析逾期客户特征

6.5.6 根据消费历史分析客户特征

6.5.7 基于聚类分析客户特征

6.5.8 基于客户细分的聚类分析

第7章 海底捞火锅运营分析

7.1 火锅相关数据抓取

7.2 数据预处理

7.3 数据分析

7.3.1 海底捞运营分析

7.3.2 店铺选址分析

7.4 菜品关联分析

7.5 用户评论与评分的关联分析

7.6 顾客情感分析

第8章 商务宾馆竞争分析

8.1 目前经济型酒店行业竞争态势

8.2 用户相关数据准备

8.3 通过Python编程抓取评论

8.4 数据预处理

8.5 商务宾馆客户数据分析

8.5.1 酒店评分影响因素

8.5.2 酒店评分与酒店业绩关系

8.5.3 酒店评分分析

8.5.4 客户情感分析

8.5.5 竞争分析

8.6 建议

第9章 耐热导线工厂质量管理数据分析

9.1 项目概述

9.2 耐热导线生产质量数据预处理

9.3 耐热铝线质量检测数据分析

第10章 基于逻辑回归模型的高危人员分析

10.1 高危人员分析需求

10.2 高危人群相关数据收集与预处理

10.3 建立模型

第11章 卷积神经网络在音频质量评价领域的应用

11.1 深度学习基础

11.1.1 深度学习的发展过程

11.1.2 深度学习常用技术框架

11.1.3 常用的深度学习算法

11.2 音频质量评价

11.2.1 音频样本及特征预处理

11.2.2 音频特征选择

11.2.3 卷积神经网络模型训练

11.2.4 模型参数调优

11.3 性能验证

参考文献

数据挖掘实用案例分析是2018年由清华大学出版社出版,作者 董亮。

得书感谢您对《数据挖掘实用案例分析》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Python金融数据分析与挖掘实战 电子书
深入浅出地为你介绍如何使用Python进行金融数据分析、挖掘和量化投资的全过程。
数据挖掘及其应用 电子书
随着互联网、云计算和人工智能等高科技信息技术的飞速发展,人类已迈入大数据时代,但很多时候我们会感到被数据淹没,却缺乏知识的困境,并没有“得数据者得天下”的能力,我们迫切需要从海量数据中,找到值得参考的样型或规则,转换成有价值的信息或知识,创造更多新价值,因此,数据挖掘成了我们提取数据信息的必要窗口。  本书共8章,主要介绍了数据挖掘的理论方法与实践应用,内容涵盖了关联规则挖掘、决策树分析、聚类分析
铁路文本大数据分析挖掘研究及应用 电子书
本书阐述了铁路文本大数据分析挖掘的理论、技术及应用,内容包括:绪论、文本大数据分析挖掘基础、文本大数据分析挖掘理论体系、常用分析与挖掘工具包、铁路文本大数据分析挖掘平台研究、铁路安全文本大数据应用案例、铁路应急管理文本大数据应用案例。
R语言数据分析与挖掘(微课版) 电子书
本书由浅入深,内容丰富。全书共11章,主要内容包括第1章R语言数据分析概述、第2章R语言数据操作基础、第3章数据读写、第4章数据预处理、第5章数据的描述统计分析、第6章数据相关性分析、第7章R语言可视化基础、第8章高级可视化工具、第9章聚类分析、第10章关联规则、第11章分类及预测。
Python大数据分析与挖掘实战(微课版) 电子书
本书以应用为导向,将理论与实践相结合,深入浅出地介绍了利用Python进行大数据分析与挖掘的基本知识,以及如何将其应用到具体领域的方法。本书分3篇:基础篇、案例篇和提高篇。基础篇(第1章-第6章)主要介绍Python基础知识及应用于科学计算、数据处理、数据可视化、机器学习、深度学习等方面的基础知识;案例篇(第7章-第11章)主要介绍利用Python进行金融、地理信息、交通、文本分析、图像识别等领域