Hadoop大数据分析与挖掘实战

Hadoop大数据分析与挖掘实战

编辑推荐

通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得大数据项目挖掘分析经验,同时快速领悟看似难懂的大数据分析与挖掘理论知识。

内容简介

本书作者从实践出发,结合大量大数据挖掘工程案例及教学经验,以真实案例为主线,深入浅出介绍大数据挖掘项目中针对数据分析的各个流程:数据探索、数据预处理、分类与预测、聚类分析、关联规则挖掘、智能推荐等。因此,图书的编排以解决某个大数据应用的挖掘目标为前提,先介绍案例背景提出挖掘目标,再阐述针对这个目标使用的大数据挖掘分析方法与过程,最后完成模型构建,在介绍建模过程中会针对每个大数据项目的特点进行分析,同时提供上机实验,把相关的建模操作提供给读者。在本书的高级篇中,介绍大数据挖掘的二次开发实例,方便有能力的读者进行相关二次开发。

作者简介

作者张良均,高级信息系统项目管理师,泰迪杯全国大学生数据挖掘竞赛(www.tipdm.org)的发起人。华南师范大学、广东工业大学兼职教授,广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历,主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格(水平)考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数二十余篇,已取得国家发明专利12项,主编图书《神经网络实用教程》《数据挖掘:实用案例分析》《Python数据分析与挖掘》等多本畅销图书,主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。

章节目录

版权信息

前言

基础篇

第1章 数据挖掘基础

1.1 某知名连锁餐饮企业的困惑

1.2 从餐饮服务到数据挖掘

1.3 数据挖掘的基本任务

1.4 数据挖掘建模过程

1.5 餐饮服务中的大数据应用

1.6 小结

第2章 Hadoop基础

2.1 概述

2.2 安装与配置

2.3 Hadoop原理

2.4 动手实践

2.5 小结

第3章 Hadoop生态系统:Hive

3.1 概述

3.2 Hive原理

3.3 动手实践

3.4 小结

第4章 Hadoop生态系统:HBase

4.1 概述

4.2 HBase原理

4.3 动手实践

4.4 小结

第5章 大数据挖掘建模平台

5.1 常用的大数据平台

5.2 TipDM-HB大数据挖掘建模平台

5.3 小结

第6章 挖掘建模

6.1 分类与预测

6.2 聚类分析

6.3 关联规则

6.4 协同过滤

6.5 小结

实战篇

第7章 法律咨询数据分析与服务推荐

7.1 背景与挖掘目标

7.2 分析方法与过程

7.3 上机实验

7.4 拓展思考

7.5 小结

第8章 电商产品评论数据情感分析

8.1 背景与挖掘目标

8.2 分析方法与过程

8.3 上机实验

8.4 拓展思考

8.5 小结

第9章 航空公司客户价值分析

9.1 背景与挖掘目标

9.2 分析方法与过程

9.3 上机实验

9.4 拓展思考

9.5 小结

第10章 基站定位数据商圈分析

10.1 背景与挖掘目标

10.2 分析方法与过程

10.3 上机实验

10.4 拓展思考

10.5 小结

第11章 互联网电影智能推荐

11.1 背景与挖掘目标

11.2 分析方法与过程

11.3 上机实验

11.4 拓展思考

11.5 小结

第12章 家电故障备件储备预测分析

12.1 背景与挖掘目标

12.2 分析方法与过程

12.3 上机实验

12.4 拓展思考

12.5 小结

第13章 市供水混凝投药量控制分析

13.1 背景与挖掘目标

13.2 分析方法与过程

13.3 上机实验

13.4 拓展思考

13.5 小结

第14章 基于图像处理的车辆压双黄线检测

14.1 背景与挖掘目标

14.2 分析方法与过程

14.3 上机实验

14.4 拓展思考

14.5 小结

高级篇

第15章 基于Mahout的大数据挖掘开发

15.1 概述

15.2 环境配置

15.3 基于Mahout算法接口的二次开发0000

15.4 小结

第16章 基于TipDM-HB的数据挖掘二次开发

16.1 概述

16.2 TipDM-HB大数据挖掘建模平台服务开发实例

16.3 小结

参考资料

Hadoop大数据分析与挖掘实战是2015年由机械工业出版社华章分社出版,作者张良均。

得书感谢您对《Hadoop大数据分析与挖掘实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
掘金大数据:电信数据金矿详解、挖掘及应用 电子书

本书带你了解电信运营商数据的全貌,详解资源特征、分析体系,涵盖交通金融旅游广告气象餐饮娱乐政务等案例。
Python数据分析入门与实战 电子书

掌握数据分析技巧,运用强大的Python工具,解决工作中繁琐的数据问题。
Spark快速大数据分析(第2版) 电子书

涵盖Spark3.0的新特性,着重展示如何利用机器学习算法执行大数据分析。
数据仓库与数据挖掘 电子书

本书深入剖析数据仓库、挖掘算法、产品及税务案例,探讨大数据管理与应用。
数据分析实战:方法、工具与可视化 电子书

本书通过实战案例和可视化的图形讲解数据分析的知识。
R语言医学数据分析实战 电子书

以医学数据为例,讲解如何使用R进行数据分析。
PowerBI数据挖掘与可视化分析 电子书

“人人都是数据分析师”系列,深入浅出讲解PowerBI应用和秘诀,让你的数据“狂飙”。