Hadoop大数据分析与挖掘实战

Hadoop大数据分析与挖掘实战

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得大数据项目挖掘分析经验,同时快速领悟看似难懂的大数据分析与挖掘理论知识。

内容简介

本书作者从实践出发,结合大量大数据挖掘工程案例及教学经验,以真实案例为主线,深入浅出介绍大数据挖掘项目中针对数据分析的各个流程:数据探索、数据预处理、分类与预测、聚类分析、关联规则挖掘、智能推荐等。因此,图书的编排以解决某个大数据应用的挖掘目标为前提,先介绍案例背景提出挖掘目标,再阐述针对这个目标使用的大数据挖掘分析方法与过程,最后完成模型构建,在介绍建模过程中会针对每个大数据项目的特点进行分析,同时提供上机实验,把相关的建模操作提供给读者。在本书的高级篇中,介绍大数据挖掘的二次开发实例,方便有能力的读者进行相关二次开发。

作者简介

作者张良均,高级信息系统项目管理师,泰迪杯全国大学生数据挖掘竞赛(www.tipdm.org)的发起人。华南师范大学、广东工业大学兼职教授,广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历,主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格(水平)考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数二十余篇,已取得国家发明专利12项,主编图书《神经网络实用教程》《数据挖掘:实用案例分析》《Python数据分析与挖掘》等多本畅销图书,主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。

章节目录

版权信息

前言

基础篇

第1章 数据挖掘基础

1.1 某知名连锁餐饮企业的困惑

1.2 从餐饮服务到数据挖掘

1.3 数据挖掘的基本任务

1.4 数据挖掘建模过程

1.5 餐饮服务中的大数据应用

1.6 小结

第2章 Hadoop基础

2.1 概述

2.2 安装与配置

2.3 Hadoop原理

2.4 动手实践

2.5 小结

第3章 Hadoop生态系统:Hive

3.1 概述

3.2 Hive原理

3.3 动手实践

3.4 小结

第4章 Hadoop生态系统:HBase

4.1 概述

4.2 HBase原理

4.3 动手实践

4.4 小结

第5章 大数据挖掘建模平台

5.1 常用的大数据平台

5.2 TipDM-HB大数据挖掘建模平台

5.3 小结

第6章 挖掘建模

6.1 分类与预测

6.2 聚类分析

6.3 关联规则

6.4 协同过滤

6.5 小结

实战篇

第7章 法律咨询数据分析与服务推荐

7.1 背景与挖掘目标

7.2 分析方法与过程

7.3 上机实验

7.4 拓展思考

7.5 小结

第8章 电商产品评论数据情感分析

8.1 背景与挖掘目标

8.2 分析方法与过程

8.3 上机实验

8.4 拓展思考

8.5 小结

第9章 航空公司客户价值分析

9.1 背景与挖掘目标

9.2 分析方法与过程

9.3 上机实验

9.4 拓展思考

9.5 小结

第10章 基站定位数据商圈分析

10.1 背景与挖掘目标

10.2 分析方法与过程

10.3 上机实验

10.4 拓展思考

10.5 小结

第11章 互联网电影智能推荐

11.1 背景与挖掘目标

11.2 分析方法与过程

11.3 上机实验

11.4 拓展思考

11.5 小结

第12章 家电故障备件储备预测分析

12.1 背景与挖掘目标

12.2 分析方法与过程

12.3 上机实验

12.4 拓展思考

12.5 小结

第13章 市供水混凝投药量控制分析

13.1 背景与挖掘目标

13.2 分析方法与过程

13.3 上机实验

13.4 拓展思考

13.5 小结

第14章 基于图像处理的车辆压双黄线检测

14.1 背景与挖掘目标

14.2 分析方法与过程

14.3 上机实验

14.4 拓展思考

14.5 小结

高级篇

第15章 基于Mahout的大数据挖掘开发

15.1 概述

15.2 环境配置

15.3 基于Mahout算法接口的二次开发0000

15.4 小结

第16章 基于TipDM-HB的数据挖掘二次开发

16.1 概述

16.2 TipDM-HB大数据挖掘建模平台服务开发实例

16.3 小结

参考资料

Hadoop大数据分析与挖掘实战是2015年由机械工业出版社华章分社出版,作者张良均。

得书感谢您对《Hadoop大数据分析与挖掘实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Hadoop大数据开发案例教程与项目实战(在线实验+在线自测) 电子书
本书是一本Hadoop学习入门参考书,全书共11章,分为基础篇和提高篇两部分。基础篇包括第1~6章,具体包括Hadoop概述、Hadoop基础环境配置、分布式存储HDFS、计算系统MapReduce、计算模型Yarn、数据云盘。提高篇包括第7~11章,具体包括协调系统Zookeeper、Hadoop数据库Hbase、Hadoop数据仓库Hive、Hadoop数据采集Flume、OTA离线数据分析平
Hadoop大数据平台集群部署与开发 电子书
Hadoop大数据平台集群部署与开发课程是云计算的一门专业平台课。本教材可为参与大数据开发与处理等相关流程的技术人员提供有益参考,为其介绍大数据处理技术Hadoop以及Hadoop家族体系的其他核心成员:Zookeeper、HBase、Hive、Flume、Sqoop等。本教材以分类任务的形式,具体介绍了“这些成员”的概念及实际应用,具有较强的综合性和实践性强,内容涉及广泛,讲解深入透彻。
大数据技术基础——基于Hadoop与Spark 电子书
将Hadoop和Spark组合起来进行剖析,呈现完整的大数据技术方案。
大数据Hadoop 3.X分布式处理实战 电子书
本书共14章,前4章主要讲解和演示大数据与Hadoop概述、Hadoop伪分布式安装、HDFS分布式文件系统、MapReduce分布式计算框架。第5到11章讲解了Hadoop生态的常用组件,包括NoSQL数据库HBase、分布式数据仓库Hive、数据转换工具Sqoop、内存计算框架Spark。最后3章讲解了3个企业级的大型大数据综合实战项目。
大数据时代的数据挖掘 电子书
(1)内容全面,覆盖当前数据挖掘的主要应用。在介绍每个应用案例时,详细阐述应用的背景,该领域中数据的来源和特点,数据采集与预处理方式,应用领域中数据挖掘的任务和实施数据挖掘技术的难点。同时提供相应的数据挖掘算法分析、工具设计以及系统实现。 (2)条理清晰、便于理解。一方面,面向热爱和关心数据挖掘技术的学术界和工业界读者,帮助他们更好地理解研究的目的和应用的基础;另一方面,让没有太多相关技术背景的读者可以通过阅读本书能够了解数据挖掘的意义和价值,可以看出数据挖掘是如何被广泛地应用于实际案例并成为解决各种问题的核心工具。