Hadoop与大数据挖掘(第2版)

Hadoop与大数据挖掘(第2版)

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书详解了Hadoop全栈技术及其大数据挖掘方法。

内容简介

本书基于开源Hadoop生态圈的主流技术,深入浅出地介绍了大数据相关技术的原理、知识点及具体应用,适合教师教学使用和零基础自学者使用。

通过本书的学习,读者可以理解大数据相关技术的原理,迅速掌握大数据技术的操作,为后续数据挖掘与分布式计算平台的结合使用打下良好的技术基础。

章节目录

版权信息

作者介绍

前言

第一部分 基础篇

第1章 浅谈大数据

1.1 大数据产生的背景

1.2 大数据概述

1.3 大数据挖掘概述

1.4 大数据平台

1.5 小结

第2章 大数据基础架构Hadoop

2.1 Hadoop技术概述

2.2 Hadoop应用场景介绍

2.3 Hadoop生态系统

2.4 Hadoop安装配置

2.5 Hadoop HDFS文件操作命令

2.6 Hadoop MapReduce编程开发

2.7 场景应用:电影网站用户影评分析

2.8 小结

第3章 数据仓库Hive

3.1 Hive技术概述

3.2 Hive应用场景介绍

3.3 Hive安装配置

3.4 HiveQL查询语句

3.5 Hive自定义函数的使用

3.6 场景应用:基站掉话率排名统计

3.7 小结

第4章 分布式协调框架ZooKeeper

4.1 ZooKeeper技术概述

4.2 ZooKeeper应用场景介绍

4.3 ZooKeeper分布式安装配置

4.4 ZooKeeper客户端常用命令

4.5 ZooKeeper Java API操作

4.6 场景应用:服务器上下线动态监控

4.7 小结

第5章 分布式数据库HBase

5.1 HBase技术概述

5.2 HBase应用场景介绍

5.3 HBase安装配置

5.4 HBase Shell操作

5.5 HBase高级应用

5.6 场景应用:用户通话记录数据存储设计及查询

5.7 小结

第6章 分布式计算框架Spark

6.1 Spark技术概述

6.2 Spark应用场景介绍

6.3 Spark集群安装配置

6.4 Spark Core——底层基础框架

6.5 Spark SQL——查询引擎框架

6.6 Spark MLlib——机器学习库

6.7 Spark Streaming——流计算框架

6.8 小结

第7章 大数据采集框架Flume

7.1 Flume技术概述

7.2 Flume应用场景介绍

7.3 Flume安装与配置

7.4 Flume核心组件的常见类型及参数配置

7.5 Flume采集方案设计与实践

7.6 场景应用:广告日志数据采集系统

7.7 小结

第8章 消息订阅系统Kafka

8.1 Kafka技术概述

8.2 Kafka应用场景介绍

8.3 Kafka集群的安装

8.4 Kafka的基础操作

8.5 Kafka Java API的使用

8.6 场景应用:广告日志数据实时传输

8.7 小结

第二部分 实战篇

第9章 图书热度实时分析系统

9.1 背景与目标

9.2 创建IDEA项目并添加依赖

9.3 图书数据采集

9.4 图书热度指标构建

9.5 图书热度实时计算

9.6 图书热度实时分析过程的完整实现

9.7 小结

第10章 O2O优惠券个性化投放

10.1 背景与目标

10.2 数据探索及预处理

10.3 多维度指标构建

10.4 模型构建

10.5 模型评价

10.6 O2O平台营销手段和策略分析

10.7 小结

第11章 消费者人群画像

11.1 背景与目标

11.2 数据探索

11.3 数据预处理

11.4 消费者信用特征关联

11.5 模型构建

11.6 模型加载应用

11.7 小结

Hadoop与大数据挖掘(第2版)是2022年由机械工业出版社有限公司出版,作者王哲。

得书感谢您对《Hadoop与大数据挖掘(第2版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
HADOOP大数据开发实战 电子书
Hadoop基础教程,大数据技术原理与应用教程,MapReduce框架入门实战指南。
Hadoop数据仓库实战 电子书
本书以Hive为开发平台,主要介绍了如何使用HiveQL来查询和分析存储在Hadoop分布式文件系统上的大数据集合,具体内容包括Hive入门、Hive数据库及表操作、Hive元数据、Hive高级操作、Hive函数与Streaming、Hive视图与索引、Hive调优、Hive与HBase集成、数据迁移框架Sqoop等。本书介绍的每个任务都运用了大量案例,紧密结合实际应用,融入了含金量十足的开发经验
Hadoop大数据开发基础 电子书
本书以任务为导向,较为全面地介绍了Hadoop大数据技术的相关知识。全书共6章,具体内容包括Hadoop介绍、Hadoop集群的搭建及配置、Hadoop基础操作、MapReduce编程入门、MapReduce进阶编程、项目案例:电影网站用户性别预测。本书的第2~5章包含了实训与课后练习,通过练习和操作实践,帮助读者巩固所学的内容。本书可以作为高校大数据技术类专业的教材,也可作为大数据技术爱好者的自
数据挖掘及其应用 电子书
随着互联网、云计算和人工智能等高科技信息技术的飞速发展,人类已迈入大数据时代,但很多时候我们会感到被数据淹没,却缺乏知识的困境,并没有“得数据者得天下”的能力,我们迫切需要从海量数据中,找到值得参考的样型或规则,转换成有价值的信息或知识,创造更多新价值,因此,数据挖掘成了我们提取数据信息的必要窗口。  本书共8章,主要介绍了数据挖掘的理论方法与实践应用,内容涵盖了关联规则挖掘、决策树分析、聚类分析
大数据技术基础——基于Hadoop与Spark 电子书
将Hadoop和Spark组合起来进行剖析,呈现完整的大数据技术方案。