编辑推荐
本书详解了Hadoop全栈技术及其大数据挖掘方法。
内容简介
本书基于开源Hadoop生态圈的主流技术,深入浅出地介绍了大数据相关技术的原理、知识点及具体应用,适合教师教学使用和零基础自学者使用。
通过本书的学习,读者可以理解大数据相关技术的原理,迅速掌握大数据技术的操作,为后续数据挖掘与分布式计算平台的结合使用打下良好的技术基础。
章节目录
版权信息
作者介绍
前言
第一部分 基础篇
第1章 浅谈大数据
1.1 大数据产生的背景
1.2 大数据概述
1.3 大数据挖掘概述
1.4 大数据平台
1.5 小结
第2章 大数据基础架构Hadoop
2.1 Hadoop技术概述
2.2 Hadoop应用场景介绍
2.3 Hadoop生态系统
2.4 Hadoop安装配置
2.5 Hadoop HDFS文件操作命令
2.6 Hadoop MapReduce编程开发
2.7 场景应用:电影网站用户影评分析
2.8 小结
第3章 数据仓库Hive
3.1 Hive技术概述
3.2 Hive应用场景介绍
3.3 Hive安装配置
3.4 HiveQL查询语句
3.5 Hive自定义函数的使用
3.6 场景应用:基站掉话率排名统计
3.7 小结
第4章 分布式协调框架ZooKeeper
4.1 ZooKeeper技术概述
4.2 ZooKeeper应用场景介绍
4.3 ZooKeeper分布式安装配置
4.4 ZooKeeper客户端常用命令
4.5 ZooKeeper Java API操作
4.6 场景应用:服务器上下线动态监控
4.7 小结
第5章 分布式数据库HBase
5.1 HBase技术概述
5.2 HBase应用场景介绍
5.3 HBase安装配置
5.4 HBase Shell操作
5.5 HBase高级应用
5.6 场景应用:用户通话记录数据存储设计及查询
5.7 小结
第6章 分布式计算框架Spark
6.1 Spark技术概述
6.2 Spark应用场景介绍
6.3 Spark集群安装配置
6.4 Spark Core——底层基础框架
6.5 Spark SQL——查询引擎框架
6.6 Spark MLlib——机器学习库
6.7 Spark Streaming——流计算框架
6.8 小结
第7章 大数据采集框架Flume
7.1 Flume技术概述
7.2 Flume应用场景介绍
7.3 Flume安装与配置
7.4 Flume核心组件的常见类型及参数配置
7.5 Flume采集方案设计与实践
7.6 场景应用:广告日志数据采集系统
7.7 小结
第8章 消息订阅系统Kafka
8.1 Kafka技术概述
8.2 Kafka应用场景介绍
8.3 Kafka集群的安装
8.4 Kafka的基础操作
8.5 Kafka Java API的使用
8.6 场景应用:广告日志数据实时传输
8.7 小结
第二部分 实战篇
第9章 图书热度实时分析系统
9.1 背景与目标
9.2 创建IDEA项目并添加依赖
9.3 图书数据采集
9.4 图书热度指标构建
9.5 图书热度实时计算
9.6 图书热度实时分析过程的完整实现
9.7 小结
第10章 O2O优惠券个性化投放
10.1 背景与目标
10.2 数据探索及预处理
10.3 多维度指标构建
10.4 模型构建
10.5 模型评价
10.6 O2O平台营销手段和策略分析
10.7 小结
第11章 消费者人群画像
11.1 背景与目标
11.2 数据探索
11.3 数据预处理
11.4 消费者信用特征关联
11.5 模型构建
11.6 模型加载应用
11.7 小结
Hadoop与大数据挖掘(第2版)是2022年由机械工业出版社有限公司出版,作者王哲。
得书感谢您对《Hadoop与大数据挖掘(第2版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。