大数据技术原理与应用(第3版)

大数据技术原理与应用(第3版)

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

内容简介

本书系统介绍了大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。

作者简介

编著者林子雨,北大博士,厦门大学计算机科学系老师,中国高校首个“数字教师”的提出者和建设者。在数据库、数据仓库、数据挖掘、大数据、云计算和物联网等领域有着十多年的知识积累,对各个领域知识都有比较深入的了解,有比较宽泛的视野。

章节目录

版权信息

内容提要

前言(第3版)

第一篇 大数据基础

第1章 大数据概述

1.1 大数据时代

1.2 大数据的概念

1.3 大数据的影响

1.4 大数据的应用

1.5 大数据关键技术

1.6 大数据计算模式

1.7 大数据产业

1.8 大数据与云计算、物联网

1.9 本章小结

1.10 习题

第2章 大数据处理架构Hadoop

2.1 概述

2.2 Hadoop生态系统

2.3 Hadoop的安装与使用

2.4 本章小结

2.5 习题

实验1 熟悉常用的Linux操作和Hadoop操作

第二篇 大数据存储与管理

第3章 分布式文件系统HDFS

3.1 分布式文件系统

3.2 HDFS简介

3.3 HDFS的相关概念

3.4 HDFS体系结构

3.5 HDFS的存储原理

3.6 HDFS的数据读写过程

3.7 HDFS编程实践

3.8 本章小结

3.9 习题

实验2 熟悉常用的HDFS操作

第4章 分布式数据库HBase

4.1 概述

4.2 HBase访问接口

4.3 HBase数据模型

4.4 HBase的实现原理

4.5 HBase运行机制

4.6 HBase编程实践

4.7 本章小结

4.8 习题

实验3 熟悉常用的HBase操作

第5章 NoSQL数据库

5.1 NoSQL简介

5.2 NoSQL兴起的原因

5.3 NoSQL与关系数据库的比较

5.4 NoSQL的四大类型

5.5 NoSQL的三大基石

5.6 从NoSQL到NewSQL数据库

5.7 本章小结

5.8 习题

实验4 NoSQL和关系数据库的操作比较

第6章 云数据库

6.1 云数据库概述

6.2 云数据库产品

6.3 云数据库系统架构

6.4 本章小结

6.5 习题

第三篇 大数据处理与分析

第7章 MapReduce

7.1 概述

7.2 MapReduce的工作流程

7.3 实例分析:WordCount

7.4 MapReduce的具体应用

7.5 MapReduce编程实践

7.6 本章小结

7.7 习题

实验5 MapReduce初级编程实践

第8章 Hadoop再探讨

8.1 Hadoop的优化与发展

8.2 HDFS 2.0的新特性

8.3 新一代资源管理调度框架YARN

8.4 Hadoop生态系统中具有代表性的功能组件

8.5 本章小结

8.6 习题

第9章 数据仓库Hive

9.1 概述

9.2 Hive系统架构

9.3 Hive工作原理

9.4 Hive HA基本原理

9.5 Impala

9.6 Hive编程实践

9.7 本章小结

9.8 习题

实验6 熟悉Hive的基本操作

第10章 Spark

10.1 概述

10.2 Spark生态系统

10.3 Spark运行架构

10.4 Spark的部署和应用方式

10.5 Spark编程实践

10.6 本章小结

10.7 习题

实验7 Spark初级编程实践

第11章 流计算

11.1 流计算概述

11.2 流计算的处理流程

11.3 流计算的应用

11.4 开源流计算框架Storm

11.5 Spark Streaming

11.6 本章小结

11.7 习题

第12章 Flink

12.1 Flink简介

12.2 为什么选择Flink

12.3 Flink应用场景

12.4 Flink技术栈

12.5 Flink体系架构

12.6 Flink编程模型

12.7 Flink编程实践

12.8 本章小结

12.9 习题

实验8 Flink初级编程实践

第13章 图计算

13.1 图计算简介

13.2 Pregel简介

13.3 Pregel图计算模型

13.4 Pregel的C++ API

13.5 Pregel的体系结构

13.6 Pregel的应用实例

13.7 Pregel和MapReduce实现PageRank算法的对比

13.8 本章小结

13.9 习题

第14章 数据可视化

14.1 可视化概述

14.2 可视化工具

14.3 可视化典型案例

14.4 本章小结

14.5 习题

第四篇 大数据应用

第15章 大数据在互联网领域的应用

15.1 推荐系统概述

15.2 协同过滤

15.3 协同过滤实践

15.4 本章小结

15.5 习题

第16章 大数据在生物医学领域的应用

16.1 流行病预测

16.2 智慧医疗

16.3 生物信息学

16.4 案例:基于大数据的综合健康服务平台

16.5 本章小结

16.6 习题

第17章 大数据的其他应用

17.1 大数据在物流领域中的应用

17.2 大数据在城市管理中的应用

17.3 大数据在金融行业中的应用

17.4 大数据在汽车行业中的应用

17.5 大数据在零售行业中的应用

17.6 大数据在餐饮行业中的应用

17.7 大数据在电信行业中的应用

17.8 大数据在能源行业中的应用

17.9 大数据在体育和娱乐领域中的应用

17.10 大数据在安全领域中的应用

17.11 大数据在政府领域中的应用

17.12 大数据在日常生活中的应用

17.13 本章小结

17.14 习题

参考文献

大数据技术原理与应用(第3版)是2021年由人民邮电出版社出版,作者林子雨 编著。

得书感谢您对《大数据技术原理与应用(第3版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
图数据库实战 电子书
图数据库入门教程书籍,采用Gremlin语言,完整展示图应用程序的构建过程,从入门到实践学习图数据库。
数据会说话:活用数据表达、说服与决策 电子书
本书用通俗易懂的语言、丰富的案例,介绍了如何利用数据有效表达、说服他人,以及如何防止被他人的数据误导。
Excel商务数据处理与分析(微课版 第2版) 电子书
本书主要讲解商务数据的处理与分析,深入浅出地介绍了使用Excel编辑、分析和管理商务数据的方法,帮助读者快速、高效地完成商务数据的处理与分析工作。全书共11章:第1章主要介绍商务数据分析的基础知识;第2~5章主要介绍编辑与处理数据的方法;第6~11章主要介绍实际工作中不同类型数据的分析方法,并对Excel的常用函数、公式和数据分析工具等进行详细讲解。本书内容翔实、结构清晰、图文并茂,通过实际工作中
Access数据库应用教程 电子书
理论与实际操作紧密结合,让你体验并掌握使用Access建立数据库应用系统的全过程。
pandas数据处理与分析 电子书
本书以Python中的pandas库为主线,介绍各类数据处理与分析方法。