大数据技术和应用

大数据技术和应用

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书9章讲解大数据起源、技术、组件,含实验手册,深入浅出。

内容简介

本书共分为9章,讲解了大数据的起源、概念,详细讲解大数据技术及相关组件的各种技术,包括HDFS、Sqoop、HBase、Kafka、Spark等主要组件。每个章节都配套有习题和实验手册。全文通俗易懂,深入浅出讲解了每个知识点。

作者简介

章节目录

版权信息

内容简介

主编介绍

前言

关于本书

本书适合的读者

联系方式与资源下载

第1章 了解大数据

1.1 大数据处理的基础技术

1.1.1 大数据相关概念

1.1.2 大数据处理流程

1.1.3 大数据处理基础技术

1.2 主流大数据技术

1.2.1 主流大数据技术各阶段

1.2.2 Hadoop生态系统

1.2.3 Hadoop核心组件简介

1.3 大数据平台解决方案

1.3.1 Cloudera

1.3.2 Hortonworks

1.3.3 MapR

1.3.4 FusionInsight

1.3.5 Transwarp Data Hub

1.4 大数据发展现状和趋势

1.4.1 大数据市场规模

1.4.2 国内大数据发展面临的问题

1.4.3 大数据发展趋势

1.5 习题

第2章 大数据基础软件

2.1 Linux基础介绍

2.1.1 用户和用户组管理

2.1.2 文件和目录操作

2.1.3 文本编辑器

2.2 Java基础介绍

2.2.1 Java基础

2.2.2 编程开发

2.2.3 Java开发环境配置

2.3 SQL语言基础介绍

2.3.1 数据库基础

2.3.2 SQL简介

2.3.3 SQL语法

2.3.4 SQL基础语法

2.4 实验一:在Linux中安装和使用Java

2.4.1 本实验目标

2.4.2 本实验知识点

2.4.3 项目实施过程

2.4.4 常见问题

2.5 实验二:在Linux中安装和使用MySQL

2.5.1 本实验目标

2.5.2 本实验知识点

2.5.3 项目实施过程

2.5.4 常见问题

2.6 习题

第3章 大数据采集

3.1 大数据采集技术介绍

3.2 常见采集工具和厂商

3.2.1 搜索引擎查看

3.2.2 工具分类

3.3 八爪鱼采集器介绍

3.3.1 八爪鱼采集原理

3.3.2 八爪鱼实现的功能

3.4 爬山虎采集器介绍

3.4.1 爬山虎介绍

3.4.2 产品特点和核心技术

3.4.3 软件界面

3.5 流数据采集工具Flume

3.5.1 Flume背景

3.5.2 Flume NG基本架构

3.5.3 Flume案例分析

3.6 数据传输工具Sqoop介绍

3.6.1 Sqoop工具介绍

3.6.2 Sqoop2特性

3.6.3 Sqoop案例

3.6.4 Sqoop问题集

3.7 实验三:Sqoop的安装配置及使用

3.7.1 本实验目标

3.7.2 本实验知识点

3.7.3 项目实施过程

3.7.4 常见问题

3.8 实验四:Kafka的安装、配置及使用

3.8.1 本实验目标

3.8.2 本实验知识点

3.8.3 项目实施过程

3.8.4 常见问题

第4章 大数据存储

4.1 数据库和数据仓库

4.1.1 数据库类型简介

4.1.2 数据仓库介绍

4.2 分布式文件系统HDFS

4.2.1 HDFS介绍

4.2.2 HDFS体系结构

4.3 分布式分析引擎Kylin介绍

4.3.1 Kylin简介

4.3.2 Kylin基本原理和架构

4.3.3 Kylin的最新特性

4.4 大数据仓库Hive

4.4.1 Hive简介

4.4.2 Hive体系结构

4.4.3 Hive数据存储模型

4.4.4 Hive应用场景

4.5 NoSQL数据库

4.5.1 NoSQL简介

4.5.2 NoSQL在系统架构中的应用

4.6 键-值存储数据库Memcached、Redis

4.6.1 Redis基本介绍

4.6.2 Redis命令总结

4.7 面向文档数据库MongoDB介绍

4.7.1 MongoDB简介

4.7.2 MongoDB深入剖析

4.8 实验五:Hadoop的安装、配置及HDFS使用

4.8.1 本实验目标

4.8.2 本实验知识点

4.8.3 项目实施过程

4.8.4 常见问题

4.9 实验六:Redis数据库的安装与使用

4.9.1 本实验目标

4.9.2 本实验知识点

4.9.3 项目实施过程

4.9.4 常用命令及配置文件介绍

4.10 实验七:HBase的安装和配置

4.10.1 本实验目标

4.10.2 本实验知识点

4.10.3 项目实施过程

4.10.4 常见问题

4.11 习题

第5章 Spark内存计算框架

5.1 Spark简介

5.2 Spark技术原理

5.2.1 Spark与Hadoop的对比

5.2.2 Spark运行架构

5.2.3 RDD基本概念

5.3 Spark SQL介绍

5.4 Spark Streaming实时处理技术

5.5 Spark MLlib数据挖掘库

5.5.1 机器学习定义

5.5.2 Spark MLlib的优势

5.5.3 Spark MLlib支持的机器学习类型

5.6 Spark GraphX图处理技术

5.7 Spark编程实例

第6章 大数据分析挖掘

6.1 大数据分析概述

6.1.1 数据分析与数据挖掘的区别

6.1.2 常见数据分析挖掘工具

6.1.3 数据挖掘十大算法介绍

6.2 分类算法概述

6.2.1 分类预测常见算法

6.2.2 分类预测实现过程

6.3 决策树算法介绍

6.3.1 决策树的定义

6.3.2 决策树的优缺点

6.3.3 决策树的发展

6.3.4 决策树的构造流程

6.3.5 决策树的相关指标

6.3.6 常见决策树算法

6.4 推荐算法介绍

6.4.1 常用推荐算法介绍

6.4.2 主要推荐方法对比

6.5 Apriori算法介绍

6.5.1 Apriori算法

6.5.2 频繁项集的评估标准

6.5.3 Apriori算法思想

6.5.4 Apriori算法流程

6.5.5 Apriori算法小结

第7章 大数据可视化

7.1 大数据可视化概述

7.1.1 数据可视化概述

7.1.2 数据可视化流程

7.1.3 数据可视化展现形式

7.2 大数据可视化工具概述

7.3 Tableau大数据可视化技术简介

7.4 Power BI大数据可视化技术简介

7.5 实验八:ECharts的安装与使用

7.5.1 本实验目标

7.5.2 本实验知识点

7.5.3 项目实施过程

7.5.4 常见问题

第8章 大数据安全

8.1 大数据安全的挑战与对策

8.2 数据管理安全

8.3 数据安全分析

第9章 大数据应用

9.1 企业大数据应用

9.1.1 中国企业大数据现状

9.1.2 企业大数据应用需求

9.2 互联网大数据

9.2.1 互联网行业拥有大数据的关键因素

9.2.2 大数据方案后的价值体现

9.3 零售大数据

9.4 医疗大数据

9.5 大数据未来展望

9.6 大数据和云计算的关系

9.6.1 云计算的特征

9.6.2 云计算与大数据的关系

9.6.3 云计算及其分布式结构是重要途径

9.6.4 云数据库的必然

9.6.5 云数据库需满足的要求

9.6.6 云计算能为大数据带来的变化

参考文献

大数据技术和应用是2020年由清华大学出版社出版,作者席进爱 主编。

得书感谢您对《大数据技术和应用》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
大数据技术原理与应用(第2版) 电子书
国内高校大数据课程知名教师倾心之作,带你“零基础”学习大数据。
命名数据网络原理、技术与应用 电子书
本书是一本系统完整地介绍命名数据网络的书籍,几乎涵盖了所有相关命名数据网络的重要内容,对增强该方向的国内普及具有重要意义。本书作者长期在网络领域从事研究,精通传统IP网络、覆盖网以及未来新型网络,对命名数据网络有着国内前沿的研究,在此基础上对该书编写投入巨大精力,使得本书语言精练、思想深刻,便于读者在较短时间内对命名数据网络有一个全面把握。
MySQL数据库应用技术及实战 电子书
本书针对开发零基础的人群,采用案例或任务驱动的方式,由入门到精通,采用边讲解边练习的方式,使读者感受到学习开发原来如此容易。本书中的数据库技术主要包括MySQL数据库、数据操作、高级查询、索引及数据恢复备份、MySQL数据库优化等方面的知识。通过本书,读者可以实现对MySQL数据库的使用和开发。
MySQL数据库技术与项目应用教程 电子书
本书分为基础应用篇和高级应用篇两大部分,共8个项目26个任务,主要内容包括MySQL数据库的安装与配置、数据库设计与建模、关系代数、数据库的创建与管理和数据查询、数据查询优化、数据库编程、维护系统数据库的安全性和高可用性。
电子商务数据库技术与应用 电子书
本书基本涵盖了电子商务数据库技术的整个知识体系,重点阐述SQL语言和集成开发工具、数据库设计方法和网络数据库程序设计等基础知识;详细地介绍了SQLServer数据库的基本应用、数据库连接技术的基本原理与方法、数据库安全与数据库管理的基本知识。