大数据治理与安全:从理论到开源实践

大数据治理与安全:从理论到开源实践

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书在介绍大数据学术界新动态与大数据行业生产实践的同时,对大数据安全与治理的新理论与实践内容做了详尽的阐述。

内容简介

作为大数据前沿的新兴领域,市面上大数据安全与治理的相关书籍屈指可数。本书分为两部分:第壹篇(理论篇),介绍大数据治理与安全的理论、方法和技术挑战等;第二篇(开源实现篇),介绍开源社区各类开源项目,将研究与实践的内容根据不同组件分类。

作者简介

作者刘驰,教授、博导、北京理工大学软件学院副院长。先后入选2015年度国家人社部“高层次留学人才回国资助计划”和第八批陕西省百人计划(短期)。分别于清华大学和英国帝国理工学院获得学士和博士学位,后在德国电信研究院(柏林)、美国IBM TJ Watson研究中心和IBM中国研究院任博士后研究员和研究主管。主要研究方向是:绿色物联网大数据高效传输与处理技术。发表高水平SCI/EI论文80余篇,授权外发明7项,编著中英文书籍8本/节。主持了国家自然科学基金、工信部2013年电子商务集成创新试点工程等20余省部级重点项目,现任国际信息处理联合会(IFIP)云计算专委会副主席、中国自动化学会大数据专委会委员、中国工程院聘中国信息与电子工程科技发展战略研究中心特聘专家(计算机应用领域)等。

章节目录

版权信息

前言

第一篇 理论篇

第1章 大数据治理技术

1.1 概述

1.1.1 大数据治理的基本概念

1.1.2 大数据治理的意义和重要作用

1.2 框架

1.2.1 大数据治理框架概述

1.2.2 大数据治理的原则

1.2.3 大数据治理的范围

1.2.4 大数据治理的实施与评估

第2章 大数据安全、隐私保护和审计技术

2.1 大数据安全

2.1.1 大数据安全的意义和重要作用

2.1.2 大数据安全面临的问题与挑战

2.1.3 大数据安全防护技术

2.2 大数据隐私保护

2.2.1 大数据隐私保护的意义和重要作用

2.2.2 大数据隐私保护面临的问题与挑战

2.2.3 大数据隐私保护技术

2.3 大数据治理审计

2.3.1 大数据治理审计概述

2.3.2 大数据治理审计内容

2.3.3 大数据治理审计方法和技术

2.3.4 大数据治理审计流程

第二篇 开源实现篇

第3章 大数据治理之Apache Falcon

3.1 Apache Falcon概述

3.1.1 Apache Falcon技术概况

3.1.2 Apache Falcon发展近况

3.1.3 Apache Falcon技术优势

3.1.4 Apache Falcon架构

3.2 Apache Falcon的使用

3.2.1 Oozie的安装与配置

3.2.2 Falcon的安装与配置

3.2.3 实体XML的创建与声明

3.3 Apache Falcon场景设计与实现

3.3.1 数据管道

3.3.2 结构化数据导入分布式文件系统

3.3.3 结构化数据库与数据仓库的交互

3.3.4 跨集群数据传输

3.3.5 数据镜像

3.3.6 数据仓库中的数据操作

3.4 Apache Falcon优化与性能分析

3.4.1 Apache Falcon控制流

3.4.2 分布式部署

3.4.3 安全模式

3.4.4 Apache Falcon优化

3.5 Apache Falcon应用举例

3.5.1 InMobi基于Falcon的数据治理

3.5.2 Expedia基于Falcon的数据治理

3.6 本章小结

第4章 大数据治理之Apache Atlas

4.1 Apache Atlas概述

4.1.1 Apache Atlas技术概况

4.1.2 Apache Atlas发展近况

4.1.3 Apache Atlas技术优势

4.1.4 Apache Atlas架构

4.2 Apache Atlas的配置与使用

4.2.1 安装配置Apache Atlas

4.2.2 添加或修改Atlas Web UI的登录账户

4.2.3 配置Hive通过Hive HOOK导入数据

4.2.4 配置Sqoop通过Sqoop HOOK导入数据

4.2.5 配置Storm通过Storm HOOK导入数据

4.2.6 配置Falcon通过Falcon HOOK导入数据

4.3 Apache Atlas的场景设计

4.3.1 Atlas总场景介绍

4.3.2 Atlas非实时数据场景

4.3.3 Atlas实时数据场景

4.3.4 Hive数据表操作

4.4 Apache Atlas优化与性能分析

4.5 本章小结

第5章 大数据安全之Apache Ranger

5.1 Apache Ranger概述

5.1.1 Ranger技术概况

5.1.2 Ranger发展史及近况

5.1.3 Ranger的特点和作用

5.1.4 Ranger架构

5.1.5 Ranger应用场景

5.2 Apache Ranger的安全认证配置

5.2.1 Ranger安装与部署

5.2.2 安全及访问权限控制机制

5.2.3 Ranger集成HDFS的安全认证机制与配置

5.2.4 Ranger集成YARN的安全认证机制与配置

5.2.5 Ranger集成Hive的安全认证机制与配置

5.2.6 Ranger集成HBase的安全认证机制与配置

5.2.7 Ranger集成Kafka的安全认证机制与配置

5.2.8 Ranger集成Atlas的安全认证机制与配置

5.2.9 Ranger集成Storm的安全认证机制与配置

5.2.10 Ranger集成Solr的安全认证机制与配置

5.3 Apache Ranger的功能配置

5.3.1 Tag同步验证

5.3.2 各类Policy验证

5.4 Apache Ranger优化与性能分析

5.5 本章小结

第6章 大数据安全之Apache Sentry

6.1 Apache Sentry概述

6.1.1 Apache Sentry技术概况

6.1.2 Apache Sentry发展近况

6.1.3 Apache Sentry技术优势

6.1.4 Apache Sentry架构

6.2 Apache Sentry的安装与配置

6.2.1 先决条件

6.2.2 Impala的安装与调试

6.2.3 Apache Sentry的安装和配置

6.2.4 Apache Sentry与Impala的集成

6.3 Apache Sentry场景设计之Sentry对Impala的控制

6.3.1 场景数据准备

6.3.2 基于文件存储元数据的场景验证

6.3.3 基于数据库存储元数据的场景验证

6.4 Apache Sentry场景设计之Sentry对Hive的控制

6.4.1 Hive与Sentry的集成配置

6.4.2 准备实验数据

6.4.3 基于文件存储方式的数据表操作

6.4.4 基于数据库存储方式的数据表操作

6.5 本章小结

第7章 大数据安全之Kerberos认证

7.1 Kerberos概述

7.1.1 Kerberos技术概况

7.1.2 Kerberos发展史及近况

7.1.3 Kerberos架构

7.1.4 Kerberos的认证流程

7.1.5 Kerberos的风险与缺陷

7.1.6 Kerberos应用举例

7.2 Kerberos使用操作说明

7.2.1 名词解释

7.2.2 KDC常用操作

7.2.3 Client常用操作

7.3 Kerberos集成环境配置

7.3.1 Kerberos服务配置

7.3.2 HDFS集成Kerberos的安装与调试

7.3.3 YARN集成Kerberos的安装与调试

7.3.4 Hive集成Kerberos的配置与调试

7.3.5 Zookeeper集成Kerberos的配置与调试

7.3.6 HBase集成Kerberos的配置与调试

7.3.7 Sqoop集成Kerberos的配置与调试

7.3.8 Hue集成Kerberos的安装与调试

7.3.9 Spark集成Kerberos的安装与调试

7.3.10 Solr集成Kerberos的安装与调试

7.3.11 Kafka集成Kerberos的配置与调试

7.3.12 Storm集成Kerberos的安装与调试

7.3.13 Impala集成Kerberos的安装与调试

7.4 Kerberos配置优化及常见问题

7.4.1 Kerberos的认证方式

7.4.2 时间同步

7.4.3 ticket周期

7.4.4 KVNO导致的认证失败

7.5 本章小结

大数据治理与安全:从理论到开源实践是2017年由机械工业出版社华章分社出版,作者刘驰。

得书感谢您对《大数据治理与安全:从理论到开源实践》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
大数据安全治理与防范——网址反欺诈实战 电子书
互联网的快速发展,在方便用户信息传递的过程中,也使大量犯罪活动从线下向线上转移,黑灰产常常通过搭建和传播欺诈、赌博、色情等恶意网站来牟取暴利。为了净化网络环境,必须加大对恶意网站的检测和拦截。本书主要介绍恶意网址的欺诈手段和对抗技术。本书分为5个部分,共11章。针对网址反欺诈这一领域,首先介绍万维网的起源、工作原理和发展历程;其次通过列举常见的恶意网站,让读者了解网址反欺诈面临的主要问题;然后讲解
抗菌药物科学化管理:从理论到实践 电子书
耐药细菌感染已经成为全球公共健康领域的重大挑战,需要全世界共同努力,积极应对。抗菌药物科学化管理(AntimicrobialStewardship,AMS)是控制耐药的重要手段,AMS名称大家已经耳熟能详,但其真正的含义以及具体实践措施依然让很多同道感到茫然。的确在我国,AMS概念已经提出很多年,然而AMS的真正实施还处在起步阶段,尽管也有AMS指导的相关文献,但存在推荐不具体,缺乏可行性等问题,
社会主义运动:从理论到实践的转变:1848—1917 电子书
集中展现马克思、恩格斯如何将社会主义从空想变为科学,从理论到实践,开启拓荒之路
市场营销——从理论到实践(微课版 第3版) 电子书
本书借鉴和吸收了国内外市场营销的理论和最新研究成果,内容包括导论、市场营销环境、消费者购买行为、影响消费者购买行为的因素、组织购买行为、目标市场营销战略、市场竞争战略、产品策略、定价策略、分销策略、促销策略、互联网营销共12章内容。本书配有丰富的教学资源,用书教师可登录人邮教育社区(www.ryjiaoyu.com)进行下载。本书可作为本科、高职高专院校工商管理类等专业相关课程的教材,也适合从事企
与开源同行:揭秘PingCAP七年创业实践 电子书
本书包含开源公司的创业故事、对开源的历史理解、对数据库的变迁思考和未来发展趋势的研判。