Hadoop安全:大数据平台隐私保护

Hadoop安全:大数据平台隐私保护

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书阐述了Hadoop从早期开放的消费互联网时代到现在作为敏感数据可信平台的演变历程。

内容简介

本书介绍了包括身份验证、加密、密钥管理和商业实践在内的诸多主题,并在实际环境下加以讨论。第1章是介绍性内容,随后分为四大部分:第一部分是安全架构,第二部分是验证、授权和安全审计,第三部分是数据安全,第四部分是归纳总结。最后介绍了几个使用案例,融合了书中诸多概念。

作者简介

作者Ben Spivey,Cloudera解决方案架构师,曾在多家世界500强企业工作,涉及金融服务、零售、医疗等多个行业。在于客户的Hadoop集群进行规划、安装、配置以及安全保护方面有丰富经验。

章节目录

版权信息

O'Reilly Media, Inc. 介绍

前言

第1章 引言

1.1 安全概览

1.2 Hadoop安全:简史

1.3 Hadoop组件和生态系统

1.4 小结

第一部分 安全架构

第2章 保护分布式系统

2.1 威胁种类

2.2 威胁和风险评估

2.3 漏洞

2.4 深度防御

2.5 小结

第3章 系统架构

3.1 运行环境

3.2 网络安全

3.3 Hadoop角色和隔离策略

3.4 操作系统安全

3.5 小结

第4章 Kerberos

4.1 为什么是Kerberos

4.2 Kerberos概览

4.3 Kerberos工作流:一个简单示例

4.4 Kerberos信任

4.5 MIT Kerberos

4.6 小结

第二部分 验证、授权和审计

第5章 身份和验证

5.1 身份

5.2 身份验证

5.3 小结

第6章 授权

6.1 HDFS授权

6.2 服务级授权

6.3 MapReduce和YARN的授权

6.4 ZooKeeper ACLs

6.5 Oozie授权

6.6 HBase和Accumulo的授权

6.7 小结

第7章 Apache Sentry(孵化中)

7.1 Sentry概念

7.2 Sentry服务

7.3 Hive授权

7.4 Impala授权

7.5 Solr授权

7.6 Sentry特权模型

7.7 Sentry策略管理

7.8 小结

第8章 审计

8.1 HDFS审计日志

8.2 MapReduce审计日志

8.3 YARN审计日志

8.4 Hive审计日志

8.5 Cloudera Impala审计日志

8.6 HBase审计日志

8.7 Accumulo审计日志

8.8 Sentry审计日志

8.9 日志聚合

8.10 小结

第三部分 数据安全

第9章 数据保护

9.1 加密算法

9.2 静态数据加密

9.3 动态数据加密

9.4 数据销毁和删除

9.5 小结

第10章 数据导入安全

10.1 导入数据的完整性

10.2 数据导入的机密性

10.3 导入工作流

10.4 企业架构

10.5 小结

第11章 数据提取和客户端访问安全

11.1 Hadoop命令行接口

11.2 保护应用安全

11.3 HBase

11.4 Accumulo

11.5 Oozie

11.6 Sqoop

11.7 SQL访问

11.8 WebHDFS/HttpFS

11.9 小结

第12章 Cloudera Hue

12.1 Hue HTTPS

12.2 Hue身份验证

12.3 Hue授权

12.4 Hue SSL客户端配置

12.5 小结

第四部分 综合应用

第13章 案例分析

13.1 案例分析:Hadoop数据仓库

13.2 案例分析:交互式HBase Web应用

后记

关于作者

关于封面

Hadoop安全:大数据平台隐私保护是2017年由人民邮电出版社·图灵出品出版,作者[美]Ben Spivey。

得书感谢您对《Hadoop安全:大数据平台隐私保护》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Hadoop数据仓库实战 电子书
本书以Hive为开发平台,主要介绍了如何使用HiveQL来查询和分析存储在Hadoop分布式文件系统上的大数据集合,具体内容包括Hive入门、Hive数据库及表操作、Hive元数据、Hive高级操作、Hive函数与Streaming、Hive视图与索引、Hive调优、Hive与HBase集成、数据迁移框架Sqoop等。本书介绍的每个任务都运用了大量案例,紧密结合实际应用,融入了含金量十足的开发经验
Hadoop大数据开发基础 电子书
本书以任务为导向,较为全面地介绍了Hadoop大数据技术的相关知识。全书共6章,具体内容包括Hadoop介绍、Hadoop集群的搭建及配置、Hadoop基础操作、MapReduce编程入门、MapReduce进阶编程、项目案例:电影网站用户性别预测。本书的第2~5章包含了实训与课后练习,通过练习和操作实践,帮助读者巩固所学的内容。本书可以作为高校大数据技术类专业的教材,也可作为大数据技术爱好者的自
HADOOP大数据开发实战 电子书
Hadoop基础教程,大数据技术原理与应用教程,MapReduce框架入门实战指南。
Hadoop+Spark大数据技术 电子书
本书介绍Hadoop、Spark两种大数据处理框架,共12章,内容包括:Hadoop大数据开发环境、HDFS大数据分布式存储、MapReduce分布式计算框架、HBase分布式数据库、Scala基础编程、Spark大数据处理框架、Windows环境下Spark综合编程等。
大数据处理平台 电子书
本书从数据查询、数据分析和迭代计算平台3个方面对大数据处理平台的体系结构、基本原理、主流技术、国内外研究进展和成果进行了全面、深入的阐述,对大数据实时处理平台的架构和核心技术进行了展望。企业技术人员可参考本书选择合适的技术构建大数据处理平台或对现有平台进行优化;高校院所的科研人员可参考本书了解大数据管理的基本原理和现有研究成果;学生读者可通过学习本书全面了解大数据处理平台。同时,本书也适用于对大数