数据资产管理核心技术与应用

数据资产管理核心技术与应用

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

深入探讨数据资产管理的核心技术与应用。

内容简介

本书为读者提供一套可以落地的数据资产管理框架,并详解两个基于该框架进行数据资产管理的应用案例,使读者能更好地了解数据资产管理底层所涉及的众多核心技术,让数据可以发挥出更大的价值。

全书共分10章,第1章主要让读者认识数据资产,了解数据资产相关的基础概念,以及数据资产的发展情况。

第2~8章主要介绍大数据时代数据资产管理所涉及的核心技术,内容包括元数据的采集与存储、数据血缘、数据质量、数据监控与告警、数据服务、数据权限与安全、数据资产管理架构等。

第9~10章主要从实战的角度介绍数据资产管理技术的应用实践,包括如何对元数据进行管理以发挥出数据资产的更大潜力,以及如何对数据进行建模以挖掘出数据中更大的价值。

作者简介

作者张永清,从事功能测试、自动化测试、性能测试、Java软件发、大数据发、架构师等工作十多年,在自动化测试设计、性能测试设计、性能诊断、性能调优、分布式架构设计等方面积累了多年经验。参与过的系统涉及公安、互联网、移动互联网、大数据、人工智能等领域。

先后任职于江苏飞搏软件、苏宁大数据研发中心、苏宁研究院、苏宁人工智能研发中心、紫金普惠研发中心、福特汽车工程研究有限公司,历任测试经理、技术经理、部门经理、高级架构师等职位。重关注大数据、图像处理、高性能分布式架构设计等领域。

章节目录

版权信息

内容简介

推荐序1

推荐序2

推荐序3

作者简介

前言

第1章 认识数据资产

1.1 数据资产的基本介绍

1.2 数据资产的分类

1.3 数据资产的价值评估

1.4 数据资产的质量

1.5 数据资产的存储

1.6 数据资产管理

1.7 数据资产管理的信息化建设

1.8 数据资产与人工智能

第2章 元数据的采集与存储

2.1 Hive中的元数据采集

2.1.1 基于Hive Meta DB的元数据采集

2.1.2 基于Hive Catalog的元数据采集

2.1.3 基于Spark Catalog的元数据采集

2.2 Delta Lake中的元数据采集

2.2.1 基于Delta Lake自身设计来采集元数据

2.2.2 基于Spark Catalog来采集元数据

2.3 MySQL中的元数据采集

2.4 Apache Hudi中的元数据采集

2.4.1 基于Spark Catalog采集元数据

2.4.2 Hudi Timeline Meta Server

2.4.3 基于Hive Meta DB采集元数据

2.5 Apache Iceberg中的元数据采集

2.5.1 Iceberg的元数据设计

2.5.2 Iceberg元数据的采集

2.6 元数据的存储模型设计

2.6.1 如何对元数据进行整合

2.6.2 元数据的存储模型设计

第3章 数据血缘

3.1 获取数据血缘的技术实现

3.1.1 如何从Hive中获取数据血缘

3.1.2 从Spark执行计划中获取数据血缘

3.1.3 从Spark SQL语句中获取数据血缘

3.1.4 从Flink中获取数据血缘

3.1.5 从数据任务的编排系统中获取数据血缘

3.2 数据血缘的存储模型与展示设计

第4章 数据质量的技术实现

4.1 质量数据采集的技术实现

4.1.1 定义数据采集的规则

4.1.2 定时Job的技术选型

4.2 如何处理采集到的质量数据

4.3 质量数据的存储模型设计

4.4 常见的开源数据质量管理平台

4.4.1 Apache Griffin

4.4.2 Qualitis

第5章 数据监控与告警

5.1 数据监控

5.1.1 数据监控的种类

5.1.2 监控数据的特点与存储方式

5.2 常见的数据监控目标

5.2.1 数据链路监控

5.2.2 数据任务监控

5.2.3 数据质量监控

5.2.4 数据服务监控

5.2.5 数据处理资源监控

5.3 Prometheus简介

5.4 Grafana简介

5.5 使用Grafana和Prometheus来实现数据监控与告警

5.5.1 数据链路的告警实现

5.5.2 数据任务的告警实现

5.5.3 数据质量的告警实现

5.5.4 数据服务的告警实现

5.5.5 数据处理资源的告警实现

第6章 数据服务

6.1 如何设计数据服务

6.1.1 数据源管理

6.1.2 数据服务的敏捷化和可配置化

6.1.3 数据服务文档的自动生成

6.1.4 数据服务的统一认证与鉴权

6.1.5 数据服务的监控与告警

6.2 数据服务的性能

6.3 数据服务的熔断与降级

第7章 数据权限与安全

7.1 常见的权限设计模式

7.1.1 基于角色的访问控制

7.1.2 基于属性的访问控制

7.1.3 基于对象的访问控制

7.2 数据权限

7.2.1 列权限控制

7.2.2 行权限控制

7.3 数据脱敏

7.4 数据安全

第8章 数据资产架构

8.1 数据资产的架构设计

8.1.1 数据获取层

8.1.2 数据处理层

8.1.3 数据存储层

8.1.4 数据管理层

8.1.5 数据分析层

8.1.6 数据服务层

8.2 常见的开源数据资产管理平台

8.2.1 Apache Atlas

8.2.2 Data Hub

8.2.3 OpenMetadata

第9章 元数据管理实践

9.1 如何理解元数据

9.1.1 为何需要元数据

9.1.2 如何让元数据产生更大价值

9.1.3 元数据分类及其好处

9.1.4 元数据管理

9.1.5 参与角色

9.2 元数据管理

9.2.1 元数据模型的组织关系

9.2.2 元数据的采集

9.2.3 业务域设计

9.2.4 业务术语设计

9.2.5 元数据标签设计

9.2.6 数据Owner

9.2.7 数据生命周期

9.2.8 元数据注册和发布

9.2.9 核心功能介绍

第10章 数据建模实践

10.1 什么是数据建模

10.1.1 数据模型分类

10.1.2 数据建模方法

10.2 数据仓库建模架构

10.3 关系型数据建模

10.3.1 概念模型阶段

10.3.2 逻辑模型阶段

10.3.3 物理模型阶段

10.4 维度建模

10.4.1 基本概念

10.4.2 维度表设计

10.4.3 事实表分类

10.4.4 基于维度建模的数据分析实践

参考文献

数据资产管理核心技术与应用是2024年由清华大学出版社出版,作者张永清 等。

得书感谢您对《数据资产管理核心技术与应用》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
大数据导论 思维、技术与应用 电子书
本书以基本概念与实例相结合的方法,由浅入深、顺序渐进的对大数据思维、技术和应用做了全面系统的介绍。全书共12章,分为大数据基础篇、大数据存储篇、大数据处理篇、大数据挖掘篇和大数据应用篇。每个知识节点都配有与理论学习内容相结合的案例介绍和代码实例,并在每章后面都配有丰富的作业。
MySQL数据库技术与应用 电子书
MySQL是目前最流行的关系数据库管理系统之一。本书以MySQL5.6数据库管理系统为平台,以案例教学法为编写主线,介绍了数据库系统的基本概念和应用技术。本书以学生选课管理系统作为教学案例,以网上书店作为实训案例,采用“学习要点—内容示例—归纳总结—习题实训”的结构体系设计每章内容。最后一章以一个具体的项目案例开发设计过程,将数据库原理知识与实际数据库开发结合在一起。本书采用在线开放课程教学方式,
Excel商务数据分析与应用 电子书
本书以实践中商务数据分析工作的基本流程为主线,讲解相关人员在商务数据分析工作中所需掌握的基础知识,并通过“实践练习”环节提升读者应用所学知识来解决实际问题的能力。本书共7章。第1章概要介绍商务数据分析的基本情况,第2章~第6章讲解商务数据分析各个步骤的相关知识点及其应用,第7章要求读者综合应用前面各章内容完整地解决一个实践领域中的问题。本书每章都配备真实案例供读者学习,以增强读者的实战能力。本书配
云计算平台管理与应用 电子书
本书系统地介绍了云计算基础架构与实践相关知识,全书共分为5个项目,项目1主要介绍了云计算的概念与发展趋势、云计算的架构内涵与关键技术、云计算基础架构等内容;项目2主要介绍了共享存储模型、磁盘存储阵列、存储网络、共享文件系统等内容;项目3主要介绍了网络总体架构、接入层网络、主机网络虚拟化、OpenFlow网络流量平面等内容;项目4主要介绍了云接入技术、桌面云和VMwareView桌面云等内容;项目5
Oracle数据库基础与应用教程 电子书
本书全面讲述了Oracle数据库的日常管理工作内容。全书共14章,包含Oracle简介和安装、Oracle客户端、管理Oracle环境、Oracle体系结构、管理Oracle存储结构、SQL语言、表、约束、视图、同义词和序列、索引、实现数据库安全、DataPump数据导出和导入、数据库备份和恢复。每章结尾提供适量的选择题、简答题和操作题,通过练习和操作实践,帮助读者巩固所学内容。本书适合Oracl