主数据驱动的数据治理——原理、技术与实践

主数据驱动的数据治理——原理、技术与实践

编辑推荐

数据治理:概念、实施、技术与发展前景

内容简介

  “数据”已成为企业的一项宝贵的战略资产。为了使庞大的数据发挥更大的价值,企业必须着眼于数据治理和综合利用。主数据驱动的数据治理是指从企业杂乱的数据中捕捉具有高业务价值、被企业内各业务部门重复使用的关键数据进行管理,构建单一、准确、权的数据来源,从而提高企业的整体数据质量,提升数据资产价值,推动业务创新,全面增强企业竞争力。本书编者将近10年在数据治理咨询工作中积累的经验和知识进行总结,通过对数据治理的原理、技术、案例、发展趋势等内容的介绍,为读者进行数据治理、主数据管理实践提供重要的参考。

  全书分为4篇,共14章。第一篇数据治理概念(第1~3章),面向数据治理组织管理者,从数据治理的必要性、可行性、应用效果等进行展开,回答管理者关心的数据治理的核心问题;第二篇数据治理实施(第4~8章),面向数据治理团队成员,介绍数据治理工作的前期准备、工作步骤、治理过程、后期运维等内容;第三篇数据治理技术(第9~13章),面向IT工程技术人员,从技术视角展开数据治理的系统架构与模型、数据治理质量评估、数据安全保护、数据集成服务等内容;第四篇数据治理前景(第14章),对数据治理应用前景进行展望。

  本书可作为从事信息化建设的管理者、数据治理团队、IT咨询从业者、IT工程技术人员、相关专业在校师生的参考读物。

作者简介

  王兆君高级工程师,北京三维天地科技有限公司高级副总裁。在企业信息化领域服务30年,在智能制造、电子商务、数据治理等领域具有专长。多次主持企业信息咨询规划项目建设,负责过近百家大型企业信息化项目的组织管理工作,承担多项国家标准的制定任务。为能源、化工、电力、建筑、冶金等行业的数据治理建设提供过专业咨询服务。在信息化实施方面积累了丰富的经验。

  王钺博士,清华大学电子工程系副研究员。长期从事传感网、大数据,以及数据治理领域的研究工作。主持或参与包括国家973、863计划在内的20余项科研项目,发表论文50余篇。

  曹朝辉数据标准化资深专家,北京三维天地科技有限公司副总裁。从事信息标准化咨询和实施工作超过15年。参与国际贸易、电子商务、人体工效学等方面的“十一五”“十二五”“十三五”国家科技支撑计划项目3项,曾负责和参与过国家食品药品监督管理总局、中国海油、中煤能源、国家电投、中国国电、中国有色、中国铝业、中国黄金、中船重工、中兴通讯、京东方、四川长虹等单位数据标准咨询和系统实施项目,在数据标准构建、数据清洗和治理、数据管控、数据集成和应用等方面具有丰富的经验。

章节目录

封面页

书名页

版权页

作者简介

内容简介

编审委员会

序FOREWORD

前言PREFACE

目录

第一篇 数据治理概念

第1章 数据治理概述

1.1 数据治理背景

1.2 数据资产和数据管理

1.2.1 数据资产的概念和重要性

1.2.2 数据资产的构成

1.2.3 数据管理的内容、现状和问题

1.3 数据治理的目标和挑战

1.3.1 数据治理的概念

1.3.2 数据治理的目标

1.3.3 数据治理的挑战

1.4 数据治理的核心内容

1.4.1 数据治理的内容

1.4.2 数据治理的基本过程

1.4.3 数据治理的重点

1.5 数据治理的评估——成熟度模型

1.5.1 数据管理的成熟度模型

1.5.2 您的企业需要数据治理吗

第2章 主数据和主数据管理

2.1 主数据的概念

2.1.1 主数据的定义

2.1.2 主数据的特征

2.1.3 主数据的范围

2.2 主数据管理的概念

2.2.1 主数据管理的定义

2.2.2 主数据管理体系

2.2.3 主数据管理系统的功能

2.3 主数据管理的意义

2.3.1 主数据管理的必要性

2.3.2 主数据管理的意义

第3章 主数据驱动的数据治理

3.1 数据治理框架

3.1.1 国际标准化组织

3.1.2 国际数据管理协会

3.1.3 国际数据治理研究所

3.1.4 IBM数据治理委员会

3.1.5 中国电子工业标准化技术协会信息技术服务分会

3.1.6 现有数据治理框架的局限

3.2 主数据驱动的数据治理框架

3.2.1 治理思路和治理目标

3.2.2 治理框架

3.2.3 技术架构

3.3 主数据驱动的数据治理过程

3.3.1 过程框架

3.3.2 架构阶段

3.3.3 治理阶段

3.3.4 任务、角色、分工、职责

3.4 数据治理工具和系统选型

3.4.1 软件公司的行业实践

3.4.2 产品特性

3.4.3 软件公司的实力

3.4.4 软件公司的实施

3.4.5 软件的价格

第二篇 数据治理实施

第4章 主数据项目的准备

4.1 主数据项目实施的主要风险

4.1.1 组织风险

4.1.2 数据风险

4.1.3 集成风险

4.1.4 其他风险

4.2 数据治理管理组织

4.2.1 项目组织

4.2.2 人员配置

4.2.3 管控角色

4.2.4 管控流程

4.2.5 绩效考核

4.3 数据管理规范体系

4.3.1 主数据管理规范

4.3.2 主数据应用标准

第5章 主数据体系规划方法

5.1 主数据体系规划的任务和步骤

5.1.1 主数据体系规划的任务

5.1.2 主数据体系规划的步骤

5.2 主数据体系评估方法论

5.2.1 主数据管理成熟度模型

5.2.2 主数据管理成熟度模型的评价指标

5.2.3 主数据管理成熟度评估方法

5.3 现状调研与需求分析

5.3.1 现状调研

5.3.2 现状评估与差距分析

5.3.3 需求分析

5.4 主数据识别分析方法

5.4.1 多因素分析方法

5.4.2 主数据类型识别分析

5.4.3 主数据元属性识别分析

5.5 主数据体系规划设计

5.6 主数据体系架构设计

5.6.1 主数据管控体系

5.6.2 主数据标准体系

5.6.3 主数据质量体系

5.6.4 主数据安全体系

5.7 主数据管理实施规划

5.7.1 实施策略

5.7.2 实施计划

5.7.3 投资预算

第6章 主数据项目实施步骤

6.1 实施方法概述

6.1.1 传统软件开发项目的实施方法

6.1.2 主数据项目的实施方法

6.2 项目实施阶段的主要任务

6.2.1 第一阶段:体系规划阶段

6.2.2 第二阶段:平台实施阶段

6.3 各主要阶段的任务分工

6.3.1 项目启动与需求调研阶段

6.3.2 体系规划与架构设计阶段

6.3.3 标准建立及主数据平台设计阶段

6.3.4 客户化设计、开发、测试、数据清洗阶段

6.3.5 系统上线启用阶段

6.3.6 系统运维与持续优化阶段

6.4 数据准备

6.4.1 数据准备方案制订

6.4.2 数据采集

6.4.3 数据清洗

6.4.4 数据导入

6.5 人员培训

6.6 程序设计

6.6.1 程序设计的基本要求

6.6.2 程序设计方法

6.6.3 产品定制开发

6.7 系统集成

6.7.1 系统集成架构

6.7.2 集成流程

6.7.3 系统集成技术

6.8 系统测试

6.9 系统试运行及上线

6.9.1 系统试运行

6.9.2 系统切换

6.10 系统评价

6.11 项目管理

第7章 主数据项目的运维和管理

7.1 主数据运维管理体系

7.1.1 主数据运维管理组织

7.1.2 主数据运维管理流程

7.2 主数据运维管理内容

7.2.1 主数据模型运维管理

7.2.2 主数据工作流运维管理

7.2.3 主数据生命周期运维管理

7.2.4 主数据质量运维管理

7.2.5 平台基础服务运维管理

7.2.6 主数据存储运维管理

7.2.7 数据库系统运维服务

7.2.8 主数据安全运维管理

7.2.9 基于云服务的运维管理

7.3 主数据运维应急响应措施

7.4 对外部供应商的运维要求

第8章 典型主数据管理产品及实施案例

8.1 主数据管理系统模式的分类

8.1.1 基于ETL工具的主数据应用

8.1.2 基于SOA的主数据管理平台

8.2 典型产品和解决方案及其对比

8.2.1 SunwayWorld的主数据全生命周期管理平台

8.2.2 SAP的MDM解决方案

8.2.3 IBM的MDM解决方案

8.2.4 Oracle的MDM解决方案

8.2.5 Informatica MDM解决方案

8.2.6 产品对比

8.3 先进企业的主数据管理现状

8.4 主数据典型应用案例介绍

8.4.1 石油行业应用举例——某大型石油总公司的主数据管理

8.4.2 煤炭行业应用举例——某大型能源集团公司的主数据管理

8.4.3 有色金属行业应用举例——某大型有色金属公司的主数据管理

8.4.4 建筑行业应用举例——某大型建筑股份有限公司的主数据管理

8.4.5 航空航天行业应用举例——某航天建设集团有限公司的主数据管理

8.4.6 基建行业应用举例——某工程建设有限责任公司的主数据管理

8.4.7 电器行业应用举例——某大型电器集团的主数据管理

8.4.8 机械制造行业应用举例——某大型饲料机械集团的主数据管理

8.4.9 水泥行业应用举例——某水泥控股有限公司的主数据管理

8.4.10 交通运输行业应用举例——某交通投资建设有限公司的主数据管理

8.4.11 政府部门主数据应用举例——某省经信委项目的主数据管理

第三篇 数据治理技术

第9章 数据架构和模型

9.1 数据架构

9.1.1 数据架构规划

9.1.2 数据架构设计

9.2 数据模型

9.2.1 数据模型的定义

9.2.2 数据模型的类型

9.2.3 数据的物理特征

9.2.4 元数据模型

9.2.5 主数据模型

9.2.6 信息链和信息生命周期

9.2.7 数据谱系和影响分析

第10章 数据集成

10.1 企业应用集成

10.1.1 企业应用集成的概念

10.1.2 企业应用集成的分类

10.1.3 企业应用集成的方法

10.1.4 企业服务总线

10.1.5 微服务架构

10.2 数据集成交换服务

10.2.1 制定数据集成交换规范和架构

10.2.2 搭建数据交换平台

10.2.3 实现数据交换管理

10.3 构建数据服务体系

10.4 形成数据资产全局视图

第11章 数据质量管理

11.1 数据质量的定义

11.1.1 数据质量

11.1.2 数据质量维度

11.1.3 数据质量评估

11.1.4 数据剖析

11.1.5 数据质量问题和数据管理问题

11.1.6 合理性检查

11.1.7 数据质量阈值

11.1.8 过程控制

11.1.9 联机数据质量的检测和监控

11.2 数据质量评估框架

11.2.1 数据质量评估框架的背景

11.2.2 数据质量评估框架的范围

11.2.3 数据质量评估框架的质量维度

11.2.4 数据质量期望

11.3 数据质量评估测量类型

11.3.1 数据模型的一致性

11.3.2 数据内容的有效性

11.3.3 评估数据内容的一致性

11.4 数据评估方案

11.4.1 数据初步评估

11.4.2 数据质量改进评估

11.4.3 数据质量持续改进

11.5 数据质量战略

11.5.1 数据质量战略的概念

11.5.2 数据战略和数据质量战略

11.5.3 把数据作为资产

11.5.4 监控数据质量

第12章 主数据全生命周期管理

12.1 主数据全生命周期管理及意义

12.2 主数据全生命周期管理内容

12.2.1 数据申请

12.2.2 数据审核

12.2.3 数据变更

12.2.4 数据集成和数据分发

12.2.5 数据查询

12.2.6 数据归档

12.3 数据清洗管理

12.3.1 数据清洗的内容

12.3.2 数据清洗的一般过程

12.3.3 数据清洗的工具

12.4 建立主数据全生命周期管理体系

12.4.1 概述

12.4.2 建立信息架构

12.4.3 发现数据对象

12.4.4 分类数据对象和定义服务水平

12.4.5 建立测试数据管理策略

12.4.6 归档数据

第13章 数据安全管理

13.1 数据安全的意义和作用

13.1.1 数据安全的概念

13.1.2 数据安全的意义和作用

13.2 数据安全的关键内容

13.2.1 数据存储安全

13.2.2 数据传输安全

13.2.3 数据使用安全

13.3 数据隐私保护

13.3.1 数据隐私保护的意义和作用

13.3.2 数据隐私保护面临的问题和挑战

13.3.3 数据隐私保护技术

第四篇 数据治理前景

第14章 主数据管理应用前景展望

14.1 主数据管理应用市场发展趋势

14.2 大数据时代的主数据管理

14.2.1 大数据的定义和特征

14.2.2 大数据时代企业管理的新模式

14.2.3 主数据管理在大数据分析中的作用

14.2.4 大数据对主数据管理的挑战

14.3 基于云服务的主数据管理

14.3.1 云服务的定义和发展现状

14.3.2 主数据管理的云服务模式

14.3.3 主数据管理云服务平台的技术基础

14.3.4 云服务对企业主数据管理的影响

14.4 面向人工智能的主数据管理

14.4.1 人工智能的定义及应用领域

14.4.2 人工智能在企业中的实践

14.4.3 主数据管理与人工智能的关系

14.4.4 主数据管理在人工智能中的作用

14.5 区块链技术与主数据管理

14.5.1 区块链的定义及特征

14.5.2 区块链技术的应用领域

14.5.3 区块链技术在主数据管理中的应用

14.6 主数据管理——企业发展的坚实根基

附录CD

主数据驱动的数据治理——原理、技术与实践是2019年由清华大学出版社出版,作者王兆君。

得书感谢您对《主数据驱动的数据治理——原理、技术与实践》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
消费者洞察:大数据驱动下的新媒体运营研究 电子书

本书以消费者洞察为核心切入点,深入研究了大数据驱动下的新媒体运营。
数据库系统——原理、设计与编程(MOOC版) 电子书

数据库原理与技术应用:关系模型、SQL、设计、管理及NoSQL等。
云数据中心网络架构与技术 电子书

由华为数据通信数字化信息开发部和数据通信架构与设计部联合编写基于华为在全球范围的丰富商用交付经验聚焦新一代网络技术的发展热点聚集华为数据通信产品线的一线专家和技术人员的研发成果...
深度学习原理与实践 电子书

(1)大量图例,简单易懂。作者亲自绘制了大量插图,力求还原深度学习的算法思想,分解和剖析晦涩的算法,用图例来表示复杂的问题。生动的图例也能给读者带来阅读乐趣,快乐地学习算法知识...
大数据时代的数据挖掘 电子书

(1)内容全面,覆盖当前数据挖掘的主要应用。在介绍每个应用案例时,详细阐述应用的背景,该领域中数据的来源和特点,数据采集与预处理方式,应用领域中数据挖掘的任务和实施数据挖掘技术...
Spark海量数据处理:技术详解与平台实战 电子书

在数字经济时代,数据是重要的资源要素;同时,新的数据又在源源不断地产生,企业面临的一个基本问题就是如何管理和利用这些数据,这对传统的数据处理方法与分析框架提出了新的诉求和挑战,...
云计算与大数据 电子书

本书抽丝剥茧地讲述了云计算简史、大数据的前世今生,纠正了一些时下被“误导”的观点,分析了大数据与Hadoop的关系、云计算与大数据的关系,从开源vs.闭源的角度阐释了整个业界的...