数据质量实践手册:4步构建高质量数据体系

数据质量实践手册:4步构建高质量数据体系

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

高质量的数据关乎企业运营、合规、决策和业绩的关键。

内容简介

哈佛商业评论的一项研究发现,企业中只有3%的数据符合质量标准,绝大多数公司都在寻求切实可行的指导来提高数据质量。

本书作者基于多年在数据、数据分析和人工智能方面的实践经验,阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法(定义、评估、实现、持续)和10个数据质量最佳实践案例,以此来提高业务中的数据质量水平,为业务提供数据价值,保证生成的数据可以有效支持高级分析和人工智能。

本书适合数据科学家、数据分析师、商业智能专业人士、首席技术官和数据官,以及对收集和使用高质量数据感兴趣的人士。

作者简介

作者普拉桑特·苏特卡尔,知名的数据分析和人工智能顾问、作家和教授,曾为包括宝洁、通用电气、壳牌、苹果、联邦快递和SAP在内的80多家公司提供咨询服务。

他是麻省理工学院CDOIQ研讨会的编辑委员会成员,也是硅谷风险投资公司BGV(Benhamou Global Ventures)的顾问委员会成员,还是IE商学院(西班牙马德里)的数据和分析副教授。CDO Magazine将他列入2022年全球75位学术数据领导者之列。除了从事咨询和顾问工作外,他还在全球培训了3000多名数据和分析专业人员。

章节目录

版权信息

推荐序

前言

致谢

第1篇 定义阶段

第1章 概述

1.1 引言

1.2 数据、数据分析、人工智能和业务绩效

1.3 数据作为业务资产或负债

1.4 数据治理、数据管理和数据质量

1.5 领导层对数据质量的承诺

1.6 关键要点

1.7 结论

参考文献

第2章 业务数据

2.1 引言

2.2 业务中的数据

2.3 遥测数据

2.4 数据在业务中的用途

2.5 业务数据视角

2.6 业务数据的关键特征

2.7 关键数据元素

2.8 关键要点

2.9 结论

参考文献

第3章 业务中的数据质量

3.1 引言

3.2 数据质量维度

3.3 上下文中的数据质量

3.4 数据质量不佳所产生的影响

3.5 数据贬值及其影响因素

3.6 IT系统中的数据

3.7 数据质量和可信信息

3.8 关键要点

3.9 结论

参考文献

第2篇 评估阶段

第4章 数据质量差的原因

4.1 引言

4.2 数据质量问题根本原因分析工具

4.3 数据质量不佳的典型原因

4.4 关键要点

4.5 结论

参考文献

第5章 数据生命周期和数据血缘

5.1 引言

5.2 数据生命周期

5.3 数据血缘

5.4 关键要点

5.5 结论

参考文献

第6章 数据质量分析

6.1 引言

6.2 数据剖析的标准

6.3 测量中心性的数据剖析技术

6.4 测量变异性的数据剖析技术

6.5 整合中心性和变异性KPI

6.6 关键要点

6.7 结论

参考文献

第3篇 实现阶段

第7章 数据质量参考架构

7.1 引言

7.2 数据质量解决方案

7.3 DataOps

7.4 数据产品

7.5 数据编织和数据网格

7.6 数据增强

7.7 关键要点

7.8 结论

参考文献

第8章 数据质量最佳实践(一)

8.1 引言

8.2 最佳实践概述

8.3 BP 1:确定业务KPI以及这些KPI和相关数据的所有权

8.4 BP 2:建立和提高组织中的数据文化和素养

8.5 BP 3:确定当前和期望的数据质量的状态

8.6 BP 4:遵循极简主义原则的数据采集方法

8.7 BP 5:选择并定义用于提高质量的数据属性

8.8 BP 6:使用MDM系统中的数据标准采集和管理关键数据

8.9 关键要点

8.10 结论

参考文献

第9章 数据质量最佳实践(二)

9.1 引言

9.2 BP 7:合理化和自动化关键数据元素的集成

9.3 BP 8:定义SoR并在SoR/OLTP系统中安全地采集交易数据

9.4 BP 9:构建和管理强大的数据集成能力

9.5 BP 10:分发数据来源与洞察消费

9.6 关键要点

9.7 结论

参考文献

第4篇 持续阶段

第10章 数据治理

10.1 引言

10.2 数据治理原则

10.3 数据治理设计组件

10.4 实施数据治理计划

10.5 数据可观察性

10.6 数据合规性——ISO 27001、SOC1和SOC2

10.7 关键要点

10.8 结论

参考文献

第11章 数据保护

11.1 引言

11.2 数据分类

11.3 存储相关的数据安全

11.4 访问相关的数据安全

11.5 关键要点

11.6 结论

参考文献

第12章 数据伦理

12.1 引言

12.2 数据伦理的定义

12.3 数据伦理的重要性

12.4 数据伦理的原则

12.5 模型漂移中的数据伦理

12.6 数据隐私

12.7 管理数据伦理

12.8 关键要点

12.9 结论

参考文献

数据质量实践手册:4步构建高质量数据体系是2024年由机械工业出版社出版,作者[美] 普拉桑特·苏特卡尔。

得书感谢您对《数据质量实践手册:4步构建高质量数据体系》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
数据素养 电子书
全面解析数据素养,助你成为数据管理高手。
大数据营销 电子书
本书分为4篇13章。其中,第1章到第4章属于基础篇,主要介绍大数据概述、大数据营销概述、大数据时代的消费者行为分析、大数据广告营销等内容。第5章、第6章属于工具篇,主要介绍精准营销、大数据搜索营销等内容。第7章到第11章属于智能应用篇,主要介绍当前热门的大数据营销应用领域,包括App营销、微信营销、微博营销、O2O营销、短视频与直播营销等内容。第12章、第13章属于拓展篇,主要介绍跨界营销、其他大
软件定义数据中心:Windows Server SDDC技术与实践 电子书
本书是国内首部讲解微软WindowsServer软件定义数据中心的中文图书,书中系统、全面地普及了微软WindowsServer软件定义数据中心各个模块的概念、技术和架构,书里凝结了作者近几年在使用WindowsServerSDDC的经验和对相关技术的思考。本书的主要内容包含WindowsServer软件定义的高可用群集、WindowsServerSDS、WindowsServerSDN和Wind
数据治理与数据安全 电子书
一本书讲清数据,推进数据开放共享与跨境流动战略,助力个人信息保护。
图解数据科学 电子书
解码数据科学的奥秘,驱动业务决策和创新。