数据自助服务实践指南:数据开放与洞察提效

数据自助服务实践指南:数据开放与洞察提效

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

教你构建自助服务门户以支持数据发现、数据质量、数据沿袭和数据治理。

内容简介

本书主要介绍数据洞察及其四个阶段,第一部分为自助服务数据发现,包括元数据目录服务、搜索服务、特征存储服务、数据迁移服务、点击流跟踪服务。第二部分为自助服务数据准备包括数据湖管理服务、数据整理服务、数据权限治理服务。第三部分为自助服务数据构建,包括、数据虚拟化服务、模型训练服务、持续集成服务、A/B测试服务。第四部分为自助服务数据实施,包括查询优化服务、管道编排服务、模型部署服务、质量监控服务、成本管理服务。

通过学习本书,数据工程师、数据科学家和团队经理将学习如何构建一个自助数据科学平台,帮助你的组织中的任何人从数据中提取见解。

作者简介

作者桑迪普·乌坦坎达尼,博士,Unravel Data Systems的工程副总裁兼首席数据官。他在构建企业数据产品和运行PB级数据平台(用于关键业务分析和机器学习应用程序)方面拥有近20年的经验。

他在Intuit管理数据平台团队,为Intuit的财务会计、工资单和支付产品提供分析和机器学习支持。Sandeep之前是一家使用机器学习管理开源产品安全漏洞的初创公司的联合创始人兼CEO。他在VMware和IBM担任工程领导职务超过15年。

Sandeep拥有40多项已授权的专利,在重要技术会议上发表了几十篇论文,并获得了多项产品创新和管理卓越奖。他是数据会议的常客,也是大学的客座讲师。他为初创企业提供咨询服务,并曾担任多个会议的项目/指导委员会成员。Sandeep拥有伊利诺伊大学香槟分校的计算机科学博士和硕士学位。

章节目录

版权信息

关于作者

关于封面

O'Reilly Media, Inc.介绍

业界评论

译者序

前言

第1章 数据介绍

1.1 从原始数据到洞察

1.2 定义洞察耗时记分卡

1.3 建立数据自助服务路线图

第一部分 数据发现自助服务

第2章 元数据目录服务

2.1 路线图

2.2 最小化解释耗时

2.3 定义需求

2.4 实现模式

2.5 总结

第3章 搜索服务

3.1 路线图

3.2 最小化搜索耗时

3.3 定义需求

3.4 实现模式

3.5 总结

第4章 特征存储服务

4.1 路线图

4.2 最小化特征处理耗时

4.3 定义需求

4.4 实现模式

4.5 总结

第5章 数据迁移服务

5.1 路线图

5.2 最小化数据可用性耗时

5.3 定义需求

5.4 实现模式

5.5 总结

第6章 点击流跟踪服务

6.1 路线图

6.2 最小化点击指标耗时

6.3 定义需求

6.4 实现模式

6.5 总结

第二部分 数据准备自助服务

第7章 数据湖管理服务

7.1 路线图

7.3 实现模式

7.4 总结

第8章 数据整理服务

8.1 路线图

8.2 最小化数据整理耗时

8.3 定义需求

7.2 最小化数据湖管理耗时

8.4 实现模式

8.5 总结

第9章 数据权限治理服务

9.1 路线图

9.2 最小化合规耗时

9.3 定义需求

9.4 实现模式

9.5 总结

第三部分 数据构建自助服务

第10章 数据虚拟化服务

10.1 路线图

10.2 最小化查询耗时

10.3 定义需求

10.4 实现模式

10.5 总结

第11章 数据转换服务

11.1 路线图

11.2 最小化转换耗时

11.3 定义需求

11.4 实现模式

11.5 总结

第12章 模型训练服务

12.1 路线图

12.2 最小化训练耗时

12.3 定义需求

12.4 实现模式

12.5 总结

第13章 持续集成服务

13.1 路线图

13.2 最小化集成耗时

13.3 定义需求

13.4 实现模式

13.5 总结

第14章 A/B测试服务

14.1 路线图

14.2 最小化A/B测试耗时

14.3 实现模式

14.4 总结

第四部分 数据实施自助服务

第15章 查询优化服务

15.1 路线图

15.2 最小化优化耗时

15.3 定义需求

15.4 实现模式

15.5 总结

第16章 管道编排服务

16.1 路线图

16.2 最小化编排耗时

16.3 定义需求

16.4 实现模式

16.5 总结

第17章 模型部署服务

17.1 路线图

17.2 最小化部署耗时

17.3 定义需求

17.4 实现模式

17.5 总结

第18章 质量可观测性服务

18.1 路线图

18.2 最小化洞察质量耗时

18.3 定义需求

18.4 实现模式

18.5 总结

第19章 成本管理服务

19.1 路线图

19.2 最小化优化成本耗时

19.3 定义需求

19.4 实现模式

19.5 总结

数据自助服务实践指南:数据开放与洞察提效是2022年由机械工业出版社华章分社出版,作者[美] 桑迪普·乌坦坎达尼。

得书感谢您对《数据自助服务实践指南:数据开放与洞察提效》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
数据治理与数据安全 电子书
一本书讲清数据,推进数据开放共享与跨境流动战略,助力个人信息保护。
消费者洞察:大数据驱动下的新媒体运营研究 电子书
本书以消费者洞察为核心切入点,深入研究了大数据驱动下的新媒体运营。
IBM SPSS Modeler 18.0数据挖掘权威指南 电子书
联袂推荐 暨南大学教授、博士生导师刘建平,暨南大学研究生院副院长、经济学院统计学系副主任、教授、博士生导师陈光慧,天善智能创始人梁勇,IBM技术专家刘咏梅,IBM数据科学家钟云飞,广东省环保厅环境咨询专家委员会专家、广东柯内特环境科技有限公司总经理朱斌 本书特色 内容全面:涉及数据读取、数据处理、数据可视化、统计分析与检验、数据挖掘算法、自动建模、集成与扩展、模型部署、性能优化、数据挖掘方法论等诸多内容; 讲解透彻:既有理论的讲解,又涵盖应用的实践,而且在工具的介绍上,尽可能包括每一个选项的内容和应用形式,力求让读者“吃透”每一章节的内容; 突出实战:集行业经验、项目实践、算法剖析、应用技巧于一身,配套提供数据文件以及数据模型文件,方便读者动手实践。
首席数据官知识体系指南 电子书
数字时代的CDO生存手册,国际数据管理协会(DAMA)推荐读物。
软件定义数据中心:Windows Server SDDC技术与实践 电子书
本书是国内首部讲解微软WindowsServer软件定义数据中心的中文图书,书中系统、全面地普及了微软WindowsServer软件定义数据中心各个模块的概念、技术和架构,书里凝结了作者近几年在使用WindowsServerSDDC的经验和对相关技术的思考。本书的主要内容包含WindowsServer软件定义的高可用群集、WindowsServerSDS、WindowsServerSDN和Wind