数据科学工程实践:用户行为分析与建模、A/B实验、SQLFlow

数据科学工程实践:用户行为分析与建模、A/B实验、SQLFlow

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

从商业理解、量化模型、数据技术3个纬度全面讲解数据科学的应用场景、理论支撑和技术底座。

内容简介

这是一本将数据科学三要素——商业理解、量化模型、数据技术全面打通的实战性著作,是来自腾讯、滴滴、快手等一线互联网企业的数据科学家、数据分析师和算法工程师的经验总结。

全书三个部分,内容相对独立,既能帮助初学者建立知识体系,又能帮助从业者解决商业中的实际问题,还能帮助有经验的专家快速掌握数据科学的最新技术和发展动向。

内容围绕非实验环境下的观测数据的分析、实验的设计和分析、自助式数据科学平台3大主题展开,涉及统计学、经济学、机器学习、实验科学等多个领域,包含大量常用的数据科学方法、简洁的代码实现和经典的实战案例。

第1部分(第1~6章)观测数据的分析技术讲解了非实验环境下不同观测数据分析场景所对应的分析框架、原理及实际操作,包括消费者选择偏好分析、消费者在时间维度上的行为分析、基于机器学习的用户生命周期价值预测、基于可解释模型技术的商业场景挖掘、基于矩阵分解技术的用户行为规律发现与挖掘,以及在不能进行实验分析时如何更科学地进行全量评估等内容。

第二部分(第7~9章)实验设计和分析技术从A/B实验的基本原理出发,深入浅出地介绍了各种商业场景下进行实验设计需要参考的原则和运用的方法,尤其是在有样本量约束条件下提升实验效能的方法及商业场景限制导致的非传统实验设计。

第三部分(第10~12章)自助式数据科学平台SQLFlow针对性的讲解了开源的工程化的自助式数据科学平台SQLFlow,并通过系统配置、黑盒模型的解读器应用、聚类分析场景等案例帮助读者快速了解这一面向未来的数据科学技术。

作者简介

作者谢梁,经济学博士,腾讯QQ浏览器副总经理、QQ浏览器数据负责人。CCF数据科学专委会创始委员,入选第一财经数据科学50人,清华大学商学院及香港大学商学院商业分析硕士项目指导嘉宾。曾任滴滴杰出数据科学家、美国微软云存储核心工程部首席数据科学家。

章节目录

版权信息

作者简介

序一

序二

前言

第一部分 观测数据的分析技术

第1章 如何分析用户的选择

1.1 深入理解选择行为

1.2 DCM详述

1.3 DCM模型的Python实践

1.4 本章小结

第2章 与时间相关的行为分析

2.1 生存分析与二手车定价案例

2.2 生存分析的理论框架

2.3 生存分析在二手车定价案例中的应用

2.4 本章小结

第3章 洞察用户长期价值: 基于神经网络的LTV建模

3.1 用户长期价值的概念和商业应用

3.2 基于Keras的LTV模型实践

3.3 本章小结

第4章 使用体系化分析方法进行场景挖掘

4.1 经验化分析与体系化分析

4.2 体系化分析常用工具

4.3 场景挖掘分析的应用与实现

4.4 本章小结

第5章 行为规律的发现与挖掘

5.1 对有序数据的规律分析

5.2 SVD聚类建模Python实战

5.3 对无序稀疏数据的规律分析

5.4 本章小结

第6章 对观测到的事件进行因果推断

6.1 使用全量评估分析已发生的事件

6.2 全量评估的主要方法

6.3 全量评估方法的应用

6.4 本章小结

第二部分 实验设计和分析技术

第7章 如何比较两个策略的效果

7.1 正确推断因果关系

7.2 运用A/B实验进行策略比较

7.3 A/B实验应用步骤

7.4 A/B实验案例

7.5 本章小结

第8章 提高实验效能

8.1 控制实验指标方差的必要性和手段

8.2 用随机区组设计控制实验指标方差

8.3 随机区组实验应用步骤

8.4 随机区组实验案例介绍

8.5 随机区组实验的常见问题

8.6 本章小结

第9章 特殊场景下的实验设计和分析方法

9.1 解决分流实验对象之间的干扰

9.2 Switchback实验和评估方法

9.3 交叉实验

9.4 强约束条件下的实验方法

9.5 本章小结

第三部分 自助式数据科学平台SQLFlow

第10章 SQLFlow

10.1 SQLFlow简介

10.2 设置SQLFlow运行环境

10.3 向SQLFlow提交分析模型

10.4 本章小结

第11章 机器学习模型可解释性

11.1 模型的可解释性

11.2 常见的可解释模型

11.3 黑盒模型的解释性

11.4 本章小结

第12章 基于LSTM-Autoencoder的无监督聚类模型

12.1 聚类分析的广泛应用

12.2 聚类模型的应用案例

12.3 SQLFlow中基于深度学习的聚类模型

12.4 本章小结

数据科学工程实践:用户行为分析与建模、A/B实验、SQLFlow是2021年由机械工业出版社出版,作者谢梁。

得书感谢您对《数据科学工程实践:用户行为分析与建模、A/B实验、SQLFlow》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Python数据分析与应用 电子书
本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开介绍相关的理论知识点,推导生成可行的解决方案, 后落实在任务实现环节。 全书大部分章节紧扣任务需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施。通过从任务需求到实现这一完整工作流程的体验,帮助读者真正理解与消化Python数据分析与应用。 书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握大数据相关技能。
pandas数据处理与分析 电子书
本书以Python中的pandas库为主线,介绍各类数据处理与分析方法。
大数据分析与挖掘 电子书
数据科学与大数据技术专业系列规划教材。强调概念+算法实践,让你“小数据”上会“算”,“大数据”上“算得快”。
Elasticsearch数据搜索与分析实战 电子书
深入描述了Elasticsearch的各种运行机制。
Excel数据分析与处理 电子书
全书分为4篇:第1篇为应用基础篇,主要介绍Excel的基本功能和基本操作;第2篇为数据处理篇,主要介绍使用公式和函数实现数据处理的方法,以及直观显示数据的方法;第3篇为数据分析篇,主要介绍Excel数据管理、数据分析方面的基本功能和分析方法;第4篇为拓展应用篇,主要介绍宏和协同功能。