这就是推荐系统:核心技术原理与企业应用

这就是推荐系统:核心技术原理与企业应用

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

多个大规模工业级推荐系统的核心研发经验总结囊括推荐系统的基础框架、核心技术和前沿发展。

内容简介

推荐系统技术作为近年来非常热门的AI技术,已广泛应用于互联网各行业,从衣食住行到娱乐消费,以及无处不在的广告,背后都依赖推荐系统的决策。

本书贴合工业级推荐系统,以推荐系统的整体技术框架为切入点,深入剖析推荐系统中的内容理解、用户画像、召回、排序、重排等核心模块,介绍每个模块的核心技术和业界应用,并展开介绍了推荐冷启动、推荐偏差与消偏等常见问题和解决方案。此外,还对当前推荐系统领域的热门前沿技术进行了介绍,包括强化学习、因果推断、端上智能等。

本书既适合推荐系统、计算广告及搜索领域的互联网相关从业人员,也适合高等院校人工智能、计算机技术、软件工程等专业的本科生、研究生及博士生,以及对推荐系统感兴趣的爱好者等,可以帮助他们了解工业级推荐系统的基础框架、核心技术和前沿发展。

作者简介

作者胡澜涛,毕业于清华大学计算机系,快手推荐算法技术总监。曾任字节跳动高级算法工程师,腾讯高级研究员。在推荐系统领域有丰富的实践经验,负责过包括TikTok、快手、微信看一看在内的多个大规模工业级推荐系统的核心研发工作。

主要研究方向为推荐系统,发表相关领域的学术论文6篇,拥有专利5项。

章节目录

版权信息

内容简介

推荐序

前言

第1章 初识推荐系统

1.1 推荐系统大时代

1.1.1 推荐系统的定义

1.1.2 推荐系统的价值

1.1.3 推荐系统的天时地利

1.1.4 推荐系统架构概览

1.2 推荐系统的核心模块

1.2.1 内容理解:理解和刻画推荐内容

1.2.2 用户画像:理解和刻画用户

1.2.3 召回:为用户初筛内容

1.2.4 排序:为用户精选内容

1.2.5 重排:从业务角度进行内容调整

1.2.6 推荐系统质量评估体系

总结

第2章 多模态时代的内容理解

2.1 内容标签体系建设

2.1.1 标签体系的作用

2.1.2 标签体系设计和建设

2.1.3 标签提取或生成

2.2 文本内容理解

2.2.1 文本分类

2.2.2 文本标签提取

2.2.3 文本聚类

2.2.4 文本Embedding

2.2.5 知识图谱

2.3 多模态内容理解

2.3.1 图像分类

2.3.2 视频分类

2.3.3 视频多模态内容Embedding

2.4 内容理解在推荐系统中的应用

总结

第3章 比你更了解自己的用户画像

3.1 初识用户画像

3.1.1 什么是用户画像

3.1.2 用户画像的作用

3.1.3 用户画像系统架构

3.2 用户画像标签体系

3.2.1 用户基础属性标签

3.2.2 用户社交属性标签

3.2.3 用户行为属性标签

3.2.4 用户兴趣标签

3.2.5 用户分层标签

3.2.6 其他常用维度标签

3.3 用户画像标签开发

3.3.1 标签的基础数据

3.3.2 标签计算整体流程

3.3.3 规则类标签

3.3.4 统计类标签

3.3.5 模型类标签

3.4 用户画像实践案例

总结

第4章 包罗万象的召回环节

4.1 召回的基本逻辑和方法论

4.1.1 召回的重要性

4.1.2 召回与排序的区别

4.1.3 主要的召回策略与算法

4.2 传统召回策略

4.2.1 基于内容的召回

4.2.2 经典协同过滤召回

4.2.3 探索类召回

4.3 向量化模型召回

4.3.1 向量化模型召回原理

4.3.2 从KNN到ANN

4.3.3 经典向量化召回模型

4.4 基于用户行为序列的召回

4.4.1 SASRec——经典行为序列召回模型

4.4.2 BERT4Rec与BST——NLP技术与用户行为序列结合

4.4.3 MIND及其衍生——多兴趣召回模型

4.4.4 超长序列召回——建模用户全期兴趣

4.5 图Embedding在召回中的应用

4.5.1 图Embedding技术

4.5.2 DeepWalk——经典图Embedding方法

4.5.3 Node2Vec——DeepWalk更进一步

4.5.4 PinSAGE——GCN在推荐系统领域的工业化应用

4.5.5 MetaPath2Vec——异构图Embedding方法

4.6 前瞻性召回策略与模型

4.6.1 TDM——模型与索引结合的艺术

4.6.2 对比学习——样本的魔法

4.7 召回质量评估方法

4.7.1 召回评估方法概述

4.7.2 召回率、精确率、F1值——基准评估指标

4.7.3 HR、ARHR——TopN推荐评价指标

4.7.4 CG、DCG、NDCG——信息增益维度的评估指标

4.7.5 长尾覆盖评估

总结

第5章 投你所好的排序环节

5.1 排序环节的意义和优化方向

5.1.1 排序环节的意义

5.1.2 排序环节的优化方向

5.2 从Embedding看排序模型的演进

5.2.1 什么是Embedding

5.2.2 Embedding的产生过程

5.2.3 特征组合在深度排序模型中的应用

5.2.4 用户历史行为建模在深度排序模型中的应用

5.2.5 超大规模Embedding在实际中的应用

5.3 推荐系统粗排阶段及其发展历程

5.3.1 粗排定位与技术路线选择

5.3.2 粗排模型架构的演变

5.3.3 使用知识蒸馏增强粗排与精排的一致性

5.3.4 缓解样本选择偏差

5.3.5 粗排效果的评价

5.4 多目标排序建模

5.4.1 多目标排序建模的意义和挑战

5.4.2 多目标排序建模方法概览

5.4.3 多目标融合寻参

5.5 推荐系统排序阶段的评估

5.5.1 排序评估的两个阶段

5.5.2 常用的效果评估指标

5.5.3 常用的系统评估指标

5.5.4 离线和线上效果的一致性问题

总结

第6章 权衡再三重排序

6.1 重排序的必要性和作用

6.2 重排模型

6.2.1 重排模型建模的出发点

6.2.2 序列重排模型

6.2.3 基于强化学习的重排模型

6.3 重排多样性策略

6.3.1 重排多样性的出发点

6.3.2 多样性评估指标

6.3.3 规则多样性打散

6.3.4 多样性模型策略

6.4 重排中的业务规则

总结

第7章 如若初见冷启动

7.1 推荐冷启动的定义与挑战

7.2 冷启动一般解决思路

7.3 新用户推荐冷启动

7.3.1 新用户召回策略

7.3.2 新用户排序模型

7.3.3 新用户重排策略

7.4 新物品分发冷启动

7.4.1 新物品冷启动召回策略

7.4.2 新物品冷启动排序策略

7.4.3 新物品冷启动流量分配机制

总结

第8章 推荐系统中的魔术手

8.1 特征工程

8.1.1 特征的理解和分类

8.1.2 特征挖掘维度

8.1.3 工程视角下的特征工程开发

8.1.4 特征工程的流程和方法

8.2 样本加工艺术

8.2.1 如何提取有效样本

8.2.2 负样本优化

8.2.3 样本迁移

8.2.4 其他样本优化技巧

8.3 推荐系统实效性

8.3.1 推荐数据实效性

8.3.2 推荐模型实效性

8.3.3 在线学习整体机制

8.4 推荐中的偏差与消偏策略

8.4.1 推荐偏差的缘由

8.4.2 推荐系统常见偏差

8.4.3 常用的消偏技术和策略

总结

第9章 系统进化的利器——AB实验平台

9.1 什么是AB实验

9.2 AB实验平台框架

9.3 AB实验分流机制&实验类型

9.4 AB实验效果评估

9.4.1 推荐系统常见的AB指标

9.4.2 AB实验的假设检验

9.4.3 AB实验的流量大小

9.5 AB实验并不是万能的

总结

第10章 推荐系统中的前沿技术

10.1 强化学习

10.2 因果推断

10.3 端上智能

10.4 动态算力分配

10.5 增益模型

总结

后记

反侵权盗版声明

这就是推荐系统:核心技术原理与企业应用是2023年由电子工业出版社出版,作者胡澜涛。

得书感谢您对《这就是推荐系统:核心技术原理与企业应用》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
软件定义网络核心原理与应用实践 电子书
本书分为核心原理和应用实践两大部分,对软件定义网络(SDN)技术进行了全面剖析和深入解读。第一部分首先阐述了SDN的设计思想与体系架构,详细分析了软件定义网络的控制转发分离和可编程性两个突出属性,其次介绍了以OpenFlow为代表的SDN南向接口协议,以及北向和东向接U协议,接下来根据SDN的层次化架构,依次介绍了SDN数据平面、控制平面以及SDN应用案例,最后梳理总结J,SDN标准化进展以及学术
数据库系统原理及MySQL应用教程(第2版) 电子书
本书全面系统地讲述了数据库技术的基本原理和应用。
透视C#核心技术:系统架构及移动端开发 电子书
本书采用循序渐进的方式讲解C#及其在电商、ERP及手机APP方面的开发技术。
大数据技术原理与应用(第2版) 电子书
国内高校大数据课程知名教师倾心之作,带你“零基础”学习大数据。
大数据技术原理与应用(第3版) 电子书
本书系统介绍了大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。