检索匹配:深度学习在搜索、广告、推荐系统中的应用

检索匹配:深度学习在搜索、广告、推荐系统中的应用

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

深度学习在搜索、广告、推荐系统中的应用全面解析。

内容简介

本书主要介绍了深度学习在互联网核心的三大类业务(搜索、广告、推荐系统)检索系统中的应用。本书详细讲述了检索匹配的理论、演进历史,以及在业务中落地一个基于深度学习算法模型的全流程技能,包括业务问题建模、样本准备、特征抽取、模型训练和预测等,并提供了相应的代码。全书共11章,分为四大部分。第一部分(第1~2章)介绍了深度学习的相关理论知识;第二部分(第3~6章)介绍了业务中如何上线一个深度学习模型,包括标签拼接、特征抽取、模型训练和预测等流程,采用单机实现;第三部分(第7~9章)介绍了检索算法基本理论以及演进历史,并以业界中应用较为广泛的双塔模型DSSM为例进行了详细理论介绍和代码实现;第四部分(第10~11章)介绍了如何将单机训练模式改造为分布式训练模式,以加快模型的训练速度,从而应对具有海量样本的业务场景。本书旨在为读者介绍深度学习在互联网业务中落地的方法和实现,主要面向算法工程师、相关领域研究人员和相关专业院校师生。

章节目录

封面

作者简介

版权页

前言

目录

第1部分 理论准备

第1章 深度学习时代

1.1 深度学习的飞速发展

1.2 深度学习在互联网的应用

1.2.1 搜索

1.2.2 推荐

1.2.3 广告

1.2.4 通用检索流程

1.3 深度学习模型分类

1.4 模型服务中台

1.5 分布式机器学习

1.6 深度学习软件框架

1.7 小结

第2章 深度学习简介

2.1 生物神经网络

2.2 人工神经网络

2.3 业务问题建模

2.4 DNN的拟合能力

2.5 DNN的学习方式

2.6 CNN与RNN

2.7 小结

第2部分 设计与实现

第3章 标签拼接

3.1 时间窗口

3.2 延迟反馈

3.3 样本集介绍

3.3.1 原始样本

3.3.2 广告基本信息表

3.3.3 用户基本信息表

3.3.4 用户的行为日志

3.4 小结

第4章 特征处理

4.1 特征分类

4.2 特征体系

4.3 原始特征拼接

4.3.1 拼接方法

4.3.2 数据集特征拼接

4.3.3 代码

4.4 明文特征抽取

4.4.1 特征抽取算子

4.4.2 特征抽取示例

4.5 特征ID化

4.5.1 特征词表生成

4.5.2 ID化示例

4.6 代码说明

4.7 小结

第5章 模型构建

5.1 DNN求解

5.1.1 数学规划

5.1.2 DNN方法

5.2 模型层

5.2.1 输入层

5.2.2 神经网络层

5.2.3 激活函数层

5.3 模型结构

5.3.1 DLRM模型

5.3.2 模型搭建

5.4 损失函数

5.4.1 MSE损失函数

5.4.2 Cross Entropy损失函数

5.5 优化器

5.5.1 SGD

5.5.2 Momentum

5.5.3 Nesterov

5.5.4 AdaGrad

5.5.5 Adam

5.5.6 扩展

5.6 小结

第6章 模型训练与预测

6.1 模型评估

6.2 模型训练

6.2.1 模型训练流程

6.2.2 模型训练技巧

6.3 模型预测

6.4 训练效果示例

6.5 模型优化

6.6 GPU应用

6.7 小结

第3部分 高级深度学习模型

第7章 检索算法理论

7.1 检索算法抽象

7.2 有表示匹配

7.2.1 标签表示

7.2.2 分布式表示

7.3 无表示匹配

7.4 内容理解

7.4.1 自然语言处理

7.4.2 计算机视觉

7.4.3 一点思考

7.5 用户理解

7.6 小结

第8章 检索算法演进

8.1 前深度学习时代

8.1.1 LR

8.1.2 决策树

8.1.3 协同过滤

8.1.4 MF

8.1.5 算法应用

8.2 深度学习时代

8.2.1 精排模型演进

8.2.2 粗排模型演进

8.2.3 召回模型演进

8.3 小结

第9章 DSSM理论与实现

9.1 DSSM模型

9.2 DSSM实现

9.3 线上预测

9.4 ANN检索

9.4.1 基于树的方法

9.4.2 基于Hash的方法

9.4.3 基于图的方法

9.4.4 ANN检索效率比较

9.5 训练效果

9.6 模型优化

9.7 小结

第4部分 分布式机器学习

第10章 计算机系统

10.1 单机系统

10.1.1 单机系统物理模型

10.1.2 单机系统程序编程

10.2 分布式系统

10.2.1 分布式计算

10.2.2 分布式存储

10.2.3 分布式协同通信

10.2.4 CAP理论

10.2.5 一点思考

10.3 分布式系统示例

10.4 分布式编程示例

10.5 小结

第11章 分布式机器学习设计与实现

11.1 机器学习应用系统设计

11.2 分布式机器学习设计

11.2.1 并行方式

11.2.2 节点协作方式

11.2.3 模型更新方式

11.3 常用的分布式学习框架

11.4 PS Lite介绍

11.4.1 代码架构

11.4.2 工作流程

11.5 分布式训练实现

11.5.1 架构设计

11.5.2 代码实现

11.5.3 程序运行

11.5.4 模型保存与加载

11.5.5 效果评估

11.6 小结

结语

附录

附录A 辅助学习资料

检索匹配:深度学习在搜索、广告、推荐系统中的应用是2022年由机械工业出版社出版,作者康善同。

得书感谢您对《检索匹配:深度学习在搜索、广告、推荐系统中的应用》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
PyTorch深度学习实战 电子书
1.PyTorch核心开发者教你使用PyTorch创建神经网络和深度学习系统的实用指南。2.详细讲解整个深度学习管道的关键实践,包括PyTorch张量API、用Python加载数据、监控训练以及对结果进行可视化。3.PyTorch核心知识+真实、完整的案例项目,快速提升读者动手能力:a.全面掌握PyTorch相关的API的使用方法以及系统掌握深度学习的理论和方法;b.快速从零开始构建一个真实示例:肿瘤图像分类器;c.轻松学会使用PyTorch实现各种神经网络模型来解决具体的深度学习问题;d.章尾附有“练习题”,巩固提升所学知识;更有配套的代码文件可下载并动手实现。4.PyTorch联合创作者SoumithChintala作序推荐!5.书中所有代码都是基于Python3.6及以上的版本编写的,提供源代码下载。
深度学习与围棋 电子书
深入浅出的深度学习入门书,从零实现AlphaGo,为AI理论和应用打下基础。
Excel 2010在会计与财务管理中的应用 电子书
本书详细介绍了如何应用Excel电子表格软件解决企业会计核算和财务管理的问题,内容涵盖应用Excel电子表格软件在账务处理、报表编制、工资管理、固定资产管理、进销存管理、财务分析、筹资管理及投资管理等方面的应用。
Excel2013在会计中的应用(第3版) 电子书
本书以图文并茂的方式,结合大量实例和详尽的操作步骤说明,全面系统地向读者介绍了Excel2013在会计、财务中的具体运用。全书共分三部分:第一部分由浅入深地介绍了Excel2013的基础知识;第二部分介绍了如何利用Excel2013对会计日常账务核算流程进行处理;第三部分介绍了如何利用Excel2013进行企业常见的资产管理及财务分析等。本书实例丰富、针对性强,既可作为高等院校信息系统、信息管理、
Excel 2010在会计与财务管理中的应用 电子书
本书详细介绍了如何应用Excel2010电子表格软件解决企业会计核算、财务管理和管理会计的问题,内容涵盖应用Excel2010电子表格软件在账务处理、报表编制、工资管理、固定资产管理、进销存管理、财务分析、筹资管理、投资管理及本量利分析等方面的应用。