机器学习算法评估实战

机器学习算法评估实战

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

编辑推荐

在机器学习算法的实际应用中,我们不仅要知道算法的原理,也要了解如何评估算法上线服务的可靠性。

内容简介

机器学习算法评估力求用科学的指标,对机器学习算法进行完整、可靠的评价。本书详细介绍机器学习算法评估的理论、方法和实践。全书分为3个部分。第1部分包含第1章~第3章,针对分类算法、回归算法和聚类算法分别介绍对应的基础理论和评估方法;第2部分包含第4章~第8章,介绍更复杂的模型(如深度学习模型和集成树模型)的对比与评估,并且针对它们实际应用的业务场景介绍一些特有的评估指标和评估体系;第3部分包含第9章~第11章,总结算法评估的常用工具、技术及方法论,包括实用的可视化工具介绍,并讨论机器学习算法的本质。本书适合机器学习专业相关从业者和算法工程师阅读,也适合想要从事人工智能和机器学习工作的人士学习和参考。

作者简介

作者宋亚统,美团点评配送事业部高级算法工程师,2017年获得中国科学院大学硕士学位。他目前主要负责基于位置的服务(Location-Based Service,LBS)算法研发工作。他热爱人工智能并擅长写作,在职期间获得8项算法发明专利,对机器学习算法有着深入的研究和丰富的实践经验。

章节目录

版权信息

内容提要

前言 PREFACE

写作这本书的背景

什么是机器学习算法评估

为什么需要算法评估

你真的会评估吗

评估体系的关键因素

实用性

容错程度

性能

可解释性

表现形式

本书的主要内容

本书的目标读者

致谢

资源与支持

提交错误信息

与我们联系

关于异步社区和异步图书

第1章 分类的艺术

1.1 训练集和测试集的选择

1.2 准召率和P-R曲线

1.3 ROC和AUC

1.5 异常检测

1.5 小结

第2章 一个好的回归算法

2.1 ME那些事

2.2 方差和偏差

2.3 欠拟合和过拟合

2.4 正则化方法

2.5 回归算法的对比

2.5.1 线性回归

2.5.2 局部加权线性回归

2.5.3 岭回归

2.6 梯度下降的对比

2.6.1 一般的梯度下降

2.6.2 随机梯度下降和批量梯度下降

2.6.3 动量梯度下降

2.6.4 AdaGrad、RMSProp和Adam

2.7 小结

第3章 “硬核”聚类

3.1 无监督学习

3.2 聚类算法的评估指标

3.2.1 霍普金斯统计量

3.2.2 类簇的数量

3.2.3 聚类效果

3.3 聚类算法的对比

3.3.1 基于密度的聚类

3.3.2 K-means

3.3.3 基于层次的聚类

3.3.4 基于概率的聚类

3.4 小结

第4章 慧眼识天下

4.1 卷积神经网络

4.1.1 简单的卷积神经网络

4.1.2 详解卷积神经网络

4.2 循环神经网络

4.2.1 图解RNN

4.2.2 RNN的训练

4.2.3 RNN的变化形式

4.3 更实用的模型

4.3.1 LSTM

4.3.2 Seq2Seq

4.3.3 注意力机制

4.4 小结

第5章 智慧的语言——NLP算法实战与评估

5.1 文字的预处理

5.1.1 嵌入

5.1.2 word2vec

5.1.3 词袋模型与TF-IDF

5.2 RNN文本分类

5.2.1 RNN文本分类的模块

5.2.2 参数定义

5.2.3 预处理

5.2.4 模型定义

5.2.5 模型训练和评估

5.3 HAN文本分类

5.3.1 HAN和GRU的基本原理

5.3.2 HAN的注意力层

5.4 NLP评估

5.4.1 N-gram

5.4.2 BLEU

5.4.3 ROUGE

5.4.4 Pointwise、Pairwise和Listwise排序算法

5.5 小结

第6章 预言家的思考

6.1 基础树模型的对比

6.1.1 ID3

6.1.2 C4.5

6.1.3 CART

6.2 随机森林和AdaBoost

6.2.1 随机森林

6.2.2 AdaBoost

6.3 GBDT

6.3.1 GBDT简介

6.3.2 GBDT和回归问题

6.3.3 GBDT和分类问题

6.4 XGBoost

6.4.1 XGBoost简介

6.4.2 XGBoost回归算法

6.4.3 XGBoost分类算法

6.4.4 XGBoost的优化方法和特征评估

6.4.5 GBDT和XGBoost的对比评估

6.5 小结

第7章 爱我所爱

7.1 多路召回

7.1.1 基于用户的协同过滤

7.1.2 基于物品的协同过滤

7.2 逻辑斯谛回归

7.2.1 逻辑斯谛回归的基本原理

7.2.2 逻辑斯谛回归和推荐排序

7.3 FM、FFM和特征组合

7.3.1 FM基本原理

7.3.2 用FFM和GBDT进行高阶特征组合

7.4 Wide&Deep

7.5 更有趣的模型——Transformer

7.5.1 模型整体架构

7.5.2 注意力机制

7.5.3 编码器

7.5.4 解码器

7.5.5 基于位置的前馈神经网络

7.5.6 嵌入层

7.5.7 线性层和softmax层

7.5.8 Transformer在推荐系统的应用

7.6 推荐算法的评估

7.6.1 准确度指标

7.6.2 排序指标

7.6.3 覆盖率

7.6.4 多样性和新颖性

7.7 小结

第8章 奇门遁甲

8.1 坐标

8.1.1 坐标生成

8.1.2 基于密度的坐标生成

8.1.3 基于GeoHash块热度的坐标生成

8.1.4 坐标质量评估

8.2 路线

8.2.1 路线相似度评估

8.2.2 路线规划——Dijkstra算法

8.2.3 路线排序

8.2.4 路线质量评估

8.3 小结

第9章 评估利器

9.1 R语言简介

9.1.1 为什么要可视化

9.1.2 R语言介绍

9.1.3 数据生态

9.2 Shiny可视化

9.2.1 UI布局

9.2.2 服务器

9.2.3 可视化评估示例

9.3 小结

第10章 像哲学家一样思考

10.1 机器学习之殇

鹦鹉学舌vs. 乌鸦喝水

10.2 辛普森悖论

10.3 伯克森悖论

10.4 智能之梯

10.4.1 因果推断的起源

10.4.2 智能之梯

10.5 因果推断的方法

10.5.1 双重差分模型

10.5.2 工具变量

10.5.3 中介模型

10.6 小结

第11章 基础评估方法

11.1 卡方检验

11.2 T检验

11.3 Z检验和F检验

11.4 小结

参考文献

机器学习算法评估实战是2021年由人民邮电出版社出版,作者宋亚统。

得书感谢您对《机器学习算法评估实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
TensorFlow技术解析与实战 电子书
TensorFlow是谷歌公司开发的深度学习框架,也是目前深度学习的主流框架之一。
深度学习:基于Python语言和TensorFlow平台(视频讲解版) 电子书
本书基于使用Python语言的TensorFlow深度学习框架进行讲解,帮助你快速入门。
深度学习与飞桨PaddlePaddle Fluid实战 电子书
飞桨PaddlePaddle是百度推出的深度学习框架,不仅支撑了百度公司的很多业务和应用,而且随着其开源过程的推进,在其他行业得到普及和应用。 本书基于2019年7月4日发布的飞桨PaddlePaddle Fluid 1.5版本(后续版本会兼容旧版本),以真实案例介绍如何应用飞桨PaddlePaddle解决主流的深度学习问题。 本书适合对人工智能感兴趣的学生、从事机器学习相关工作的读者阅读,尤其适合想要通过飞桨PaddlePaddle掌握深度学习应用技术的研究者和从业者参考。 本书包括以下内容: ● 飞桨PaddlePaddle 的核心设计思想; ● PaddlePaddle在MNIST上进行手写数字识别; ● 图像分类网络实现案例; ● “天网”中目标检测和像素级物体分割的实现; ● NLP技术应用案例 :word2vec、情感分析、语义角色标注及机器翻译; ● Paddle-Mobile与Anakin框架等高级主题; ● 飞桨PaddlePaddle与TensorFlow、Caffe框架的常用层对比。
机器学习公式详解 电子书
适读人群 :(1)高等院校人工智能、计算机、自动化等相关专业机器学习方向的学生;(2)学术界机器学习领域的研究人员和教师;(3)工业界对机器学习感兴趣的专业人员和工程师。 1.周志华教授“西瓜书”《机器学习》公式完全解析指南! “南瓜书”系Datawhale成员自学笔记,对“西瓜书”中250个重难点公式做了详细解析和推导(重难点公式覆盖率达99%),旨在解决机器学习中的数学难题。 2.机器学习初学小白提升数学基础能力的必备练习册! 以本科数学基础视角对“西瓜书”里比较难理解的公式加以解析和推导细节,补充大量重、难点数学知识和参考材料,分享在学习中遇到的“坑”以及跳过这个“坑”的方法,对于初学机器学习的小白也能上手练习! 3.俞勇、王斌、李沐、程明明、陈光(博主@爱可可-爱生活)、徐亦达等人工智能领域大咖亲笔推荐
百面深度学习 算法工程师带你去面试 电子书
适读人群 :本书适合相关专业的在校学生检查和加强对所学知识点的掌握程度,求职者快速复习和补充相关的深度学习知识,以及算法工程师作为工具书随时参阅。此外,非相关专业、但对人工智能或深度学习感兴趣的研究人员,也可以通过本书大致了解一些热门的人工智能应用、深度学习模型背后的核心算法及其思想。 不可不读的深度学习面试宝典《百面机器学习》姊妹篇。 Hulu诚意出品,全面收录135道算法面试题。 一线大厂算法工程师合力创作,直击面试要点。 从算法与模型到多领域应用,全方位解读深度学习。 诚意推荐 吴军 / 《浪潮之巅》《数学之美》作者 华先胜 / 阿里巴巴达摩院人工智能中心主任,IEEE Fellow 李沐 / AWS首席科学家,《动手学深度学习》作者 孙茂松 / 清华大学人工智能研究院常务副院长 本书适合相关专业的在校学生检查和加强对所学知识点的掌握程度,求职者快速复习和补充相关的深度学习知识,以及算法工程师作为工具书随时参阅。此外,非相关专业、但对人工智能或深度学习感兴趣的研究人员,也可以通过本书大致了解一些热门的人工智能应用、深度学习模型背后的核心算法及其思想。