机器学习算法评估实战这本书讲的是什么

计算机与互联网科学与自然宋亚统

简介：在机器学习算法的实际应用中，我们不仅要知道算法的原理，也要了解如何评估算法上线服务的可靠性。

内容提要

机器学习算法评估力求用科学的指标，对机器学习算法进行完整、可靠的评价。

本书详细介绍机器学习算法评估的理论、方法和实践。全书分为3个部分。第1部分包含第1章～第3章，针对分类算法、回归算法和聚类算法分别介绍对应的基础理论和评估方法；第2部分包含第4章～第8章，介绍更复杂的模型（如深度学习模型和集成树模型）的对比与评估，并且针对它们实际应用的业务场景介绍一些特有的评估指标和评估体系；第3部分包含第9章～第11章，总结算法评估的常用工具、技术及方法论，包括实用的可视化工具介绍，并讨论机器学习算法的本质。

本书适合机器学习专业相关从业者和算法工程师阅读，也适合想要从事人工智能和机器学习工作的人士学习和参考。

前言

PREFACE

写作这本书的背景

这是充满机遇的时代，也是充满挑战的时代；这是技术日新月异的时代，也是我们回归正统、找回真我的时代；这是互联网产业蓬勃发展的时代，也是互联网技术不断转型、不断创新的时代。

很多人都听说过互联网浪潮

[1]

的“下半场”。那么，什么是“下半场”？为什么互联网产业的发展会分为“上、下半场”？

首先，我们来说一说“上半场”都发生了什么。

过去的十年中，在人工智能技术和互联网思维的驱动下，做网购的天猫和京东、做餐饮的美团、做打车的滴滴、做租房的自如……这些互联网公司如雨后春笋般迅猛发展，公司业务几乎涵盖了人们衣食住行的方方面面。

但是，这些公司基本上不做实体产业，他们只是把线下的产品或服务通过互联网平台呈现在消费者面前，在商品或服务的提供商和消费者之间提供连接的纽带，这就是互联网思维。在这种运营模式背景下，这些公司需要对海量的数据进行分析和计算，以便更好地为商户或消费者服务。对于大数据处理这种数据量大、重复性高的工作，如果将其交给人来完成无疑是成本高昂且效率低下的，因此，机器学习技术也就成了完成这项工作的“不二之选”。

在互联网浪潮的“上半场”中，机器学习在各公司的业务实践中初露锋芒。从天猫的商品个性化推荐，到百度的语义识别，再到京东的无人配送，机器学习都发挥了不可替代的作用。机器学习的评估体系也承担了重要的任务，人们通过一些常规的指标，基本能够完成对算法质量的初步判断，从而使算法在应用中达到预期的效果。

然而，在互联网浪潮的“下半场”中，竞争逐渐激烈、市场趋于稳定，许多公司已经有了属于自己的一片“领地”。对于大公司，“下半场”更多地意味着“精耕细作”和“国际化”，“精耕细作”指进一步提升效率和降低成本，“国际化”则指将平台和世界接轨，真正将自己的品牌推向世界。而对于后入场的小公司，则意味着两条发展路线，一条是研发领先于市场的新技术和新产品，做尖端服务，这可能难度较大；另一条就是走精细化路线，专注于某一个垂直领域，也就是大公司的业务涵盖不到的业务场景，提供差异化服务。

无论是大公司还是小公司，在“下半场”的竞争中，对机器学习算法的研发都需要更加专业化和精细化。在机器学习算法评估的问题上，传统领域的很多指标不一定能适应新的领域，因此在新的领域中需要新的评估指标来提供特定业务场景下的个性化服务。而对于职场上的个体，掌握一套科学高效的评估理论，不仅可以大大提高自己的工作效率，也能更好地向上级领导展示自己的工作成果，在职场发展中取得事半功倍的效果。

什么是机器学习算法评估

随着科技的发展和普及，“机器学习”已经不再是一个高冷的技术名词。诸葛越在《百面机器学习》一书中对机器学习的定义是这样的：“机器学习指计算机通过观察环境，与环境交互，在吸取信息中学习、自我更新和进步。”

我们可以大致理解为，机器学习就是计算机通过模拟人的学习方法，对一些训练数据进行学习的过程。一旦计算机获得了相应的“知识”，就能够像人一样做出智慧的推导和判断。

版权：人民邮电出版社

意见反馈

我的书架

公众号

关注微信公众号