自然语言处理迁移学习实战电子书

计算机与互联网 [加纳] 保罗·阿祖雷

简介：一本书带你读懂ChatGPT背后的技术，掌握NLP迁移学习的奥秘。

内容提要

迁移学习作为机器学习和人工智能领域的重要方法，在计算机视觉、自然语言处理（NLP）、语音识别等领域都得到广泛应用。本书是迁移学习技术的实用入门图书，能够带领读者深入实践自然语言处理模型。首先，本书回顾了机器学习中的关键概念，并介绍了机器学习的发展历史，以及NLP迁移学习的进展；其次，深入探讨了一些重要的NLP迁移学习方法——NLP浅层迁移学习和NLP深度迁移学习；最后，涵盖NLP迁移学习领域中最重要的子领域——以Transformer作为关键功能的深度迁移学习技术。读者可以动手将现有的先进模型应用于现实世界的应用程序，包括垃圾电子邮件分类器、IMDb电影评论情感分类器、自动事实检查器、问答系统和翻译系统等。

本书文字简洁、论述精辟、层次清晰，既适合拥有NLP基础的机器学习和数据科学相关的开发人员阅读，也适合作为高等院校计算机及相关专业的学生参考用书。

推荐语

这本书对NLP背景下的迁移学习做了精彩阐述。内容深入浅出，案例丰富，值得深入阅读。迁移学习本质上是知识、算力的复用。在目标检测、模式识别、NLP等领域，迁移学习大有可为。

迁移学习是近几年NLP领域最重要的研究方向之一。这本书以实例和代码的形式对NLP迁移学习的基本概念、业务应用以及发展方向做了详细介绍。这本书介绍的多个先进模型和算法在业务实践中都得到广泛应用。对想了解NLP迁移学习并在实际工作中落地的研究人员来说，这是一本很好的参考书。

迁移学习技术在感知类机器学习场景取得了长足的进步，尤其是BERT系列的预训练模型将NLP领域的基线提升到新的高度。这本书系统、全面且贴合实际地介绍了这个高速发展的主题，值得NLP领域的工程师深入阅读和探究。

迁移学习是机器学习领域一次革命性的技术突破，特别是在NLP领域取得了令人振奋的成就。同时，我们相信迁移学习深刻的思想也会应用到其他领域，并且取得不错的成绩。推荐机器学习相关领域的工程师阅读这本书，保持对迁移学习的持续关注。

这本书对迁移学习的理论给出了全面且翔实的介绍，可以帮助读者建立清晰的认知。更为难得的是，这本书以实际的业务问题作为驱动，引领读者阅读和学习。推荐给NLP领域的相关工程师。

推荐序

迁移学习，顾名思义，就是将某个领域获得的知识调整或迁移到另一个领域，也就是我们常说的“举一反三，触类旁通”。人类对迁移学习的理论性研究要追溯到1901年。当时心理学家桑代克和伍德沃思提出了学习迁移（transfer of learning）的概念，并研究了人们学习某个新的概念时怎样对学习其他概念产生迁移。这对后来教育学的发展产生了重要影响。

随着人工智能浪潮的兴起，人们开始思索把学习迁移的思想应用到机器学习中。传统的机器学习，尤其是有监督学习，对数据的样本数量、数据分布的统一性、标签的完整性等都有着严苛的要求，而迁移学习解决的正是在机器学习任务中面对样本不足、标签不全等情况时，如何借助外部服从其他分布的数据来有效地学习这一问题。20世纪90年代以来，大量研究都涉及迁移学习的概念，如自主学习、终生学习、多任务学习、知识迁移等，但是这些研究都没有形成完整的体系。直到2010年，迁移学习的首个形式化定义正式提出，由此，迁移学习成为机器学习中一个重要的分支领域。近些年来，深度迁移学习，尤其是其在NLP领域的建树让我们看到了迁移学习非凡的潜力。

学术界将要进行迁移学习的原因总结为3个方面。其一是大数据与少标注之间的矛盾。我们所处的“大数据时代”每时每刻产生着海量的数据，但是这些数据缺乏完善的数据标注，而机器学习模型的训练和更新都依赖于数据的标注，但目前只有很少的数据被标注和利用，这给机器学习和深度学习的模型训练与更新带来了挑战。其二是大数据与弱计算之间的矛盾。海量的数据需要具有强计算能力的设备进行存储和计算，而具有强计算能力的设备通常是非常昂贵的，此外使用海量数据来训练模型是非常耗时的，这就导致了大数据与弱计算之间的矛盾。其三是普适化模型与个性化需求之间的矛盾。机器学习的目的是构建尽可能通用的模型来满足不同用户、不同设备、不同环境的不同需求，这就要求模型有较高的泛化能力，但是普适化的通用模型无法满足个性化、差异化的需求。

版权：人民邮电出版社

意见反馈

我的书架

公众号

关注微信公众号