BERT基础教程:Transformer大模型实战

BERT基础教程:Transformer大模型实战

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

内容简介

本书聚焦谷歌公司开发的BERT自然语言处理模型,由浅入深地介绍了BERT的工作原理、BERT的各种变体及其应用。本书呈现了大量示意图、代码和实例,详细解析了如何训练BERT模型、如何使用BERT模型执行自然语言推理任务、文本摘要任务、问答任务、命名实体识别任务等各种下游任务,以及如何将BERT模型应用于多种语言。通读本书后,读者不仅能够系统了解有关BERT的各种概念、术语和原理,还能够使用BERT模型及其变体执行各种自然语言处理任务。

作者简介

【作者简介】


苏达哈尔桑.拉维昌迪兰(Sudharsan Ravichandiran)


热爱开源社区的数据科学家,研究方向为深度学习和强化学习的实际应用,在自然语言处理和计算机视觉等领域都颇有建树,另著有《Python强化学习实战》。


【译者简介】


周参


就职于谷歌,任软件工程师,研究方向为自然语言处理。工作之余的兴趣是研究人工智能领域机器学习方向以及新的模型算法,并将多种深度学习模型应用于实际问题中。


章节目录

版权信息

献词

前言

第一部分 开始使用BERT

第1章 Transformer概览

第2章 了解BERT模型

第3章 BERT实战

第二部分 探索BERT变体

第4章 BERT变体(上):ALBERT、RoBERTa、ELECTRA和SpanBERT

第5章 BERT变体(下):基于知识蒸馏

第三部分 BERT模型的应用

第6章 用于文本摘要任务的BERTSUM模型

第7章 将BERT模型应用于其他语言

第8章 Sentence-BERT模型和特定领域的BERT模型

第9章 VideoBERT模型和BART模型

习题参考答案

作者简介

看完了

BERT基础教程:Transformer大模型实战是2023年由人民邮电出版社出版,作者[印]苏达哈尔桑·拉维昌迪兰(Sudharsan,Ravichandiran)。

得书感谢您对《BERT基础教程:Transformer大模型实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
计算机视觉教程(第2版) 电子书
本书系统地介绍了计算机视觉的基本原理、典型方法和实用技术,内容包括图像采集、图像预处理、基元检测、目标分割、目标表达和描述、纹理特性分析、形状特性分析、立体视觉、三维景物恢复、运动特性分析、景物识别、广义匹配、时空行为了解、场景解释及计算机视觉系统。读者可从中了解计算机视觉的基本原理和典型技术,并能据此解决计算机视觉应用中的一些具体问题。本书提供了许多讲解例题,每章均有要点小结、参考文献介绍和练习
计算思维的结构 电子书
这是一本讲述计算思维的入门书,适合大学新生,以及所有希望提高问题求解、系统设计和人类行为理解能力的人阅读。本书的结构建立在计算机方法论的结构框架之上,重点放在计算机科学中的不同抽象层次的“自动有效进行”方面,着力于一般(类)问题的有效求解。这样做的好处是:一方面,从类问题求解的思维模式上帮助大学新生顺利过渡到大学学习中来;另一方面,强调计算机科学中抽象层次的概念,可以降低不同学科人们沟通的复杂程度
程序设计基础实验和学习指导(C语言微课版) 电子书
本书是工业和信息化部“十四五”规划教材《程序设计基础(C语言)》的配套实验教材。
jQuery+Bootstrap Web开发案例教程 电子书
本书通过丰富的实例详细讲解jQuery和Bootstrap框架的相关技术。jQuery篇主要包括jQuery基础、如何使用jQuery控制DOM、简化AJAX操作、制作动画与特效以及jQuery插件等内容。Bootstrap篇主要包括工具类、栅格布局、表单样式和组件库等内容。本书使用大量的案例帮助读者理解这两个框架的使用,同时会演示综合使用这两个框架进行Web开发的方法。
计算机网络技术入门教程(项目式) 电子书
内容提要本书是计算机网络技术的入门级教材,它打破了传统的课程教学模式,以职业能力为导向,构建以项目为载体的课程体系。本书将理论教学和实践教学融为一体,由浅入深构建了7个项目,包括认知网络、双机直连、组建简单的局域网、配置和管理网络、配置Internet接入、组建小型无线局域网、构建安全的校园网络,内容涵盖网络体系结构、局域网技术、网络传输介质与网络设备、IP地址、网络共享、网络接入技术、网络服务配