多模态大模型:算法、应用与微调

多模态大模型:算法、应用与微调

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

多模态大模型技术全景解析,助你掌握部署、微调和优化。

内容简介

本书详尽地覆盖了多模态大模型的算法原理和应用实战,提供了丰富的微调技术细节和实际案例,适合对多模态大模型有兴趣的技术人员深入学习及应用。

本书分为两篇:

算法原理篇。详细介绍了先进的深度学习模型,包括Transformer、GPT系列、深度生成模型,从基本架构、训练方法到特定应用,包括但不限于Seq2Seq结构、位置编码、注意力机制、残差连接、变分自编码器等。此外,探讨了预训练模型的涌现能力、模型参数和通信数据量的估算,以及分布式训练的各种技术,如数据并行、模型并行和混合精度训练等。

应用实战篇。聚焦于深度学习模型的实际应用,特别是文本和图像生成,以及代码生成的应用实战。通过具体实战项目,如利用Stable Diffusion进行图像生成和Code Llama进行代码生成,提供了微调技术的详细细节,介绍了LangChain等大模型应用框架。

作者简介

作者刘兆峰,中国电信多模态算法工程师,基于多模态大模型提升长尾业务能力。天津科技大学人工智能专业硕士研究生。曾在京东科技担任算法工程师,从事京东白条申请评分卡开发。后加入创业公司,从事大规模预训练语言模型的分布式微调和AIGC相关衍生产品的系统开发,对LLM的训练和推理有深厚的理论基础和实战经验。

现主要研究方向为多模态大模型与Agent以及AGI系统研究,聚焦于多模态大模型的行业场景落地。工作期间技术成果丰硕,发表多篇论文,有多个软件著作权。

章节目录

版权信息

前言

第一篇 算法原理

第1章 Transformer模型

1.1 Seq2Seq结构

1.2 Transformer模型介绍

1.3 ViT模型介绍

1.4 本章总结

第2章 GPT系列模型

2.1 GPT-1

2.2 GPT-2

2.3 GPT-3

2.4 GPT-3.5

2.5 GPT-4

2.6 语言模型的未来

2.7 GPT系列的其他应用

2.8 本章总结

第3章 深度生成模型

3.1 从自编码器到变分自编码器

3.2 生成对抗网络

3.3 文本与图像的桥梁:CLIP

3.4 稳定扩散模型:Stable Diffusion

3.5 本章总结

第4章 预训练模型

4.1 大模型的涌现能力

4.2 模型参数量估算

4.3 通信数据量分析

4.4 分布式训练

4.5 DeepSpeed

4.6 模型即服务平台

4.7 本章总结

第二篇 应用实战

第5章 文本生成应用实战:利用ChatPDF与文件对话

5.1 大模型的落地应用

5.2 GLM系列模型

5.3 参数高效微调

5.4 大语言模型应用框架:LangChain

5.5 ChatGLM金融大模型挑战赛

5.6 本章总结

第6章 文本生成算法实战:DeepSpeed-Chat

6.1 ZeRO++

6.2 DeepSpeed-Chat快速开始

6.3 DeepSpeed-Chat的RLHF训练

6.4 DeepSpeed混合引擎

6.5 本章总结

第7章 图像生成算法实战:Stable Diffusion微调

7.1 LoRA参数高效微调技术

7.2 用于Diffusers的LoRA微调

7.3 Stable Diffusion WebUI

7.4 可控扩散模型:ControlNet

7.5 本章总结

第8章 代码生成算法实战:Code Llama微调

8.1 任务介绍

8.2 Llama 2

8.3 算法竞赛大语言模型

8.4 本章总结

第9章 综合应用实战:构建“漫画家”生成多模态漫画

9.1 应用介绍

9.2 功能实现选型

9.3 相关模型部署

9.4 后端应用搭建

9.5 本章总结

多模态大模型:算法、应用与微调是2024年由机械工业出版社出版,作者刘兆峰。

得书感谢您对《多模态大模型:算法、应用与微调》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
医患互动机制研究:从语言本体到多模态 电子书
本书针对中国语境下医患互动存在的现实问题,把(不)礼貌理论、人际关系管理理论、权力基础理论、多模态话语分析等引入医患互动的实证研究,探讨医患互动中言语模态与非言语模态互动的特征、机制与动因,以及对医疗意义建构和理解的协同互补作用,力争揭示医患互动的面貌和本质。同时,特别关注了老龄化背景下老年人就医互动的相关问题,并延伸至对医患关系、医学人文、老龄化社会等问题的思考。本书适合语言学、多模态研究等领域
建筑信息模型(BIM)技术与应用 电子书
本书主要内容包括BIM技术概论,BIM技术在土木工程方向的主要应用内容和特点以及方法,常用BIM平台介绍。针对目前通用度比较高的建模软件Autodesk公司的Revit建模平台深入讲解,Revit概述、BIM建模前期准备、结构模型创建、建筑模型创建、BIM标准化与快速建模技巧等。教材由浅入深,侧重于实际案例的应用。通过教学使得学生初步掌握BIM技术应用的理论基础知识,同时具备一定的实操基础能力,达
大数据网络传播模型和算法 电子书
本书系统总结了若干经典的随机传播模型,准确论述了模型之间的关系和模型的主要性质。在传播算法方面,本书以影响力最大化为主线,介绍了适用于不同场景的基于影响力传播的优化问题和算法。
空间回归模型的理论应用与扩展 电子书
空间回归模型是空间经济学在计量经济学领域的全新拓展,其对空间结构的检验和空间关系的衡量弥补了传统计量经济领域空间同质性研究的不足,为研究现实经济现象的空间异质性提供了新的方法和视角。本书立足空间计量经济学理论前沿,创新性地引入wu-hausman统计量和空间回归模型对中国FDI的空间格局以及空间结构的稳定性进行了验证,通过实证分析探究多类型空间回归模型在应用领域的拓展。