多模态大模型：算法、应用与微调

刘兆峰

查阅电子书

手机扫码

微信扫一扫

关注微信公众号

因版权原因待上架

类似推荐

编辑推荐

多模态大模型技术全景解析，助你掌握部署、微调和优化。

内容简介

本书详尽地覆盖了多模态大模型的算法原理和应用实战，提供了丰富的微调技术细节和实际案例，适合对多模态大模型有兴趣的技术人员深入学习及应用。

本书分为两篇：

算法原理篇。详细介绍了先进的深度学习模型，包括Transformer、GPT系列、深度生成模型，从基本架构、训练方法到特定应用，包括但不限于Seq2Seq结构、位置编码、注意力机制、残差连接、变分自编码器等。此外，探讨了预训练模型的涌现能力、模型参数和通信数据量的估算，以及分布式训练的各种技术，如数据并行、模型并行和混合精度训练等。

应用实战篇。聚焦于深度学习模型的实际应用，特别是文本和图像生成，以及代码生成的应用实战。通过具体实战项目，如利用Stable Diffusion进行图像生成和Code Llama进行代码生成，提供了微调技术的详细细节，介绍了LangChain等大模型应用框架。

作者简介

作者刘兆峰，中国电信多模态算法工程师，基于多模态大模型提升长尾业务能力。天津科技大学人工智能专业硕士研究生。曾在京东科技担任算法工程师，从事京东白条申请评分卡开发。后加入创业公司，从事大规模预训练语言模型的分布式微调和AIGC相关衍生产品的系统开发，对LLM的训练和推理有深厚的理论基础和实战经验。

现主要研究方向为多模态大模型与Agent以及AGI系统研究，聚焦于多模态大模型的行业场景落地。工作期间技术成果丰硕，发表多篇论文，有多个软件著作权。

章节目录

版权信息

前言

第一篇算法原理

第1章 Transformer模型

1.1 Seq2Seq结构

1.2 Transformer模型介绍

1.3 ViT模型介绍

1.4 本章总结

第2章 GPT系列模型

2.1 GPT-1

2.2 GPT-2

2.3 GPT-3

2.4 GPT-3.5

2.5 GPT-4

2.6 语言模型的未来

2.7 GPT系列的其他应用

2.8 本章总结

第3章深度生成模型

3.1 从自编码器到变分自编码器

3.2 生成对抗网络

3.3 文本与图像的桥梁：CLIP

3.4 稳定扩散模型：Stable Diffusion

3.5 本章总结

第4章预训练模型

4.1 大模型的涌现能力

4.2 模型参数量估算

4.3 通信数据量分析

4.4 分布式训练

4.5 DeepSpeed

4.6 模型即服务平台

4.7 本章总结

第二篇应用实战

第5章文本生成应用实战：利用ChatPDF与文件对话

5.1 大模型的落地应用

5.2 GLM系列模型

5.3 参数高效微调

5.4 大语言模型应用框架：LangChain

5.5 ChatGLM金融大模型挑战赛

5.6 本章总结

第6章文本生成算法实战：DeepSpeed-Chat

6.1 ZeRO++

6.2 DeepSpeed-Chat快速开始

6.3 DeepSpeed-Chat的RLHF训练

6.4 DeepSpeed混合引擎

6.5 本章总结

第7章图像生成算法实战：Stable Diffusion微调

7.1 LoRA参数高效微调技术

7.2 用于Diffusers的LoRA微调

7.3 Stable Diffusion WebUI

7.4 可控扩散模型：ControlNet

7.5 本章总结

第8章代码生成算法实战：Code Llama微调

8.1 任务介绍

8.2 Llama 2

8.3 算法竞赛大语言模型

8.4 本章总结

第9章综合应用实战：构建“漫画家”生成多模态漫画

9.1 应用介绍

9.2 功能实现选型

9.3 相关模型部署

9.4 后端应用搭建

9.5 本章总结

多模态大模型：算法、应用与微调是2024年由机械工业出版社出版,作者刘兆峰。

得书感谢您对《多模态大模型：算法、应用与微调》关注和支持，如本书内容有不良信息或侵权等情形的，请联系本网站。

购买这本书

得书 - 好书推荐、正版图书免费阅读