Ray分布式机器学习:利用Ray进行大模型的数据处理、训练、推理和部署

Ray分布式机器学习:利用Ray进行大模型的数据处理、训练、推理和部署

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

教你如何使用ray构建分布式机器学程序。

内容简介

Ray是开源分布式计算框架,简化了扩展计算密集型Python工作负载的过程。本书展示了如何使用Ray构建机器学习应用程序,介绍了Ray如何融入当前的机器学习工具,以及Ray如何与这些工具紧密集成。

本书前3章介绍了Ray作为分布式Python框架的基础知识,并提供了应用示例;第4-10章介绍了Ray高级库(Ray RLlib、Ray Tune、Ray Dataset、Ray Train、Ray Serve、Ray Cluster、Ray AIR),并展示如何使用高级库创建应用程序;第11章对Ray的生态进行了总结,并指导读者继续学习。

章节目录

版权信息

O'Reilly Media,Inc.介绍

推荐序 让分布式AI触手可及

前言

第1章 Ray概述

1.1 Ray是什么

1.1.1 Ray的渊源

1.1.2 Ray的设计原则

1.1.3 Ray的三层架构:内核、库、生态

1.2 分布式计算框架

1.3 数据科学库套件

1.3.1 Ray AIR和数据科学工作流

1.3.2 处理数据

1.3.3 训练模型

1.3.4 调优超参数

1.3.5 部署模型

1.4 Ray的生态

1.5 总结

第2章 Ray Core入门

2.1 Ray Core简介

2.1.1 Ray API的第一个示例

2.1.2 Ray Core API概述

2.2 理解Ray的系统组件

2.2.1 在节点上调度和执行任务

2.2.2 主节点

2.2.3 分布式调度和执行

2.3 利用Ray创建简单的MapReduce示例

2.3.1 映射和打乱文档数据

2.3.2 利用约简进行单词统计

2.4 总结

第3章 创建第一个分布式应用程序

3.1 强化学习入门

3.2 创建简易的迷宫问题

3.3 创建模拟

3.4 训练强化学习模型

3.5 创建分布式Ray应用程序

3.6 回顾强化学习术语

3.7 总结

第4章 利用Ray RLlib进行强化学习

4.1 RLlib概述

4.2 RLlib入门

4.2.1 创建Gym环境

4.2.2 运行RLlib CLI

4.2.3 使用RLlib Python API

4.3 配置RLlib实验

4.3.1 资源配置

4.3.2 配置rollout worker

4.3.3 配置环境

4.4 使用RLlib环境

4.4.1 RLlib环境概述

4.4.2 使用多智能体

4.4.3 使用策略服务器和客户端

4.5 高级概念

4.5.1 创建高级环境

4.5.2 应用课程学习

4.5.3 使用离线数据

4.5.4 其他高级主题

4.6 总结

第5章 利用Ray Tune进行超参数调优

5.1 调优超参数

5.1.1 使用Ray创建随机搜索示例

5.1.2 调优超参数的难点

5.2 Ray Tune入门

5.2.1 Tune的原理

5.2.2 配置和运行Tune

5.3 使用Tune进行机器学习

5.3.1 结合使用RLlib和Tune

5.3.2 调优Keras模型

5.4 总结

第6章 利用Ray进行数据处理

6.1 Ray Dataset

6.1.1 Ray Dataset基础

6.1.2 利用Ray Dataset进行计算

6.1.3 数据集管道

6.1.4 示例:并行训练分类器副本

6.2 外部集成库

6.3 创建ML管道

6.4 总结

第7章 利用Ray Train进行分布式训练

7.1 分布式模型训练基础

7.2 基于示例介绍Ray Train

7.2.1 预测纽约出租车的大额小费

7.2.2 加载、预处理、特征化

7.2.3 定义深度学习模型

7.2.4 示例:利用Ray Train进行分布式训练

7.2.5 分布式批量推理

7.3 Ray Train训练器

7.3.1 迁移到Ray Train

7.3.2 扩展训练器

7.3.3 利用Ray Train进行预处理

7.3.4 将训练器和Ray Tune集成

7.3.5 使用回调函数监控训练

7.4 总结

第8章 利用Ray Serve进行在线推理

8.1 在线推理的主要特点

8.1.1 ML模型属于计算密集型

8.1.2 ML模型无法独立使用

8.2 Ray Serve入门

8.2.1 Ray Serve概述

8.2.2 定义基础HTTP端点

8.2.3 扩展和资源分配

8.2.4 批处理请求

8.2.5 多模型推理图

8.3 端到端示例:创建基于NLP的API

8.3.1 获取内容和预处理

8.3.2 NLP模型

8.3.3 HTTP处理和驱动逻辑

8.3.4 整合

8.4 总结

第9章 Ray集群

9.1 手动创建Ray Cluster

9.2 在Kubernetes上进行部署

9.2.1 设置KubeRay集群

9.2.2 与KubeRay集群交互

9.2.3 公开KubeRay

9.2.4 配置KubeRay

9.2.5 配置KubeRay日志

9.3 使用Ray集群启动器

9.3.1 配置Ray集群

9.3.2 使用集群启动器CLI

9.3.3 与Ray Cluster交互

9.4 使用云集群

9.4.1 AWS

9.4.2 其他云服务

9.5 自动扩展

9.6 总结

第10章 Ray AIR入门

10.1 为什么使用AIR

10.2 AIR核心概念

10.2.1 Ray Dataset和预处理器

10.2.2 训练器

10.2.3 调优器和检查点

10.2.4 批预测器

10.2.5 部署

10.3 适合AIR的任务

10.3.1 AIR任务执行

10.3.2 AIR内存管理

10.3.3 AIR故障模型

10.3.4 自动扩展AIR任务

10.4 总结

第11章 Ray生态及其他

11.1 蓬勃的生态

11.1.1 数据加载和处理

11.1.2 模型训练

11.1.3 模型服务

11.1.4 创建自定义集成

11.1.5 Ray集成概述

11.2 Ray和其他系统

11.2.1 分布式Python框架

11.2.2 Ray AIR和更广泛的ML生态

11.2.3 将AIR集成到ML平台

11.3 继续学习

11.4 总结

作者简介

封面简介

Ray分布式机器学习:利用Ray进行大模型的数据处理、训练、推理和部署是2024年由机械工业出版社出版,作者[德] 马克斯·普佩拉。

得书感谢您对《Ray分布式机器学习:利用Ray进行大模型的数据处理、训练、推理和部署》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
机器学习实战 电子书
本书共11章,从推荐系统的发展历史、基本构成开始,依次剖析推荐系统的内容召回、协同过滤召回、深度学习召回中具有代表性的模型;再从经典排序模型到基于深度学习的排序,顺势介绍会话推荐、强化学习推荐及工业级推荐,搭建了完整的推荐系统技术体系,这是一个由浅入深的系统学习过程。
实用机器学习 电子书
大数据时代为机器学习的应用提供了广阔的空间,各行各业涉及数据分析的工作都需要使用机器学习算法。本书围绕实际数据分析的流程展开,着重介绍数据探索、数据预处理和常用的机器学习算法模型。本书从解决实际问题的角度出发,介绍回归算法、分类算法、推荐算法、排序算法和集成学习算法。在介绍每种机器学习算法模型时,书中不但阐述基本原理,而且讨论模型的评价与选择。为方便读者学习各种算法,本书介绍了R语言中相应的软件包
从零开始:机器学习的数学原理和算法实践 电子书
一学就会的数学知识,通俗易懂的算法原理,经典实用的编程实践。
场景化机器学习 电子书
本书展示了如何在业务场景中应用机器学习,全书分为三个部分。第一部分介绍有效的决策如何帮助公司提高生产率以保持竞争力,阐释如何使用开源工具和AWS工具将机器学习应用于业务决策中。第二部分以虚拟人物为主线,研究六个场景,这些场景展示了如何使用机器学习来制定各种业务决策。第三部分讨论如何在Web上设置和共享机器学习模型,还介绍了一些案例。
机器学习公式详解 电子书
适读人群 :(1)高等院校人工智能、计算机、自动化等相关专业机器学习方向的学生;(2)学术界机器学习领域的研究人员和教师;(3)工业界对机器学习感兴趣的专业人员和工程师。 1.周志华教授“西瓜书”《机器学习》公式完全解析指南! “南瓜书”系Datawhale成员自学笔记,对“西瓜书”中250个重难点公式做了详细解析和推导(重难点公式覆盖率达99%),旨在解决机器学习中的数学难题。 2.机器学习初学小白提升数学基础能力的必备练习册! 以本科数学基础视角对“西瓜书”里比较难理解的公式加以解析和推导细节,补充大量重、难点数学知识和参考材料,分享在学习中遇到的“坑”以及跳过这个“坑”的方法,对于初学机器学习的小白也能上手练习! 3.俞勇、王斌、李沐、程明明、陈光(博主@爱可可-爱生活)、徐亦达等人工智能领域大咖亲笔推荐