Kubeflow学习指南:生产级机器学习系统实现

Kubeflow学习指南:生产级机器学习系统实现

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

Kubeflow是基于K8S的机器学习工具包,是为数据科学家和数据工程师构建生产级别的机器学习实现而设计的。

内容简介

本书采用循序渐进的方式,从Kubeflow的安装、使用和设计开篇,随后从模型训练的整个周期展开,涵盖了数据探索、特征准备、模型训练/调优、模型服务、模型测试、模型监测和模型版本管理等各个环节,既有相关的理论知识也囊括了真实的使用案例,能够让读者在学习Kubeflow知识的同时全面了解机器学习的相关知识,是入门和深入学习Kubeflow以及机器学习的良好指南。

章节目录

版权信息

关于作者

关于封面

O'Reilly Media, Inc. 介绍

译者序

序言

前言

第1章 Kubeflow及其适用对象

1.1 模型开发生命周期

1.2 Kubeflow适合什么场景

1.3 为什么需要容器化

1.4 为什么需要Kubernetes

1.5 Kubeflow的设计和核心组件

1.5.1 使用notebook进行数据探索

1.5.2 数据准备与特征准备

1.5.3 训练

1.5.4 超参调优

1.5.5 模型验证

1.5.6 推理/预测

1.5.7 Pipeline

1.5.8 组件概述

1.6 Kubeflow的替代方案

1.6.1 Clipper

1.6.2 MLflow

1.6.3 其他替代方案

1.7 案例研究

1.7.1 MNIST

1.7.2 邮件列表数据

1.7.3 产品推荐系统

1.7.4 CT扫描

1.8 总结

第2章 你好,Kubeflow

2.1 搭建Kubeflow

2.1.1 安装Kubeflow及其依赖项

2.1.2 搭建本地Kubernetes

2.1.3 搭建Kubeflow开发环境

2.1.4 创建第一个Kubeflow项目

2.2 训练和部署模型

2.2.1 训练和监测进展

2.2.2 测试查询

2.3 超越本地部署

2.4 总结

第3章 Kubeflow设计:超越基础

3.1 中央仪表盘

3.1.1 notebook(JupyterHub)

3.1.2 训练operator

3.1.3 初识Kubeflow Pipeline

3.1.4 超参调优

3.1.5 模型推理

3.1.6 元数据

3.1.7 组件概述

3.2 支持组件

3.2.1 MinIO

3.2.2 Istio

3.2.3 Knative

3.2.4 Apache Spark

3.2.5 Kubeflow多用户隔离

3.3 总结

第4章 Kubeflow Pipeline

4.1 Pipeline入门

4.1.1 探索预置的Pipeline样例

4.1.2 用Python构建一个简单的Pipeline

4.1.3 步骤之间存储数据

4.2 Kubeflow Pipeline组件介绍

4.2.1 Argo:Pipeline的基石

4.2.2 Kubeflow Pipeline对Argo工作流的增强

4.2.3 使用现有镜像构建Pipeline

4.2.4 Kubeflow Pipeline组件

4.3 Pipeline高级主题

4.3.1 Pipeline阶段的条件执行

4.3.2 按计划执行Pipeline

4.4 总结

第5章 数据准备和特征准备

5.1 选择正确的工具

5.2 本地数据准备和特征准备

5.2.1 获取数据

5.2.2 数据清理:过滤垃圾信息

5.2.3 格式化数据

5.2.4 特征准备

5.2.5 自定义容器

5.3 分布式工具

5.3.1 TensorFlow扩展

5.3.2 使用Apache Spark的分布式数据

5.3.3 使用Apache Spark的分布式特征准备

5.4 将其整合到一个Pipeline中

5.5 将整个notebook作为数据准备Pipeline阶段使用

5.6 总结

第6章 制品和元数据存储

6.1 Kubeflow ML Metadata

6.1.1 编程查询

6.1.2 Kubeflow Metadata用户界面

6.2 基于Kubeflow的MLflow元数据工具

6.2.1 创建和部署MLflow跟踪服务器

6.2.2 记录运行数据

6.2.3 使用MLflow用户界面

6.3 总结

第7章 训练机器学习模型

7.1 用TensorFlow构建推荐器

7.1.1 入门

7.1.2 创建一个新notebook会话

7.1.3 TensorFlow训练

7.2 部署TensorFlow训练作业

7.3 分布式训练

7.3.1 使用GPU

7.3.2 使用其他框架进行分布式训练

7.4 使用scikit-learn训练模型

7.4.1 建立新的notebook会话

7.4.2 数据准备

7.4.3 Scikit-learn训练

7.4.4 解释模型

7.4.5 导出模型

7.4.6 集成到Pipeline

7.5 总结

第8章 模型推断

8.1 模型服务

8.2 模型监控

8.2.1 模型的准确性、漂移和可解释性

8.2.2 模型监控要求

8.3 模型更新

8.4 推理要求概述

8.5 Kubeflow中的模型推理

8.6 TensorFlow Serving

8.7 Seldon Core

8.7.1 设计Seldon推理图

8.7.2 测试模型

8.7.3 服务请求

8.7.4 监控模型

8.7.5 审阅

8.8 KFServing

8.8.1 Serverless和服务平面

8.8.2 数据平面

8.8.3 示例演练

8.8.4 剥离底层基础设施

8.8.5 审阅

8.9 总结

第9章 多工具使用案例

9.1 CT扫描去噪示例

9.1.1 使用Python进行数据准备

9.1.2 使用Apache Spark进行DS-SVD

9.1.3 可视化

9.1.4 CT扫描去噪Pipeline

9.2 共享Pipeline

9.3 总结

第10章 超参调优和自动化机器学习

10.1 AutoML概述

10.2 使用Kubeflow Katib进行超参调优

10.3 Katib概念

10.4 安装Katib

10.5 运行第一个Katib实验

10.5.1 准备训练代码

10.5.2 配置实验

10.5.3 运行实验

10.5.4 Katib用户界面

10.6 调优分布式训练作业

10.7 神经网络架构搜索

10.8 Katib的优势

10.9 总结

附录A Argo执行器配置和权衡

附录B 特定于云的工具和配置

B.1 Google云

附录C 在应用程序中使用模型服务

C.1 利用模型服务构建流式应用程序

C.2 利用模型服务构建批处理应用程序

Kubeflow学习指南:生产级机器学习系统实现是2022年由机械工业出版社华章分社出版,作者[美] Trevor Grant。

得书感谢您对《Kubeflow学习指南:生产级机器学习系统实现》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
华为MPLS VPN学习指南 电子书
1.本书专门针对目前市场上没有华为S系列交换机、AR G3系列路由器MPLS技术原理、应用配置方法进行介绍。 2.本书是一本内容系统、丰富,更具实战化的图书,不仅包括许多深入的MPLS技术原理介绍,还有大量的分类应用配置步骤展示和具体的应用方案配置案例。 3.本书除了介绍华为网络设备MPLS的基本技术和应用之外,还将全面介绍目前在数据中心中经常用到的基于MPLS的虚拟化技术及应用,如VLL、PWE3等。 4.本书注重细节,追求系统深入,思路清晰,符合读者阅读习惯。
《HCNA-WLAN学习指南》 电子书
  1.本书是由华为公司官方直接授权编写,审核通过出版的,并作为面向企业市场的无线局域网络工程师培训教材,其专业性毋庸置疑。   2.本书是目前国内一本专业的讲述华为无线局域网络工程师培训的图书,本书所包括的内容非常全面、系统,真正的“一册在手,别无所求”。
实用机器学习 电子书
大数据时代为机器学习的应用提供了广阔的空间,各行各业涉及数据分析的工作都需要使用机器学习算法。本书围绕实际数据分析的流程展开,着重介绍数据探索、数据预处理和常用的机器学习算法模型。本书从解决实际问题的角度出发,介绍回归算法、分类算法、推荐算法、排序算法和集成学习算法。在介绍每种机器学习算法模型时,书中不但阐述基本原理,而且讨论模型的评价与选择。为方便读者学习各种算法,本书介绍了R语言中相应的软件包
机器学习实战 电子书
《机器学习实战》面向日常任务的高效实战内容,介绍并实现机器学习的主流算法。
HCNP路由交换学习指南 电子书
1.针对HCNP级别的每项网络技术知识做单独、细致的讲解,易于学习且可读性强。 2.详细讲述每个技术的来龙去脉以及各个技术解决方案中相关的联系,让读者知其然,也知其所以然。 3.以典型企业网络为模型,细致介绍每种网络技术的原理及应用。 4.每个章节都附有练习题、思考题以及答案,供读者对技术问题加深思考,总结回顾。 5.本书为华为官方出版的认证培训实验教材。