人工智能云平台:原理、设计与应用电子书

简介: 从原理到应用,全面、深入地学习人工智能云平台。

内容提要

本书以实践为导向,深入浅出,从人工智能技术、机器学习框架和微服务等概念讲起,对主流的人工智能云平台产品进行剖析和比较,对从训练学习到服务封装再到模型发布应用的全过程进行介绍,并对人工智能云平台技术栈涉及的云计算、集群管理、任务调度、共享存储等技术进行了详细讲解,以提高研发人员对人工智能全生产流程的理解。书中结合以上技术知识,以目前较为主流的开源人工智能集群管理云平台为例,对相关工程案例进行了深入讲解,帮助读者加深对知识点的理解和掌握。

本书适合有一定机器学习基础和大数据基础的学生、研发人员或希望进入人工智能云平台领域的读者阅读和学习。同时,希望本书能帮助更多人在人工智能时代找到自己的方向和定位。

引言

目前人类正处在一个日新月异、飞速变革的智能时代。近年来,随着大数据技术、高性能计算技术和深度学习技术的崛起和突破,涌现出了很多智能算法。这些智能算法对图像处理、自然语言处理、语音处理、搜索推荐等技术的发展起到了极大的促进作用,相关研究领域的算法技术从实验室走入商业场景,创造了丰富的商业价值。

开放的软件生态和易用的软件形态是打造人工智能(Artificial Intelligence,AI)和深度学习产业链的至关重要的两个方面。没有软件的支撑,理论很难与应用相结合,新硬件也很难为应用提速。像大数据时代Hadoop的出现、移动互联网时代安卓(Android)系统的出现一样,在新的智能浪潮下,支撑人工智能算法服务生产和开发的相关技术也得到了快速的发展,谷歌(Google)、脸书(Facebook)、亚马逊(Amazon)等人工智能巨头纷纷推出了面向算法开发者的人工智能开发框架。他们推出的TensorFlow、PyTorch、MXNet等开源框架,大大扩展了人工智能算法服务的训练生产能力,缩短了智能服务的上线、更新周期,提高了人工智能服务的生产效率。

然而,TensorFlow、PyTorch、MXNet尚不足以支撑人工智能的全流程生产化应用,它们仅面向个人开发者和研究人员,管理少数计算设备资源,无法在云计算资源上提供面向多租户的智能应用全流程服务,欠缺诸如海量样本数据管理与共享存储、集群管理、任务调度、快速训练与部署、运行时监控等能力,导致用户形成生产力的成本过高。

深度学习等人工智能技术是计算密集型重资产类应用,亟须能够提供异构高性能计算资源和主流机器学习框架支持的云服务,降低人工智能框架的使用门槛,并提升用户体验,从而与开源效应叠加,加速产业发展。面对这一需求和市场,国家发展和改革委员会、科学技术部针对人工智能开源开放平台设立重大专项,大力发展相关技术;谷歌、脸书、亚马逊以及国内的阿里巴巴、百度、华为等优秀的科技公司,也纷纷开始推出人工智能的云平台服务。人工智能云平台作为一种新的智能产业领域,正在如火如荼地发展。

然而,目前尚缺少全面、系统、深入介绍人工智能云平台的资料。针对这一迫切需求,本书以实践为导向,首先对智能云平台的技术体系进行梳理,从智能云平台与大数据云计算技术、人工智能技术的关系讲起,为读者勾勒该领域涵盖的技术范畴。然后,对从训练学习到服务封装再到模型发布应用的全过程的人工智能云平台设计的关键技术原理进行了阐述,对人工智能应用的完整流程进行了详细介绍,并对人工智能云平台技术栈涉及的云计算、集群管理、任务调度、共享存储等技术进行了针对性讲解。最后,结合理论知识与作者多年的工作实践,以目前较为主流的多个开源人工智能管理平台为例,对相关工程案例进行了深入讲解,以填补人工智能云平台技术领域教程的空白。

本书的主要特点如下。

内容来自多个智能云平台项目。本书的许多内容是大型项目和商业运营产品等不同场景下智能云平台系统的研发心得,具有很高的借鉴价值。

版权:人民邮电出版社