构建实时机器学习系统

构建实时机器学习系统

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

类似推荐

编辑推荐

重架构、重设计、重实战是本书撰写的指导思想。

内容简介

本书以全栈机器学习应用为目标,通过介绍Docker等部署工具,帮助读者加速掌握机器学习模型的产业化进程。不管你是就职于大公司,还是自己创业,希望《构建实时机器学习系统》的内容能够让你快速上线满意的机器学习系统,离梦想更近一点。

世界在变,机器学习也在不停地变。对于机器学习中的很多重要成员,如建模工具、分布式队列等,本书都会对其来龙去脉和发展趋势进行综述。希望通过这样的讨论,能够让读者对机器学习的发展趋势有自己的判断,在未来的成长中也能独占鳌头。

本书力求避免代码的大段堆砌。所有案例代码都力求在20行以内,所有例子都通过多次可用性测试。同时我们也将源代码寄存在Github上面,随时进行更新排错。

实时股票交易实例数据。采用美股交易秒级数据作为案例数据,搭建实时机器学习平台,对数据进行存储、加工分析和可视化,并且对数据未来若干秒的走势进行预测。

作者简介

作者彭河森,资深机器学习科学家,曾在Google、Amazon、微软等公司从事一线机器学习构架和开发工作,参与了Google实时数据警报、Amazon产品广告自动化优化、微软必应广告等多项海量数据、延时要求苛刻的机器学习应用工作。也参与Scikit—learn、Airflow、R等多项开源项目。对机器学习项目的生存期管理、架构设计、软件开发以及应用关键有着丰富的经验。

章节目录

版权信息

前言

第1部分 实时机器学习方法论

第1章 实时机器学习综述

1.1 什么是机器学习

1.2 机器学习发展的前世今生

1.3 机器学习领域分类

1.4 实时是个“万灵丹”

1.5 实时机器学习的分类

1.6 实时应用对机器学习的要求

1.7 案例:Netflix在机器学习竞赛中学到的经验

1.8 实时机器学习模型的生存期

第2章 实时监督式机器学习

2.1 什么是监督式机器学习

2.2 怎样衡量监督式机器学习模型

2.3 实时线性分类器介绍

第3章 数据分析工具Pandas

3.1 颠覆R的Pandas

3.2 Pandas的安装

3.3 利用Pandas分析实时股票报价数据

3.4 数据分析的三个要点

第4章 机器学习工具Scikit-learn

4.1 如何站在风口上?向Scikit-learn学习

4.2 Scikit-learn的安装

4.3 Scikit-learn的主要模块

4.4 利用Scikit-learn进行股票价格波动预测

第2部分 实时机器学习架构

第5章 实时机器学习架构设计

5.1 设计实时机器学习架构的四个要点

5.2 Lambda架构和主要成员

5.3 常用的实时机器学习架构

5.4 小结

第6章 集群部署工具Docker

6.1 Docker的前世今生

6.2 容器虚拟机的基本组成部分

6.3 Docker引擎命令行工具

6.4 通过Dockerfile配置容器虚拟机

6.5 服务器集群配置工具Docker Compose

6.6 远端服务器配置工具Docker Machine

6.7 其他有潜力的Docker工具

第7章 实时消息队列和RabbitMQ

7.1 实时消息队列

7.2 AMQP和RabbitMQ简介

7.3 RabbitMQ的主要构成部分

7.4 常用交换中心模式

7.5 消息传导设计模式

7.6 利用Docker快速部署RabbitMQ

7.7 利用RabbitMQ开发队列服务

第8章 实战数据库综述

8.1 SQL与NoSQL,主流数据库分类

8.2 数据库的性能

8.3 SQL和NoSQL对比

8.4 数据库的发展趋势

8.5 MySQL简介

8.6 Cassandra简介

第9章 实时数据监控ELK集群

9.1 Elasticsearch、LogStash和Kibana的前世今生

9.2 Elasticsearch基本架构

9.3 Elasticsearch快速入门

9.4 Kibana快速入门

第10章 机器学习系统设计模式

10.1 设计模式的前世今生

10.2 读:高速键值模式

10.3 读:缓存高速查询模式

10.4 更新:异步数据库更新模式

10.5 更新:请求重定向模式

10.6 处理:硬实时并行模式

10.7 处理:分布式任务队列模式

10.8 处理:批实时处理模式

第3部分 未来展望

第11章 Serverless架构

11.1 Serverless架构的前世今生

11.2 Serverless架构对实时机器学习的影响

第12章 深度学习的风口

12.1 深度学习的前世今生

12.2 深度学习的难点

12.3 如何选择深度学习工具

12.4 未来发展方向

构建实时机器学习系统是2017年由机械工业出版社华章分社出版,作者汪涵。

得书感谢您对《构建实时机器学习系统》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
机器学习基础 电子书
近年来人工智能技术蓬勃发展,人工智能正在改变我们的生活。为了让读者在不需要掌握太多数学和计算机科学知识的情况下,能够快速上手,使用Python语言实现常用的机器学习算法,并解决一些实际的问题,我们策划并出版本书。本书共14章,内容涵盖基本的机器学习概念和环境搭建,目前各个领域中的热门算法,以及数据预处理、模型评估和文本数据分析等。希望本书可以让读者轻松入门,在动手实践的过程中找到乐趣。本书可以作为
实用机器学习 电子书
大数据时代为机器学习的应用提供了广阔的空间,各行各业涉及数据分析的工作都需要使用机器学习算法。本书围绕实际数据分析的流程展开,着重介绍数据探索、数据预处理和常用的机器学习算法模型。本书从解决实际问题的角度出发,介绍回归算法、分类算法、推荐算法、排序算法和集成学习算法。在介绍每种机器学习算法模型时,书中不但阐述基本原理,而且讨论模型的评价与选择。为方便读者学习各种算法,本书介绍了R语言中相应的软件包
场景化机器学习 电子书
本书展示了如何在业务场景中应用机器学习,全书分为三个部分。第一部分介绍有效的决策如何帮助公司提高生产率以保持竞争力,阐释如何使用开源工具和AWS工具将机器学习应用于业务决策中。第二部分以虚拟人物为主线,研究六个场景,这些场景展示了如何使用机器学习来制定各种业务决策。第三部分讨论如何在Web上设置和共享机器学习模型,还介绍了一些案例。
机器学习公式详解 电子书
适读人群 :(1)高等院校人工智能、计算机、自动化等相关专业机器学习方向的学生;(2)学术界机器学习领域的研究人员和教师;(3)工业界对机器学习感兴趣的专业人员和工程师。 1.周志华教授“西瓜书”《机器学习》公式完全解析指南! “南瓜书”系Datawhale成员自学笔记,对“西瓜书”中250个重难点公式做了详细解析和推导(重难点公式覆盖率达99%),旨在解决机器学习中的数学难题。 2.机器学习初学小白提升数学基础能力的必备练习册! 以本科数学基础视角对“西瓜书”里比较难理解的公式加以解析和推导细节,补充大量重、难点数学知识和参考材料,分享在学习中遇到的“坑”以及跳过这个“坑”的方法,对于初学机器学习的小白也能上手练习! 3.俞勇、王斌、李沐、程明明、陈光(博主@爱可可-爱生活)、徐亦达等人工智能领域大咖亲笔推荐
机器学习案例实战 电子书
机器学习已经广泛地应用于各行各业,深度学习的兴起再次推动了人工智能的热潮。本书结合项目实践,首先讨论了TensorFlow、PySpark、TI-ONE等主流机器学习平台的主要特点;然后结合Tableau介绍了数据可视化在银行客户用卡行为分析的应用。在此基础上,利用上述介绍的这些平台,通过多个项目案例,详细地分析了决策树、随机森林、支持向量机、逻辑回归、贝叶斯网络、卷积神经网络、循环神经网络、对抗