构建实时机器学习系统

构建实时机器学习系统

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

重架构、重设计、重实战是本书撰写的指导思想。

内容简介

本书以全栈机器学习应用为目标,通过介绍Docker等部署工具,帮助读者加速掌握机器学习模型的产业化进程。不管你是就职于大公司,还是自己创业,希望《构建实时机器学习系统》的内容能够让你快速上线满意的机器学习系统,离梦想更近一点。

世界在变,机器学习也在不停地变。对于机器学习中的很多重要成员,如建模工具、分布式队列等,本书都会对其来龙去脉和发展趋势进行综述。希望通过这样的讨论,能够让读者对机器学习的发展趋势有自己的判断,在未来的成长中也能独占鳌头。

本书力求避免代码的大段堆砌。所有案例代码都力求在20行以内,所有例子都通过多次可用性测试。同时我们也将源代码寄存在Github上面,随时进行更新排错。

实时股票交易实例数据。采用美股交易秒级数据作为案例数据,搭建实时机器学习平台,对数据进行存储、加工分析和可视化,并且对数据未来若干秒的走势进行预测。

作者简介

作者彭河森,资深机器学习科学家,曾在Google、Amazon、微软等公司从事一线机器学习构架和开发工作,参与了Google实时数据警报、Amazon产品广告自动化优化、微软必应广告等多项海量数据、延时要求苛刻的机器学习应用工作。也参与Scikit—learn、Airflow、R等多项开源项目。对机器学习项目的生存期管理、架构设计、软件开发以及应用关键有着丰富的经验。

章节目录

版权信息

前言

第1部分 实时机器学习方法论

第1章 实时机器学习综述

1.1 什么是机器学习

1.2 机器学习发展的前世今生

1.3 机器学习领域分类

1.4 实时是个“万灵丹”

1.5 实时机器学习的分类

1.6 实时应用对机器学习的要求

1.7 案例:Netflix在机器学习竞赛中学到的经验

1.8 实时机器学习模型的生存期

第2章 实时监督式机器学习

2.1 什么是监督式机器学习

2.2 怎样衡量监督式机器学习模型

2.3 实时线性分类器介绍

第3章 数据分析工具Pandas

3.1 颠覆R的Pandas

3.2 Pandas的安装

3.3 利用Pandas分析实时股票报价数据

3.4 数据分析的三个要点

第4章 机器学习工具Scikit-learn

4.1 如何站在风口上?向Scikit-learn学习

4.2 Scikit-learn的安装

4.3 Scikit-learn的主要模块

4.4 利用Scikit-learn进行股票价格波动预测

第2部分 实时机器学习架构

第5章 实时机器学习架构设计

5.1 设计实时机器学习架构的四个要点

5.2 Lambda架构和主要成员

5.3 常用的实时机器学习架构

5.4 小结

第6章 集群部署工具Docker

6.1 Docker的前世今生

6.2 容器虚拟机的基本组成部分

6.3 Docker引擎命令行工具

6.4 通过Dockerfile配置容器虚拟机

6.5 服务器集群配置工具Docker Compose

6.6 远端服务器配置工具Docker Machine

6.7 其他有潜力的Docker工具

第7章 实时消息队列和RabbitMQ

7.1 实时消息队列

7.2 AMQP和RabbitMQ简介

7.3 RabbitMQ的主要构成部分

7.4 常用交换中心模式

7.5 消息传导设计模式

7.6 利用Docker快速部署RabbitMQ

7.7 利用RabbitMQ开发队列服务

第8章 实战数据库综述

8.1 SQL与NoSQL,主流数据库分类

8.2 数据库的性能

8.3 SQL和NoSQL对比

8.4 数据库的发展趋势

8.5 MySQL简介

8.6 Cassandra简介

第9章 实时数据监控ELK集群

9.1 Elasticsearch、LogStash和Kibana的前世今生

9.2 Elasticsearch基本架构

9.3 Elasticsearch快速入门

9.4 Kibana快速入门

第10章 机器学习系统设计模式

10.1 设计模式的前世今生

10.2 读:高速键值模式

10.3 读:缓存高速查询模式

10.4 更新:异步数据库更新模式

10.5 更新:请求重定向模式

10.6 处理:硬实时并行模式

10.7 处理:分布式任务队列模式

10.8 处理:批实时处理模式

第3部分 未来展望

第11章 Serverless架构

11.1 Serverless架构的前世今生

11.2 Serverless架构对实时机器学习的影响

第12章 深度学习的风口

12.1 深度学习的前世今生

12.2 深度学习的难点

12.3 如何选择深度学习工具

12.4 未来发展方向

构建实时机器学习系统是2017年由机械工业出版社华章分社出版,作者汪涵。

得书感谢您对《构建实时机器学习系统》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Python机器学习 电子书
《Python机器学习》从实用的角度出发,整合Python语言基础、数据分析与可视化、机器学习常用算法等知识。内容从*基本的Python编程基础入手,由浅入深、循序渐进地讲授NumPy库和Matplotlib库,以及复杂的机器学习基本理论和算法,并突出知识的实用性和可操作性。《Python机器学习》力求以浅显的语言讲解复杂的知识,以直观的案例辅助读者理解,并以图表形式展示代码和运行结果,配合习题巩
机器学习实战 电子书
《机器学习实战》面向日常任务的高效实战内容,介绍并实现机器学习的主流算法。
场景化机器学习 电子书
本书展示了如何在业务场景中应用机器学习,全书分为三个部分。第一部分介绍有效的决策如何帮助公司提高生产率以保持竞争力,阐释如何使用开源工具和AWS工具将机器学习应用于业务决策中。第二部分以虚拟人物为主线,研究六个场景,这些场景展示了如何使用机器学习来制定各种业务决策。第三部分讨论如何在Web上设置和共享机器学习模型,还介绍了一些案例。
机器学习公式详解 电子书
适读人群 :(1)高等院校人工智能、计算机、自动化等相关专业机器学习方向的学生;(2)学术界机器学习领域的研究人员和教师;(3)工业界对机器学习感兴趣的专业人员和工程师。 1.周志华教授“西瓜书”《机器学习》公式完全解析指南! “南瓜书”系Datawhale成员自学笔记,对“西瓜书”中250个重难点公式做了详细解析和推导(重难点公式覆盖率达99%),旨在解决机器学习中的数学难题。 2.机器学习初学小白提升数学基础能力的必备练习册! 以本科数学基础视角对“西瓜书”里比较难理解的公式加以解析和推导细节,补充大量重、难点数学知识和参考材料,分享在学习中遇到的“坑”以及跳过这个“坑”的方法,对于初学机器学习的小白也能上手练习! 3.俞勇、王斌、李沐、程明明、陈光(博主@爱可可-爱生活)、徐亦达等人工智能领域大咖亲笔推荐
机器学习Python实战 电子书
本书使用Python的机器学习算法库scikit-learn讲解机器学习重要算法的应用,内容包括机器学习认知、数据预处理、KNN算法、线性回归算法、逻辑回归算法、朴素贝叶斯算法、决策树与随机森林算法、支持向量机、k-mcans算法、神经网络、模型评估与优化。本书使用通俗易懂的语言、丰富的图表和大量的案例对机器学习的重要算法进行讲解,提供一条从实践出发掌握机器学习知识的途径,读者即使没有很扎实的数学