编辑推荐
重架构、重设计、重实战是本书撰写的指导思想。
内容简介
本书以全栈机器学习应用为目标,通过介绍Docker等部署工具,帮助读者加速掌握机器学习模型的产业化进程。不管你是就职于大公司,还是自己创业,希望《构建实时机器学习系统》的内容能够让你快速上线满意的机器学习系统,离梦想更近一点。
世界在变,机器学习也在不停地变。对于机器学习中的很多重要成员,如建模工具、分布式队列等,本书都会对其来龙去脉和发展趋势进行综述。希望通过这样的讨论,能够让读者对机器学习的发展趋势有自己的判断,在未来的成长中也能独占鳌头。
本书力求避免代码的大段堆砌。所有案例代码都力求在20行以内,所有例子都通过多次可用性测试。同时我们也将源代码寄存在Github上面,随时进行更新排错。
实时股票交易实例数据。采用美股交易秒级数据作为案例数据,搭建实时机器学习平台,对数据进行存储、加工分析和可视化,并且对数据未来若干秒的走势进行预测。
作者简介
作者彭河森,资深机器学习科学家,曾在Google、Amazon、微软等公司从事一线机器学习构架和开发工作,参与了Google实时数据警报、Amazon产品广告自动化优化、微软必应广告等多项海量数据、延时要求苛刻的机器学习应用工作。也参与Scikit—learn、Airflow、R等多项开源项目。对机器学习项目的生存期管理、架构设计、软件开发以及应用关键有着丰富的经验。
章节目录
版权信息
前言
第1部分 实时机器学习方法论
第1章 实时机器学习综述
1.1 什么是机器学习
1.2 机器学习发展的前世今生
1.3 机器学习领域分类
1.4 实时是个“万灵丹”
1.5 实时机器学习的分类
1.6 实时应用对机器学习的要求
1.7 案例:Netflix在机器学习竞赛中学到的经验
1.8 实时机器学习模型的生存期
第2章 实时监督式机器学习
2.1 什么是监督式机器学习
2.2 怎样衡量监督式机器学习模型
2.3 实时线性分类器介绍
第3章 数据分析工具Pandas
3.1 颠覆R的Pandas
3.2 Pandas的安装
3.3 利用Pandas分析实时股票报价数据
3.4 数据分析的三个要点
第4章 机器学习工具Scikit-learn
4.1 如何站在风口上?向Scikit-learn学习
4.2 Scikit-learn的安装
4.3 Scikit-learn的主要模块
4.4 利用Scikit-learn进行股票价格波动预测
第2部分 实时机器学习架构
第5章 实时机器学习架构设计
5.1 设计实时机器学习架构的四个要点
5.2 Lambda架构和主要成员
5.3 常用的实时机器学习架构
5.4 小结
第6章 集群部署工具Docker
6.1 Docker的前世今生
6.2 容器虚拟机的基本组成部分
6.3 Docker引擎命令行工具
6.4 通过Dockerfile配置容器虚拟机
6.5 服务器集群配置工具Docker Compose
6.6 远端服务器配置工具Docker Machine
6.7 其他有潜力的Docker工具
第7章 实时消息队列和RabbitMQ
7.1 实时消息队列
7.2 AMQP和RabbitMQ简介
7.3 RabbitMQ的主要构成部分
7.4 常用交换中心模式
7.5 消息传导设计模式
7.6 利用Docker快速部署RabbitMQ
7.7 利用RabbitMQ开发队列服务
第8章 实战数据库综述
8.1 SQL与NoSQL,主流数据库分类
8.2 数据库的性能
8.3 SQL和NoSQL对比
8.4 数据库的发展趋势
8.5 MySQL简介
8.6 Cassandra简介
第9章 实时数据监控ELK集群
9.1 Elasticsearch、LogStash和Kibana的前世今生
9.2 Elasticsearch基本架构
9.3 Elasticsearch快速入门
9.4 Kibana快速入门
第10章 机器学习系统设计模式
10.1 设计模式的前世今生
10.2 读:高速键值模式
10.3 读:缓存高速查询模式
10.4 更新:异步数据库更新模式
10.5 更新:请求重定向模式
10.6 处理:硬实时并行模式
10.7 处理:分布式任务队列模式
10.8 处理:批实时处理模式
第3部分 未来展望
第11章 Serverless架构
11.1 Serverless架构的前世今生
11.2 Serverless架构对实时机器学习的影响
第12章 深度学习的风口
12.1 深度学习的前世今生
12.2 深度学习的难点
12.3 如何选择深度学习工具
12.4 未来发展方向
构建实时机器学习系统是2017年由机械工业出版社华章分社出版,作者汪涵。
得书感谢您对《构建实时机器学习系统》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。