分布式机器学习实战

分布式机器学习实战

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

分布式机器学习实战:大数据技术、主流框架与算法详解。

内容简介

本书由浅入深,逐步讲解分布式机器学习的框架及应用,内容板块包括主流大数据算法系统架构设计、大数据基础、mahout分布式机器学习平台、Spark分布式机器学习平台、TensorFlow等。同时配套完整工业级实战项目,例如个性化推荐算法系统、人脸识别,对话机器人。通过阅读本书,读者不仅可以学习到分布式机器学习的知识,还能通过实战案例更好地将理论融入到实际工作中。

本书适合想学习分布式机器学习的初学者阅读,对于有一定经验的分布式大数据方向的从业人员及算法工程师,也可以从书中获取很多有价值的知识。

作者简介

陈敬雷 充电了么创始人,CEO兼CTO,中国首席数据官联盟专家委员。陈敬雷拥有十几年互联网从业经验,曾任架构师、首席技术官、首席科学家等职务。在技术领域,尤其在大数据和人工智能方向有着丰富的算法工程落地实战经验,在猎聘网任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。目前专注于大数据和人工智能驱动的上班族在线教育行业,研发了充电了么App,用深度学习算法、NLP、推荐引擎等技术来高效提升在线学习效率。

章节目录

版权信息

内容简介

作者简介

前言 PREFACE

第1章 互联网公司大数据和人工智能那些事

1.1 大数据和人工智能在互联网公司扮演的角色和重要性

1.1.1 什么是大数据,扮演的角色和重要性

1.1.2 什么是人工智能,扮演的角色和重要性

1.1.3 大数据和人工智能有什么区别,又是如何相互关联

1.2 大数据部门组织架构和各种职位介绍

1.2.1 大数据部门组织架构

1.2.2 各种职位介绍和技能要求

1.2.3 不同职位相互协调配合关系

1.2.4 各个职位的职业生涯规划和发展路径

1.2.5 各个职位的市场平均薪资水平

第2章 大数据算法系统架构

2.1 经典应用场景

2.2 应用系统架构设计

第3章 大数据基础

3.1 Hadoop大数据平台搭建

3.1.1 Hadoop原理和功能介绍

3.1.2 Hadoop安装部署

3.1.3 Hadoop常用操作命令

3.2 Hive数据仓库实战

3.2.1 Hive原理和功能介绍

3.2.2 Hive安装部署

3.2.3 Hive SQL操作

3.2.4 UDF函数

3.2.5 Hive数据仓库模型设计

3.3 HBase实战

3.3.1 HBase原理和功能介绍

3.3.2 HBase数据结构和表详解

3.3.3 HBase安装部署

3.3.4 HBase Shell常用命令操作

3.3.5 HBase客户端类SQL工具Phoenix

3.3.6 Hive集成HBase查询数据

3.3.7 HBase升级和数据迁移

3.4 Sqoop数据ETL工具实战

3.4.1 Sqoop原理和功能介绍

3.4.2 Sqoop常用操作

3.5 Spark基础

3.5.1 Spark原理和介绍

3.5.2 Spark MLlib机器学习介绍

3.5.3 Spark GraphX图计算介绍

3.5.4 Spark Streaming流式计算介绍

3.5.5 Scala编程入门和Spark编程

3.5.6 Spark项目案例实战和分布式部署

第4章 Docker容器

4.1 Docker介绍

4.1.1 能用Docker做什么

4.1.2 Docker容器基本概念

4.2 Docker容器部署

4.2.1 基础环境安装

4.2.2 Docker常用命令

第5章 Mahout分布式机器学习平台

5.1 Mahout挖掘平台

5.1.1 Mahout原理和介绍

5.1.2 Mahout安装部署

5.2 Mahout机器学习算法

5.2.1 Mahout算法概览

5.2.2 潜在狄利克雷分配模型

5.2.3 MinHash聚类

5.2.4 K-means聚类

5.2.5 Canopy聚类

5.2.6 MeanShift均值漂移聚类

5.2.7 Fkmeans模糊聚类

5.2.8 贝叶斯分类算法

5.2.9 SGD逻辑回归分类算法

5.2.10 随机森林分类算法

5.2.11 关联规则之频繁项集挖掘算法

5.2.12 协同过滤算法

5.2.13 遗传算法

第6章 Spark分布式机器学习平台

6.1 Spark机器学习库

6.1.1 Spark机器学习简介

6.1.2 算法概览

6.2 各个算法介绍和编程实战

6.2.1 推荐算法交替最小二乘法

6.2.2 逻辑回归

6.2.3 决策树

6.2.4 随机森林

6.2.5 梯度提升决策树

6.2.6 支持向量机

6.2.7 朴素贝叶斯

6.2.8 序列模式挖掘PrefixSpan

6.2.9 Word2vec词向量模型

6.2.10 多层感知器神经网络

第7章 分布式深度学习实战

7.1 TensorFlow深度学习框架

7.1.1 TensorFlow原理和介绍

7.1.2 TensorFlow安装部署

7.2 MXNet深度学习框架

7.2.1 MXNet原理和介绍

7.2.2 MXNet安装部署

7.3 神经网络算法

7.3.1 多层感知器算法

7.3.2 卷积神经网络

7.3.3 循环神经网络

7.3.4 长短期记忆神经网络

7.3.5 端到端神经网络

7.3.6 生成对抗网络

7.3.7 深度强化学习

7.3.8 TensorFlow分布式训练实战

7.3.9 分布式TensorFlow on Kubernetes集群实战

第8章 完整工业级系统实战

8.1 推荐算法系统实战

8.1.1 推荐系统架构设计

8.1.2 推荐数据仓库集市

8.1.3 ETL数据处理

8.1.4 协同过滤用户行为挖掘

8.1.5 ContentBase文本挖掘算法

8.1.6 用户画像兴趣标签提取算法

8.1.7 基于用户心理学模型推荐

8.1.8 多策略融合算法

8.1.9 准实时在线学习推荐引擎

8.1.10 Redis缓存处理

8.1.11 分布式搜索

8.1.12 推荐Rerank二次重排序算法

8.1.13 在线Web实时推荐引擎服务

8.1.14 在线AB测试推荐效果评估

8.1.15 离线AB测试推荐效果评估

8.1.16 推荐位管理平台

8.2 人脸识别实战

8.2.1 人脸识别原理与介绍

8.2.2 人脸识别应用场景

8.2.3 人脸检测与对齐

8.2.4 人脸识别比对

8.2.5 人脸年龄识别

8.2.6 人脸性别预测

8.3 对话机器人实战

8.3.1 对话机器人原理与介绍

8.3.2 基于TensorFlow的对话机器人

8.3.3 基于MXNet的对话机器人

8.3.4 基于深度强化学习的机器人

8.3.5 基于搜索引擎的对话机器人

8.3.6 对话机器人的Web服务工程化

分布式机器学习实战是2020年由清华大学出版社出版,作者陈敬雷。

得书感谢您对《分布式机器学习实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
机器学习算法评估实战 电子书
在机器学习算法的实际应用中,我们不仅要知道算法的原理,也要了解如何评估算法上线服务的可靠性。
机器学习 电子书
机器学习基础与高级内容全面讲解,实例丰富,易于学习巩固。
实用机器学习 电子书
大数据时代为机器学习的应用提供了广阔的空间,各行各业涉及数据分析的工作都需要使用机器学习算法。本书围绕实际数据分析的流程展开,着重介绍数据探索、数据预处理和常用的机器学习算法模型。本书从解决实际问题的角度出发,介绍回归算法、分类算法、推荐算法、排序算法和集成学习算法。在介绍每种机器学习算法模型时,书中不但阐述基本原理,而且讨论模型的评价与选择。为方便读者学习各种算法,本书介绍了R语言中相应的软件包
机器学习公式详解 电子书
适读人群 :(1)高等院校人工智能、计算机、自动化等相关专业机器学习方向的学生;(2)学术界机器学习领域的研究人员和教师;(3)工业界对机器学习感兴趣的专业人员和工程师。 1.周志华教授“西瓜书”《机器学习》公式完全解析指南! “南瓜书”系Datawhale成员自学笔记,对“西瓜书”中250个重难点公式做了详细解析和推导(重难点公式覆盖率达99%),旨在解决机器学习中的数学难题。 2.机器学习初学小白提升数学基础能力的必备练习册! 以本科数学基础视角对“西瓜书”里比较难理解的公式加以解析和推导细节,补充大量重、难点数学知识和参考材料,分享在学习中遇到的“坑”以及跳过这个“坑”的方法,对于初学机器学习的小白也能上手练习! 3.俞勇、王斌、李沐、程明明、陈光(博主@爱可可-爱生活)、徐亦达等人工智能领域大咖亲笔推荐
Python高手修炼之道:数据处理与机器学习实战 电子书
适读人群 :1.没有编程知识的新手 不同于一般的基础语法讲解教程,本书并未将Python 开发限定于某个集成开发工具(IDE)中,而是采用交互式编程的方式来强化读者对语言特性的理解,帮助新手读者真正理解Python 语言和Python 编程。2.从未接触过Python 语言,但了解一点编程知识的初学者 本书通过对基础知识高度的提炼和概括,以避免初学者陷入低级且冗长的细节知识点而心生懈怠;同时,本书为初学者规划了从初级到高级的编程技能提升路线图。3.具有一定基础的Python 程序员 本书可以作为案头工具书来使用。本书从基础语法、基本技能讲起,涵盖了科学计算、数据处理、机器学习等领域,示例代码涉及30 余个模块的使用。 构建从Python入门到数据分析到机器学习的路线图,入门有章可循; 1.讲解独到,常见盲点趣解析 作者基于多年的经验积累,善于总结概括初学Python过程中的误区。 2.内容全面,常用工具全涵盖 书中介绍的Python工具包覆盖Numpy、Matplotlib、Pandas、SciPy、Scikit-Learn,方便读者拓展实用技能、掌握工作利器。 3.拓展训练,重点知识有强化 语感训练100题、Python内置函数(类)手册、从新手到高手的100个模块,强化知识点的掌握。 4.代码完整,随时动手可复现 本书提供了完整、可验证的代码,方便读者动手练习并强化理解。