类似推荐
编辑推荐
通过学习本书,你将逐步掌握将原始数据转化为重要结论的过程。
内容简介
本书着重介绍预测性分析技术,先概述了数据分析系统的基本架构和主要处理流程,然后从分类和无监督学习开始,逐一讲解每种机器学习算法的工作原理,并在每一章的后给出了详细的案例讨论。高质量的数据是能够进行正确分析的前提,为了便于后期分析模型的构建,本书还会介绍对于不同类型数据的清洗和过滤等内容。通过学习本书的内容,读者将了解将原始数据转化为重要结论的过程,并掌握快速将其中涉及的模型应用到自有数据中的方法。
作者简介
作者约瑟夫·巴布科克,现为AQR Capital Management机器学习研究员,之前曾是Netflix不错的数据科学家。他有近10年的复杂数据集研究经验,解决了来自医疗健康和娱乐行业的众多大数据挑战。他毕业于美国约翰-霍普金斯大学医学院,获得了该校所罗门-斯奈德神经系统学科的博士学位,在该校就读期间,他运用机器学习预测了对心脏方面的副作用。
章节目录
版权信息
译者序
关于审稿人
前言
第1章 数据转换成决策——从分析应用着手
1.1 设计高级分析方案
1.2 案例学习:社交媒体数据的情感分析
1.3 案例学习:针对性电子邮件活动
1.4 总结
第2章 Python数据分析和可视化初探
2.1 在IPython中探索分类和数值型数据
2.2 时间序列分析
2.3 操作地理数据
2.4 PySpark简介
2.5 总结
第3章 在噪声中探求模式——聚类和无监督学习
3.1 相似性和距离度量
3.2 近邻传播算法——自动选择聚类数量
3.3 k-中心点算法
3.4 凝聚聚类算法
3.5 Spark中的数据流聚类
3.6 总结
第4章 从点到模型——回归方法
4.1 线性回归
4.2 树方法
4.3 利用PySpark进一步扩展——预测歌曲的发行年份
4.4 总结
第5章 数据分类——分类方法和分析
5.1 逻辑回归
5.2 拟合模型
5.3 评估分类模型
5.4 通过支持向量机分离非线性边界
5.5 分类方法比较
5.6 案例学习:在PySpark中拟合分类器模型
5.7 总结
第6章 词语和像素——非结构化数据分析
6.1 文本数据分析
6.2 主分量分析
6.3 图像
6.4 案例学习:在PySpark中训练一个推荐系统
6.5 总结
第7章 自底向上学习——深度网络和无监督特征
7.1 使用神经网络学习模式
7.2 TensorFlow库与数字识别
7.3 总结
第8章 利用预测服务共享模型
8.1 预测服务的架构
8.2 客户端和发出请求
8.3 服务器——Web交通控制器
8.4 利用数据库系统持久化存储信息
8.5 案例学习——逻辑回归服务
8.6 总结
第9章 报告和测试——分析型系统迭代
9.1 利用诊断检查模型的健康度
9.2 通过A/B测试对模型进行迭代
9.3 沟通指南
9.4 总结
预测分析:Python语言实现是2017年由机械工业出版社华章分社出版,作者[美]约瑟夫·巴布科克。
得书感谢您对《预测分析:Python语言实现》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。