Python数据挖掘入门与实践

Python数据挖掘入门与实践

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

数据挖掘入门读物,带你轻松踏上数据挖掘之旅。

内容简介

介绍数据挖掘的基础知识、基本工具和实践方法,通过循序渐进地讲解算法,带你轻松踏上数据挖掘之旅。采用理论与实践相结合的方式,呈现了如何使用决策树和随机森林算法预测美国职业篮球联赛比赛结果,如何使用亲和性分析方法推荐电影,如何使用朴素贝叶斯算法进行社交媒体挖掘,等等。本书也涉及神经网络、深度学习、大数据处理等内容。本书面向愿意学习和尝试数据挖掘的程序员。

作者简介

作者罗伯特·莱顿,计算机科学博士,网络犯罪问题和文本分析方面的专家。多年来一直热衷于Python编程,参与过scikit-learn库等很多开源库的开发,曾担任2014年度“谷歌编程之夏”项目导师。他曾与全球几大数据挖掘公司密切合作,挖掘真实数据并研发相关应用。他的公司dataPipeline为多个行业提供数据挖掘和数据分析解决方案。

章节目录

版权信息

译者序

前言

本书的阅读前提

本书的目标读者

排版约定

客户支持

下载示例代码

下载配套PDF文件

勘误表

侵权

问题

第1章 开始数据挖掘之旅

1.1 数据挖掘简介

1.2 使用Python和IPython Notebook

1.3 亲和性分析示例

1.4 分类问题的简单示例

1.5 什么是分类

1.6 小结

第2章 用scikit-learn估计器分类

2.1 scikit-learn估计器

2.2 流水线在预处理中的应用

2.3 流水线

2.4 小结

第3章 用决策树预测获胜球队

3.1 加载数据集

3.2 决策树

3.3 NBA比赛结果预测

3.4 随机森林

3.5 小结

第4章 用亲和性分析方法推荐电影

4.1 亲和性分析

4.2 电影推荐问题

4.3 Apriori算法的实现

4.4 抽取关联规则

4.5 小结

第5章 用转换器抽取特征

5.1 特征抽取

5.2 特征选择

5.3 创建特征

5.4 创建自己的转换器

5.5 小结

第6章 使用朴素贝叶斯进行社会媒体挖掘

6.1 消歧

6.2 文本转换器

6.3 朴素贝叶斯

6.4 应用

6.5 小结

第7章 用图挖掘找到感兴趣的人

7.1 加载数据集

7.2 寻找子图

7.3 小结

第8章 用神经网络破解验证码

8.1 人工神经网络

8.2 创建数据集

8.3 训练和分类

8.4 用词典提升正确率

8.5 小结

第9章 作者归属问题

9.1 为作品找作者

9.2 功能词

9.3 支持向量机

9.4 字符N元语法

9.5 使用安然公司数据集

9.6 小结

第10章 新闻语料分类

10.1 获取新闻文章

10.2 从任意网站抽取文本

10.3 新闻语料聚类

10.4 聚类融合

10.5 线上学习

10.6 小结

第11章 用深度学习方法为图像中的物体进行分类

11.1 物体分类

11.2 应用场景和目标

11.3 深度神经网络

11.4 GPU优化

11.5 环境搭建

11.6 应用

11.7 小结

第12章 大数据处理

12.1 大数据

12.2 大数据应用场景和目标

12.3 MapReduce

12.4 应用

12.5 小结

附录 接下来的方向

第1章——开始数据挖掘之旅

第2章——用scikit-learn估计器分类

第3章——用决策树预测获胜球队

第4章——用亲和性分析方法推荐电影

第5章——用转换器抽取特征

第6章——使用朴素贝叶斯进行社会媒体挖掘

第7章——用图挖掘找到感兴趣的人

第8章——用神经网络破解验证码

第9章——作者归属问题

第10章——新闻语料分类

第11章——用深度学习方法为图像中的物体进行分类

第12章——大数据处理

看完了

Python数据挖掘入门与实践是2016年由人民邮电出版社·图灵出品出版,作者[澳]罗伯特·莱顿。

得书感谢您对《Python数据挖掘入门与实践》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。