Python数据科学与机器学习:从入门到实践

Python数据科学与机器学习:从入门到实践

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

寓复杂问题于简单实践,轻松掌握Python数据分析和机器学习技能。

内容简介

本书深入讨论数据挖掘与人工智能相关的60多个主题,介绍了使用Python进行数据分析和高效的机器学习,首先从一节Python速成课开始,然后回顾统计学和概率论的基础知识,接着深入讨论与数据挖掘和机器学习相关的60多个主题,包括贝叶斯定理、聚类、决策树、回归分析、实验设计等。

提供三大实战案例:使用真实的电影评分数据创建一个电影推荐系统;创建一个能实际运行的维基百科数据搜索引擎;创建一个垃圾邮件分类器,可以对邮件账户中的垃圾邮件和正常邮件进行正确的分类。

本书涵盖准备分析数据、训练机器学习模型和可视化分析结果等主题,有助你提高使用Python高效地进行数据分析和机器学习的能力,并建立信心以更好地分析自己的机器学习模型。

作者简介

作者Frank Kane,Sundog Software公司创始人,曾在Amazon和IMDb工作近9年,在分布式计算、数据挖掘和机器学习等领域持有17项专利。 【译者简介】 陈光欣,毕业于清华大学并留校工作,主要兴趣为数据分析与数据挖掘。

章节目录

版权信息

前言

目标读者

排版约定

读者反馈

客户支持

勘误

举报盗版

问题

电子书

第1章 入门

1.1 安装Enthought Canopy

1.2 使用并理解IPython/Jupyter Notebook

1.3 Python基础——第一部分

1.4 理解Python代码

1.5 导入模块

1.6 Python基础——第二部分

1.7 运行Python脚本

1.8 小结

第2章 统计与概率复习以及Python实现

2.1 数据类型

2.2 均值、中位数和众数

2.3 在Python中使用均值、中位数和众数

2.4 标准差和方差

2.5 概率密度函数和概率质量函数

2.6 各种类型的数据分布

2.7 百分位数和矩

2.8 小结

第3章 Matplotlib与概率高级概念

3.1 Matplotlib快速学习

3.2 协方差与相关系数

3.3 条件概率

3.4 贝叶斯定理

3.5 小结

第4章 预测模型

4.1 线性回归

4.2 多项式回归

4.3 多元回归和汽车价格预测

4.4 多水平模型

4.5 小结

第5章 使用Python进行机器学习

5.1 机器学习及训练/测试法

5.2 使用训练/测试法防止多项式回归中的过拟合

5.3 贝叶斯方法——概念

5.4 使用朴素贝叶斯实现垃圾邮件分类器

5.5 均值聚类

5.6 基于收入与年龄进行人群聚类

5.7 熵的度量

5.8 决策树——概念

5.9 决策树——使用Python预测录用决策

5.10 集成学习

5.11 支持向量机简介

5.12 使用scikit-learn通过SVM进行人员聚集

5.13 小结

第6章 推荐系统

6.1 什么是推荐系统

6.2 基于项目的协同过滤

6.3 基于项目的协同过滤是如何工作的

6.4 找出电影相似度

6.5 改善电影相似度结果

6.6 向人们推荐电影

6.7 改善推荐结果

6.8 小结

第7章 更多数据挖掘和机器学习技术

7.1 最近邻的概念

7.2 使用KNN预测电影评分

7.3 数据降维与主成分分析

7.4 对鸢尾花数据集的PCA示例

7.5 数据仓库简介

7.6 强化学习

7.7 小结

第8章 处理真实数据

8.1 偏差-方差权衡

8.2 使用折交叉验证避免过拟合

8.3 数据清理和标准化

8.4 清理Web日志数据

8.5 数值型数据的标准化

8.6 检测异常值

8.7 小结

第9章 Apache Spark——大数据上的机器学习

9.1 安装Spark

9.2 Spark简介

9.3 Spark和弹性分布式数据集

9.4 MLlib简介

9.5 在Spark中使用MLlib实现决策树

9.6 在Spark中实现均值聚类

9.7 TF-IDF

9.8 使用Spark MLlib搜索维基百科

9.9 使用Spark 2.0中的MLlib数据框API

9.10 小结

第10章 测试与实验设计

10.1 A/B测试的概念

10.2 检验与值

10.3 使用Python计算统计量和值

10.4 确定实验持续时间

10.5 A/B测试中的陷阱

10.6 小结

看完了

Python数据科学与机器学习:从入门到实践是2019年由人民邮电出版社·图灵出品出版,作者[美] Frank Kane。

得书感谢您对《Python数据科学与机器学习:从入门到实践》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Python数据分析从入门到精通 电子书
本书循序渐进的讲解了Python数据分析技术的核心内容,并通过实例的实现过程演练了各个知识点的具体使用流程。分别讲解了处理特殊格式文件,使用数据库保存数据,操作处理CSV文件,操作处理JSON数据,处理网络数据,使用matplotlib实现数据可视化处理,使用pygal库实现数据可视化处理,使用正则表达式匹配数据,使用Pandas库分离和提取数据,爬取网页数据,抓取知乎数据并实现可视化图表分析,获
Python期货量化交易:从入门到实践 电子书
本书是介绍Python编程及其在量化交易领域的实践技巧的图书,旨在帮助读者掌握基本的Python编程技能,并顺利应用于期货量化交易实践。
Python从入门到精通 电子书
一本Python零基础入门的实战教程。
Python机器学习 电子书
《Python机器学习》从实用的角度出发,整合Python语言基础、数据分析与可视化、机器学习常用算法等知识。内容从*基本的Python编程基础入手,由浅入深、循序渐进地讲授NumPy库和Matplotlib库,以及复杂的机器学习基本理论和算法,并突出知识的实用性和可操作性。《Python机器学习》力求以浅显的语言讲解复杂的知识,以直观的案例辅助读者理解,并以图表形式展示代码和运行结果,配合习题巩
Python与R语言数据科学实践 电子书
J.
本书从数据科学的角度,讲解了Python和R的语言特性以及各自的优缺点,介绍了包括包、框架和工作流在内的开源生态系统,分析了Python和R分别适用于哪些业务场景,并通过真实的案例演示如何在单个工作流中集成Python与R,使两种语言充分发挥优势,改善业务应用的效果。本书还提供了Python和R的对照翻译,帮助读者在两种语言间快速切换。本书适合数据科学领域有一定Python或R基础的开发人员阅读,