Python机器学习基础教程

Python机器学习基础教程

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

机器学习入门书,以Python语言介绍。

内容简介

本书主要内容包括:机器学习的基本概念及其应用;实践中最常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的高级方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。

作者简介

作者Andreas C.Müller,scikit-learn库维护者和核心贡献者。现任哥伦比亚大学数据科学研究院讲师,曾任纽约大学数据科学中心助理研究员、亚马逊公司计算机视觉应用的机器学习研究员。在波恩大学获得机器学习博士学位。

章节目录

版权信息

O'Reilly Media, Inc. 介绍

前言

第1章 引言

1.1 为何选择机器学习

1.2 为何选择Python

1.3 scikit-learn

1.4 必要的库和工具

1.5 Python 2与Python 3的对比

1.6 本书用到的版本

1.7 第一个应用:鸢尾花分类

1.8 小结与展望

第2章 监督学习

2.1 分类与回归

2.2 泛化、过拟合与欠拟合

2.3 监督学习算法

2.4 分类器的不确定度估计

2.5 小结与展望

第3章 无监督学习与预处理

3.1 无监督学习的类型

3.2 无监督学习的挑战

3.3 预处理与缩放

3.4 降维、特征提取与流形学习

3.5 聚类

3.6 小结与展望

第4章 数据表示与特征工程

4.1 分类变量

4.2 分箱、离散化、线性模型与树

4.3 交互特征与多项式特征

4.4 单变量非线性变换

4.5 自动化特征选择

4.6 利用专家知识

4.7 小结与展望

第5章 模型评估与改进

5.1 交叉验证

5.2 网格搜索

5.3 评估指标与评分

5.4 小结与展望

第6章 算法链与管道

6.1 用预处理进行参数选择

6.2 构建管道

6.3 在网格搜索中使用管道

6.4 通用的管道接口

6.5 网格搜索预处理步骤与模型参数

6.6 网格搜索选择使用哪个模型

6.7 小结与展望

第7章 处理文本数据

7.1 用字符串表示的数据类型

7.2 示例应用:电影评论的情感分析

7.3 将文本数据表示为词袋

7.4 停用词

7.5 用tf-idf缩放数据

7.6 研究模型系数

7.7 多个单词的词袋(n元分词)

7.8 高级分词、词干提取与词形还原

7.9 主题建模与文档聚类

7.10 小结与展望

第8章 全书总结

8.1 处理机器学习问题

8.2 从原型到生产

8.3 测试生产系统

8.4 构建你自己的估计器

8.5 下一步怎么走

8.6 总结

关于作者

关于封面

Python机器学习基础教程是2018年由人民邮电出版社出版,作者[德]安德里亚斯·穆勒(AndreasC.Müller)。

得书感谢您对《Python机器学习基础教程》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。