精通特征工程

精通特征工程

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

掌握特征工程基本原则和应用,增强机器学习算法效果。

内容简介

本书介绍大量特征工程技术,阐明特征工程的基本原则。主要内容包括:机器学习流程中

的基本概念,数值型数据的基础特征工程,自然文本的特征工程,词频- 逆文档频率,高效的分类变量编码技术,主成分分析,模型堆叠,图像处理,等等。

作者简介

作者爱丽丝·郑(Alice Zheng),亚马逊广告平台建模和优化团队负责人,应用机器学习、生成算法和平台开发领域的技术领导者,前微软研究院机器学习研究员。

章节目录

版权信息

版权声明

O'Reilly Media, Inc. 介绍

业界评论

前言

简介

排版约定

使用示例代码

O'Reilly Safari

联系我们

致谢

电子书

第1章 机器学习流程

1.1 数据

1.2 任务

1.3 模型

1.4 特征

1.5 模型评价

第2章 简单而又奇妙的数值

2.1 标量、向量和空间

2.2 处理计数

2.3 对数变换

2.4 特征缩放/归一化

2.5 交互特征

2.6 特征选择

2.7 小结

2.8 参考文献

第3章 文本数据:扁平化、过滤和分块

3.1 元素袋:将自然文本转换为扁平向量

3.2 使用过滤获取清洁特征

3.3 意义的单位:从单词、n元词到短语

3.4 小结

3.5 参考文献

第4章 特征缩放的效果:从词袋到 tf-idf

4.1 tf-idf:词袋的一种简单扩展

4.2 tf-idf方法测试

4.3 深入研究:发生了什么

4.4 小结

4.5 参考文献

第5章 分类变量:自动化时代的数据计数

5.1 分类变量的编码

5.2 处理大型分类变量

5.3 小结

5.4 参考文献

第6章 数据降维:使用PCA挤压数据

6.1 直观理解

6.2 数学推导

6.3 PCA实战

6.4 白化与ZCA

6.5 PCA的局限性与注意事项

6.6 用例

6.7 小结

6.8 参考文献

第7章 非线性特征化与k-均值模型堆叠

7.1 k-均值聚类

7.2 使用聚类进行曲面拼接

7.3 用于分类问题的k-均值特征化

7.4 优点、缺点以及陷阱

7.5 小结

7.6 参考文献

第8章 自动特征生成:图像特征提取和深度学习

8.1 最简单的图像特征(以及它们因何失效)

8.2 人工特征提取:SIFT和HOG

8.3 通过深度神经网络学习图像特征

8.4 小结

8.5 参考文献

第9章 回到特征:建立学术论文推荐器

9.1 基于项目的协同过滤

9.2 第一关:数据导入、清理和特征解析

9.3 第二关:更多特征工程和更智能的模型

9.4 第三关:更多特征=更多信息

9.5 小结

9.6 参考文献

附录 A 线性建模与线性代数基础

A.1 线性分类概述

A.2 矩阵的解析

A.3 线性系统求解

A.4 参考文献

作者简介

封面简介

看完了

精通特征工程是2019年由人民邮电出版社出版,作者[美]爱丽丝•郑。

得书感谢您对《精通特征工程》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。