机器学习算法(原书第2版)

机器学习算法(原书第2版)

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

使机器学习算法通过Python实现真正“落地”的书,侧重于介绍如何在Python环境下使用机器学习方法库,助你夯实基础。

内容简介

本书介绍了数据科学领域常用的所有重要机器学习算法以及TensorFlow和特征工程等相关内容。涵盖的算法包括线性回归、逻辑回归、支持向量机、朴素贝叶斯、k均值、随机森林等,这些算法可以用于监督学习、非监督学习、强化学习或半监督学习。

在本书中,你将学会如何使用这些算法来解决所遇到的问题,并了解这些算法的工作方式。本书还将介绍自然语言处理和推荐系统,这些内容将帮助大家进行多种算法的实践。

作者简介

作者朱塞佩·博纳科尔索,一家大型跨国公司的数据科学主管。他拥有意大利卡塔尼亚大学电子工程专业工程学硕士学位,然后在意大利罗马第二大学、英国埃塞克斯大学深造过。在他的职业生涯中,担任过公共管理、军事、公用事业、医疗保健、诊断和广告等多个业务领域的IT工程师,使用Java、Python、Hadoop、Spark、Theano和TensorFlow等多种技术进行过项目开发与管理。他的主要研究兴趣包括人工智能、机器学习、深度学习、强化学习、数据科学等。

章节目录

版权信息

译者序

前言

第1章 机器学习简介

1.1 简介——经典机器和自适应的机器

1.1.1 描述性分析

1.1.2 预测性分析

1.2 关于学习

1.2.1 监督学习

1.2.2 无监督学习

1.2.3 半监督学习

1.2.4 强化学习

1.2.5 计算神经科学

1.3 超越机器学习——深度学习和基于生物启发的适应系统

1.4 机器学习和大数据

1.5 本章小结

第2章 机器学习的重要元素

2.1 数据格式

2.2 可学习性

2.2.1 欠拟合和过拟合

2.2.2 误差度量和成本函数

2.2.3 PAC学习

2.3 统计学习方法介绍

2.3.1 最大后验概率学习

2.3.2 最大似然学习

2.4 类平衡

2.4.1 可置换的重采样

2.4.2 合成少数类过采样

2.5 信息论的要素

2.5.1 熵

2.5.2 交叉熵和互信息

2.5.3 两个概率分布的散度

2.6 本章小结

第3章 特征选择与特征工程

3.1 scikit-learn的toy数据集

3.2 创建训练集和测试集

3.3 管理分类数据

3.4 管理缺失特征

3.5 数据缩放和归一化

3.6 特征选择和过滤

3.7 主成分分析

3.7.1 非负矩阵分解

3.7.2 稀疏PCA

3.7.3 核PCA

3.8 独立成分分析

3.9 原子提取和字典学习

3.10 使用t-SNE可视化高维数据集

3.11 本章小结

第4章 回归算法

4.1 线性模型

4.2 一个二维的例子

4.3 基于scikit-learn的线性回归和更高维

4.3.1 决定系数

4.3.2 可解释方差

4.3.3 回归的解析表达

4.4 Ridge回归、Lasso回归和ElasticNet

4.4.1 Ridge回归

4.4.2 Lasso回归

4.4.3 ElasticNet

4.5 稳健回归

4.5.1 随机抽样一致算法

4.5.2 Huber回归

4.6 贝叶斯回归

4.7 多项式回归

4.8 保序回归

4.9 本章小结

第5章 线性分类算法

5.1 线性分类

5.2 逻辑回归

5.3 实现和优化

5.4 随机梯度下降算法

5.5 被动攻击算法

5.6 通过网格搜索找到最优超参数

5.7 评估分类的指标

5.7.1 混淆矩阵

5.7.2 精确率

5.7.3 召回率

5.7.4 F-Beta

5.7.5 Kappa系数

5.7.6 分类报告

5.7.7 学习曲线

5.8 ROC曲线

5.9 本章小结

第6章 朴素贝叶斯和判别分析

6.1 贝叶斯定理

6.2 朴素贝叶斯分类器

6.3 scikit-learn中的朴素贝叶斯

6.3.1 伯努利朴素贝叶斯

6.3.2 多项式朴素贝叶斯

6.3.3 高斯朴素贝叶斯

6.4 判别分析

6.5 本章小结

第7章 支持向量机

7.1 线性支持向量机

7.2 scikit-learn实现

7.3 基于内核的分类

7.3.1 径向基函数

7.3.2 多项式核

7.3.3 Sigmoid核

7.3.4 自定义核

7.3.5 非线性例子

7.4 受控支持向量机

7.5 支持向量回归

7.6 半监督支持向量机简介

7.7 本章小结

第8章 决策树和集成学习

8.1 二元决策树

8.1.1 二元决策

8.1.2 不纯度的衡量

8.1.3 特征重要度

8.2 基于scikit-learn的决策树分类

8.3 决策树回归

8.4 集成学习简介

8.4.1 随机森林

8.4.2 AdaBoost

8.4.3 梯度树提升

8.4.4 投票分类器

8.5 本章小结

第9章 聚类原理

9.1 聚类基础

9.2 k-NN算法

9.3 高斯混合

9.4 k-means

9.5 基于样本标记的评价方法

9.5.1 同质性

9.5.2 完整性

9.5.3 修正兰德指数

9.6 本章小结

第10章 高级聚类

10.1 DBSCAN

10.2 谱聚类

10.3 在线聚类

10.3.1 mini-batch k-means

10.3.2 BIRCH

10.4 双聚类

10.5 本章小结

第11章 层次聚类

11.1 分层策略

11.2 凝聚聚类

11.2.1 树形图

11.2.2 scikit-learn中的凝聚聚类

11.2.3 连接限制

11.3 本章小结

第12章 推荐系统介绍

12.1 朴素的基于用户的系统

12.2 基于内容的系统

12.3 无模式(或基于内存的)协同过滤

12.4 基于模型的协同过滤

12.4.1 奇异值分解策略

12.4.2 交替最小二乘法策略

12.4.3 用Apache Spark MLlib实现交替最小二乘法策略

12.5 本章小结

第13章 自然语言处理简介

13.1 NLTK和内置语料库

13.2 词袋策略

13.2.1 标记

13.2.2 停止词的删除

13.2.3 词干抽取

13.2.4 向量化

13.3 词性

13.4 示例文本分类器

13.5 本章小结

第14章 NLP中的主题建模与情感分析

14.1 主题建模

14.1.1 隐性语义分析

14.1.2 概率隐性语义分析

14.1.3 隐性狄利克雷分配

14.2 使用Gensim的Word2vec简介

14.3 情感分析

14.4 本章小结

第15章 神经网络介绍

15.1 深度学习简介

15.2 基于Keras的MLP

15.3 本章小结

第16章 高级深度学习模型

16.1 深层结构

16.2 基于Keras的深度卷积网络示例

16.3 基于Keras的LSTM网络示例

16.4 TensorFlow简介

16.4.1 梯度计算

16.4.2 逻辑回归

16.4.3 用多层感知器进行分类

16.4.4 图像卷积

16.5 本章小结

第17章 创建机器学习架构

17.1 机器学习框架

17.1.1 数据收集

17.1.2 归一化

17.1.3 降维

17.1.4 数据扩充

17.1.5 数据转换

17.1.6 建模、网格搜索和交叉验证

17.1.7 可视化

17.1.8 GPU支持

17.1.9 分布式架构简介

17.2 用于机器学习架构的scikit-learn工具

17.2.1 管道

17.2.2 特征联合

17.3 本章小结

机器学习算法(原书第2版)是2020年由机械工业出版社华章分社出版,作者[意] 朱塞佩·博纳科尔索。

得书感谢您对《机器学习算法(原书第2版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
机器学习 电子书
机器学习基础与高级内容全面讲解,实例丰富,易于学习巩固。
机器学习案例实战(第2版) 电子书
机器学习已经广泛地应用于各行各业,深度学习的兴起再次推动了人工智能的热潮。本书结合项目实践,首先讨论了主流机器学习平台的主要特点以及机器学习的实战难点。在此基础上,利用主流的机器学习开源平台TensorFlow、OpenVINO、PaddlePaddle等,通过17个实战案例,详细地分析了决策树、随机森林、支持向量机、逻辑回归、贝叶斯网络、聚类、卷积神经网络、循环神经网络、生成对抗网络等机器学习和
机器学习公式详解(第2版) 电子书
周志华老师的《机器学习》(俗称“西瓜书”)是机器学习领域的经典入门教材之一。本书是《机器学习公式详解》(俗称“南瓜书”)的第2版。相较于第1版,本书对“西瓜书”中除了公式以外的重、难点内容加以解析,以过来人视角给出学习建议,旨在对比较难理解的公式和重点内容扩充具体的例子说明,以及对跳步过大的公式补充具体的推导细节。全书共16章,与“西瓜书”章节、公式对应,每个公式的推导和解释都以本科数学基础的视角
机器学习实战 电子书
《机器学习实战》面向日常任务的高效实战内容,介绍并实现机器学习的主流算法。
Python机器学习 电子书
《Python机器学习》从实用的角度出发,整合Python语言基础、数据分析与可视化、机器学习常用算法等知识。内容从*基本的Python编程基础入手,由浅入深、循序渐进地讲授NumPy库和Matplotlib库,以及复杂的机器学习基本理论和算法,并突出知识的实用性和可操作性。《Python机器学习》力求以浅显的语言讲解复杂的知识,以直观的案例辅助读者理解,并以图表形式展示代码和运行结果,配合习题巩