类似推荐
编辑推荐
使机器学习算法通过Python实现真正“落地”的书,侧重于介绍如何在Python环境下使用机器学习方法库,助你夯实基础。
内容简介
本书介绍了数据科学领域常用的所有重要机器学习算法以及TensorFlow和特征工程等相关内容。涵盖的算法包括线性回归、逻辑回归、支持向量机、朴素贝叶斯、k均值、随机森林等,这些算法可以用于监督学习、非监督学习、强化学习或半监督学习。
在本书中,你将学会如何使用这些算法来解决所遇到的问题,并了解这些算法的工作方式。本书还将介绍自然语言处理和推荐系统,这些内容将帮助大家进行多种算法的实践。
作者简介
作者朱塞佩·博纳科尔索,一家大型跨国公司的数据科学主管。他拥有意大利卡塔尼亚大学电子工程专业工程学硕士学位,然后在意大利罗马第二大学、英国埃塞克斯大学深造过。在他的职业生涯中,担任过公共管理、军事、公用事业、医疗保健、诊断和广告等多个业务领域的IT工程师,使用Java、Python、Hadoop、Spark、Theano和TensorFlow等多种技术进行过项目开发与管理。他的主要研究兴趣包括人工智能、机器学习、深度学习、强化学习、数据科学等。
章节目录
版权信息
译者序
前言
第1章 机器学习简介
1.1 简介——经典机器和自适应的机器
1.1.1 描述性分析
1.1.2 预测性分析
1.2 关于学习
1.2.1 监督学习
1.2.2 无监督学习
1.2.3 半监督学习
1.2.4 强化学习
1.2.5 计算神经科学
1.3 超越机器学习——深度学习和基于生物启发的适应系统
1.4 机器学习和大数据
1.5 本章小结
第2章 机器学习的重要元素
2.1 数据格式
2.2 可学习性
2.2.1 欠拟合和过拟合
2.2.2 误差度量和成本函数
2.2.3 PAC学习
2.3 统计学习方法介绍
2.3.1 最大后验概率学习
2.3.2 最大似然学习
2.4 类平衡
2.4.1 可置换的重采样
2.4.2 合成少数类过采样
2.5 信息论的要素
2.5.1 熵
2.5.2 交叉熵和互信息
2.5.3 两个概率分布的散度
2.6 本章小结
第3章 特征选择与特征工程
3.1 scikit-learn的toy数据集
3.2 创建训练集和测试集
3.3 管理分类数据
3.4 管理缺失特征
3.5 数据缩放和归一化
3.6 特征选择和过滤
3.7 主成分分析
3.7.1 非负矩阵分解
3.7.2 稀疏PCA
3.7.3 核PCA
3.8 独立成分分析
3.9 原子提取和字典学习
3.10 使用t-SNE可视化高维数据集
3.11 本章小结
第4章 回归算法
4.1 线性模型
4.2 一个二维的例子
4.3 基于scikit-learn的线性回归和更高维
4.3.1 决定系数
4.3.2 可解释方差
4.3.3 回归的解析表达
4.4 Ridge回归、Lasso回归和ElasticNet
4.4.1 Ridge回归
4.4.2 Lasso回归
4.4.3 ElasticNet
4.5 稳健回归
4.5.1 随机抽样一致算法
4.5.2 Huber回归
4.6 贝叶斯回归
4.7 多项式回归
4.8 保序回归
4.9 本章小结
第5章 线性分类算法
5.1 线性分类
5.2 逻辑回归
5.3 实现和优化
5.4 随机梯度下降算法
5.5 被动攻击算法
5.6 通过网格搜索找到最优超参数
5.7 评估分类的指标
5.7.1 混淆矩阵
5.7.2 精确率
5.7.3 召回率
5.7.4 F-Beta
5.7.5 Kappa系数
5.7.6 分类报告
5.7.7 学习曲线
5.8 ROC曲线
5.9 本章小结
第6章 朴素贝叶斯和判别分析
6.1 贝叶斯定理
6.2 朴素贝叶斯分类器
6.3 scikit-learn中的朴素贝叶斯
6.3.1 伯努利朴素贝叶斯
6.3.2 多项式朴素贝叶斯
6.3.3 高斯朴素贝叶斯
6.4 判别分析
6.5 本章小结
第7章 支持向量机
7.1 线性支持向量机
7.2 scikit-learn实现
7.3 基于内核的分类
7.3.1 径向基函数
7.3.2 多项式核
7.3.3 Sigmoid核
7.3.4 自定义核
7.3.5 非线性例子
7.4 受控支持向量机
7.5 支持向量回归
7.6 半监督支持向量机简介
7.7 本章小结
第8章 决策树和集成学习
8.1 二元决策树
8.1.1 二元决策
8.1.2 不纯度的衡量
8.1.3 特征重要度
8.2 基于scikit-learn的决策树分类
8.3 决策树回归
8.4 集成学习简介
8.4.1 随机森林
8.4.2 AdaBoost
8.4.3 梯度树提升
8.4.4 投票分类器
8.5 本章小结
第9章 聚类原理
9.1 聚类基础
9.2 k-NN算法
9.3 高斯混合
9.4 k-means
9.5 基于样本标记的评价方法
9.5.1 同质性
9.5.2 完整性
9.5.3 修正兰德指数
9.6 本章小结
第10章 高级聚类
10.1 DBSCAN
10.2 谱聚类
10.3 在线聚类
10.3.1 mini-batch k-means
10.3.2 BIRCH
10.4 双聚类
10.5 本章小结
第11章 层次聚类
11.1 分层策略
11.2 凝聚聚类
11.2.1 树形图
11.2.2 scikit-learn中的凝聚聚类
11.2.3 连接限制
11.3 本章小结
第12章 推荐系统介绍
12.1 朴素的基于用户的系统
12.2 基于内容的系统
12.3 无模式(或基于内存的)协同过滤
12.4 基于模型的协同过滤
12.4.1 奇异值分解策略
12.4.2 交替最小二乘法策略
12.4.3 用Apache Spark MLlib实现交替最小二乘法策略
12.5 本章小结
第13章 自然语言处理简介
13.1 NLTK和内置语料库
13.2 词袋策略
13.2.1 标记
13.2.2 停止词的删除
13.2.3 词干抽取
13.2.4 向量化
13.3 词性
13.4 示例文本分类器
13.5 本章小结
第14章 NLP中的主题建模与情感分析
14.1 主题建模
14.1.1 隐性语义分析
14.1.2 概率隐性语义分析
14.1.3 隐性狄利克雷分配
14.2 使用Gensim的Word2vec简介
14.3 情感分析
14.4 本章小结
第15章 神经网络介绍
15.1 深度学习简介
15.2 基于Keras的MLP
15.3 本章小结
第16章 高级深度学习模型
16.1 深层结构
16.2 基于Keras的深度卷积网络示例
16.3 基于Keras的LSTM网络示例
16.4 TensorFlow简介
16.4.1 梯度计算
16.4.2 逻辑回归
16.4.3 用多层感知器进行分类
16.4.4 图像卷积
16.5 本章小结
第17章 创建机器学习架构
17.1 机器学习框架
17.1.1 数据收集
17.1.2 归一化
17.1.3 降维
17.1.4 数据扩充
17.1.5 数据转换
17.1.6 建模、网格搜索和交叉验证
17.1.7 可视化
17.1.8 GPU支持
17.1.9 分布式架构简介
17.2 用于机器学习架构的scikit-learn工具
17.2.1 管道
17.2.2 特征联合
17.3 本章小结
机器学习算法(原书第2版)是2020年由机械工业出版社华章分社出版,作者[意] 朱塞佩·博纳科尔索。
得书感谢您对《机器学习算法(原书第2版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。