现代决策树模型及其编程实践:从传统决策树到深度决策树

现代决策树模型及其编程实践:从传统决策树到深度决策树

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书通过原理解析、应用示例和完整的代码实现详细讲解决策树算法。

内容简介

决策树是数据分析中广泛使用的机器学习模型,其模型简单、算法快速且具有可解释性。但随着大数据的涌现,将决策树真正应用到实践中还面临诸多困难。本书正是为解决这一痛点而作,旨在帮助读者系统且全面地了解决策树,并成功地将其用于工程实践。

作者简介

编著者黄智濒,计算机系统结构博士,北京邮电大学计算机学院讲师。长期从事机器学习、超大规模并行计算、GPU加速计算以及三维计算机视觉和深度学习架构方面的研究。曾经在中国航天空气动力技术研究院、联想集团工作过。

章节目录

版权信息

作者简介

赞誉

推荐序一

推荐序二

推荐序三

前言

第1章 决策树与人工智能

1.1 决策与智能

1.2 决策树算法的起源

1.3 决策树的核心术语

1.4 决策树的可解释性

1.5 作为决策分析工具的决策树

1.5.1 决策分析

1.5.2 基于决策分析流程的决策树

1.6 作为机器学习算法的决策树

1.6.1 机器学习算法的类型

1.6.2 基于数据的决策树

1.6.3 决策树算法面临的基本问题

1.6.4 基于规则的机器学习

1.7 作为特征学习与决策融合的决策树

1.8 参考文献

第2章 经典决策树算法

2.1 经典决策树应用的一般流程

2.1.1 缺失值的处理

2.1.2 连续数值属性的离散化处理

2.2 CART算法

2.2.1 基尼不纯度、基尼增益与基尼指数

2.2.2 CART分类决策树的原理

2.2.3 CART分类决策树的编程实践

2.2.4 回归问题与回归算法

2.2.5 CART回归决策树的特征和分割点选择准则

2.2.6 CART回归决策树的原理

2.2.7 CART回归决策树的编程实践

2.3 ID3算法

2.3.1 信息熵与信息增益

2.3.2 ID3算法示例

2.3.3 ID3算法的编程实践

2.4 C4.5算法

2.4.1 信息增益率

2.4.2 连续属性的处理

2.4.3 缺失值的处理

2.4.4 基于C4.5算法处理连续属性生成分类决策树的示例

2.4.5 C4.5算法的后续改进——C5.0算法

2.5 决策树的评估

2.6 决策树的5种可视化方法

2.7 小结

2.8 参考文献

第3章 决策树的剪枝

3.1 代价复杂度剪枝

3.1.1 CCP算法的基本原理

3.1.2 CCP算法的编程实践

3.1.3 基于sklearn的CCP示例

3.2 错误率降低剪枝

3.2.1 REP算法的基本原理

3.2.2 REP算法的编程实践

3.3 悲观错误剪枝

3.3.1 PEP算法的基本原理

3.3.2 PEP算法的编程实践

3.4 最小错误剪枝

3.4.1 MEP算法的基本原理

3.4.2 MEP算法的编程实践

3.5 其他决策树剪枝算法简介

3.6 小结

3.7 参考文献

第4章 随机森林

4.1 随机森林的基本原理

4.1.1 构造随机森林的步骤

4.1.2 随机森林的简单示例

4.1.3 基于sklearn的随机森林编程示例

4.1.4 选择最优的随机特征属性数量

4.2 套袋法

4.2.1 套袋法的算法流程

4.2.2 套袋法的偏差和方差

4.2.3 套袋法的优缺点

4.3 随机森林的参数设置与调优

4.3.1 sklearn随机森林的参数

4.3.2 调参示例

4.3.3 OOB错误率与交叉验证

4.4 随机森林的优缺点

4.5 使用随机森林进行特征属性的重要性区分的示例

4.5.1 基于基尼指数的特征属性重要性评估

4.5.2 基于袋外数据错误率的特征属性重要性评估

4.6 使用随机森林进行无监督聚类的示例

4.7 使用随机森林进行回归分析的示例

4.8 随机森林与核方法的结合

4.9 小结

4.10 参考文献

第5章 集成学习方法

5.1 提升法

5.1.1 AdaBoost算法原理

5.1.2 AdaBoost算法实现

5.1.3 AdaBoost算法的编程实践——基于sklearn解决分类问题

5.1.4 AdaBoost算法的编程实践——基于sklearn解决回归问题

5.1.5 提升法的分类、优点和挑战

5.2 梯度提升法

5.2.1 梯度提升法的原理和示例

5.2.2 梯度提升决策树

5.2.3 梯度提升分类决策树

5.2.4 梯度提升回归决策树

5.2.5 随机梯度提升树

5.2.6 基于梯度提升法的机器学习库

5.3 堆叠法

5.3.1 简单的二阶段堆叠算法

5.3.2 基于K折交叉验证的二阶段堆叠法

5.3.3 基于sklearn的K折交叉验证的二阶段堆叠法的编程实践

5.3.4 多阶段堆叠模型

5.4 套袋法、提升法、堆叠法的比较

5.5 小结

5.6 参考文献

第6章 并行决策树

6.1 随机森林的并行化

6.2 XGBoost基础

6.2.1 XGBoost核心原理

6.2.2 XGBoost系统设计及其并行化加速

6.2.3 XGBoost编程基础

6.2.4 XGBoost回归问题编程

6.2.5 XGBoost分类问题编程

6.2.6 XGBoost随机森林编程

6.2.7 XGBoost特征筛选编程

6.2.8 XGBoost与传统提升树的比较

6.2.9 XGBoost的缺点

6.3 LightGBM基础

6.3.1 LightGBM核心原理

6.3.2 LightGBM系统设计及其并行化加速

6.3.3 LigthGBM编程基础

6.3.4 LightGBM与sklearn结合的示例

6.3.5 LightGBM回归问题编程

6.3.6 LightGBM分类问题编程

6.3.7 LightGBM的优缺点

6.4 CatBoost基础

6.4.1 CatBoost核心原理

6.4.2 CatBoost系统设计及其并行化加速

6.4.3 CatBoost编程基础

6.4.4 CatBoost分类问题编程(不带分类特征属性)

6.4.5 CatBoost回归问题编程(不带分类特征属性)

6.4.6 CatBoost回归问题编程(带分类特征属性)

6.4.7 CatBoost的优缺点

6.4.8 XGBoost、LightGBM、CatBoost的比较

6.5 NGBoost简介

6.6 小结

6.7 参考文献

第7章 蚁群决策树

7.1 蚁群元启发式算法

7.1.1 典型蚁群算法

7.1.2 MMAS算法

7.1.3 ACS算法

7.2 基于蚁群的分类规则提取

7.2.1 Ant-Miner规则提取方法

7.2.2 Ant-Miner算法实现

7.2.3 Ant-Miner算法的早期变种

7.2.4 MYRA——开源实现

7.2.5 Ant-MinerMA+G算法

7.2.6 AMclr算法

7.3 蚁群决策树的算法原理

7.3.1 Ant-Tree-Miner决策树生成算法

7.3.2 ACDT算法

7.4 自适应蚁群决策森林

7.4.1 自适应ACDF算法

7.4.2 ACDF算法中的长期提升

7.5 小结

7.6 参考文献

第8章 深度决策树

8.1 深度森林

8.1.1 gcForest的基本原理

8.1.2 gcForest的编程实践

8.1.3 DF21开源库

8.1.4 改进的深度森林模型

8.2 深度神经决策树

8.2.1 DNDT的基本原理

8.2.2 DNDT的编程实践

8.3 自适应神经决策树

8.3.1 ANT的基本原理

8.3.2 ANT的编程实践

8.4 神经支持决策树

8.4.1 NBDT的基本原理

8.4.2 NBDT的编程实践

8.5 深度神经决策森林

8.5.1 dNDF的基本原理

8.5.2 dNDF模型的优缺点

8.5.3 dNDF的编程实践

8.6 小结

8.7 参考文献

现代决策树模型及其编程实践:从传统决策树到深度决策树是2022年由机械工业出版社出版,作者黄智濒 编著。

得书感谢您对《现代决策树模型及其编程实践:从传统决策树到深度决策树》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
智能风控实践指南:从模型、特征到决策 电子书
一本金融智能风控算法应用教程书。
Wireshark网络分析从入门到实践 电子书
1.这是一本好用的工具书 对于对于网络运维人员、网络安全人员,WireShark是非常好的网络分析工具,这本优秀的基础工具书正是目前大家需要的。本书内容由浅入深,案例环环相扣,同时配备完整的代码资源,适合读者边学边练,从实践中夯实基础,掌握实践技能。 2.带读者体验身临其境的网络分析 本书系统地将WireShark与虚拟网络环境(ENSP)相结合,将WireShark的应用提升到真正实践的层面,可以帮助那些无法拥有真实网络设备的读者建立虚拟环境,从而降低学习者的门槛。除此之外,本书还采用Lua语言,扩展了Wireshark的功能。 3.这是一本经得起实践考验的教程 除此之外,本书的作者是拥有丰富经验高校教师,多年来培育了大量的网络安全方向工作人员,拥有多年的网络安全一线教学与实践经验,让你读书犹如老师在身边一对一地讲解。
深度学习原理与实践 电子书
(1)大量图例,简单易懂。作者亲自绘制了大量插图,力求还原深度学习的算法思想,分解和剖析晦涩的算法,用图例来表示复杂的问题。生动的图例也能给读者带来阅读乐趣,快乐地学习算法知识,体会深度学习的算法本质。 (2)简化公式,生动比喻。深度学习和机器学习类的书中通常会有大量复杂冗长的算法公式,为了避免出现读者读不懂的情况,本书尽可能地统一了公式和符号,简化相关公式,并加以生动的比喻进行解析。在启发读者的同时,锻炼读者分析问题和解决问题的能力。 (3)算法原理,代码实现。在介绍深度学习及相关算法的原理时,不仅给出了对应的公式,还给出了实现和求解公式的代码,让读者明确该算法的作用、输入和输出。原理与代码相结合,使得读者对深度学习的算法实现更加具有亲切感。 (4)深入浅出,精心剖析。理解深度学习需要一定的机器学习知识,本书在D1章介绍了深度学习与机器学习的关系,并简要介绍了机器学习的内容。在内容安排上,每章依次介绍模型框架的应用场景、结构和使用方式,最后通过真实的案例去全面分析该模型结构。目的是让读者可以抓住深度学习的本质。 (5)入门实践,案例重现。每一章最后的真实案例不是直接堆砌代码,而是讲解使用该算法模型的原因和好处。从简单的背景知识出发,使用前文讲解过的深度学习知识实现一个实际的工程项目。实践可以用于及时检验读者对所学知识的掌握程度,为读者奠定深度学习的实践基础。 将一本技术书籍写得通俗易懂谈何容易,但《深度学习原理与实践》这本书确实做到了。书中对近年来火热的深度学习理论知识进行简单剖析,化繁为简,没有局限于坐而论道,而是将实例和数学理论相结合,让读者能够快速理解各种模型并上手实践,值得细读。 --唐春明 广州大学数学与信息学科学院副院长 本书从原理、方法、实践这 3 个维度系统地介绍了深度学习的方方面面,内容详实,解读清晰,细节与全貌兼顾,既适合初学者阅读,也可以作为深入研究的参考用书。 --杨刚 西安电子科技大学教授 近年来出版的深度学习相关图书中,本书是我见过非常有指导意义的中文书籍之一。本书对 ANN、CNN、RNN 等模型进行深入浅出的介绍,引入大量图例和简化后的公式,让算法浅显易懂。每一章的实践内容都给人惊喜,强烈推荐! --吴健之 腾讯音乐高级工程师 作为产品经理,我能看懂的深度学习书籍实在太少了。本书恰到好处,插图丰富直观,数学公式简练,很喜欢此类风格的图书,易懂好学。即使你不是程序员或算法专家,该书也值得一看! --张瑞 中软国际高级产品经理
深度学习原理与 TensorFlow实践 电子书
本书介绍了深度学习原理与TensorFlow实践。着重讲述了当前学术界和工业界的深度学习核心知识:机器学习概论、神经网络、深度学习。着重讲述了深度学习的实现以及深度学习框架TensorFlow:Python编程基础、TensorFlow编程基础、TensorFlow模型、TensorFlow编程实践、TensorFlowLite和TensorFlow.js、TensorFlow案例--医学应用和S
深度学习入门与TensorFlow实践 电子书
基于TensorFlow2,系统讲述如何搭建、训练和应用深度学习模型。