机器学习原理与Python编程实践

机器学习原理与Python编程实践

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书专为初学者顺利入门而设计,解决机器学习中基本理论和编程实践的两大障碍。

内容简介

本书讲述机器学习的基本原理,使用Python和Numpy实现涉及的各种机器学习算法。通过理论学习和实践操作,使读者了解并掌握机器学习的基本原理和技能,拉近理论与实践的距离。

全书共分为13章,主要内容包括:机器学习介绍、线性回归、逻辑回归、贝叶斯分类器、模型评估与选择、K-均值算法和EM算法、决策树、神经网络、隐马尔科夫模型、支持向量机、推荐系统、主成分分析、集成学习。全书源码全部在Python3.7上调试成功,每章都附有习题和习题参考答案,供读者参考。

本书系统讲解了机器学习的常用核心算法和Python编程实践,内容全面、实例丰富、可操作性强,做到理论与实践相结合。本书适合机器学习爱好者作为入门和提高的技术参考书,也适合用作计算机专业高年级本科生和研究生的教材或教学参考书。

作者简介

作者袁梅宇,北航工学博士,硕士导师,现在昆明理工大学计算机系任教。为本科生和研究生主讲Java程序设计、Java EE技术、数据库原理、人工智能、Dot Net技术等核心课程,参加过863 CIMS Net建设、中欧合作项目DRAGON和多项国家基金和省基金项目,作者公开发表论文十余篇,软件著作权六项。作者专著有《Java EE企业级编程开发实例详解》、《数据挖掘与机器学习——WEKA应用技术与实践》、《求精要诀——Java EE编程开发案例精讲》、《机器学习基础原理、算法与实践》等。

章节目录

版权信息

内容简介

前言

第1章 机器学习介绍

1.1 机器学习简介

1.1.1 什么是机器学习

1.1.2 机器学习与日常生活

1.1.3 如何学习机器学习

1.1.4 Python的优势

1.2 基本概念

1.2.1 机器学习的种类

1.2.2 有监督学习

1.2.3 无监督学习

1.2.4 机器学习的术语

1.2.5 预处理

1.3 Numpy数据格式

1.3.1 标称数据

1.3.2 序数数据

1.3.3 分类数据

1.4 示例数据集

1.4.1 天气问题

1.4.2 鸢尾花

1.4.3 其他数据集

1.5 了解你的数据

习题

第2章 线性回归

2.1 从一个实际例子说起

2.1.1 模型定义

2.1.2 模型假设

2.1.3 模型评估

2.2 最小二乘法

2.2.1 最小二乘法求解参数

2.2.2 用最小二乘法来拟合奥运会数据

2.2.3 预测比赛结果

2.3 梯度下降

2.3.1 基本思路

2.3.2 梯度下降算法

2.3.3 梯度下降求解线性回归问题

2.4 多变量线性回归

2.4.1 多变量线性回归问题

2.4.2 多变量梯度下降

2.4.3 随机梯度下降

2.4.4 小批量梯度下降

2.4.5 正规方程

2.5 多项式回归

2.5.1 多项式回归算法

2.5.2 正则化

习题

第3章 逻辑回归

3.1 逻辑回归介绍

3.1.1 线性回归用于分类

3.1.2 假设函数

3.1.3 决策边界

3.2 逻辑回归算法

3.2.1 代价函数

3.2.2 梯度下降算法

3.2.3 SciPy优化函数

3.2.4 多项式逻辑回归

3.3 多元分类

3.3.1 一对多

3.3.2 一对一

3.3.3 Softmax回归

习题

第4章 贝叶斯分类器

4.1 简介

4.1.1 概述

4.1.2 判别模型和生成模型

4.1.3 极大似然估计

4.2 高斯判别分析

4.2.1 多元高斯分布

4.2.2 高斯判别模型

4.3 朴素贝叶斯

4.3.1 朴素贝叶斯算法

4.3.2 文本分类

习题

第5章 模型评估与选择

5.1 简介

5.1.1 训练误差与泛化误差

5.1.2 偏差和方差

5.2 评估方法

5.2.1 训练集、验证集和测试集划分

5.2.2 交叉验证

5.3 性能度量

5.3.1 常用性能度量

5.3.2 查准率和查全率

5.3.3 ROC和AUC

5.4 偏差与方差折中

5.4.1 偏差方差诊断

5.4.2 正则化与偏差和方差

5.4.3 学习曲线

习题

第6章 K-均值算法和EM算法

6.1 聚类分析

6.1.1 K-means算法

6.1.2 K-means算法的应用

6.1.3 注意事项

6.2 EM算法

6.2.1 基本EM算法

6.2.2 EM算法的一般形式

6.2.3 混合高斯模型

习题

第7章 决策树

7.1 决策树介绍

7.2 ID3算法

7.2.1 信息熵

7.2.2 信息增益计算示例

7.2.3 ID3算法描述

7.2.4 ID3算法实现

7.3 C4.5算法

7.3.1 基本概念

7.3.2 剪枝处理

7.3.3 C4.5算法描述

7.3.4 C4.5算法实现

7.4 CART算法

7.4.1 CART算法介绍

7.4.2 CART算法描述

7.4.3 CART算法实现

习题

第8章 神经网络

8.1 神经网络介绍

8.1.1 从一个实例说起

8.1.2 神经元

8.1.3 神经网络结构

8.1.4 简化的神经网络模型

8.1.5 细节说明

8.2 神经网络学习

8.2.1 代价函数

8.2.2 BP算法

8.2.3 BP算法实现

8.3 神经网络实现

8.3.1 MNIST神经网络实现

8.3.2 逻辑异或的神经网络实现

习题

第9章 隐马尔科夫模型

9.1 隐马尔科夫模型基本概念

9.1.1 离散马尔科夫过程

9.1.2 扩展至隐马尔科夫模型

9.1.3 HMM的组成和序列生成

9.1.4 三个基本问题

9.2 求解HMM三个基本问题

9.2.1 评估问题

9.2.2 解码问题

9.2.3 学习问题

习题

第10章 支持向量机

10.1 支持向量机介绍

10.2 最大间隔超平面

10.2.1 SVM问题的形式化描述

10.2.2 函数间隔和几何间隔

10.2.3 最优间隔分类器

10.2.4 使用优化软件求解SVM

10.3 对偶算法

10.3.1 SVM对偶问题

10.3.2 使用优化软件求解对偶SVM

10.4 非线性支持向量机

10.4.1 核技巧

10.4.2 常用核函数

10.5 软间隔支持向量机

10.5.1 动机及原问题

10.5.2 对偶问题

10.5.3 使用优化软件求解软间隔对偶SVM

10.6 SMO算法

10.6.1 SMO算法描述

10.6.2 简化SMO算法实现

10.7 LibSVM

10.7.1 LibSVM的安装

10.7.2 LibSVM函数

10.7.3 LibSVM实践指南

习题

第11章 推荐系统

11.1 推荐系统介绍

11.1.1 什么是推荐系统

11.1.2 数据集描述

11.1.3 推荐系统符号

11.2 基于用户的协同过滤

11.2.1 相似性度量

11.2.2 算法描述

11.2.3 算法实现

11.3 基于物品的协同过滤

11.3.1 调整余弦相似度和预测

11.3.2 Slope One算法描述与实现

11.4 基于内容的协同过滤算法与实现

11.4.1 算法描述

11.4.2 算法实现

习题

第12章 主成分分析

12.1 主成分分析介绍

12.2 本征值与奇异值分解

12.2.1 本征值分解

12.2.2 奇异值分解

12.3 PCA算法描述

12.3.1 PCA算法

12.3.2 从压缩表示中重建

12.3.3 确定主成分数量

12.4 PCA实现

12.4.1 假想实例

12.4.2 MNIST实例

习题

第13章 集成学习

13.1 集成学习介绍

13.1.1 集成学习简介

13.1.2 个体学习器

13.1.3 集成学习的基本原理

13.1.4 融合个体学习器的方法

13.2 装袋

13.2.1 装袋算法描述

13.2.2 装袋算法实现

13.3 提升

13.3.1 提升算法描述

13.3.2 AdaBoost算法实现

13.4 随机森林

13.4.1 随机森林算法描述

13.4.2 随机森林算法实现

习题

附录1 符号表

附录2 习题参考答案

参考文献

机器学习原理与Python编程实践是2021年由清华大学出版社出版,作者袁梅宇。

得书感谢您对《机器学习原理与Python编程实践》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Python高手修炼之道:数据处理与机器学习实战 电子书
适读人群 :1.没有编程知识的新手 不同于一般的基础语法讲解教程,本书并未将Python 开发限定于某个集成开发工具(IDE)中,而是采用交互式编程的方式来强化读者对语言特性的理解,帮助新手读者真正理解Python 语言和Python 编程。2.从未接触过Python 语言,但了解一点编程知识的初学者 本书通过对基础知识高度的提炼和概括,以避免初学者陷入低级且冗长的细节知识点而心生懈怠;同时,本书为初学者规划了从初级到高级的编程技能提升路线图。3.具有一定基础的Python 程序员 本书可以作为案头工具书来使用。本书从基础语法、基本技能讲起,涵盖了科学计算、数据处理、机器学习等领域,示例代码涉及30 余个模块的使用。 构建从Python入门到数据分析到机器学习的路线图,入门有章可循; 1.讲解独到,常见盲点趣解析 作者基于多年的经验积累,善于总结概括初学Python过程中的误区。 2.内容全面,常用工具全涵盖 书中介绍的Python工具包覆盖Numpy、Matplotlib、Pandas、SciPy、Scikit-Learn,方便读者拓展实用技能、掌握工作利器。 3.拓展训练,重点知识有强化 语感训练100题、Python内置函数(类)手册、从新手到高手的100个模块,强化知识点的掌握。 4.代码完整,随时动手可复现 本书提供了完整、可验证的代码,方便读者动手练习并强化理解。
Python编程基础 电子书
全面介绍Python编程基础与实用技术。
Python编程基础 电子书
介绍了Python编程基础及其相关知识的应用,解决部分实际问题。
跟着迪哥学:Python数据分析与机器学习实战 电子书
本书适合对人工智能、机器学习、数据分析等方向感兴趣的初学者和爱好者。
机器学习 电子书
机器学习基础与高级内容全面讲解,实例丰富,易于学习巩固。