编辑推荐
本书面向所有对人工智能领域感兴趣的读者。
内容简介
本书在不涉及大量数学与编程知识的前提下,从零开始,逐步带领读者熟悉并掌握当下最流行的基于Python 3的人工智能编程工具,包括但不限于数据分析(Pandas),以及支持单机(Scikit-learn)、深度(PyTorch、TensorFlow、PaddlePaddle)和分布式(PySpark-ML)机器学习的开源程序库,等等。
作者简介
作者范淼,清华大学计算机系人工智能研究所博士,研究方向涉及机器学习与自然语言处理技术。2015年3月受国家留学基金委公派至美国纽约大学计算机系联合培养。攻读博士期间,于所在研究领域内多个重要国际会议与期刊上发表论文近20篇。先后在Hulu、MSRA(微软亚洲研究院)、百度自然语言处理部、Bosch(博世)北美硅谷研究院等多个公司的研发部门实习,并承担机器学习与自然语言处理相关的研究任务。
章节目录
版权信息
内容简介
作者介绍
致谢
前言
入门篇
第1章 全书指南
1.1 Python编程
1.2 数据分析
1.3 机器学习
1.3.1 任务
1.3.2 经验
1.3.3 表现
1.4 Kaggle竞赛
1.5 Git代码管理
小结
第2章 基本环境搭建与配置
2.1 Windows下基本环境的搭建与配置
2.1.1 查看Windows的版本与原始配置
2.1.2 下载并安装Anaconda3(Windows版本)
2.1.3 创建虚拟环境python_env
2.1.4 在虚拟环境python_env下安装Jupyter Notebook
2.2 macOS下基本环境的搭建与配置
2.2.1 查看macOS的版本与原始配置
2.2.2 下载并安装Anaconda3(macOS版本)
2.2.3 创建虚拟环境python_env
2.2.4 在虚拟环境python_env下安装Jupyter Notebook
2.3 Ubuntu下基本环境的搭建与配置
2.3.1 查看Ubuntu的版本与原始配置
2.3.2 下载并安装Anaconda3(Linux版本)
2.3.3 创建虚拟环境python_env
2.3.4 在虚拟环境python_env下安装Jupyter Notebook
2.4 Jupyter Notebook使用简介
2.4.1 在虚拟环境python_env下启动Jupyter Notebook
2.4.2 创建一个.ipynb文件
2.4.3 试运行.ipynb文件内的Python 3程序
2.5 PyCharm使用简介
2.5.1 安装PyCharm
2.5.2 在虚拟环境python_env下启动PyCharm
2.5.3 创建一个.py文件
2.5.4 试运行.py文件内的Python 3程序
小结
基础篇
第3章 Python编程基础
3.1 Python环境配置
3.1.1 基于命令行/终端的交互式编程环境
3.1.2 基于Web的交互式开发环境
3.1.3 集成式开发环境
3.2 Python基本语法
3.2.1 注释
3.2.2 赋值
3.2.3 缩进
3.3 Python数据类型
3.4 Python数据运算
3.5 Python流程控制
3.5.1 分支语句
3.5.2 循环控制
3.6 Python函数设计
3.7 Python面向对象编程
3.8 Python编程库(包)/模块导入
3.9 Python编程综合实践
小结
第4章 Pandas数据分析
4.1 Pandas环境配置
4.1.1 使用Anaconda Navigator搭建和配置环境
4.1.2 使用conda命令搭建和配置环境
4.2 Pandas核心数据结构
4.2.1 序列
4.2.2 数据框
4.3 Pandas读取/写入文件数据
4.3.1 读取/写入CSV文件数据
4.3.2 读取/写入JSON文件数据
4.3.3 读取/写入Excel文件数据
4.4 Pandas数据分析的常用功能
4.4.1 添加数据
4.4.2 删除数据
4.4.3 查询/筛选数据
4.4.4 修改数据
4.4.5 数据统计
4.4.6 数据排序
4.4.7 函数应用
4.5 Pandas数据合并
4.6 Pandas数据清洗
4.7 Pandas数据分组与聚合
小结
第5章 Scikit-learn单机机器学习
5.1 Scikit-learn环境配置
5.1.1 使用Anaconda Navigator搭建和配置环境
5.1.2 使用conda命令搭建和配置环境
5.2 Scikit-learn无监督学习
5.2.1 降维学习与可视化
5.2.2 聚类算法
5.3 Scikit-learn监督学习
5.3.1 分类预测模型
5.3.2 数值回归模型
5.4 Scikit-learn半监督学习模型
5.4.1 自学习框架
5.4.2 标签传播算法
5.5 单机机器学习模型的常用优化技巧
5.5.1 交叉验证
5.5.2 特征工程
5.5.3 参数正则化
5.5.4 超参数寻优
5.5.5 并行加速训练
小结
进阶篇
第6章 PyTorch/TensorFlow/PaddlePaddle深度学习
6.1 PyTorch/TensorFlow/PaddlePaddle环境配置
6.1.1 PyTorch环境配置
6.1.2 TensorFlow环境配置
6.1.3 PaddlePaddle环境配置
6.2 全连接神经网络
6.2.1 全连接神经网络的PyTorch实践
6.2.2 全连接神经网络的TensorFlow实践
6.2.3 全连接神经网络的PaddlePaddle实践
6.3 卷积神经网络
6.3.1 卷积神经网络的PyTorch实践
6.3.2 卷积神经网络的TensorFlow实践
6.3.3 卷积神经网络的PaddlePaddle实践
6.4 残差神经网络
6.4.1 残差神经网络的PyTorch实践
6.4.2 残差神经网络的TensorFlow实践
6.4.3 残差神经网络的PaddlePaddle实践
6.5 循环神经网络
6.5.1 循环神经网络的PyTorch实践
6.5.2 循环神经网络的TensorFlow实践
6.5.3 循环神经网络的PaddlePaddle实践
6.6 注意力机制
6.6.1 注意力机制的PyTorch实践
6.6.2 注意力机制的TensorFlow实践
6.6.3 注意力机制的PaddlePaddle实践
6.7 自动编码器
6.7.1 自动编码器的PyTorch实践
6.7.2 自动编码器的TensorFlow实践
6.7.3 自动编码器的PaddlePaddle实践
6.8 变换模型
6.8.1 变换模型的PyTorch实践
6.8.2 变换模型的TensorFlow实践
6.8.3 变换模型的PaddlePaddle实践
6.9 深度学习模型的常用优化技巧
6.9.1 随机失活
6.9.2 批标准化
6.9.3 层标准化
小结
第7章 PySpark分布式机器学习
7.1 PySpark环境配置
7.1.1 使用Anaconda Navigator搭建和配置环境
7.1.2 使用conda命令搭建和配置环境
7.1.3 安装JRE
7.2 PySpark分布式数据结构
7.2.1 RDD
7.2.2 DataFrame
7.3 PySpark分布式特征工程
7.3.1 特征抽取
7.3.2 特征转换
7.4 PySpark分布式机器学习
7.4.1 PySpark-ML分类预测模型
7.4.2 PySpark-ML数值回归模型
7.5 分布式机器学习模型的常用优化技巧
7.5.1 超参数寻优:留一验证
7.5.2 超参数寻优:交叉验证
小结
实践篇
第8章 Kaggle竞赛实践
8.1 Titanic罹难乘客预测
8.1.1 数据分析
8.1.2 数据预处理
8.1.3 模型设计与寻优
8.1.4 提交测试
8.2 Ames房产价格评估
8.2.1 数据分析
8.2.2 数据预处理
8.2.3 模型设计与寻优
8.2.4 提交测试
8.3 Twitter短文本分类
8.3.1 数据分析
8.3.2 数据预处理
8.3.3 模型设计与寻优
8.3.4 提交测试
8.4 CIFAR-100图像识别
8.4.1 数据分析
8.4.2 数据预处理
8.4.3 模型设计与寻优
8.4.4 提交测试
小结
第9章 Git代码管理
9.1 Git本地环境搭建
9.1.1 Windows下Git工具的安装与配置
9.1.2 macOS下Git工具的安装与配置
9.1.3 Ubuntu下Git工具的安装与配置
9.2 Git远程仓库配置
9.2.1 GitHub介绍
9.2.2 GitHub远程仓库的创建与配置
9.2.3 Gitee介绍
9.2.4 Gitee远程仓库的创建与配置
9.3 Git基本指令
9.3.1 克隆仓库
9.3.2 提交修改
9.3.3 远程推送
9.4 Git分支管理
9.4.1 创建分支
9.4.2 分支合并
9.4.3 合并冲突
9.4.4 删除分支
9.5 贡献Git项目
9.5.1 复刻项目
9.5.2 本地克隆、修改与推送
9.5.3 发起拉取请求
小结
后记
Python人工智能编程实践是2024年由清华大学出版社出版,作者范淼。
得书感谢您对《Python人工智能编程实践》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。