金融中的机器学习

金融中的机器学习

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

跟随机器学习最佳实践,探秘金融中的科技思维。

内容简介

机器学习是设计与应用算法的科学,可从数据中进行学习和预测,其应用已经非常普遍。金融领域集中了大量的交易数据,为人工智能技术的运用奠定了良好的数据基础。本书面向金融领域的读者,介绍了机器学习技术的原理与实践。

本书包括10章,介绍了神经网络算法、结构化数据的处理、计算机视觉处理技术、时间序列分析、自然语言处理、生成模型的应用、强化学习技术、数据建模与调试、贝叶斯推理和概率编程等内容。

本书由资深金融从业者编写,融合了其在金融项目中关于机器学习的实践经验,适合金融领域的数据科学家、数据分析师、金融科技公司的技术研发人员以及对金融领域的机器学习技术感兴趣的读者阅读。

作者简介

作者简尼斯·克拉斯(Jannes Klaas)是一名拥有金融学和经济学背景的量化分析师。他曾主导过两个机器学习训练营项目,也同研发数据驱动类应用的公司和交易策略类公司有过合作。目前,他的研究领域包括系统风险和大规模自动化的知识挖掘。

章节目录

版权信息

内容提要

作者简介

审稿人简介

前言

本书的目标读者

本书内容概要

本书相关约定

资源与支持

配套资源

提交勘误

与我们联系

关于异步社区和异步图书

第1章 神经网络和基于梯度的优化

1.1 本书的内容概要

1.2 什么是机器学习

1.3 监督学习

1.4 非监督学习

1.5 强化学习

1.5.1 极其有效的数据

1.5.2 模型即是错

1.6 创建工作区

1.7 使用Kaggle内核

本地运行Notebook文件

1.8 使用AWS深度学习AMI

1.9 近似函数

1.10 前向传递

1.11 逻辑回归器

逻辑回归器的Python实现

1.12 优化模型参数

1.13 评估模型损失

1.13.1 梯度下降

1.13.2 反向传播

1.13.3 参数更新

1.13.4 阶段小结

1.14 深度网络

1.15 Keras简介

1.15.1 导入Keras库

1.15.2 Keras中的双层模型

1.15.3 Keras和TensorFlow

1.16 张量和计算图

1.17 练习

1.18 本章小结

第2章 机器学习在结构化数据中的应用

2.1 数据

2.2 启发式模型、基于特征的模型和E2E模型

2.3 机器学习软件栈

2.4 启发式方法

2.4.1 使用启发式模型来预测

2.4.2 F1分数

2.4.3 基于混淆矩阵的评价

2.5 特征工程方法

2.5.1 特征源于直觉

2.5.2 专家视角

2.5.3 统计奇事

2.6 Keras库的数据准备

2.6.1 one-hot编码

2.6.2 实体嵌入(entity embeddings)

2.7 使用Keras创建预测模型

2.7.1 提取目标

2.7.2 创建测试集

2.7.3 创建验证集

2.7.4 训练数据的过采样

2.7.5 构建模型

2.8 基于决策树方法的简要入门

2.8.1 一个简单的决策树

2.8.2 随机森林

2.8.3 XGBoost

2.9 E2E模型

2.10 练习

2.11 本章小结

第3章 计算机视觉的应用

3.1 卷积神经网络

3.1.1 过滤MNIST数据集

3.1.2 第二个过滤器

3.2 彩色图片的过滤技术

3.3 Keras ConvNet组成模块

3.3.1 Conv2D

3.3.2 最大池化

3.3.3 Flatten层

3.3.4 Dense层

3.3.5 训练MNIST

3.4 神经网络的延展

3.4.1 动量

3.4.2 Adam优化器

3.4.3 正则化(regularization)

3.4.4 失效(dropout)

3.4.5 批归一化(BatchNorm)

3.5 采用大图片数据集

3.6 采用预训练模型

3.6.1 修改VGG16

3.6.2 随机图像增强

ImageDataGenerator图像增强

3.7 模块度权衡

3.8 计算机视觉不止分类

3.8.1 人脸识别

3.8.2 边框预测

3.9 练习

3.10 本章小结

第4章 理解时间序列

4.1 数据的可视化与Pandas准备

4.1.1 汇总全局特征统计

4.1.2 检查采样时间序列

4.1.3 不同平稳特性

4.1.4 为什么平稳性重要

4.1.5 让时间序列具有平稳性

4.1.6 何时忽略平稳性问题

4.2 快速傅里叶变换

4.3 自相关

4.4 构建训练和测试方案

4.5 回测

4.6 中位数预测

4.7 ARIMA模型

4.8 卡曼滤波

4.9 神经网络预测

数据准备

工作日

4.10 Conv1D

4.11 因果卷积和扩张卷积

4.12 简单的RNN

4.13 LSTM

carry

4.14 循环dropout

4.15 贝叶斯深度学习

4.16 练习

4.17 本章小结

第5章 用自然语言处理解析文本数据

5.1 spaCy的入门指南

5.2 命名实体识别

微调NER

5.3 词性标记

5.4 基于规则的匹配

5.4.1 在匹配器中添加自定义函数

5.4.2 匹配器添加到pipeline中

5.4.3 基于规则和学习相结合的系统

5.5 正则表达式

5.5.1 Python 正则表达式

5.5.2 Pandas正则表达式

5.5.3 何时使用正则表达式

5.6 文本分类任务

5.7 准备数据

5.7.1 清理字符

5.7.2 词形还原

5.7.3 制定目标

5.7.4 准备训练集和测试集

5.8 词袋模型

TF-IDF

5.9 主题模型

5.10 单词嵌入

5.10.1 针对单词向量训练的预处理

5.10.2 加载预先训练的单词向量

5.10.3 单词向量的时间序列模型

5.11 具有单词嵌入的文档相似度

5.12 快速浏览Keras函数API

5.13 注意力机制

5.14 注意力模块

5.15 seq2seq模型

5.15.1 seq2seq架构概述

5.15.2 数据

5.15.3 字符编码

5.15.4 构建推断模型

5.15.5 翻译

5.16 练习

5.17 本章小结

第6章 生成模型的应用

6.1 理解自编码器

6.1.1 MNIST的自编码器

6.1.2 信用卡自编码器

6.2 使用t-SNE可视化隐空间

6.3 变分自编码器

6.3.1 MNIST实例

6.3.2 使用Lambda层

6.3.3 Kullback-Leibler散度

6.3.4 创建自定义损失

6.3.5 使用VAE生成数据

6.3.6 针对端到端诈骗检测系统的VAE

6.4 时间序列的VAE

6.5 GAN

6.5.1 MNIST GAN

6.5.2 理解GAN隐向量

6.5.3 GAN训练技巧

6.6 使用更少的数据

6.6.1 高效使用标签预算

6.6.2 采用机器来为人类打标签

6.6.3 未打标签数据的伪标签

6.6.4 使用生成模型

6.7 用于诈骗检测的SGAN

6.8 练习

6.9 本章小结

第7章 金融市场中的强化学习

7.1 “接水果”游戏

7.1.1 Q-learning将强化学习变成监督学习

7.1.2 定义Q-learning模型

7.1.3 训练玩“接水果”游戏

7.2 马尔可夫过程和贝尔曼方程

经济学中的贝尔曼方程

7.3 优势动作评论(A2C)模型

7.3.1 学习平衡

7.3.2 学习交易

7.4 进化策略和基因算法

7.5 强化学习工程的实用建议

7.5.1 设计良好的收益函数

7.5.2 强鲁棒性的强化学习

7.6 强化学习技术前沿

7.6.1 多代理强化学习

7.6.2 学习如何去学习

7.6.3 通过强化学习理解大脑

7.7 练习

7.8 本章小结

第8章 调试和发布产品

8.1 调试数据

8.1.1 如何查看数据是否胜任任务

8.1.2 没有足够数据该怎么办

8.1.3 单元测试数据

8.1.4 保证数据隐私并遵守法规

8.1.5 为训练准备数据

8.1.6 了解何种输入导致何种预测

8.2 调试模型

8.2.1 Hyperas搜索超参

8.2.2 高效的学习率搜索

8.2.3 学习率调度

8.2.4 TensorBoard监控训练

8.2.5 梯度爆炸和消失

8.3 部署

8.3.1 快速上线

8.3.2 理解和监控指标

8.3.3 了解数据的来源

8.4 性能建议

8.4.1 使用合适的硬件

8.4.2 使用分布式训练和TF估计器

8.4.3 使用CuDNNLSTM优化层

8.4.4 优化管道

8.4.5 使用Cython加速代码

8.4.6 缓存频繁的请求

8.5 练习

8.6 本章小结

第9章 挑战偏见

9.1 机器学习中不公平的来源

9.2 法律视角

9.3 量化公平

9.4 训练公平

9.5 因果学习

9.5.1 获得因果模型

9.5.2 工具变量

9.5.3 非线性因果模型

9.6 解释模型来确保公平

9.7 不公平则是复杂系统的失败

9.7.1 复杂系统本质上是危险系统

9.7.2 诸多故障引发灾难

9.7.3 复杂系统以降级模式运行

9.7.4 人工操作既能引发事故也能防止事故

9.7.5 无事故操作要求有故障经验

9.8 开发公平模型的检查清单

9.8.1 模型开发人员的目标是什么

9.8.2 数据存在偏见吗

9.8.3 错误是否有偏见

9.8.4 如何整合反馈

9.8.5 模型可解释吗

9.8.6 模型部署后会发生什么

9.9 练习

9.10 本章小结

第10章 贝叶斯推理和概率编程

10.1 贝叶斯推理入门指南

10.1.1 扁平先验

10.1.2 < 50%先验

10.1.3 先验与后验

10.1.4 马尔可夫链蒙特卡罗算法

10.1.5 Metropolis-Hastings MCMC

10.1.6 从概率编程到深度概率编程

10.2 本章小结

结束语

推荐读物

版权声明

金融中的机器学习是2021年由人民邮电出版社出版,作者[英] 简尼斯·克拉斯。

得书感谢您对《金融中的机器学习》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Python机器学习 电子书
《Python机器学习》从实用的角度出发,整合Python语言基础、数据分析与可视化、机器学习常用算法等知识。内容从*基本的Python编程基础入手,由浅入深、循序渐进地讲授NumPy库和Matplotlib库,以及复杂的机器学习基本理论和算法,并突出知识的实用性和可操作性。《Python机器学习》力求以浅显的语言讲解复杂的知识,以直观的案例辅助读者理解,并以图表形式展示代码和运行结果,配合习题巩
场景化机器学习 电子书
本书展示了如何在业务场景中应用机器学习,全书分为三个部分。第一部分介绍有效的决策如何帮助公司提高生产率以保持竞争力,阐释如何使用开源工具和AWS工具将机器学习应用于业务决策中。第二部分以虚拟人物为主线,研究六个场景,这些场景展示了如何使用机器学习来制定各种业务决策。第三部分讨论如何在Web上设置和共享机器学习模型,还介绍了一些案例。
机器学习公式详解 电子书
适读人群 :(1)高等院校人工智能、计算机、自动化等相关专业机器学习方向的学生;(2)学术界机器学习领域的研究人员和教师;(3)工业界对机器学习感兴趣的专业人员和工程师。 1.周志华教授“西瓜书”《机器学习》公式完全解析指南! “南瓜书”系Datawhale成员自学笔记,对“西瓜书”中250个重难点公式做了详细解析和推导(重难点公式覆盖率达99%),旨在解决机器学习中的数学难题。 2.机器学习初学小白提升数学基础能力的必备练习册! 以本科数学基础视角对“西瓜书”里比较难理解的公式加以解析和推导细节,补充大量重、难点数学知识和参考材料,分享在学习中遇到的“坑”以及跳过这个“坑”的方法,对于初学机器学习的小白也能上手练习! 3.俞勇、王斌、李沐、程明明、陈光(博主@爱可可-爱生活)、徐亦达等人工智能领域大咖亲笔推荐
机器学习工程实战 电子书
机器学习入门手册《机器学习精讲》姊妹篇,人工智能和机器学习领域专业人士的多年实践结晶,深入浅出讲解机器学习应用和工程实践。
机器学习案例实战 电子书
机器学习已经广泛地应用于各行各业,深度学习的兴起再次推动了人工智能的热潮。本书结合项目实践,首先讨论了TensorFlow、PySpark、TI-ONE等主流机器学习平台的主要特点;然后结合Tableau介绍了数据可视化在银行客户用卡行为分析的应用。在此基础上,利用上述介绍的这些平台,通过多个项目案例,详细地分析了决策树、随机森林、支持向量机、逻辑回归、贝叶斯网络、卷积神经网络、循环神经网络、对抗