人工智能与大数据技术导论

人工智能与大数据技术导论

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

10章精讲AI技术,附大数据产业参考资料。

内容简介

本书共10章,内容包括人工智能概述、AI产业、数据、机器学习、机器学习算法、深度学习、机器视觉技术、语音技术、知识图谱、数据挖掘与分析等。附录给出极有参考价值的大数据与人工智能产业参考资料。

章节目录

封面页

书名页

版权页

作者简介

内容简介

前言

目录

第1章 人工智能概述

1.1 AI是什么

1.1.1 火热的AI

1.1.2 AI的驱动因素

1.2 AI技术的成熟度

1.2.1 视觉识别

1.2.2 自然语言理解

1.2.3 机器人

1.2.4 自动驾驶

1.2.5 机器学习

1.2.6 游戏

1.3 美国AI巨头分析

1.4 国内AI现状

1.5 AI与云计算和大数据的关系

1.6 AI技术路线

1.7 AI国家战略

1.8 AI的历史发展

第2章 AI产业

2.1 基础层

2.1.1 芯片产业

2.1.2 GPU

2.1.3 FPGA

2.1.4 ASIC

2.1.5 TPU

2.1.6 亚马逊的芯片

2.1.7 芯片产业小结

2.1.8 传感器

2.1.9 传感器小结

2.2 技术层

2.2.1 机器学习

2.2.2 语音识别与自然语言处理

2.2.3 计算机视觉

2.3 应用层

2.3.1 安防

2.3.2 金融

2.3.3 制造业

2.3.4 智能家居

2.3.5 医疗

2.3.6 自动驾驶

2.4 AI产业发展趋势分析

第3章 数 据

3.1 什么是大数据

3.1.1 大数据的特征

3.1.2 大数据的误区

3.1.3 大数据交易难点

3.1.4 大数据的来源

3.1.5 数据关联

3.1.6 大数据生产链

3.1.7 大数据怎么用

3.2 国内大数据现状

3.2.1 政策持续完善

3.2.2 技术和应用逐步落地

3.2.3 数据产生价值难

3.2.4 问题与机遇并存

3.3 大数据的计算模式

3.3.1 流式计算的应用场景

3.3.2 流式大数据的特征

3.3.3 流式计算关键技术

3.4 大数据技术

3.4.1 数据技术的演进

3.4.2 分布式计算系统概述

3.4.3 Hadoop

3.4.4 Spark

3.4.5 Storm系统

3.4.6 Kafka系统

3.4.7 各类技术平台比较

3.5 数据平台

3.5.1 数据存储和计算

3.5.2 数据质量

3.5.3 数据管理

3.5.4 数据目录

3.5.5 数据安全管控

3.5.6 数据准备

3.5.7 数据整合

3.5.8 数据服务

3.5.9 数据开发

3.5.10 数据平台总结

3.6 大数据的商用途径

3.6.1 数据化

3.6.2 算法化

3.6.3 应用化(产品化)

3.6.4 生态化

3.7 大数据产业

3.7.1 大数据产业界定

3.7.2 大数据技术发展的推动力

3.7.3 重点行业的大数据应用

3.7.4 大数据应用发展趋势

3.7.5 大数据的产业链构成分析

3.8 政府大数据案例分析

3.8.1 政府有哪些数据资源

3.8.2 政府大数据应用案例

3.8.3 政府大数据面临的挑战

3.8.4 政府大数据应用启示

第4章 机器学习概述

4.1 走进机器学习

4.1.1 什么是机器学习

4.1.2 机器学习的感性认识

4.1.3 机器学习的本质

4.1.4 对机器学习的全面认识

4.1.5 机器学习、深度学习与人工智能

4.1.6 机器学习、数据挖掘与数据分析

4.2 机器学习的基本概念

4.2.1 数据集、特征和标签

4.2.2 监督式学习和非监督式学习

4.2.3 强化学习和迁移学习

4.2.4 特征数据类型

4.2.5 训练集、验证集和测试集

4.2.6 机器学习的任务流程

4.3 数据预处理

4.3.1 探索性分析

4.3.2 数据清洗

4.3.3 特征工程

第5章 模 型

5.1 什么是模型

5.2 误差和MSE

5.3 模型的训练

5.3.1 模型与算法的区别

5.3.2 迭代法

5.4 梯度下降法

5.4.1 步长

5.4.2 优化步长

5.4.3 三类梯度下降法

5.4.4 梯度下降的详细算法

5.5 模型的拟合效果

5.5.1 欠拟合与过拟合

5.5.2 过拟合的处理方法

5.6 模型的评估与改进

5.6.1 机器学习模型的评估

5.6.2 机器学习算法与人类比较

5.6.3 改进策略

5.7 机器学习的实现框架

5.7.1 Python

5.7.2 scikit-learn

5.7.3 Spark MLlib

第6章 机器学习算法

6.1 算法概述

6.1.1 线性回归

6.1.2 逻辑回归

6.1.3 线性判别分析

6.1.4 分类与回归树分析

6.1.5 朴素贝叶斯

6.1.6 K最近邻算法

6.1.7 学习矢量量化

6.1.8 支持向量机

6.1.9 Bagging和随机森林

6.1.10 Boosting和AdaBoost

6.2 支持向量机算法

6.3 逻辑回归算法

6.4 KNN算法

6.4.1 超参数k

6.4.2 KNN实例:波士顿房价预测

6.4.3 算法评价

6.5 决策树算法

6.6 集成算法

6.6.1 集成算法简述

6.6.2 集成算法之Bagging

6.6.3 集成算法之Boosting

6.7 聚类算法

6.7.1 K均值聚类

6.7.2 均值漂移聚类

6.7.3 基于密度的聚类方法

6.7.4 用高斯混合模型的最大期望聚类

6.7.5 凝聚层次聚类

6.7.6 图团体检测

6.8 机器学习算法总结

第7章 深度学习

7.1 走进深度学习

7.1.1 深度学习为何崛起

7.1.2 从逻辑回归到浅层神经网络

7.1.3 深度神经网络

7.1.4 正向传播

7.1.5 激活函数

7.2 神经网络的训练

7.2.1 神经网络的参数

7.2.2 向量化

7.2.3 价值函数

7.2.4 梯度下降和反向传播

7.3 神经网络的优化和改进

7.3.1 神经网络的优化策略

7.3.2 正则化方法

7.4 卷积神经网络

7.4.1 卷积运算

7.4.2 卷积层

7.4.3 CNN实例

7.5 深度学习的优势

7.6 深度学习的实现框架

第8章 TensorFlow

8.1 TensorFlow工具包

8.1.1 tf.estimator API

8.1.2 Pandas速成

8.1.3 必要的Python知识

8.2 第一个TensorFlow程序

8.2.1 装载数据

8.2.2 探索数据

8.2.3 训练模型

8.2.4 评估模型

8.2.5 优化模型

8.2.6 合成特征

8.2.7 离群值处理

8.3 过拟合处理

8.3.1 训练集和测试集

8.3.2 验证集

8.3.3 过拟合实例

8.4 特征工程

8.4.1 数值型数据

8.4.2 字符串数据和one-hot编码

8.4.3 枚举数据(分类数据)

8.4.4 好特征

8.4.5 数据清洗

8.4.6 分箱(分桶)技术

8.4.7 特征工程实例

第9章  TensorFlow高级知识

9.1 特征交叉

9.1.1 什么是特征交叉

9.1.2 FTRL实践

9.1.3 分桶(分箱)代码实例

9.1.4 特征交叉代码实例

9.2 L2正则化

9.3 逻辑回归

9.4 分类

9.4.1 评价指标——准确率

9.4.2 评价指标——精确率

9.4.3 指标——召回率

9.4.4 评价指标之综合考虑

9.4.5 ROC曲线

9.4.6 预测偏差

9.4.7 分类代码实例

9.5 L1正则化

第10章 神经网络

10.1 什么是神经网络

10.1.1 隐藏层

10.1.2 激活函数

10.1.3 ReLU

10.1.4 实例代码

10.2 训练神经网络

10.2.1 正向传播算法

10.2.2 反向传播算法

10.2.3 标准化特征值

10.2.4 丢弃正则化

10.2.5 代码实例

10.3 多类别神经网络

10.3.1 一对多方法

10.3.2 Softmax

10.3.3 代码实例

10.4 嵌套

10.4.1 协同过滤

10.4.2 稀疏数据

10.4.3 获取嵌套

10.4.4 代码实例

第11章 知识图谱

11.1 什么是知识图谱

11.1.1 知识图谱的定义

11.1.2 知识图谱的架构

11.1.3 开放知识图谱

11.1.4 知识图谱在行业数据分析中的应用

11.2 知识图谱构建的关键技术

11.2.1 知识提取

11.2.2 语义类抽取

11.2.3 属性和属性值抽取

11.2.4 关系抽取

11.2.5 知识表示

11.2.6 知识融合

11.3 知识计算及应用

11.4 企业知识图谱建设

第12章 数据挖掘

12.1 什么是数据挖掘

12.1.1 数据挖掘技术产生的背景

12.1.2 数据挖掘与数据分析的区别

12.2 数据挖掘技术(方法)

12.2.1 分类

12.2.2 聚类

12.2.3 回归分析

12.2.4 关联规则

12.2.5 神经网络方法

12.2.6 Web数据挖掘

12.2.7 特征分析

12.2.8 偏差分析

12.3 大数据思维

12.3.1 信度与效度思维

12.3.2 分类思维

12.3.3 漏斗思维

12.3.4 逻辑树思维

12.3.5 时间序列思维

12.3.6 指数化思维

12.3.7 循环/闭环思维

第13章 银行业大数据和人工智能

13.1 四大行的进展

13.1.1 建设银行

13.1.2 工商银行

13.1.3 农业银行

13.1.4 中国银行

13.2 其他银行

13.2.1 广发银行

13.2.2 江苏银行

13.3 金融宏观大数据分析

13.4 小结

13.4.1 大数据给银行带来的机遇与挑战

13.4.2 银行大数据体系建设的思考

第14章 医疗大数据和人工智能

14.1 医疗大数据的特点

14.2 医疗大数据处理模型

14.3 医疗大数据的AI应用

14.3.1 智能辅助诊疗

14.3.2 影像数据分析与影像智能诊断

14.3.3 合理用药

14.3.4 远程监控

14.3.5 精准医疗

14.3.6 成本与疗效分析

14.3.7 绩效管理

14.3.8 医院控费

14.3.9 医疗质量分析

14.4 人工智能的医疗应用场景

14.5 人工智能要当“医生”

14.6 医院大数据

14.7 机器学习在医疗行业中的应用实例分析

第15章 公安大数据和人工智能

15.1 公安大数据的特点

15.2 建设流程

15.3 公安大数据管理平台

15.3.1 公安大数据建模

15.3.2 公安大数据汇集

15.3.3 公安大数据服务

15.4 公安大数据挖掘分析

15.5 公安大数据AI应用

15.6 小结

第16章 工农业大数据和人工智能

16.1 中国制造2025

16.2 工业大数据

16.2.1 工业大数据面临三大制约因素

16.2.2 工业大数据应用的四大发展趋势

16.2.3 发展工业大数据

16.3 AI+制造

16.4 农业大数据

16.4.1 发展现状

16.4.2 农业大数据目标

16.4.3 农业大数据建设任务

16.4.4 农产品质量安全追溯

附录A 国内人工智能企业名单

附录B 大数据和人工智能网上资料

附录C 本书中采用的人工智能中英文术语

附录D 术语列表

人工智能与大数据技术导论是2019年由清华大学出版社出版,作者杨正洪。

得书感谢您对《人工智能与大数据技术导论》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
大数据原理与技术 电子书
本书则是华为公司针对华为ICT学院大数据方向的在读学生,专门组织合作伙伴和华为公司内部员工开发的标准化教材,这套教材的目的在于循序渐进地帮助华为ICT学院大数据方向的学生掌握大数据技术的基本原理与应用场景,能够在面对真实的业务场景时,独立完成大数据平台的搭建、维护及故障的处理。
数据共享与数据整合技术 电子书
本教材一共6个项目,项目1为SOA基础知识导入,主要介绍了SOA的基本概念、发展历程,与企业IT战略之间的关系;项目2介绍了Web服务的相关基础知识,包括Web服务的体系结构特性、服务规范、SOAP、WSDL、UDDI等;项目3介绍了ESB的相关知识,明确了ESB与EAI之间的关系,介绍了SOA思想针对实际问题的具体实现思路,重点讲解了iESB引擎和iESB设计器的安装配置方法;项目4至项目6比较
机器学习与大数据技术 电子书
本书较为全面地论述了机器学习、深度学习、大数据技术与图像处理技术的基本概念、基础原理和基本方法,以农业为应用场景,力求通缩易懂,深入浅出的介绍了与机器学习、深度学习、大数据技术与图像处理技术问题联系密切的内容。全书主要分为4大部分:机器学习、大数据技术和图像处理技术的基础知识;经典的机器学习基本理论和方法,以及深度学习和大数据未来的发展;实践应用;机器学习和人工智能的数学基础与编程基础。
大数据技术与应用基础 电子书
本书在介绍大数据发展背景、特点及主要技术层面的基础上,对大数据的数据采集、数据存储、常见计算模式和典型系统工具进行了分析介绍。本书同时对各种典型系统工具进行了讲解,包括大数据查询分析计算及典型工具(HBase、Hive)、批处理计算及典型工具(MapReduce、Spark)、流式计算及典型工具(Storm、Apex、Flink)、事件流及典型工具(Druid)等。本书提供了大量的实例和源代码供读
MySQL数据库技术与应用 电子书
MySQL是目前最流行的关系数据库管理系统之一。本书以MySQL5.6数据库管理系统为平台,以案例教学法为编写主线,介绍了数据库系统的基本概念和应用技术。本书以学生选课管理系统作为教学案例,以网上书店作为实训案例,采用“学习要点—内容示例—归纳总结—习题实训”的结构体系设计每章内容。最后一章以一个具体的项目案例开发设计过程,将数据库原理知识与实际数据库开发结合在一起。本书采用在线开放课程教学方式,