图数据实战:用图思维和图技术解决复杂问题

图数据实战:用图思维和图技术解决复杂问题

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

一本探索如何应用图思维和图技术解决复杂问题的书。

内容简介

本书涵盖了与图数据相关的广泛主题,包括图思维、图数据模型和查询语言,讨论了如何将图数据应用于社交网络、物流和网络安全等领域的问题解决方案。

此外,本书还提供了实践指导,包括工具和框架的推荐、设计有效图数据模型的建议,以及如何使用图数据生成洞见和做出明智决策的建议。

作者简介

作者丹妮丝·柯斯勒·戈斯内尔(Denise Koessler Gosnell),DataStax首席数据官。她的专利、技术成果和演讲涉及图论、图算法、图数据库和图数据在所有行业垂直领域的应用相关的数十个主题。

章节目录

版权信息

O'Reilly Media,Inc.介绍

业界评论

前言

第1章 图思维

1.1 为什么是现在将图引入数据库技术

1.1.1 20世纪60年代~80年代:分层数据

1.1.2 20世纪80年代~21世纪00年代:实体关系

1.1.3 21世纪00年代~20年代:NoSQL

1.1.4 21世纪20年代以后:图

1.2 什么是图思维

1.2.1 复杂问题和复杂系统

1.2.2 业务中的复杂问题

1.3 制定技术决策解决复杂问题

1.3.1 现在你有了图数据,接下来是什么

1.3.2 看清局势

1.4 开启你的图思维旅程

第2章 从关系思维进化到图思维

2.1 本章预览:将关系概念转化为图术语

2.2 关系和图:差异在哪里

2.3 关系型数据建模

2.3.1 实体和属性

2.3.2 构建ERD

2.4 图数据中的概念

2.4.1 图的基本元素

2.4.2 邻接

2.4.3 邻接点

2.4.4 距离

2.4.5 度

2.5 图结构语言

2.5.1 顶点标签和边标签

2.5.2 属性

2.5.3 边的方向

2.5.4 自指向边标签

2.5.5 图的多样性

2.5.6 图模型的完整示例

2.6 确定是关系型还是图

2.6.1 数据建模

2.6.2 理解图数据

2.6.3 系统目的和数据库设计

2.7 总结

第3章 入门:简单的C360视图

3.1 本章预览:关系型技术和图技术

3.2 图数据的基本用例:C360

3.3 在关系型系统中实施C360应用程序

3.3.1 数据模型

3.3.2 关系型实现

3.3.3 C360查询示例

3.4 在图系统中实现C360应用程序

3.4.1 数据模型

3.4.2 图实现

3.4.3 C360查询示例

3.5 关系型与图:如何选择

3.5.1 关系型与图:数据建模

3.5.2 关系型与图:表示关系

3.5.3 关系型与图:查询语言

3.5.4 关系型与图:要点

3.6 总结

3.6.1 为什么不用关系型技术

3.6.2 为C360应用程序做技术决策

第4章 在开发环境中探索邻接点

4.1 本章预览:构建一个更现实的C360

4.2 图数据建模101

4.2.1 这应该是一个顶点还是一条边

4.2.2 迷路了吗?让我们带你找到方向

4.2.3 图命名中的常见错误

4.2.4 完整的开发环境图模型

4.2.5 在开始开发之前

4.2.6 数据、查询和终端用户的重要性

4.3 在开发环境中探索邻接点的实现细节

4.4 Gremlin基础导航

4.5 高级Gremlin:构造查询结果

4.5.1 使用project()、fold()和unfold()来构造查询结果

4.5.2 在结果中使用where(neq())模式删除数据

4.5.3 使用coalesce()步骤来规划稳定的返回结果

4.6 从开发到生产

第5章 在生产环境中探索邻接点

5.1 本章预览:学习Apache Cassandra的分布式图数据

5.2 使用Apache Cassandra处理图数据

5.2.1 了解数据建模最重要的概念:主键

5.2.2 分布式环境中的分区键和数据位置

5.2.3 学习边,第一部分:邻接表中的边

5.2.4 学习边,第二部分:聚类列

5.2.5 学习边,第三部分:遍历的物化视图

5.3 图数据建模201

5.4 生产环境的实现细节

5.4.1 物化视图以及在边上添加时间

5.4.2 C360最终生产版本

5.4.3 批量加载图数据

5.4.4 基于边的时间属性更新Gremlin查询

5.5 更复杂的分布式图问题

第6章 在开发环境中使用树

6.1 本章预览:导航树、分层数据和循环

6.2 分层和嵌套数据

6.2.1 物料清单中的分层数据

6.2.2 版本控制系统中的分层数据

6.2.3 自组织网络中的分层数据

6.2.4 为什么对分层数据使用图技术

6.3 在纷繁的术语中找到出路

6.3.1 树、根和叶子

6.3.2 遍历深度、路径和环

6.4 通过传感器数据学习层次结构

6.4.1 理解数据

6.4.2 使用GSL表示方法构建概念模型

6.4.3 实现数据结构

6.4.4 在构建查询之前

6.5 开发环境中从叶子节点到根节点的查询

6.5.1 传感器将信息发送到哪里

6.5.2 传感器通向任意一个塔的路径

6.5.3 自底向上

6.6 开发环境中从根节点到叶子节点的查询

6.6.1 准备查询:哪个塔连接了最多的传感器,适合作为示例

6.6.2 与Georgetown直连的传感器

6.6.3 所有与Georgetown相关的传感器

6.6.4 递归中的深度限制

6.7 回到过去

第7章 在生产环境中使用树

7.1 本章预览:分支系数、深度和边上的时间属性

7.2 传感器数据中的时间

7.3 示例中的分支系数

7.3.1 什么是分支系数

7.3.2 我们如何绕过分支系数

7.4 传感器数据的生产结构

7.5 生产环境中从叶子节点到根节点的查询

7.5.1 这个传感器在什么时间将数据发送到哪里

7.5.2 从传感器出发,根据时间找到所有以塔作为根节点的树

7.5.3 从传感器出发,找到一棵有效树

7.5.4 高级Gremlin:学习where().by()模式

7.6 生产环境中从根节点到叶子节点的查询

7.6.1 按时间顺序直接与Georgetown通信的传感器

7.6.2 从Georgetown塔向下到达传感器的有效路径

7.7 在通信塔故障的场景中应用查询

7.8 以小见大

第8章 开发环境中的路径查找

8.1 本章预览:量化网络中的信任

8.2 关于信任的三个例子

8.2.1 你对公开邀请有多信任

8.2.2 调查人员的故事站得住脚吗

8.2.3 物流公司如何模拟包裹的投递

8.3 路径的基本概念

8.3.1 最短路径

8.3.2 深度优先搜索和广度优先搜索

8.3.3 将应用程序功能抽象为不同的路径问题

8.4 信任网络中的路径查找

8.4.1 源数据

8.4.2 比特币术语简介

8.4.3 创建开发模型

8.4.4 加载数据

8.4.5 探索信任社区

8.5 用比特币信任网络理解遍历

8.5.1 一级邻接点的地址

8.5.2 二级邻接点的地址

8.5.3 是二级邻接点但不是一级邻接点的地址

8.5.4 Gremlin查询语言中的求值策略

8.5.5 为示例挑选一个随机地址

8.6 最短路径查询

8.6.1 查找固定长度的路径

8.6.2 查找任意长度的路径

8.6.3 通过信任评分增强路径

8.6.4 你信任这个人吗

第9章 生产环境中的路径查找

9.1 本章预览:权重、距离和剪枝

9.2 加权路径和搜索算法

9.2.1 最短加权路径问题的定义

9.2.2 最短加权路径搜索优化

9.3 最短路径问题的边权重归一化

9.3.1 归一化边的权重

9.3.2 更新图

9.3.3 探索归一化的边权重

9.3.4 学习最短加权路径查询前的一些思考

9.4 最短加权路径查询

9.5 生产环境中的加权路径和信任

第10章 开发环境中的推荐

10.1 本章预览:电影推荐的协同过滤

10.2 推荐系统示例

10.2.1 我们如何在医疗保健领域提供推荐

10.2.2 我们如何在社交媒体上经历推荐

10.2.3 我们如何在电子商务中使用深度连接的数据进行推荐

10.3 协同过滤导论

10.3.1 理解问题和领域

10.3.2 图数据协同过滤

10.3.3 基于条目的协同过滤的图数据推荐

10.3.4 三种不同的推荐排序模型

10.4 电影数据:结构、加载和查询

10.4.1 电影推荐的数据模型

10.4.2 电影推荐的结构代码

10.4.3 加载电影数据

10.4.4 电影数据中的邻接点查询

10.4.5 电影数据中的树查询

10.4.6 电影数据中的路径查询

10.5 Gremlin中基于条目的协同过滤

10.5.1 模型1:统计推荐集中的路径

10.5.2 模型2:NPS启发

10.5.3 模型3:归一化NPS

10.5.4 选择你自己的冒险:电影和图问题版

第11章 图中的简单实体解析

11.1 本章预览:合并多个数据集到一个图

11.2 定义一个不同的复杂问题:实体解析

11.3 分析两个电影数据集

11.3.1 MovieLens数据集

11.3.2 Kaggle数据集

11.3.3 开发结构

11.4 匹配和合并电影数据

11.5 解决假阳性

11.5.1 MovieLens数据集中发现的假阳性

11.5.2 在实体解析过程中发现的其他错误

11.5.3 合并过程的最终分析

11.5.4 图结构在合并电影数据中的作用

第12章 生产环境中的推荐

12.1 本章预览:快捷边、预计算和高级修剪技术

12.2 实时推荐的快捷边

12.2.1 我们的开发过程在哪里无法扩展

12.2.2 我们如何解决扩展问题:快捷边

12.2.3 探索我们的设计在生产环境中交付了什么

12.2.4 修剪:预计算快捷边的不同方法

12.2.5 更新推荐的考虑因素

12.3 计算我们的电影数据的快捷边

12.3.1 分解快捷边预计算的复杂问题

12.3.2 解决刻意回避的问题:批计算

12.4 电影推荐的生产结构和数据加载

12.4.1 电影推荐的生产结构

12.4.2 电影推荐的生产数据加载

12.5 带有快捷边的推荐查询

12.5.1 确认边加载正确

12.5.2 为用户提供生产环境推荐

12.5.3 通过计算边分区了解生产环境中的响应时间

12.5.4 关于分布式图查询性能推理的最后思考

第13章 结语

13.1 何去何从

13.1.1 图算法

13.1.2 分布式图

13.1.3 图论

13.1.4 网络理论

13.2 保持联系

关于作者

关于封面

图数据实战:用图思维和图技术解决复杂问题是2023年由机械工业出版社出版,作者[美] 丹妮丝·柯斯勒·戈斯内尔。

得书感谢您对《图数据实战:用图思维和图技术解决复杂问题》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Altium Designer 原理图与PCB设计 电子书
全书共分11章,介绍了AltiumDesigner15基本操作,原理图的设计基础、绘制和编辑方法,层次化原理图设计,PCB设计基础,PCB设计环境、基本操作和编辑方法,以及电路仿真、信号完整性分析、元器件绘制的基本方法。
新印象:VRayforSketchUp效果图高级渲染技法 电子书
本书旨在全面讲解VRay for SketchUp渲染器的功能及其应用。
学抠图:Photoshop专业抠图技法案例教程 电子书
本书是一本关于Photoshop抠图的教程类图书。全书以选区为切入点,由浅入深地介绍各类抠图工具、命令,在每个知识点的后面都辅以大量的原理图与实操案例,使读者从理论和实战两方面掌握抠图技术,从而解决工作、学习、生活中的抠图难题。全书共8章,包含29个实战案例。每一个抠图案例都采用“抠图效果展示→抠图思路分析→抠图操作步骤”的逻辑进行演示与讲解,力求让读者明白每一步操作背后的意义。此外,本书还在关键
3ds Max 2014/VRay效果图制作实战从入门到精通 电子书
本书由浅入深,全面、详细地介绍了利用3dsMax进行室内外设计及浏览动画的各项核心技术与精髓内容,通过室内、外各种场景的200个实例深入地讲解了3dsMax2014应用于实践的原理和流程,案例讲解与知识点相结合,具有很强的实用性,帮助读者在短时间内掌握室内效果图的制作。全书共分为23章,包括3dsMax2014的基本操作,标准基本体的应用,扩展及特殊基本体的应用,二维图形的应用,二维图形转三维对象