类似推荐
编辑推荐
本书详细介绍了开源的分布式SQL查询引擎Trino涉及的方方面面的知识。
内容简介
全书共三部分,第一部分介绍Trino的发展历史、主要功能以及如何安装和使用它,第二部分介绍Trino的内部架构、部署、连接器和所支持的SQL语句的使用等,第三部分介绍在生产环境中部署Trino的知识,以及一些真实世界的部署案例。
通过学习本书,你将了解Trino在解决海量数据分析和查询问题方面的优越性,并学会在现实场景中使用它来高效地解决需要在短时间内返回结果的大数据查询问题。
作者简介
作者马丁·特拉韦尔索,Presto项目创始成员,Presto软件基金会联合创始人,Starburst公司首席技术官。
章节目录
版权信息
O'Reilly Media, Inc. 介绍
本书赞誉
译者序
序
前言
第一部分 Trino入门
第1章 Trino介绍
1.1 大数据带来的问题
1.2 Trino来救场
1.3 Trino使用场景
1.4 Trino资源
1.5 Trino简史
1.6 小结
第2章 安装和配置Trino
2.1 使用Docker容器探索Trino
2.2 使用归档文件安装Trino
2.3 添加数据源
2.4 运行Trino
2.5 小结
第3章 使用Trino
3.1 Trino CLI
3.2 Trino JDBC驱动
3.3 Trino与ODBC
3.4 客户端库
3.5 Trino Web UI
3.6 使用Trino执行SQL
3.7 小结
第二部分 深入理解Trino
第4章 Trino架构
4.1 集群中的协调器和工作节点
4.2 基于连接器的架构
4.3 catalog、schema和表
4.4 查询执行模型
4.5 查询计划
4.6 优化规则
4.7 实现规则
4.8 基于代价的优化器
4.9 使用表统计信息
4.10 小结
第5章 生产环境部署
5.1 配置细节
5.2 服务端配置
5.3 日志
5.4 节点配置
5.5 JVM配置
5.6 启动器
5.7 集群安装
5.8 使用RPM安装
5.9 在云上安装
5.10 用Helm chart部署Kubernetes
5.11 考虑集群规模
5.12 小结
第6章 连接器
6.1 配置
6.2 RDBMS连接器示例:PostgreSQL
6.3 TPC-H连接器和TPC-DS连接器
6.4 用于分布式存储数据源的Hive连接器
6.5 现代分布式存储管理和分析
6.6 非关系型数据源
6.7 Trino JMX连接器
6.8 black hole连接器
6.9 内存连接器
6.10 其他连接器
6.11 小结
第7章 高级连接器示例
7.1 用Phoenix连接HBase
7.2 键值存储连接器示例:Accumulo
7.3 Apache Cassandra连接器
7.4 流系统连接器示例:Kafka
7.5 文档存储连接器示例:Elasticsearch
7.6 Trino中的联邦查询
7.7 ETL和联邦查询
7.8 小结
第8章 在Trino中使用SQL
8.1 Trino语句
8.2 Trino系统表
8.3 catalog
8.4 schema
8.5 information schema
8.6 表
8.7 视图
8.8 会话信息和配置
8.9 数据类型
8.10 SELECT语句基础
8.11 WHERE子句
8.12 GROUP BY和HAVING子句
8.13 ORDER BY子句和LIMIT子句
8.14 JOIN语句
8.15 UNION、INTERSECT和EXCEPT子句
8.16 分组操作
8.17 WITH子句
8.18 子查询
8.19 从表中删除数据
8.20 小结
第9章 高级SQL特性
9.1 函数和运算符介绍
9.2 标量函数和运算符
9.3 布尔运算符
9.4 逻辑运算符
9.5 用BETWEEN语句选择范围
9.6 用IS (NOT) NULL检测值的存在
9.7 数学函数和运算符
9.8 三角函数
9.9 常数和随机函数
9.10 字符串函数和运算符
9.11 字符串和映射
9.12 Unicode
9.13 正则表达式
9.14 解嵌套复杂数据类型
9.15 JSON函数
9.16 日期和时间函数及运算符
9.17 直方图
9.18 聚合函数
9.19 窗函数
9.20 lambda表达式
9.21 地理空间函数
9.22 预处理语句
9.23 小结
第三部分 Trino的实际应用
第10章 安全
10.1 认证
10.2 授权
10.3 加密
10.4 CA与自签名证书
10.5 证书认证
10.6 Kerberos
10.7 数据源访问和安全配置
10.8 使用Hive连接器进行Kerberos认证
10.9 集群分离
10.10 小结
第11章 将Trino与其他工具集成
11.1 使用Apache Superset进行查询、可视化和更多操作
11.2 使用RubiX提高性能
11.3 使用Apache Airflow的工作流
11.4 嵌入式Trino示例:Amazon Athena
11.5 企业版:Starburst Enterprise和StarburstGalaxy
11.6 其他集成示例
11.7 自定义集成
11.8 小结
第12章 生产环境中的Trino
12.1 使用Trino Web UI进行监控
12.2 Trino SQL查询调优
12.3 内存管理
12.4 任务并发性
12.5 工作节点调度
12.6 网络数据交换
12.7 JVM调优
12.8 资源组
12.9 小结
第13章 真实世界案例
13.1 部署和运行时平台
13.2 集群规模
13.3 Hadoop/Hive迁移的使用场景
13.4 其他数据源
13.5 用户和流量
13.6 小结
总结
关于作者
关于封面
推荐阅读
Trino权威指南(原书第2版)是2023年由机械工业出版社出版,作者[美] 马特·富勒。
得书感谢您对《Trino权威指南(原书第2版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。