Trino权威指南(原书第2版)

Trino权威指南(原书第2版)

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书详细介绍了开源的分布式SQL查询引擎Trino涉及的方方面面的知识。

内容简介

全书共三部分,第一部分介绍Trino的发展历史、主要功能以及如何安装和使用它,第二部分介绍Trino的内部架构、部署、连接器和所支持的SQL语句的使用等,第三部分介绍在生产环境中部署Trino的知识,以及一些真实世界的部署案例。

通过学习本书,你将了解Trino在解决海量数据分析和查询问题方面的优越性,并学会在现实场景中使用它来高效地解决需要在短时间内返回结果的大数据查询问题。

作者简介

作者马丁·特拉韦尔索,Presto项目创始成员,Presto软件基金会联合创始人,Starburst公司首席技术官。

章节目录

版权信息

O'Reilly Media, Inc. 介绍

本书赞誉

译者序

前言

第一部分 Trino入门

第1章 Trino介绍

1.1 大数据带来的问题

1.2 Trino来救场

1.3 Trino使用场景

1.4 Trino资源

1.5 Trino简史

1.6 小结

第2章 安装和配置Trino

2.1 使用Docker容器探索Trino

2.2 使用归档文件安装Trino

2.3 添加数据源

2.4 运行Trino

2.5 小结

第3章 使用Trino

3.1 Trino CLI

3.2 Trino JDBC驱动

3.3 Trino与ODBC

3.4 客户端库

3.5 Trino Web UI

3.6 使用Trino执行SQL

3.7 小结

第二部分 深入理解Trino

第4章 Trino架构

4.1 集群中的协调器和工作节点

4.2 基于连接器的架构

4.3 catalog、schema和表

4.4 查询执行模型

4.5 查询计划

4.6 优化规则

4.7 实现规则

4.8 基于代价的优化器

4.9 使用表统计信息

4.10 小结

第5章 生产环境部署

5.1 配置细节

5.2 服务端配置

5.3 日志

5.4 节点配置

5.5 JVM配置

5.6 启动器

5.7 集群安装

5.8 使用RPM安装

5.9 在云上安装

5.10 用Helm chart部署Kubernetes

5.11 考虑集群规模

5.12 小结

第6章 连接器

6.1 配置

6.2 RDBMS连接器示例:PostgreSQL

6.3 TPC-H连接器和TPC-DS连接器

6.4 用于分布式存储数据源的Hive连接器

6.5 现代分布式存储管理和分析

6.6 非关系型数据源

6.7 Trino JMX连接器

6.8 black hole连接器

6.9 内存连接器

6.10 其他连接器

6.11 小结

第7章 高级连接器示例

7.1 用Phoenix连接HBase

7.2 键值存储连接器示例:Accumulo

7.3 Apache Cassandra连接器

7.4 流系统连接器示例:Kafka

7.5 文档存储连接器示例:Elasticsearch

7.6 Trino中的联邦查询

7.7 ETL和联邦查询

7.8 小结

第8章 在Trino中使用SQL

8.1 Trino语句

8.2 Trino系统表

8.3 catalog

8.4 schema

8.5 information schema

8.6 表

8.7 视图

8.8 会话信息和配置

8.9 数据类型

8.10 SELECT语句基础

8.11 WHERE子句

8.12 GROUP BY和HAVING子句

8.13 ORDER BY子句和LIMIT子句

8.14 JOIN语句

8.15 UNION、INTERSECT和EXCEPT子句

8.16 分组操作

8.17 WITH子句

8.18 子查询

8.19 从表中删除数据

8.20 小结

第9章 高级SQL特性

9.1 函数和运算符介绍

9.2 标量函数和运算符

9.3 布尔运算符

9.4 逻辑运算符

9.5 用BETWEEN语句选择范围

9.6 用IS (NOT) NULL检测值的存在

9.7 数学函数和运算符

9.8 三角函数

9.9 常数和随机函数

9.10 字符串函数和运算符

9.11 字符串和映射

9.12 Unicode

9.13 正则表达式

9.14 解嵌套复杂数据类型

9.15 JSON函数

9.16 日期和时间函数及运算符

9.17 直方图

9.18 聚合函数

9.19 窗函数

9.20 lambda表达式

9.21 地理空间函数

9.22 预处理语句

9.23 小结

第三部分 Trino的实际应用

第10章 安全

10.1 认证

10.2 授权

10.3 加密

10.4 CA与自签名证书

10.5 证书认证

10.6 Kerberos

10.7 数据源访问和安全配置

10.8 使用Hive连接器进行Kerberos认证

10.9 集群分离

10.10 小结

第11章 将Trino与其他工具集成

11.1 使用Apache Superset进行查询、可视化和更多操作

11.2 使用RubiX提高性能

11.3 使用Apache Airflow的工作流

11.4 嵌入式Trino示例:Amazon Athena

11.5 企业版:Starburst Enterprise和StarburstGalaxy

11.6 其他集成示例

11.7 自定义集成

11.8 小结

第12章 生产环境中的Trino

12.1 使用Trino Web UI进行监控

12.2 Trino SQL查询调优

12.3 内存管理

12.4 任务并发性

12.5 工作节点调度

12.6 网络数据交换

12.7 JVM调优

12.8 资源组

12.9 小结

第13章 真实世界案例

13.1 部署和运行时平台

13.2 集群规模

13.3 Hadoop/Hive迁移的使用场景

13.4 其他数据源

13.5 用户和流量

13.6 小结

总结

关于作者

关于封面

推荐阅读

Trino权威指南(原书第2版)是2023年由机械工业出版社出版,作者[美] 马特·富勒。

得书感谢您对《Trino权威指南(原书第2版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
IBM SPSS Modeler 18.0数据挖掘权威指南 电子书
联袂推荐 暨南大学教授、博士生导师刘建平,暨南大学研究生院副院长、经济学院统计学系副主任、教授、博士生导师陈光慧,天善智能创始人梁勇,IBM技术专家刘咏梅,IBM数据科学家钟云飞,广东省环保厅环境咨询专家委员会专家、广东柯内特环境科技有限公司总经理朱斌 本书特色 内容全面:涉及数据读取、数据处理、数据可视化、统计分析与检验、数据挖掘算法、自动建模、集成与扩展、模型部署、性能优化、数据挖掘方法论等诸多内容; 讲解透彻:既有理论的讲解,又涵盖应用的实践,而且在工具的介绍上,尽可能包括每一个选项的内容和应用形式,力求让读者“吃透”每一章节的内容; 突出实战:集行业经验、项目实践、算法剖析、应用技巧于一身,配套提供数据文件以及数据模型文件,方便读者动手实践。
艾略特波浪理论:市场行为的关键(原书第11版) 电子书
经过40余年市场检验的有效投资技术分析工具。官方指定授权的全新升级改版。
小红书运营速成指南 电子书
小红书运营逻辑解密,实用有效的涨粉攻略。
美国本科西游之路:美国百所名校本科留学权威指南 电子书
本书汇集美国2015年最新排名TOP70的综合性大学和TOP30的文理学院,提供各院校的基本信息、分数要求、申请费用、院校介绍以及各专业机构的排名等相关信息,帮助申请者及家长初步了解各大院校,更为重要的,本书还提供已成功申请者对该院校的申请要点、就读重点以及就读环境等的相关说明,还有招生官对该院校有重点的、指导性的讲解,能更有效地帮助申请者及家长进行选择。本书作为最新的美国留学院校指南,更符合美国
Redis入门指南(第3版) 电子书
本书旨在帮助读者从基础开始了解Redis,由浅入深过渡到实践,帮助读者尽快在实际项目中用上Redis,做到即学即用。