跳到主要内容

使用 Colocate Group 优化 Join

定义 Colocate Group 是一种高效的 Join 方式,通过这种方式,执行引擎能有效地规避 Join 操作中输入数据的传输开销(关于 Colocate Group 的介绍可参考 JOIN

然而,在某些场景下,即使已经成功建立了 Colocate Group,执行计划(plan)仍然可能会显示为 Shuffle Join 或 Bucket Shuffle Join。这种情况通常发生在 Doris 正在进行数据整理的过程中,比如,它可能在 BE 间迁移 tablet,以确保数据在多个 BE 之间的分布达到更加均衡的状态。

通过命令show proc "/colocation_group";可以查看 Colocate Group 状态,如下图所示:IsStable 出现 false,表示有 colocation_group 不可用的情况。

使用 Colocate Group 优化 Join