跳到主要内容

使用 Colocate Group 优化 Join

Colocate Group 是一种高效的 Join 方式,使得执行引擎能有效地规避 Join 操作中数据的shuffle开销。相关原理介绍和案例参考详见 Colocation Join

注意
  • 在某些场景下,即使已经成功建立了 Colocate Group,执行计划(plan)仍然可能会显示为 Shuffle JoinBucket Shuffle Join。这种情况通常发生在 Doris 正在进行数据整理的过程中,比如,它可能在 BE 间迁移 tablet,以确保数据在多个 BE 之间的分布达到更加均衡的状态。
  • 通过命令show proc "/colocation_group";可以查看 Colocate Group 状态,如下图所示:IsStable 出现false,表示有 Colocate Group 不可用的情况。

使用 Colocate Group 优化 Join