跳到主要内容

APPROX_COUNT_DISTINCT

Description

Syntax

APPROX_COUNT_DISTINCT(expr)

返回类似于 COUNT(DISTINCT col) 结果的近似值聚合函数。

它基于 HyperLogLog 算法实现,使用固定大小的内存估算列基数。该算法基于尾部零分布假设进行计算,具体精确程度取决于数据分布。基于 Doris 使用的固定桶大小,该算法相对标准误差为 0.8125%

更详细具体的分析,详见相关论文

Example

MySQL > select approx_count_distinct(query_id) from log_statis group by datetime;
+-----------------+
| approx_count_distinct(`query_id`) |
+-----------------+
| 17721 |
+-----------------+

Keywords

APPROX_COUNT_DISTINCT