ワークロード分析診断
クラスターのワークロード分析は主に2つの段階に分けられます:
- 第1段階はランタイムワークロード分析で、クラスターの可用性が低下した際に、監視を通じて大量のリソースを消費するクエリを特定し、適切に格下げすることができます。
- 第2段階は、audit logsなどの履歴データを分析して、不適切なワークロードを特定し最適化することです。
ランタイムワークロード分析
監視によってクラスターの可用性が低下していることが検出された場合、以下のプロセスに従うことができます:
- 最初に、監視を使用してクラスターの現在のボトルネックを大まかに判断します。例えば、メモリ使用量の過多、CPU使用率の高さ、IOの高さなどです。すべてが高い場合は、メモリの問題に優先的に対処することが推奨されます。
- クラスターのボトルネックが特定されたら、workload_group_resource_usageテーブルを参照して、現在最もリソース使用量の多いGroupを見つけることができます。例えば、メモリのボトルネックがある場合、メモリ使用量が最も多い上位NのGroupsを特定できます。
- 最もリソース使用量の多いGroupを特定した後、最初のステップとしてこのGroupのクエリ同時実行数を減らすことができます。この時点でクラスターリソースは既に逼迫しており、新しいクエリはクラスターリソースを枯渇させる可能性があるため避けるべきです。
- 現在のGroupのクエリを格下げします。ボトルネックに応じて、異なるアプローチを取ることができます:
- CPUボトルネックの場合、GroupのCPUをhard limitに設定し、cpu_hard_limitをより低い値に調整してCPUリソースを自発的に譲渡することを検討します。
- IOボトルネックの場合、read_bytes_per_secondパラメータを通じてGroupの最大IOを制限します。
- メモリボトルネックの場合、Groupのメモリをhard limitに設定し、memory_limit値を減少させて一部のメモリを解放します。これにより、現在のGroup内で多数のクエリ失敗が発生する可能性があることに注意してください。
- 上記のステップを完了した後、通常クラスターの可用性はある程度回復します。この時点で、さらなる分析を行って、このGroupでのリソース使用量増加の主要原因を特定することができます。それがこのGroupでのクエリ同時実行数の全体的な増加によるものか、特定の大きなクエリによるものかを判断します。特定の大きなクエリが原因の場合、これらのクエリを迅速にkillしてクラスター機能を復旧できます。
- backend_active_tasksテーブルをactive_queriesと組み合わせて使用し、クラスター内で異常なリソース使用量を持つSQLクエリを特定し、kill文を使用してこれらのクエリをkillしリソースを解放することができます。
履歴データを通じたワークロード分析
現在、DorisのauditログはSQL実行に関する簡潔な情報を保持しており、これを使用して過去に実行された不適切なクエリを特定し調整を行うことができます。具体的なプロセスは以下の通りです:
- 監視を確認してクラスターの履歴リソース使用量を確認し、クラスターのボトルネックがCPU、メモリ、IOのいずれかを特定します。
- クラスターのボトルネックが特定されたら、audit logsを参照して該当期間中に異常なリソース使用量を持つSQLクエリを見つけることができます。異常なSQLを定義する方法は2つあります:
- ユーザーがクラスター内のSQLのリソース使用量に関して一定の期待を持っている場合、例えばほとんどの遅延が秒単位で、スキャン行数が数千万行である場合、スキャン行数が数億行から数十億行のSQLクエリは異常と見なされ、手動介入が必要です。
- ユーザーがクラスター内のSQLリソース使用量に関して期待を持っていない場合、パーセンタイル関数を使用してリソース使用量を計算し、異常なリソース使用量を持つSQLクエリを特定できます。CPUボトルネックを例にとると、まず履歴期間のクエリCPU時間のtp50/tp75/tp99/tp999を計算し、これらの値を正常とします。これらを現在のクラスターの同期間のクエリCPU時間のパーセンタイル関数と比較します。例えば、履歴期間のtp999が1分であるが、現在のクラスターの同期間のtp50が既に1分である場合、履歴データと比較してCPU時間が1分を超えるSQLクエリが多数あることを示しています。したがって、CPU時間が1分を超えるSQLクエリを異常と定義できます。同じロジックが他のメトリクスにも適用されます。
- 異常なリソース使用量を持つSQLクエリを最適化します。例えば、SQLの書き直し、テーブル構造の最適化、並列度の調整により、SQLクエリあたりのリソース使用量を削減します。
- audit logsでSQLリソース使用量が正常であることが判明した場合、監視とauditingを使用してその時間に実行されたSQLクエリ数が履歴期間と比較して増加しているかを確認します。そうである場合、対応する時間帯にアップストリームのアクセストラフィックが増加したかどうかアップストリームビジネスに確認し、クラスターをスケールするか、キューイングとレート制限を実装するかを決定します。
よく使用されるSQL
ヒント
active_queriesテーブルはFE上で実行されているクエリを記録し、backend_active_tasksテーブルはBE上で実行されているクエリを記録することに注意してください。すべてのクエリが実行中にFEに登録されるわけではありません。例えば、stream loadsはFEに登録されません。したがって、backend_active_tasksとactive_queriesの間でLEFT JOINを実行する際に一致する結果が得られないのは正常です。
クエリがSELECTクエリの場合、active_queriesとbackend_active_tasksの両方に記録されるqueryIdは同じです。クエリがstream loadの場合、active_queriesテーブルのqueryIdは空ですが、backend_active_tasksのqueryIdはstream loadのIDです。
- 現在のすべてのWorkload Groupsを表示し、メモリ/CPU/I/O使用量の降順で表示します。
select be_id,workload_group_id,memory_usage_bytes,cpu_usage_percent,local_scan_bytes_per_second
from workload_group_resource_usage
order by memory_usage_bytes,cpu_usage_percent,local_scan_bytes_per_second desc
-
CPU使用率上位N件のSQL。
select
t1.query_id as be_query_id,
t1.query_type,
t2.query_id,
t2.workload_group_id,
t2.`database`,
t1.cpu_time,
t2.`sql`
from
(select query_id, query_type,sum(task_cpu_time_ms) as cpu_time from backend_active_tasks group by query_id, query_type)
t1 left join active_queries t2
on t1.query_id = t2.query_id
order by cpu_time desc limit 10; -
メモリ使用量TopN Sql。
select
t1.query_id as be_query_id,
t1.query_type,
t2.query_id,
t2.workload_group_id,
t1.mem_used
from
(select query_id, query_type, sum(current_used_memory_bytes) as mem_used from backend_active_tasks group by query_id, query_type)
t1 left join active_queries t2
on t1.query_id = t2.query_id
order by mem_used desc limit 10; -
スキャンバイト/行数TopN Sql。
select
t1.query_id as be_query_id,
t1.query_type,
t2.query_id,
t2.workload_group_id,
t1.scan_rows,
t1.scan_bytes
from
(select query_id, query_type, sum(scan_rows) as scan_rows,sum(scan_bytes) as scan_bytes from backend_active_tasks group by query_id,query_type)
t1 left join active_queries t2
on t1.query_id = t2.query_id
order by scan_rows desc,scan_bytes desc limit 10; -
ワークロードグループのスキャン行数/バイト数を表示します。
select
t2.workload_group_id,
sum(t1.scan_rows) as wg_scan_rows,
sum(t1.scan_bytes) as wg_scan_bytes
from
(select query_id, sum(scan_rows) as scan_rows,sum(scan_bytes) as scan_bytes from backend_active_tasks group by query_id)
t1 left join active_queries t2
on t1.query_id = t2.query_id
group by t2.workload_group_id
order by wg_scan_rows desc,wg_scan_bytes desc -
ワークロードグループのクエリキューの詳細を表示します。
select
workload_group_id,
query_id,
query_status,
now() - queue_start_time as queued_time
from
active_queries
where query_status='queued'
order by workload_group_id