キャッシュメモリ解析
Dorisによって管理されるキャッシュは、現在すべてLRU削除戦略を使用しており、すべてパラメータを通じて容量と削除時間を個別に制御することをサポートしています。
Doris キャッシュタイプ
- Page Cache
データスキャンの高速化に使用されます。
- DataPageCache: Cache data Page.
- IndexPageCache: Cache data Page index.
- PKIndexPageCache: Cache Page primary key index.
- Metadata Cache
メタデータ読み取りを高速化するために使用されます。
- SegmentCache: Cache open Segments, such as index information.
- SchemaCache: Cache Rowset Schema.
- TabletSchemaCache: Cache Tablet Schema.
- CreateTabletRRIdxCache: Cache Create Tabelt index.
- MowTabletVersionCache: Cache Mow Tablet Version.
- MowDeleteBitmapAggCache: Cache Mow DeleteBitmap.
- Cloud Cache
クラウド上の専用キャッシュ。
- CloudTabletCache: Cache Tablet on the Cloud.
- CloudTxnDeleteBitmapCache: Cache DeleteBitmap on Cloud.
- Inverted Index Cache
転置インデックスを高速化します。
- InvertedIndexSearcherCache
- InvertedIndexQueryCache
- Point Query Cache
ポイントクエリの実行を高速化し、主にログ解析に使用されます。
- PointQueryRowCache
- PointQueryLookupConnectionCache
- その他のCache
- FileCache: File cache used by external table queries and Cloud.
- CommonObjLRUCache
- LastSuccessChannelCache
Doris Cache View Method
Doris Cacheに関連する指標を表示する方法は3つあります。
- Doris BE Metrics
Webページ http://{be_host}:{be_web_server_port}/metrics では、BEプロセスメモリ監視(Metrics)を確認でき、各cacheの容量、使用量、要素数、検索回数、ヒット回数などの指標が含まれます。
- `doris_be_cache_capacity{name="TabletSchemaCache"} 102400`: Cache capacity, two limiting methods: memory size or number of elements.
- `doris_be_cache_usage{name="TabletSchemaCache"} 40838`: Cache usage, memory size or number of elements, corresponding to the limit of cache capacity.
- `doris_be_cache_usage_ratio{name="TabletSchemaCache"} 0.398809`: Cache usage, equal to `(cache_usage / cache_capacity)`.
- `doris_be_cache_element_count{name="TabletSchemaCache"} 1628`: Number of cache elements, equal to Cache Usage when the cache capacity limits the number of elements.
- `doris_be_cache_lookup_count{name="TabletSchemaCache"} 63393`: Number of cache lookups.
- `doris_be_cache_hit_count{name="TabletSchemaCache"} 61765`: Number of hits when looking up the cache.
- `doris_be_cache_hit_ratio{name="TabletSchemaCache"} 0.974319`: Hit ratio, equal to `(hit_count / lookup_count)`
- Doris BE Bvar
Webページ http://{be_host}:{brpc_port}/vars/*cache* では、いくつかのcacheの固有のメトリクスを表示できます。
将来的に、Doris BE MetricsのIndicatorはDoris BE Bvarに移行される予定です。
- Memory Trakcer
各cacheがリアルタイムで占有するメモリサイズを確認するには、Global Memory Analysisを参照してください。メモリエラーが発生した場合、be/log/be.INFOログでMemory Tracker Summaryを確認できます。これには、その時点でのcacheメモリサイズが含まれています。
Doris Cache Memory Analysis
Doris BEが実行中には様々なcacheが存在します。通常、cacheメモリに注意を払う必要はありません。なぜなら、BEプロセスで利用可能メモリが不足すると、memory GCがトリガーされてまずcacheがクリーンアップされるからです。
ただし、cacheが大きすぎる場合、memory GCの負荷が増加し、queryやloadエラープロセスで利用可能メモリが不足するリスクが高まり、BEプロセスのOOM Crashのリスクが増加します。そのため、メモリが常に逼迫している場合は、cacheの上限を下げる、cacheを無効にする、またはcache entryの生存時間を短縮することを検討できます。小さなcacheは一部のシナリオでqueryパフォーマンスを低下させる可能性がありますが、通常本番環境では許容範囲です。調整後、一定期間queryとloadパフォーマンスを観察できます。
Doris 2.1以前では、Memory GCは完璧ではありませんでした。メモリが不足した際、cacheが適時に解放されない可能性がありました。メモリが常に逼迫している場合、多くの場合手動でcache制限を下げることを検討する必要がありました。
Doris 2.1.6以降、BE運用中に全てのcacheを手動でクリーンアップしたい場合は、curl http://{be_host}:{be_web_server_port}/api/clear_cache/allを実行すると、解放されたメモリサイズが返されます。
以下では、異なるcacheがより多くのメモリを使用する状況を分析します。
DataPageCacheがより多くのメモリを使用する場合
-
Doris 2.1.6以降、BE運用中に手動でクリーンアップするには
curl http://{be_host}:{be_web_server_port}/api/clear_cache/DataPageCacheを実行します。 -
curl -X POST http://{be_host}:{be_web_server_port}/api/update_config?disable_storage_page_cache=trueを実行して実行中のBEのDataPageCacheを無効にし、デフォルトで最大10分後にクリアします。ただし、これは一時的な方法です。BE再起動後、DataPageCacheは再び有効になります。 -
長期間DataPageCacheのメモリ使用量を削減することが確実な場合は、BE Configuration Itemsを参照し、
conf/be.confのstorage_page_cache_limitを削減してDataPageCacheの容量を減らす、data_page_cache_stale_sweep_time_secを削減してDataPageCache cacheの有効時間を短縮する、またはdisable_storage_page_cache=trueを追加してDataPageCacheを無効にし、その後BEプロセスを再起動します。
SegmentCacheが大量のメモリを使用する場合
-
Doris 2.1.6以降、BE運用中に手動でクリーンアップするには
curl http://{be_host}:{be_web_server_port}/api/clear_cache/SegmentCacheを実行します。 -
curl -X POST http:/{be_host}:{be_web_server_port}/api/update_config?disable_segment_cache=trueを実行して実行中のBEのSegmentCacheを無効にし、デフォルトで最大10分後にクリアしますが、これは一時的な方法であり、BE再起動後SegmentCacheは再び有効になります。 -
長期間SegmentCacheのメモリ使用量を削減することが確実な場合は、BE Configuration Itemsを参照し、
conf/be.confのsegment_cache_capacityまたはsegment_cache_memory_percentageを調整してSegmentCacheの容量を削減する、tablet_rowset_stale_sweep_time_secを削減してSegmentCache cacheの有効時間を短縮する、またはconf/be.confにdisable_segment_cache=trueを追加してSegmentCacheを無効にしてBEプロセスを再起動します。
PKIndexPageCacheが大量のメモリを使用する場合
-
Doris 2.1.6以降、BE運用中に手動でクリーンアップするには
curl http://{be_host}:{be_web_server_port}/api/clear_cache/PKIndexPageCacheを実行します。 -
BE Configuration Itemsを参照し、
conf/be.confのpk_storage_page_cache_limitを下げてPKIndexPageCacheの容量を削減する、pk_index_page_cache_stale_sweep_time_secを下げてPKIndexPageCacheの有効時間を短縮する、またはconf/be.confにdisable_pk_storage_page_cache=trueを追加してPKIndexPageCacheを無効にし、その後BEプロセスを再起動します。