メインコンテンツまでスキップ

キャッシュメモリ解析

Dorisによって管理されるキャッシュは、現在すべてLRU削除戦略を使用しており、すべてパラメータを通じて容量と削除時間を個別に制御することをサポートしています。

Doris キャッシュタイプ

  1. Page Cache

データスキャンの高速化に使用されます。

- DataPageCache: Cache data Page.
- IndexPageCache: Cache data Page index.
- PKIndexPageCache: Cache Page primary key index.
  1. Metadata Cache

メタデータ読み取りを高速化するために使用されます。

- SegmentCache: Cache open Segments, such as index information.
- SchemaCache: Cache Rowset Schema.
- TabletSchemaCache: Cache Tablet Schema.
- CreateTabletRRIdxCache: Cache Create Tabelt index.
- MowTabletVersionCache: Cache Mow Tablet Version.
- MowDeleteBitmapAggCache: Cache Mow DeleteBitmap.
  1. Cloud Cache

クラウド上の専用キャッシュ。

- CloudTabletCache: Cache Tablet on the Cloud.
- CloudTxnDeleteBitmapCache: Cache DeleteBitmap on Cloud.
  1. Inverted Index Cache

転置インデックスを高速化します。

- InvertedIndexSearcherCache
- InvertedIndexQueryCache
  1. Point Query Cache

ポイントクエリの実行を高速化し、主にログ解析に使用されます。

- PointQueryRowCache
- PointQueryLookupConnectionCache
  1. その他のCache
- FileCache: File cache used by external table queries and Cloud.
- CommonObjLRUCache
- LastSuccessChannelCache

Doris Cache View Method

Doris Cacheに関連する指標を表示する方法は3つあります。

  1. Doris BE Metrics

Webページ http://{be_host}:{be_web_server_port}/metrics では、BEプロセスメモリ監視(Metrics)を確認でき、各cacheの容量、使用量、要素数、検索回数、ヒット回数などの指標が含まれます。

- `doris_be_cache_capacity{name="TabletSchemaCache"} 102400`: Cache capacity, two limiting methods: memory size or number of elements.
- `doris_be_cache_usage{name="TabletSchemaCache"} 40838`: Cache usage, memory size or number of elements, corresponding to the limit of cache capacity.
- `doris_be_cache_usage_ratio{name="TabletSchemaCache"} 0.398809`: Cache usage, equal to `(cache_usage / cache_capacity)`.
- `doris_be_cache_element_count{name="TabletSchemaCache"} 1628`: Number of cache elements, equal to Cache Usage when the cache capacity limits the number of elements.
- `doris_be_cache_lookup_count{name="TabletSchemaCache"} 63393`: Number of cache lookups.
- `doris_be_cache_hit_count{name="TabletSchemaCache"} 61765`: Number of hits when looking up the cache.
- `doris_be_cache_hit_ratio{name="TabletSchemaCache"} 0.974319`: Hit ratio, equal to `(hit_count / lookup_count)`
  1. Doris BE Bvar

Webページ http://{be_host}:{brpc_port}/vars/*cache* では、いくつかのcacheの固有のメトリクスを表示できます。

将来的に、Doris BE MetricsのIndicatorはDoris BE Bvarに移行される予定です。

  1. Memory Trakcer

各cacheがリアルタイムで占有するメモリサイズを確認するには、Global Memory Analysisを参照してください。メモリエラーが発生した場合、be/log/be.INFOログでMemory Tracker Summaryを確認できます。これには、その時点でのcacheメモリサイズが含まれています。

Doris Cache Memory Analysis

Doris BEが実行中には様々なcacheが存在します。通常、cacheメモリに注意を払う必要はありません。なぜなら、BEプロセスで利用可能メモリが不足すると、memory GCがトリガーされてまずcacheがクリーンアップされるからです。

ただし、cacheが大きすぎる場合、memory GCの負荷が増加し、queryやloadエラープロセスで利用可能メモリが不足するリスクが高まり、BEプロセスのOOM Crashのリスクが増加します。そのため、メモリが常に逼迫している場合は、cacheの上限を下げる、cacheを無効にする、またはcache entryの生存時間を短縮することを検討できます。小さなcacheは一部のシナリオでqueryパフォーマンスを低下させる可能性がありますが、通常本番環境では許容範囲です。調整後、一定期間queryとloadパフォーマンスを観察できます。

Doris 2.1以前では、Memory GCは完璧ではありませんでした。メモリが不足した際、cacheが適時に解放されない可能性がありました。メモリが常に逼迫している場合、多くの場合手動でcache制限を下げることを検討する必要がありました。

Doris 2.1.6以降、BE運用中に全てのcacheを手動でクリーンアップしたい場合は、curl http://{be_host}:{be_web_server_port}/api/clear_cache/allを実行すると、解放されたメモリサイズが返されます。

以下では、異なるcacheがより多くのメモリを使用する状況を分析します。

DataPageCacheがより多くのメモリを使用する場合

  • Doris 2.1.6以降、BE運用中に手動でクリーンアップするにはcurl http://{be_host}:{be_web_server_port}/api/clear_cache/DataPageCacheを実行します。

  • curl -X POST http://{be_host}:{be_web_server_port}/api/update_config?disable_storage_page_cache=trueを実行して実行中のBEのDataPageCacheを無効にし、デフォルトで最大10分後にクリアします。ただし、これは一時的な方法です。BE再起動後、DataPageCacheは再び有効になります。

  • 長期間DataPageCacheのメモリ使用量を削減することが確実な場合は、BE Configuration Itemsを参照し、conf/be.confstorage_page_cache_limitを削減してDataPageCacheの容量を減らす、data_page_cache_stale_sweep_time_secを削減してDataPageCache cacheの有効時間を短縮する、またはdisable_storage_page_cache=trueを追加してDataPageCacheを無効にし、その後BEプロセスを再起動します。

SegmentCacheが大量のメモリを使用する場合

  • Doris 2.1.6以降、BE運用中に手動でクリーンアップするにはcurl http://{be_host}:{be_web_server_port}/api/clear_cache/SegmentCacheを実行します。

  • curl -X POST http:/{be_host}:{be_web_server_port}/api/update_config?disable_segment_cache=trueを実行して実行中のBEのSegmentCacheを無効にし、デフォルトで最大10分後にクリアしますが、これは一時的な方法であり、BE再起動後SegmentCacheは再び有効になります。

  • 長期間SegmentCacheのメモリ使用量を削減することが確実な場合は、BE Configuration Itemsを参照し、conf/be.confsegment_cache_capacityまたはsegment_cache_memory_percentageを調整してSegmentCacheの容量を削減する、tablet_rowset_stale_sweep_time_secを削減してSegmentCache cacheの有効時間を短縮する、またはconf/be.confdisable_segment_cache=trueを追加してSegmentCacheを無効にしてBEプロセスを再起動します。

PKIndexPageCacheが大量のメモリを使用する場合

  • Doris 2.1.6以降、BE運用中に手動でクリーンアップするにはcurl http://{be_host}:{be_web_server_port}/api/clear_cache/PKIndexPageCacheを実行します。

  • BE Configuration Itemsを参照し、conf/be.confpk_storage_page_cache_limitを下げてPKIndexPageCacheの容量を削減する、pk_index_page_cache_stale_sweep_time_secを下げてPKIndexPageCacheの有効時間を短縮する、またはconf/be.confdisable_pk_storage_page_cache=trueを追加してPKIndexPageCacheを無効にし、その後BEプロセスを再起動します。