メインコンテンツまでスキップ

エラスティックスケーリング

Dorisはオンライン弾性スケーリングをサポートしており、ユーザーはサービスを中断することなく動的にノードを追加または削除できます。この機能により、企業は増大する需要に対応したり、アイドル状態のリソースの無駄を削減したりすることができます。BEノードのスケールアップまたはスケールダウンはクラスターの可用性に影響しませんが、データ移行を伴うため、ビジネス活動が少ない期間にスケーリング操作を実行することを推奨します。

FEクラスターのScale In/Out

Doris FEノードは以下の3つの役割に分かれており、各FEノードにはメタデータの完全なセットが含まれています:

  • Master Node:メタデータの読み取りと書き込みを担当します。Master nodeでメタデータの変更が発生すると、BDB JEプロトコルを介してnon-Masterノードに同期されます。クラスター内には1つのMaster FEノードのみが存在できます。

  • Follower Node:メタデータの読み取りを担当します。Master nodeに障害が発生した場合、Followerノードがリーダー選出を開始して新しいMaster nodeを選択します。クラスター内では、MasterとFollowerノードの総数は奇数にすることが推奨されます。

  • Observer Node:メタデータの読み取りを担当しますが、リーダー選出には参加しません。FEノードの読み取りサービス容量を拡張するために使用されます。

通常、各FEノードは10-20個のBEノードの負荷操作を処理できます。3つのFEノードの構成は、ほとんどのビジネスシナリオの要件を満たすのに十分です。

FEのScale out

Note:

新しいFEノードを追加する際は、以下の点にご注意ください:

  • 新しいFEノードのhttp_portは、クラスター内の既存のすべてのFEノードのhttp_portと一致する必要があります。

  • Followerノードを追加する場合、クラスター内のMasterとFollowerノードの総数は奇数にすることが推奨されます。

  • show frontendsコマンドを使用して、現在のクラスターノードのポートと役割を確認できます。

  1. FE Nodeを開始:
fe/bin/start_fe.sh --helper <leader_fe_host>:<edit_log_port> --daemon
  • FE Nodeの登録:

    • ノードをFollower FEとして登録:

      ALTER SYSTEM ADD FOLLOWER "<follower_host>:<edit_log_port>";
  • ノードをObserver FEとして登録する:

    ALTER SYSTEM ADD OBSERVER "<observer_host>:<edit_log_port>";
  • 新しく追加されたFEノードのステータスを確認する

    show frontends;

FE クラスターでのスケールイン

FE ノードをスケールインする際は、クラスター内の Master および Follower ノードの総数が奇数のままであることを確認してください。ノードを削除するには、以下のコマンドを使用します:

ALTER SYSTEM DROP FOLLOWER[OBSERVER] "<fe_host>:<edit_log_port>";

スケールイン後、FEディレクトリを手動で削除する必要があります。

BEクラスターのスケールイン/アウト

BEクラスターのスケールアウト

  1. BEプロセスを開始します:

    be/bin/start_be.sh
  2. BEノードを登録します:

    ALTER SYSTEM ADD backend '<be_host>:<be_heartbeat_service_port>';

BE クラスターのスケールイン

BE ノードをスケールインする際は、DROP または DECOMMISSION のいずれかの方法を選択できます:

DROPDECOMMISSION
原理ノードを直接削除し、BE ノードを削除します。BE ノード上のデータを他のノードに移行するコマンドを開始します。移行が完了すると、BE ノードは自動的に削除されます。
有効時間実行後すぐに有効になります。データ移行が完了した後に有効になります。クラスターの既存データ量によっては、数時間から最大1日かかる場合があります。
シングルレプリカテーブルの処理データ損失が発生する可能性があります。データ損失は発生しません。
複数ノードの同時削除データ損失が発生する可能性があります。データ損失は発生しません。
本番環境での推奨本番環境では推奨されません。本番環境で推奨されます。
  • DROP 方法を使用して BE ノードを削除するには、以下のコマンドを使用します:

    ALTER SYSTEM DROP backend "<be_host>:<be_heartbeat_service_port>";
  • DECOMMISSION方法を使用してBEノードを削除するには、以下のコマンドを使用します:

    ALTER SYSTEM DECOMMISSION backend "<be_host>:<be_heartbeat_service_port>";

DECOMMISSIONコマンドの説明:

  • DECOMMISSIONは非同期操作です。実行後、SHOW backends;でBEノードのSystemDecommissionedステータスがtrueに設定されていることを確認できます。これは、そのノードが削除中であることを示します。

  • DECOMMISSIONコマンドは失敗する場合があります。例えば、削除対象のBEからのデータを格納するために残りのBEノードに十分なストレージ領域がない場合、または残りのノードが最小レプリケーション要件を満たさない場合、コマンドは完了せず、BEはSystemDecommissionedtrueに設定された状態のままになります。

  • DECOMMISSIONの進行状況はSHOW PROC '/backends';を使用して監視できます。操作が進行中の場合、TabletNumの値は継続的に減少します。

  • CANCEL DECOMMISSION BACKEND "be_host:be_heartbeat_service_port";コマンドを使用して操作をキャンセルできます。キャンセル後、BEノードは現在の残りのデータを保持し、Dorisは負荷を再バランスします。

  • データ移行速度はbalance_slot_num_per_pathパラメータを変更することで調整できます。