メインコンテンツまでスキップ

クラスターのアップグレード

Dorisはローリングアップグレード機能を提供し、FEノードとBEノードを段階的にアップグレードして、ダウンタイムを最小限に抑え、アップグレードプロセス中もシステムが動作し続けることを保証します。

バージョン互換性

Dorisのバージョニングは3つの要素から構成されます:最初の数字はメジャーマイルストーンバージョンを表し、2番目の数字は機能バージョンを示し、3番目の数字はバグ修正に対応します。バグ修正バージョンでは新機能は導入されません。例えば、Dorisバージョン2.1.3では、「2」は2番目のマイルストーンバージョンを示し、「1」はこのマイルストーン下の機能バージョンを表し、「3」はこの機能バージョンに対する3番目のバグ修正を表します。

バージョンアップグレード時は、以下のルールが適用されます:

  • 3桁バージョン: 最初の2桁が同じバージョンは、3桁バージョン間で直接アップグレードできます。例えば、バージョン2.1.3は直接バージョン2.1.7にアップグレードできます。

  • 2桁および1桁バージョン: 2桁バージョンのクロスバージョンアップグレードは互換性の問題により推奨されません。各2桁バージョンを順次経由してアップグレードすることを推奨します。例えば、バージョン3.0から3.3にアップグレードする場合は、3.0 -> 3.1 -> 3.2 -> 3.3の順序に従う必要があります。

詳細なバージョン情報はversioning rulesで確認できます。

アップグレード時の注意事項

アップグレードを実行する際は、以下の点に注意してください:

  • バージョン間の動作変更: アップグレード前にRelease 注を確認して互換性の問題を特定してください。

  • クラスター内のタスクに再試行メカニズムを追加: アップグレード中はノードが順次再起動されます。クエリタスクとStream Loadインポートジョブでタスクの失敗を避けるために、再試行メカニズムが配置されていることを確認してください。flink-doris-connectorまたはspark-doris-connectorを使用するRoutine Loadジョブはコード内に既に再試行メカニズムが含まれており、追加のロジックは必要ありません。

  • レプリカ修復およびバランス機能を無効化: アップグレードプロセス中はこれらの機能を無効化してください。アップグレード結果に関わらず、アップグレード完了後にこれらの機能を再度有効化してください。

メタデータ互換性テスト

Note

プロダクション環境では、高可用性のために少なくとも3つのFEノードを設定することを推奨します。FEノードが1つしかない場合は、アップグレード前にメタデータ互換性テストを実行する必要があります。メタデータ互換性は非常に重要であり、非互換性はアップグレード失敗とデータ損失を引き起こす可能性があります。各アップグレード前にメタデータ互換性テストを実施することを推奨し、以下の点にご留意ください:

  • FEノードの使用を避けるため、可能な限り開発マシンまたはBEノードでメタデータ互換性テストを実行してください。

  • FEノードでテストを実施する必要がある場合は、非Masterノードを使用し、元のFEプロセスを停止してください。

アップグレード前に、メタデータ非互換性による失敗を防ぐためにメタデータ互換性テストを実施してください。

  1. メタデータ情報のバックアップ:

    アップグレードを開始する前に、Master FEノードのメタデータをバックアップしてください。

    show frontendsコマンドを使用し、IsMaster列を参照してMaster FEノードを特定してください。FEメタデータはFEノードを停止せずにホットバックアップできます。デフォルトでは、FEメタデータはfe/doris-metaディレクトリに格納されます。これはfe.conf設定ファイルのmeta_dirパラメータで確認できます。

  2. テストFEノードのfe.conf設定ファイルを変更:

    vi ${DORIS_NEW_HOME}/conf/fe.conf

以下のポート情報を変更し、すべてのポートが本番環境のものと異なることを確認し、clusterIDパラメータを更新してください:

...
## modify port
http_port = 18030
rpc_port = 19020
query_port = 19030
arrow_flight_sql_port = 19040
edit_log_port = 19010

## modify clusterID
clusterId=<a_new_clusterID, such as 123456>
...
  1. バックアップされたMaster FEメタデータを新しい互換性テスト環境にコピーします。

    cp ${DORIS_OLD_HOME}/fe/doris-meta/* ${DORIS_NEW_HOME}/fe/doris-meta
  2. コピーしたメタデータディレクトリ内のVERSIONファイルを編集して、cluster_idを新しいクラスターIDに更新します。例えば、例に示すように123456に変更します:

    vi ${DORIS_NEW_HOME}/fe/doris-meta/image/VERSION
    clusterId=123456
  3. テスト環境でFEプロセスを開始します。

    sh ${DORIS_NEW_HOME}/bin/start_fe.sh --daemon --metadata_failure_recovery

バージョン2.0.2より前のバージョンでは、FEプロセスを開始する前にfe.confファイルにmetadata_failure_recoveryパラメータを追加してください:

echo "metadata_failure_recovery=true" >> ${DORIS_NEW_HOME}/conf/fe.conf
sh ${DORIS_NEW_HOME}/bin/start_fe.sh --daemon
  1. MySQLコマンドを使用して現在のFEに接続することで、FEプロセスが正常に開始されたことを確認します。例えば、上記で言及したクエリポート19030を使用します:

    mysql -uroot -P19030 -h127.0.0.1

アップグレード手順

アップグレードの詳細なプロセスは次のとおりです:

  1. レプリカ修復およびバランス機能を無効にする

  2. BEノードをアップグレードする

  3. FEノードをアップグレードする

  4. レプリカ修復およびバランス機能を有効にする

アップグレードプロセス中は、BEノードを最初にアップグレードし、その後FEノードをアップグレードする原則に従う必要があります。FEをアップグレードする際は、Observer FEとFollower FEノードを最初にアップグレードし、その後Master FEノードをアップグレードします。

Note

一般的に、FEディレクトリ下の/binおよび/libディレクトリと、BEディレクトリ下の/binおよび/libディレクトリのみをアップグレードする必要があります。

バージョン2.0.2以降では、FEとBEのデプロイメントパス下にcustom_lib/ディレクトリが追加されました(存在しない場合は手動で作成できます)。custom_lib/ディレクトリは、hadoop-lzo-*.jarorai18n.jarなどのユーザー定義のサードパーティjarファイルを格納するために使用されます。このディレクトリはアップグレード中に置き換える必要はありません。

ステップ1: レプリカ修復およびバランス機能を無効にする

アップグレードプロセス中にノードが再起動され、不要なクラスターバランシングおよびレプリカ修復ロジックがトリガーされる可能性があります。まず次のコマンドを使用してこれらの機能を無効にします:

admin set frontend config("disable_balance" = "true");
admin set frontend config("disable_colocate_balance" = "true");
admin set frontend config("disable_tablet_scheduler" = "true");

ステップ2: BEノードのアップグレード

注記:

データの安全性を確保するため、アップグレードのミスや失敗によるデータ損失を避けるために、3つのレプリカを使用してデータを保存してください。

  1. マルチレプリカクラスターでは、1つのBEノードでプロセスを停止し、段階的なアップグレードを実行することを選択できます:

    sh ${DORIS_OLD_HOME}/be/bin/stop_be.sh
  2. BEディレクトリ内の/binおよび/libディレクトリの名前を変更します:

    mv ${DORIS_OLD_HOME}/be/bin ${DORIS_OLD_HOME}/be/bin_back
    mv ${DORIS_OLD_HOME}/be/lib ${DORIS_OLD_HOME}/be/lib_back
  3. 新しいバージョンの /bin および /lib ディレクトリを元のBEディレクトリにコピーします:

    cp -r ${DORIS_NEW_HOME}/be/bin ${DORIS_OLD_HOME}/be/bin
    cp -r ${DORIS_NEW_HOME}/be/lib ${DORIS_OLD_HOME}/be/lib
  4. BEノードを開始します:

    sh ${DORIS_OLD_HOME}/be/bin/start_be.sh --daemon
  5. クラスターに接続してノード情報を確認します:

    show backends\G

BEノードのaliveステータスがtrueで、Version値が新しいバージョンである場合、ノードのアップグレードは正常に完了しています。

ステップ3: FEノードのアップグレード

  1. 複数FEノード構成では、アップグレード用にMaster以外のノードを選択し、まずそれを停止します:

    sh ${DORIS_OLD_HOME}/fe/bin/stop_fe.sh
  2. FEディレクトリ内の/bin/lib、および/mysql_ssl_default_certificateディレクトリの名前を変更します:

    mv ${DORIS_OLD_HOME}/fe/bin ${DORIS_OLD_HOME}/fe/bin_back
    mv ${DORIS_OLD_HOME}/fe/lib ${DORIS_OLD_HOME}/fe/lib_back
    mv ${DORIS_OLD_HOME}/fe/mysql_ssl_default_certificate ${DORIS_OLD_HOME}/fe/mysql_ssl_default_certificate_back
  3. 新しいバージョンの /bin/lib、および /mysql_ssl_default_certificate ディレクトリを元のFEディレクトリにコピーします:

    cp -r ${DORIS_NEW_HOME}/fe/bin ${DORIS_OLD_HOME}/fe/bin
    cp -r ${DORIS_NEW_HOME}/fe/lib ${DORIS_OLD_HOME}/fe/lib
    cp -r ${DORIS_NEW_HOME}/fe/mysql_ssl_default_certificate ${DORIS_OLD_HOME}/fe/mysql_ssl_default_certificate
  4. FEノードを起動します:

    sh ${DORIS_OLD_HOME}/fe/bin/start_fe.sh --daemon
  5. クラスターに接続してノード情報を確認します:

    show frontends\G

FEノードのaliveステータスがtrueで、Version値が新しいバージョンの場合、そのノードは正常にアップグレードされています。

  1. 他のFEノードを順番にアップグレードし、最後にMasterノードをアップグレードします。

Step 4: レプリカ修復とバランス機能の有効化

アップグレードが完了し、すべてのBEノードのステータスがAliveになった後、クラスタのレプリカ修復とバランス機能を有効にします:

admin set frontend config("disable_balance" = "false");
admin set frontend config("disable_colocate_balance" = "false");
admin set frontend config("disable_tablet_scheduler" = "false");