クラスターのアップグレード
Dorisはローリングアップグレード機能を提供し、FEノードとBEノードを段階的にアップグレードして、ダウンタイムを最小限に抑え、アップグレードプロセス中もシステムが動作し続けることを保証します。
バージョン互換性
Dorisのバージョニングは3つの要素から構成されます:最初の数字はメジャーマイルストーンバージョンを表し、2番目の数字は機能バージョンを示し、3番目の数字はバグ修正に対応します。バグ修正バージョンでは新機能は導入されません。例えば、Dorisバージョン2.1.3では、「2」は2番目のマイルストーンバージョンを示し、「1」はこのマイルストーン下の機能バージョンを表し、「3」はこの機能バージョンに対する3番目のバグ修正を表します。
バージョンアップグレード時は、以下のルールが適用されます:
-
3桁バージョン: 最初の2桁が同じバージョンは、3桁バージョン間で直接アップグレードできます。例えば、バージョン2.1.3は直接バージョン2.1.7にアップグレードできます。
-
2桁および1桁バージョン: 2桁バージョンのクロスバージョンアップグレードは互換性の問題により推奨されません。各2桁バージョンを順次経由してアップグレードすることを推奨します。例えば、バージョン3.0から3.3にアップグレードする場合は、3.0 -> 3.1 -> 3.2 -> 3.3の順序に従う必要があります。
詳細なバージョン情報はversioning rulesで確認できます。
アップグレード時の注意事項
アップグレードを実行する際は、以下の点に注意してください:
-
バージョン間の動作変更: アップグレード前にRelease 注を確認して互換性の問題を特定してください。
-
クラスター内のタスクに再試行メカニズムを追加: アップグレード中はノードが順次再起動されます。クエリタスクとStream Loadインポートジョブでタスクの失敗を避けるために、再試行メカニズムが配置されていることを確認してください。flink-doris-connectorまたはspark-doris-connectorを使用するRoutine Loadジョブはコード内に既に再試行メカニズムが含まれており、追加のロジックは必要ありません。
-
レプリカ修復およびバランス機能を無効化: アップグレードプロセス中はこれらの機能を無効化してください。アップグレード結果に関わらず、アップグレード完了後にこれらの機能を再度有効化してください。
メタデータ互換性テスト
プロダクション環境では、高可用性のために少なくとも3つのFEノードを設定することを推奨します。FEノードが1つしかない場合は、アップグレード前にメタデータ互換性テストを実行する必要があります。メタデータ互換性は非常に重要であり、非互換性はアップグレード失敗とデータ損失を引き起こす可能性があります。各アップグレード前にメタデータ互換性テストを実施することを推奨し、以下の点にご留意ください:
-
FEノードの使用を避けるため、可能な限り開発マシンまたはBEノードでメタデータ互換性テストを実行してください。
-
FEノードでテストを実施する必要がある場合は、非Masterノードを使用し、元のFEプロセスを停止してください。
アップグレード前に、メタデータ非互換性による失敗を防ぐためにメタデータ互換性テストを実施してください。
-
メタデータ情報のバックアップ:
アップグレードを開始する前に、Master FEノードのメタデータをバックアップしてください。
show frontendsコマンドを使用し、IsMaster列を参照してMaster FEノードを特定してください。FEメタデータはFEノードを停止せずにホットバックアップできます。デフォルトでは、FEメタデータはfe/doris-metaディレクトリに格納されます。これはfe.conf設定ファイルのmeta_dirパラメータで確認できます。 -
テストFEノードの
fe.conf設定ファイルを変更:vi ${DORIS_NEW_HOME}/conf/fe.conf
以下のポート情報を変更し、すべてのポートが本番環境のものと異なることを確認し、clusterIDパラメータを更新してください:
...
## modify port
http_port = 18030
rpc_port = 19020
query_port = 19030
arrow_flight_sql_port = 19040
edit_log_port = 19010
## modify clusterID
clusterId=<a_new_clusterID, such as 123456>
...
-
バックアップされたMaster FEメタデータを新しい互換性テスト環境にコピーします。
cp ${DORIS_OLD_HOME}/fe/doris-meta/* ${DORIS_NEW_HOME}/fe/doris-meta -
コピーしたメタデータディレクトリ内の
VERSIONファイルを編集して、cluster_idを新しいクラスターIDに更新します。例えば、例に示すように123456に変更します:vi ${DORIS_NEW_HOME}/fe/doris-meta/image/VERSION
clusterId=123456 -
テスト環境でFEプロセスを開始します。
sh ${DORIS_NEW_HOME}/bin/start_fe.sh --daemon --metadata_failure_recovery
バージョン2.0.2より前のバージョンでは、FEプロセスを開始する前にfe.confファイルにmetadata_failure_recoveryパラメータを追加してください:
echo "metadata_failure_recovery=true" >> ${DORIS_NEW_HOME}/conf/fe.conf
sh ${DORIS_NEW_HOME}/bin/start_fe.sh --daemon
-
MySQLコマンドを使用して現在のFEに接続することで、FEプロセスが正常に開始されたことを確認します。例えば、上記で言及したクエリポート
19030を使用します:mysql -uroot -P19030 -h127.0.0.1
アップグレード手順
アップグレードの詳細なプロセスは次のとおりです:
-
レプリカ修復およびバランス機能を無効にする
-
BEノードをアップグレードする
-
FEノードをアップグレードする
-
レプリカ修復およびバランス機能を有効にする
アップグレードプロセス中は、BEノードを最初にアップグレードし、その後FEノードをアップグレードする原則に従う必要があります。FEをアップグレードする際は、Observer FEとFollower FEノードを最初にアップグレードし、その後Master FEノードをアップグレードします。
一般的に、FEディレクトリ下の/binおよび/libディレクトリと、BEディレクトリ下の/binおよび/libディレクトリのみをアップグレードする必要があります。
バージョン2.0.2以降では、FEとBEのデプロイメントパス下にcustom_lib/ディレクトリが追加されました(存在しない場合は手動で作成できます)。custom_lib/ディレクトリは、hadoop-lzo-*.jar、orai18n.jarなどのユーザー定義のサードパーティjarファイルを格納するために使用されます。このディレクトリはアップグレード中に置き換える必要はありません。
ステップ1: レプリカ修復およびバランス機能を無効にする
アップグレードプロセス中にノードが再起動され、不要なクラスターバランシングおよびレプリカ修復ロジックがトリガーされる可能性があります。まず次のコマンドを使用してこれらの機能を無効にします:
admin set frontend config("disable_balance" = "true");
admin set frontend config("disable_colocate_balance" = "true");
admin set frontend config("disable_tablet_scheduler" = "true");
ステップ2: BEノードのアップグレード
データの安全性を確保するため、アップグレードのミスや失敗によるデータ損失を避けるために、3つのレプリカを使用してデータを保存してください。
-
マルチレプリカクラスターでは、1つのBEノードでプロセスを停止し、段階的なアップグレードを実行することを選択できます:
sh ${DORIS_OLD_HOME}/be/bin/stop_be.sh -
BEディレクトリ内の
/binおよび/libディレクトリの名前を変更します:mv ${DORIS_OLD_HOME}/be/bin ${DORIS_OLD_HOME}/be/bin_back
mv ${DORIS_OLD_HOME}/be/lib ${DORIS_OLD_HOME}/be/lib_back -
新しいバージョンの
/binおよび/libディレクトリを元のBEディレクトリにコピーします:cp -r ${DORIS_NEW_HOME}/be/bin ${DORIS_OLD_HOME}/be/bin
cp -r ${DORIS_NEW_HOME}/be/lib ${DORIS_OLD_HOME}/be/lib -
BEノードを開始します:
sh ${DORIS_OLD_HOME}/be/bin/start_be.sh --daemon -
クラスターに接続してノード情報を確認します:
show backends\G
BEノードのaliveステータスがtrueで、Version値が新しいバージョンである場合、ノードのアップグレードは正常に完了しています。
ステップ3: FEノードのアップグレード
-
複数FEノード構成では、アップグレード用にMaster以外のノードを選択し、まずそれを停止します:
sh ${DORIS_OLD_HOME}/fe/bin/stop_fe.sh -
FEディレクトリ内の
/bin、/lib、および/mysql_ssl_default_certificateディレクトリの名前を変更します:mv ${DORIS_OLD_HOME}/fe/bin ${DORIS_OLD_HOME}/fe/bin_back
mv ${DORIS_OLD_HOME}/fe/lib ${DORIS_OLD_HOME}/fe/lib_back
mv ${DORIS_OLD_HOME}/fe/mysql_ssl_default_certificate ${DORIS_OLD_HOME}/fe/mysql_ssl_default_certificate_back -
新しいバージョンの
/bin、/lib、および/mysql_ssl_default_certificateディレクトリを元のFEディレクトリにコピーします:cp -r ${DORIS_NEW_HOME}/fe/bin ${DORIS_OLD_HOME}/fe/bin
cp -r ${DORIS_NEW_HOME}/fe/lib ${DORIS_OLD_HOME}/fe/lib
cp -r ${DORIS_NEW_HOME}/fe/mysql_ssl_default_certificate ${DORIS_OLD_HOME}/fe/mysql_ssl_default_certificate -
FEノードを起動します:
sh ${DORIS_OLD_HOME}/fe/bin/start_fe.sh --daemon -
クラスターに接続してノード情報を確認します:
show frontends\G
FEノードのaliveステータスがtrueで、Version値が新しいバージョンの場合、そのノードは正常にアップグレードされています。
- 他のFEノードを順番にアップグレードし、最後にMasterノードをアップグレードします。
Step 4: レプリカ修復とバランス機能の有効化
アップグレードが完了し、すべてのBEノードのステータスがAliveになった後、クラスタのレプリカ修復とバランス機能を有効にします:
admin set frontend config("disable_balance" = "false");
admin set frontend config("disable_colocate_balance" = "false");
admin set frontend config("disable_tablet_scheduler" = "false");