メインコンテンツまでスキップ

Load High Availability

概要

Dorisは、データインポート中の高可用性を確保するために様々なメカニズムを提供します。この記事では、Dorisのデフォルトのインポート動作と、インポートの可用性を向上させるための追加オプション、特に最小書き込みレプリカ数機能について詳しく説明します。

Majority Write

デフォルトでは、Dorisはデータの信頼性と一貫性を確保するために多数決書き込み戦略を採用しています:

  • インポートは、正常に書き込まれたレプリカ数が総レプリカ数の半分を超えた場合に成功とみなされます。
  • 例えば、3つのレプリカを持つテーブルの場合、インポートが成功とみなされるためには少なくとも2つのレプリカが正常に書き込まれる必要があります。

動作原理

  1. データ配布: インポートタスクは最初にすべての関連するBEノードにデータを配布します。

  2. 並列書き込み: 各BEノードは並列でデータ書き込み操作を処理します。

  3. 書き込み確認: データ書き込み完了後、各BEノードはFEに確認を送信します。

  4. 多数決判定: FEは正常に書き込まれたレプリカ数をカウントし、多数に達した時点でインポートを成功とみなします。

  5. トランザクションコミット: FEはインポートトランザクションをコミットし、データを外部から見えるようにします。

  6. 非同期レプリケーション: 正常に書き込まれなかったレプリカについては、システムがバックグラウンドで非同期的にデータをレプリケートし、すべてのレプリカ間で最終的な一貫性を確保します。

多数決書き込み戦略は、データの信頼性とシステムの可用性の間でのDorisのバランスです。特別な要件がある場面では、Dorisは最小書き込みレプリカ数などの他のオプションを提供し、システムの柔軟性をさらに向上させます。

最小書き込みレプリカ数

多数決書き込み戦略はデータの信頼性を確保しますが、特定のシナリオではシステムの可用性に影響を与える可能性があります。例えば、2つのレプリカという状況では、インポートを完了するために両方のレプリカが正常に書き込まれる必要があり、インポートプロセス中にレプリカが利用できなくなることが許されないことを意味します。

この問題に対処し、インポートの可用性を向上させるために、DorisはMin Load Replica Numオプションを提供します。

機能説明

最小書き込みレプリカ数により、ユーザーはデータインポート中に正常に書き込まれる必要があるレプリカの最小数を指定できます。正常に書き込まれたレプリカ数がこの値以上になった場合、インポートは成功とみなされます。

使用ケース

  • 一部のノードが利用できない場合でも、データインポートを保証する必要がある場合。

  • データインポート速度に対する要件が高く、ユーザーがより高い可用性のために一部の信頼性を犠牲にしても良い場合。

設定方法

1. 単一テーブル設定

a. テーブル作成時に設定:

CREATE TABLE example_table
(
id INT,
name STRING
)
DUPLICATE KEY(id)
DISTRIBUTED BY HASH(id) BUCKETS 10
PROPERTIES
(
'replication_num' = '3',
'min_load_replica_num' = '2'
);

b. 既存のテーブルを変更する:

ALTER TABLE example_table
SET ( 'min_load_replica_num' = '2' );

2. グローバル設定

FE設定項目min_load_replica_numにより設定します。

  • 有効値:0より大きい値

  • デフォルト値:-1(グローバル最小書き込みレプリカ数が無効であることを示す)

優先度:テーブルプロパティ > グローバル設定 > デフォルト過半数ルール

テーブルプロパティが設定されていない、または無効で、グローバル設定が有効な場合、テーブルの最小書き込みレプリカ数は: min(FE設定のmin_load_replica_num, テーブルのレプリカ数/2 + 1)

FE設定項目の表示と変更については、FE設定ドキュメントを参照してください。

その他の高可用性メカニズム

最小書き込みレプリカ数オプションに加えて、Dorisはインポートの可用性を向上させるため、以下のメカニズムも採用しています:

  1. インポート再試行:一時的な障害により失敗したインポートタスクを自動的に再試行します。

  2. 負荷分散:インポートタスクを異なるBEノードに分散し、単一ポイントへの過度な負荷を回避します。

  3. トランザクションメカニズム:データの整合性を保証し、障害時は自動的にロールバックします。