メインコンテンツまでスキップ

バックアップと復元の概要

はじめに

Dorisはバックアップと復元操作をサポートしています。これらの機能により、ユーザーはデータベース、テーブル、またはパーティションのデータをリモートストレージシステムにバックアップし、必要に応じて復元することができます。

要件

  • 管理者権限: ADMIN権限を持つユーザーのみがバックアップと復元操作を実行できます。

主要概念

Snapshot: スナップショットは、データベース、テーブル、またはパーティションのデータの時点キャプチャです。スナップショットを作成する際は、スナップショットラベルを指定する必要があり、完了時にタイムスタンプが生成されます。これにより、Repository、スナップショットラベル、およびタイムスタンプを通じてスナップショットを識別できます。

Repository: バックアップファイルが保存されるリモートストレージの場所です。サポートされているリモートストレージには、S3、Azure、GCP、OSS、COS、MinIO、HDFS、およびその他のS3互換オブジェクトストレージが含まれます。

Backup Operation: バックアップ操作は、データベース、テーブル、またはパーティションのスナップショットを作成し、スナップショットファイルをリモートRepositoryにアップロードし、バックアップに関連するメタデータを保存することを含みます。

Restore Operation: 復元操作は、リモートRepositoryからバックアップを取得し、それをDorisクラスターに復元することを含みます。

主要機能

  1. データのバックアップ: Dorisでは、スナップショットを作成することで、テーブル、パーティション、またはデータベース全体のデータをバックアップできます。データはファイル形式でバックアップされ、HDFS、S3、またはその他のS3互換リモートストレージシステムに保存されます。

  2. データの復元: リモートRepositoryからバックアップデータを任意のDorisクラスターに復元できます。これには、データベース全体の復元、テーブル全体の復元、およびパーティションレベルの復元が含まれ、柔軟なデータ復旧を可能にします。

  3. スナップショット管理: データはスナップショットの形式でバックアップされます。これらのスナップショットはリモートストレージシステムにアップロードされ、必要に応じて復元できます。復元プロセスでは、スナップショットファイルをダウンロードし、それをローカルメタデータにマッピングして有効にします。

  4. データ移行: バックアップと復元に加えて、この機能は異なるDorisクラスター間でのデータ移行もサポートしています。データをリモートストレージシステムにバックアップし、別のDorisクラスターに復元することで、クラスター移行シナリオを促進できます。

  5. レプリケーション制御: データを復元する際に、復元されたデータのレプリカ数を指定して、冗長性と障害耐性を確保できます。

制限事項

  1. ストレージとコンピューティングの分離: ストレージとコンピューティングの分離モデルは、バックアップと復元をサポートしていません。

  2. 非同期Materialized Views(MTMV)はサポートされていません: 非同期materialized views(MTMV)のバックアップまたは復元はサポートされていません。これらのビューは、バックアップと復元操作では考慮されません。

  3. Storage Policiesを使用するテーブルはサポートされていません: storage policiesを使用するテーブルは、バックアップと復元操作をサポートしていません

  4. 増分バックアップ: 現在、Dorisは完全バックアップのみをサポートしています。増分バックアップ(前回のバックアップ以降に変更されたデータのみを保存)はサポートされていません。特定のパーティションをバックアップして増分バックアップを実現できます。

  5. colocate_with属性: バックアップまたは復元操作中、Dorisはテーブルのcolocate_with属性を保持しません。復元後、colocatedテーブルに対してこれを再設定する必要がある場合があります。

  6. Dynamic パーティションサポート: テーブルを復元した後、ALTER TABLEコマンドを使用してこの属性を手動で有効にする必要があります。

  7. 単一同時実行: 単一データベースでは、バックアップまたは復元タスクを同時に実行できるのは1つのみです。