CREATE ASYNC MATERIALIZED VIEW
説明
非同期マテリアライズドビューを作成するためのステートメントです。カラム名と型は、マテリアライズドビューのSQLステートメントから派生されます。カスタムカラム名は許可されていますが、カラム型は定義できません。
構文
CREATE MATERIALIZED VIEW
[ IF NOT EXISTS ] <materialized_view_name>
[ (<columns_definition>) ]
[ BUILD <build_mode> ]
[ REFRESH <refresh_method> [<refresh_trigger>]]
[ [DUPLICATE] KEY (<key_cols>) ]
[ COMMENT '<table_comment>' ]
[ PARTITION BY (
{ <partition_col>
| DATE_TRUNC(<partition_col>, <partition_unit>) }
)]
[ DISTRIBUTED BY { HASH (<distribute_cols>) | RANDOM }
[ BUCKETS { <bucket_count> | AUTO } ]
]
[ PROPERTIES (
-- Table property
<table_property>
-- Additional table properties
[ , ... ])
]
AS <query>
ここで:
columns_definition
: -- Column definition
<col_name>
[ COMMENT '<col_comment>' ]
refresh_trigger
: ON MANUAL
| ON SCHEDULE EVERY <int_value> <refresh_unit> [ STARTS '<start_time>']
| ON COMMIT
必須パラメータ
1. <materialized_view_name>
マテリアライズドビューの識別子(名前)を指定します。テーブルが作成されるデータベース内で一意である必要があります。
識別子は文字で始まる必要があります(Unicode名前サポートが有効な場合、任意の言語の文字を使用可能)。全体の識別子文字列がバッククォートで囲まれていない限り(例:
My Object)、スペースや特殊文字を含むことはできません。識別子は予約キーワードであってはいけません。
詳細については、識別子と予約キーワードの要件を参照してください。
2. <query>
マテリアライズドビューを作成する際の必須パラメータです。データを投入するSELECT文を指定します。
オプションパラメータ
1. <key_cols>
テーブルのキーカラムです。Dorisでは、キーカラムはテーブルの最初のK列である必要があります。キー制限とキーカラムの選び方の詳細については、「データモデル」章の該当セクションを参照してください。
2. <build_mode>
リフレッシュタイミング:マテリアライズドビューが作成後すぐにリフレッシュされるかどうか。
IMMEDIATE:即座にリフレッシュ。デフォルトはIMMEDIATEです。
DEFERRED:遅延リフレッシュ。
3. <refresh_method>
リフレッシュ方法:
COMPLETE:すべてのパーティションをリフレッシュ。
AUTO:増分リフレッシュを試み、前回のマテリアライズドビューリフレッシュ以降に変更されたパーティションのみリフレッシュ。増分リフレッシュが不可能な場合、すべてのパーティションがリフレッシュされます。
パーティション化されたマテリアライズドビューがCOMPLETEリフレッシュモードを使用する場合、すべてのパーティションデータの完全リフレッシュを実行し、実質的に非パーティション化マテリアライズドビューに退化します。
4. <refresh_trigger>
トリガー方法:
MANUAL:手動リフレッシュ。
ON SCHEDULE:スケジュールリフレッシュ。
ON COMMIT:トリガーリフレッシュ。ベーステーブルデータの変更がマテリアライズドビューのリフレッシュをトリガーします。
5. <refresh_unit>
定期リフレッシュの時間単位。現在サポートされている単位はMINUTE、HOUR、DAY、WEEKです。
6. <partition_col>
PARTITION BYが指定されていない場合、デフォルトで1つのパーティションのみになります。
パーティションフィールドが指定されている場合、フィールドがどのベーステーブルから来るかを自動的に推論し、ベーステーブルと同期します(現在は内部テーブルとHiveテーブルをサポート)。内部テーブルの場合、1つのパーティションフィールドのみが許可されます。
マテリアライズドビューはパーティションロールアップによってパーティション数を減らすこともできます。現在、パーティションロールアップ機能は
date_truncをサポートしています。
7. <partition_unit>
パーティションロールアップの集約粒度。現在サポートされている単位はHOUR、DAY、WEEK、QUARTER、MONTH、YEARです。
8. <start_time>
スケジュールされた開始時間は未来でなければなりません。つまり、現在時刻より後である必要があります。
9. <table_property>
内部テーブルで使用されるプロパティで、その大部分はマテリアライズドビューでも使用可能です。また、マテリアライズドビュー固有のプロパティもあり、以下に一覧表示します:
| プロパティ名 | 説明 |
|---|---|
| grace_period | クエリ書き換え時のマテリアライズドビューデータの最大許容遅延秒数。マテリアライズドビューのパーティションAとベーステーブルデータが不一致で、パーティションAの最後のリフレッシュ時間が10:15:00、現在のシステム時刻が10:15:08の場合、パーティションは透過的に書き換えられません。しかし、grace_periodが10に設定されている場合、パーティションは透過的書き換えに使用されます。 |
| excluded_trigger_tables | データリフレッシュ時に無視するカンマ区切りのテーブル名。例:table1,table2。 |
| refresh_partition_num | 単一のINSERT文でリフレッシュするパーティション数。デフォルトは1。マテリアライズドビューをリフレッシュする際、最初にリフレッシュするパーティションリストを計算し、それを複数のINSERT文に分割して順次実行します。INSERT文が失敗した場合、タスク全体が停止します。マテリアライズドビューは単一のINSERT文の原子性を保証し、失敗したINSERTは既に正常にリフレッシュされたパーティションに影響しません。 |
| workload_group | マテリアライズドビューがリフレッシュタスクを実行する際に使用するworkload_groupの名前。これは、他のビジネス操作に影響を与えないよう、データリフレッシュ時にマテリアライズドビューが使用するリソースを制限するために使用されます。workload_groupの作成と使用の詳細については、WORKLOAD-GROUPドキュメントを参照してください。 |
| partition_sync_limit | ベーステーブルのパーティションフィールドが時間型の場合、このプロパティをpartition_sync_time_unitと組み合わせて使用し、ベーステーブルと同期するパーティションの範囲を設定できます。例えば、2に設定しpartition_sync_time_unitをMONTHに設定すると、ベーステーブルの過去2か月のパーティションとデータのみが同期されます。最小値は1です。時間の経過とともに、マテリアライズドビューは各リフレッシュ時にパーティションを自動的に追加・削除します。例えば、マテリアライズドビューが現在2月と3月のデータを持っている場合、来月は自動的に2月のデータを削除し、4月のデータを追加します。 |
| partition_sync_time_unit | パーティションリフレッシュの時間単位。DAY/MONTH/YEAR をサポート(デフォルトはDAY)。 |
| partition_date_format | ベーステーブルのパーティションフィールドが文字列型の場合、partition_sync_limit機能を使用したい場合は、日付フォーマットを設定してpartition_date_format設定に従ってパーティション時間を解析できます。 |
| enable_nondeterministic_function | マテリアライズドビュー定義SQLにcurrent_date()、now()、random()などの非決定的関数の含有を許可するかどうか。trueに設定すると含有を許可し、そうでなければ許可しません。デフォルトは許可しません。 |
| use_for_rewrite | このマテリアライズドビューが透過的書き換えに参加するかどうかを示します。falseに設定すると、透過的書き換えに参加しません。デフォルトはtrueです。データモデリングシナリオで、マテリアライズドビューが直接クエリにのみ使用される場合、このプロパティを設定してマテリアライズドビューが透過的書き換えに参加しないようにし、クエリ応答速度を向上させることができます。 |
Apache Doris 2.1.10より前では、DISTRIBUTED BY句は必須です。省略するとエラーが発生します。 Apache Doris 2.1.10以降、指定されていない場合、デフォルトの分散はRANDOMになります。
Apache Doris 2.1.10/3.0.6より前では、excluded_trigger_tablesプロパティはベーステーブル名の指定のみをサポートしていました。 これらのバージョン以降、CatalogとDatabaseを含む完全修飾テーブル名をサポートするようになりました(例:internal.db1.table1)。
アクセス制御要件
このSQLコマンドを実行するユーザーは、最低限以下の権限を持つ必要があります:
| 権限 | オブジェクト | 備考 |
|---|---|---|
| CREATE_PRIV | Database | |
| SELECT_PRIV | Table, View | <query>でクエリされるテーブルまたはビューに対するSELECT_PRIV権限が必要 |
注意事項
-
マテリアライズドビューのDMLおよびDDL制限:
マテリアライズドビューは、列の型変更、列の追加、削除などのスキーマ変更操作をサポートしていません。列はマテリアライズドビュー定義SQLから派生するためです。
マテリアライズドビューは手動のinsert intoやinsert overwrite操作をサポートしていません。
-
パーティション化マテリアライズドビューの作成条件:
マテリアライズドビューのSQL定義とパーティションフィールドは、パーティション化増分更新を実行するために以下の条件を満たす必要があります:
- マテリアライズドビューで使用されるベーステーブルの少なくとも1つがパーティションテーブルである必要があります。
- マテリアライズドビューで使用されるパーティション化ベーステーブルは、ListまたはRangeパーティショニング戦略を使用する必要があります。
- マテリアライズドビュー定義SQLのPartition By句には1つのパーティションフィールドのみを指定できます。
- マテリアライズドビューSQLのPartition By句のパーティションフィールドはSelect句の後に現れる必要があります。
- マテリアライズドビュー定義SQLでGroup Byを使用する場合、パーティションフィールドはGroup By句の後に現れる必要があります。
- マテリアライズドビュー定義SQLでWindow関数を使用する場合、パーティションフィールドはPartition By句の後に現れる必要があります。
- データ変更はパーティションテーブルで発生する必要があります。非パーティションテーブルで発生した場合、マテリアライズドビューは完全ビルドが必要です。
- マテリアライズドビューがJoinのNULL生成側のフィールドをパーティションフィールドとして使用する場合、パーティション化増分更新を実行できません。例えば、LEFT OUTER JOINの場合、パーティションフィールドは右側ではなく左側にある必要があります。
例
- 非パーティション化マテリアライズドビュー
CREATE MATERIALIZED VIEW complete_mv (
orderdate COMMENT 'Order date',
orderkey COMMENT 'Order key',
partkey COMMENT 'Part key'
)
BUILD IMMEDIATE
REFRESH AUTO
ON SCHEDULE EVERY 1 DAY STARTS '2024-12-01 20:30:00'
DISTRIBUTED BY HASH (orderkey) BUCKETS 2
PROPERTIES
("replication_num" = "1")
AS
SELECT
o_orderdate,
l_orderkey,
l_partkey
FROM
orders
LEFT JOIN lineitem ON l_orderkey = o_orderkey
LEFT JOIN partsupp ON ps_partkey = l_partkey
and l_suppkey = ps_suppkey;
- パーティション化されたマテリアライズドビュー
以下に示すように、パーティションカラムが指定されている場合、システムは自動的にそのカラムがどのベーステーブルから来ているかを識別し、ベーステーブルのパーティションを同期します。ベーステーブルは日別でパーティション化されており(パーティションカラム:o_orderdate、パーティションタイプ:RANGE)、マテリアライズドビューは月別でパーティション化され、DATE_TRUNC関数を使用してベーステーブルのパーティションを月単位でロールアップします。
CREATE TABLE IF NOT EXISTS orders (
o_orderkey integer not null,
o_custkey integer not null,
o_orderstatus char(1) not null,
o_totalprice decimalv3(15,2) not null,
o_orderdate date not null,
o_orderpriority char(15) not null,
o_clerk char(15) not null,
o_shippriority integer not null,
o_comment varchar(79) not null
)
DUPLICATE KEY(o_orderkey, o_custkey)
PARTITION BY RANGE(o_orderdate)(
FROM ('2023-10-16') TO ('2023-11-30') INTERVAL 1 DAY
)
DISTRIBUTED BY HASH(o_orderkey) BUCKETS 3
PROPERTIES (
"replication_num" = "3"
);
CREATE MATERIALIZED VIEW partition_mv
BUILD IMMEDIATE
REFRESH AUTO
ON SCHEDULE EVERY 1 DAY STARTS '2024-12-01 20:30:00'
PARTITION BY (DATE_TRUNC(o_orderdate, 'MONTH'))
DISTRIBUTED BY HASH (l_orderkey) BUCKETS 2
PROPERTIES
("replication_num" = "3")
AS
SELECT
o_orderdate,
l_orderkey,
l_partkey
FROM
orders
LEFT JOIN lineitem ON l_orderkey = o_orderkey
LEFT JOIN partsupp ON ps_partkey = l_partkey
and l_suppkey = ps_suppkey;
以下の例では、パーティション列が非date_trunc関数を使用しているため、パーティション化されたマテリアライズドビューを作成できません。エラーメッセージは次の通りです:because column to check use invalid implicit expression, invalid expression is min(o_orderdate#4)
CREATE MATERIALIZED VIEW partition_mv_2
BUILD IMMEDIATE
REFRESH AUTO
ON SCHEDULE EVERY 1 DAY STARTS '2024-12-01 20:30:00'
PARTITION BY (DATE_TRUNC(min_orderdate, 'MONTH'))
DISTRIBUTED BY HASH (l_orderkey) BUCKETS 2
PROPERTIES
("replication_num" = "3")
AS
SELECT
min(o_orderdate) AS min_orderdate,
l_orderkey,
l_partkey
FROM
orders
LEFT JOIN lineitem ON l_orderkey = o_orderkey
LEFT JOIN partsupp ON ps_partkey = l_partkey
and l_suppkey = ps_suppkey
GROUP BY
o_orderdate,
l_orderkey,
l_partkey;
- マテリアライズドビューのプロパティの変更 ALTER MATERIALIZED VIEW文を使用します。
例:
ALTER MATERIALIZED VIEW partition_mv
SET (
"grace_period" = "10",
"excluded_trigger_tables" = "lineitem,partsupp"
);
- マテリアライズドビューのリフレッシュモードの変更 ALTER MATERIALIZED VIEW文を使用します。 例:
ALTER MATERIALIZED VIEW partition_mv REFRESH COMPLETE;
After running SHOW CREATE MATERIALIZED VIEW partition_mv;, you can see that the refresh mode has been changed to COMPLETE.