マニュアルパーティショニング
パーティション columns
-
パーティション columnsは1つまたは複数の列として指定でき、partition columnsはKEY columnsである必要があります。
-
allow_partition_column_nullableがtrueに設定されている場合、Range partitionはNULL partition columnsの使用をサポートします。List パーティションはNULL partition columnsを常時サポートしません。 -
partition columnのタイプに関係なく、partition valuesを記述する際にはダブルクォートが必要です。
-
partitionの数には理論的に上限はありません。ただし、各テーブルはデフォルトで4096個のpartitionに制限されています。この制限を超えたい場合は、FE設定パラメータ
max_multi_partition_numとmax_dynamic_partition_numを変更できます。 -
partitioningなしでテーブルを作成する場合、システムは自動的にテーブル名と同じ名前のfull-range partitionを生成します。このpartitionはユーザーには見えず、削除や変更もできません。
-
partition作成時に範囲の重複は許可されません。
RANGE partitioning
パーティション columnsは通常、古いデータと新しいデータの便利な管理のためのtime columnsです。RANGE partitioningはDATE、DATETIME、TINYINT、SMALLINT、INT、BIGINT、LARGEINTなどのcolumn typesをサポートします。
パーティション情報は以下の4つの記述方法をサポートします:
FIXED RANGE:この方法はpartitionを左閉右開区間として定義します。
PARTITION BY RANGE(col1[, col2, ...])
(
PARTITION partition_name1 VALUES [("k1-lower1", "k2-lower1", "k3-lower1",...), ("k1-upper1", "k2-upper1", "k3-upper1", ...)),
PARTITION partition_name2 VALUES [("k1-lower1-2", "k2-lower1-2", ...), ("k1-upper1-2", MAXVALUE, ))
)
例えば:
PARTITION BY RANGE(`date`)
(
PARTITION `p201701` VALUES [("2017-01-01"), ("2017-02-01")),
PARTITION `p201702` VALUES [("2017-02-01"), ("2017-03-01")),
PARTITION `p201703` VALUES [("2017-03-01"), ("2017-04-01"))
)
LESS THAN: この方法はパーティションの上限のみを定義します。下限は前のパーティションの上限によって決定されます。
PARTITION BY RANGE(col1[, col2, ...])
(
PARTITION partition_name1 VALUES LESS THAN MAXVALUE | ("value1", "value2", ...),
PARTITION partition_name2 VALUES LESS THAN MAXVALUE | ("value1", "value2", ...)
)
例えば:
PARTITION BY RANGE(`date`)
(
PARTITION `p201701` VALUES LESS THAN ("2017-02-01"),
PARTITION `p201702` VALUES LESS THAN ("2017-03-01"),
PARTITION `p201703` VALUES LESS THAN ("2017-04-01")
)
PARTITION BY RANGE(`date`)
(
PARTITION `p201701` VALUES LESS THAN ("2017-02-01"),
PARTITION `p201702` VALUES LESS THAN ("2017-03-01"),
PARTITION `p201703` VALUES LESS THAN ("2017-04-01")
PARTITION `other` VALUES LESS THAN (MAXVALUE)
)
LIST パーティション
LIST パーティションに基づくパーティション列は、BOOLEAN、TINYINT、SMALLINT、INT、BIGINT、LARGEINT、DATE、DATETIME、CHAR、VARCHAR などのデータ型をサポートします。パーティション値は列挙値です。データが対象パーティションの列挙値のいずれかである場合のみ、パーティションにヒットできます。
パーティションは、VALUES IN (...) を通じて各パーティションに含まれる列挙値の指定をサポートします。
例:
PARTITION BY LIST(city)
(
PARTITION `p_cn` VALUES IN ("Beijing", "Shanghai", "Hong Kong"),
PARTITION `p_usa` VALUES IN ("New York", "San Francisco"),
PARTITION `p_jp` VALUES IN ("Tokyo")
)
LIST パーティショニングは、複数列パーティショニングもサポートしています。例えば:
PARTITION BY LIST(id, city)
(
PARTITION p1_city VALUES IN (("1", "Beijing"), ("1", "Shanghai")),
PARTITION p2_city VALUES IN (("2", "Beijing"), ("2", "Shanghai")),
PARTITION p3_city VALUES IN (("3", "Beijing"), ("3", "Shanghai"))
)
NULL パーティショニング
NULL パーティショニングに基づくパーティションカラムは、デフォルトで not null カラムである必要があります。null カラムを使用する必要がある場合は、セッション変数 allow_partition_column_nullable を true に設定してください。LIST パーティショニングでは、NULL パーティショニングがサポートされていますが、RANGE パーティショニングでは、null 値は less than パーティションに割り当てられます。カラムは以下の通りです:
LIST パーティショニング
mysql> create table null_list(
-> k0 varchar null
-> )
-> partition by list (k0)
-> (
-> PARTITION pX values in ((NULL))
-> )
-> DISTRIBUTED BY HASH(`k0`) BUCKETS 1
-> properties("replication_num" = "1");
Query OK, 0 rows affected (0.11 sec)
mysql> insert into null_list values (null);
Query OK, 1 row affected (0.19 sec)
mysql> select * from null_list;
+------+
| k0 |
+------+
| NULL |
+------+
1 row in set (0.18 sec)
less thanパーティションを使用したRANGEパーティショニング
mysql> create table null_range(
-> k0 int null
-> )
-> partition by range (k0)
-> (
-> PARTITION p10 values less than (10),
-> PARTITION p100 values less than (100),
-> PARTITION pMAX values less than (maxvalue)
-> )
-> DISTRIBUTED BY HASH(`k0`) BUCKETS 1
-> properties("replication_num" = "1");
Query OK, 0 rows affected (0.12 sec)
mysql> insert into null_range values (null);
Query OK, 1 row affected (0.19 sec)
mysql> select * from null_range partition(p10);
+------+
| k0 |
+------+
| NULL |
+------+
1 row in set (0.18 sec)
less thanパーティションを使用しないRANGEパーティショニング
mysql> create table null_range2(
-> k0 int null
-> )
-> partition by range (k0)
-> (
-> PARTITION p200 values [("100"), ("200"))
-> )
-> DISTRIBUTED BY HASH(`k0`) BUCKETS 1
-> properties("replication_num" = "1");
Query OK, 0 rows affected (0.13 sec)
mysql> insert into null_range2 values (null);
ERROR 5025 (HY000): Insert has filtered data in strict mode, tracking_url=......