メインコンテンツまでスキップ

挿入

説明

change文は、データ挿入操作を完了するためのものです。

INSERT INTO table_name
[ PARTITION (p1, ...) ]
[ WITH LABEL label]
[ (column [, ...]) ]
[ [ hint [, ...] ] ]
{ VALUES ( { expression | DEFAULT } [, ...] ) [, ...] | query }

パラメータ

tablet_name: データをインポートする宛先テーブル。db_name.table_nameの形式で指定可能

partitions: インポートするパーティションを指定。table_nameに存在するパーティションでなければならない。複数のパーティション名はカンマで区切る

label: Insertタスクのラベルを指定

column_name: 指定する宛先カラム。table_nameに存在するカラムでなければならない

expression: カラムに割り当てる必要がある対応する式

DEFAULT: 対応するカラムにデフォルト値を使用させる

query: 一般的なクエリ。クエリの結果がターゲットに書き込まれる

hint: INSERTの実行動作を示すために使用される指示子。次の値のいずれかを選択可能:/*+ STREAMING *//*+ SHUFFLE */または/*+ NOSHUFFLE */

  1. STREAMING: 現在は実際の効果はなく、以前のバージョンとの互換性のためにのみ保持されている(以前のバージョンでは、このhintを追加するとlabelが返されていたが、現在はデフォルトでlabelを返す)
  2. SHUFFLE: ターゲットテーブルがパーティションテーブルの場合、このhintを有効にするとrepartiitonが実行される
  3. NOSHUFFLE: ターゲットテーブルがパーティションテーブルであってもrepartiitonは実行されないが、データが各パーティションに正しく配置されることを保証するために他の操作が実行される

merge-on-writeが有効なUniqueテーブルについては、insert文を使用して部分カラム更新を実行することも可能です。insert文で部分カラム更新を実行するには、セッション変数enable_unique_key_partial_updateをtrue(この変数のデフォルト値はfalseで、insert文による部分カラム更新はデフォルトで許可されていない)に設定する必要があります。部分カラム更新を実行する場合、挿入されるカラムは最低でもすべてのKeyカラムを含み、更新したいカラムを指定する必要があります。挿入される行のKeyカラム値が元のテーブルに既に存在する場合、同じキーカラム値を持つ行のデータが更新されます。挿入される行のKeyカラム値が元のテーブルに存在しない場合、新しい行がテーブルに挿入されます。この場合、insert文で指定されていないカラムはデフォルト値を持つかnull許可である必要があります。これらの欠損カラムは最初にデフォルト値で埋められ、カラムにデフォルト値がない場合はnullで埋められます。カラムがnullにできない場合、insert操作は失敗します。

insert文が厳密モードで動作するかどうかを制御するセッション変数enable_insert_strictのデフォルト値はtrueであることに注意してください。つまり、insert文はデフォルトで厳密モードになっており、このモードでは部分カラム更新において存在しないキーの更新は許可されません。したがって、insert文を部分カラム更新に使用し、存在しないキーを挿入したい場合は、enable_unique_key_partial_updateをtrueに設定すると同時にenable_insert_strictをfalseに設定する必要があります。

注意:

INSERT文を実行する際、デフォルトの動作では、文字列が長すぎるなど、ターゲットテーブル形式に適合しないデータがフィルタリングされます。ただし、データがフィルタリングされないことが要求されるビジネスシナリオでは、セッション変数enable_insert_stricttrueに設定して、データがフィルタリングされた場合にINSERTが正常に実行されないことを保証できます。

testテーブルには2つのカラムc1c2があります。

  1. testテーブルに1行のデータをインポート
INSERT INTO test VALUES (1, 2);
INSERT INTO test (c1, c2) VALUES (1, 2);
INSERT INTO test (c1, c2) VALUES (1, DEFAULT);
INSERT INTO test (c1) VALUES (1);

最初と2番目のステートメントは同じ効果を持ちます。対象列が指定されていない場合、テーブルの列順序がデフォルトの対象列として使用されます。 3番目と4番目のステートメントは同じ意味を表し、c2列のデフォルト値を使用してデータインポートを完了します。

  1. testテーブルに複数行のデータを一度にインポートする
INSERT INTO test VALUES (1, 2), (3, 2 + 2);
INSERT INTO test (c1, c2) VALUES (1, 2), (3, 2 * 2);
INSERT INTO test (c1) VALUES (1), (3);
INSERT INTO test (c1, c2) VALUES (1, DEFAULT), (3, DEFAULT);

最初と2番目のステートメントは同じ効果を持ち、2つのデータを一度にtestテーブルにインポートします 3番目と4番目のステートメントの効果は既知であり、c2列のデフォルト値を使用して2つのデータをtestテーブルにインポートします

  1. クエリ結果をtestテーブルにインポートする
INSERT INTO test SELECT * FROM test2;
INSERT INTO test (c1, c2) SELECT * from test2;
  1. クエリ結果をtestテーブルにインポートし、パーティションとラベルを指定する
INSERT INTO test PARTITION(p1, p2) WITH LABEL `label1` SELECT * FROM test2;
INSERT INTO test WITH LABEL `label1` (c1, c2) SELECT * from test2;

Keywords

INSERT

Best Practice

  1. 返された結果を確認する

    INSERT操作は同期操作であり、結果の返却は操作の終了を示します。ユーザーは異なる返却結果に応じて対応する処理を実行する必要があります。

    1. 実行が成功し、結果セットが空の場合

      select文に対応するinsertの結果セットが空の場合、以下のように返されます:

      mysql> insert into tbl1 select * from empty_tbl;
      Query OK, 0 rows affected (0.02 sec)

Query OKは実行の成功を示します。0 rows affectedは、データがインポートされなかったことを意味します。

  1. 実行が成功し、結果セットが空ではない

    結果セットが空ではない場合。返される結果は以下の状況に分けられます:

    1. Insertが正常に実行され、可視である:

      mysql> insert into tbl1 select * from tbl2;
      Query OK, 4 rows affected (0.38 sec)
      {'label':'insert_8510c568-9eda-4173-9e36-6adc7d35291c', 'status':'visible', 'txnId':'4005'}

      mysql> insert into tbl1 with label my_label1 select * from tbl2;
      Query OK, 4 rows affected (0.38 sec)
      {'label':'my_label1', 'status':'visible', 'txnId':'4005'}

      mysql> insert into tbl1 select * from tbl2;
      Query OK, 2 rows affected, 2 warnings (0.31 sec)
      {'label':'insert_f0747f0e-7a35-46e2-affa-13a235f4020d', 'status':'visible', 'txnId':'4005'}

      mysql> insert into tbl1 select * from tbl2;
      Query OK, 2 rows affected, 2 warnings (0.31 sec)
      {'label':'insert_f0747f0e-7a35-46e2-affa-13a235f4020d', 'status':'committed', 'txnId':'4005'}

Query OKは実行が成功したことを示します。4 rows affectedは合計4行のデータがインポートされたことを意味します。2 warningsはフィルタリングされる行数を示します。

     また、json文字列も返します:

```json
{'label':'my_label1', 'status':'visible', 'txnId':'4005'}
{'label':'insert_f0747f0e-7a35-46e2-affa-13a235f4020d', 'status':'committed', 'txnId':'4005'}
{'label':'my_label1', 'status':'visible', 'txnId':'4005', 'err':'some other error'}
```

labelは、ユーザーが指定したラベルまたは自動生成されたラベルです。LabelはこのInsert IntoインポートジョブのIDです。各インポートジョブは単一のデータベース内で一意のLabelを持ちます。

     `status`は、インポートされたデータが表示可能かどうかを示します。表示可能な場合は`visible`、表示不可能な場合は`committed`を表示します。

`txnId`は、このinsertに対応するインポートトランザクションのIDです。

`err`フィールドは、その他の予期しないエラーを表示します。

フィルタリングされた行を表示する必要がある場合、ユーザーは以下のステートメントを渡すことができます

```sql
show load where label="xxx";
```

戻り結果のURLは、間違ったデータをクエリするために使用できます。詳細については、後述のエラー行の表示の要約を参照してください。

     **データの非可視性は一時的な状態であり、このバッチのデータは最終的に可視化されます**

このバッチのデータの可視化ステータスは、次のステートメントで確認できます:

```sql
show transaction where id=4005;
```

返された結果のTransactionStatus列がvisibleの場合、表現データは可視状態です。

  1. 実行失敗

    実行失敗は、データのインポートが成功しなかったことを示し、以下が返されます:

    mysql> insert into tbl1 select * from tbl2 where k1 = "a";
    ERROR 1064 (HY000): all partitions have no load data. url: http://10.74.167.16:8042/api/_load_error_log?file=__shard_2/error_log_insert_stmt_ba8bb9e158e4879-ae8de8507c0bf8a2_ba8bb9e158e4879_ae8de8507c0

ERROR 1064 (HY000): all partitions have no load dataは失敗の理由を示しています。以下のURLを使用して間違ったデータを照会できます:

  ```sql
show load warnings on "url";
```

特定のエラー行を確認できます。

  1. タイムアウト時間

    INSERT操作のタイムアウトは、max(insert_timeout, query_timeout)によって制御されます。両方とも環境変数であり、insert_timeoutのデフォルトは4時間、query_timeoutのデフォルトは5分です。操作がタイムアウトを超えた場合、ジョブはキャンセルされます。insert_timeoutの導入は、INSERT文がより長いデフォルトタイムアウトを持つことを保証し、通常のクエリに適用される短いデフォルトタイムアウトの影響を受けることなく、インポートタスクを実行できるようにするためです。

  2. Labelと原子性

    INSERT操作はインポートの原子性も保証します。Import Transactions and Atomicityのドキュメントを参照してください。

    insert操作のクエリ部分でCTE(Common Table Expressions)を使用する場合、WITH LABELcolumn部分を指定する必要があります。

  3. Filter Threshold

    他のインポート方法とは異なり、INSERT操作ではfilter threshold(max_filter_ratio)を指定できません。デフォルトのfilter thresholdは1で、これはエラーのある行を無視できることを意味します。

    データをフィルタリングしないことが要求されるビジネスシナリオの場合、session variable enable_insert_stricttrueに設定することで、データがフィルタリングされた際にINSERTが正常に実行されないことを保証できます。

  4. パフォーマンス問題

    VALUES方法を使用した単一行挿入はありません。この方法を使用する必要がある場合は、複数行のデータを1つのINSERT文にまとめて一括コミットしてください。