SELECT

説明

主にSelect構文の使用方法を紹介します

文法：

SELECT
    [hint_statement, ...]
    [ALL | DISTINCT | DISTINCTROW | ALL EXCEPT ( col_name1 [, col_name2, col_name3, ...] )]
    select_expr [, select_expr ...]
    [FROM table_references
      [PARTITION partition_list]
      [TABLET tabletid_list]
      [TABLESAMPLE sample_value [ROWS | PERCENT]
        [REPEATABLE pos_seek]]
    [WHERE where_condition]
    [GROUP BY [GROUPING SETS | ROLLUP | CUBE] {col_name | expr | position}]
    [HAVING where_condition]
    [ORDER BY {col_name | expr | position}
      [ASC | DESC], ...]
    [LIMIT {[offset,] row_count | row_count OFFSET offset}]
    [INTO OUTFILE 'file_name']

構文の説明:
1. select_expr, ... 結果で取得され表示される列、エイリアスを使用する場合、asはオプションです。
2. select_expr, ... 取得対象のテーブル（1つまたは複数のテーブル（サブクエリによって生成された一時テーブルを含む））
3. where_definitionは取得条件（式）、WHERE句がある場合、条件は行データをフィルタリングします。where_conditionは選択される各行に対してtrueと評価される式です。WHERE句がない場合、ステートメントはすべての行を選択します。WHERE式では、集計関数を除いて、MySQLでサポートされている任意の関数と演算子を使用できます
4. ALL | DISTINCT : 結果セットを更新する、allはすべて、distinct/distinctrowは重複する列を更新する、デフォルトはall
5. ALL EXCEPT: 完全な（all）結果セットでフィルタリングし、exceptは完全な結果セットから除外される1つ以上の列の名前を指定します。一致するすべての列名は出力で無視されます。
この機能はApache Doris 1.2バージョン以降でサポートされています
1. INTO OUTFILE 'file_name' : 結果を新しいファイル（以前は存在しなかった）に保存し、違いは保存形式にあります。
2. Group by having: 結果セットをグループ化し、havingが現れた場合にgroup byの結果をブラッシュします。Grouping Sets、Rollup、Cubeはgroup byの拡張です。詳細についてはGROUPING SETS DESIGNを参照してください。
3. Order by: 最終結果をソートし、Order byは1つ以上の列のサイズを比較して結果セットをソートします。
  
  Order byは時間とリソースを消費する操作です。すべてのデータをソートする前に1つのノードに送信する必要があり、ソート操作は非ソート操作よりも多くのメモリを必要とするためです。
  
  上位Nのソート結果を返す必要がある場合は、LIMIT句を使用する必要があります。メモリ使用量を制限するため、ユーザーがLIMIT句を指定しない場合、デフォルトで最初の65535のソート結果が返されます。
4. Limit n: 出力結果の行数を制限し、limit m,nはm行目から開始してn件のレコードを出力することを意味します。limit m,nを使用する前にorder byを使用する必要があります。そうしないと、実行するたびにデータが一貫しない可能性があります。
5. Having句はテーブル内の行データをフィルタリングするのではなく、集計関数によって生成された結果をフィルタリングします。
  
  通常、havingは集計関数（例：COUNT(), SUM(), AVG(), MIN(), MAX()）およびgroup by句と一緒に使用されます。
6. SELECTは、table_reference内のテーブル名の後にパーティションまたはサブパーティション（またはその両方）のリストを含むPARTITIONを使用した明示的なパーティション選択をサポートしています
7. [TABLET tids] TABLESAMPLE n [ROWS | PERCENT] [REPEATABLE seek]: FROM句内のテーブルから読み取る行数を制限し、指定された行数またはパーセンテージに従ってテーブルから疑似ランダムに多数のTabletsを選択し、REPEATABLEでシード数を指定して選択されたサンプルを再び返します。さらに、TableIDを手動で指定することもできます。これはOLAPテーブルでのみ使用できることに注意してください。
8. hint_statement: selectlistの前のhintは、望ましい実行計画を得るためにオプティマイザーの動作に影響を与えるためにヒントを使用できることを示します。詳細についてはjoinHint使用ドキュメントを参照してください

構文の制約:

SELECTは、任意のテーブルを参照せずに計算行を取得するためにも使用できます。
すべての句は上記の形式に従って厳密に順序付けする必要があり、HAVING句はGROUP BY句の後でORDER BY句の前に配置する必要があります。
エイリアスキーワードASはオプションです。エイリアスはgroup by、order by、havingで使用できます
Where句：WHERE文は実行され、GROUP BY部分にどの行を含めるべきかを決定し、HAVINGは結果セット内のどの行を使用すべきかを決定するために使用されます。
HAVING句は総計関数を参照できますが、WHERE句はcount、sum、max、min、avgなどを参照できません。同時に、where句は総計関数以外の他の関数を参照できます。Where句では列エイリアスを使用して条件を定義することはできません。
Group byの後にwith rollupを付けると、結果を1回以上カウントできます。

Join クエリ:

DorisはJOIN構文をサポートしています

JOIN
table_references:
    table_reference [, table_reference] …
table_reference:
    table_factor
  | join_table
table_factor:
    tbl_name [[AS] alias]
        [{USE|IGNORE|FORCE} INDEX (key_list)]
  | ( table_references )
  | { OJ table_reference LEFT OUTER JOIN table_reference
        ON conditional_expr }
join_table:
    table_reference [INNER | CROSS] JOIN table_factor [join_condition]
  | table_reference LEFT [OUTER] JOIN table_reference join_condition
  | table_reference NATURAL [LEFT [OUTER]] JOIN table_factor
  | table_reference RIGHT [OUTER] JOIN table_reference join_condition
  | table_reference NATURAL [RIGHT [OUTER]] JOIN table_factor
join_condition:
    ON conditional_expr

UNION文法:

SELECT ...
UNION [ALL| DISTINCT] SELECT ......
[UNION [ALL| DISTINCT] SELECT ...]

UNIONは、複数のSELECT文の結果を単一の結果セットに結合するために使用されます。

最初のSELECT文の列名が、返される結果の列名として使用されます。各SELECT文の対応する位置にリストされた選択された列は、同じデータ型である必要があります。（例えば、最初の文で選択された最初の列は、他の文で選択された最初の列と同じ型である必要があります。）

UNIONのデフォルトの動作は、結果から重複行を削除することです。オプションのDISTINCTキーワードは、同じく重複行の削除を指定するため、デフォルト以外の効果はありません。オプションのALLキーワードを使用すると、重複行の削除は行われず、結果にはすべてのSELECT文のすべての一致する行が含まれます。

WITH文:

共通テーブル式を指定するには、1つ以上のコンマ区切りの句でWITH句を使用します。各副句は、結果セットを生成するサブクエリを提供し、名前をサブクエリに関連付けます。以下の例では、cte1とcte2という名前のCTEでWITH句を定義し、それらの最上位のSELECTの下でWITH句を参照しています。

WITH
  cte1 AS (SELECT a，b FROM table1),
  cte2 AS (SELECT c，d FROM table2)
SELECT b，d FROM cte1 JOIN cte2
WHERE cte1.a = cte2.c;

WITH句を含むステートメントでは、各CTE名を参照して対応するCTE結果セットにアクセスできます。

CTE名は他のCTEで参照でき、他のCTEに基づいてCTEを定義することができます。

再帰CTEは現在サポートされていません。

例

年齢が18歳、20歳、25歳の学生の名前を照会する
```
select Name from student where age in (18,20,25);
```

Example以外のすべて

-- Query all information except the students' age
select * except(age) from student; 

GROUP BY の例

--Query the tb_book table, group by type, and find the average price of each type of book,
select type,avg(price) from tb_book group by type;

DISTINCT の使用

--Query the tb_book table to remove duplicate type data
select distinct type from tb_book;

ORDER BY の例

クエリ結果を昇順（デフォルト）または降順（DESC）でソートします。昇順では NULL が最初に、降順では NULL が最後になります
```
--Query all records in the tb_book table, sort them in descending order by id, and display three records
select * from tb_book order by id desc limit 3;
```
LIKE あいまい検索

あいまい検索を実現でき、2つのワイルドカードがあります：% と _、% は1文字以上の文字にマッチでき、_ は1文字にマッチできます
```
--Find all books whose second character is h
select * from tb_book where name like('_h%');
```

LIMITは結果行の数を制限します

--1. Display 3 records in descending order
select * from tb_book order by price desc limit 3;

--2. Display 4 records from id=1
select * from tb_book where id limit 1,4;

CONCAT 複数の列を結合

--Combine name and price into a new string output
select id,concat(name,":",price) as info,type from tb_book;

関数と式の使用

--Calculate the total price of various books in the tb_book table
select sum(price) as total,type from tb_book group by type;
--20% off price
select *,(price * 0.8) as "20%" from tb_book;

UNION の例

SELECT a FROM t1 WHERE a = 10 AND B = 1 ORDER by LIMIT 10
UNION
SELECT a FROM t2 WHERE a = 11 AND B = 2 ORDER by LIMIT 10;

WITH句の例

WITH cte AS
(
  SELECT 1 AS col1, 2 AS col2
  UNION ALL
  SELECT 3, 4
)
SELECT col1, col2 FROM cte;

JOIN の例

SELECT * FROM t1 LEFT JOIN (t2, t3, t4)
                 ON (t2.a = t1.a AND t3.b = t1.b AND t4.c = t1.c)

に相当する

```sql
SELECT * FROM t1 LEFT JOIN (t2 CROSS JOIN t3 CROSS JOIN t4)
                 ON (t2.a = t1.a AND t3.b = t1.b AND t4.c = t1.c)
```

13. INNER JOIN

```sql
SELECT t1.name, t2.salary
  FROM employee AS t1 INNER JOIN info AS t2 ON t1.name = t2.name;

SELECT t1.name, t2.salary
  FROM employee t1 INNER JOIN info t2 ON t1.name = t2.name;
```

14. LEFT JOIN

```sql
SELECT left_tbl.*
  FROM left_tbl LEFT JOIN right_tbl ON left_tbl.id = right_tbl.id
  WHERE right_tbl.id IS NULL;
```

15. RIGHT JOIN

```sql
mysql> SELECT * FROM t1 RIGHT JOIN t2 ON (t1.a = t2.a);
+------+------+------+------+
| a    | b    | a    | c    |
+------+------+------+------+
|    2 | y    |    2 | z    |
| NULL | NULL |    3 | w    |
+------+------+------+------+
```

16. TABLESAMPLE

```sql
--Pseudo-randomly sample 1000 rows in t1. Note that several Tablets are actually selected according to the statistics of the table, and the total number of selected Tablet rows may be greater than 1000, so if you want to explicitly return 1000 rows, you need to add Limit.
SELECT * FROM t1 TABLET(10001) TABLESAMPLE(1000 ROWS) REPEATABLE 2 limit 1000;
```

Keywords

SELECT

ベストプラクティス

SELECT句に関する追加知識
- select_exprにはAS alias_nameを使用してエイリアスを指定できます。エイリアスは式内でカラム名として使用され、GROUP BY、ORDER BY、HAVING句で使用できます。ASキーワードはカラムのエイリアスを指定する際に使用する良い習慣です。
- FROMの後のtable_referencesは、クエリに参加する1つ以上のテーブルを示します。複数のテーブルが一覧表示されている場合、JOIN操作が実行されます。また、指定された各テーブルに対して、エイリアスを定義できます
- SELECT後に選択されたカラムは、カラム名、カラムエイリアス、またはカラム位置を表す整数（1から開始）によってORDER INおよびGROUP BYで参照できます
```
SELECT college, region, seed FROM tournament
  ORDER BY region, seed;

SELECT college, region AS r, seed AS s FROM tournament
  ORDER BY r, s;

SELECT college, region, seed FROM tournament
  ORDER BY 2, 3;
```

ORDER BYがサブクエリに現れ、外側のクエリにも適用される場合、最も外側のORDER BYが優先されます。
- GROUP BYが使用される場合、グループ化された列は自動的に昇順でソートされます（同じ列が続くORDER BY文があるかのように）。自動ソートによるGROUP BYのオーバーヘッドを回避したい場合は、ORDER BY NULLを追加することで解決できます：
```
SELECT a, COUNT(b) FROM test_table GROUP BY a ORDER BY NULL;
```
SELECT で ORDER BY または GROUP BY を使用して列をソートする場合、サーバーは max_sort_length システム変数で指定された初期バイト数のみを使用して値をソートします。
- HAVING 句は一般的に最後に適用され、結果セットが MySQL クライアントに返される直前に実行され、最適化されません。（LIMIT は HAVING の後に適用されます）
  
  SQL 標準では、HAVING は GROUP BY リスト内の列または集約関数で使用される列を参照する必要があります。ただし、MySQL はこれを拡張し、HAVING が Select 句リスト内の列や外部サブクエリの列も参照できるようにしています。
  
  HAVING で参照される列が曖昧な場合、警告が生成されます。以下のステートメントでは、col2 が曖昧です：
```
SELECT COUNT(col1) AS col2 FROM t GROUP BY col2 HAVING col2 = 2;
```
WHEREを使うべき場所でHAVINGを使わないよう注意してください。HAVINGはGROUP BYと組み合わせて使用します。
- HAVING句は集約関数を参照できますが、WHEREでは参照できません。
```
SELECT user, MAX(salary) FROM users
  GROUP BY user HAVING MAX(salary) > 10;
```

LIMIT句は、SELECT文によって返される行数を制限するために使用できます。LIMITには1つまたは2つの引数を指定でき、どちらも非負の整数である必要があります。

/*Retrieve 6~15 rows in the result set*/
SELECT * FROM tbl LIMIT 5,10;
/*Then if you want to retrieve all rows after a certain offset is set, you can set a very large constant for the second parameter. The following query fetches all data from row 96 onwards */
SELECT * FROM tbl LIMIT 95,18446744073709551615;
/*If LIMIT has only one parameter, the parameter specifies the number of rows that should be retrieved, and the offset defaults to 0, that is, starting from the first row*/

SELECT...INTOはクエリ結果をファイルに書き込むことができます

SELECTキーワードの修飾子
- 重複除去
  
  ALLおよびDISTINCT修飾子は、結果セット内の行を重複除去するかどうかを指定します（列であってはなりません）。
  
  ALLはデフォルトの修飾子です。つまり、要件を満たすすべての行が取得されます。
  
  DISTINCTは重複する行を削除します。
サブクエリの主な利点
- サブクエリは構造化されたクエリを可能にし、ステートメントの各部分を分離できます。
- 一部の操作では複雑な結合と関連付けが必要です。サブクエリはこれらの操作を実行する他の方法を提供します
クエリの高速化
- データスキャンの範囲を減らすため、可能な限りDorisのパーティションとバケットをデータフィルタリング条件として使用してください
- クエリ速度を向上させるため、Dorisのプレフィックスインデックスフィールドをデータフィルタ条件として最大限活用してください
UNION
- unionキーワードのみを使用することは、union disitnctを使用することと同じ効果があります。重複除去作業はよりメモリ集約的であるため、union all操作を使用したクエリ速度の方が高速になり、メモリ消費量も少なくなります。ユーザーが返される結果セットに対してorder byおよびlimit操作を実行したい場合は、union操作をサブクエリ内に配置し、その後サブクエリからselectし、最後にサブクエリとorder byをサブクエリの外に配置する必要があります。
```
select * from (select age from student_01 union all select age from student_02) as t1
order by age limit 4;
  
+-------------+
| age |
+-------------+
| 18 |
| 19 |
| 20 |
| 21 |
+-------------+
4 rows in set (0.01 sec)
```
JOIN
- 内部結合条件では、等値結合のサポートに加えて、非等値結合もサポートしています。パフォーマンス上の理由により、等値結合の使用を推奨します。
- その他の結合では等価結合のみをサポートします

説明​

例​

Keywords​

ベストプラクティス​

説明

例

Keywords

ベストプラクティス