SOUNDEX
説明
SOUNDEX関数は文字列のSoundex encodingを計算します。Soundexは英語の単語を発音を表すコードにエンコードする音韻アルゴリズムで、似た発音の単語は同じエンコーディングになります。
エンコーディングルール: 1つの大文字に続いて3つの数字からなる4文字のコードを返します(例:S530)。
構文
SOUNDEX(<expr>)
パラメータ
| パラメータ | 説明 |
|---|---|
<expr> | Soundexエンコーディングを計算する文字列(ASCII文字のみサポート)。型: VARCHAR |
戻り値
VARCHAR(4)型を返します。文字列のSoundexエンコーディングを表します。
特殊なケース:
- 引数がNULLの場合、NULLを返します
- 文字列が空または文字が含まれていない場合、空文字列を返します
- ASCII文字のみを処理し、その他の文字は無視します
- 非ASCII文字が含まれている場合、関数はエラーをスローします
例
- 基本的な使用方法: 単語のエンコーディング
SELECT soundex('Doris');
+------------------+
| soundex('Doris') |
+------------------+
| D620 |
+------------------+
- 似た発音の単語は同じエンコーディングを持つ
SELECT soundex('Smith'), soundex('Smyth');
+------------------+------------------+
| soundex('Smith') | soundex('Smyth') |
+------------------+------------------+
| S530 | S530 |
+------------------+------------------+
- 空文字列処理
SELECT soundex('');
+-------------+
| soundex('') |
+-------------+
| |
+-------------+
- NULL値の処理
SELECT soundex(NULL);
+---------------+
| soundex(NULL) |
+---------------+
| NULL |
+---------------+
- 空文字列は空文字列を返す
SELECT soundex('');
+-------------+
| soundex('') |
+-------------+
| |
+-------------+
- 文字以外の文字のみの場合は空文字列を返す
SELECT soundex('123@*%');
+-------------------+
| soundex('123@*%') |
+-------------------+
| |
+-------------------+
- 非文字文字の無視
SELECT soundex('R@b-e123rt'), soundex('Robert');
+-----------------------+-------------------+
| soundex('R@b-e123rt') | soundex('Robert') |
+-----------------------+-------------------+
| R163 | R163 |
+-----------------------+-------------------+
- 非ASCII文字のみのエラー例
SELECT soundex('你好');
ERROR 1105 (HY000): errCode = 2, detailMessage = Not Supported: Not Supported: soundex only supports ASCII, but got: 你
SELECT soundex('Apache Doris 你好');
+--------------------------------+
| soundex('Apache Doris 你好') |
+--------------------------------+
| A123 |
+--------------------------------+
キーワード
SOUNDEX