メインコンテンツまでスキップ

SOUNDEX

説明

SOUNDEX関数は文字列のSoundex encodingを計算します。Soundexは英語の単語を発音を表すコードにエンコードする音韻アルゴリズムで、似た発音の単語は同じエンコーディングになります。

エンコーディングルール: 1つの大文字に続いて3つの数字からなる4文字のコードを返します(例:S530)。

構文

SOUNDEX(<expr>)

パラメータ

パラメータ説明
<expr>Soundexエンコーディングを計算する文字列(ASCII文字のみサポート)。型: VARCHAR

戻り値

VARCHAR(4)型を返します。文字列のSoundexエンコーディングを表します。

特殊なケース:

  • 引数がNULLの場合、NULLを返します
  • 文字列が空または文字が含まれていない場合、空文字列を返します
  • ASCII文字のみを処理し、その他の文字は無視します
  • 非ASCII文字が含まれている場合、関数はエラーをスローします

  1. 基本的な使用方法: 単語のエンコーディング
SELECT soundex('Doris');
+------------------+
| soundex('Doris') |
+------------------+
| D620 |
+------------------+
  1. 似た発音の単語は同じエンコーディングを持つ
SELECT soundex('Smith'), soundex('Smyth');
+------------------+------------------+
| soundex('Smith') | soundex('Smyth') |
+------------------+------------------+
| S530 | S530 |
+------------------+------------------+
  1. 空文字列処理
SELECT soundex('');
+-------------+
| soundex('') |
+-------------+
| |
+-------------+
  1. NULL値の処理
SELECT soundex(NULL);
+---------------+
| soundex(NULL) |
+---------------+
| NULL |
+---------------+
  1. 空文字列は空文字列を返す
SELECT soundex('');
+-------------+
| soundex('') |
+-------------+
| |
+-------------+
  1. 文字以外の文字のみの場合は空文字列を返す
SELECT soundex('123@*%');
+-------------------+
| soundex('123@*%') |
+-------------------+
| |
+-------------------+
  1. 非文字文字の無視
SELECT soundex('R@b-e123rt'), soundex('Robert');
+-----------------------+-------------------+
| soundex('R@b-e123rt') | soundex('Robert') |
+-----------------------+-------------------+
| R163 | R163 |
+-----------------------+-------------------+
  1. 非ASCII文字のみのエラー例
SELECT soundex('你好');  
ERROR 1105 (HY000): errCode = 2, detailMessage = Not Supported: Not Supported: soundex only supports ASCII, but got: 你
SELECT soundex('Apache Doris 你好');
+--------------------------------+
| soundex('Apache Doris 你好') |
+--------------------------------+
| A123 |
+--------------------------------+

キーワード

SOUNDEX