mysql:10318

いちかわともうします。

LIKEなどでの検索の際、たとえばＡをAと同一の文字とみなして検索したいという要求があります。

理想を言うと、
Unicode Normalization Forms
http://www.unicode.org/unicode/reports/tr15/
でいうところの、NFKC正規化を行ったあとの形式で検索をしたいのですが、そ
こまでいわないでも、最低カナ/ローマ字/数字の全角半角の正規化した形での
検索をしたいのです。

RLIKEライブラリやcollationのマニュアル読んでみたんですが、どうも簡
単な方法がピンと来ないんで、UDF利用してICU4Cのコードを組み込むかなと
思うんですが、何かそんなに手間がかからずに実装できる方法などいいアイディ
アはないものでしょうか。

My SQL 4.1.5 gammma
charsetはUCS2もしくはUTF8で格納することを想定しています。

＃DBより上の層で正規化すればいいという考え方もあるでしょうが、今回は諸
＃般の事情でそうもいかないんです。