[前][次][番号順一覧][スレッド一覧]

mysql:10318

From: ICHIKAWA SHIN <ICHIKAWA SHIN <sichikawa@xxxxxxxxxx>>
Date: Fri, 15 Oct 2004 15:25:03 +0900 (LDT)
Subject: [mysql 10318] 文字列の正規化

いちかわともうします。

LIKEなどでの検索の際、たとえばAをAと同一の文字とみなして検索したいという要求があります。

理想を言うと、
Unicode Normalization Forms
http://www.unicode.org/unicode/reports/tr15/
でいうところの、NFKC正規化を行ったあとの形式で検索をしたいのですが、そ
こまでいわないでも、最低カナ/ローマ字/数字の全角半角の正規化した形での
検索をしたいのです。

RLIKEライブラリやcollationのマニュアル読んでみたんですが、どうも簡
単な方法がピンと来ないんで、UDF利用してICU4Cのコードを組み込むかなと
思うんですが、何かそんなに手間がかからずに実装できる方法などいいアイディ
アはないものでしょうか。

My SQL 4.1.5 gammma
charsetはUCS2もしくはUTF8で格納することを想定しています。

#DBより上の層で正規化すればいいという考え方もあるでしょうが、今回は諸
#般の事情でそうもいかないんです。

[前][次][番号順一覧][スレッド一覧]

->   10318 2004-10-15 15:25 [ICHIKAWA SHIN <sichi] 文字列の正規化                          
     10320 2004-10-15 15:32 ┗[<yasuyuki@xxxxxxxxxx]                                       
     10326 2004-10-18 14:04  ┗[ICHIKAWA SHIN <sichi]