mysql:4480
From: tateyan <tateyan <tateyan@xxxxxxxxxx>>
Date: Fri, 12 Oct 2001 22:07:15 +0900
Subject: [mysql 04480] Re: 日本語検索について
たてやんっす kakashi や Chasen で語句単位(分かち書き)で区切ってやれば それなりに使えました 東京都 京都も ひとつの語句としてMySQLに登録してやれば ワイルドカード検索でないかぎりヒットできますね あ もちろん 入力文字も語句単位に分解してやる必要はでてくる と思います MySQL に入れるものはこれらの語句とどの文章に目的の語句があるか という指標をインデックスで作ってやればいいのではないかと 考えます Web+DB PRESS No.2 の記事を書くために一応のところまで作ってみました^^; 結局 Namazu も語句単位に分けての検索なので 検索エンジン部分を MySQL ということも考えられないことはないと思うのですが... って はずしてるかも知れないですが... futarohさんの 題名「[mysql 04476] Re: 日本語検索について」のメールからの引用です > 山下@DoEveryです。 > > Tatsuhiko Miyagawa さんは書きました: > >現時点で対応していないと思います。 > >MySQL 3.23.x の FULLTEXT 検索 > >http://www.mysql.com/doc/F/u/Fulltext_Search.html > > > >便乗なのですが、 > > > >Kakasi や Chasen, Sary といったもので UDF を定義したりするアプロー > >チがあるかな、と思うのですが、どなたか実装されているかたがいらっしゃ > >いましたら、興味ありますので教えていただきたいです。 > > 日本語全文検索エンジンとDBの連携を行ったことがあります。 > > DB:ORACLE > 日本語検索エンジン:Infobee (gooで使われている奴) > > NAMAZUにしろ、Infobeeにしろ、日本語全文検索エンジン自身が利用する > indexを生成する必要があるので、DBとのリアルタイムの連携は難しいと > 思います。 > > 日本語特有の問題を無視すれば、宮川さんがご指摘のようにmysqlの > full-text engineを使えそうな気がします。が、その時は多分、次の > ような問題が発生するでしょう。 > ・全角「A」と半角「A」は区別できない > ・半角カナは認識されない > ・「京都」で検索しても「東京都」がひっかかる ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 彡彡从 たてやんっす d□/□-b <tateyan@xxxxxxxxxx> ヽ"ー"丿 Key fingerprint = 5D56 8EA3 B9FE A721 4866 FB4A 0041 672C 08DD C33A
4472 2001-10-12 14:09 [伏見 宰 <t.fushimi@x] 日本語検索について 4475 2001-10-12 17:08 ┣[Tatsuhiko Miyagawa <] 4476 2001-10-12 17:43 ┃┗[<futaroh@xxxxxxxxxx>] 4478 2001-10-12 19:13 ┃ ┣[とみたまさひろ <tomm] -> 4480 2001-10-12 22:07 ┃ ┗[tateyan <tateyan@xxx] 4482 2001-10-13 03:25 ┗[とみたまさひろ <tomm]