[前][次][番号順一覧][スレッド一覧]

mysql:4480

From: tateyan <tateyan <tateyan@xxxxxxxxxx>>
Date: Fri, 12 Oct 2001 22:07:15 +0900
Subject: [mysql 04480] Re: 日本語検索について

たてやんっす

kakashi や Chasen で語句単位(分かち書き)で区切ってやれば
それなりに使えました

東京都  京都も ひとつの語句としてMySQLに登録してやれば
ワイルドカード検索でないかぎりヒットできますね

あ もちろん 入力文字も語句単位に分解してやる必要はでてくる
と思います

MySQL に入れるものはこれらの語句とどの文章に目的の語句があるか
という指標をインデックスで作ってやればいいのではないかと
考えます


Web+DB PRESS No.2 の記事を書くために一応のところまで作ってみました^^;


結局 Namazu も語句単位に分けての検索なので 検索エンジン部分を
MySQL ということも考えられないことはないと思うのですが...

って はずしてるかも知れないですが...

futarohさんの
題名「[mysql 04476] Re: 日本語検索について」のメールからの引用です
> 山下@DoEveryです。
> 
> Tatsuhiko Miyagawa さんは書きました:
> >現時点で対応していないと思います。
> >MySQL 3.23.x の FULLTEXT 検索
> >http://www.mysql.com/doc/F/u/Fulltext_Search.html
> >
> >便乗なのですが、
> >
> >Kakasi や Chasen, Sary といったもので UDF を定義したりするアプロー
> >チがあるかな、と思うのですが、どなたか実装されているかたがいらっしゃ
> >いましたら、興味ありますので教えていただきたいです。
> 
> 日本語全文検索エンジンとDBの連携を行ったことがあります。
> 
> DB:ORACLE
> 日本語検索エンジン:Infobee (gooで使われている奴)
> 
> NAMAZUにしろ、Infobeeにしろ、日本語全文検索エンジン自身が利用する
> indexを生成する必要があるので、DBとのリアルタイムの連携は難しいと
> 思います。
> 
> 日本語特有の問題を無視すれば、宮川さんがご指摘のようにmysqlの
> full-text engineを使えそうな気がします。が、その時は多分、次の
> ような問題が発生するでしょう。
> ・全角「A」と半角「A」は区別できない
> ・半角カナは認識されない
> ・「京都」で検索しても「東京都」がひっかかる
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
  彡彡从        たてやんっす
 d□/□-b      <tateyan@xxxxxxxxxx>
 ヽ"ー"丿

Key fingerprint = 5D56 8EA3 B9FE A721 4866  FB4A 0041 672C 08DD C33A




[前][次][番号順一覧][スレッド一覧]

      4472 2001-10-12 14:09 [伏見 宰 <t.fushimi@x] 日本語検索について                      
      4475 2001-10-12 17:08 ┣[Tatsuhiko Miyagawa <]                                       
      4476 2001-10-12 17:43 ┃┗[<futaroh@xxxxxxxxxx>]                                     
      4478 2001-10-12 19:13 ┃ ┣[とみたまさひろ <tomm]                                   
->    4480 2001-10-12 22:07 ┃ ┗[tateyan <tateyan@xxx]                                   
      4482 2001-10-13 03:25 ┗[とみたまさひろ <tomm]