[前][次][番号順一覧][スレッド一覧]

mysql:5404

From: "KAWAI,Takanori" <"KAWAI,Takanori" <GCD00051@xxxxxxxxxx>>
Date: Thu, 25 Apr 2002 14:10:54 +0900
Subject: [mysql 05404] Re: Full-text Search

川合孝典です。

----- Original Message -----
From: <moeru@xxxxxxxxxx>
To: <ml@xxxxxxxxxx>
Sent: Thursday, April 25, 2002 12:14 PM
Subject: [mysql 05403] Re: Full-text Search


>
> 2002/04/25 11:06:59 +0900に"KAWAI,Takanori" <GCD00051@xxxxxxxxxx>さんに頂
いた
> 「[mysql 05401] Re: Full-text Search」への返事です。
>
> モエルです。
(中略)
> Full Text Searchの速度は、どんなもんですか?
>
> 1st: 0.00574994087219238
> 2nd: 0.00473403930664062
> って書いてあったのは、速度ですか?
これはSQLの実行からすべて取り出し終わるまでの時間です
(ミリ秒単位)。

はっきり言って、これくらいの件数だと確実に遅いです(^^;;
#だってわざわざ単語に分解して、それをベースに検索用の文字列を
#作ってから検索するわけですから
といっても違いは0.0何秒っていう程度です。
単純に同じデータを10回ずつINSERTした場合には、あっさり
逆転しました。件数が多ければ中間一致に負けることはまずない
でしょう。

ChaSen使い方で活用はすべて終止形で検索文字列を作るようにして
いるので、単純に中間一致した場合とは違いもでてきます。現在は
助詞や記号も検索文字列としているので、「の」とか「が」まで
検索しにいくので、精度が低くなっているようにも感じます。
まぁこの当たりは調整の範囲だと思っていますが。

> >myperlあたりでPerlを使ったストアドプロシージャとか用意できれば
> >かなり手数も減りますし、他の言語からも呼べるんじゃないかとは
> >思いますが(Cで書けばという話もあるかな)
>
> このへんは、またまた、ぼくには難しいお話で(^^;
>
> ソース見て、思ったんですけど、ChaSenってPHPとか対応してない
> ようなのでperlでデータの分解・登録をバックグラウンド処理するなら
> できるかなと思いました。
myperlのソースをちょっと見た感じでは、かなり辛そうですし、
私はPerlを使うので、mysqlのほうはあっさり断念しました。
myperlを見ながらMySQLにCでストアドプロシージャ書けば
いいのかしらんと思いつつ。chasenの初期化とかあるので
素直に行くかどうかちょっと疑問だったりもします。

PHPからCで書かれたライブラリを利用できるようにする方法は
あいにくとしりませんが、とりあえずchasenを外部コマンドとして
呼び出せれば、問題ないかと思います。実行結果を読み込んで
分解するというのは、ルートが多少違っても結局同じことですし。
mod_phpにしているのに外部プログラムを呼び出したんでは...
ということはあるかもしれませんが。

なおWindowsであればCOM連携でComCha.dllが利用できるかも
知れません。
(これは作った本人もあまり信用していなかったりする :-))

ComCha.dll、ChaDll.dll
http://member.nifty.ne.jp/hippo2000/ComCha/ComCha.htm

#って悩むよりPerl使えば?(というのが私の考え(^^))
===================================================
川合 孝典 (Hippo2000)
   DBI日本語メーリングリスト管理人、Kansai.pm所属
   kwitknr@xxxxxxxxxx GCD00051@xxxxxxxxxx
   http://member.nifty.ne.jp/hippo2000
   http://www.hippo2000.info/
「Perlを256倍使うための本 DBI編」 発売中
http://member.nifty.ne.jp/hippo2000/p256dbi/p256dbi.htm
===================================================


[前][次][番号順一覧][スレッド一覧]

      5375 2002-04-20 22:23 [<moeru@xxxxxxxxxx>  ] Full-text Search                        
      5376 2002-04-20 23:19 ┗[とみたまさひろ <tomm]                                       
      5377 2002-04-20 23:35  ┗[<moeru@xxxxxxxxxx>  ]                                     
      5378 2002-04-21 00:34   ┗[とみたまさひろ <tomm]                                   
      5379 2002-04-21 00:47    ┗[<moeru@xxxxxxxxxx>  ]                                 
      5381 2002-04-21 07:37     ┣["KAWAI,Takanori" <GC]                               
      5383 2002-04-21 11:13     ┃┗[<moeru@xxxxxxxxxx>  ]                             
      5386 2002-04-21 23:19     ┃ ┗["KAWAI,Takanori" <GC]                           
      5387 2002-04-22 00:13     ┃  ┗[<moeru@xxxxxxxxxx>  ]                         
      5401 2002-04-25 11:06     ┃   ┗["KAWAI,Takanori" <GC]                       
      5403 2002-04-25 12:14     ┃    ┗[<moeru@xxxxxxxxxx>  ]                     
->    5404 2002-04-25 14:10     ┃     ┣["KAWAI,Takanori" <GC]                   
      5407 2002-04-26 01:10     ┃     ┃┣[<moeru@xxxxxxxxxx>  ]                 
      5408 2002-04-26 07:44     ┃     ┃┃┗["KAWAI,Takanori" <GC]               
      5410 2002-04-26 09:47     ┃     ┃┃ ┗[<moeru@xxxxxxxxxx>  ]             
      5411 2002-04-26 10:52     ┃     ┃┃  ┣["KAWAI,Takanori" <GC]           
      5417 2002-04-27 00:22     ┃     ┃┃  ┃┣[<moeru@xxxxxxxxxx>  ]         
      5419 2002-04-27 12:30     ┃     ┃┃  ┃┗[Tatsuhiko Miyagawa <]         
      5421 2002-04-27 12:46     ┃     ┃┃  ┃ ┣["TOYOSHIMA, Masayuki]       
      5422 2002-04-27 13:06     ┃     ┃┃  ┃ ┃┣[Tatsuhiko Miyagawa <]     
      5423 2002-04-28 11:50     ┃     ┃┃  ┃ ┃┃┗["TOYOSHIMA, Masayuki]   
      5424 2002-04-28 18:36     ┃     ┃┃  ┃ ┃┗["KAWAI,Takanori" <GC]     
      5425 2002-04-28 18:50     ┃     ┃┃  ┃ ┗["KAWAI,Takanori" <GC]       
      5432 2002-05-05 14:58     ┃     ┃┃  ┃  ┗[<moeru@xxxxxxxxxx>  ]     
      5416 2002-04-26 20:20     ┃     ┃┃  ┗[Hidetoshi OKAWA <hid]           
      5420 2002-04-27 12:46     ┃     ┃┗[Tatsuhiko Miyagawa <]                 
      5405 2002-04-25 18:33     ┃     ┗[Hidetoshi OKAWA <hid]                   
      5382 2002-04-21 08:04     ┗[とみたまさひろ <tomm]