[前][次][番号順一覧][スレッド一覧]

mysql:7569

From: "KAWAI,Takanori" <"KAWAI,Takanori" <GCD00051@xxxxxxxxxx>>
Date: Sun, 20 Apr 2003 06:51:42 +0900
Subject: [mysql 07569] Re: 文書検索のためのテーブル設計

川合孝典です。

----- Original Message -----
From: "HIGUCHI Koichi" <ko-ichi@xxxxxxxxxx>
To: <ml@xxxxxxxxxx>
Sent: Sunday, April 20, 2003 4:16 AM
Subject: [mysql 07566] 文書検索のためのテーブル設計


> はじめまして、樋口と申します。
>
> 文書の検索などを行うためのフリーソフトウェアをPerl/Tk + MySQLで作製しよう> しているのですが、テーブル設計で行き詰まってしまいました。皆様のお知恵をか> ていただけませんでしょうか。
(中略)
> 実現したいことは、単語による文書の検索です。
> 例えば、「今日 or 明日 >= 2」という検索式を入力して、「今日」が含まれてい> か、「明日」が2つ以上含まれている文書を検索するといった具合です。

「2つ以上」と出現回数が欲しいのであれば、かわじさんの書かれたとおり頻度を
入れるでしょう。別途、元の文章をとっておく必要があるでしょうけれども。
また元の文章がそのままほしいとすれば、今の形では単語の順序を
入れる列が必要でしょう。

> 皆様のアイデア、あるいは参考になりそうな書籍、ホームページなどなど、
> お教えいただければ幸いです。
単純に単語の出現回数ということになると、長い文章はひっかかり
やすくなるということがあります。さらに、単語がタイトルや見だしに
あるのか、普通の文に含まれているかで重み付けをすると
いったことも考える必要があるかもしれません。

MySQL独自ということでは、「MySQL Full-text Search」が
あります。これは1つの文での単なる出現回数ではなく、登録されて
いる文全体での、その単語の出現回数などをベースに評価している
はずです。(例えば「は」よりも「明日」のほうが点数が高くなるとか)
#最近は追っかけていないので、もっと進化しているかもしれません

去年書いたページですけども
MySQLでお気楽全文検索
(Text::ChaSenとMySQLのFullText Searchの組み合わせ)
 http://www.hippo2000.info/perl/myfull.htm

またDBIx::FullTextSearchというモジュールもあったりします。

またNamazuの動きということではナマズ本あたりはいかがです?
『Namazuシステムの構築と活用』
http://homepage2.nifty.com/baba_hajime/namazubook/
私は古いのしか読んでませんが
http://homepage2.nifty.com/baba_hajime/namazubook/v1/support.html

===================================================
川合 孝典 (Hippo2000)
   DBI日本語メーリングリスト管理人、Kansai.pm所属
   kwitknr@xxxxxxxxxx GCD00051@xxxxxxxxxx
   http://member.nifty.ne.jp/hippo2000http://www.hippo2000.info/
perldocの日本語化ならperldocjp:翻訳してみませんか?
  http://sourceforge.jp/projects/perldocjp
===================================================


[前][次][番号順一覧][スレッド一覧]

      7566 2003-04-20 04:16 ["HIGUCHI Koichi" <ko] 文書検索のためのテーブル設計            
      7567 2003-04-20 04:59 ┣[Shinya Kawaji <kawaj]                                       
      7568 2003-04-20 05:07 ┣[Shogo <shogo@xxxxxxx]                                       
->    7569 2003-04-20 06:51 ┣["KAWAI,Takanori" <GC]                                       
      7570 2003-04-20 09:40 ┗["HIGUCHI Koichi" <ko]