mysql:7569
From: "KAWAI,Takanori" <"KAWAI,Takanori" <GCD00051@xxxxxxxxxx>>
Date: Sun, 20 Apr 2003 06:51:42 +0900
Subject: [mysql 07569] Re: 文書検索のためのテーブル設計
川合孝典です。 ----- Original Message ----- From: "HIGUCHI Koichi" <ko-ichi@xxxxxxxxxx> To: <ml@xxxxxxxxxx> Sent: Sunday, April 20, 2003 4:16 AM Subject: [mysql 07566] 文書検索のためのテーブル設計 > はじめまして、樋口と申します。 > > 文書の検索などを行うためのフリーソフトウェアをPerl/Tk + MySQLで作製しよう と > しているのですが、テーブル設計で行き詰まってしまいました。皆様のお知恵をか し > ていただけませんでしょうか。 (中略) > 実現したいことは、単語による文書の検索です。 > 例えば、「今日 or 明日 >= 2」という検索式を入力して、「今日」が含まれてい る > か、「明日」が2つ以上含まれている文書を検索するといった具合です。 「2つ以上」と出現回数が欲しいのであれば、かわじさんの書かれたとおり頻度を 入れるでしょう。別途、元の文章をとっておく必要があるでしょうけれども。 また元の文章がそのままほしいとすれば、今の形では単語の順序を 入れる列が必要でしょう。 > 皆様のアイデア、あるいは参考になりそうな書籍、ホームページなどなど、 > お教えいただければ幸いです。 単純に単語の出現回数ということになると、長い文章はひっかかり やすくなるということがあります。さらに、単語がタイトルや見だしに あるのか、普通の文に含まれているかで重み付けをすると いったことも考える必要があるかもしれません。 MySQL独自ということでは、「MySQL Full-text Search」が あります。これは1つの文での単なる出現回数ではなく、登録されて いる文全体での、その単語の出現回数などをベースに評価している はずです。(例えば「は」よりも「明日」のほうが点数が高くなるとか) #最近は追っかけていないので、もっと進化しているかもしれません 去年書いたページですけども MySQLでお気楽全文検索 (Text::ChaSenとMySQLのFullText Searchの組み合わせ) http://www.hippo2000.info/perl/myfull.htm またDBIx::FullTextSearchというモジュールもあったりします。 またNamazuの動きということではナマズ本あたりはいかがです? 『Namazuシステムの構築と活用』 http://homepage2.nifty.com/baba_hajime/namazubook/ 私は古いのしか読んでませんが http://homepage2.nifty.com/baba_hajime/namazubook/v1/support.html =================================================== 川合 孝典 (Hippo2000) DBI日本語メーリングリスト管理人、Kansai.pm所属 kwitknr@xxxxxxxxxx GCD00051@xxxxxxxxxx http://member.nifty.ne.jp/hippo2000、http://www.hippo2000.info/ perldocの日本語化ならperldocjp:翻訳してみませんか? http://sourceforge.jp/projects/perldocjp ===================================================
7566 2003-04-20 04:16 ["HIGUCHI Koichi" <ko] 文書検索のためのテーブル設計 7567 2003-04-20 04:59 ┣[Shinya Kawaji <kawaj] 7568 2003-04-20 05:07 ┣[Shogo <shogo@xxxxxxx] -> 7569 2003-04-20 06:51 ┣["KAWAI,Takanori" <GC] 7570 2003-04-20 09:40 ┗["HIGUCHI Koichi" <ko]