mysql:11154
From: "Takashi Hoshizawa" <"Takashi Hoshizawa" <t_hoshizawa@xxxxxxxxxx>>
Date: Sat, 12 Mar 2005 01:28:57 +0900
Subject: [mysql 11154] MySQLを使ったフリーのサーチエンジン
星澤といいます。 MySQL、Ruby、erubyをベースに開発したフリーのサーチエンジン 「SUZAKU(朱雀)」のバージョン2を公開しました。 下記のURLから、ダウンロードすることができます。 http://hoshizawa.no-ip.com/suzaku/ 1. SUZAKUとは SUZAKU(朱雀) は、インターネット/イントラネットを対象にした、フリーの ロボット型サーチエンジンです。 SUZAKU には、以下のような特徴があります。 ・MySQL、Ruby、erubyなどのフリーソフトをベースにしたシステムです。 ・SUZAKU は、以下の機能がワンセットになっています。 ・ホームページのリンクを自動的に探索し、ダウンロード&インデックス化 する機能 ・キーワードに該当するホームページを検索する機能 ・ブラウザによるシステムの管理機能 ・ホームページのリンクの探索を、指定された同一サイト内に限定する機能 があります。これにより、特定ジャンルのホームページ群を対象とした、 独自のサーチエンジンを構築することができます。 ・プラットフォームには、LinuxベースのPCサーバーを想定しています。高速 検索が可能な MySQL をデータベースに使用しており、中小規模のサーチ エンジンであれば、十分に実用的なシステムを構築することができます。 例えば、ADSL + PCサーバー(Linux) + SUZAKU を使って、独自のサーチ エンジンを自前のサーバー上に構築し、外部に公開することができます。 ・ホームページのダウンロード&インデックス化の処理を実行中でも、 キーワードによる検索を行うことができます。 ・ダウンロード先のサーバーを分散し、相手のサーバーに過度の負荷をかけ ないようにする機能や、robots.txt による探索制限に従う機能を実装して います。 ・プログラム本体は、Ruby および eruby で記述されており、ソースは公開 されています。スクリプト言語による比較的コンパクトなシステムであり、 改造も容易です。 2. バージョン2の変更点 2005/03/09 Version 2.0 * Ruby 1.8対応。 * MySQL 4.1対応。 * 検索キーワードに数字が指定された場合の処理改善。 * Version 1では名詞のみを検索対象としていたが、Version 2ではすべての 単語を検索対象とするように変更。 * 前提とする文字コードをEUCからUTF-8に変更。 * 巡回処理のログを、巡回処理が実行される毎に別ファイルとして保存する 形式に変更(管理者モードで巡回ログを表示する際のレスポンス改善)。 --- 星澤 隆 / Takashi Hoshizawa mail: t_hoshizawa@xxxxxxxxxx
11150 2005-03-10 23:42 [Toshinori Kawai <zan] マルチ質問 11151 2005-03-11 00:23 ┣[Manabu Kobayashi <ma] Re: [mysql 11150] マルチ質問 11152 2005-03-11 09:38 ┣[Tetsuro Ikeda <ikdtt] 11191 2005-03-18 17:28 ┃┗[Toshinori Kawai <kaw] MYSQL4.1.9をアンインストールし、MYSQL4.0.23をインストールしたときの状況 11218 2005-03-20 18:55 ┃ ┗[Toshinori Kawai <zan] Re: 【自己解決】 MYSQL4.1.9をアンインストールし、MYSQL4.0.23をインストールしたときの状況 11153 2005-03-11 10:03 ┗["kondo kondo" <umius] -> 11154 2005-03-12 01:28 ┗["Takashi Hoshizawa" ] MySQLを使ったフリーのサーチエンジン