2002年12月01日
SUZAKUとは?
SUZAKU(朱雀) はインターネット/イントラネットを対象にした、フリーのロボット型サーチエンジンです。SUZAKU には、以下のような特徴があります。
- Ruby、MySQLなどのフリーソフトをベースにしたシステムです。
- SUZAKU は、以下の機能がワンセットになっています。
・ホームページのリンクを自動的に探索する機能
・探索したホームページをダウンロード&インデックス化する機能
・キーワードに該当するホームページを検索する機能
・ブラウザによるシステムの管理機能 - ホームページのリンクの探索を、指定された同一サイト内に限定する機能があります。これにより、特定ジャンルのホームページ群を対象とした、独自のサーチエンジンを構築することができます。
- プラットフォームには、Windows/LinuxベースのPCサーバーを想定しています。高速検索が可能なMySQL をデータベースに使用しており、中小規模のサーチエンジンであれば、十分に実用的なシステムを構築することができます。例えば、ADSL + PCサーバー + SUZAKU を使って、独自のサーチエンジンを自前のサーバー上に構築し、外部に公開することができます。
- ホームページのダウンロード&インデックス化の処理を実行中でも、キーワードによる検索を行うことができます。
- ダウンロード先のサーバーを分散し、相手のサーバーに過度の負荷をかけないようにする機能や、robots.txtによる探索制限に従う機能を実装しています。
- プログラム本体は、Ruby および eruby(erb) で記述されており、ソースは公開されています。スクリプト言語による比較的コンパクトなシステムであり、改造も容易です。
投稿者 webmaster : 00:00 | コメント (0) | トラックバック (0)
コメント