2002年12月01日

SUZAKUとは?

 SUZAKU(朱雀) はインターネット/イントラネットを対象にした、フリーのロボット型サーチエンジンです。SUZAKU には、以下のような特徴があります。

  • Ruby、MySQLなどのフリーソフトをベースにしたシステムです。
  • SUZAKU は、以下の機能がワンセットになっています。
     ・ホームページのリンクを自動的に探索する機能
     ・探索したホームページをダウンロード&インデックス化する機能
     ・キーワードに該当するホームページを検索する機能
     ・ブラウザによるシステムの管理機能
  • ホームページのリンクの探索を、指定された同一サイト内に限定する機能があります。これにより、特定ジャンルのホームページ群を対象とした、独自のサーチエンジンを構築することができます。
  • プラットフォームには、Windows/LinuxベースのPCサーバーを想定しています。高速検索が可能なMySQL をデータベースに使用しており、中小規模のサーチエンジンであれば、十分に実用的なシステムを構築することができます。例えば、ADSL + PCサーバー + SUZAKU を使って、独自のサーチエンジンを自前のサーバー上に構築し、外部に公開することができます。
  • ホームページのダウンロード&インデックス化の処理を実行中でも、キーワードによる検索を行うことができます。
  • ダウンロード先のサーバーを分散し、相手のサーバーに過度の負荷をかけないようにする機能や、robots.txtによる探索制限に従う機能を実装しています。
  • プログラム本体は、Ruby および eruby(erb) で記述されており、ソースは公開されています。スクリプト言語による比較的コンパクトなシステムであり、改造も容易です。

投稿者 webmaster : 00:00 | コメント (0) | トラックバック (0)

トラックバック

コメント