« 0x82 | Main | XML parsing failed : (413 Request Entity Too Large) »

2017.06.10

Fess

めっちゃひさしぶりに更新(笑

オープンソース全文検索サーバー Fess

5 分で簡単に構築可能な全文検索サーバー と記載されていますが、確かに、サクッと構築することができました(笑)。
Apache Solr で構築しようと考えていたのですが、セットアップやら、フロントエンドは自前で作る必要があったりするなど、そこそこ時間がかかりそう。その昔、Apache Luceneを作って、某アプリケーションに組み込む検索機能を構築したことはあるのですが、今はとにかくサクッと環境を構築したかったので。

ってことで、JavaSE8をインストールしてちょこちょこっと設定をして、クロールの設定をしたら、ひとまず予備検証は完了♪

ドキュメントではシステムの環境変数を書き換えるように書かれていたのですが、今回はfess.batの方を直接書き換え(今回試したのは Fess 11.1.1 )。

SET JAVA_HOME=C:\Program Files\Java\jdk1.8.0_131

SET PATH=%PATH%;%JAVA_HOME%\bin

の2行を TITLE Fess の下に追記してバッチファイルを実行。ドキュメントではログファイルが更新されるというようなことを記載されていたのですが、そのログファイルが見当たらず。
でも、アクセスするとページが表示されたので、問題なく起動はした模様。

adminページから、今回検索対象としたいPDFファイルが保管されているフォルダを指定して、クロールを即時開始してしばらく待つと・・・できあがり。
難点は、メモリをそれなりに消費することかな・・・。クロール中は、トータルで2GB以上のメモリを消費していた感じなので、ちゃんと運用するのであれば、Fessを起動していない状態での空きメモリは3GB以上は欲しいかもですね。

ちょっと調べたいこと。
・ポート番号を変更したい
・クロール対象のグループを作成し、検索する時に「どのグループを検索対象とするか」を指定したい。
 (マニュアル群のみを検索対象にしたり、ソースコードのみを検索対象としたりできるようにしたい)

|

« 0x82 | Main | XML parsing failed : (413 Request Entity Too Large) »

Java」カテゴリの記事