仕事で全文検索をすることになりまして、Hyper Estraierを教えてもらいました。
簡単なところですとNamazuがありまして、Namazuですとインデックス作成に時間がかかってしまうところが難点かと思い、会社の方々に幾つか教えてもらいました。
あとはJavaで作られているLuceneも教えてもらったので試したのですが、どうも日本語関連が怪しいので、もうちと調整してみなければ、というところです。
Hyper EstraierはQDBMをベースに作られていて、APIも充実しているみたいですし、なによりインデックス生成が速く、Namazuの約10倍近い性能がありました。どちらにしてもAPIでデータ抽出して成形しなければならないので、Hyper Estraierを選択しようかと考えています。
APIを呼び出すクライアントはJavaになるかと思うのでLuceneも捨てがたいのですが...
