2011-06-14から1日間の記事一覧

multiprocessing で word count

検索を書いてみるついでに、並列処理でマップリデュースっぽいワードカウントをやってみた。 しかし大量のドキュメントを用意するのが面倒だったので、複数クエリでやってみる。文章と検索対象のどちらが共通か、っていう問題なので、やってることは同じ。 #…

MongoDBなら検索エンジンが簡単に作れる

形態素解析でインデックスを作って検索する Mongoでの全文検索 - Docs-Japanese - 10gen Confluenceを参考に、すぐ実装できた 試しに、青空文庫から走れメロス引っ張ってやってみた。 ライブラリ MongoDB API Docs for python > easy_install pymongo SREngi…