2007-07-24

他のPythonによる本文抽出ツール

自分で作ったあとにGoogleで検索して、すでにもっとすごいものがあるということに気づくという、いつものパータンですが、

webstemmer

という、より精度の高そうな本文抽出ツールを公開されている方がおられます。

こういうアルゴリズムは聞いたことはあったけど、Pythonですでに実装されているとは。

しかし、こういうのを作るってすごい。
いつかは自分もこういうものを作れるようになりたいと思います。