自分で作ったあとにGoogleで検索して、すでにもっとすごいものがあるということに気づくという、いつものパータンですが、
webstemmer
という、より精度の高そうな本文抽出ツールを公開されている方がおられます。
こういうアルゴリズムは聞いたことはあったけど、Pythonですでに実装されているとは。
しかし、こういうのを作るってすごい。
いつかは自分もこういうものを作れるようになりたいと思います。
PythonやC++のメモ
自分で作ったあとにGoogleで検索して、すでにもっとすごいものがあるということに気づくという、いつものパータンですが、
webstemmer
という、より精度の高そうな本文抽出ツールを公開されている方がおられます。
こういうアルゴリズムは聞いたことはあったけど、Pythonですでに実装されているとは。
しかし、こういうのを作るってすごい。
いつかは自分もこういうものを作れるようになりたいと思います。