Ответ 1
Я думаю, вы найдете nltk полезным. В частности, классифицировать модуль.
Быстрый поиск в Google показывает, что существует большое количество байесовских классификаторов, реализованных в виде модулей Python. Если я хочу завернутый, высокоуровневая функциональность, похожая на dbacl, какой из этих модулей подходит мне?
Обучение
% dbacl -l one sample1.txt
% dbacl -l two sample2.txt
Классификация
% dbacl -c one -c two sample3.txt -v
one
Я думаю, вы найдете nltk полезным. В частности, классифицировать модуль.
Возможно, это может быть полезно: http://www.divmod.org/trac/wiki/DivmodReverend
Заметив этот вопрос. Я поставил свою реализацию наивного байесовского классификатора на gitHub.
Это все еще нуждается в большом улучшении. Любая помощь приветствуется.
Если вы пытаетесь обнаружить язык это отлично работает даже с довольно короткими текстами.
Апи очень близок к твоему, но Я не знаю, называется ли это байесовским классификатором.
Попробуйте Mallet и LingPipe. они предоставляют больше моделей для классификатора.