Ответ 1
NLTK (для Python) предлагает несколько древовидных бланков бесплатно.
Можно ли загружать Treebank английских фраз бесплатно или менее $100? Мне нужны учебные данные, содержащие кучу синтаксических анализируемых предложений ( > 1000) на английском языке в любом формате. В основном все, что мне нужно, это просто слова в этих предложениях, которые распознаются частью речи.
NLTK (для Python) предлагает несколько древовидных бланков бесплатно.
Вот несколько (англ.) древовидных брэндов:
American National Corpus: MASC
Вопросы: QuestionBank и исправления Стэнфорда
Британские новости: BNC
Обсуждение TED: NAIST-NTT TED Treebank
Многоязычный корпус Джорджтаунского университета: GUM
Biomedical:
См. также Wikipedia для огромного списка.
как насчет Penn Treebank? Надеюсь, это будет бесплатно или по крайней мере. http://www.cis.upenn.edu/~treebank/cdrom2.html