Стэнфордские парсерные теги
Я только начал использовать Stanford Parser, но я не очень хорошо понимаю теги. Это может быть глупый вопрос, но кто-нибудь может сказать мне, что представляют собой теги SBARQ и SQ, и где я могу найти полный список для них? Я знаю, как выглядит Penn Treebank, но они немного разные.
Sentence: What is the highest waterfall in the United States ?
(ROOT
(SBARQ
(WHNP (WP What))
(SQ (VBZ is)
(NP
(NP (DT the) (JJS highest) (NN waterfall))
(PP (IN in)
(NP (DT the) (NNP United) (NNPS States)))))
(. ?)))
Я просмотрел веб-сайт Стэнфорда Парсера и прочитал несколько журналов, перечисленных там, но нет объяснений упомянутых выше тегов. Я нашел руководство, описывающее все используемые зависимости, но не объясняет, что я ищу. Спасибо!
Ответы
Ответ 1
Эта ссылка имеет обширный список - не уверен, что она завершена или нет.
В частности, в нем перечислены те, о которых вы спрашиваете:
SBARQ - Direct question introduced by a wh-word or a wh-phrase. Indirect
questions and relative clauses should be bracketed as SBAR, not SBARQ.
SQ - Inverted yes/no question, or main clause of a wh-question,
following the wh-phrase in SBARQ.
Ответ 2
Чтобы увидеть весь список, просто напечатайте tagIndex анализатора
LexicalizedParser lp = LexicalizedParser.loadModel();
System.out.println(lp.tagIndex); // print the tag index