Ответ 1
Там есть приличная информация для написания классификаторов. я написал статью в блоге об этом некоторое время назад.
Что касается образцов/кода, то есть:
- Шаблон проекта, который поставляется с SDK (смотрите под С# → Расширяемость)
- (ответ Брайана) Служба языка Ook
- A шаблон для написания классификаторов (ссылка предназначена для источника шаблона, так что вам придется не templatize $foo $parts)
- A diff classifier (довольно старый)
- Несколько других классификаторов в различных проектах на моей странице github.
Ответ на другую часть вашего вопроса о том, говорит ли SDK, что такое каждое слово, ответ "нет", с несколькими "любопытными" оговорками. В общем, основные языковые модели не раскрываются, хотя вы можете делать такие вещи, как употреблять классификационную информацию из других классификаторов в надежде, что они дадут вам достаточно информации; некоторые, как и С#, имеют тенденцию предоставлять много информации, которая может не отображаться в среде IDE в настройках шрифтов и цветов по умолчанию (проверьте настройки "Инструменты" - "Параметры" - "Среда → " и "Цветовые настройки", чтобы увидеть, хотите ли вы изменения уже могут быть там), а другие, такие как VB, имеют тенденцию не делать этого. Вы также можете использовать такие вещи, как DTE CodeModel, но я никогда не слышал о том, что у него действительно хороший опыт.
Если вам нужен пример использования информации о классификации, вы можете увидеть, как это делает CommentTextTagger.cs (часть расширения проверки орфографии).