Ответ 1
Словатонный леммамер знает только четыре части речи (ADJ, ADV, NOUN и VERB), и только правила NOUN и VERB делают что-то особенно интересное. Существительные части речи в наборе меток treebank начинаются с NN, все теги глаголов начинаются с VB, теги прилагательных начинаются с JJ, а теги наречия начинаются с RB. Таким образом, преобразование из одного набора меток в другое довольно просто, что-то вроде:
from nltk.corpus import wordnet
morphy_tag = {'NN':wordnet.NOUN,'JJ':wordnet.ADJ,'VB':wordnet.VERB,'RB':wordnet.ADV}[penn_tag[:2]]