Ответ 1
Возможно, вам захочется изучить работу Ноама Хомского и людей, которые последовали за ним. Я считаю, что большая часть его работы была связана с генеративными свойствами языка. Более подробно см. Статью Generative Grammar в Википедии.
Я просматриваю веб-поиск грамматики английского языка, но я нашел лишь несколько простых примеров, например:
s -> np vp
np -> det n
vp -> v | v np
det -> 'a' | 'the'
n -> 'woman' | 'man'
v -> 'shoots'
Может быть, я не понимаю, насколько велика эта проблема, потому что я строго сформулировал эту грамматику. Может ли кто-нибудь предоставить мне источник для некоторой расширенной грамматики формального английского языка?
Возможно, вам захочется изучить работу Ноама Хомского и людей, которые последовали за ним. Я считаю, что большая часть его работы была связана с генеративными свойствами языка. Более подробно см. Статью Generative Grammar в Википедии.
Посмотрите на английскую грамматику ресурсов, которую вы можете использовать с LKB или PET
Это было бы огромно. Вероятно, это невозможно.
Человеческие языки интерпретируются "аналоговыми" существами в (как правило) очень прощающим образом, а не с помощью немых цифровых машин, которые могут настаивать на соблюдении правил. Они, как правило, имеют некоторую структуру, но исключений предостаточно. На самом деле единственное "правило" - это дать возможность другим понять вас.
Даже среди биологических языков английский был бы самым худшим выбором из-за его истории. Это началось, вероятно, как pidgen из разных немецких языков (с упрощенными упрощениями), после чего на Норманнском завоевании было наложено большое количество французских франков, затем на него набросились кусочки и кусочки почти каждого языка в мире.
Чтобы дать вам некоторое представление о масштабе, о котором мы говорим, предположим, что мы можем считать словари вашим списком терминалов для человеческого языка. Единственная крупная работа, которая делает пассивный удар, будучи всеобъемлющей для английского, - это Oxford English Dictionary, который содержит более полмиллиона. Однако очень немногие люди, вероятно, знают более 1/10 из них. Это означает, что, если вы выбрали случайные слова из OED и выстроили предложения из них, большинство англоязычных пользователей столкнулись бы с проблемой даже распознавания результата как английского.
Различные группы говорящих, как правило, знают разные наборы слов. Поэтому почти каждый пользователь языка учится адаптировать свой словарный запас (список используемых терминалов) к своей аудитории. Я говорю по-разному с моими приятелями с "неправильной стороны треков", чем с моей семьей, и все еще не так, как здесь, на SO.
Не совершенный, конечно, не полный, не идеальный с теоретической точки зрения. Но самое приятное, что я нашел: http://www.scientificpsychic.com/grammar/enggram1.html
Посмотрите на Attempto Controlled English: http://attempto.ifi.uzh.ch/site/
Стандартный неэлектронный ресурс Кембриджская грамматика английского языка.