Статья 2348

Вторая проблема заключается, собственно, в разборе предложения. Глядя на некоторую часть предложения, не всегда можно точно сказать, какую именно роль играет эта часть во всем предложении и образуют ли единое целое составляющие ее слова. Рассмотрим предложение, розы будут цвести в тех темных садах, что мы покинули очень давно. Слова могут быть интерпретированы как законченное сочетание, в темноте - оно грамматически правильно и имеет смысл. Однако такое словосочетание не может быть правильно включено в разбор всего предложения, поскольку в этом случае следует считать предложением сочетание, розы будут цвести в темноте, и оставшаяся часть оказывается не у дел.
Чтобы справиться с этой многовариантностью объединения слов, в синтаксических анализаторах применяются несколько стратегий. Некоторые анализаторы действуют сверху вниз, пытаясь с самого начала находить варианты структуры предложения другие же работают снизу вверх, начиная с локального объединения слов. В некоторых анализаторах применяется возврат назад, чтобы исследовать альтернативные варианты, если рассматриваемый путь привел к неудаче в других - используется параллельная обработка, с тем чтобы одновременно отслеживать несколько вариантов. Одни анализаторы используют формализмы, придуманные лингвистами, такие, как трансформационные грамматики другие основываются на формализмах, разработанных в расчете на компьютер. Формализмы второго типа больше подходят для реализации процедур синтаксического разбора. Например, в формализме расширенных сетей переходов структура предложений-словосочетаний выражается в виде явной последовательности переходов, которые должна проделать машина. В грамматиках лексических функций создается функциональная структура, в которой со словами и словосочетаниями явно соотносятся выполняемые ими грамматические функции, ядро, подлежащее, дополнение.
Ни одна формальная грамматика не может справиться со всеми проблемами естественного языка, тем не менее существующие анализаторы успешно обрабатывают более 90 процентов всех предложений.