Компьютерная лингвистика для всех - Мифы, Алгоритмы, Язык - Анатолий Анисимов
Шрифт:
Интервал:
Закладка:
Другая известная модель, отражая иерархическую структуру частей предложения, — системы составлявших. Их удобно задавать в виде скобочной структуры. В скобки заключают синтаксически связные словосочетания. Например, (Онегин, (добрый (мой приятель))), (родился (на (брегах Невы))). Очевидно, рассмотренные модели дают важную информацию о синтаксической структуре предложения. Однако у обеих есть существенные недостатки. Деревья подчинения не учитывают связей между словосочетаниями и синтаксически целостными группами слов. В сложных предложениях группы слов могут служить для уточнения одного слова или другой группы слов, что затруднительно выразить связями деревьев подчинения. Системы составляющих игнорируют направленные связи. Кроме того, они не позволяют описывать разрывные словосочетания. Поэтому ни одна из моделей не дает полного представления о синтаксической структуре предложения. Отталкиваясь от такой критики, Гладкий предложил более общую модель, названную им системой синтаксических групп (116). Синтаксическая группа — это подмножество слов
— ------------=
(116) Гладкий А. В. Синтаксические структуры естественного языка в автоматизированных системах общений. — М Наука 1985. — 144 с.
— ------------=
(часть текста), связанных согласно определенному критерию. Между синтаксическими группами устанавливается отношение непосредственного подчинения. Деревья подчинения и системы составляющих могут быть интерпретированы как некоторые разные виды синтаксических групп. Разложение предложения на синтаксические группы неоднозначно и зависит от выбора критерия объединения слов в синтаксическую группу. Гладкий рассмотрел ряд критериев получения синтаксических групп.
Алгоритмическая модель предложения (модель охотника и жертвы).
Мы пытаемся построить модель, максимально приближенную к реальной синтаксической структуре предложения. Предварительно сделаем несколько замечаний, касающихся будущей модели. Деревья подчинения и системы составляющих, несмотря на недостатки, отличаются и достоинством: они адекватно отражают существенные свойства синтаксической структуры предложения. Поэтому модель, которую необходимо разработать, должна давать одновременно информацию, содержащуюся и в деревьях подчинения, и в системах составляющих. Кроме того, что язык дает имена объектам окружающего мира, он обладает фундаментальным свойством выражать динамические отношения, в которые вступают объекты. Например, глагол связывает в отношение объекты, участвующие в схеме его действия, пилагательное задает отношение объекта с самим собой. Из синтаксической модели мы должны знать, какие части предложения связаны между собой через отношения и что это за отношения. Существуют всего два вида синтаксических отношений — предикативное и синтагматическое. Первое выражает зависимость между синтаксическими объектами через понятие, означающее деиствие и обычно выражаемое сказуемым. Синтагма — это сочетание двух синтаксических объектов, из которых один служит определением другого. Поэтому в разрабатываемой модели должны полностью выявляться именно эти виды отношений. Кроме того, в таком широком понимании синтагмы должны образовывать синтаксические группы. Адекватная модель синтаксической структуры должна также отражать основополагающее свойство рекурсивности языка — способность развертывать собственные определения, т. е. давать уточнения, характеристики, комментарии к своим частям, а также строить определения определений. "Язык в себе самом содержит свой внутренний принцип развития" (117). Отнесение подобных вопросов к сфере семантики неправомочно — они должны решаться на уровне синтаксической модели, так как проявляются на уровне общей схемы, не зависящей от смысла высказываний. Предлагаемая ниже модель удовлетворяет всем перечисленным условиям. Прежде всего о роли управляющих связей между словосочетаниями. Мы нарушаем традиционный лингвистический подход, при котором сказуемое считается главным членом предложения, от которого распространяются управляющие связи. Это идет от привычки считать имя функции более важным, чем ее аргументы. Для наших целей удобнее задавать синтаксические отношения связями генерации и передачи отношений. При этом достигается более точная характеристика управляющих связей, чем при традиционном подходе, где акцент делался только на связи подчинения. Пешковский был прав, считая подлежащее главным, но только необходимо было говорить о генерации отношения. Сказуемое тоже главное, но в другом аспекте — в выражении мысли. Вспомним базовую схему первобытного мышления: охотник-действие-жертва. По этой схеме должны строиться простые предложения. Поэтом выделяем объекты-"охотники", генерирующие отношения и «набрасывающие» их на объекты-"жертвы". В сложных предложениях эта схема многократно рекурсивно повторяется. Анализ предложения сводится к выявлению членов предложений как персонажей рекурсивной «ОХОТЫ». Если два объекта, А и В, вступают в отношение С, мы выделяем объект (предположим, А), вызываюший (инициирующий, порождающий) это отношение, и объект, на который оно передается. Таким образом, выделяем два вида направленных связей: от объекта — генератора отношения — к отношению и от отношения к подчиненному объекту: Первый вид связи называем а-связью (связь генерирования), второй — связью (связь распространения). Объекты А, В и отношение С размещаются в точках управляющего пространства, поэтому графическое представление отношения С, связывающего А и В, имеет вид, изобра
— ------------=
(117) Фуко М. Слова и вещи. — С. 488
— ------------=
* Рис. 16. Объект А — «охотник» гнерирует отношение С и направляет его на «жертву» — В
* Рис. 17. Сложный объект с кольцевой связью
женный на рис. 16. Глаголы определяют отношения между объектами. Вот почему в стандартной схеме простого предложения "Существительное — глагол существительное" а-связь направлена от первого существительного к глаголу, а — связь — от глагола к существительному-определению. Рассмотрим пример. "Девочка собирает цветы". Объект «девочка» генерирует отношение, собирает и направляет его на объект «цветы». Рассмотрим фразу "Красивая девочка". Здесь объект девочка генерирует уднарное отношение красивая и передает это отношение себе же (охотник охотится на себя) (рис. 17). Возникает кольцевая связь, характеризующая определения. Аналогично рассуждая, для фразы "Красивая девочка весело собирает цветы" получаем структуру, показанную на рис. 18. Для сравнения рассмотрим дерево зависимостей этого предложения (рис. 19). Замечаем, что структура, показанная на рис. 18, более информативна по сравнению с деревом подчинения. Разложение предложения по а- связи с учетом вложенности точек называем управляющим пространством предложеиия. Отношения — тоже объекты и могут вступать в отношения между собой (это и есть рекурсия). Поэтому а- структуры управляющего пространства распространяются и на сложные предложения. Таким образом, предложение имеет два варианта а- связей: строго линейную и замкнутую кольцевую зависимость. Первую называем линейной конструкцией, вторую — определением. В линейных конструкциях некоторые объекты могут отсутствовать. Поэтому допускаем наличие только одной а- или — связи. Например, птицы летят. Здесь только одна а-связь, направленная от слова «птицы» к слову «летят». В предложении "Улетают вдаль" выделяется одна
* Рис. 18. Структура управляющего пространства предложения
* Рис. 19. Дерево зависимостей
— связь. В подобных случаях иногда можно считать, что отсутствующая аили — связь соединяется с особым объектом «неопределенность». В линейной конструкции связываются отношением два объекта, хотя можно было бы допустить наличие конструкций с несколькими а- и — связями через одно предикативное отношение. При построении управляющих пространств следует избегать таких ситуаций, хотя и это допустимо. Логика языка дает возможность обойтись только простыми линейными конструкциями и определениями. Например: "Он написал письмо брату". В этом предложении в предикативную связь вступают три объекта — он, письмо, брату. Поэтому можно было бы структуру VII этого предложения представить в линейном виде с одной а- и двумя — связями. Но интуитивно осознается, что группа написал письмо сильнее связана, чем написал брату. В этом случае слово письмо выступает как некоторая уточняющая характеристика действия написал. Объекты «он» и «брату» связаны предикативной конструкцией "написал письмо". поэтому более точная структура этого предложения имеет вид, изображенный на рис. 20. Семантически прравильна также интерпретация этого предложения, при которой происходит связывание объектов «он» и «письмо» через отношение "написал брату" (рис. 21). Отличия в понимании этих двух интерпретаций находятся на уровне оттенков смысла и отражают способ