Джордж Ф. Люгер
Искутсственный интелект
Стратегии и методы решения сложных проблем
2003

6.1.3. Стандартизация сетевых отношений

Само по себе представление отношений в виде графов имеет мало преимуществ пе­ ред исчислением предикатов — это только другая запись отношений между объектами. Сила сетевых представлений состоит в определении связей и специфических правил вы­вода, определяемых механизмом наследования.

Хотя ранняя работа Куиллиана установила такие наиболее значительные особенности формализма семантических сетей, как помеченные дуги и связи, иерархическое наследо­вание и вывод на основе ассоциативных связей, она не позволяла преодолеть сложность многих проблемных областей. Одной из главных причин этого была ограниченность свя­зей, которые не охватывали более глубоких семантических аспектов знаний. Большая часть связей представляла общие ассоциации между узлами и не обеспечивала реальной основы для структурирования семантических отношений. Та же проблема возникала при попытке использовать исчисление предикатов для охвата семантики смысла. Хотя этот формализм является очень выразительным и позволяет представлять почти любой вид знаний, он слишком общий и переносит бремя конструирования соответствующего мно­жества фактов и правил на программиста.

Большинство работ по сетевым представлениям, развивающих работы Куиллиана, сводились к определению обширного множества меток связей (отношений) для более полного моделирования семантики естественного языка. За счет реализации базовых се­мантических отношений естественного языка как части формализма, а не как части зна­ний о предметной области, базы знаний позволяют автоматизировать работу и обеспе­чивают большую общность и непротиворечивость. В [Brachman, 1979] отмечено следующее.

Ключевым вопросом здесь является выделение примитивов для языков семантических сетей. Примитивами сетевого языка являются те понятия, для понимания которых интерпретатор программируется заранее, и которые (обычно) не представлены в самом сетевом языке.

В [Simmons, 1973] подчеркнута необходимость стандартизации отношений с уче­том грамматики английского языка. В этом подходе, основанном на работе [Fillmore, 1968], связи определяются ролью существительных и групп существи­тельных в действии, описываемом предложением. К числу возможных ролей (падежных отношений) относятся агент, объект, инструмент, место и время. Йредложенйе представляется как набор узлов, один из которых соответствует глаго-лу, а остальные связанные с ним узлы представляют других участников действия. Эта структура называется падежным фреймом (case frame). При разборе предложе­ния программа находит глагол и ищет в базе знаний соответствующий ему падеж­ный фрейм. Затем она связывает значения агента, объекта и тому подобного с соот­ветствующими узлами падежного фрейма. Используя этот подход, предложение "Sarah fixed the chair with glue" ("Сара укрепила стул клеем") можно представить се­тью, показанной на рис. 6.5.



Рис. 6.5. Падежный фрейм, представляющий предложение
"Сара укрепила стул клеем "

Таким образом, сам язык представления включает многие глубинные связи есте­ственного языка, такие как отношение между глаголом и его субъектом (агентное отношение) или глаголом и его объектом. Знание падежной структуры английского языка является частью самого сетевого формализма. При разборе отдельного пред­ложения становится ясно, что Сара— это человек, производящий укрепление, а клей используется для соединения частей стула. Отметим, что эти лингвистические отношения запоминаются отдельно (независимо) от реального предложения и да­же от языка, на котором сформулировано предложение. Подобный подход принят ' в сетевых_язьнсах, предложенных в [Norman, 1972], [Rumelhart и др., 1972] v., [Riimelhart и др., 1973]. Ряд исследователей уделяли большое внимание дальнейшей стандартизации имен^ ^связей [Masterman, 1961], [Wilks, 1972], [Schank и Colby, 1973], [Schank и Nash-Webber, 197S]. Каждое исследование было направлено на установление полного множества примитивов для единообразного представления семантической структуры выраже­ний естественного языка. Эти множества призваны помочь в реализации рассуждений с использованием элементов языка. Они должны быть независимы от индивидуальных особенностей отдельных языков или фраз. Возможно, наиболее амбициозной попыткой формального моделирования глубинных семантических структур естественного языка является теория концептуальной зависимо-emu (conceptual dependency) Ригера(Rieger) и Шенка(Schank) [Sdiank и Rieger, l974. В рамках теории концептуальной зависимости рассматриваются четыре типа примитивов, на основе которых определяется смысл выражений. К ним относятся:

• ACT — действия (actions);
• РР — объекты (picture producers);
• АА — модификаторы действий (action aiders);
• PA — модификаторы объектов (picture aiders).

Предполагается, что каждое из действий должно приводить к созданию одного или нескольких примитивов ACT.
Перечисленные ниже примитивы выбраны в качестве основных компонентов действия.

• ATRANS — передавать отношение (давать).
• PTRANS — передавать физическое расположение объекта (идти).
• PROPEL — применять физическую силу к объекту (толкать).
• MOVE — перемещать часть тела (владельцем).
• GRASP — захватывать объект (исполнителем).
• INGEST — поглощать объект (есть).
• EXPEL — издавать звуки (кричать).
• MTRANS — передавать ментальную информацию (сказать).
• MBUILD — создавать новую ментальную информацию (решать).
• CONC — осмысливать идею (думать).
• SPEAK — производить звук (говорить).
• ATTEND — слушать.

Эти примитивы используются для определения отношений концептуальной зави­симости, которые описывают смысловые структуры, такие как падежные отношения или связи объектов и значений. Отношения концептуальной зависимости — это кон­цептуальные синтаксические правила, которые выражают семантические связи в соответствии с грамматикой языка. Эти отношения могут быть использованы для конструирования внутреннего представления английского предложения. На рис. 6.6 представлен список основных концептуальных зависимостей [Schank и Rieger, 1974]. Эти зависимости охватывают базовые семантические структуры есте­ственного языка. Например, первая концептуальная зависимость на рис. 6.6 описы­вает отношение между подлежащим и сказуемым, а третья — отношение глагол-объект. Они могут сочетаться и представлять простые транзитивные предложения, такие как "John throws the ball" ("Джон бросает мяч") (рис. 6.7).

Указывает, что исполнитель действует
указывает, что объект имеет определенный признак
означает объект действия
обозначает реципиента и донора для объекта действия
указывает направление объекта действия
означает инструментальную концептуализацию действия
указывает, что X вызывается Y
указывает изменение состояния объекта
указывает, что РР2 является либо частью, либо владельцем РР1

Рис. 6.6. Концептуальные зависимости [Schank и Rieger, 1974]

1. Джон бежал.
2. Джон высокий.
3. Джон—доктор
4. Милый мальчик.
5 Собака Джона
6 Джон двигал тележку
7 Джон взял книгу у Мэр
8 Джон съел мороженое
9 Джон удобрил поле
10 Растения выросли.
11 Билл застрелил Боба.
12 Вчера Джон

Рис. 6.8. Некоторые базовые концептуальные зависимости, взятые из работы [Schank и Colby, 1973], и их использование для представ­ления более сложных английских предложений


И, наконец, ко множеству концепций может быть добавлена временная и модальная информация. Шенк приводит следующий список модификаторов отношений.

р — прошедшее время
f — будущее время
t — передача
к — продолжительность
r — начало передачи
? — вопрос
t — окончание передачи
с — условие
/ — отрицание
nil — настоящее время
delta"! — независимость от времени

В рамках теории эти отношения считаются конструкциями первого уровня — простейшими семантическими отношениями, на основе которых могут быть построены более сложные структуры. Примеры того, как эти базовые концептуальные зависимости могут сочетаться для представления смысла простых английских предложений, показаны на рис. 6.8.


На рис. 6.9 показано, как на основе этих примитивов представляется выражение "John ate the egg" ("Джон съел яйцо"). : Символы здесь имеют следующий смысл

•    <------ указывает направление зависимости;
•    <=> — обозначает отношение агент-глагол;
•    р — указывает на прошедшее время;
•    INGEST — определяет примитивное действие теории;
•    О — обозначает объектное отношение;
•    О — указывает направление объекта при выполнении действия.

Рис. 6.9. Концептуальная зависимость, представляющая выражение "John ate the egg" [Schank и Rieger, 1974]

Другим примером структур, которые могут быть построены на основе концептуальных зависимостей, является графическое представление предложения "John, prevented Mary from giving a book to bill" ("Джон предостерег Мэри, чтобы она не давала книгу Биллу") (рис. 6.10). Этот частный пример интересен тем, что он демонстрирует представление причинности.

Рис. 6.10. Представление концептуальной за­висимости для предложения "John prevented Mary from giving a book to bill" [Schank ы Rieger, 1974]

Теория концептуальной зависимости имеет ряд важных преимуществ. Во-первых, за счет построения формальной теории семантик естественного языка уменьшаются проблемы, связанные с двусмысленностью. Во-вторых, само представление в про­цессе построения канонической формы смысла выражений охватывает много есте­ственно-языковых семантик. Это означает, что все выражения, которые имеют один и тот же смысл, будут внутренне представлены синтаксически идентичными, а не только семантически эквивалентными графами. Это каноническое представление — попытка упростить выводы, требуемые для понимания. Например, мы можем про­демонстрировать, что два выражения означают одну и ту же сущность, с помощью простого сопоставления графов концептуальной зависимости. Представление, которое не обеспечивает канонической формы, может потребовать большого количества операций на графах различной структуры.

К сожалению, процесс преобразования выражений в каноническую форму вряд ли можно полностью алгоритмизировать. Как отмечено в [Woods, 1985] и других работах, преобразование в каноническую форму нельзя реализовать даже для моноидов — алгебраических групп, которые значительно проще, чем естественный язык. Более того, нет уверенности, что люди запоминают свои знания в какой-нибудь канонической форме.

Критические замечания высказывались также по поводу вычислительной слож­ности преобразования предложения в набор примитивов низкого уровня. Кроме то­го, сами примитивы не позволяют охватить многие более тонкие понятия, играющие важную роль в использовании естественного языка. Например, представление слова "tall" ("высокий") во втором выражении на рис. 6.8 не учитывает неопределенность этого термина, как это делается в системах нечеткой логики [Zadeh, 1983], описанных в разделе 7.3.

Однако нельзя сказать, что модель концептуальной зависимости интенсивно не изучалась и не была хорошо понята. Уточнение и расширение этой модели продолжалось более десяти лет. Важными для развития теории концептуальных зависимостей являются работы, посвященные сценариям и пакетам организации памяти. Работы по сценариям связаны с изучением организации знаний в памяти и ее роли в рассуждениях (см. подраздел 6.1.4). Пакеты организации памяти стали одной из' вспомогательных исследовательских областей для разработки механизмов рассуждений, основанных на опыте (раздел 7.3) Теория концептуальной зависимости является полностью разработанной моделью семантики естественного языка. Она широко применяется и дает непротиворечивые результаты.