Джордж Ф. Люгер
Искутсственный интелект
Стратегии и методы решения сложных проблем
2003
Само по себе представление отношений в виде графов имеет мало преимуществ пе ред исчислением предикатов — это только другая запись отношений между объектами. Сила сетевых представлений состоит в определении связей и специфических правил вывода, определяемых механизмом наследования.
Хотя ранняя работа Куиллиана установила такие наиболее значительные особенности формализма семантических сетей, как помеченные дуги и связи, иерархическое наследование и вывод на основе ассоциативных связей, она не позволяла преодолеть сложность многих проблемных областей. Одной из главных причин этого была ограниченность связей, которые не охватывали более глубоких семантических аспектов знаний. Большая часть связей представляла общие ассоциации между узлами и не обеспечивала реальной основы для структурирования семантических отношений. Та же проблема возникала при попытке использовать исчисление предикатов для охвата семантики смысла. Хотя этот формализм является очень выразительным и позволяет представлять почти любой вид знаний, он слишком общий и переносит бремя конструирования соответствующего множества фактов и правил на программиста.
Большинство работ по сетевым представлениям, развивающих работы Куиллиана, сводились к определению обширного множества меток связей (отношений) для более полного моделирования семантики естественного языка. За счет реализации базовых семантических отношений естественного языка как части формализма, а не как части знаний о предметной области, базы знаний позволяют автоматизировать работу и обеспечивают большую общность и непротиворечивость. В [Brachman, 1979] отмечено следующее.
Ключевым вопросом здесь является выделение примитивов для языков семантических сетей. Примитивами сетевого языка являются те понятия, для понимания которых интерпретатор программируется заранее, и которые (обычно) не представлены в самом сетевом языке.
В [Simmons, 1973] подчеркнута необходимость стандартизации отношений с учетом грамматики английского языка. В этом подходе, основанном на работе [Fillmore, 1968], связи определяются ролью существительных и групп существительных в действии, описываемом предложением. К числу возможных ролей (падежных отношений) относятся агент, объект, инструмент, место и время. Йредложенйе представляется как набор узлов, один из которых соответствует глаго-лу, а остальные связанные с ним узлы представляют других участников действия. Эта структура называется падежным фреймом (case frame). При разборе предложения программа находит глагол и ищет в базе знаний соответствующий ему падежный фрейм. Затем она связывает значения агента, объекта и тому подобного с соответствующими узлами падежного фрейма. Используя этот подход, предложение "Sarah fixed the chair with glue" ("Сара укрепила стул клеем") можно представить сетью, показанной на рис. 6.5.
Таким образом, сам язык представления включает многие глубинные связи естественного языка, такие как отношение между глаголом и его субъектом (агентное отношение) или глаголом и его объектом. Знание падежной структуры английского языка является частью самого сетевого формализма. При разборе отдельного предложения становится ясно, что Сара— это человек, производящий укрепление, а клей используется для соединения частей стула. Отметим, что эти лингвистические отношения запоминаются отдельно (независимо) от реального предложения и даже от языка, на котором сформулировано предложение. Подобный подход принят
' в сетевых_язьнсах, предложенных в [Norman, 1972], [Rumelhart и др., 1972] v., [Riimelhart и др., 1973].
Ряд исследователей уделяли большое внимание дальнейшей стандартизации имен^
^связей [Masterman, 1961], [Wilks, 1972], [Schank и Colby, 1973], [Schank и Nash-Webber, 197S]. Каждое исследование было направлено на установление полного множества примитивов для единообразного представления семантической структуры выражений естественного языка. Эти множества призваны помочь в реализации рассуждений с использованием элементов языка. Они должны быть независимы от индивидуальных особенностей отдельных языков или фраз.
Возможно, наиболее амбициозной попыткой формального моделирования глубинных семантических структур естественного языка является теория концептуальной зависимо-emu (conceptual dependency) Ригера(Rieger) и Шенка(Schank) [Sdiank и Rieger, l974. В рамках теории концептуальной зависимости рассматриваются четыре типа примитивов, на основе которых определяется смысл выражений. К ним относятся:
Предполагается, что каждое из действий должно приводить к созданию одного или нескольких примитивов ACT.
Перечисленные ниже примитивы выбраны в качестве основных компонентов действия.
Эти примитивы используются для определения отношений концептуальной зависимости, которые описывают смысловые структуры, такие как падежные отношения или связи объектов и значений. Отношения концептуальной зависимости — это концептуальные синтаксические правила, которые выражают семантические связи в соответствии с грамматикой языка. Эти отношения могут быть использованы для конструирования внутреннего представления английского предложения. На рис. 6.6 представлен список основных концептуальных зависимостей [Schank и Rieger, 1974]. Эти зависимости охватывают базовые семантические структуры естественного языка. Например, первая концептуальная зависимость на рис. 6.6 описывает отношение между подлежащим и сказуемым, а третья — отношение глагол-объект. Они могут сочетаться и представлять простые транзитивные предложения, такие как "John throws the ball" ("Джон бросает мяч") (рис. 6.7).
Указывает, что исполнитель действует | |
указывает, что объект имеет определенный признак | |
означает объект действия | |
обозначает реципиента и донора для объекта действия | |
указывает направление объекта действия | |
означает инструментальную концептуализацию действия | |
указывает, что X вызывается Y | |
указывает изменение состояния объекта | |
указывает, что РР2 является либо частью, либо владельцем РР1 |
Рис. 6.6. Концептуальные зависимости [Schank и Rieger, 1974]
1. | Джон бежал. | ||
2. | Джон высокий. | ||
3. | Джон—доктор | ||
4. | Милый мальчик. | ||
5 | Собака Джона | ||
6 | Джон двигал тележку | ||
7 | Джон взял книгу у Мэр | ||
8 | Джон съел мороженое | ||
9 | Джон удобрил поле | ||
10 | Растения выросли. | ||
11 | Билл застрелил Боба. | ||
12 | Вчера Джон |
Рис. 6.8. Некоторые базовые концептуальные зависимости, взятые из работы [Schank и Colby, 1973], и их использование для представления более сложных английских предложений
И, наконец, ко множеству концепций может быть добавлена временная и модальная информация. Шенк приводит следующий список модификаторов отношений.
В рамках теории эти отношения считаются конструкциями первого уровня — простейшими семантическими отношениями, на основе которых могут быть построены более сложные структуры. Примеры того, как эти базовые концептуальные зависимости могут сочетаться для представления смысла простых английских предложений, показаны на рис. 6.8.
На рис. 6.9 показано, как на основе этих примитивов представляется выражение "John ate the egg" ("Джон съел яйцо"). : Символы здесь имеют следующий смысл
Рис. 6.9. Концептуальная зависимость, представляющая выражение "John ate the egg" [Schank и Rieger, 1974]
Другим примером структур, которые могут быть построены на основе концептуальных зависимостей, является графическое представление предложения "John, prevented Mary from giving a book to bill" ("Джон предостерег Мэри, чтобы она не давала книгу Биллу") (рис. 6.10). Этот частный пример интересен тем, что он демонстрирует представление причинности.
Рис. 6.10. Представление концептуальной зависимости для предложения "John prevented Mary from giving a book to bill" [Schank ы Rieger, 1974]
Теория концептуальной зависимости имеет ряд важных преимуществ. Во-первых, за счет построения формальной теории семантик естественного языка уменьшаются проблемы, связанные с двусмысленностью. Во-вторых, само представление в процессе построения канонической формы смысла выражений охватывает много естественно-языковых семантик. Это означает, что все выражения, которые имеют один и тот же смысл, будут внутренне представлены синтаксически идентичными, а не только семантически эквивалентными графами. Это каноническое представление — попытка упростить выводы, требуемые для понимания. Например, мы можем продемонстрировать, что два выражения означают одну и ту же сущность, с помощью простого сопоставления графов концептуальной зависимости. Представление, которое не обеспечивает канонической формы, может потребовать большого количества операций на графах различной структуры.
К сожалению, процесс преобразования выражений в каноническую форму вряд ли можно полностью алгоритмизировать. Как отмечено в [Woods, 1985] и других работах, преобразование в каноническую форму нельзя реализовать даже для моноидов — алгебраических групп, которые значительно проще, чем естественный язык. Более того, нет уверенности, что люди запоминают свои знания в какой-нибудь канонической форме.
Критические замечания высказывались также по поводу вычислительной сложности преобразования предложения в набор примитивов низкого уровня. Кроме того, сами примитивы не позволяют охватить многие более тонкие понятия, играющие важную роль в использовании естественного языка. Например, представление слова "tall" ("высокий") во втором выражении на рис. 6.8 не учитывает неопределенность этого термина, как это делается в системах нечеткой логики [Zadeh, 1983], описанных в разделе 7.3.
Однако нельзя сказать, что модель концептуальной зависимости интенсивно не изучалась и не была хорошо понята. Уточнение и расширение этой модели продолжалось более десяти лет. Важными для развития теории концептуальных зависимостей являются работы, посвященные сценариям и пакетам организации памяти. Работы по сценариям связаны с изучением организации знаний в памяти и ее роли в рассуждениях (см. подраздел 6.1.4). Пакеты организации памяти стали одной из' вспомогательных исследовательских областей для разработки механизмов рассуждений, основанных на опыте (раздел 7.3) Теория концептуальной зависимости является полностью разработанной моделью семантики естественного языка. Она широко применяется и дает непротиворечивые результаты.