|
|||
|
|||
B
|
Венди Ленерт, М. Г. Дайер,
П. Н. Джонсон, К- Дж. Янг, С. Харли
BORIS-ЭКСПЕРИМЕНТАЛЬНАЯ СИСТЕМА ГЛУБИННОГО ПОНИМАНИЯ ПОВЕСТВОВАТЕЛЬНЫХ
ТЕКСТОВ *
(Йейльский университет. Отделение информатики)
|
||
|
|||
BORIS — это экспериментальная система, способная понимать тексты и отвечать на вопросы; ее работа основана на использовании целого ряда источников знаний. В противоположность системам поверхностного понимания текстов, которые извлекают из текста лишь его основное содержание и игнорируют все остальное, система BORIS стремится понять входной текст с максимальной степенью глубины. В настоящей работе рассматриваются способы автоматической обработки достаточно сложного повествовательного текста, а именно короткого рассказа, в котором описывается история одного развода.
1. ВВЕДЕНИЕ
1.1. Процессуальная модель понимания повествовательного текста Предлагаемая в настоящей работе теория понимания повествовательного текста реализована в машинной программе BORIS. Кроме обработки текста, BORIS обладает способностью отвечать на вопросы по тексту, тем самым демонстрируя правильность его понимания. Таким образом, в системе BORIS программно воплощается также теория поиска информации в памяти для построения ответа на вопрос.
Ниже дается запись вопросно-ответного сеанса работы системы с конкретным текстом короткого рассказа, который мы будем называть РАЗВОД-1. По мере обработки программой BORIS фрагментов текста она создает внутреннее представление воспринятого ею понятийного содержания. Вопросы, на которые способна отвечать система, показывают, каким образом в этом внутреннем представлении отражаются причинно-следственные отношения, служащие основой ос-
|
|||
|
|||
* Wendy G. L е h п е г t, Michael G. Dyer, Peter N.Johnson, С J. Yang and Steve H a r 1 e y. (Department of Computer Science, Yale University. New Haven, USA.) BORIS — An Experiment in-Depth Understanding of Narratives.— „Artificial Intelligence", vol. 20, № 1, 1983, p. 15—62.
Настоящая работа отчасти финансировалась Агентством перспективных исследовательских проектов (ARPA), а отчасти — Национальным научным фондом США.— Прим. авторов.
© 1983 North-Holland.
|
|||
|
|||
|
|||
|
|||
|
||
мысленной и связной интерпретации входного текста. (Входной материал, предлагаемый программе, набирается строчными буквами, а ответы программы — прописными *.)
(BORIS РАЗВОД-1)
ОБРАБАТЫВАЕТСЯ АБЗАЦ 1
Ричард несколько лет не имел никаких известий о Поле, своем товарище по комнате во время учебы в университете. В то время Ричард одолжил у Поля некоторую сумму, которая так и не была возвращена. Теперь же он совершенно не представлял себе, где он может найти своего старого друга. Когда вдруг из Сан-Франциско пришло письмо, Ричард загорелся желанием узнать, как живет Поль.
СИСТЕМА ГОТОВА К РАБОТЕ В РЕЖИМЕ В/О
Какое событие произошло у Ричарда дома? РИЧАРД ПОЛУЧИЛ ПИСЬМО ОТ ПОЛЯ.
Кто такой Поль? ДРУГ РИЧАРДА.
Хотел ли Ричард видеть Поля?
ДА, РИЧАРД ХОТЕЛ ЗНАТЬ, КАК ЖИВЕТ ПОЛЬ.
Помогал ли когда-либо Поль Ричарду?
ДА, ПОЛЬ ДАЛ РИЧАРДУ ДЕНЬГИ В ДОЛГ.
Почему Ричард не вернул долг Полю? РИЧАРД НЕ ЗНАЛ, ГДЕ НАХОДИТСЯ ПОЛЬ.
Что почувствовал Ричард, когда пришло письмо? РИЧАРД БЫЛ ОБРАДОВАН, ПОТОМУ ЧТО ПОЛЬ И ОН БЫЛИ ДРУЗЬЯМИ.
ОБРАБАТЫВАЕТСЯ АБЗАЦ 2
К сожалению, новости не были хорошими. Жена Поля Сара настаивала на разводе. Она хотела также получить машину, дом, взять детей и добиться алиментов. Поль хотел развода, но он не хотел, чтобы к Саре перешло все их имущество. Его жалованье в государственной школе было очень мало. Не зная, к кому обратиться, он надеялся на содействие единственного знакомого ему адвоката. Поль указал номер своего домашнего телефона на тот случай, если Ричард сочтет, что может быть ему полезным.
|
||
|
||
* Фразы из рассказов, вопросы к системе BORIS и ее ответы даются на русском языке; текст на английском приводится только в тех случаях, когда обсуждается какое-то явление, специфичное для английского языка.— Прим. перев.
|
||
|
||
|
|||
СИСТЕМА ГОТОВА К РАБОТЕ В РЕЖИМЕ В/О
Что сообщалось в письме?
ПОЛЬ И САРА ЗАТЕЯЛИ ДЕЛО О РАЗВОДЕ.
Написал ли Поль письмо Саре?
НЕТ, НЕ САРЕ. ПИСЬМО ПОЛУЧИЛ РИЧАРД.
Почему Поль был расстроен в связи с разводом? ПОЛЬ И САРА СПОРИЛИ ПО ПОВОДУ СЕМЕЙНОГО ИМУЩЕСТВА.
Чем Поль зарабатывал себе на жизнь? ПОЛЬ БЫЛ УЧИТЕЛЕМ.
Чего хотела Сара?
САРА ХОТЕЛА ПОЛУЧИТЬ МАШИНУ И ДОМ, ВЗЯТЬ МАЛЫШЕЙ И ДОБИТЬСЯ АЛИМЕНТОВ.
Почему Поль написал Ричарду?
ПОЛЬ ХОТЕЛ, ЧТОБЫ РИЧАРД БЫЛ ЕГО АДВОКАТОМ.
ОБРАБАТЫВАЕТСЯ АБЗАЦ 3
Ричард нетерпеливо схватил трубку телефона и набрал номер. После короткого разговора Поль договорился с ним позавтракать вместе на следующий день. В его голосе слышались явное облегчение и благодарность.
СИСТЕМА ГОТОВА К РАБОТЕ В РЕЖИМЕ В/О
Почему Ричард позвонил Полю?
РИЧАРД ХОТЕЛ ДОГОВОРИТЬСЯ С ПОЛЕМ О ВСТРЕЧЕ.
Установил ли Ричард связь с Полем? ДА, РИЧАРД ПОЗВОНИЛ ПОЛЮ.
Как Ричард установил связь с Полем? ПО ТЕЛЕФОНУ.
Что почувствовал Поль, когда позвонил Ричард?
ПОЛЬ БЫЛ ДОВОЛЕН, ТАК КАК РИЧАРД СОГЛАСИЛСЯ
БЫТЬ АДВОКАТОМ ПОЛЯ.
ОБРАБАТЫВАЕТСЯ АБЗАЦ 4
На следующий день, когда Ричард ехал на машине в ресторан, он едва не сбил на улице старика. Он чувствовал себя совершенно потрясенным после этого происшествия и в ресторане выпил три рюмки спиртного. Когда пришел Поль, Ричард был изрядно пьян. Когда принесли еду, Ричард пролил чашку кофе на Поля. Это, видимо, сильно раздосадовало Поля, и поэтому Ричард предложил отвезти его домой, чтобы он мог переодеться.
|
СИСТЕМА ГОТОВА К РАБОТЕ В РЕЖИМЕ В/О Почему Ричард завтракал вместе с Полем? РИЧАРД ХОТЕЛ ОБСУДИТЬ С ПОЛЕМ ДЕЛО О РАЗВОДЕ.
Что случилось с Ричардом на пути в ресторан? РИЧАРД ЕДВА НЕ ЗАДАВИЛ СТАРИКА.
Почему Ричард напился?
РИЧАРД БЫЛ ПОТРЯСЕН ТЕМ, ЧТО ОН ЕДВА НЕ ЗАДАВИЛ
СТАРИКА.
Что случилось в ресторане?
РИЧАРД ПРОЛИЛ КОФЕ НА ПОЛЯ.
Что почувствовал Ричард, когда пролил кофе?
РИЧАРД ПОЧУВСТВОВАЛ СЕБЯ ВИНОВАТЫМ.
Почему Ричард пролил кофе? РИЧАРД БЫЛ ПЬЯН.
Когда Ричард едва не сбил старика?
КОГДА РИЧАРД ЕХАЛ НА МАШИНЕ В РЕСТОРАН.
Где Ричард завтракал с Полем? В РЕСТОРАНЕ.
|
||
ОБРАБАТЫВАЕТСЯ АБЗАЦ 5
Когда Поль вошел в спальню и обнаружил там Сару с другим мужчиной, его едва не хватил удар. Затем он сообразил, что это невероятная удача. Поскольку рядом был свидетель в лице Ричарда, то дело о разводе для Сары было очевидным образом проиграно. Ричард поздравил Поля и предложил отпраздновать удачу и пообедать вместе. Поль охотно согласился.
СИСТЕМА ГОТОВА К РАБОТЕ В РЕЖИМЕ В/О
Почему Ричард отвез Поля домой?
ЧТОБЫ ПОЛЬ МОГ ПЕРЕМЕНИТЬ ОДЕЖДУ.
Что произошло у Поля дома?
ПОЛЬ ЗАСТАЛ САРУ В МОМЕНТ НАРУШЕНИЯ СУПРУЖЕСКОЙ ВЕРНОСТИ.
Что почувствовал Поль? ПОЛЬ БЫЛ ПОРАЖЕН.
Почему Сара проиграла дело о разводе?
САРА НАРУШИЛА СУПРУЖЕСКУЮ ВЕРНОСТЬ.
Почему Ричард поздравил Поля? ПОЛЬ ВЫИГРАЛ ДЕЛО О РАЗВОДЕ.
|
|||
|
|||
|
|||
1.2. Проблемы, проблемы, проблемы
|
весь второй абзац посвящен информации, содержащейся в письме, которое читает Ричард. Однако читателю нигде явно не сообщается о факте прочтения письма.
(е) Жена Поля Сара настаивала на разводе.
Как информация о разводе представлена в нашей памяти? По крайней мере она должна предусматривать и фактическое расторжение брака, и правовой спор. Иначе теряло бы смысл упоминание о потребности Поля в адвокате, которое содержится в конце данного абзаца.
(ж)...but he did not want to see Sarah walk off with everything he had.
'...но он не хотел [букв, 'не хотел видеть'], чтобы к Саре перешло все их имущество' [букв, 'ушла со всем, чем он владел'].
Здесь предполагаемое действие Сары „walk off" не подразумевает простое физически наглядное событие. Аналогичным образом глагол see не обозначает факт зрительного восприятия. Нельзя здесь понимать слишком буквально и слово everything. Всякого рода метафоры и непрямые обозначения должны восприниматься с известной долей осторожности.
(з) Его жалованье в государственной школе было очень мало.
Как связана фраза (з) с содержанием рассказа? Люди легко понимают связь между небольшим жалованьем и гонорарами адвокату, суммой алиментов и т. п. Но как сможет установить эту связь BORIS?
(и) Not knowing who to turn to he was hoping for a favor from the only lawyer he know.
'He зная, к кому обратиться, он надеялся на содействие единственного знакомого ему адвоката'.
Здесь мы должны понять, что означает выражение „to turn to someone", интерпретируемое в данном случае не в чисто физическом смысле. А каким образом тот факт, что Ричард является единственным знакомым Полю адвокатом, каузально связан с надеждой Поля? Конечно, выражение „not knowing who to turn to" (букв, 'незнание, к кому обратиться') практически синонимично выражению „not knowing who else to turn to" (букв, 'незнание, к кому еще обратиться'). Отметим, кстати, еще и то, что в рассказе нигде явно не говорится о том, что Ричард и есть тот самый адвокат, о котором идет речь.
(к) Ричард нетерпеливо схватил трубку телефона и набрал номер.
ill
|
||
Для понимания возможностей системы BORIS проведем беглый обзор проблем, возникающих по ходу обработки приведенного выше рассказа.
(а) Ричард несколько лет не имел никаких известий о Поле, своем товарище по комнате во время учебы в университете.
Здесь BORIS получает информацию об отрицании некоторого события, то есть о некотором ,,не-событии". Однако недостаточно просто записать это событие в памяти, снабдив его пометой о том, что оно не имело места. Когда человек воспринимает фразу „Джон вошел в комнату, и Мэри там не было", он делает вывод, что Джон хотел видеть Мэри и ожидал найти ее в комнате; он не ограничивается простым занесением в память факта ЛОЖНО [НАХОДИТЬСЯ [МЭРИ, КОМНАТА] ].
(б) ..., которая так и не была возвращена.
Эта фраза тоже сообщает о не-событии, однако импликации из этой информации весьма существенны. Многие читатели данного рассказа считают, что Ричард хотел помочь Полю, так как Ричард чувствовал себя ему обязанным. Следовательно, не-событие в данном случае должно интерпретироваться в рамках взаимоотношений между Полем и Ричардом. Далее следует обратить внимание на то, что в (б) явно не указано, кто, что и кому не возвратил; тем не менее читатели без затруднений восстанавливают эту информацию на основе их знаний о событиях займа и выплаты долга.
(в)... Теперь же он совершенно не представлял себе, где он может найти своего старого друга.
Для правильного осмысления этого высказывания мы должны понимать, что Ричард не может установить местонахождение Поля: они уже не находятся «в контакте». На уровне осмысления более мелких единиц мы должны также понимать, что слово старый относится к давности отношений Ричарда и Поля, но отнюдь не к возрасту Поля. И, наконец, мы должны понимать, что между (б) и (в) имеется связь: установление местонахождения Поля — одно из необходимых условий для возвращения ему долга.
(г) Когда вдруг из Сан-Франциско пришло письмо...
Читатели предполагают, что письмо пришло от Поля, хотя об этом явно не сообщается.
(д) ...к сожалению, новости не были хорошими.
Здесь говорится о содержании письма Поля. По существу,
|
|||
|
|||
|
|||
В рассказе не говорится явно о том, кому позвонил Ричард.
(л) В его голосе слышались явное облегчение и благодарность. В чьем голосе? Каким образом мы узнаем это?
(м) ...he barely avoided hitting an old man in the street. '...он едва не сбил на улице старика.'
BORIS должна понять, что „hitting" относится здесь к ситуации уличного происшествия, но отнюдь не кулачного боя.
(н) Когда пришел Поль, Ричард был изрядно пьян.
В рассказе явно не сказано, куда пришел Поль; однако читатель без труда опознает это место, обращаясь к прошлой договоренности о встрече двух приятелей.
(о) ...и поэтому Ричард предложил отвезти его домой, чтобы он мог переодеться.
Почему Ричард сделал такое предложение? Почему Полю нужно было переменить одежду? Для ответа на вопрос подобного рода между указанными событиями должны быть установлены определенные связи.
(п) Когда Поль вошел в спальню...
Что Поль делает в спальне? Как он туда попал? Большинство сценических переходов осуществляется в повествовательных текстах лишь неявно. Отметим еще, что нам не сообщается о том, что Ричард отвез Поля домой, а только о том, что он предложил это сделать.
(р) ...и обнаружил там Сару с другим мужчиной, его едва не хватил удар.
Здесь следует вывести умозаключения относительно того, чем занималась Сара и что значили ее действия для Поля, а также относительно возможной реакции Поля на все это. Только при условии вывода подобных умозаключений имеет смысл сообщение, что Поля „едва не хватил удар" (кстати, само это сообщение является метафорическим выражением для состояния шока).
(с) Затем он сообразил, что это невероятная удача.
Что обозначает здесь слово это} Данная фраза как бы настраивает нас на поиск объяснения. Не располагая таким объяснением, нельзя уяснить, почему здесь говорится об удаче.
(т) With Richard there as a witness, Sarah's divorce case was shot.
'Поскольку рядом был свидетель в лице Ричарда, дело о разводе для Сары было очевидным образом проиграно'. 112
|
Для успешной интерпретации этой фразы BORIS должна располагать некоторыми сведениями о том, что такое свидетель. И, конечно, shot court case 'проигранное судебное дело' весьма существенно отличается от dead case of beer 'пустой ящик из-под пива <Спивных бутылок, жестянок>'.
(у) Ричард поздравил Поля и предложил отпраздновать удачу и пообедать вместе.
Система BORIS должна понять, почему здесь уместны поздравления. В рассказе не говорится о том, что Поль выиграет дело, а только о том, что Сара его проиграет. Вывод, конечно, ясен, но тем не менее его нужно сделать.
Как показывают приведенные выдержки, система BORIS должна предусматривать такие процессы, как определение, применение и взаимодействие разнообразных источников знаний. В рассказе РАЗВОД-1 содержатся элементарные объекты (object primitives) (Lehnert, Burstein, 1979; L e h n e r t, 1979), сценарии (scripts) (C u 1 1 i n g f о r d, 1981), описания обстановки (settings) (Dyer, Lehnert, 1980), цели (goals) (Wilensky, 1978a), планы (Schank, Abelson, 1977), аффективные переживания (affects) (Dyer, 1982), темы (W i 1 e n s k y, 1978b), межличностные отношения (Schank, Abelson, 1977), физические состояния (Schank, 1975), события (Dyer, 1981), социальные акты (Schank, Carbonell (Jr.), 1979), КОП — Конфигурация Организации Памяти (MOPS — Memory Organization Packets) (Schank, 1982) и АТБ — Аффективно-Тематические Блоки (TAUS— Thematic Affect Units) (Dyer. 1981).
1.3. Интеграция процесса обработки текста: общие принципы
1.3.1. Из истории разработки системы.
Нынешняя версия системы BORIS представляет собой интегральную систему. BORIS работает как единый модуль, в котором все операции по выводу умозаключений, вызову структур знаний и поиску в памяти актуализируются как побочные эффекты единого процесса обработки текста. Однако так обстояло дело не всегда. Сначала BORIS проектировалась как система, состоящая из четырех взаимодействующих модулей:
(1) Концептуальный анализатор (КА) принимал на входе английскую фразу из некоторого рассказа и строил структуры (Schank, Abelson, 1977) концептуальных зависимостей (КЗ), которые хранились в оперативном буферном устройстве, называемом рабочей памятью (РП).
(2) Накопитель событий (НС) анализировал структуры концептуальных зависимостей в том виде, в каком они хранились в рабо-
|
||
|
|||
|
|||
чей памяти, и строил на их основе эпизоды, заносившиеся в особую эпизодную память (или память повествования). Накопитель событий включал ожидания, работавшие по принципу „сверху вниз", то есть предсказывавшие появление тех или иных событий в тексте на основе общеситуационных соображений, и использовал эту информацию как для заполнения ненасыщенных слотов в структурах концептуальных зависимостей, порождаемых концептуальным анализатором, так и для построения каузальных связей между структурами памяти.
(3) Вопросно-ответный модуль (ВО) интерпретировал вопросы и обращался к эпизодной памяти для поиска ответов в форме концептуальных представлений.
(4) Синтезатор * английского языка (BORGEN) принимал на входе структуру концептуальных зависимостей из эпизодной памяти и синтезировал английскую фразу в качестве выхода.
Этот модульный подход в ряде отношений стал обнаруживать свою несостоятельность. Во-первых, мы установили, что для понимания вопросов, относящихся к рассказу, люди производят поиск в памяти сведений о данном рассказе. Для моделирования такого поведения был построен второй анализатор (DYPAR) (Dyer, to appear), осуществлявший в ходе понимания вопросов поиск в эпизодной памяти с целью облегчить процесс анализа вопросов. Эта работа имела три важных следствия.
(1) BORIS нередко располагает ответом на вопрос еще до завершения полного анализа вопроса (Dyer, 1981) (см. ниже, разд. 5.3).
(2) Поскольку ранее накопитель событий находился в активном состоянии только во время осуществления процесса понимания рассказа, то во время подготовки ответа на вопрос не работал никакой механизм накопления событий, который помогал бы в анализе вопросов. Однако вопросно-ответный анализатор DYPAR легко преодолел эту трудность, так как он обладал способностью обследования эпизодной памяти в ходе процесса понимания вопроса.
(3) Стала очевидной искусственность положения, когда мы имеем две отдельные анализирующие системы, одна из которых опирается на накопитель событий в ходе процесса понимания рассказа, а другая объединяет процедуры анализа с процедурами поиска информации в эпизодной памяти.
Во-вторых, поскольку концептуальный анализатор функционировал в полной изоляции от других процедур, ему часто не хватало информации, которая могла бы облегчить выполнение стоящей перед ним задачи. Задача анализа уже не сводилась к простому преобразованию входной фразы на естественном языке в репрезен-
|
тацию ее значения. Теперь, когда наряду со структурами памят низших уровней (например, концептуальными зависимостями) системе строились структуры памяти высших уровней (наприме] АТБ и КОП), мы должны были решать, на каком уровне долже строить представление фразы наш анализатор.
Рассмотрим, например, следующий фрагмент фразы из после/ него абзаца рассказа РАЗВОД-1:
Когда Поль вошел в спальню и обнаружил там Сару с други. мужчиной...
Анализатор мог бы построить два независимых представлени на двух уровнях.
(1) Он мог бы интерпретировать данную фразу как сообщени о том, что Поль увидел Сару рядом с мужчиной в спальне, и толью потом накопитель событий будет вычислять тот факт, что Сар; находится в любовной связи с этим человеком и тем самым нарушае супружескую верность.
(2) С другой стороны, анализатор мог бы понять эту фраз; иначе — как прямое сообщение о факте любовной связи Сары с муж чиной. Тогда все необходимые выводы были бы сделаны уже сами* анализатором, а не накопителем событий.
Который из двух уровней представления более приемлем в ход< анализа? Для того чтобы понять вопрос:
Что почувствовал Поль, когда он обнаружил в спальне Capi с другим мужчиной?
вопросно-ответный анализатор должен прежде всего уяснить, чтс данный вопрос подразумевает факт адюльтера. Если бы вопрос бы/ понят только на низшем уровне, поиск в памяти опирался бы лиил на факт близости местонахождения двух действующих лиц и поэтом} не привел бы к успешному выводу. Однако, если анализатор строит представление высшего уровня, модуля накопления событий уже не требуется, поскольку все умозаключения высшего уровня порождаются в ходе процесса анализа.
В-третьих, взаимодействие накопителя событий и концептуального анализатора всегда представляло немалые трудности. Сколь часто в ходе накопления событий следует обращаться к рабочей памяти — после каждой фразы, каждого словосочетания, каждого слова? В рассматриваемом варианте системы концептуальный анализатор обычно не справлялся с задачей анализа в тех случаях, когда требовалось обращение к структурам памяти высших уровней. Мы попытались дополнить сферу действия концептуального анализатора процедурами, позволявшими обследовать в динамическом режиме те структуры, которые строил накопитель событий в ходе обработки своих текущих запросов (Lehnert, Dyer et al., 1980).
|
||
* В большинстве контекстов в данном сборнике английские термины „to generate" и „generator" переводятся как 'синтезировать', 'синтезатор'.— Прим. ред.
|
|||
|
|||
8«
|
|||
|
|||
|
|||
Однако такой подход приводит к трудностям, связанным с синхронизацией работы этих двух модулей. Всегда возникала неясность относительно того, который из двух модулей должен выполнять ту или иную конкретную задачу — концептуальный анализатор или накопитель событий. Разделение функций между этими модулями представлялось все более и более искусственным.
Наконец, нужно добавить, что накопитель событий содержал ожидания, основанные на логике типа „сверху вниз", тогда как концептуальный анализатор работал по принципу „снизу вверх", отправляясь от конкретного состава исходной фразы. Накопитель событий накладывал каждое из своих ожиданий на входную структуру концептуальных зависимостей, построенную в рабочей памяти, пока одно из них не вкладывалось в нее. Однако это часто означало, что информация низшего уровня, вытекающая непосредственно из входного сообщения, просто игнорировалась. Например, в ответ на фразу
Ричард нетерпеливо схватил трубку телефона и набрал номер
накопитель событий делал предположение, что Ричард позвонил Полю. В данном случае это оказалось верным. Однако если бы в предложении явно сообщалось следующее:
Ричард нетерпеливо схватил трубку телефона и позвонил Фреду, который был специалистом по военным спорам,
тогда указанное умозаключение, делаемое накопителем событий, было бы ошибочно (Granger (Jr.), 1980). В данном случае адресатом телефонного звонка должен быть Фред, а не Поль. Умозаключения этого типа можно предотвратить, если система будет учитывать, какие выводы несовместимы с явно заданной (восходящей) информацией. В подобных случаях эксплицитная информация должна предотвращать вывод умозаключений по принципу предсказания.
Решение указанных проблем осуществлялось двумя путями: (1) мы ликвидировали накопитель событий как отдельный модуль и (2) DYPAR и концептуальный анализатор были объединены в единый модуль, в результате чего DYPAR получил возможность вести поиск в эпизоднои памяти и строить содержимое этой памяти. Одно из следствий этого подхода состоит в том, что теперь анализатор порождает процедуры непосредственного обращения к единицам эпизоднои памяти. Другое (непредвиденное) следствие такого объединения состоит в том, что BORIS иногда достраивает содержимое эпизоднои памяти в процессе выработки ответа на вопрос (Dyer, 1981; Lehnert, Black, Robertson, to appear). Этот „эффект Лофтуса" (L о f t u s, 1979) является естественным следствием интегрального анализа.
|
1.3.2. Управление процессом анализа.
Все операции по поиску информации в памяти, актуализаци эпизодов и выводу умозаключений осуществляются в системе BORI в пословном режиме. Каждой единице машинного словаря (слов; суффиксу или обороту) в словаре присваиваются структуры знани (одна или более) и ассоциируемые с данной единицей „демоны (Dyer, to appear). Демоны представляют ожидания и другую прс цедурную информацию. Каждый демон сам осуществляет управлени своей собственной „жизнью" и „смертью". Демоны могут „плодить другие демоны для создания более сложных структур обработки демоны характеризуются теми или иными значениями определенны параметров, тем самым являясь носителями общей процедурной ин формации. Более существенно то, что демоны способны обследоват и формировать эпизодную память. Новые демоны порождаютс: также всякий раз, когда в качестве отдельного эпизода актуализи руется некоторая новая структура знаний. Эпизод в памяти всегд; создается посредством актуализации по меньшей мере одной структу ры знаний.
Большинство демонов, приписываемых различным структурам знаний, распадается на пять категорий: (1) демоны, заполняющи* слоты, (2) демоны цели/планирования, (3) демоны, связанны! с описаниями обстановки, (4) демоны, связанные с событиями, i (5) демоны нарушения ожиданий. Дальнейшее изложение буде-посвящено описанию функционирования системы BORIS; мы рас смотрим: (а) структуры знаний, обрабатываемые программой, и (б] некоторые из процессов, осуществляемых в ходе понимания текста
2. ПРЕДСТАВЛЕНИЕ ЗНАНИЙ И ЭПИЗОДНАЯ ПАМЯТЬ
Наиболее важные структуры знаний в рассматриваемой систем* сводятся к трем типам: КОП (S с h a n k, 1982b), МЕТА-КОП (S chan к, 1982а) и АТБ (Dyer, 1981). КОП (Конфигурация Организации Памяти (МОР — Memory Organization Packet)) — это конфигурация единиц, описанных с помощью аппарата концептуальных зависимостей * и объединенных в особую дискретную структуру знаний посредством стандартного набора семантических связей. (Эти связи подробно описаны в: Dyer, Lehnert, 1980.) АТБ (Аффективно-Тематические Блоки — TAU — Thematic Affect. Units) будут рассмотрены в разд. 2.3.
|
||
* О переводе термина „концептуальные зависимости" см. наст, сб., с. 36.— Прим. ред.
|
|||
|
|||
|
|||
2.1. КОП и МЕТА-КОП
|
ветственно „намерение", „мотивацию" и „достижение". Эти связи, а также другие, не представленные в приводимых здесь схемах, подробно описаны в: Dye г, Lehnert, 1980. Согласно принятым в нашей работе правилам, события и планы изображаются в центральной части схемы, а цели записываются в левой или правой части под соответствующей ролью действующего лица данной ситуации (см. рис. 1).
Схема К-ОДАЛЖИВАНИЕ [К — „конфигурация", в сокращении — КОП] отражает важнейшие компоненты любого эпизода одалживания. Лицо, берущее взаймы („берущий-взаймы"), хочет иметь нечто, поэтому оно просит другое лицо („дающего-взаймы") предоставить ему соответствующий объект. Если дающий взаймы предоставляет („дает") этот объект, то он „хочет получить его обратно" в будущем, а берущий взаймы будет сознавать, что он обязан вернуть его. BORIS использует эту структуру знаний в процессе понимания события одалживания, о котором упоминается в первом абзаце рассказа РАЗВОД-1. Когда имеет место ситуация одалживания, BORIS обращается к конфигурации К-ОДАЛЖИВАНИЕ, чтобы создать ожидание того, что взятый взаймы объект будет возвращен в некоторый будущий момент времени. Когда система BORIS читает фразу «которая так и не была возвращена», она понимает слово „возвращена" в терминах схемы К-ОДАЛЖИВАНИЕ и автоматически выводит необходимые умозаключения относительно заполнения узлов этой схемы.
Кроме того, схема К-ОДАЛЖИВАНИЕ включает ряд КОП-связей, которые используются для анализа контекста с целью определения того, какая (или какие) МЕТА-КОП могут быть релевантными для анализируемого текста. Если ситуация характеризуется неформальными отношениями партнеров (например, берущий взаймы и дающий взаймы являются друзьями), то активизируется МК-СО-ДЕЙСТВИЕ. Это соотношение представлено на схеме посредством следующей КОП-связи: „МЛТ-ДРУЖБА -+■ МК-СОДЕЙСТВИЕ".
Префикс „МЛТ" здесь обозначает межличностные темы. На межличностном уровне BORIS знает, что друзья склонны: (а) общаться, проводить совместно время, (б) знать о жизни и о делах друг друга и (в) оказывать друг другу услуги. Если эти условия нарушаются слишком часто, то дружбе может наступить конец.
КОП-связи однонаправленны. Другими словами, К-ОДАЛЖИВАНИЕ может активизировать МК-СОДЕЙСТВИЕ, однако обратное неверно. Это объясняется тем, что почти любая деятельность может считаться содействием. Например, если вы предложили кому-то пойти с вами в кино, то это можно считать содействием; однако нельзя ожидать, что МК-СОДЕЙСТВИЕ включает знание обо всех подобных возможностях. Метаконфигурация МК-СОДЕЙСТВИЕ изображена на рис. 2.
119
|
||
В отличие от сценариев, отражающих лишь действия персонажей повествования в той или иной конкретной обстановке, КОП включает также цели и намерения. Каждой КОП приписывается некоторый набор КОП-связей, которые в ходе понимания рассказа позволяют оперативно учитывать отношения данной КОП к другой КОП, а также ожидания, касающиеся возможных последующих событий. Кроме того, совокупность КОП служит в качестве указателя, облегчающего обращение к эпизодной памяти. Эпизоды в системе BORIS восстанавливаются в динамическом режиме на основе нескольких КОП, МЕТА-КОП и АТБ. Эта процедура будет рассмотрена ниже.
|
|||
|
|||
Рис. 1. К-ОДАЛЖИВАНИЕ.
На рис. 1 приводится пример КОП, представляющей знания системы BORIS о фактах одалживания тех или иных объектов. В целях наглядности и ясности все схемы, изображающие КОП, носят в настоящей работе упрощенный характер. Например, всякий узел в КОП указывает на какую-то конструкцию из концептуальных зависимостей; однако на приводимых схемах каждая такая конструкция заменена мнемоническим обозначением, имеющим соответствующее событие или цель. Связи ,,н", ,,м" и ,,д" обозначают соот-
|
|||
|
|||
|
|||
Существенно, что BORIS понимает событие одалживания как на уровне КОП, так и на уровне МЕТА-КОП. Прежде всего, каждая структура знаний охватывает особый набор ожиданий. На уровне конфигурации К-ОДАЛЖИВАНИЕ BORIS ожидает, что Ричард вернет деньги Полю. Это ожидание весьма конкретно, и в случае рассказа РАЗВОД-1 оно не выполняется. Однако на уровне метакон-фигурации МК-СОДЕЙСТВИЕ ожидание того, что Ричард поможет Полю, впоследствии выполняется (когда Ричард соглашается пред-
|
дует представлять развод? Что именно входит в К-РАЗВОД? Каждый раз, когда мы пытались выявить содержание конфигурации К-РАЗВОД, дело сводилось к другим структурам знаний — браку, адюльтеру, спорам об опеке детей и т. п. Фактически от собственно развода в конфигурации К-РАЗВОД остается, довольно мало. КОП К-РАЗВОД содержит в основном связи с другими структурами знаний. На рис. 3 изображена часть того знания о разводах, которым располагает BORIS.
|
||
|
|||
|
|
||
Рис. 2. МК-СОДЕЙСТВИЕ.
ставлять интересы Поля на суде). Это ожидание ответного содействия сохраняется независимо от того, возвратил Ричард деньги Полю или нет. Таким образом, МК-СОДЕЙСТВИЕ представляет „неопределенные" ожидания, в которых воплощено наше предположение о том, что Ричард сделает нечто для Поля, но мы не можем сказать уверенно, что именно.
МЕТА-КОП, будучи весьма похожи на КОП, отличаются от них большей степенью абстрактности. МЕТА-КОП существенны потому, что они представляют такое знание о событии, которое не может быть уловлено на уровне КОП. Например, пусть в рассказе мы читаем:
Ричард взял в долг 800 долларов в банке Джоунза, но так и не вернул эту сумму.
Этот случай одалживания, конечно, является не ситуацией содействия, а скорее деловым контрактом, и выводы, вытекающие из неуплаты Ричардом долга, носят совсем другой характер.
Некоторые КОП определить очень трудно. В системе BORIS развод представляет собой КОП. Однако встает вопрос: как сле-
|
|||
Рис. 3. К-РАЗВОД.
Во многих случаях, когда люди слышат о разводе, они вовсе не обязательно сразу же вспоминают о таких вещах, как правовые споры, адвокаты, адюльтеры, утраченная любовь, перемена местожительства и т. п. Если бы люди задумывались обо всех структурах знаний, потенциально связанных с данным событием, они были бы подавлены объемом привлекаемой информации. Однако, если в контексте развода упоминается адвокат, люди мгновенно понимают, почему это существенно. BORIS достигает такого понимания при помощи КОП-связей. Если BORIS читает о том, что имеет место существенный конфликт целей двух супругов, то система активизирует МК-ПРАВОВОЙ-СПОР. Эта структура знаний задает ту информацию, которая касается споров, разрешаемых с помощью обращения с заявлением в судебные инстанции (Bower, Black, Turner, 1979). Поскольку для составления заявлений необходим адвокат,
|
|||
|
|||
|
|||
уместность упоминания его в контексте развода становится понятной. Метаконфигурация МК-ПРАВОВОЙ-СПОР изображена на рис. 4. В содержательном изложении МК-ПРАВОВОЙ-СПОР означает следующее. Два лица имеют противоречащие цели. Каждый из адвокатов представляет дело судье. Судья разрешает дело благоприятно для одного лица и неблагоприятно для другого. Шансы в пользу того или иного решения зависят от сути спора. Например, в „контрактных" спорах судья склонен решить дело неблагоприятно для лица, нарушившего контракт. Вот почему BORIS понимает,
|
наложения следующих структур: МК-ПРАВОВОЙ-СПОР, К-АДВО-КАТ, МК-ПРОФ-ОБСЛУЖИВАНИЕ, К-РАЗВОД и МК-СОДЕЙСТ-ВИЕ.
УРЕГУЛИРОВАНИЕ КОНФЛИКТА в К-РАЗВОД является предметом СПОРА в МК-ПРАВОВОЙ-СПОР. Тот аспект ситуации спора, который состоит в необходимости иметь адвоката (то есть НАЙТИ-АДВОКАТА-ДЛЯ-А), соотносится на схеме с теми знаниями об адвокатах, которыми располагает BORIS. Поскольку Ричард готовит защиту судебного дела для Поля (то есть ПРОШЕНИЕ),
|
||
|
|||
|
|
||
Рис. 4. МК-ПРАВОВОЙ-СПОР.
что нарушение Сарой супружеской верности (то есть „брачного контракта") предопределяет для нее проигрыш бракоразводного спора.
|
|||
Рис. 5. Наложения структур памяти.
то он одновременно осуществляет профессиональное обслуживание и оказывает содействие своему старому другу.
Эта схема наложений обладает четырьмя достоинствами:
(1) Каждая структура знаний может быть задана независимо от других структур знаний, а уже затем она может быть привязана к другим структурам посредством КОП-связей.
(2) В каждой структуре знаний требуется представлять только то, что существенно непосредственно для нее. Например, К-АДВОКАТ содержит ролевую информацию о том, что обычно делают адвокаты (то есть встречаются с клиентами, собирают свидетельства и т.п.). Однако тот факт, что адвокат выполняет эти задачи, имея в виду личный доход, учитывается метаконфигурацией МК-ПРОФ-ОБСЛУЖИВАНИЕ, которая отражает информацию о денежном вознаграждении для ЛЮБОГО типа профессионального обслуживания. Поэтому и не нужно размножать МК-ПРОФ-ОБСЛУ-
|
|||
2.2. Наложение структур памяти
Когда посредством КОП-связи активизируется какая-то КОП или МЕТА-КОП, должно быть известно содержательное соотношение между источником активизирующего знания и источником активизируемого знания. Например, система BORIS должна понять не только то, что развод каузировал правовой спор, но и то, что предмет спора в рамках МК-ПРАВОВОЙ-СПОР включает урегулирование вопроса об имуществе и об опеке детей. BORIS достигает такого понимания с помощью приема „наложения" одной структуры знаний на другую. „Наложение" состоит в указании того, какой компонент в одной структуре знаний эквивалентен некоторому другому компоненту в какой-то другой структуре знаний. Рис. 5 демонстрирует
|
|||
|
|||
|
|||
ЖИВАНИЕ для разных видов услуг, оказываемых врачами, водопроводчиками и др. Тем самым достигается колоссальная экономия объема памяти (Dyer, 1981a; S с h a n к, 1982а).
(3) Источник знаний активизируется только тогда, когда происходит событие, имеющее к нему непосредственное отношение. Например, читатели вовсе не обязательно задумываются над необходимостью оплаты услуг адвоката, если в тексте нет прямого упоминания об оплате (или о неуплате, или об отказе оплачивать труд адвоката).
(4) Каждое событие может быть понято с нескольких точек зрения. Когда Ричард и Поль встречаются за завтраком, мы видим двух старых университетских приятелей, собравшихся для дружеского общения после длительной разлуки, и в то же время мы видим адвоката и клиента, встретившихся для обсуждения судебного дела. Поскольку люди не испытывают никаких затруднений, имея дело одновременно с несколькими точками зрения на ситуацию и участников (например, Поль является одновременно супругом, университетским другом, учителем, участником правового спора и клиентом адвоката), мы хотим наделить систему BORIS точно такой же способностью.
|
знание о том, какие чувства испытывают люди, попавшие в затруднительные обстоятельства, и как они реагируют на эту ситуацию или на ее изменения. «Явное облегчение», которое ощутил Поль, тем самым предсказывается на основе АТБ-ЗАТРУДН-ОБСТ.
Ниже указываются некоторые АТБ, используемые в рассказе о разводе, и те события, которые эти АТБ представляют:
АТБ-ЗАТРУДН-ОБСТ: Поль не знает, к кому обратиться.
АТБ-ОПАСНОСТЬ: Ричард едва не убивает старика.
АТБ-КОНСТАТ-ОШИБКИ: Ричард проливает кофе на Поля.
АТБ-ПОИМКА-С-ПОЛИЧНЫМ: Поль застает Сару в постели.
АТБ-НАРУШЕННОЕ-ОБЯЗАТЕЛЬСТВО: Сара находится в любовной связи.
АТБ-НЕЯВНАЯ-УДАЧА: Поль осознает, что его проблемы решены.
АТБ обладают следующими характерными чертами, отличающими их от КОП:
(1) Они являются тематическими по своей природе. Это означает, что они нередко задают то знание, которое люди отражают в разного рода афоризмах, описывающих способы реагирования людей на неудачи в планировании (Dyer, 1981b). Например, пословица „A friend in need is a friend indeed" « 'Друзья познаются в беде' резюмирует содержание АТБ-ЗАТРУДН-ОБСТ, а пословица „Every cloud has a silver lining" « 'Нет худа без добра' резюмирует АТБ-НЕЯВНАЯ-УДАЧА.
(2) В АТБ присутствует существенный аффективный компонент, например: Поль очень хочет, чтобы Ричард согласился быть его адвокатом; Ричард чувствует необычайное потрясение после едва не случившегося дорожного происшествия; Поль шокирован тем, что он застал Сару с другим мужчиной, и т. п.
(3) АТБ обнаруживают отклонения от стандартного процесса обработки целей/планов, осуществляемого посредством КОП. В большинстве АТБ планы проваливаются (или почти проваливаются). Фактически большинство АТБ возникает из-за появления в повествовательном тексте неожиданных событий. Едва не случившаяся катастрофа, пролитый кофе и раскрытая любовная связь — все эти события являются неожиданными для персонажей.
(4) В отличие от КОП АТБ активизируются с помощью особых содержательных индикаторов, которые опознаются при анализе текста в восходящем режиме. Например, АТБ-ПОИМКА-С-ПОЛИЧНЫМ активизируется тогда, когда попытка достичь какой-то цели, связанной с нарушением нормы (попытка, требующая сохранения тайны для своего успешного осуществления), терпит неудачу (в ходе выполнения соответствующего этой цели плана) вследствие вмешательства неожиданного свидетеля.
|
||
2.3. Аффективно-Тематические Блоки (АТБ)
Не всякое знание может быть задано в рамках КОП или МЕТА-КОП. Например, рассмотрим следующую фразу:
Не зная, к кому обратиться, он надеялся на содействие единственного знакомого ему адвоката.
Очевидно, что Поль воспринимает свое положение как ситуацию серьезного жизненного затруднения. Он не знает, что предпринять. Он не уверен, что Ричард ему поможет, и он не знает никого другого, способного ему помочь. Несколько ниже в рассказе говорится:
В его голосе слышались явное облегчение и благодарность.
Эта фраза следует после того, 'как мы узнаем, что Ричард согласился заняться делом Поля. Наши знания о дилемме Поля позволяют нам отнести местоимение его к Полю, а не к Ричарду.
Для обработки примеров такого рода BORIS обращается к структуре знаний, называемой АТБ (Аффективно-Тематическим Блоком). АТБ (Dyer, 1982) используются для учета различных аспектов как сюжетных блоков (L e h n e r t, 1982), так и конфигураций типа TOP (S с h a n к, 1982а). В приведенном выше примере для понимания ситуации, в которой находится Поль, BORIS использует структуру АТБ-ЗАТРУДН-ОБСТ. Этот АТБ представляет
|
|||
|
|||
|
|||
(5) АТБ чувствительны к точке зрения персонажей. Например, поимка кого-либо с поличным соотносится с переживанием, весьма отличным от переживания пойманного с поличным. Таким образом, индикатор, позволяющий обращаться к памяти, зависит от того, какую роль играет в ситуации объект, находящийся в фокусе внимания.
|
„картина памяти рассказа после прочтения системой рассказа о разводе. Каждый эпизод выделен подчеркиванием.
|
||
|
|||
2.4. Аффективное переживание и эмпатия
В системе BORIS программно воплощается также теория представления аффективных переживаний, соотносящая аффективные реакции персонажей с межличностными темами и целевыми ситуациями. Эта теория представляет собой развитие М. Дайером разработок, начатых И.Роузманом (Roseman, 1979). В число аффективных переживаний, доступных обработке в системе BORIS, входят: гнев, сильное желание, надежда, беспокойство, счастье, потрясение, разочарование, благодарность, облегчение, стремление, смущение и т. д. Дескриптивы „к сожалению" и „поздравил" в рассказе РАЗВОД-1 обрабатываются с помощью эмфатических блоков, называемых АСЕ (Dyer, 1982), которые также используются в системе для учета других аффективных переживаний, таких, как зависть и злоба.
2.5. Семантическая vs. эпизодная память
Мы считаем, что противопоставление семантической и эпизодной памяти носит в значительной мере искусственный характер. Это особенно справедливо для систем, способных усваивать и моделировать организацию долговременной памяти человека [К о 1 о d n е г, 1981).
Поскольку семантическая память создается в ходе накопления эпизодов, то между двумя упомянутыми видами памяти провести четкое разграничение невозможно. Однако BORIS не является обучающейся системой; поэтому в нашем случае удобно называть ту совокупность знаний, которой BORIS располагает до прочтения рассказа, семантической памятью системы, а термин „эпизодная память" оставить для обозначения знаний, создаваемых в результате прочтения рассказа.
Эпизодная память в системе BORIS складывается из актуализированных КОП, МЕТА-КОП и АТБ. Центральным организующим понятием здесь является „эпизод", понимаемый как одновременная актуализация взаимосвязанных структур знаний. Эпизод аналогичен сценарию; отличие его от сценария состоит лишь в том, что эпизод организован не статически, а динамически строится из других релевантных структур знаний. На рис.6 упрощенно представлена
|
|||
Рис. 6. Эпизодная память.
|
|||
|
|||
|
|||
Каждый эпизод организует те структуры знаний, которые относятся к данному событию. Например, ЭП7 на рис. 6 представляет событие, состоящее в том, что Поль застал Сару в момент нарушения ею их брачного контракта. Один из способов связывания эпизодов состоит в косвенном связывании их через цели. Например, цель „вождение машины" выступает как средство по отношению к цели „встреча с Полем". Эпизоды могут также связываться между собой через АТБ. Так, АТБ-НЕЯВНАЯ-УДАЧА представляет ситуации, включающие такое событие, которое можно рассматривать как с положительной, так и с отрицательной точек зрения. Например, адюльтер Сары плох для Поля с точки зрения брака, но хорош с точки зрения бракоразводного дела.
|
Ниже приводится иллюстративный фрагмент словаря системы BORIS *. Приводимые словарные статьи носят упрощенный характер. Из соображений ясности и краткости некоторые демоны изменены или вообще опущены. Здесь мы оставляем полностью в стороне такие вопросы, как пассивный залог и разрешение лексической неоднозначности. (Обсуждение этих проблем см.: Dyer, 1982.)
Упрощенный словарь Ричард (ЧЕЛОВЕК-ИМЯ (РИЧАРД) ПОЛ (МУЖСКОЙ)
АКТУАЛИЗАЦИЯ * <== (НАЙТИ-ПЕРСОНАЖ)) пролить (ПРИВОДИТЬ-В-ДВИЖЕНИЕ
АГЕНТ * <== (ОЖИДАТЬ 'ЧЕЛОВЕК 'ПЕРЕД) ОБЪЕКТ •<== ((ОЖИДАТЬ '(СОСУД ДЛЯ ЖИДКОСТИ)
'ПОСЛЕ) АДРЕСАТ * < = = ((ОЖИДАТЬ 'ЧЕЛОВЕК 'ПОСЛЕ)
(ПРЕДЛ-ОБ '(ЧЕЛОВЕК ФИЗ-ОБ) 'НА)) ОБРАЗ-ДЕЙСТВИЯ (НЕНАМЕРЕННОЕ) АКТУАЛИЗАЦИЯ •<== (ПРОВЕРКА-ЦЕЛИ)
(РАСПОЗН-АТБ))
л * <== (МОДИФИЦИРОВАТЬ-ПРЕДШ 'ДЕЙСТВ 'ВРЕМЯ 'ПРОШ)
чашка (СОСУД ОБЪЕКТ • <== (ПАДЕЖ-ОБ '(ЖИДКОСТЬ) 'РОДИ-
ТЕЛЬНЫЙ)
АКТУАЛИЗАЦИЯ • <== ...) кофе (ЖИДКОСТЬ ТИП (КОФЕ)
АКТУАЛИЗАЦИЯ • <== .'..)
В приведенных словарных статьях звездочка (*) обозначает ячейку для ответного значения одного или более демонов, указанных после стрелки ( <= = ). Демон ОЖИДАТЬ воспринимает заданный образец как директиву поиска в Рабочей памяти; демон ПРЕДЛ-ОБ содержит информацию о предлоге, заполняющем соответствующее актантное место; демон ПАДЕЖ-ОБ содержит информацию о падеже существительного, заполняющего соответствующее актантное место; демон НАЙТИ-ПЕРСОНАЖ производит поиск персонажа в эпизод-ной памяти и в случае неудачи создает такой персонаж в эпизодной памяти. Другие демоны выводят цели на основании действий (например, ПРОВЕРКА-ЦЕЛИ) или, как в случае ненамеренного действия, проверяют наличие возможных тематических ситуаций (например, РАСПОЗН-АТБ). В любом случае может осуществляться поиск в эпизодной памяти. По мере прочтения каждого слова в Рабочую
|
||
3. АНАЛИЗ
3.1. Роль лингвистических знаний
В системе BORIS анализ предложения управляется понятийной информацией. Конечный результат анализа — построение или отыскание в памяти концептуальных и эпизодных структур (или поиск в этих структурах). Синтаксическая информация используется лишь в той мере, в какой она требуется для осуществления процедур вывода умозаключений, актуализации каких-то структур знаний или поиска информации. Например, анализатор системы не использует таких синтаксических категорий, как СУЩЕСТВИТЕЛЬНОЕ, ГЛАГОЛ, ИМЕННАЯ ГРУППА, ГЛАГОЛЬНАЯ ГРУППА, НАРЕЧИЕ и т. п. Вместо этого применяется методика, при которой слова инициируют построение концептуальных структур, а приписанные им демоны находят и обследуют другие структуры. Если тот или иной синтаксический показатель оказывается полезным для нахождения какой-то семантической характеристики, он включается в состав концептуальной структуры, которая строится в данный момент в рабочей памяти. Как только построена эпизодная структура, эта синтаксическая информация забывается.
3.2. Основные принципы анализа
Как было указано ранее, идентификация некоторой словарной единицы приводит к размещению в рабочей памяти некоторой концептуальной структуры, и при этом „порождаются " ассоциируемые с нею демоны. Для уяснения этого процесса рассмотрим, каким образом BORIS анализирует следующую фразу из абзаца 4 рассказа РАЗВОД-1:
Ричард пролил чашку кофе на Поля.
|
|||
* В оригинале даются словарные статьи для единиц, входящих в английскую фразу Richard spilled a cup of coffee on Paul; в переводе эти единицы заменены русскими эквивалентами, а компоненты словарных статей переданы приблизительными русскими соответствиями (ср. примечание переводчика на с.107).— Прим. перев.
|
|||
|
|||
|
|||
память засылаются соответствующие концепты и порождаются (запускаются в действие) приписанные им демоны. По мере того как демоны „срабатывают", в Рабочей памяти формируются соответствующие связи структур знаний и на основе эпизодной памяти создаются (или отыскиваются в готовом виде) соответствующие им эпизоды. В результате в Рабочей памяти будет построена, например, следующая концептуализация, содержащая отсылки к структурам в эпизодной памяти (такие отсылки делаются с помощью особого показателя, например показателя АКТУАЛИЗАЦИЯ — INSTANTIATION):
(ПРИВОДИТЬ-В-ДВИЖЕНИЕ АГЕНТ (ЧЕЛОВЕК
ИМЯ (РИЧАРД) ПОЛ (МУЖСКОЙ) АКТУАЛИЗАЦИЯ (РИЧАРД 0)) ОБЪЕКТ (СОСУД
ОБЪЕКТ (ЖИДКОСТЬ
ТИП (КОФЕ)
АКТУАЛИЗАЦИЯ (ЖИДКОСТЬ 0)) АКТУАЛИЗАЦИЯ (СОСУД 0)) АДРЕСАТ (ЧЕЛОВЕК
ИМЯ (ПОЛЬ) ПОЛ (МУЖСКОЙ) АКТУАЛИЗАЦИЯ (ПОЛЬ 0)) ВРЕМЯ (ПРОШЕДШЕЕ) ОБРАЗ-ДЕЙСТВИЯ (НЕНАМЕРЕННОЕ) АКТУАЛИЗАЦИЯ (АТБ-РЕГИСТРАЦИЯ-ОШИБКИ
СОВЕРШИВШИЙ-ОШИБКУ (РИЧАРД 0) ПОСТРАДАВШИЙ-ОТ-ОШИБКИ (ПОЛЬ 0) ...))
Заметим, что в ходе анализа демоны ОЖИДАТЬ и ПРЕДЛ-ОБ будут актуализироваться несколько раз. Поскольку эти демоны имеют изменяемые параметры, их лингвистические знания могут быть распределены по разным компонентам системы.
|
Ричард взял у Поля взаймы некоторую сумму...
BORIS распознает здесь некоторое событие одалживания, имевшее место в прошлом. Однако продолжение этой фразы
...которая не была возвращена
не содержит явных указаний на то, кто не возвратил, что и кому. Эта задача легко решается с помощью обращения к памяти. В семантической памяти содержится утверждение о том, что берущий взаймы возвращает (компенсирует) заимствованный объект дающему взаймы; в эпизодной памяти содержатся указания о том, что берущий взаймы — это Ричард, дающий взаймы — Поль, а заимствованный объект — деньги. Если какие-то актантные роли отсутствуют в анализируемом высказывании, то анализатор берет последнюю из активизированных КОП, проверяет ее на соответствие ожидаемому событию и если соответствие выполняется, использует уже заполненные актантные роли в эпизодной памяти для вывода умозаключений о заполнении недостающих ролей в анализируемой фразе.
3.3.2.Разрешение местоименной референции.
Память оказывается также полезной при разрешении местоименной референции. Снова рассмотрим фразу из абзаца 3 рассказа РАЗВОД-1.
В его голосе слышались явное облегчение и благодарность.
Существует два стандартных подхода к проблеме местоименной референции (в нашем примере речь идет о неоднозначности местоимения его). Для иллюстрации первого подхода рассмотрим структуру предшествующей фразы:
Поль согласился позавтракать с ним вместе на следующий день. Для разрешения неоднозначности местоимения в данном случае можно предложить следующее бесхитростное правило:
Если первый партиципант текущей фразы обозначен местоимением
И в тексте представлено более одного возможного референта, согласованного с данным местоимением по признаку пола,
То это местоимение соотносится с первым партиципантом, упомянутым в предшествующей фразе.
Используя это правило, BORIS сделает правильный вывод о том, что его в исходной фразе соотносится с Полем. Но адекватно ли это правило? А что, если бы в рассказе говорилось нечто другое? Например:
После короткого разговора Ричард условился с Полем встре-
|
||
3.3. Взаимодействие анализатора и памяти
Что значит использовать эпизодную память при анализе? Почему это полезно для анализа? В следующих разделах мы продемонстрируем плодотворность использования эпизодной памяти при анализе.
3.3.1. Вывод умозаключений о заполнении ролей.
Анализатор обследует актуализированные узлы памяти в целях облегчения процесса порождения умозаключений. Этот тип доступа к памяти часто используется для вывода умозаключений о недостающих ролевых связях. Возьмем простой пример из рассказа:
|
|||
|
|||
|
|||
титься на следующий день для обсуждения бракоразводного дела. В его голосе слышались явное облегчение и благодарность.
Здесь, хотя первым персонажем, упомянутым в первой фразе, является Ричард, местоимение его во второй фразе относится все же к Полю. Поэтому требуется более сильное и общее решение. Для выработки такого решения нужен доступ к „подходящей" структуре знаний, такой, в которой референт местоимения может быть определен на основе концептуального анализа.
Понимание того, кто же обозначен местоимением его в рассматриваемом примере, предполагает понимание импликаций, связанных с наличием во фразе слов облегчение и благодарность (импликаций с точки зрения процедуры обработки целей). В системе BORIS переживания (affects) организуются в рамках АТБ. Конкретно „облегчение " и „благодарность" относятся к следующим ситуациям ПЕРЕЖИВАНИЕ/ЦЕЛЬ:
Если X испытывает „облегчение",
То X достиг определенной цели, которая, по мнению Х'а, могла и не быть достигнута, или у Х'а была сиюминутная цель самосохранения, активизированная некоторой „миновавшей" угрозой.
Если X испытывает „благодарность",
То либо некоторый агент Y уже обеспечил достижение некоторой
цели Х'а, либо X нашел некоторого агента для достижения
некоторой своей цели.
Но эти ситуации как раз и представляют собой содержание АТБ-ЗАТРУДН-ПОЛОЖ, который раньше уже актуализировался в памяти системы (см. разд. 2.3). В АТБ-ЗАТРУДН-ПОЛОЖ именно Полю угрожают финансовые потери и именно Поль опасается, что Ричард откажет ему в помощи. Что касается Ричарда, то именно он обеспечил достижение цели Поля, состоящей в нахождении адвоката для защиты в бракоразводном деле. Таким образом, обследуя этот АТБ, анализатор выясняет, что Поль является лицом, находящимся в затруднительном положении, и, следовательно, Поль — наиболее вероятный референт местоимения его в рассмотренном примере.
3.3.3. Разрешение лексической неоднозначности.
Разрешение лексической неоднозначности составляет одну из главных проблем анализа. В анализаторе системы BORIS принят подход, опирающийся на поиск в памяти необходимых подсказок для разрешения неоднозначности. Рассмотрим следующий пример из нашего рассказа:
|
The next day, as Richard was driving to the restaurant, he barely avoided hitting an old man on the street.
'На следующий день, когда Ричард ехал на машине в ресторан, он чуть не сбил [букв, 'с трудом избежал сбитая'] на улице старика'.
Концовка данной фразы допускает по меньшей мере две интерпретации [за счет неоднозначности слова hitting]:
(1) Richard nearly had a fight with an old man. 'Ричард чуть не подрался со стариком'.
(2) Richard's car nearly hit an old man. 'Машина Ричарда чуть не сбила старика'.
Неоднозначность слова hit можно разрешить двумя способами. Прочитав форму hitting, анализатор обращается к эпизодной памяти и выясняет, что К-ВОЖДЕНИЕ МАШИНЫ является в данный момент текущей активной КОП. В семантической памяти системы BORIS уличное происшествие, связанное с машиной, представлено следующим образом:
(К-ТРАНСП-ПРОИСШЕСТВИЕ
тип коп
РОЛИ (ВОДИТЕЛЬ-ТРАНСП ТРАНСП-ВИНОВН ЖЕРТВА)
ГЛАВ-ПОН СОБ-СТОЛКНОВЕНИЕ
ЦЕЛИ (Ц-АГЕНТА-ФИЗ-ЗДОРОВЬЕ Ц-ФИЗ-ЗДОРОВЬЕ)
ЯЗ-КОНТЕКСТ PTRANS *
В системе предусмотрена восходящая связь ВОЖДЕНИЕ-МАШИНЫ -> ТРАНСП-ПРОИСШЕСТВИЕ, которая соединяет К-ВОЖДЕНИЕ-МАШИНЫ и К-ТРАНСП-ПРОИСШЕСТВИЕ следующим образом:
(ВОЖДЕНИЕ-МАШИНЫ -+ ТРАНСП-ПРОИСШЕСТВИЕ ТИП КОП-СВЯЗЬ
В ЧЕМ К-ВОЖДЕНИЕ-МАШИНЫ
КЛАСС-К-СВЯЗЕЙ ВОСХОДЯЩИЕ
С-ЧЕМ-СОЕД К-ТРАНСП-ПРОИСШЕСТВИЕ
ЭКВ-РОЛИ [(ВОДИТЕЛЬ ~ ВОДИТЕЛЬ-ТРАНСП)
(ТРАНСП-СРЕДСТВО ~ ТРАНСП-ВИНОВН) ])
В данной записи представлено знание о том, что транспортные происшествия происходят в контексте вождения машины. Однако нет аналогичной связи, соединяющей представление о „драке" и К-ВОЖДЕНИЕ-МАШИНЫ. Поэтому анализатор и делает вывод о том, что вторая из указанных выше интерпретаций естественнее, чем первая.
|
||
* PTRANS — один из элементарных актов в теории концептуальных зависимостей Р. Шенка. В данной статье авторы пользуются тремя элементарными актами теории: PTRANS — 'изменять местоположение чего-либо' ('физически перемещать'), ATRANS — 'осуществлять абстрактную передачу функции обладания' ('передавать'), MTRANS — 'передавать информацию' ('ментально перемещать'). См. Шенк Р. Обработка концептуальной информации. М., 1980.— Прим. перев.
|
|||
|
|||
|
|||
Слово „avoided" 'избежал' также может способствовать разрешению неоднозначности слова „hit", так как глагол „avoid" всегда предполагает наличие после него обозначения такого действия, которое является ненамеренным или нежелательным с точки зрения деятеля. Поскольку транспортное происшествие является в нормальных условиях ненамеренным и нежелательным одновременно, то анализатор выбирает именно вторую интерпретацию hit.
4. ПРИМЕНЕНИЕ ЗНАНИЙ
Процесс анализа, как мы понимаем его в настоящей работе, есть процесс применения знаний. Для понимания даже самого простого предложения привлекается огромный объем знаний. Эти знания должны включать — наряду с лексическими, языковыми и энциклопедическими знаниями — содержание эпизодной памяти, построенное к текущему моменту анализа.
По мере чтения рассказа содержание каждого очередного предложения должно быть закодировано в виде некоторого внутреннего представления и добавлено к содержимому эпизодной памяти. Такое кодирование состоит прежде всего в порождении умозаключений. Как только упоминается цель, событие или состояние, система BORIS должна вложить новую информацию в текущее представление текста рассказа. Для этого необходимо вывести определенные умозаключения, соотносящие поступившую концептуальную единицу с другими единицами, уже входящими в представление рассказа. Обратимся, например, ко второму абзацу рассказа РАЗВОД-1:
К сожалению, новости не были хорошими. Жена Поля Сара настаивала на разводе. Она хотела также получить машину, дом, взять детей и добиться алиментов. Поль хотел развода, но он не хотел, чтобы к Саре перешло все имущество, которым владел и он. Его жалованье в государственной школе было очень мало.
Обрабатывая последнюю фразу, система BORIS должна сделать вывод о том, что небольшое жалованье как-то соотносится с желанием Поля защитить свое имущество от посягательств жены. Без такого вывода BORIS не могла бы понять релевантности этой фразы в контексте развода Поля.
Хотя при понимании текста BORIS функционирует в полностью интегральном режиме, мы все же можем охарактеризовать разные типы привлекаемых системой знаний в терминах трех общих задач, которые должны выполняться в процессе понимания текста:
(1) применение восходящих знаний путем интерпретации событий, целей и состояний, вытекающих из очередной фразы;
(2) применение нисходящих знаний путем обследования струк-
|
тур знаний, которые система уже актуализировала в своей памяти; (3) применение метатекстовых знаний, касающихся законов построения любых рассказов.
|
||
4.1. Обработка в восходящем режиме
В системе BORIS восходящие правила могут быть отнесены к одному из трех классов — в зависимости от условий их применения и от характера результата, к которому они приводят. Эти три класса суть (а) формирование эпизодной памяти, (б) анализ целей планов и (в) построение схемы сценария.
4.1.1. Формирование эпизодной памяти.
Когда анализатор обрабатывает первую фразу нового рассказа
Richard had not heard from his college roommate Paul for years. 'Ричард несколько лет не имел никаких известий о Поле, своем товарище по комнате во время учебы в университете',
он по необходимости должен анализировать ее в восходящем режиме. Отправляясь от терма „товарищ по комнате" (roommate), BORIS может построить при этом структуру отношения О-ТОВАРИЩ-ПО-КОМНАТЕ. Как только будет построена эта структура, она (как структура знаний) будет порождать многочисленные стереотипные ожидания. Эти ожидания используются, в частности, для интерпретации выражения not having heard from, которое предшествует слову roommate. Сочетание hear from интерпретируется здесь как факт социальной коммуникации. Отрицательная форма (had not) в соединении с указанием на длительность (for years) приводит к восходящему умозаключению, что данное отношение имеет приостановленный (vs. активный) статус.
Когда на вход системы BORIS поступает первое событие рассказа РАЗВОД-1:
Richard had borrowed money from Paul... 'Ричард одолжил у Поля некоторую сумму...',
система строит эпизодную структуру для эпизода одалживания. Эта структура содержит ожидания (касающиеся финансовых соглашений), которые вытекают из КОП К-ОДАЛЖИВАНИЕ. В данном случае К-ОДАЛЖИВАНИЕ активизируется глаголом borrow 'одалживать', явно присутствующим во входной фразе.
Другой, менее тривиальный случай формирования эпизодной памяти иллюстрируется следующей фразой из первого абзаца рассказа о разводе:
Когда из Сан-Франциско пришло письмо...
|
|||
|
|||
|
|||
Здесь восходящее правило связано со словом письмо; это правило проверяет, является ли письмо объектом действия PTRANS. Если это так, то правило обращается к КОП „письмо", что в конечном счете приводит к построению эпизодной структуры, описывающей отправление и получение письма, ситуацию дружеского общения и т. п.
Из приведенных примеров становится ясно, что восходящие правила, связанные с событиями или конкретными словами текста, могут выступать в качестве указателей к структурам знаний, хранящимся в семантической памяти. Правила обращения к памяти ассоциируются также с целями, состояниями и различными типами тематических предикатов.
4.1.2. Обработка целей/планов.
BORIS обращается к набору правил обработки целей/планов, когда необходимо оценить поступающие понятия в рамках задачи выявления ключевых целевых ситуаций, таких, как конфликт целей и ссперничество целей. Следующая фраза взята из второго абзаца рассказа о разводе:
Поль хотел развода, но он не хотел, чтобы к Саре перешло все их имущество.
Во втором сочиненном предложении мы обнаруживаем своего рода ,,не-цель". Приводимое ниже восходящее правило интерпретирует эту не-цель:
Если лицо Л1 имеет цель (Ц), которая предполагает некоторое ДЕЙСТВИЕ лица Л2,
То имеет место СОПЕРНИЧЕСТВО между Л1 и Л2 относительно той ЦЕЛИ, которая должна быть достигнута посредством данного ДЕР1СТВИЯ-
Применение этого правила позволяет системе интерпретировать состояние, выраженное в последнем примере, как частный случай соперничества целей. Это соперничество согласуется и с ожиданием, вытекающим из активизированной структуры знаний о разводе.
Другое правило обработки целей/планов можно проиллюстрировать с помощью следующего примера „не-события" из первого абзаца рассказа о разводе:
Ричард одолжил у Поля некоторую сумму денег, которая не была возвращена. Теперь же он совершенно не представлял себе, где найти своего старого друга.
Вторая фраза иллюстрирует то, каким образом не-событие может быть использовано для порождения ожидания того, что некоторый план не осуществится (S с h a n k, A b el s о n, 1977). Следующее
|
правило показывает, как не-события нередко соотносятся с неосуществленными целями:
Если о событии С сообщается, что оно не имеет места,
И существует активная цель Ц, которая предполагает осуществление события С,
То сформировать применительно к событию С ожидание неосуществления необходимой предпосылки. Если это неосуществление обнаруживается, то пометить цель (Ц) как блокированную именно отсутствием этой необходимой предпосылки.
Использование этого правила позволяет системе понять, что тот факт, что Ричард не вернул долг Полю, объясняется невозможностью (для него) найти Поля. Более того, в ходе применения этого правила необходимая предпосылка осуществления плана помечается с помощью акта ATRANS (то есть перехода имущества), который задает предварительное условие, необходимое для совершения ATRANS.
Демоны целей/планов контролируют существование и статус целей и планов, заключенных в каждой структуре знаний. Например, в КОП развода входят ожидания относительно желания партиципантов сохранить за собой семейное имущество, поскольку это, как правило, весьма существенный аспект разводов.
4.1.3. Построение схемы сценария.
Схема сценария (Dyer, 1980; Dyer, 1982) представляет собой ориентированную во времени и пространстве структуру доступа к эпизодной памяти. Она состоит из списка упорядоченных во времени и взаимосвязанных сценарных дескрипторов. Каждым таким дескриптором закодированы действующие лица, а также события, происходящие в заданной конкретной обстановке.
Построение схемы сценария предполагает слежение (monitoring) за персонажами по мере их пространственных перемещений в рассказе. В ходе такого слежения иногда могут быть полезны некоторые очень простые восходящие правила. Пусть, например, анализируется следующий отрывок:
Пит сидел, наслаждаясь новой книгой, и вдруг он вспомнил, что должен был забрать детей из школы. Он быстро выбежал из парка.
Обратим внимание на то, что ситуационный контекст, порождаемый первым предложением, не сообщает о том, где находится Пит во время чтения книги. Более того, по умолчанию можно вывести заключение, что он находится дома. Однако во втором предложении указывается, что он читал в парке. Анализатор BORIS представит эту фразу приблизительно следующим образом:
|
||
|
|||
|
|||
(PTRANS АГЕНТ Пит
ОБЪЕКТ Пит
ОТКУДА-парк-
КУДА-школа-
Предикат концептуальных зависимостей PTRANS выступает как указатель, позволяющий обратиться к множеству правил сценических переходов. Одно из таких правил реагирует на незаполненность слота ОТКУДА; с помощью этого правила система будет пытаться установить пространственную локализацию текущей сцены. Это правило описывается следующим образом:
Если слот ОБЪЕКТ заполнен именем какого-то персонажа рассказа, И слот ОТКУДА задает некоторую локализацию, И эта локализация не содержится в заданной ранее локализации сцены, То эта локализация совпадает с локализацией предшествующей сцены.
Есть и другие аналогичные правила для установления локализации последующей сцены в схеме сценария. Эти правила опираются на сведения о локализации, явно указанные в тексте рассказа. Следовательно, им отдается предпочтение по сравнению с любыми теоретическими рассуждениями относительно возможной локализации текущей или последующей сцены.
Другие восходящие сценарные правила столь же просты. Эти правила отслеживают такие события, как появление в сцене новых персонажей, уход персонажей из сцены и эпизоды, происходящие в ходе перемещения персонажей из одной сцены в другую. Каждое сценарное правило, работающее в восходящем режиме, помечается предикатом концептуальной единицы, порождаемой анализатором.
Некоторые КОП расчленяются на сцены. Например, К-ПИСЬМО расчленяется на сцену отправления письма и сцену получения письма. Эта информация используется при построении схемы сценария для установления перехода от одной сцены к другой. Существуют и устанавливаемые по умолчанию локализации, ассоциируемые с определенными КОП'. Например, получение письма имеет место либо в доме, либо на работе того лица, которому письмо адресовано.
Схема сценария дает полезные намеки для вывода существенных умозаключений. Вспомним пример:
Когда Поль вошел в спальню и обнаружил там Сару с другим мужчиной...
Прежде всего, когда анализатор читает сообщение о факте со-
|
циальной близости двух персонажей в некоторой сцене, он пытается выяснить, можно ли связать с ними некоторый вид деятельности. Один из способов такого выяснения состоит в изучении обстановки, как в следующих примерах:
(1) Билл видел Джона с Мэри в театре.
(2) Билл видел Джона с Мэри в ресторане.
В (1) предполагается, что Джон и Мэри смотрели спектакль, а во (2) — что Джон и Мэри ели в ресторане. Следуя аналогичной стратегии, анализатор замечает, что текущая сцена происходит в СПАЛЬНЕ. Существует несколько видов деятельности, связываемых со СПАЛЬНЕЙ: сон, переодевание и секс. Из них только секс является видом совместной деятельности. Поэтому BORIS и делает умозаключение о том, что Сара и упомянутый мужчина занимались сексом.
|
||
4.2. Нисходящие знания
Эпизод состоит из набора частично актуализированных взаимосвязанных структур знаний. Каждая из этих структур знаний привносит свою собственную интерпретацию событий, происходящих в рамках данного эпизода, а также набор ожиданий, относящийся к этому событию. Рассмотрим, например, эпизод в ресторане в нашем рассказе.
Существует целый ряд ожиданий, связываемых с КОП „ресторан". К клиентам должна подойти официантка, для того чтобы их обслуживать. Клиенты скорее всего будут делать заказ, глядя в меню, и т. д. Есть и ожидания, связываемые с КОП „адвокат" (правовая консультация). В соответствующей ситуации Ричард и Поль будут скорее всего обсуждать бракоразводное дело. Есть ожидания, связываемые с КОП „прием пищи". Как правило, люди едят, потому что они голодны. Есть ожидания, связываемые с дружескими отношениями людей и их совместным времяпровождением (это отражает особая МЕТА-КОП). В такой ситуации они будут скорее всего проявлять бурную радость по поводу встречи друг с другом.
Все такие ожидания кодируются в декларативной форме в семантической памяти системы BORIS. Для использования нисходящих знаний демоны должны обследовать ту часть содержания памяти, которая к данному моменту уже актуализирована. Рассмотрим фрагмент из четвертого абзаца рассказа РАЗВОД-1:
Когда принесли еду...
В данном случае конфигурация К-РЕСТОРАН уже была активизирована демонами, отвечавшими за построение схемы сценария
|
|||
|
|||
|
|||
и осуществлявшими интерпретацию фраз „ехал на машине в ресторан" и „в ресторане выпил три рюмки спиртного". Когда в систему поступает фраза „принесли еду", то в эпизодной памяти ищется такая активизированная КОП, которая содержит роль с признаком ЕДА. Поскольку конфигурация К-РЕСТОРАН удовлетворяет этому условию, она проверяется на согласование с образцом (PTRANS ОБЪЕКТ (ЕДА)). После того как обнаруживается согласование этого образца с событием ПРИНОСИТЬ-ЕДУ в рамках конфигурации К-РЕСТОРАН, система осуществляет модернизацию этой КОП. Этот процесс опирается на программу подбора образцов, вызываемую демонами событий; ее действие аналогично применению сценариев (scripts)* (С и 1 1 i n g f о г d, 1981).
КОП и МЕТА-КОП связываются друг с другом в семантической памяти посредством КОП-связей. Каждой КОП-связи приписано условие активизации. Это условие предписывает те обстоятельства, при которых соединяемые КОП релевантны для данного эпизода. Например, условием активизации внесения МК-ПРАВО-ВОЙ-СПОР в эпизод развода является наличие конфликта целей между мужем и женой. Когда для формирования эпизода развода был использован К-РАЗВОД, было одновременно сформировано ожидание для проверки этого эпизода на наличие конфликта целей. Далее, во втором абзаце описывается конфликт целей, тем самым ожидание срабатывает, и в данный эпизод вносится МК-ПРАВОВОЙ-СПОР.
4.3. Метатекстовые знания о строении рассказов
Система BORIS способна использовать знания о том, как люди организуют текст рассказа. Эта способность нынешней версии системы проявляется двумя способами — через идентификацию главного персонажа и через установление локальных контекстов.
4.3.1. Идентификация главного персонажа.
В абзаце рассказа нередко отражается точка зрения одного из персонажей, и повествование ориентируется на его цели и действия. BORIS пытается в каждом абзаце идентифицировать главного персонажа и вывести ожидания на основе его отношений с другими персонажами в рассказе (Reiser, 1981).
|
Главный персонаж в абзаце обычно идентифицируется анализатором в соответствии с несколькими эвристиками. Например, главный персонаж может быть задан в составе доминирующей концептуальной единицы, которая репрезентирует содержание первого предложения абзаца. Личность главного персонажа может быть также раскрыта в перспективе взаимоотношений, описываемых в рассказе. Так, сочетание жена Поля Сара во втором абзаце свидетельствует о том, что главным персонажем этого абзаца является Поль.
Главный персонаж часто инициирует эпизоды в абзаце. Например, поскольку Ричард инициирует эпизод езды на машине и эпизод встречи в ресторане в четвертом абзаце, то BORIS понимает, что именно Ричард и является главным персонажем этого абзаца.
Выявление главного персонажа служит для организации межличностных тематических ожиданий. Например, мы можем ожидать в рассказе периодических встреч двух друзей.
Когда идентифицирован главный персонаж абзаца, на передний план выходят его взаимоотношения с другими персонажами рассказа. Таким образом, события в рассказе осмысляются в терминах тематических интересов главного персонажа в каждом абзаце.
4.3.2. Локальные контексты.
В ходе повествования автор обычно делает какие-то комментарии по тексту или дает какие-то сведения об обстановке. Он может раскрыть мысли одного из персонажей или дать некоторую фоновую информацию об отношениях между двумя персонажами.
Во втором абзаце рассказа о разводе автор описывает содержание письма Поля Ричарду, что само по себе уже представляет отдельный вставленный рассказ. Читатель должен понять, что содержание второго абзаца должно быть объединено в единый мысленный объект эпизода с письмом, инициированного в первом абзаце. Аналогичная проблема встает при понимании телефонного разговора, переданного по телефону сообщения и т. п.
Система BORIS справляется с обработкой подобных ситуаций благодаря переходу на режим работы в локальном контексте. В этом режиме все создаваемые эпизоды объединяются вместе в объемлющий ментальный блок (unit). В дальнейшем система может ссылаться на этот блок как на единое целое. В эпизоде с письмом, например, такой блок заполняет объектный слот понятия MTRANS.
В рассказе РАЗВОД-1 BORIS обращается к режиму работы в локальном контексте тогда, когда первое предложение второго абзаца упоминает некоторый информационный объект (то есть „новости"). Рассмотрим эту фразу:
К сожалению, новости не были хорошими.
|
||
* Заметим, что русскому термину сценарий соответствуют по крайней мере два английских: „scenario" и „script". Первый из них скорее несет идею последовательности сцен, а второй — представление о тексте, описывающем развертывание действия.— Прим. ред.
|
|||
|
|||
|
|||
Если бы этой фразе не предшествовал первый абзац, у читателя были бы несомненные трудности с интерпретацией ее начала. Вводное слово к сожалению требует предшествующего контекста, с которым можно было бы соотнести событие, вызывающее сожаление. Более того, читатель вполне мог бы сделать вывод, что новости, о которых идет речь, взяты из выпуска последних известий по телевидению или радио. Однако в случае нашего рассказа читатель автоматически делает вывод, что „новости" относятся к содержанию письма. Каким образом делает это умозаключение BORIS?
Когда система BORIS читает о прибытии письма, она формирует КОП К-ПИСЬМО, где следующим ожидаемым событием является знакомство с содержанием письма. Когда BORIS читает слово новости, это интерпретируется как ИНФОРМАЦИЯ, и порождается особый демон, который должен проверить, подходит ли данный объект для заполнения некоторой роли в текущей активизированной КОП. Если проверка дает положительный ответ, то это служит сигналом о начале работы в локальном контексте.
Важность распознавания локальных контекстов становится очевидной, когда BORIS выводит умозаключение о том, что Ричард является адвокатом. Если мы внимательно проанализируем рассказ, мы увидим, что об этом нигде явно не сообщается. В тексте говорится следующее:
Он надеялся на содействие единственного знакомого ему адвоката.
Для вывода соответствующего умозаключения BORIS использует следующее правило:
Если лицо Л1 совершает акт MTRANS по отношению к лицу Л2, сообщая, что Л1 имеет ЦЕЛЬ, требующую АГЕНТа, И АГЕНТ явным образом не упоминается, То Л2 является таким вероятным АГЕНТом.
Для применения этого правила BORIS должна понять, что просьба о содействии неявно передается (посредством MTRANS) Ричарду, поскольку именно Ричард входит в локальный контекст чтения письма Поля. Именно локальный контекст дает это понимание.
|
5.1. Анализ языковых выражений во время выработки ответа на вопрос (в противоположность анализу текста во время понимания рассказа)
Для обработки предложений в рассказе и вопросов по тексту рассказа BORIS использует один и тот же анализатор. Поскольку процесс анализа объединен с процессами формирования и обработки содержания памяти, то выработка ответа на вопрос протекает в основном точно так же, как обработка предложения в ходе понимания рассказа. Однако существуют три ситуации, при которых „режим" понимания (то есть понимание текста рассказа vs. выработки ответа на вопросы) влияет на действия анализатора.
5.1.1. Обращение с новыми объектами (tokenizatlon).
Если анализатор встречает обозначение некоторого элементарного объекта, некоторой конкретной обстановки или персонажа, он обращается к памяти для выяснения того, имеется ли уже соответствующий знак в эпизодной памяти. При работе в режиме понимания текста неудача при поиске референта приводит к созданию в памяти нового знака. Однако в процессе выработки ответа на вопрос неудача при поиске референта в памяти приводит к отказу от попытки построить какой-либо ответ. Вместо этого порождается „жалоба", указывающая на то, что референт не найден. Например:
В.: Чем Бенджамин зарабатывал себе на жизнь?
О.: Я не помню никакого упоминания о персонаже по имени Бенджамин.
5.1.2. Проверка пресуппозиций.
В процессе выработки ответа на вопрос анализатор сравнивает заполнение ролевых слотов, предполагаемое в вопросе, с действительным заполнением их в эпизодной памяти. В процессе понимания текста рассказа при нарушении соответствия ролевых слотов вырабатывается сигнал о том, что должна быть построена другая актуализированная структура. Например, если бы в нашем рассказе было упомянуто письмо от Сары, это вынудило бы систему построить новую конфигурацию типа К-ПИСЬМО, отличную от конфигурации, связанной с письмом от Поля. Однако в процессе выработки ответа на вопрос отрицательный результат сопоставления ролей указывает на ложность пресуппозиции. Поэтому BORIS отвергает соответствующий вопрос и исправляет ложную пресуппозицию. Например:
В.: Почему Сара написала письмо Ричарду? О.: Ричарду написал письмо Поль, а не Сара.
|
||
5. ВЫРАБОТКА ОТВЕТОВ НА ВОПРОСЫ
К настоящему времени в литературе описано множество эвристик, полезных при выработке ответов на вопросы по текстам (Dyer, L e h n e r t, 1980; L e h n e r t, 1978). Мы коснемся тех аспектов ответов на вопросы, которые специфичны именно для системы BORIS.
|
|||
|
|||
|
|||
5.1.3. Вопросительные слова.
Слова типа кто, который, что, почему, где и т. п. обрабатываются особым образом. Если такое слово входит в вопрос, оно рассматривается как сигнал информационного запроса. В ходе же понимания текста рассказа такие слова обрабатываются специальными демонами и рассматриваются как указатели начала придаточного предложения. Если в процессе обработки рассказа встречается вопрос, то он трактуется как риторический вопрос и ответить на него никакой попытки не делается.
|
возврат денег. Он сразу же поймет это выражение как обозначение акта мести.
Неоднозначность выражения pay back не может быть разрешена с помощью синтаксических или семантических знаний (в том числе общих знаний о мире). Мы должны знать, о чем именно говорилось в рассказе. Таким образом, в результате анализа выражения pay back в данном эпизодном контексте строится такое представление вопроса, которое ссылается на некоторое событие, уже содержащееся в эпизодной памяти. Следовательно, к тому времени, когда будет понят вопрос, будет произведен поиск в эпизодной памяти. Именно это и обеспечивает быстрый выбор правильного ответа. Нередко ответ на вопрос становится известным системе BORIS еще до завершения полного анализа вопроса (см. Dyer, 1981c).
Поиск в эпизодной памяти особенно полезен тогда, когда вопросы носят нечеткий характер. Например, вопрос „Устанавливал ли Поль контакт с Ричардом, находясь в Сан-Франциско?" носит менее конкретный характер, чем вопрос „Написал ли Поль Ричарду из Сан-Франциско?". В подобных случаях эпизоды ищутся через посредство МЕТА-КОП. Если систему спросить:
В.: Помог ли Поль Ричарду?,
она будет искать в эпизодной памяти МЕТА-КОП, которая связана с оказанием содействия. И как только в качестве вероятного референта будет найдено МК-СОДЕЙСТВИЕ, будет получен доступ к тому конкретному событию, которое связано с этим абстрактным событием:
О.: Да, Поль одолжил Ричарду деньги.
|
||
5.2. Использование памяти для понимания вопроса
Для системы BORIS понять вопрос — значит найти в эпи-зодной памяти референт, соответствующий концептуальному содержанию вопроса. Одно из следствий этого подхода состоит в том, что обследование эпизодной памяти производится не только в процессе непосредственной выработки ответа на вопрос, но и в ходе самого процесса понимания вопроса. В отличие от многочисленных систем поиска информации в базе данных, которые в качестве механизатора-посредника при обращении к поисковой системе используют изолированный анализатор, система BORIS обследует память, содержащую информацию о рассказе, в процессе самого понимания вопроса. Например, если спросить читателя нашего рассказа
Q.: Why did Richard not pay Paul back? 'В.: Почему Ричард не вернул долг Полю?',
то он, конечно, даже и не подумает о том, что выражение pay back можно здесь отнести к чему-либо другому, кроме как к акту возврата взятых в долг денег, поскольку, когда читатель анализирует вопрос, он все время держит в уме содержание рассказа. Представим себе теперь, что в рассказе говорится следующее:
Ричард состоял в любовной связи с женой Поля, и Поль узнал об этом. Поль поклялся, что он убьет Ричарда за разрушение его семьи. Поль взял дробовик и пошел к Ричарду, но полицейские арестовали Поля, решив, что у него нервное расстройство. Когда полиция увозила Поля, он поклялся, что накажет Ричарда, даже если это будет его последним делом.
Теперь если читателя спросить:
Q.: Why did Paul not pay Richard back? 'В.: Почему Поль не отплатил Ричарду?',—
то он и не заметит, что выражение pay back может означать
|
|||
5.3. Поиск ответа в ходе анализа вопроса
Поскольку в ходе анализа вопроса BORIS производит поиск в эпизодной памяти, то часто бывает так, что BORIS выбирает ответ еще до завершения процесса анализа. Рассмотрим следующий вопрос:
В.: Кто случайно пролил кофе на Поля в ресторане?
Большинство опрошенных читателей рассказа утверждали, что они подумали о Ричарде не позднее, чем дошли до слова кофе. Когда система BORIS встречает в данном вопросе упоминание о событии „пролил", она обращается к эпизодной памяти и находит его. Сразу после этого срабатывает демон, ассоциируемый со словом кто, и вызывает соответствующий узел из этого эпизода. Другие узлы также проверяются на согласование с содержанием эпизодной памяти; система делает это на всякий случай, чтобы убедиться
|
|||
|
|||
|
|||
в том, что пресуппозиции вопроса не противоречат содержимому эпизодной памяти. Как видим, система „узнает" ответ (на вопрос „кто?") еще до полного прочтения всего вопроса.
Однако такое быстрое отыскание ответа достигается отнюдь не всегда. Вопросы о причине события (например, со словом почему) часто требуют дополнительного поиска связей, касающихся намерений персонажей (Dyer, L e h n е г t, 1980; Dyer, 1982), и уже после этого может быть найдено концептуальное представление ответа. С другой стороны, в случае вопросов, связанных с выяснением справедливости тех или иных фактов (L e h n e r t, 1978), отыскание ответа предполагает обследование эпизодной памяти для подтверждения (или отрицания) события, упоминаемого в вопросе. Поскольку же BORIS все равно обследует эпизодную память в ходе анализа вопроса, то система узнает ответ на вопрос именно в тот момент, когда достигнуто полное понимание вопроса. Это объясняется тем, что процесс понимания вопроса для BORIS включает обнаружение его референта в памяти.
5.4. Поиск с восстановлением
BORIS актуализирует только фрагменты КОП, так как процедуры поиска, осуществляемые во время отыскания ответа, могут восстанавливать события по фрагментам КОП. Если систему спросить:
В.: Написал ли Поль Ричарду?,
она начнет искать в эпизодной памяти К-ПИСЬМО. Поскольку же в рассказе не говорилось о написании письма, в эпизодной памяти такое событие актуализировать не удается. Однако событие, состоящее в написании письма, может быть выведено. BORIS знает, что Ричард не мог бы получить письмо от Поля, если бы Поль не написал письма. В данный момент поиска событие, состоящее в написании Полем письма, считается найденным и актуализируется. Если данный вопрос будет задан еще раз, эта актуализированная структура будет просто найдена (а не выведена). Это означает, что отыскание ответа на данный вопрос во второй раз потребует меньшего времени поиска. Таким образом, в процессе отыскания ответов на вопросы может модифицироваться содержание эпизодной памяти. А это позволяет повысить эффективность вызова данных, поскольку BORIS актуализирует только то, что используется для отыскания ответов.
|
6. СИНТЕЗ* АНГЛИЙСКИХ ФРАЗ В СИСТЕМЕ BORIS
Генератор системы BORIS (BORGEN) представляет собой адаптированную версию системы GEN, разработанной Родом МакГиром в Йейле (М с G u i r е, 1980). В настоящее время BORGEN используется для синтеза ответов на английском языке на основе концептуальных представлений, выдаваемых системой BORIS в процессе получения ответов на вопросы.
6.1. Основания процедуры синтеза
Синтез осуществляется путем обработки элементов „потока составляющих" („phrase stream") (М с G u i r e, 1980), то есть списка единиц (компонентов предложения), подлежащих выражению. Генератор работает в циклическом режиме, обрабатывая эти элементы до тех пор, пока не будет исчерпан имеющийся фразовый поток. Элементы потока составляющих содержат команды для генератора и обеспечивают доступ к другим командам (хранящимся в виде данных), которые в конечном итоге приводят к синтезу слов. Как эти элементы вырабатываются и используются, будет объяснено ниже, а сейчас важно уяснить, что они должны обеспечивать доступ к памяти. Существенной стороной генератора системы BORIS является способ организации лексической памяти. Эта организация основывается на иерархии лексических прототипов, разработанной в системе GEN МакГира; для применения в системе BORIS эта иерархия была несколько модифицирована и расширена.
6.1.1. Иерархия прототипов.
Иерархия прототипов — это система, служащая для классификации информации, необходимой для синтеза, в соответствии с иерархией лексических „прототипов", с помощью которой генератор выбирает способ языкового выражения того или иного понятия. Иерархия имеет древесную структуру: элемент высшего уровня может иметь много подчиненных элементов.
В системе BORIS информация, необходимая для синтеза, приписана в иерархии прототипов «шаблонам, инициирующим актуализацию конкретных знаний. Поскольку для выражения концептуальной единицы генератор должен располагать лексической информацией, он должен для получения этой информации обращаться к иерархии прототипов. Шаблоны системы BORIS (для КОП, Целей, Переживаний и т. п.) нередко уже содержат часть информации,
|
||
|
|||
* Здесь термин „generation" переводится как 'синтез'. См. вступительную статью, с. 25. Однако термин „generator" передается как генератор, поскольку синтезатором принято называть лишь системы, синтезирующие звучащую речь. В общем смысле обычно говорят о системе синтеза.— Прим. ред.
|
|||
|
|||
|
|||
необходимой для синтеза, однако обычно генератор должен осуществлять поиск некоторой части информации и в вышележащих узлах дерева.
Иерархия прототипов предназначена для сведения информации о сходных формах выражения в одну единицу памяти. Если некоторое представление (типа Концептуальных Зависимостей) содержит характеристику, которая отвечает задаче синтеза, то база данных, используемая генератором, должна лишь накапливать такую информацию в одном и том же месте. Таким образом, более общая информация хранится в стволе иерархического дерева, а более специфическая — в его ветвях.
Большинство понятий имеет лексические прототипы, и процесс просмотра различных уровней иерархии снизу вверх в конечном счете приводит к лексической сущности Ц—С (соответствующей „цели/состоянию" в системе GEN). Ц—С является „сиротой" в том смысле, что она не имеет узла-прототипа (родителя).
В этом множестве прототипов хранится информация о способах выражения понятий. Эта информация может быть весьма простой и сводиться к указанию конкретного слова или глагольной информации, отсылающей к таблице форм конкретного глагола. Используются и более сложные данные, например указания о порядке выражения тех или иных понятий, о путях обхода дерева для проверки нужности выражения понятия и об альтернативных способах выражения понятия в случае неудачного поиска на том или ином пути.
Генератор обследует иерархию прототипов таким образом: для обнаружения какой-либо единицы информации, необходимой для синтеза, он проверяет, содержит ли эту информацию входная концептуальная структура. Если да, то никакого дальнейшего поиска не требуется. В противном случае ищется лексический прототип. Если нет лексического прототипа, то предполагается, что текущая единица подлежит выражению в ее исходном виде. Если есть лексический прототип, но он не содержит подходящей информации, то проверяется следующий прототип (прототип прототипа), и т.д.
6.1.2 Процесс синтеза.
Основным динамическим компонентом генератора является „фразовый поток составляющих" (М с G u i r е, 1980), который организует процесс выражения различных частей текущей концептуальной единицы и следит за тем, когда именно должны выполняться те или иные действия. Эти действия представляют собой указатели к ЛИСП-коду, которые в конечном счете синтезируют «лексические единицы», или слова.
Функционирование генератора состоит из последовательных операций развертывания выражений, расположенных слева в потоке
|
составляющих. Это развертывание обычно требует обследования иерархии прототипов. Если некоторый элемент потока составляющих не может быть развернут, то он считается словом, удаляется из потока составляющих и помещается во временное запоминающее устройство. Данный цикл затем повторяется для нового состояния потока составляющих. Синтез заканчивается, когда выполнены все развертывания и поток составляющих пуст. Последняя задача генератора — печать слов.
Структура потока составляющих обычно обусловливает такой режим синтеза, который сходен с обходом синтаксического дерева, направленным слева направо и в глубину. Однако синтаксические конструкции определяются исключительно на основе концептуального содержания, а выбор слов и синтаксических групп (phrases) контролируется также диалоговым контекстом.
Именно иерархия прототипов определяет реальный порядок расположения подлежащего, сказуемого, дополнения и других членов предложения. Сначала поток составляющих содержит только один элемент, помещенный туда в начале прогона генератора; этот элемент развертывается в правильную цепочку выражений в соответствии со структурой концептуальной единицы, подлежащей выражению на естественном языке. Исходный элемент потока составляющих служит сигналом для поиска в дереве прототипов того способа выражения, который удовлетворителен с контекстуальной, концептуальной и лексической точек зрения. Этот исходный элемент развертывается в серию элементов, организующих искомое выражение. На каждой стадии развертывания могут учитываться контекстуальные и семантические факторы.
Иерархию прототипов можно рассматривать как различительную сеть для выражения разных концептуальных единиц. Весь процесс выражения контролируется системой лексических прототипов, а поток составляющих полностью подчинен этой базе данных. Начальный элемент потока составляющих служит указателем (pointer) к тому разделу ЛИСП-кода, который находит структуру составляющих для понятия, подлежащего выражению. Это осуществляется путем отыскания наиболее конкретного лексического прототипа, содержащего информацию о структуре составляющих (то есть путем обследования дерева прототипов до обнаружения такого прототипа).
Многие концептуальные единицы требуют одной и той же структуры составляющих. Для таких понятий нужная информация хранится в общем лексическом прототипе. Для случаев, когда к работе генератора предъявляются особые требования, в нижних ярусах дерева прототипов хранится соответствующий особый код.
На рис. 7 приводится пример использования потока составляющих и иерархии прототипов для синтеза английского выражения из концептуальной единицы PTRANS. На этом рисунке СОБ-ПЕ-
|
||
|
|||
|
|||
РЕДАЧА относится к событию, состоящему в передаче письма почтальоном адресату. Эта информация представляется посредством концептуальных зависимостей следующим образом:
(PTRANS АГЕНТ почтальон
ОБЪЕКТ письмо ОТКУДА почтальон КУДА читатель) СОБ-ПЕРЕДАЧА 0 — это узел в памяти BORIS, построенный для представления конкретного события, состоящего в получении письма от Поля в абзаце 1 рассказа о разводе. Когда генератор BORIS начинает строить выражение для СОБ-ПЕРЕДАЧА, он не находит в актуализированном узле никакой информации, необходи-
|
ная концептуальная единица в результате выражается так:
RICHARD GOT A LETTER FROM PAUL. 'Ричард получил письмо от Поля'.
6.2. Текущие исследования процесса синтеза
Синтез часто рассматривается как последний этап после понимания вопроса и формирования ответа. Важно, однако, помнить о том, что всякий анализируемый нами текст кем-то был синтезирован. Такой взгляд на синтез помогает выявить истинную роль синтеза — мы синтезируем, чтобы быть понятыми.
6.2.1. Интегральный синтез.
В естественноязыковой компьютерной системе с широкой ориентацией мы обнаруживаем задачи, которые предполагают выполнение сходных операций на разных уровнях. С точки зрения программирования анализ текста рассказа и анализ вопроса осуществляются в системе BORIS одной и той же функцией, действующей в несколько отличающихся друг от друга режимах. Разумно предположить, что люди обладают единым механизмом понимания языка, который они применяют ко всем частным задачам, связанным с пониманием. Аналогичным образом разумно предположить, что все задачи, связанные с выражением информации на естественном языке, основываются на единой функции генератора.
Генераторы можно характеризовать в соответствии с тем, какая часть ответственности за выбор нужной формы выражения возлагается на них в сопоставлении с другими компонентами системы. Например, GEN имеет дело только с выражением полных концептуализации, построенных другими компонентами системы. С этой точки зрения GEN аналогичен преобразователю: концептуальное содержание выражения уже полностью определено до начала процесса синтеза.
В отличие от этой системы BORGEN часто получает на входе просто указатель к эпизодной памяти и данные о вопросно-ответном диалоге, на основе которых он должен определить наилучший способ выражения того или иного узла памяти. Например, если дан указатель к ситуационной обстановке РЕСТОРАН 0, то, прежде чем формировать ответ, генератор должен оценить состояние знаний спрашивающего.
А1: «Ресторан.» А2: «В ресторане.» A3: «В ресторан.»
Если задается такой вопрос:
В.: Куда ехал Ричард, когда он едва не сбил старика?,
|
||
|
|||
Рис. 7. Пример иерархической структуры и маршрут поиска информации для синтеза.
|
|||
мой для синтеза, и поэтому осуществляет переход по связи, ведущей к прототипу — шаблону СОБ-ПЕРЕДАЧА,— который в свою очередь является узлом в КОП „письмо". Узел с этим шаблоном содержит две единицы информации: (1) указание об использовании глагола to get и (2) указание о том, что подлежащее будущего предложения будет найдено в слоте'КУДА соответствующего концептуального представления. Далее, лексическим прототипом для СОБ-ПЕРЕДАЧА является акт PTRANS, который снабжен особой информацией о выражении дополнения. Наконец, к PTRANS идет прототипная связь, приводящая в конечном счете к узлу Ц—С; информация этого последнего подавляется информацией в подчиненных узлах. Ц—С также организует структуру предложения некоторым стандартным образом. На основе информации о ролевом заполнении ролей, содержащейся в актуализированном узле, исход-
|
|||
|
|||
|
|||
то в качестве приемлемого ответа следует выбрать A3, но не А1 или А2.
В настоящее время в нашей системе синтез остается единственной задачей, которая решается посредством отдельного модуля. Мы полагаем, что такое разделение весьма искусственно, так как люди, отвечая на вопрос, часто начинают синтезировать ответы еще до их полной конкретизации. Подлинно интегральный генератор сможет наделить BORIS способностью синтезировать „интроспективные протоколы" процессов, осуществляемые системой в ходе поиска ответа. В этом случае, правда, мы сталкиваемся с такой трудной задачей, как синтез приемлемых переходных выражений, обеспечивающих „гладкость" промежуточных выходных сообщений. Но и это говорит в пользу объединения процессов синтеза с другими процессами, обеспечивающими вывод умозаключений в памяти, поиск информации и понимание естественноязыковых выражений.
6.2.2. Построение резюме текста.
В системе BORIS выделяются две задачи синтеза. Основной областью применения синтеза является построение ответов на вопросы, но BORGEN применяется также в области построения резюме и перифазирования. Процесс построения резюме основывается на системе сюжетных блоков Ленерта (L e h n е г t, 1982), которая организует память в соответствии с определенными абстрактными сущностями (положительными актами, отрицательными актами и ментальными состояниями). Сюжетные блоки представляют собой специфические конфигурации этих сущностей, характеризующиеся достаточной различимостью и играющие достаточно важную роль для того, чтобы трактовать их как автономные единицы. Как только программа сформирует память на основе сюжетных блоков, они могут анализироваться с целью формирования резюме рассказа.
6.2.3. Элементарные единицы диалога.
Проводятся также исследования, направленные на расширение существующего набора „элементарных единиц диалога", используемых в системе BORIS. В процессе синтеза ответа элементарные единицы диалога могут учитывать не только конкретное содержание ответа участника диалога, но и его общие намерения. Например, предикат НЕСОГЛАСИЕ представляет побуждения участника диалога к выражению несогласия как в отношении фактов, так и в отношении их интерпретации. Таким элементарным единицам сопоставлены генерационные фреймы. Так, элементарной единице диалога НЕСОГЛАСИЕ сопоставлен следующий фрейм:
„BUT IT WAS (person)WHO (role), NOT (other person)..."
152
|
'НО ВЕДЬ ЭТО БЫЛ (лицо) КТО (роль), А НЕ (другое лицо)...'
6.2.4. Синтез тем.
В настоящее время в BORGEN используются в основном КОП и элементарные единицы концептуальных зависимостей. АТБ применяются только при синтезе ответов на вопросы, касающиеся переживания. Однако АТБ содержат также информацию, относящуюся к синтезу тем, которые часто выражаются в пословицах и „изречениях". В будущих исследованиях мы постараемся научить BORIS синтезировать пословицы из АТБ. Например, в ответ на вопрос: „What is a moral of this story?" 'Какова мораль этого рассказа?', если в основу ответа будет положен АТБ-НЕЯВНАЯ-УДАЧА, система сможет выдать следующее изречение: „Every cloud has a silver lining", букв. 'Каждое облако имеет светлый ореол' [ж Нет худа без добра].
7. ХАРАКТЕРИСТИКА ВЕДУЩИХСЯ ИССЛЕДОВАНИЙ И ОБЩИЕ ВЫВОДЫ
Следующий этап в нашей исследовательской работе включает испытание системы BORIS на разных вариациях рассказа РАЗВОД-1, что необходимо как для повышения надежности системы, так и для выяснения того, какие модификации нужно внести в структуры представлений и механизмы обработки.
7.1 Расширение общности системы
Довольно трудно составить и испытать большое число повествовательных вариаций рассказа, если такие вариации сопоставимы по сложности с текстом РАЗВОД-1. В итоге мы решили предложить системе BORIS следующий рассказ, который система должна обрабатывать совершенно по-другому, используя при этом те же самые структуры знаний, что и при обработке текста РАЗВОД-1. Приводим этот новый рассказ.
|
||
РАЗВОД-2
Джордж завтракал со своим коллегой-учителем и проверял домашние работы учеников, когда официантка случайно опрокинула на него стакан кока-колы. Джордж страшно рассердился и ушел, отказавшись платить по счету. Он решил поехать на машине домой, чтобы снять мокрую одежду.
Когда он приехал домой, он застал свою жену Энн в постели с мужчиной. Джордж был ошарашен, ему захотелось уйти из дому и напиться вдрызг.
В баре он столкнулся со своим старым приятелем Дэвидом, товарищем по комнате во время учебы в университете, которого он не видел несколько лет. Дэвид предложил Джорджу выпить вместе с ним, и скоро они оба были совершенно пьяны.
|
|||
|
|||
|
|||
Когда Джордж узнал, что Дэвид адвокат, он рассказал ему обо всех своих горестях и попросил Дэвида представлять его интересы в суде. Поскольку Дэвид одолжил когда-то у Джорджа денежную сумму и не возвратил долга, он чувствовал себя обязанным помочь Джорджу выбраться из затруднительного положения.
Некоторое время спустя Дэвид написал Энн о том, что Джордж хочет развода. Ее адвокат в свою очередь позвонил Дэвиду и сообщил ему, что Энн намерена получить дом, взять детей и добиться больших алиментов. Когда Джордж услышал об этом, он был очень обеспокоен. Он зарабатывал довольно мало, преподавая в начальных классах школы. Дэвид объяснил ему, что не стоит беспокоиться, так как судья решит дело в его пользу, как только узнает, что Энн ему изменяла.
На суде Дэвид представлял сторону Джорджа. Поскольку у них не было свидетеля, они не смогли доказать супружескую неверность Энн, и она выиграла дело. У Джорджа едва не случился сердечный приступ. Дэвид мог лишь выразить Джорджу свое сочувствие.
Неделю спустя Джордж получил по почте счет от Дэвида на крупную сумму. То-то был он в ярости!
Отметим, что РАЗВОД-2 содержит много уже знакомых нам структур знаний: это телефонные звонки, письма, адвокаты, учителя, рестораны, езда на машине, правовые споры, эмоциональные реакции, адюльтер, акты содействия и др. Однако РАЗВОД-2 отличается от рассказа РАЗВОД-1 на многих уровнях.
(1) На уровне эпизодов:
В тексте РАЗВОД-1 жена застигнута в момент нарушения супружеской верности в конце рассказа, который завершается констатацией выигрыша дела мужем, хотя персонажи и не появляются на суде.
В тексте РАЗВОД-2 жена застигнута в момент нарушения супружеской верности в начале рассказа. Персонажи реально появляются в суде, а дело завершается проигрышем мужа.
(2) На уровне взаимодействия знаний:
В рассказе РАЗВОД-1 муж получает весть о своем старом товарище по комнате из его письма, а впоследствии испытывает ошеломляющее чувство, застав свою жену с другим мужчиной.
В рассказе РАЗВОД-2 муж встречает своего старого товарища по комнате случайно в баре, а впоследствии испытывает похожее ошеломляющее чувство, узнав на суде о проигрыше дела.
(3) На уровне ролей:
В рассказе РАЗВОД-1 адвокат проливает жидкость на клиента.
В рассказе РАЗВОД-2 жидкость проливает официантка, и это вызывает со стороны мужа несколько иную реакцию по сравнению с рассказом РАЗВОД-1.
(4) На семантическом и синтаксическом уровнях:
В рассказе РАЗВОД-1 читаем: „...предложил отвезти его домой, для того чтобы он мог переодеться".
В рассказе РАЗВОД-2 аналогичное место выглядит по-другому: „...решил поехать на машине домой, чтобы снять мокрую одежду".
154
|
(5) На тематическом уровне:
В рассказе РАЗВОД-1 муж выигрывает дело благодаря случайности.
В рассказе РАЗВОД-2 мужа подводит его друг, который к тому же запрашивает чрезмерную сумму за свои адвокатские услуги.
BORIS успешно обрабатывает как РАЗВОД-1, так и РАЗВОД-2 (Dyer, Wolf, Korsin, 1981; Dyer, 1981a; Dyer, 1982). Ниже приводятся образцы ответов BORIS на вопросы по тексту РАЗВОД-2.
В.: Что произошло в ресторане?
О.: Официантка пролила кока-колу на Джорджа, и Джордж отказался платить по счету.
В.: Какие чувства испытывала официантка? О.: Официантка сожалела, что она пролила кока-колу на Джорджа.
В.: Почему Джордж отказался платить по счету?
О.: Потому что официантка пролила кока-колу на Джорджа.
В.: Почему Джордж захотел напиться вдрызг?
О.: Он был ошарашен, потому что его жена изменяла ему.
В.: Почему Дэвид чувствовал себя обязанным помочь Джорджу выбраться из затруднительного положения?
О.: Он хотел оказать Джорджу ответную услугу, потому что он был должен Джорджу деньги.
В.: Что произошло на суде?
О.: Судья решил дело в пользу Энн.
В.: Почему Джордж не выиграл дело?
О.: У Джорджа не было свидетеля факта измены его жены.
В.: Как воспринял Дэвид судебное решение?
О.: Дэвид испытывал неловкость по отношению к Джорджу.
В.: Что почувствовал Джордж, когда он получил ответ? О.: Джордж был рассержен на Дэвида.
В.: Почему?
О.: Потому что счет был слишком велик.
Для того чтобы добиться понимания системой BORIS текста РАЗВОД-2, потребовалось' расширить как структуры знаний, так и правила обработки в программе. Частично это связано с тем обстоятельством, что РАЗВОД-2 содержит ряд структур, не встречающихся в тексте РАЗВОД-1 (например, в рассказе РАЗВОД-1 нет сцены в зале судебного заседания или сцен, связанных с денежными
155
|
||
|
|||
|
|||
счетами). Но в целом структуры знаний, используемые при понимании текста РАЗВОД-1, требуют очень небольших модификаций для их подгонки к использованию при понимании текста РАЗВОД-2. Тот факт, что BORIS может обрабатывать столь разные рассказы, придает нам уверенность в том, что мы находимся на верном пути.
7.2. Будущие исследования
Мы усматриваем много направлений для нашей будущей работы. Немало еще предстоит сделать в области представления типов знаний, необходимых для понимания текстов, аналогичных рассказам РАЗВОД-1 и РАЗВОД-2, а также в области более детального исследования процессов взаимодействия между используемыми в BORIS источниками знаний (а их у нас более 15). Кроме того, требуется дальнейшая работа по совершенствованию программного использования наложений структур памяти и одновременного использования нескольких перспектив, а также и по экспериментированию в области взаимодействия между процессами анализа и другими операциями с содержимым памяти.
В настоящее время BORIS обрабатывает каждый рассказ о разводе изолированно. Что бы произошло, если бы BORIS читала текст РАЗВОД-2 в контексте знаний о рассказе РАЗВОД-1? Люди, которые перед чтением текста РАЗВОД-2 уже читали РАЗВОД-1, вспоминали о последнем при чтении рассказа РАЗВОД-2, а впоследствии, когда им предлагались задания по пересказу рассказов или построению по нему резюме, часто обнаруживалось, что в памяти читателей смешивались эпизоды разных рассказов. Таким образом, одно из направлений исследований затрагивает происходящие в системе BORIS процессы вспоминания и последствия воспоминаний (Schank, 1982b) для понимания повествовательного текста.
Наконец, продолжается работа по изучению абстрактных структур знаний высокого уровня типа сюжетных блоков (Lehnert, 1982) и АТБ (Dyer, 1981b; Dyer, 1982). Такие структуры высокого уровня, как ВОЗДАЯНИЯ, НЕЯВНЫЕ-УДАЧИ, ПОИМКИ-С-ПОЛИЧНЫМ и ЗАТРУДНИТЕДЬНЫЕ-ОБСТОЯТЕЛЬСТВА, нередко заключают в себе мораль или «суть» рассказа. В этом смысле они представляют наиболее глубинный уровень понимания, выходящий далеко за рамки уровня чистых фактов и отражающий те темы и структуры, благодаря которым рассказ остается в памяти читателей и воспроизводится ими в каждом уместном случае.
|
7.3. Смежные исследования
Литература по анализу и пониманию текстов огромна, поэтому здесь мы ограничимся беглым упоминанием тех работ других исследователей, которые нам представляются наиболее близкими нашей собственной работе. В число таковых мы включаем разработки систем, в которых предпринимаются попытки достичь понимания (или синтеза) текста в строгом режиме обработки слева направо, с использованием такого же количества уровней обработки и уровней знаний, как в нашем исследовании, с формированием семантически ориентированного представления текста в интегральном режиме.
Разработанные ранее в Йейле естественноязыковые системы были предназначены для обработки большого числа рассказов. Например, система FRUMP была способна обрабатывать (на поверхностном уровне) около 10% сообщений из телеграфных новостей ЮПИ, а система IPP (см. L e b о w i t z, 1981) обрабатывала начальные абзацы из нескольких сотен газетных сообщений, посвященных террористическим актам. Однако для достижения подобной надежности этих программ пришлось пожертвовать глубиной понимания. Иными словами, такие программы „просматривают" текст на разных уровнях, стремясь извлечь „суть" из каждого сообщения. Так, если имеется „схематичный сценарий" землетрясения, система FRUMP сможет извлечь из сообщения данные о времени, месте, силе, числе жертв и нанесенном ущербе в каждом конкретном случае сообщения о землетрясении. Все остальное будет проигнорировано. Так, в следующем предположительном отрывке будет проигнорировано все, что касается чисто „человеческого фактора":
Прошлой ночью губернатор Джерри Браун был разбужен мощным землетрясением. Сильный толчок сбросил его с кровати, и он упал на свою собаку, которая укусила его. Официальные источники сообщают, что землетрясение характеризовалось...
Аналогичным образом система IPP при всей своей „надежности" понимает только те части сообщений, которые непосредственно соотносятся со знаниями системы о террористических актах. IPP знает очень много о терроризме, но очень мало о чем-либо еще. В отличие от упомянутых систем в системе BORIS воплощены попытки выявить те знания, которые извлекаются из нескольких довольно сложных рассказов при максимально глубоком понимании. Поэтому представления текста в памяти BORIS должны быть достаточно богатыми для отображения детальных запросов в ходе процедуры ответов на вопросы. Будучи ориентированы на резюмирование содержания текста, ни FRUMP, ни IPP не имели дела с задачей формирования ответов на вопросы.
|
||
|
|||
|
|||
/ U&ruCfH
|
|||
|
|||
Что касается уровня управления обработкой, то принятый в системе BORIS подход, основанный на демонах, имеет ряд общих черт с исследованиями Аренса (А г ens, 1981) и Смолла (Small, 1981). Однако их исследования, как нам кажется, ориентируются в основном на уровень предложения. В противоположность этому главное внимание в наших разработках уделяется взаимодействию и взаимосвязи между многочисленными источниками знаний в целях построения цельного представления исходного повествовательного текста. Значительная часть наших усилий также направлена на определение конкретного содержания различных структур знаний (например, соглашений и содействий). Аналогичным образом в нашей работе по совершенствованию системы BORIS нас гораздо больше интересуют способы функционирования конкретных типов множественных перспектив в повествовательных текстах, чем использование множественных перспектив как общего средства программирования (Bob row, Winograd, 1977).
Генератор системы BORIS имеет ряд общих характеристик с другими системами, синтезирующими цепочки слов в строгом режиме слева направо, такими, как генератор Макдональда MUMBLE (McDonald, 1980). Однако разработка BORGEN направлена в основном на синтез описаний повествовательных эпизодов и тематических конфигураций, а работа Макдональда направлена на синтез текста из исходного материала, имеющего более процедурный характер, такого, как запись ходов игроков в некоторой настольной игре.
|
никла под влиянием исследования Роузмана (Roseman, 1979).
(2) Другие структуры знаний, используемые в системе BORIS, сами вызывают интерес у специалистов по когнитивной психологии и стимулируют соответствующие эксперименты.
Например, был проведен ряд экспериментов по выявлению психологической достоверности аффективно-тематических блоков (АТБ) (Dyer, 1981b; S e i f e r t, 1981). Эти эксперименты показывают, что люди пользуются средствами, в чем-то напоминающими АТБ, при чтении повествовательных текстов, рассматриваемых в разработке проекта BORIS. Другие эксперименты свидетельствуют в пользу психологической достоверности сюжетных блоков Ленерта (Lehnert, Black, Reiser, 1981) и существенности выделения главного персонажа на некоторых отрезках текста (Reiser, 1981). Наконец, некоторые эксперименты, описанные в L e liner t, Black, Robertson (to appear) говорят о том, что интегральная обработка в процессе формирования ответов на вопросы может вызывать модификации в структурах эпизодной памяти.
|
||
7.5. Заключительные замечания
Степень сложности процесса обработки текстов на естественном языке оценить очень трудно, потому что люди справляются с этой задачей без малейших усилий. Почти каждый может спокойно прочесть газету или непринужденно участвовать в беседе. Однако задача построения крупных промышленных систем, работающих в режиме естественного языка, остается пока нерешенной.
Люди являют собой наиболее впечатляющий пример интеллектуальных информационных процессоров, использующих многочисленные и разнообразные источники знаний, функционирующие на различных уровнях подробности и в разных режимах взаимодействия. В настоящее время уникальные человеческие способности обращения с естественным языком наиболее выигрышно проявляются и раскрываются в области естественноязыковой аргументации и понимания повествовательных текстов. Самым важным научным вкладом системы BORIS является то, что она служит одновременно источником и испытательной моделью для интересных теоретических проблем, связанных с указанными базисными когнитивными способностями человека.
Приложение А
BORIS функционирует на компьютере DEC-20 в Йейле, реализована на языке TLISP (Yale UCI Rutgers LISP). Чтение рассказа РАЗВОД-1 и формирование ответов на 30 вопросов тре-
|
|||
7.4. Система BORIS как когнитивная модель
В ходе разработки и реализации системы BORIS были накоплены многочисленные протоколы человеческих ответов на вопросы и резюмирования текстов людьми с целью получения подтверждения того, что BORIS моделирует психологически достоверное поведение.
Используемые в системе BORIS структуры знаний отражают современные психологические теории в двух аспектах:
(1) Некоторые структуры знаний в системе BORIS построены на основе экспериментальных данных, полученных в исследованиях восприятия текста человеком.
Например, теория конфигураций организации памяти (КОП) (Schank, 1982b) первоначально разрабатывалась как реакция на эксперименты (Bower, Black, Turner, 1979), касающиеся тех случаев смешения единиц в памяти испытуемых, которые не были предусмотрены в сценариях Шенка. Аналогичным образом теория ПЕРЕЖИВАНИЙ, используемая в системе BORIS, воз-
|
|||
|
|||
|
||
буют в совокупности приблизительно 20 минут (реального) машинного времени. Время работы центрального процессора только для текста РАЗВОД-1—300 секунд. В системе BORIS требуется около 10 секунд работы центрального процессора на обработку вопроса, включающую понимание вопроса, поиск ответа и синтез ответа в виде выражения на английском языке. Можно добиться значительного сокращения этих временных показателей, если произвести компиляцию некоторых частей системы. В настоящее время BORIS содержит в словаре всего лишь около 350 слов и оборотов. Поскольку BORIS была спроектирована в основном как экспериментальный прототип, к настоящему времени была проведена минимальная работа по расширению словаря за пределы того объема, который необходим для понимания двух рассказов — РАЗВОД-1 и РАЗВОД-2.
[Далее в Приложении приводятся фрагменты машинной выдачи, отражающие работу программ системы BORIS в режимах понимания, формирования ответов на вопросы и синтеза ответа.]
|
||
|
||