B
Венди Ленерт, М. Г. Дайер,
П. Н. Джонсон, К- Дж. Янг, С. Харли
BORIS-ЭКСПЕРИМЕНТАЛЬНАЯ СИСТЕМА ГЛУБИННОГО ПОНИМАНИЯ ПОВЕСТВОВАТЕЛЬНЫХ
ТЕКСТОВ *
(Йейльский университет. Отделение информатики)
BORIS — это экспериментальная система, способная понимать тексты и отвечать на вопросы; ее работа основана на использовании целого ряда источников знаний. В противоположность системам поверхностного понимания текстов, которые извлека­ют из текста лишь его основное содержание и игнорируют все остальное, система BORIS стремится понять входной текст с максимальной степенью глубины. В насто­ящей работе рассматриваются способы автоматической обработки достаточно слож­ного повествовательного текста, а именно короткого рассказа, в котором описывается история одного развода.
1. ВВЕДЕНИЕ
1.1. Процессуальная модель понимания повествовательного текста
Предлагаемая в настоящей работе теория понимания повество­вательного текста реализована в машинной программе BORIS. Кроме обработки текста, BORIS обладает способностью отвечать на вопросы по тексту, тем самым демонстрируя правильность его понимания. Таким образом, в системе BORIS программно вопло­щается также теория поиска информации в памяти для построения ответа на вопрос.
Ниже дается запись вопросно-ответного сеанса работы системы с конкретным текстом короткого рассказа, который мы будем назы­вать РАЗВОД-1. По мере обработки программой BORIS фрагментов текста она создает внутреннее представление воспринятого ею поня­тийного содержания. Вопросы, на которые способна отвечать систе­ма, показывают, каким образом в этом внутреннем представлении от­ражаются причинно-следственные отношения, служащие основой ос-
* Wendy G. L е h п е г t, Michael G. Dyer, Peter N.Johnson, С J. Yang and Steve H a r 1 e y. (Department of Computer Science, Yale University. New Haven, USA.) BORIS — An Experiment in-Depth Understanding of Narratives.— „Artificial Intelligence", vol. 20, № 1, 1983, p. 15—62.
Настоящая работа отчасти финансировалась Агентством перспективных исследо­вательских проектов (ARPA), а отчасти — Национальным научным фондом США.— Прим. авторов.
© 1983 North-Holland.
 
мысленной и связной интерпретации входного текста. (Входной материал, предлагаемый программе, набирается строчными буквами, а ответы программы — прописными *.)
(BORIS РАЗВОД-1)
ОБРАБАТЫВАЕТСЯ АБЗАЦ 1
Ричард несколько лет не имел никаких известий о Поле, своем товарище по комнате во время учебы в университете. В то время Ричард одолжил у Поля некоторую сумму, которая так и не была возвращена. Теперь же он совершенно не представлял себе, где он может найти своего старого друга. Когда вдруг из Сан-Франциско пришло письмо, Ричард загорелся жела­нием узнать, как живет Поль.
СИСТЕМА ГОТОВА К РАБОТЕ В РЕЖИМЕ В/О
Какое событие произошло у Ричарда дома? РИЧАРД ПОЛУЧИЛ ПИСЬМО ОТ ПОЛЯ.
Кто такой Поль? ДРУГ РИЧАРДА.
Хотел ли Ричард видеть Поля?
ДА, РИЧАРД ХОТЕЛ ЗНАТЬ, КАК ЖИВЕТ ПОЛЬ.
Помогал ли когда-либо Поль Ричарду?
ДА, ПОЛЬ ДАЛ РИЧАРДУ ДЕНЬГИ В ДОЛГ.
Почему Ричард не вернул долг Полю? РИЧАРД НЕ ЗНАЛ, ГДЕ НАХОДИТСЯ ПОЛЬ.
Что почувствовал Ричард, когда пришло письмо? РИЧАРД БЫЛ ОБРАДОВАН, ПОТОМУ ЧТО ПОЛЬ И ОН БЫЛИ ДРУЗЬЯМИ.
ОБРАБАТЫВАЕТСЯ АБЗАЦ 2
К сожалению, новости не были хорошими. Жена Поля Сара настаивала на разводе. Она хотела также получить машину, дом, взять детей и добиться алиментов. Поль хотел развода, но он не хотел, чтобы к Саре перешло все их имущество. Его жалованье в государственной школе было очень мало. Не зная, к кому обратиться, он надеялся на содействие единст­венного знакомого ему адвоката. Поль указал номер своего домашнего телефона на тот случай, если Ричард сочтет, что может быть ему полезным.
* Фразы из рассказов, вопросы к системе BORIS и ее ответы даются на русском языке; текст на английском приводится только в тех случаях, когда обсуждается какое-то явление, специфичное для английского языка.— Прим. перев.
СИСТЕМА ГОТОВА К РАБОТЕ В РЕЖИМЕ В/О
Что сообщалось в письме?
ПОЛЬ И САРА ЗАТЕЯЛИ ДЕЛО О РАЗВОДЕ.
Написал ли Поль письмо Саре?
НЕТ, НЕ САРЕ. ПИСЬМО ПОЛУЧИЛ РИЧАРД.
Почему Поль был расстроен в связи с разводом? ПОЛЬ И САРА СПОРИЛИ ПО ПОВОДУ СЕМЕЙНОГО ИМУ­ЩЕСТВА.
Чем Поль зарабатывал себе на жизнь? ПОЛЬ БЫЛ УЧИТЕЛЕМ.
Чего хотела Сара?
САРА ХОТЕЛА ПОЛУЧИТЬ МАШИНУ И ДОМ, ВЗЯТЬ МАЛЫ­ШЕЙ И ДОБИТЬСЯ АЛИМЕНТОВ.
Почему Поль написал Ричарду?
ПОЛЬ ХОТЕЛ, ЧТОБЫ РИЧАРД БЫЛ ЕГО АДВОКАТОМ.
ОБРАБАТЫВАЕТСЯ АБЗАЦ 3
Ричард нетерпеливо схватил трубку телефона и набрал номер. После короткого разговора Поль договорился с ним позавтра­кать вместе на следующий день. В его голосе слышались явное облегчение и благодарность.
СИСТЕМА ГОТОВА К РАБОТЕ В РЕЖИМЕ В/О
Почему Ричард позвонил Полю?
РИЧАРД ХОТЕЛ ДОГОВОРИТЬСЯ С ПОЛЕМ О ВСТРЕЧЕ.
Установил ли Ричард связь с Полем? ДА, РИЧАРД ПОЗВОНИЛ ПОЛЮ.
Как Ричард установил связь с Полем? ПО ТЕЛЕФОНУ.
Что почувствовал Поль, когда позвонил Ричард?
ПОЛЬ БЫЛ ДОВОЛЕН, ТАК КАК РИЧАРД СОГЛАСИЛСЯ
БЫТЬ АДВОКАТОМ ПОЛЯ.
ОБРАБАТЫВАЕТСЯ АБЗАЦ 4
На следующий день, когда Ричард ехал на машине в ресторан, он едва не сбил на улице старика. Он чувствовал себя совершен­но потрясенным после этого происшествия и в ресторане выпил три рюмки спиртного. Когда пришел Поль, Ричард был изрядно пьян. Когда принесли еду, Ричард пролил чашку кофе на Поля. Это, видимо, сильно раздосадовало Поля, и поэтому Ричард предложил отвезти его домой, чтобы он мог переодеться.
СИСТЕМА ГОТОВА К РАБОТЕ В РЕЖИМЕ В/О Почему Ричард завтракал вместе с Полем? РИЧАРД ХОТЕЛ ОБСУДИТЬ С ПОЛЕМ ДЕЛО О РАЗВОДЕ.
Что случилось с Ричардом на пути в ресторан? РИЧАРД ЕДВА НЕ ЗАДАВИЛ СТАРИКА.
Почему Ричард напился?
РИЧАРД БЫЛ ПОТРЯСЕН ТЕМ, ЧТО ОН ЕДВА НЕ ЗАДАВИЛ
СТАРИКА.
Что случилось в ресторане?
РИЧАРД ПРОЛИЛ КОФЕ НА ПОЛЯ.
Что почувствовал Ричард, когда пролил кофе?
РИЧАРД ПОЧУВСТВОВАЛ СЕБЯ ВИНОВАТЫМ.
Почему Ричард пролил кофе? РИЧАРД БЫЛ ПЬЯН.
Когда Ричард едва не сбил старика?
КОГДА РИЧАРД ЕХАЛ НА МАШИНЕ В РЕСТОРАН.
Где Ричард завтракал с Полем? В РЕСТОРАНЕ.
ОБРАБАТЫВАЕТСЯ АБЗАЦ 5
Когда Поль вошел в спальню и обнаружил там Сару с другим мужчиной, его едва не хватил удар. Затем он сообразил, что это невероятная удача. Поскольку рядом был свидетель в ли­це Ричарда, то дело о разводе для Сары было очевидным об­разом проиграно. Ричард поздравил Поля и предложил отпразд­новать удачу и пообедать вместе. Поль охотно согласился.
СИСТЕМА ГОТОВА К РАБОТЕ В РЕЖИМЕ В/О
Почему Ричард отвез Поля домой?
ЧТОБЫ ПОЛЬ МОГ ПЕРЕМЕНИТЬ ОДЕЖДУ.
Что произошло у Поля дома?
ПОЛЬ ЗАСТАЛ САРУ В МОМЕНТ НАРУШЕНИЯ СУПРУ­ЖЕСКОЙ ВЕРНОСТИ.
Что почувствовал Поль? ПОЛЬ БЫЛ ПОРАЖЕН.
Почему Сара проиграла дело о разводе?
САРА НАРУШИЛА СУПРУЖЕСКУЮ ВЕРНОСТЬ.
Почему Ричард поздравил Поля? ПОЛЬ ВЫИГРАЛ ДЕЛО О РАЗВОДЕ.
1.2. Проблемы, проблемы, проблемы
весь второй абзац посвящен информации, содержащейся в письме, которое читает Ричард. Однако читателю нигде явно не сообщает­ся о факте прочтения письма.
(е) Жена Поля Сара настаивала на разводе.
Как информация о разводе представлена в нашей памяти? По крайней мере она должна предусматривать и фактическое рас­торжение брака, и правовой спор. Иначе теряло бы смысл упомина­ние о потребности Поля в адвокате, которое содержится в конце данного абзаца.
(ж)...but he did not want to see Sarah walk off with everything he had.
'...но он не хотел [букв, 'не хотел видеть'], чтобы к Саре перешло все их имущество' [букв, 'ушла со всем, чем он владел'].
Здесь предполагаемое действие Сары „walk off" не подразу­мевает простое физически наглядное событие. Аналогичным обра­зом глагол see не обозначает факт зрительного восприятия. Нель­зя здесь понимать слишком буквально и слово everything. Всяко­го рода метафоры и непрямые обозначения должны восприниматься с известной долей осторожности.
(з) Его жалованье в государственной школе было очень мало.
Как связана фраза (з) с содержанием рассказа? Люди легко понимают связь между небольшим жалованьем и гонорарами адвока­ту, суммой алиментов и т. п. Но как сможет установить эту связь BORIS?
(и) Not knowing who to turn to he was hoping for a favor from the only lawyer he know.
'He зная, к кому обратиться, он надеялся на содействие един­ственного знакомого ему адвоката'.
Здесь мы должны понять, что означает выражение „to turn to someone", интерпретируемое в данном случае не в чисто физическом смысле. А каким образом тот факт, что Ричард является единствен­ным знакомым Полю адвокатом, каузально связан с надеждой Поля? Конечно, выражение „not knowing who to turn to" (букв, 'незнание, к кому обратиться') практически синонимично выраже­нию „not knowing who else to turn to" (букв, 'незнание, к кому еще обратиться'). Отметим, кстати, еще и то, что в рассказе нигде явно не говорится о том, что Ричард и есть тот самый адвокат, о котором идет речь.
(к) Ричард нетерпеливо схватил трубку телефона и набрал номер.
ill
Для понимания возможностей системы BORIS проведем беглый обзор проблем, возникающих по ходу обработки приведенного выше рассказа.
(а)   Ричард несколько лет не имел никаких известий о По­ле, своем товарище по комнате во время учебы в университете.
Здесь BORIS получает информацию об отрицании некоторого события, то есть о некотором ,,не-событии". Однако недостаточно просто записать это событие в памяти, снабдив его пометой о том, что оно не имело места. Когда человек воспринимает фразу „Джон вошел в комнату, и Мэри там не было", он делает вывод, что Джон хотел видеть Мэри и ожидал найти ее в комнате; он не ограничивается простым занесением в память факта ЛОЖНО [НА­ХОДИТЬСЯ [МЭРИ, КОМНАТА] ].
(б)   ..., которая так и не была возвращена.
Эта фраза тоже сообщает о не-событии, однако импликации из этой информации весьма существенны. Многие читатели данного рассказа считают, что Ричард хотел помочь Полю, так как Ричард чувствовал себя ему обязанным. Следовательно, не-событие в данном случае должно интерпретироваться в рамках взаимоотноше­ний между Полем и Ричардом. Далее следует обратить внимание на то, что в (б) явно не указано, кто, что и кому не возвра­тил; тем не менее читатели без затруднений восстанавливают эту информацию на основе их знаний о событиях займа и выплаты долга.
(в)... Теперь же он совершенно не представлял себе, где он может найти своего старого друга.
Для правильного осмысления этого высказывания мы должны понимать, что Ричард не может установить местонахождение Поля: они уже не находятся «в контакте». На уровне осмысления более мелких единиц мы должны также понимать, что слово старый отно­сится к давности отношений Ричарда и Поля, но отнюдь не к воз­расту Поля. И, наконец, мы должны понимать, что между (б) и (в) имеется связь: установление местонахождения Поля — одно из необходимых условий для возвращения ему долга.
(г)   Когда вдруг из Сан-Франциско пришло письмо...
Читатели предполагают, что письмо пришло от Поля, хотя об этом явно не сообщается.
(д)   ...к сожалению, новости не были хорошими.
Здесь говорится о содержании письма Поля. По существу,
В рассказе не говорится явно о том, кому позвонил Ричард.
(л) В его голосе слышались явное облегчение и благодарность. В чьем голосе? Каким образом мы узнаем это?
(м) ...he barely avoided hitting an old man in the street. '...он едва не сбил на улице старика.'
BORIS должна понять, что „hitting" относится здесь к ситуации уличного происшествия, но отнюдь не кулачного боя.
(н) Когда пришел Поль, Ричард был изрядно пьян.
В рассказе явно не сказано, куда пришел Поль; однако читатель без труда опознает это место, обращаясь к прошлой договорен­ности о встрече двух приятелей.
(о) ...и поэтому Ричард предложил отвезти его домой, чтобы он мог переодеться.
Почему Ричард сделал такое предложение? Почему Полю нужно было переменить одежду? Для ответа на вопрос подобного рода между указанными событиями должны быть установлены опреде­ленные связи.
(п) Когда Поль вошел в спальню...
Что Поль делает в спальне? Как он туда попал? Большинство сценических переходов осуществляется в повествовательных текстах лишь неявно. Отметим еще, что нам не сообщается о том, что Ричард отвез Поля домой, а только о том, что он предложил это сделать.
(р) ...и обнаружил там Сару с другим мужчиной, его едва не хватил удар.
Здесь следует вывести умозаключения относительно того, чем занималась Сара и что значили ее действия для Поля, а также относительно возможной реакции Поля на все это. Только при усло­вии вывода подобных умозаключений имеет смысл сообщение, что Поля „едва не хватил удар" (кстати, само это сообщение является метафорическим выражением для состояния шока).
(с) Затем он сообразил, что это невероятная удача.
Что обозначает здесь слово это} Данная фраза как бы настраива­ет нас на поиск объяснения. Не располагая таким объяснением, нельзя уяснить, почему здесь говорится об удаче.
(т) With Richard there as a witness, Sarah's divorce case was shot.
'Поскольку рядом был свидетель в лице Ричарда, дело о разводе для Сары было очевидным образом проиграно'. 112
Для успешной интерпретации этой фразы BORIS должна распо­лагать некоторыми сведениями о том, что такое свидетель. И, конеч­но, shot court case 'проигранное судебное дело' весьма существенно отличается от dead case of beer 'пустой ящик из-под пива <Спивных бутылок, жестянок>'.
(у) Ричард поздравил Поля и предложил отпраздновать удачу и пообедать вместе.
Система BORIS должна понять, почему здесь уместны поздрав­ления. В рассказе не говорится о том, что Поль выиграет дело, а только о том, что Сара его проиграет. Вывод, конечно, ясен, но тем не менее его нужно сделать.
Как показывают приведенные выдержки, система BORIS должна предусматривать такие процессы, как определение, применение и взаимодействие разнообразных источников знаний. В рассказе РАЗВОД-1 содержатся элементарные объекты (object primitives) (Lehnert, Burstein, 1979; L e h n e r t, 1979), сценарии (scripts) (C u 1 1 i n g f о r d, 1981), описания обстановки (settings) (Dyer, Lehnert, 1980), цели (goals) (Wilensky, 1978a), планы (Schank, Abelson, 1977), аффективные переживания (affects) (Dyer, 1982), темы (W i 1 e n s k y, 1978b), межличностные отношения (Schank, Abelson, 1977), физические состояния (Schank, 1975), события (Dyer, 1981), социальные акты (Schank, Carbonell (Jr.), 1979), КОП — Конфигурация Орга­низации Памяти (MOPS — Memory Organization Packets) (Schank, 1982) и АТБ — Аффективно-Тематические Блоки (TAUS— The­matic Affect Units) (Dyer. 1981).
1.3. Интеграция процесса обработки текста: общие принципы
1.3.1. Из истории разработки системы.
Нынешняя версия системы BORIS представляет собой интеграль­ную систему. BORIS работает как единый модуль, в котором все операции по выводу умозаключений, вызову структур знаний и поиску в памяти актуализируются как побочные эффекты единого процесса обработки текста. Однако так обстояло дело не всегда. Сначала BORIS проектировалась как система, состоящая из четырех взаимодействующих модулей:
(1)   Концептуальный анализатор (КА) принимал на входе анг­лийскую фразу из некоторого рассказа и строил структуры (Schank, Abelson, 1977) концептуальных зависимостей (КЗ), которые хранились в оперативном буферном устройстве, называемом рабочей памятью (РП).
(2)   Накопитель событий (НС) анализировал структуры концеп­туальных зависимостей в том виде, в каком они хранились в рабо-
чей памяти, и строил на их основе эпизоды, заносившиеся в особую эпизодную память (или память повествования). Накопитель событий включал ожидания, работавшие по принципу „сверху вниз", то есть предсказывавшие появление тех или иных событий в тексте на основе общеситуационных соображений, и использовал эту информацию как для заполнения ненасыщенных слотов в структурах концептуаль­ных зависимостей, порождаемых концептуальным анализатором, так и для построения каузальных связей между структурами памяти.
(3)   Вопросно-ответный модуль (ВО) интерпретировал вопросы и обращался к эпизодной памяти для поиска ответов в форме концептуальных представлений.
(4)   Синтезатор * английского языка (BORGEN) принимал на входе структуру концептуальных зависимостей из эпизодной памяти и синтезировал английскую фразу в качестве выхода.
Этот модульный подход в ряде отношений стал обнаруживать свою несостоятельность. Во-первых, мы установили, что для пони­мания вопросов, относящихся к рассказу, люди производят поиск в памяти сведений о данном рассказе. Для моделирования такого поведения был построен второй анализатор (DYPAR) (Dyer, to appear), осуществлявший в ходе понимания вопросов поиск в эпи­зодной памяти с целью облегчить процесс анализа вопросов. Эта работа имела три важных следствия.
(1)   BORIS нередко располагает ответом на вопрос еще до завершения полного анализа вопроса (Dyer, 1981) (см. ниже, разд. 5.3).
(2)   Поскольку ранее накопитель событий находился в активном состоянии только во время осуществления процесса понимания рассказа, то во время подготовки ответа на вопрос не работал никакой механизм накопления событий, который помогал бы в ана­лизе вопросов. Однако вопросно-ответный анализатор DYPAR легко преодолел эту трудность, так как он обладал способностью обследо­вания эпизодной памяти в ходе процесса понимания вопроса.
(3)   Стала очевидной искусственность положения, когда мы имеем две отдельные анализирующие системы, одна из которых опирается на накопитель событий в ходе процесса понимания рассказа, а дру­гая объединяет процедуры анализа с процедурами поиска информа­ции в эпизодной памяти.
Во-вторых, поскольку концептуальный анализатор функциони­ровал в полной изоляции от других процедур, ему часто не хватало информации, которая могла бы облегчить выполнение стоящей перед ним задачи. Задача анализа уже не сводилась к простому преобразованию входной фразы на естественном языке в репрезен-
тацию ее значения. Теперь, когда наряду со структурами памят низших уровней (например, концептуальными зависимостями) системе строились структуры памяти высших уровней (наприме] АТБ и КОП), мы должны были решать, на каком уровне долже строить представление фразы наш анализатор.
Рассмотрим, например, следующий фрагмент фразы из после/ него абзаца рассказа РАЗВОД-1:
Когда Поль вошел в спальню и обнаружил там Сару с други. мужчиной...
Анализатор мог бы построить два независимых представлени на двух уровнях.
(1)   Он мог бы интерпретировать данную фразу как сообщени о том, что Поль увидел Сару рядом с мужчиной в спальне, и толью потом накопитель событий будет вычислять тот факт, что Сар; находится в любовной связи с этим человеком и тем самым нарушае супружескую верность.
(2)   С другой стороны, анализатор мог бы понять эту фраз; иначе — как прямое сообщение о факте любовной связи Сары с муж чиной. Тогда все необходимые выводы были бы сделаны уже сами* анализатором, а не накопителем событий.
Который из двух уровней представления более приемлем в ход< анализа? Для того чтобы понять вопрос:
Что почувствовал Поль, когда он обнаружил в спальне Capi с другим мужчиной?
вопросно-ответный анализатор должен прежде всего уяснить, чтс данный вопрос подразумевает факт адюльтера. Если бы вопрос бы/ понят только на низшем уровне, поиск в памяти опирался бы лиил на факт близости местонахождения двух действующих лиц и поэтом} не привел бы к успешному выводу. Однако, если анализатор строит представление высшего уровня, модуля накопления событий уже не требуется, поскольку все умозаключения высшего уровня по­рождаются в ходе процесса анализа.
В-третьих, взаимодействие накопителя событий и концептуаль­ного анализатора всегда представляло немалые трудности. Сколь часто в ходе накопления событий следует обращаться к рабочей памяти — после каждой фразы, каждого словосочетания, каждого слова? В рассматриваемом варианте системы концептуальный ана­лизатор обычно не справлялся с задачей анализа в тех случаях, когда требовалось обращение к структурам памяти высших уровней. Мы попытались дополнить сферу действия концептуального анали­затора процедурами, позволявшими обследовать в динамическом режиме те структуры, которые строил накопитель событий в ходе обработки своих текущих запросов (Lehnert, Dyer et al., 1980).
* В большинстве контекстов в данном сборнике английские термины „to generate" и „generator" переводятся как 'синтезировать', 'синтезатор'.— Прим. ред.
Однако такой подход приводит к трудностям, связанным с синхро­низацией работы этих двух модулей. Всегда возникала неясность относительно того, который из двух модулей должен выполнять ту или иную конкретную задачу — концептуальный анализатор или накопитель событий. Разделение функций между этими модулями представлялось все более и более искусственным.
Наконец, нужно добавить, что накопитель событий содержал ожидания, основанные на логике типа „сверху вниз", тогда как концептуальный анализатор работал по принципу „снизу вверх", отправляясь от конкретного состава исходной фразы. Накопитель событий накладывал каждое из своих ожиданий на входную струк­туру концептуальных зависимостей, построенную в рабочей памяти, пока одно из них не вкладывалось в нее. Однако это часто озна­чало, что информация низшего уровня, вытекающая непосредственно из входного сообщения, просто игнорировалась. Например, в ответ на фразу
Ричард нетерпеливо схватил трубку телефона и набрал номер
накопитель событий делал предположение, что Ричард позвонил По­лю. В данном случае это оказалось верным. Однако если бы в пред­ложении явно сообщалось следующее:
Ричард нетерпеливо схватил трубку телефона и позвонил Фреду, который был специалистом по военным спорам,
тогда указанное умозаключение, делаемое накопителем событий, было бы ошибочно (Granger (Jr.), 1980). В данном случае адресатом телефонного звонка должен быть Фред, а не Поль. Умозаключения этого типа можно предотвратить, если система будет учитывать, какие выводы несовместимы с явно заданной (восходя­щей) информацией. В подобных случаях эксплицитная информация должна предотвращать вывод умозаключений по принципу предска­зания.
Решение указанных проблем осуществлялось двумя путями: (1) мы ликвидировали накопитель событий как отдельный модуль и (2) DYPAR и концептуальный анализатор были объединены в еди­ный модуль, в результате чего DYPAR получил возможность вести поиск в эпизоднои памяти и строить содержимое этой памяти. Одно из следствий этого подхода состоит в том, что теперь анализатор порождает процедуры непосредственного обращения к единицам эпизоднои памяти. Другое (непредвиденное) следствие такого объединения состоит в том, что BORIS иногда достраивает содер­жимое эпизоднои памяти в процессе выработки ответа на вопрос (Dyer, 1981; Lehnert, Black, Robertson, to appear). Этот „эффект Лофтуса" (L о f t u s, 1979) является естественным следст­вием интегрального анализа.
1.3.2. Управление процессом анализа.
Все операции по поиску информации в памяти, актуализаци эпизодов и выводу умозаключений осуществляются в системе BORI в пословном режиме. Каждой единице машинного словаря (слов; суффиксу или обороту) в словаре присваиваются структуры знани (одна или более) и ассоциируемые с данной единицей „демоны (Dyer, to appear). Демоны представляют ожидания и другую прс цедурную информацию. Каждый демон сам осуществляет управлени своей собственной „жизнью" и „смертью". Демоны могут „плодить другие демоны для создания более сложных структур обработки демоны характеризуются теми или иными значениями определенны параметров, тем самым являясь носителями общей процедурной ин формации. Более существенно то, что демоны способны обследоват и формировать эпизодную память. Новые демоны порождаютс: также всякий раз, когда в качестве отдельного эпизода актуализи руется некоторая новая структура знаний. Эпизод в памяти всегд; создается посредством актуализации по меньшей мере одной структу ры знаний.
Большинство демонов, приписываемых различным структурам знаний, распадается на пять категорий: (1) демоны, заполняющи* слоты, (2) демоны цели/планирования, (3) демоны, связанны! с описаниями обстановки, (4) демоны, связанные с событиями, i (5) демоны нарушения ожиданий. Дальнейшее изложение буде-посвящено описанию функционирования системы BORIS; мы рас смотрим: (а) структуры знаний, обрабатываемые программой, и (б] некоторые из процессов, осуществляемых в ходе понимания текста
2. ПРЕДСТАВЛЕНИЕ ЗНАНИЙ И ЭПИЗОДНАЯ ПАМЯТЬ
Наиболее важные структуры знаний в рассматриваемой систем* сводятся к трем типам: КОП (S с h a n k, 1982b), МЕТА-КОП (S chan к, 1982а) и АТБ (Dyer, 1981). КОП (Конфигурация Организации Памяти (МОР — Memory Organization Packet)) — это конфигурация единиц, описанных с помощью аппарата концеп­туальных зависимостей * и объединенных в особую дискретную структуру знаний посредством стандартного набора семантических связей. (Эти связи подробно описаны в: Dyer, Lehnert, 1980.) АТБ (Аффективно-Тематические Блоки — TAU — Thematic Affect. Units) будут рассмотрены в разд. 2.3.
* О переводе термина „концептуальные зависимости" см. наст, сб., с. 36.— Прим. ред.
2.1. КОП и МЕТА-КОП
ветственно „намерение", „мотивацию" и „достижение". Эти связи, а также другие, не представленные в приводимых здесь схемах, подробно описаны в: Dye г, Lehnert, 1980. Согласно принятым в нашей работе правилам, события и планы изображаются в централь­ной части схемы, а цели записываются в левой или правой части под соответствующей ролью действующего лица данной ситуации (см. рис. 1).
Схема К-ОДАЛЖИВАНИЕ [К — „конфигурация", в сокраще­нии — КОП] отражает важнейшие компоненты любого эпизода одал­живания. Лицо, берущее взаймы („берущий-взаймы"), хочет иметь нечто, поэтому оно просит другое лицо („дающего-взаймы") пре­доставить ему соответствующий объект. Если дающий взаймы предоставляет („дает") этот объект, то он „хочет получить его обратно" в будущем, а берущий взаймы будет сознавать, что он обязан вернуть его. BORIS использует эту структуру знаний в про­цессе понимания события одалживания, о котором упоминается в первом абзаце рассказа РАЗВОД-1. Когда имеет место ситуация одалживания, BORIS обращается к конфигурации К-ОДАЛЖИВА­НИЕ, чтобы создать ожидание того, что взятый взаймы объект будет возвращен в некоторый будущий момент времени. Когда система BORIS читает фразу «которая так и не была возвращена», она понимает слово „возвращена" в терминах схемы К-ОДАЛЖИВА­НИЕ и автоматически выводит необходимые умозаключения отно­сительно заполнения узлов этой схемы.
Кроме того, схема К-ОДАЛЖИВАНИЕ включает ряд КОП-свя­зей, которые используются для анализа контекста с целью опреде­ления того, какая (или какие) МЕТА-КОП могут быть релевантными для анализируемого текста. Если ситуация характеризуется нефор­мальными отношениями партнеров (например, берущий взаймы и дающий взаймы являются друзьями), то активизируется МК-СО-ДЕЙСТВИЕ. Это соотношение представлено на схеме посредством следующей КОП-связи: „МЛТ-ДРУЖБА -+■ МК-СОДЕЙСТВИЕ".
Префикс „МЛТ" здесь обозначает межличностные темы. На меж­личностном уровне BORIS знает, что друзья склонны: (а) общаться, проводить совместно время, (б) знать о жизни и о делах друг друга и (в) оказывать друг другу услуги. Если эти условия нару­шаются слишком часто, то дружбе может наступить конец.
КОП-связи однонаправленны. Другими словами, К-ОДАЛЖИ­ВАНИЕ может активизировать МК-СОДЕЙСТВИЕ, однако обрат­ное неверно. Это объясняется тем, что почти любая деятельность может считаться содействием. Например, если вы предложили кому-то пойти с вами в кино, то это можно считать содействием; однако нельзя ожидать, что МК-СОДЕЙСТВИЕ включает знание обо всех подобных возможностях. Метаконфигурация МК-СОДЕЙСТВИЕ изображена на рис. 2.
119
В отличие от сценариев, отражающих лишь действия персона­жей повествования в той или иной конкретной обстановке, КОП включает также цели и намерения. Каждой КОП приписывается не­который набор КОП-связей, которые в ходе понимания рассказа позволяют оперативно учитывать отношения данной КОП к другой КОП, а также ожидания, касающиеся возможных последующих событий. Кроме того, совокупность КОП служит в качестве указа­теля, облегчающего обращение к эпизодной памяти. Эпизоды в систе­ме BORIS восстанавливаются в динамическом режиме на основе нескольких КОП, МЕТА-КОП и АТБ. Эта процедура будет рассмот­рена ниже.
Рис. 1. К-ОДАЛЖИВАНИЕ.
На рис. 1 приводится пример КОП, представляющей знания системы BORIS о фактах одалживания тех или иных объектов. В целях наглядности и ясности все схемы, изображающие КОП, носят в настоящей работе упрощенный характер. Например, всякий узел в КОП указывает на какую-то конструкцию из концептуальных зависимостей; однако на приводимых схемах каждая такая конструк­ция заменена мнемоническим обозначением, имеющим соответст­вующее событие или цель. Связи ,,н", ,,м" и ,,д" обозначают соот-
Существенно, что BORIS понимает событие одалживания как на уровне КОП, так и на уровне МЕТА-КОП. Прежде всего, каждая структура знаний охватывает особый набор ожиданий. На уровне конфигурации К-ОДАЛЖИВАНИЕ BORIS ожидает, что Ричард вернет деньги Полю. Это ожидание весьма конкретно, и в случае рас­сказа РАЗВОД-1 оно не выполняется. Однако на уровне метакон-фигурации МК-СОДЕЙСТВИЕ ожидание того, что Ричард поможет Полю, впоследствии выполняется (когда Ричард соглашается пред-
дует представлять развод? Что именно входит в К-РАЗВОД? Каждый раз, когда мы пытались выявить содержание конфигурации К-РАЗ­ВОД, дело сводилось к другим структурам знаний — браку, адюль­теру, спорам об опеке детей и т. п. Фактически от собственно развода в конфигурации К-РАЗВОД остается, довольно мало. КОП К-РАЗ­ВОД содержит в основном связи с другими структурами знаний. На рис. 3 изображена часть того знания о разводах, которым распола­гает BORIS.
Рис. 2. МК-СОДЕЙСТВИЕ.
ставлять интересы Поля на суде). Это ожидание ответного содейст­вия сохраняется независимо от того, возвратил Ричард деньги Полю или нет. Таким образом, МК-СОДЕЙСТВИЕ представляет „неопре­деленные" ожидания, в которых воплощено наше предположение о том, что Ричард сделает нечто для Поля, но мы не можем сказать уверенно, что именно.
МЕТА-КОП, будучи весьма похожи на КОП, отличаются от них большей степенью абстрактности. МЕТА-КОП существенны потому, что они представляют такое знание о событии, которое не может быть уловлено на уровне КОП. Например, пусть в рассказе мы читаем:
Ричард взял в долг 800 долларов в банке Джоунза, но так и не вернул эту сумму.
Этот случай одалживания, конечно, является не ситуацией содействия, а скорее деловым контрактом, и выводы, вытекаю­щие из неуплаты Ричардом долга, носят совсем другой характер.
Некоторые КОП определить очень трудно. В системе BORIS развод представляет собой КОП. Однако встает вопрос: как сле-
Рис. 3. К-РАЗВОД.
Во многих случаях, когда люди слышат о разводе, они вовсе не обязательно сразу же вспоминают о таких вещах, как правовые споры, адвокаты, адюльтеры, утраченная любовь, перемена место­жительства и т. п. Если бы люди задумывались обо всех структурах знаний, потенциально связанных с данным событием, они были бы подавлены объемом привлекаемой информации. Однако, если в кон­тексте развода упоминается адвокат, люди мгновенно понимают, почему это существенно. BORIS достигает такого понимания при помощи КОП-связей. Если BORIS читает о том, что имеет место су­щественный конфликт целей двух супругов, то система активизирует МК-ПРАВОВОЙ-СПОР. Эта структура знаний задает ту информа­цию, которая касается споров, разрешаемых с помощью обращения с заявлением в судебные инстанции (Bower, Black, Turner, 1979). Поскольку для составления заявлений необходим адвокат,
уместность упоминания его в контексте развода становится понятной. Метаконфигурация МК-ПРАВОВОЙ-СПОР изображена на рис. 4. В содержательном изложении МК-ПРАВОВОЙ-СПОР означает следующее. Два лица имеют противоречащие цели. Каждый из ад­вокатов представляет дело судье. Судья разрешает дело благо­приятно для одного лица и неблагоприятно для другого. Шансы в пользу того или иного решения зависят от сути спора. Например, в „контрактных" спорах судья склонен решить дело неблагоприят­но для лица, нарушившего контракт. Вот почему BORIS понимает,
наложения следующих структур: МК-ПРАВОВОЙ-СПОР, К-АДВО-КАТ, МК-ПРОФ-ОБСЛУЖИВАНИЕ, К-РАЗВОД и МК-СОДЕЙСТ-ВИЕ.
УРЕГУЛИРОВАНИЕ КОНФЛИКТА в К-РАЗВОД является предметом СПОРА в МК-ПРАВОВОЙ-СПОР. Тот аспект ситуации спора, который состоит в необходимости иметь адвоката (то есть НАЙТИ-АДВОКАТА-ДЛЯ-А), соотносится на схеме с теми знания­ми об адвокатах, которыми располагает BORIS. Поскольку Ричард готовит защиту судебного дела для Поля (то есть ПРОШЕНИЕ),
Рис. 4. МК-ПРАВОВОЙ-СПОР.
что нарушение Сарой супружеской верности (то есть „брачного контракта") предопределяет для нее проигрыш бракоразводного спора.
Рис. 5. Наложения структур памяти.
то он одновременно осуществляет профессиональное обслуживание и оказывает содействие своему старому другу.
Эта схема наложений обладает четырьмя достоинствами:
(1)   Каждая структура знаний может быть задана независимо от других структур знаний, а уже затем она может быть привяза­на к другим структурам посредством КОП-связей.
(2)   В каждой структуре знаний требуется представлять толь­ко то, что существенно непосредственно для нее. Например, К-АДВО­КАТ содержит ролевую информацию о том, что обычно делают адвокаты (то есть встречаются с клиентами, собирают свидетельства и т.п.). Однако тот факт, что адвокат выполняет эти задачи, имея в виду личный доход, учитывается метаконфигурацией МК-ПРОФ-ОБСЛУЖИВАНИЕ, которая отражает информацию о де­нежном вознаграждении для ЛЮБОГО типа профессионального обслуживания. Поэтому и не нужно размножать МК-ПРОФ-ОБСЛУ-
2.2. Наложение структур памяти
Когда посредством КОП-связи активизируется какая-то КОП или МЕТА-КОП, должно быть известно содержательное соотношение между источником активизирующего знания и источником активизи­руемого знания. Например, система BORIS должна понять не только то, что развод каузировал правовой спор, но и то, что предмет спора в рамках МК-ПРАВОВОЙ-СПОР включает урегулирование вопроса об имуществе и об опеке детей. BORIS достигает такого понимания с помощью приема „наложения" одной структуры знаний на другую. „Наложение" состоит в указании того, какой компонент в одной структуре знаний эквивалентен некоторому другому ком­поненту в какой-то другой структуре знаний. Рис. 5 демонстрирует
ЖИВАНИЕ для разных видов услуг, оказываемых врачами, во­допроводчиками и др. Тем самым достигается колоссальная эко­номия объема памяти (Dyer, 1981a; S с h a n к, 1982а).
(3)   Источник знаний активизируется только тогда, когда про­исходит событие, имеющее к нему непосредственное отношение. Например, читатели вовсе не обязательно задумываются над необ­ходимостью оплаты услуг адвоката, если в тексте нет прямого упоминания об оплате (или о неуплате, или об отказе оплачивать труд адвоката).
(4)   Каждое событие может быть понято с нескольких точек зрения. Когда Ричард и Поль встречаются за завтраком, мы видим двух старых университетских приятелей, собравшихся для друже­ского общения после длительной разлуки, и в то же время мы ви­дим адвоката и клиента, встретившихся для обсуждения судебно­го дела. Поскольку люди не испытывают никаких затруднений, имея дело одновременно с несколькими точками зрения на ситуацию и участников (например, Поль является одновременно супругом, университетским другом, учителем, участником правового спора и клиентом адвоката), мы хотим наделить систему BORIS точно такой же способностью.
знание о том, какие чувства испытывают люди, попавшие в за­труднительные обстоятельства, и как они реагируют на эту ситуацию или на ее изменения. «Явное облегчение», которое ощутил Поль, тем самым предсказывается на основе АТБ-ЗАТРУДН-ОБСТ.
Ниже указываются некоторые АТБ, используемые в рассказе о разводе, и те события, которые эти АТБ представляют:
АТБ-ЗАТРУДН-ОБСТ: Поль не знает, к кому обратиться.
АТБ-ОПАСНОСТЬ: Ричард едва не убивает старика.
АТБ-КОНСТАТ-ОШИБКИ: Ричард проливает кофе на Поля.
АТБ-ПОИМКА-С-ПОЛИЧНЫМ: Поль застает Сару в постели.
АТБ-НАРУШЕННОЕ-ОБЯЗАТЕЛЬСТВО: Сара находится в лю­бовной связи.
АТБ-НЕЯВНАЯ-УДАЧА: Поль осознает, что его проблемы реше­ны.
АТБ обладают следующими характерными чертами, отличающи­ми их от КОП:
(1)   Они являются тематическими по своей природе. Это озна­чает, что они нередко задают то знание, которое люди отражают в разного рода афоризмах, описывающих способы реагирования лю­дей на неудачи в планировании (Dyer, 1981b). Например, по­словица „A friend in need is a friend indeed" « 'Друзья познаются в беде' резюмирует содержание АТБ-ЗАТРУДН-ОБСТ, а пословица „Every cloud has a silver lining" « 'Нет худа без добра' ре­зюмирует АТБ-НЕЯВНАЯ-УДАЧА.
(2)  В АТБ присутствует существенный аффективный компонент, например: Поль очень хочет, чтобы Ричард согласился быть его адвокатом; Ричард чувствует необычайное потрясение после едва не случившегося дорожного происшествия; Поль шокирован тем, что он застал Сару с другим мужчиной, и т. п.
(3)   АТБ обнаруживают отклонения от стандартного процесса обработки целей/планов, осуществляемого посредством КОП. В большинстве АТБ планы проваливаются (или почти проваливаются). Фактически большинство АТБ возникает из-за появления в повест­вовательном тексте неожиданных событий. Едва не случившаяся катастрофа, пролитый кофе и раскрытая любовная связь — все эти события являются неожиданными для персонажей.
(4)  В отличие от КОП АТБ активизируются с помощью особых содержательных индикаторов, которые опознаются при анализе текста в восходящем режиме. Например, АТБ-ПОИМКА-С-ПО­ЛИЧНЫМ активизируется тогда, когда попытка достичь какой-то цели, связанной с нарушением нормы (попытка, требующая сохра­нения тайны для своего успешного осуществления), терпит неудачу (в ходе выполнения соответствующего этой цели плана) вследствие вмешательства неожиданного свидетеля.
2.3. Аффективно-Тематические Блоки (АТБ)
Не всякое знание может быть задано в рамках КОП или МЕТА-КОП. Например, рассмотрим следующую фразу:
Не зная, к кому обратиться, он надеялся на содействие един­ственного знакомого ему адвоката.
Очевидно, что Поль воспринимает свое положение как ситу­ацию серьезного жизненного затруднения. Он не знает, что пред­принять. Он не уверен, что Ричард ему поможет, и он не знает никого другого, способного ему помочь. Несколько ниже в рас­сказе говорится:
В его голосе слышались явное облегчение и благодарность.
Эта фраза следует после того, 'как мы узнаем, что Ричард согласился заняться делом Поля. Наши знания о дилемме Поля позволяют нам отнести местоимение его к Полю, а не к Ричарду.
Для обработки примеров такого рода BORIS обращается к структуре знаний, называемой АТБ (Аффективно-Тематическим Блоком). АТБ (Dyer, 1982) используются для учета различных аспектов как сюжетных блоков (L e h n e r t, 1982), так и конфигу­раций типа TOP (S с h a n к, 1982а). В приведенном выше примере для понимания ситуации, в которой находится Поль, BORIS ис­пользует структуру АТБ-ЗАТРУДН-ОБСТ. Этот АТБ представляет
(5) АТБ чувствительны к точке зрения персонажей. Например, поимка кого-либо с поличным соотносится с переживанием, весьма отличным от переживания пойманного с поличным. Таким образом, индикатор, позволяющий обращаться к памяти, зависит от того, какую роль играет в ситуации объект, находящийся в фокусе внимания.
„картина памяти рассказа после прочтения системой рассказа о разводе. Каждый эпизод выделен подчеркиванием.
2.4.  Аффективное переживание и эмпатия
В системе BORIS программно воплощается также теория пред­ставления аффективных переживаний, соотносящая аффективные реакции персонажей с межличностными темами и целевыми ситуа­циями. Эта теория представляет собой развитие М. Дайером раз­работок, начатых И.Роузманом (Roseman, 1979). В число аффективных переживаний, доступных обработке в системе BORIS, входят: гнев, сильное желание, надежда, беспокойство, счастье, потрясение, разочарование, благодарность, облегчение, стремление, смущение и т. д. Дескриптивы „к сожалению" и „поздравил" в рас­сказе РАЗВОД-1 обрабатываются с помощью эмфатических блоков, называемых АСЕ (Dyer, 1982), которые также используются в сис­теме для учета других аффективных переживаний, таких, как зависть и злоба.
2.5.   Семантическая vs. эпизодная память
Мы считаем, что противопоставление семантической и эпизодной памяти носит в значительной мере искусственный характер. Это особенно справедливо для систем, способных усваивать и моделиро­вать организацию долговременной памяти человека [К о 1 о d n е г, 1981).
Поскольку семантическая память создается в ходе накопления эпизодов, то между двумя упомянутыми видами памяти провести четкое разграничение невозможно. Однако BORIS не является обу­чающейся системой; поэтому в нашем случае удобно называть ту совокупность знаний, которой BORIS располагает до прочтения рассказа, семантической памятью системы, а термин „эпизодная память" оставить для обозначения знаний, создаваемых в результате прочтения рассказа.
Эпизодная память в системе BORIS складывается из актуализи­рованных КОП, МЕТА-КОП и АТБ. Центральным организующим понятием здесь является „эпизод", понимаемый как одновременная актуализация взаимосвязанных структур знаний. Эпизод аналогичен сценарию; отличие его от сценария состоит лишь в том, что эпизод организован не статически, а динамически строится из других реле­вантных структур знаний. На рис.6 упрощенно представлена
Рис. 6. Эпизодная память.
Каждый эпизод организует те структуры знаний, которые от­носятся к данному событию. Например, ЭП7 на рис. 6 представляет событие, состоящее в том, что Поль застал Сару в момент наруше­ния ею их брачного контракта. Один из способов связывания эпизо­дов состоит в косвенном связывании их через цели. Например, цель „вождение машины" выступает как средство по отношению к цели „встреча с Полем". Эпизоды могут также связываться между собой через АТБ. Так, АТБ-НЕЯВНАЯ-УДАЧА представляет ситуации, включающие такое событие, которое можно рассматривать как с положительной, так и с отрицательной точек зрения. Например, адюльтер Сары плох для Поля с точки зрения брака, но хорош с точки зрения бракоразводного дела.
Ниже приводится иллюстративный фрагмент словаря системы BORIS *. Приводимые словарные статьи носят упрощенный харак­тер. Из соображений ясности и краткости некоторые демоны измене­ны или вообще опущены. Здесь мы оставляем полностью в стороне такие вопросы, как пассивный залог и разрешение лексической неоднозначности. (Обсуждение этих проблем см.: Dyer, 1982.)
Упрощенный словарь Ричард (ЧЕЛОВЕК-ИМЯ (РИЧАРД) ПОЛ (МУЖСКОЙ)
АКТУАЛИЗАЦИЯ * <== (НАЙТИ-ПЕРСОНАЖ)) пролить (ПРИВОДИТЬ-В-ДВИЖЕНИЕ
АГЕНТ * <== (ОЖИДАТЬ 'ЧЕЛОВЕК 'ПЕРЕД) ОБЪЕКТ •<== ((ОЖИДАТЬ '(СОСУД ДЛЯ ЖИДКОСТИ)
'ПОСЛЕ) АДРЕСАТ * < = = ((ОЖИДАТЬ 'ЧЕЛОВЕК 'ПОСЛЕ)
(ПРЕДЛ-ОБ '(ЧЕЛОВЕК ФИЗ-ОБ) 'НА)) ОБРАЗ-ДЕЙСТВИЯ (НЕНАМЕРЕННОЕ) АКТУАЛИЗАЦИЯ •<== (ПРОВЕРКА-ЦЕЛИ)
(РАСПОЗН-АТБ))
л           * <== (МОДИФИЦИРОВАТЬ-ПРЕДШ 'ДЕЙСТВ 'ВРЕМЯ 'ПРОШ)
чашка           (СОСУД ОБЪЕКТ • <== (ПАДЕЖ-ОБ '(ЖИДКОСТЬ) 'РОДИ-
ТЕЛЬНЫЙ)
АКТУАЛИЗАЦИЯ • <== ...) кофе           (ЖИДКОСТЬ ТИП (КОФЕ)
АКТУАЛИЗАЦИЯ • <== .'..)
В приведенных словарных статьях звездочка (*) обозначает ячейку для ответного значения одного или более демонов, указанных после стрелки ( <= = ). Демон ОЖИДАТЬ воспринимает заданный образец как директиву поиска в Рабочей памяти; демон ПРЕДЛ-ОБ содержит информацию о предлоге, заполняющем соответствующее актантное место; демон ПАДЕЖ-ОБ содержит информацию о падеже существительного, заполняющего соответствующее актантное место; демон НАЙТИ-ПЕРСОНАЖ производит поиск персонажа в эпизод-ной памяти и в случае неудачи создает такой персонаж в эпизодной памяти. Другие демоны выводят цели на основании действий (напри­мер, ПРОВЕРКА-ЦЕЛИ) или, как в случае ненамеренного действия, проверяют наличие возможных тематических ситуаций (например, РАСПОЗН-АТБ). В любом случае может осуществляться поиск в эпизодной памяти. По мере прочтения каждого слова в Рабочую
3. АНАЛИЗ
3.1.   Роль лингвистических знаний
В системе BORIS анализ предложения управляется понятийной информацией. Конечный результат анализа — построение или отыскание в памяти концептуальных и эпизодных структур (или поиск в этих структурах). Синтаксическая информация использу­ется лишь в той мере, в какой она требуется для осуществления процедур вывода умозаключений, актуализации каких-то структур знаний или поиска информации. Например, анализатор системы не использует таких синтаксических категорий, как СУЩЕСТВИ­ТЕЛЬНОЕ, ГЛАГОЛ, ИМЕННАЯ ГРУППА, ГЛАГОЛЬНАЯ ГРУП­ПА, НАРЕЧИЕ и т. п. Вместо этого применяется методика, при ко­торой слова инициируют построение концептуальных структур, а при­писанные им демоны находят и обследуют другие структуры. Если тот или иной синтаксический показатель оказывается полезным для нахождения какой-то семантической характеристики, он включается в состав концептуальной структуры, которая строится в данный мо­мент в рабочей памяти. Как только построена эпизодная структура, эта синтаксическая информация забывается.
3.2. Основные принципы анализа
Как было указано ранее, идентификация некоторой словарной единицы приводит к размещению в рабочей памяти некоторой кон­цептуальной структуры, и при этом „порождаются " ассоциируемые с нею демоны. Для уяснения этого процесса рассмотрим, каким образом BORIS анализирует следующую фразу из абзаца 4 рас­сказа РАЗВОД-1:
Ричард пролил чашку кофе на Поля.
* В оригинале даются словарные статьи для единиц, входящих в английскую фразу Richard spilled a cup of coffee on Paul; в переводе эти единицы заменены русскими эквивалентами, а компоненты словарных статей переданы приблизительными русскими соответствиями (ср. примечание переводчика на с.107).— Прим. перев.
память засылаются соответствующие концепты и порождаются (за­пускаются в действие) приписанные им демоны. По мере того как демоны „срабатывают", в Рабочей памяти формируются соответству­ющие связи структур знаний и на основе эпизодной памяти созда­ются (или отыскиваются в готовом виде) соответствующие им эпи­зоды. В результате в Рабочей памяти будет построена, например, следующая концептуализация, содержащая отсылки к структурам в эпизодной памяти (такие отсылки делаются с помощью особого показателя, например показателя АКТУАЛИЗАЦИЯ — INSTAN­TIATION):
(ПРИВОДИТЬ-В-ДВИЖЕНИЕ АГЕНТ (ЧЕЛОВЕК
ИМЯ (РИЧАРД) ПОЛ (МУЖСКОЙ) АКТУАЛИЗАЦИЯ (РИЧАРД 0)) ОБЪЕКТ (СОСУД
ОБЪЕКТ (ЖИДКОСТЬ
ТИП (КОФЕ)
АКТУАЛИЗАЦИЯ (ЖИДКОСТЬ 0)) АКТУАЛИЗАЦИЯ (СОСУД 0)) АДРЕСАТ (ЧЕЛОВЕК
ИМЯ (ПОЛЬ) ПОЛ (МУЖСКОЙ) АКТУАЛИЗАЦИЯ (ПОЛЬ 0)) ВРЕМЯ (ПРОШЕДШЕЕ) ОБРАЗ-ДЕЙСТВИЯ (НЕНАМЕРЕННОЕ) АКТУАЛИЗАЦИЯ (АТБ-РЕГИСТРАЦИЯ-ОШИБКИ
СОВЕРШИВШИЙ-ОШИБКУ (РИЧАРД 0) ПОСТРАДАВШИЙ-ОТ-ОШИБКИ (ПОЛЬ 0) ...))
Заметим, что в ходе анализа демоны ОЖИДАТЬ и ПРЕДЛ-ОБ будут актуализироваться несколько раз. Поскольку эти демоны име­ют изменяемые параметры, их лингвистические знания могут быть распределены по разным компонентам системы.
Ричард взял у Поля взаймы некоторую сумму...
BORIS распознает здесь некоторое событие одалживания, имев­шее место в прошлом. Однако продолжение этой фразы
...которая не была возвращена
не содержит явных указаний на то, кто не возвратил, что и кому. Эта задача легко решается с помощью обращения к памяти. В се­мантической памяти содержится утверждение о том, что берущий взаймы возвращает (компенсирует) заимствованный объект дающе­му взаймы; в эпизодной памяти содержатся указания о том, что бе­рущий взаймы — это Ричард, дающий взаймы — Поль, а заимст­вованный объект — деньги. Если какие-то актантные роли отсутству­ют в анализируемом высказывании, то анализатор берет последнюю из активизированных КОП, проверяет ее на соответствие ожидаемо­му событию и если соответствие выполняется, использует уже заполненные актантные роли в эпизодной памяти для вывода умо­заключений о заполнении недостающих ролей в анализируемой фразе.
3.3.2.Разрешение местоименной референции.
Память оказывается также полезной при разрешении место­именной референции. Снова рассмотрим фразу из абзаца 3 рассказа РАЗВОД-1.
В его голосе слышались явное облегчение и благодарность.
Существует два стандартных подхода к проблеме местоименной референции (в нашем примере речь идет о неоднозначности место­имения его). Для иллюстрации первого подхода рассмотрим структу­ру предшествующей фразы:
Поль согласился позавтракать с ним вместе на следующий день. Для разрешения неоднозначности местоимения в данном случае можно предложить следующее бесхитростное правило:
Если первый партиципант текущей фразы обозначен местоиме­нием
И в тексте представлено более одного возможного референта, согласованного с данным местоимением по признаку пола,
То это местоимение соотносится с первым партиципантом, упо­мянутым в предшествующей фразе.
Используя это правило, BORIS сделает правильный вывод о том, что его в исходной фразе соотносится с Полем. Но адекватно ли это правило? А что, если бы в рассказе говорилось нечто другое? Например:
После короткого разговора Ричард условился с Полем встре-
3.3. Взаимодействие анализатора и памяти
Что значит использовать эпизодную память при анализе? Почему это полезно для анализа? В следующих разделах мы продемонстри­руем плодотворность использования эпизодной памяти при анализе.
3.3.1. Вывод умозаключений о заполнении ролей.
Анализатор обследует актуализированные узлы памяти в целях облегчения процесса порождения умозаключений. Этот тип доступа к памяти часто используется для вывода умозаключений о недостаю­щих ролевых связях. Возьмем простой пример из рассказа:
титься на следующий день для обсуждения бракоразводного дела. В его голосе слышались явное облегчение и благодарность.
Здесь, хотя первым персонажем, упомянутым в первой фразе, является Ричард, местоимение его во второй фразе относится все же к Полю. Поэтому требуется более сильное и общее решение. Для выработки такого решения нужен доступ к „подходящей" структуре знаний, такой, в которой референт местоимения может быть опреде­лен на основе концептуального анализа.
Понимание того, кто же обозначен местоимением его в рассматри­ваемом примере, предполагает понимание импликаций, связанных с наличием во фразе слов облегчение и благодарность (импликаций с точки зрения процедуры обработки целей). В системе BORIS переживания (affects) организуются в рамках АТБ. Конкретно „облегчение " и „благодарность" относятся к следующим ситуа­циям ПЕРЕЖИВАНИЕ/ЦЕЛЬ:
Если X испытывает „облегчение",
То X достиг определенной цели, которая, по мнению Х'а, могла и не быть достигнута, или у Х'а была сиюминутная цель самосохранения, активизированная некоторой „миновавшей" угрозой.
Если X испытывает „благодарность",
То либо некоторый агент Y уже обеспечил достижение некоторой
цели Х'а, либо X нашел некоторого агента для достижения
некоторой своей цели.
Но эти ситуации как раз и представляют собой содержание АТБ-ЗАТРУДН-ПОЛОЖ, который раньше уже актуализировался в памяти системы (см. разд. 2.3). В АТБ-ЗАТРУДН-ПОЛОЖ именно Полю угрожают финансовые потери и именно Поль опасается, что Ричард откажет ему в помощи. Что касается Ричарда, то именно он обеспечил достижение цели Поля, состоящей в нахождении ад­воката для защиты в бракоразводном деле. Таким образом, обследуя этот АТБ, анализатор выясняет, что Поль является лицом, находя­щимся в затруднительном положении, и, следовательно, Поль — наиболее вероятный референт местоимения его в рассмотренном примере.
3.3.3. Разрешение лексической неоднозначности.
Разрешение лексической неоднозначности составляет одну из главных проблем анализа. В анализаторе системы BORIS принят подход, опирающийся на поиск в памяти необходимых подсказок для разрешения неоднозначности. Рассмотрим следующий пример из нашего рассказа:
The next day, as Richard was driving to the restaurant, he barely avoided hitting an old man on the street.
'На следующий день, когда Ричард ехал на машине в ресторан, он чуть не сбил [букв, 'с трудом избежал сбитая'] на улице старика'.
Концовка данной фразы допускает по меньшей мере две интер­претации [за счет неоднозначности слова hitting]:
(1)   Richard nearly had a fight with an old man. 'Ричард чуть не подрался со стариком'.
(2)   Richard's car nearly hit an old man. 'Машина Ричарда чуть не сбила старика'.
Неоднозначность слова hit можно разрешить двумя способами. Прочитав форму hitting, анализатор обращается к эпизодной памяти и выясняет, что К-ВОЖДЕНИЕ МАШИНЫ является в данный мо­мент текущей активной КОП. В семантической памяти системы BORIS уличное происшествие, связанное с машиной, представлено следующим образом:
(К-ТРАНСП-ПРОИСШЕСТВИЕ
тип                коп
РОЛИ                     (ВОДИТЕЛЬ-ТРАНСП ТРАНСП-ВИНОВН ЖЕРТВА)
ГЛАВ-ПОН            СОБ-СТОЛКНОВЕНИЕ
ЦЕЛИ                     (Ц-АГЕНТА-ФИЗ-ЗДОРОВЬЕ Ц-ФИЗ-ЗДОРОВЬЕ)
ЯЗ-КОНТЕКСТ       PTRANS *
В системе предусмотрена восходящая связь ВОЖДЕНИЕ-МА­ШИНЫ -> ТРАНСП-ПРОИСШЕСТВИЕ, которая соединяет К-ВОЖДЕНИЕ-МАШИНЫ и К-ТРАНСП-ПРОИСШЕСТВИЕ следу­ющим образом:
(ВОЖДЕНИЕ-МАШИНЫ -+ ТРАНСП-ПРОИСШЕСТВИЕ ТИП                                      КОП-СВЯЗЬ
В ЧЕМ                                 К-ВОЖДЕНИЕ-МАШИНЫ
КЛАСС-К-СВЯЗЕЙ              ВОСХОДЯЩИЕ
С-ЧЕМ-СОЕД                       К-ТРАНСП-ПРОИСШЕСТВИЕ
ЭКВ-РОЛИ                           [(ВОДИТЕЛЬ ~ ВОДИТЕЛЬ-ТРАНСП)
(ТРАНСП-СРЕДСТВО ~ ТРАНСП-ВИНОВН) ]) В данной записи представлено знание о том, что транспортные происшествия происходят в контексте вождения машины. Однако нет аналогичной связи, соединяющей представление о „драке" и К-ВОЖДЕНИЕ-МАШИНЫ. Поэтому анализатор и делает вывод о том, что вторая из указанных выше интерпретаций естественнее, чем первая.
* PTRANS — один из элементарных актов в теории концептуальных зависимос­тей Р. Шенка. В данной статье авторы пользуются тремя элементарными актами теории: PTRANS — 'изменять местоположение чего-либо' ('физически перемещать'), ATRANS — 'осуществлять абстрактную передачу функции обладания' ('передавать'), MTRANS — 'передавать информацию' ('ментально перемещать'). См. Шенк Р. Об­работка концептуальной информации. М., 1980.— Прим. перев.
Слово „avoided" 'избежал' также может способствовать разреше­нию неоднозначности слова „hit", так как глагол „avoid" всегда предполагает наличие после него обозначения такого действия, кото­рое является ненамеренным или нежелательным с точки зрения дея­теля. Поскольку транспортное происшествие является в нормаль­ных условиях ненамеренным и нежелательным одновременно, то анализатор выбирает именно вторую интерпретацию hit.
4. ПРИМЕНЕНИЕ ЗНАНИЙ
Процесс анализа, как мы понимаем его в настоящей работе, есть процесс применения знаний. Для понимания даже самого просто­го предложения привлекается огромный объем знаний. Эти знания должны включать — наряду с лексическими, языковыми и энцикло­педическими знаниями — содержание эпизодной памяти, построен­ное к текущему моменту анализа.
По мере чтения рассказа содержание каждого очередного пред­ложения должно быть закодировано в виде некоторого внутрен­него представления и добавлено к содержимому эпизодной памяти. Такое кодирование состоит прежде всего в порождении умозаключе­ний. Как только упоминается цель, событие или состояние, система BORIS должна вложить новую информацию в текущее представле­ние текста рассказа. Для этого необходимо вывести определенные умозаключения, соотносящие поступившую концептуальную единицу с другими единицами, уже входящими в представление рассказа. Обратимся, например, ко второму абзацу рассказа РАЗВОД-1:
К сожалению, новости не были хорошими. Жена Поля Сара настаивала на разводе. Она хотела также получить машину, дом, взять детей и добиться алиментов. Поль хотел развода, но он не хотел, чтобы к Саре перешло все имущество, которым владел и он. Его жалованье в государственной школе было очень мало.
Обрабатывая последнюю фразу, система BORIS должна сделать вывод о том, что небольшое жалованье как-то соотносится с жела­нием Поля защитить свое имущество от посягательств жены. Без такого вывода BORIS не могла бы понять релевантности этой фразы в контексте развода Поля.
Хотя при понимании текста BORIS функционирует в полностью интегральном режиме, мы все же можем охарактеризовать разные типы привлекаемых системой знаний в терминах трех общих задач, которые должны выполняться в процессе понимания текста:
(1)   применение восходящих знаний путем интерпретации собы­тий, целей и состояний, вытекающих из очередной фразы;
(2)   применение нисходящих знаний путем обследования струк-
тур знаний, которые система уже актуализировала в своей памяти; (3) применение метатекстовых знаний, касающихся законов построения любых рассказов.
4.1. Обработка в восходящем режиме
В системе BORIS восходящие правила могут быть отнесены к одному из трех классов — в зависимости от условий их применения и от характера результата, к которому они приводят. Эти три класса суть (а) формирование эпизодной памяти, (б) анализ целей планов и (в) построение схемы сценария.
4.1.1. Формирование эпизодной памяти.
Когда анализатор обрабатывает первую фразу нового рассказа
Richard had not heard from his college roommate Paul for years. 'Ричард несколько лет не имел никаких известий о Поле, своем товарище по комнате во время учебы в университете',
он по необходимости должен анализировать ее в восходящем режиме. Отправляясь от терма „товарищ по комнате" (roommate), BORIS может построить при этом структуру отношения О-ТОВАРИЩ-ПО-КОМНАТЕ. Как только будет построена эта структура, она (как структура знаний) будет порождать многочисленные стерео­типные ожидания. Эти ожидания используются, в частности, для интерпретации выражения not having heard from, которое предшест­вует слову roommate. Сочетание hear from интерпретируется здесь как факт социальной коммуникации. Отрицательная форма (had not) в соединении с указанием на длительность (for years) приво­дит к восходящему умозаключению, что данное отношение имеет приостановленный (vs. активный) статус.
Когда на вход системы BORIS поступает первое событие расска­за РАЗВОД-1:
Richard had borrowed money from Paul... 'Ричард одолжил у Поля некоторую сумму...',
система строит эпизодную структуру для эпизода одалживания. Эта структура содержит ожидания (касающиеся финансовых со­глашений), которые вытекают из КОП К-ОДАЛЖИВАНИЕ. В дан­ном случае К-ОДАЛЖИВАНИЕ активизируется глаголом borrow 'одалживать', явно присутствующим во входной фразе.
Другой, менее тривиальный случай формирования эпизодной памяти иллюстрируется следующей фразой из первого абзаца рас­сказа о разводе:
Когда из Сан-Франциско пришло письмо...
Здесь восходящее правило связано со словом письмо; это правило проверяет, является ли письмо объектом действия PTRANS. Если это так, то правило обращается к КОП „письмо", что в конечном счете приводит к построению эпизодной структуры, описывающей отправление и получение письма, ситуацию дружеского общения и т. п.
Из приведенных примеров становится ясно, что восходящие правила, связанные с событиями или конкретными словами текста, могут выступать в качестве указателей к структурам знаний, храня­щимся в семантической памяти. Правила обращения к памяти ассоциируются также с целями, состояниями и различными типа­ми тематических предикатов.
4.1.2. Обработка целей/планов.
BORIS обращается к набору правил обработки целей/планов, когда необходимо оценить поступающие понятия в рамках задачи выявления ключевых целевых ситуаций, таких, как конфликт целей и ссперничество целей. Следующая фраза взята из второго абзаца рассказа о разводе:
Поль хотел развода, но он не хотел, чтобы к Саре перешло все их имущество.
Во втором сочиненном предложении мы обнаруживаем своего рода ,,не-цель". Приводимое ниже восходящее правило интерпрети­рует эту не-цель:
Если лицо Л1 имеет цель (Ц), которая предполагает некоторое ДЕЙСТВИЕ лица Л2,
То имеет место СОПЕРНИЧЕСТВО между Л1 и Л2 относи­тельно той ЦЕЛИ, которая должна быть достигнута посредст­вом данного ДЕР1СТВИЯ-
Применение этого правила позволяет системе интерпретировать состояние, выраженное в последнем примере, как частный случай соперничества целей. Это соперничество согласуется и с ожиданием, вытекающим из активизированной структуры знаний о разводе.
Другое правило обработки целей/планов можно проиллюстри­ровать с помощью следующего примера „не-события" из первого абзаца рассказа о разводе:
Ричард одолжил у Поля некоторую сумму денег, которая не была возвращена. Теперь же он совершенно не представлял себе, где найти своего старого друга.
Вторая фраза иллюстрирует то, каким образом не-событие может быть использовано для порождения ожидания того, что некоторый план не осуществится (S с h a n k, A b el s о n, 1977). Следующее
правило показывает, как не-события нередко соотносятся с неосу­ществленными целями:
Если о событии С сообщается, что оно не имеет места,
И существует активная цель Ц, которая предполагает осу­ществление события С,
То сформировать применительно к событию С ожидание неосу­ществления необходимой предпосылки. Если это неосущест­вление обнаруживается, то пометить цель (Ц) как блокиро­ванную именно отсутствием этой необходимой предпосылки.
Использование этого правила позволяет системе понять, что тот факт, что Ричард не вернул долг Полю, объясняется невоз­можностью (для него) найти Поля. Более того, в ходе приме­нения этого правила необходимая предпосылка осуществления плана помечается с помощью акта ATRANS (то есть перехода иму­щества), который задает предварительное условие, необходимое для совершения ATRANS.
Демоны целей/планов контролируют существование и статус целей и планов, заключенных в каждой структуре знаний. На­пример, в КОП развода входят ожидания относительно желания партиципантов сохранить за собой семейное имущество, посколь­ку это, как правило, весьма существенный аспект разводов.
4.1.3. Построение схемы сценария.
Схема сценария (Dyer, 1980; Dyer, 1982) представляет собой ориентированную во времени и пространстве структуру доступа к эпи­зодной памяти. Она состоит из списка упорядоченных во времени и взаимосвязанных сценарных дескрипторов. Каждым таким дес­криптором закодированы действующие лица, а также события, про­исходящие в заданной конкретной обстановке.
Построение схемы сценария предполагает слежение (monitoring) за персонажами по мере их пространственных перемещений в рас­сказе. В ходе такого слежения иногда могут быть полезны не­которые очень простые восходящие правила. Пусть, например, ана­лизируется следующий отрывок:
Пит сидел, наслаждаясь новой книгой, и вдруг он вспомнил, что должен был забрать детей из школы. Он быстро выбежал из парка.
Обратим внимание на то, что ситуационный контекст, порождае­мый первым предложением, не сообщает о том, где находится Пит во время чтения книги. Более того, по умолчанию можно вывести заключение, что он находится дома. Однако во втором предложении указывается, что он читал в парке. Анализатор BORIS представит эту фразу приблизительно следующим образом:
(PTRANS         АГЕНТ Пит
ОБЪЕКТ Пит
ОТКУДА-парк-
КУДА-школа-
Предикат концептуальных зависимостей PTRANS выступает как указатель, позволяющий обратиться к множеству правил сцени­ческих переходов. Одно из таких правил реагирует на незаполнен­ность слота ОТКУДА; с помощью этого правила система будет пытаться установить пространственную локализацию текущей сцены. Это правило описывается следующим образом:
Если слот ОБЪЕКТ заполнен именем какого-то персонажа рас­сказа, И слот ОТКУДА задает некоторую локализацию, И эта локализация не содержится в заданной ранее локализа­ции сцены, То эта локализация совпадает с локализацией предшествующей сцены.
Есть и другие аналогичные правила для установления локализа­ции последующей сцены в схеме сценария. Эти правила опираются на сведения о локализации, явно указанные в тексте рассказа. Следовательно, им отдается предпочтение по сравнению с любыми теоретическими рассуждениями относительно возможной локализа­ции текущей или последующей сцены.
Другие восходящие сценарные правила столь же просты. Эти правила отслеживают такие события, как появление в сцене новых персонажей, уход персонажей из сцены и эпизоды, происходящие в ходе перемещения персонажей из одной сцены в другую. Каждое сценарное правило, работающее в восходящем режиме, помечается предикатом концептуальной единицы, порождаемой анализатором.
Некоторые КОП расчленяются на сцены. Например, К-ПИСЬМО расчленяется на сцену отправления письма и сцену получения письма. Эта информация используется при построении схемы сценария для установления перехода от одной сцены к другой. Существуют и устанавливаемые по умолчанию локализации, ассо­циируемые с определенными КОП'. Например, получение письма имеет место либо в доме, либо на работе того лица, которому пись­мо адресовано.
Схема сценария дает полезные намеки для вывода существен­ных умозаключений. Вспомним пример:
Когда Поль вошел в спальню и обнаружил там Сару с другим мужчиной...
Прежде всего, когда анализатор читает сообщение о факте со-
циальной близости двух персонажей в некоторой сцене, он пы­тается выяснить, можно ли связать с ними некоторый вид де­ятельности. Один из способов такого выяснения состоит в изуче­нии обстановки, как в следующих примерах:
(1)   Билл видел Джона с Мэри в театре.
(2)   Билл видел Джона с Мэри в ресторане.
В (1) предполагается, что Джон и Мэри смотрели спектакль, а во (2) — что Джон и Мэри ели в ресторане. Следуя аналогичной стратегии, анализатор замечает, что текущая сцена происходит в СПАЛЬНЕ. Существует несколько видов деятельности, связыва­емых со СПАЛЬНЕЙ: сон, переодевание и секс. Из них только секс является видом совместной деятельности. Поэтому BORIS и делает умозаключение о том, что Сара и упомянутый мужчина занимались сексом.
4.2. Нисходящие знания
Эпизод состоит из набора частично актуализированных взаимо­связанных структур знаний. Каждая из этих структур знаний привносит свою собственную интерпретацию событий, происходящих в рамках данного эпизода, а также набор ожиданий, относящийся к этому событию. Рассмотрим, например, эпизод в ресторане в нашем рассказе.
Существует целый ряд ожиданий, связываемых с КОП „ресто­ран". К клиентам должна подойти официантка, для того чтобы их обслуживать. Клиенты скорее всего будут делать заказ, глядя в меню, и т. д. Есть и ожидания, связываемые с КОП „адвокат" (правовая консультация). В соответствующей ситуации Ричард и Поль будут скорее всего обсуждать бракоразводное дело. Есть ожидания, связываемые с КОП „прием пищи". Как правило, люди едят, потому что они голодны. Есть ожидания, связываемые с дружескими отношениями людей и их совместным времяпровожде­нием (это отражает особая МЕТА-КОП). В такой ситуации они будут скорее всего проявлять бурную радость по поводу встречи друг с другом.
Все такие ожидания кодируются в декларативной форме в семантической памяти системы BORIS. Для использования нисхо­дящих знаний демоны должны обследовать ту часть содержания памяти, которая к данному моменту уже актуализирована. Рас­смотрим фрагмент из четвертого абзаца рассказа РАЗВОД-1:
Когда принесли еду...
В данном случае конфигурация К-РЕСТОРАН уже была активи­зирована демонами, отвечавшими за построение схемы сценария
и осуществлявшими интерпретацию фраз „ехал на машине в ресто­ран" и „в ресторане выпил три рюмки спиртного". Когда в сис­тему поступает фраза „принесли еду", то в эпизодной памяти ищется такая активизированная КОП, которая содержит роль с признаком ЕДА. Поскольку конфигурация К-РЕСТОРАН удовлет­воряет этому условию, она проверяется на согласование с образ­цом (PTRANS ОБЪЕКТ (ЕДА)). После того как обнаружива­ется согласование этого образца с событием ПРИНОСИТЬ-ЕДУ в рамках конфигурации К-РЕСТОРАН, система осуществляет модер­низацию этой КОП. Этот процесс опирается на программу подбо­ра образцов, вызываемую демонами событий; ее действие анало­гично применению сценариев (scripts)* (С и 1 1 i n g f о г d, 1981).
КОП и МЕТА-КОП связываются друг с другом в семанти­ческой памяти посредством КОП-связей. Каждой КОП-связи при­писано условие активизации. Это условие предписывает те обсто­ятельства, при которых соединяемые КОП релевантны для данного эпизода. Например, условием активизации внесения МК-ПРАВО-ВОЙ-СПОР в эпизод развода является наличие конфликта целей между мужем и женой. Когда для формирования эпизода развода был использован К-РАЗВОД, было одновременно сформировано ожидание для проверки этого эпизода на наличие конфликта целей. Далее, во втором абзаце описывается конфликт целей, тем самым ожидание срабатывает, и в данный эпизод вносится МК-ПРАВОВОЙ-СПОР.
4.3. Метатекстовые знания о строении рассказов
Система BORIS способна использовать знания о том, как люди организуют текст рассказа. Эта способность нынешней версии систе­мы проявляется двумя способами — через идентификацию главного персонажа и через установление локальных контекстов.
4.3.1. Идентификация главного персонажа.
В абзаце рассказа нередко отражается точка зрения одно­го из персонажей, и повествование ориентируется на его цели и действия. BORIS пытается в каждом абзаце идентифицировать главного персонажа и вывести ожидания на основе его отношений с другими персонажами в рассказе (Reiser, 1981).
Главный персонаж в абзаце обычно идентифицируется анализа­тором в соответствии с несколькими эвристиками. Например, главный персонаж может быть задан в составе доминирующей концептуаль­ной единицы, которая репрезентирует содержание первого предложе­ния абзаца. Личность главного персонажа может быть также раскрыта в перспективе взаимоотношений, описываемых в рассказе. Так, сочетание жена Поля Сара во втором абзаце свидетельствует о том, что главным персонажем этого абзаца является Поль.
Главный персонаж часто инициирует эпизоды в абзаце. Напри­мер, поскольку Ричард инициирует эпизод езды на машине и эпизод встречи в ресторане в четвертом абзаце, то BORIS понимает, что именно Ричард и является главным персонажем этого абзаца.
Выявление главного персонажа служит для организации меж­личностных тематических ожиданий. Например, мы можем ожидать в рассказе периодических встреч двух друзей.
Когда идентифицирован главный персонаж абзаца, на передний план выходят его взаимоотношения с другими персонажами рас­сказа. Таким образом, события в рассказе осмысляются в терминах тематических интересов главного персонажа в каждом абзаце.
4.3.2. Локальные контексты.
В ходе повествования автор обычно делает какие-то ком­ментарии по тексту или дает какие-то сведения об обстановке. Он может раскрыть мысли одного из персонажей или дать неко­торую фоновую информацию об отношениях между двумя персона­жами.
Во втором абзаце рассказа о разводе автор описывает со­держание письма Поля Ричарду, что само по себе уже представ­ляет отдельный вставленный рассказ. Читатель должен понять, что содержание второго абзаца должно быть объединено в единый мысленный объект эпизода с письмом, инициированного в первом абзаце. Аналогичная проблема встает при понимании телефонного разговора, переданного по телефону сообщения и т. п.
Система BORIS справляется с обработкой подобных ситуаций благодаря переходу на режим работы в локальном контексте. В этом режиме все создаваемые эпизоды объединяются вместе в объемлю­щий ментальный блок (unit). В дальнейшем система может ссы­латься на этот блок как на единое целое. В эпизоде с письмом, например, такой блок заполняет объектный слот понятия MTRANS.
В рассказе РАЗВОД-1 BORIS обращается к режиму работы в локальном контексте тогда, когда первое предложение второго абзаца упоминает некоторый информационный объект (то есть „новости"). Рассмотрим эту фразу:
К сожалению, новости не были хорошими.
* Заметим, что русскому термину сценарий соответствуют по крайней мере два английских: „scenario" и „script". Первый из них скорее несет идею последовательности сцен, а второй — представление о тексте, описывающем развертывание действия.— Прим. ред.
Если бы этой фразе не предшествовал первый абзац, у чи­тателя были бы несомненные трудности с интерпретацией ее на­чала. Вводное слово к сожалению требует предшествующего кон­текста, с которым можно было бы соотнести событие, вызываю­щее сожаление. Более того, читатель вполне мог бы сделать вывод, что новости, о которых идет речь, взяты из выпуска последних известий по телевидению или радио. Однако в случае нашего рас­сказа читатель автоматически делает вывод, что „новости" отно­сятся к содержанию письма. Каким образом делает это умозаклю­чение BORIS?
Когда система BORIS читает о прибытии письма, она форми­рует КОП К-ПИСЬМО, где следующим ожидаемым событием явля­ется знакомство с содержанием письма. Когда BORIS читает слово новости, это интерпретируется как ИНФОРМАЦИЯ, и порождается особый демон, который должен проверить, подходит ли данный объект для заполнения некоторой роли в текущей активизированной КОП. Если проверка дает положительный ответ, то это служит сигналом о начале работы в локальном контексте.
Важность распознавания локальных контекстов становится оче­видной, когда BORIS выводит умозаключение о том, что Ричард является адвокатом. Если мы внимательно проанализируем рассказ, мы увидим, что об этом нигде явно не сообщается. В тексте го­ворится следующее:
Он надеялся на содействие единственного знакомого ему адво­ката.
Для вывода соответствующего умозаключения BORIS использует следующее правило:
Если лицо Л1 совершает акт MTRANS по отношению к лицу Л2, сообщая, что Л1 имеет ЦЕЛЬ, требующую АГЕНТа, И АГЕНТ явным образом не упоминается, То Л2 является таким вероятным АГЕНТом.
Для применения этого правила BORIS должна понять, что просьба о содействии неявно передается (посредством MTRANS) Ричарду, поскольку именно Ричард входит в локальный контекст чтения письма Поля. Именно локальный контекст дает это понима­ние.
5.1. Анализ языковых выражений во время выработки ответа на вопрос (в противоположность анализу текста во время пони­мания рассказа)
Для обработки предложений в рассказе и вопросов по тексту рассказа BORIS использует один и тот же анализатор. Поскольку процесс анализа объединен с процессами формирования и обра­ботки содержания памяти, то выработка ответа на вопрос протекает в основном точно так же, как обработка предложения в ходе понимания рассказа. Однако существуют три ситуации, при которых „режим" понимания (то есть понимание текста рассказа vs. выра­ботки ответа на вопросы) влияет на действия анализатора.
5.1.1.  Обращение с новыми объектами (tokenizatlon).
Если анализатор встречает обозначение некоторого элементарно­го объекта, некоторой конкретной обстановки или персонажа, он обращается к памяти для выяснения того, имеется ли уже со­ответствующий знак в эпизодной памяти. При работе в режиме понимания текста неудача при поиске референта приводит к созда­нию в памяти нового знака. Однако в процессе выработки ответа на вопрос неудача при поиске референта в памяти приводит к отказу от попытки построить какой-либо ответ. Вместо этого порож­дается „жалоба", указывающая на то, что референт не найден. Например:
В.: Чем Бенджамин зарабатывал себе на жизнь?
О.: Я не помню никакого упоминания о персонаже по имени Бенджамин.
5.1.2.  Проверка пресуппозиций.
В процессе выработки ответа на вопрос анализатор сравнивает заполнение ролевых слотов, предполагаемое в вопросе, с действи­тельным заполнением их в эпизодной памяти. В процессе понимания текста рассказа при нарушении соответствия ролевых слотов выра­батывается сигнал о том, что должна быть построена другая актуа­лизированная структура. Например, если бы в нашем рассказе было упомянуто письмо от Сары, это вынудило бы систему построить новую конфигурацию типа К-ПИСЬМО, отличную от конфигурации, связанной с письмом от Поля. Однако в процессе выработки ответа на вопрос отрицательный результат сопоставления ролей указывает на ложность пресуппозиции. Поэтому BORIS отвергает соответству­ющий вопрос и исправляет ложную пресуппозицию. Например:
В.: Почему Сара написала письмо Ричарду? О.: Ричарду написал письмо Поль, а не Сара.
5. ВЫРАБОТКА ОТВЕТОВ НА ВОПРОСЫ
К настоящему времени в литературе описано множество эвристик, полезных при выработке ответов на вопросы по текстам (Dyer, L e h n e r t, 1980; L e h n e r t, 1978). Мы коснемся тех аспектов отве­тов на вопросы, которые специфичны именно для системы BORIS.
5.1.3. Вопросительные слова.
Слова типа кто, который, что, почему, где и т. п. обрабатываются особым образом. Если такое слово входит в вопрос, оно рассматри­вается как сигнал информационного запроса. В ходе же понимания текста рассказа такие слова обрабатываются специальными демона­ми и рассматриваются как указатели начала придаточного предло­жения. Если в процессе обработки рассказа встречается вопрос, то он трактуется как риторический вопрос и ответить на него никакой попытки не делается.
возврат денег. Он сразу же поймет это выражение как обозна­чение акта мести.
Неоднозначность выражения pay back не может быть разрешена с помощью синтаксических или семантических знаний (в том числе общих знаний о мире). Мы должны знать, о чем именно говорилось в рассказе. Таким образом, в результате анализа выражения pay back в данном эпизодном контексте строится такое представление вопроса, которое ссылается на некоторое событие, уже содержащееся в эпи­зодной памяти. Следовательно, к тому времени, когда будет понят вопрос, будет произведен поиск в эпизодной памяти. Именно это и обеспечивает быстрый выбор правильного ответа. Нередко ответ на вопрос становится известным системе BORIS еще до завершения полного анализа вопроса (см. Dyer, 1981c).
Поиск в эпизодной памяти особенно полезен тогда, когда вопросы носят нечеткий характер. Например, вопрос „Устанавливал ли Поль контакт с Ричардом, находясь в Сан-Франциско?" носит менее конкретный характер, чем вопрос „Написал ли Поль Ричарду из Сан-Франциско?". В подобных случаях эпизоды ищутся через посредство МЕТА-КОП. Если систему спросить:
В.: Помог ли Поль Ричарду?,
она будет искать в эпизодной памяти МЕТА-КОП, которая связа­на с оказанием содействия. И как только в качестве вероятного референта будет найдено МК-СОДЕЙСТВИЕ, будет получен доступ к тому конкретному событию, которое связано с этим абстрактным событием:
О.: Да, Поль одолжил Ричарду деньги.
5.2. Использование памяти для понимания вопроса
Для системы BORIS понять вопрос — значит найти в эпи-зодной памяти референт, соответствующий концептуальному со­держанию вопроса. Одно из следствий этого подхода состоит в том, что обследование эпизодной памяти производится не только в процессе непосредственной выработки ответа на вопрос, но и в ходе самого процесса понимания вопроса. В отличие от много­численных систем поиска информации в базе данных, которые в качестве механизатора-посредника при обращении к поисковой системе используют изолированный анализатор, система BORIS обследует память, содержащую информацию о рассказе, в процессе самого понимания вопроса. Например, если спросить читателя наше­го рассказа
Q.: Why did Richard not pay Paul back? 'В.: Почему Ричард не вернул долг Полю?',
то он, конечно, даже и не подумает о том, что выражение pay back можно здесь отнести к чему-либо другому, кроме как к акту возврата взятых в долг денег, поскольку, когда читатель анализирует вопрос, он все время держит в уме содержание рассказа. Представим себе теперь, что в рассказе говорится следующее:
Ричард состоял в любовной связи с женой Поля, и Поль узнал об этом. Поль поклялся, что он убьет Ричарда за разрушение его семьи. Поль взял дробовик и пошел к Ричарду, но полицейские арестовали Поля, решив, что у него нервное расстройство. Когда полиция увозила Поля, он поклялся, что накажет Ричарда, даже если это будет его последним делом.
Теперь если читателя спросить:
Q.: Why did Paul not pay Richard back? 'В.: Почему Поль не отплатил Ричарду?',—
то он и не заметит, что выражение pay back может означать
5.3. Поиск ответа в ходе анализа вопроса
Поскольку в ходе анализа вопроса BORIS производит поиск в эпизодной памяти, то часто бывает так, что BORIS выбирает ответ еще до завершения процесса анализа. Рассмотрим следующий вопрос:
В.: Кто случайно пролил кофе на Поля в ресторане?
Большинство опрошенных читателей рассказа утверждали, что они подумали о Ричарде не позднее, чем дошли до слова кофе. Когда система BORIS встречает в данном вопросе упоминание о событии „пролил", она обращается к эпизодной памяти и находит его. Сразу после этого срабатывает демон, ассоциируемый со словом кто, и вызывает соответствующий узел из этого эпизода. Другие узлы также проверяются на согласование с содержанием эпизодной памяти; система делает это на всякий случай, чтобы убедиться
в том, что пресуппозиции вопроса не противоречат содержимому эпизодной памяти. Как видим, система „узнает" ответ (на вопрос „кто?") еще до полного прочтения всего вопроса.
Однако такое быстрое отыскание ответа достигается отнюдь не всегда. Вопросы о причине события (например, со словом почему) часто требуют дополнительного поиска связей, касающихся намере­ний персонажей (Dyer, L e h n е г t, 1980; Dyer, 1982), и уже после этого может быть найдено концептуальное представление отве­та. С другой стороны, в случае вопросов, связанных с выяснением справедливости тех или иных фактов (L e h n e r t, 1978), отыскание ответа предполагает обследование эпизодной памяти для подтверж­дения (или отрицания) события, упоминаемого в вопросе. Поскольку же BORIS все равно обследует эпизодную память в ходе анализа вопроса, то система узнает ответ на вопрос именно в тот момент, когда достигнуто полное понимание вопроса. Это объясняется тем, что процесс понимания вопроса для BORIS включает обнаружение его референта в памяти.
5.4. Поиск с восстановлением
BORIS актуализирует только фрагменты КОП, так как процедуры поиска, осуществляемые во время отыскания ответа, могут восста­навливать события по фрагментам КОП. Если систему спросить:
В.: Написал ли Поль Ричарду?,
она начнет искать в эпизодной памяти К-ПИСЬМО. Поскольку же в рассказе не говорилось о написании письма, в эпизодной памяти такое событие актуализировать не удается. Однако событие, состоя­щее в написании письма, может быть выведено. BORIS знает, что Ричард не мог бы получить письмо от Поля, если бы Поль не написал письма. В данный момент поиска событие, состоящее в напи­сании Полем письма, считается найденным и актуализируется. Если данный вопрос будет задан еще раз, эта актуализированная струк­тура будет просто найдена (а не выведена). Это означает, что отыскание ответа на данный вопрос во второй раз потребует мень­шего времени поиска. Таким образом, в процессе отыскания ответов на вопросы может модифицироваться содержание эпизодной памяти. А это позволяет повысить эффективность вызова данных, поскольку BORIS актуализирует только то, что используется для отыскания ответов.
6. СИНТЕЗ* АНГЛИЙСКИХ ФРАЗ В СИСТЕМЕ BORIS
Генератор системы BORIS (BORGEN) представляет собой адап­тированную версию системы GEN, разработанной Родом МакГиром в Йейле (М с G u i r е, 1980). В настоящее время BORGEN исполь­зуется для синтеза ответов на английском языке на основе концеп­туальных представлений, выдаваемых системой BORIS в процессе получения ответов на вопросы.
6.1. Основания процедуры синтеза
Синтез осуществляется путем обработки элементов „потока со­ставляющих" („phrase stream") (М с G u i r e, 1980), то есть списка единиц (компонентов предложения), подлежащих выражению. Гене­ратор работает в циклическом режиме, обрабатывая эти элементы до тех пор, пока не будет исчерпан имеющийся фразовый поток. Элементы потока составляющих содержат команды для генератора и обеспечивают доступ к другим командам (хранящимся в виде дан­ных), которые в конечном итоге приводят к синтезу слов. Как эти элементы вырабатываются и используются, будет объяснено ниже, а сейчас важно уяснить, что они должны обеспечивать доступ к памяти. Существенной стороной генератора системы BORIS являет­ся способ организации лексической памяти. Эта организация осно­вывается на иерархии лексических прототипов, разработанной в сис­теме GEN МакГира; для применения в системе BORIS эта иерархия была несколько модифицирована и расширена.
6.1.1. Иерархия прототипов.
Иерархия прототипов — это система, служащая для классифи­кации информации, необходимой для синтеза, в соответствии с иерархией лексических „прототипов", с помощью которой генератор выбирает способ языкового выражения того или иного понятия. Иерархия имеет древесную структуру: элемент высшего уровня мо­жет иметь много подчиненных элементов.
В системе BORIS информация, необходимая для синтеза, при­писана в иерархии прототипов «шаблонам, инициирующим актуали­зацию конкретных знаний. Поскольку для выражения концептуаль­ной единицы генератор должен располагать лексической информа­цией, он должен для получения этой информации обращаться к иерархии прототипов. Шаблоны системы BORIS (для КОП, Целей, Переживаний и т. п.) нередко уже содержат часть информации,
* Здесь термин „generation" переводится как 'синтез'. См. вступительную статью, с. 25. Однако термин „generator" передается как генератор, поскольку синтезато­ром принято называть лишь системы, синтезирующие звучащую речь. В общем смысле обычно говорят о системе синтеза.Прим. ред.
необходимой для синтеза, однако обычно генератор должен осущест­влять поиск некоторой части информации и в вышележащих узлах дерева.
Иерархия прототипов предназначена для сведения информации о сходных формах выражения в одну единицу памяти. Если неко­торое представление (типа Концептуальных Зависимостей) содержит характеристику, которая отвечает задаче синтеза, то база данных, используемая генератором, должна лишь накапливать такую инфор­мацию в одном и том же месте. Таким образом, более общая инфор­мация хранится в стволе иерархического дерева, а более специфи­ческая — в его ветвях.
Большинство понятий имеет лексические прототипы, и процесс просмотра различных уровней иерархии снизу вверх в конечном счете приводит к лексической сущности Ц—С (соответствующей „цели/состоянию" в системе GEN). Ц—С является „сиротой" в том смысле, что она не имеет узла-прототипа (родителя).
В этом множестве прототипов хранится информация о способах выражения понятий. Эта информация может быть весьма простой и сводиться к указанию конкретного слова или глагольной информа­ции, отсылающей к таблице форм конкретного глагола. Используют­ся и более сложные данные, например указания о порядке выраже­ния тех или иных понятий, о путях обхода дерева для проверки нужности выражения понятия и об альтернативных способах выра­жения понятия в случае неудачного поиска на том или ином пути.
Генератор обследует иерархию прототипов таким образом: для обнаружения какой-либо единицы информации, необходимой для синтеза, он проверяет, содержит ли эту информацию входная концеп­туальная структура. Если да, то никакого дальнейшего поиска не требуется. В противном случае ищется лексический прототип. Если нет лексического прототипа, то предполагается, что текущая единица подлежит выражению в ее исходном виде. Если есть лексический прототип, но он не содержит подходящей информации, то проверяет­ся следующий прототип (прототип прототипа), и т.д.
6.1.2 Процесс синтеза.
Основным динамическим компонентом генератора является „фра­зовый поток составляющих" (М с G u i r е, 1980), который организует процесс выражения различных частей текущей концептуальной еди­ницы и следит за тем, когда именно должны выполняться те или иные действия. Эти действия представляют собой указатели к ЛИСП-коду, которые в конечном счете синтезируют «лексические единицы», или слова.
Функционирование генератора состоит из последовательных опе­раций развертывания выражений, расположенных слева в потоке
составляющих. Это развертывание обычно требует обследования иерархии прототипов. Если некоторый элемент потока составляющих не может быть развернут, то он считается словом, удаляется из потока составляющих и помещается во временное запоминающее устройство. Данный цикл затем повторяется для нового состояния потока составляющих. Синтез заканчивается, когда выполнены все развертывания и поток составляющих пуст. Последняя задача гене­ратора — печать слов.
Структура потока составляющих обычно обусловливает такой режим синтеза, который сходен с обходом синтаксического дерева, направленным слева направо и в глубину. Однако синтаксические конструкции определяются исключительно на основе концептуаль­ного содержания, а выбор слов и синтаксических групп (phrases) контролируется также диалоговым контекстом.
Именно иерархия прототипов определяет реальный порядок рас­положения подлежащего, сказуемого, дополнения и других членов предложения. Сначала поток составляющих содержит только один элемент, помещенный туда в начале прогона генератора; этот эле­мент развертывается в правильную цепочку выражений в соответ­ствии со структурой концептуальной единицы, подлежащей выраже­нию на естественном языке. Исходный элемент потока составляю­щих служит сигналом для поиска в дереве прототипов того спо­соба выражения, который удовлетворителен с контекстуальной, кон­цептуальной и лексической точек зрения. Этот исходный элемент развертывается в серию элементов, организующих искомое выраже­ние. На каждой стадии развертывания могут учитываться контексту­альные и семантические факторы.
Иерархию прототипов можно рассматривать как различительную сеть для выражения разных концептуальных единиц. Весь процесс выражения контролируется системой лексических прототипов, а по­ток составляющих полностью подчинен этой базе данных. Начальный элемент потока составляющих служит указателем (pointer) к тому разделу ЛИСП-кода, который находит структуру составляющих для понятия, подлежащего выражению. Это осуществляется путем отыс­кания наиболее конкретного лексического прототипа, содержащего информацию о структуре составляющих (то есть путем обследования дерева прототипов до обнаружения такого прототипа).
Многие концептуальные единицы требуют одной и той же струк­туры составляющих. Для таких понятий нужная информация хра­нится в общем лексическом прототипе. Для случаев, когда к работе генератора предъявляются особые требования, в нижних ярусах де­рева прототипов хранится соответствующий особый код.
На рис. 7 приводится пример использования потока состав­ляющих и иерархии прототипов для синтеза английского выраже­ния из концептуальной единицы PTRANS. На этом рисунке СОБ-ПЕ-
РЕДАЧА относится к событию, состоящему в передаче письма почтальоном адресату. Эта информация представляется посредством концептуальных зависимостей следующим образом:
(PTRANS         АГЕНТ почтальон
ОБЪЕКТ письмо ОТКУДА почтальон КУДА читатель) СОБ-ПЕРЕДАЧА 0 — это узел в памяти BORIS, построенный для представления конкретного события, состоящего в получении письма от Поля в абзаце 1 рассказа о разводе. Когда генератор BORIS начинает строить выражение для СОБ-ПЕРЕДАЧА, он не находит в актуализированном узле никакой информации, необходи-
ная концептуальная единица в результате выражается так:
RICHARD GOT A LETTER FROM PAUL. 'Ричард получил письмо от Поля'.
6.2. Текущие исследования процесса синтеза
Синтез часто рассматривается как последний этап после пони­мания вопроса и формирования ответа. Важно, однако, помнить о том, что всякий анализируемый нами текст кем-то был синтези­рован. Такой взгляд на синтез помогает выявить истинную роль синтеза — мы синтезируем, чтобы быть понятыми.
6.2.1. Интегральный синтез.
В естественноязыковой компьютерной системе с широкой ориентацией мы обнаруживаем задачи, которые предполагают вы­полнение сходных операций на разных уровнях. С точки зрения программирования анализ текста рассказа и анализ вопроса осу­ществляются в системе BORIS одной и той же функцией, действую­щей в несколько отличающихся друг от друга режимах. Разумно предположить, что люди обладают единым механизмом понимания языка, который они применяют ко всем частным задачам, связанным с пониманием. Аналогичным образом разумно предположить, что все задачи, связанные с выражением информации на естественном языке, основываются на единой функции генератора.
Генераторы можно характеризовать в соответствии с тем, какая часть ответственности за выбор нужной формы выражения возла­гается на них в сопоставлении с другими компонентами системы. Например, GEN имеет дело только с выражением полных концептуа­лизации, построенных другими компонентами системы. С этой точки зрения GEN аналогичен преобразователю: концептуальное содержа­ние выражения уже полностью определено до начала процесса синтеза.
В отличие от этой системы BORGEN часто получает на входе просто указатель к эпизодной памяти и данные о вопросно-ответном диалоге, на основе которых он должен определить наилучший способ выражения того или иного узла памяти. Например, если дан указа­тель к ситуационной обстановке РЕСТОРАН 0, то, прежде чем фор­мировать ответ, генератор должен оценить состояние знаний спра­шивающего.
А1: «Ресторан.» А2: «В ресторане.» A3: «В ресторан.»
Если задается такой вопрос:
В.: Куда ехал Ричард, когда он едва не сбил старика?,
Рис. 7. Пример иерархической структуры и маршрут поиска информации для синтеза.
мой для синтеза, и поэтому осуществляет переход по связи, веду­щей к прототипу — шаблону СОБ-ПЕРЕДАЧА,— который в свою очередь является узлом в КОП „письмо". Узел с этим шаблоном содержит две единицы информации: (1) указание об использовании глагола to get и (2) указание о том, что подлежащее будущего предложения будет найдено в слоте'КУДА соответствующего кон­цептуального представления. Далее, лексическим прототипом для СОБ-ПЕРЕДАЧА является акт PTRANS, который снабжен особой информацией о выражении дополнения. Наконец, к PTRANS идет прототипная связь, приводящая в конечном счете к узлу Ц—С; информация этого последнего подавляется информацией в подчи­ненных узлах. Ц—С также организует структуру предложения неко­торым стандартным образом. На основе информации о ролевом заполнении ролей, содержащейся в актуализированном узле, исход-
то в качестве приемлемого ответа следует выбрать A3, но не А1 или А2.
В настоящее время в нашей системе синтез остается един­ственной задачей, которая решается посредством отдельного модуля. Мы полагаем, что такое разделение весьма искусственно, так как люди, отвечая на вопрос, часто начинают синтезировать ответы еще до их полной конкретизации. Подлинно интегральный генера­тор сможет наделить BORIS способностью синтезировать „интро­спективные протоколы" процессов, осуществляемые системой в ходе поиска ответа. В этом случае, правда, мы сталкиваемся с такой трудной задачей, как синтез приемлемых переходных выражений, обеспечивающих „гладкость" промежуточных выходных сообщений. Но и это говорит в пользу объединения процессов синтеза с другими процессами, обеспечивающими вывод умозаключений в памяти, поиск информации и понимание естественноязыковых выражений.
6.2.2.  Построение резюме текста.
В системе BORIS выделяются две задачи синтеза. Основной областью применения синтеза является построение ответов на воп­росы, но BORGEN применяется также в области построения резюме и перифазирования. Процесс построения резюме основывается на системе сюжетных блоков Ленерта (L e h n е г t, 1982), которая орга­низует память в соответствии с определенными абстрактными сущ­ностями (положительными актами, отрицательными актами и мен­тальными состояниями). Сюжетные блоки представляют собой спе­цифические конфигурации этих сущностей, характеризующиеся дос­таточной различимостью и играющие достаточно важную роль для того, чтобы трактовать их как автономные единицы. Как только программа сформирует память на основе сюжетных блоков, они могут анализироваться с целью формирования резюме рассказа.
6.2.3.  Элементарные единицы диалога.
Проводятся также исследования, направленные на расширение существующего набора „элементарных единиц диалога", используе­мых в системе BORIS. В процессе синтеза ответа элементарные единицы диалога могут учитывать не только конкретное содержание ответа участника диалога, но и его общие намерения. Например, предикат НЕСОГЛАСИЕ представляет побуждения участника диа­лога к выражению несогласия как в отношении фактов, так и в отно­шении их интерпретации. Таким элементарным единицам сопоставле­ны генерационные фреймы. Так, элементарной единице диалога НЕСОГЛАСИЕ сопоставлен следующий фрейм:
„BUT IT WAS (person)WHO (role), NOT (other person)..."
152
'НО ВЕДЬ ЭТО БЫЛ (лицо) КТО (роль), А НЕ (другое лицо)...'
6.2.4. Синтез тем.
В настоящее время в BORGEN используются в основном КОП и элементарные единицы концептуальных зависимостей. АТБ при­меняются только при синтезе ответов на вопросы, касающиеся пе­реживания. Однако АТБ содержат также информацию, относящуюся к синтезу тем, которые часто выражаются в пословицах и „изрече­ниях". В будущих исследованиях мы постараемся научить BORIS синтезировать пословицы из АТБ. Например, в ответ на вопрос: „What is a moral of this story?" 'Какова мораль этого рассказа?', если в основу ответа будет положен АТБ-НЕЯВНАЯ-УДАЧА, сис­тема сможет выдать следующее изречение: „Every cloud has a silver lining", букв. 'Каждое облако имеет светлый ореол' [ж Нет худа без добра].
7. ХАРАКТЕРИСТИКА ВЕДУЩИХСЯ ИССЛЕДОВАНИЙ И ОБЩИЕ ВЫВОДЫ
Следующий этап в нашей исследовательской работе включа­ет испытание системы BORIS на разных вариациях рассказа РАЗ­ВОД-1, что необходимо как для повышения надежности системы, так и для выяснения того, какие модификации нужно внести в структуры представлений и механизмы обработки.
7.1 Расширение общности системы
Довольно трудно составить и испытать большое число повество­вательных вариаций рассказа, если такие вариации сопоставимы по сложности с текстом РАЗВОД-1. В итоге мы решили предло­жить системе BORIS следующий рассказ, который система должна обрабатывать совершенно по-другому, используя при этом те же са­мые структуры знаний, что и при обработке текста РАЗВОД-1. Приводим этот новый рассказ.
РАЗВОД-2
Джордж завтракал со своим коллегой-учителем и проверял домашние работы учеников, когда официантка случайно опрокинула на него стакан кока-колы. Джордж страшно рассердился и ушел, отказавшись платить по счету. Он решил поехать на машине домой, чтобы снять мокрую одежду.
Когда он приехал домой, он застал свою жену Энн в постели с мужчиной. Джордж был ошарашен, ему захотелось уйти из дому и напиться вдрызг.
В баре он столкнулся со своим старым приятелем Дэвидом, товарищем по ком­нате во время учебы в университете, которого он не видел несколько лет. Дэвид пред­ложил Джорджу выпить вместе с ним, и скоро они оба были совершенно пьяны.
Когда Джордж узнал, что Дэвид адвокат, он рассказал ему обо всех своих го­рестях и попросил Дэвида представлять его интересы в суде. Поскольку Дэвид одол­жил когда-то у Джорджа денежную сумму и не возвратил долга, он чувствовал себя обязанным помочь Джорджу выбраться из затруднительного положения.
Некоторое время спустя Дэвид написал Энн о том, что Джордж хочет развода. Ее адвокат в свою очередь позвонил Дэвиду и сообщил ему, что Энн намерена получить дом, взять детей и добиться больших алиментов. Когда Джордж услышал об этом, он был очень обеспокоен. Он зарабатывал довольно мало, преподавая в начальных классах школы. Дэвид объяснил ему, что не стоит беспокоиться, так как судья решит дело в его пользу, как только узнает, что Энн ему изменяла.
На суде Дэвид представлял сторону Джорджа. Поскольку у них не было сви­детеля, они не смогли доказать супружескую неверность Энн, и она выиграла дело. У Джорджа едва не случился сердечный приступ. Дэвид мог лишь выразить Джорд­жу свое сочувствие.
Неделю спустя Джордж получил по почте счет от Дэвида на крупную сумму. То-то был он в ярости!
Отметим, что РАЗВОД-2 содержит много уже знакомых нам струк­тур знаний: это телефонные звонки, письма, адвокаты, учителя, рестораны, езда на машине, правовые споры, эмоциональные реак­ции, адюльтер, акты содействия и др. Однако РАЗВОД-2 отличается от рассказа РАЗВОД-1 на многих уровнях.
(1)   На уровне эпизодов:
В тексте РАЗВОД-1 жена застигнута в момент нарушения супру­жеской верности в конце рассказа, который завершается конста­тацией выигрыша дела мужем, хотя персонажи и не появляются на суде.
В тексте РАЗВОД-2 жена застигнута в момент нарушения супру­жеской верности в начале рассказа. Персонажи реально появляются в суде, а дело завершается проигрышем мужа.
(2)  На уровне взаимодействия знаний:
В рассказе РАЗВОД-1 муж получает весть о своем старом това­рище по комнате из его письма, а впоследствии испытывает оше­ломляющее чувство, застав свою жену с другим мужчиной.
В рассказе РАЗВОД-2 муж встречает своего старого товарища по комнате случайно в баре, а впоследствии испытывает похожее ошеломляющее чувство, узнав на суде о проигрыше дела.
(3)   На уровне ролей:
В рассказе РАЗВОД-1 адвокат проливает жидкость на клиента.
В рассказе РАЗВОД-2 жидкость проливает официантка, и это вызывает со стороны мужа несколько иную реакцию по сравнению с рассказом РАЗВОД-1.
(4)  На семантическом и синтаксическом уровнях:
В рассказе РАЗВОД-1 читаем: „...предложил отвезти его домой, для того чтобы он мог переодеться".
В рассказе РАЗВОД-2 аналогичное место выглядит по-другому: „...решил поехать на машине домой, чтобы снять мокрую одежду".
154
(5) На тематическом уровне:
В рассказе РАЗВОД-1 муж выигрывает дело благодаря слу­чайности.
В рассказе РАЗВОД-2 мужа подводит его друг, который к тому же запрашивает чрезмерную сумму за свои адвокатские услуги.
BORIS успешно обрабатывает как РАЗВОД-1, так и РАЗВОД-2 (Dyer, Wolf, Korsin, 1981; Dyer, 1981a; Dyer, 1982). Ниже приводятся образцы ответов BORIS на вопросы по тексту РАЗВОД-2.
В.: Что произошло в ресторане?
О.: Официантка пролила кока-колу на Джорджа, и Джордж отказался платить по счету.
В.: Какие чувства испытывала официантка? О.: Официантка сожалела, что она пролила кока-колу на Джорд­жа.
В.: Почему Джордж отказался платить по счету?
О.: Потому что официантка пролила кока-колу на Джорджа.
В.: Почему Джордж захотел напиться вдрызг?
О.: Он был ошарашен, потому что его жена изменяла ему.
В.: Почему Дэвид чувствовал себя обязанным помочь Джорджу выбраться из затруднительного положения?
О.: Он хотел оказать Джорджу ответную услугу, потому что он был должен Джорджу деньги.
В.: Что произошло на суде?
О.: Судья решил дело в пользу Энн.
В.: Почему Джордж не выиграл дело?
О.: У Джорджа не было свидетеля факта измены его жены.
В.: Как воспринял Дэвид судебное решение?
О.: Дэвид испытывал неловкость по отношению к Джорджу.
В.: Что почувствовал Джордж, когда он получил ответ? О.: Джордж был рассержен на Дэвида.
В.: Почему?
О.: Потому что счет был слишком велик.
Для того чтобы добиться понимания системой BORIS текста РАЗВОД-2, потребовалось' расширить как структуры знаний, так и правила обработки в программе. Частично это связано с тем обсто­ятельством, что РАЗВОД-2 содержит ряд структур, не встречаю­щихся в тексте РАЗВОД-1 (например, в рассказе РАЗВОД-1 нет сцены в зале судебного заседания или сцен, связанных с денежными
155
счетами). Но в целом структуры знаний, используемые при пони­мании текста РАЗВОД-1, требуют очень небольших модификаций для их подгонки к использованию при понимании текста РАЗВОД-2. Тот факт, что BORIS может обрабатывать столь разные рассказы, придает нам уверенность в том, что мы находимся на верном пути.
7.2. Будущие исследования
Мы усматриваем много направлений для нашей будущей работы. Немало еще предстоит сделать в области представления типов знаний, необходимых для понимания текстов, аналогичных расска­зам РАЗВОД-1 и РАЗВОД-2, а также в области более детального исследования процессов взаимодействия между используемыми в BORIS источниками знаний (а их у нас более 15). Кроме того, требуется дальнейшая работа по совершенствованию программного использования наложений структур памяти и одновременного исполь­зования нескольких перспектив, а также и по экспериментирова­нию в области взаимодействия между процессами анализа и дру­гими операциями с содержимым памяти.
В настоящее время BORIS обрабатывает каждый рассказ о разводе изолированно. Что бы произошло, если бы BORIS читала текст РАЗВОД-2 в контексте знаний о рассказе РАЗВОД-1? Лю­ди, которые перед чтением текста РАЗВОД-2 уже читали РАЗВОД-1, вспоминали о последнем при чтении рассказа РАЗВОД-2, а впо­следствии, когда им предлагались задания по пересказу рассказов или построению по нему резюме, часто обнаруживалось, что в памяти читателей смешивались эпизоды разных рассказов. Таким образом, одно из направлений исследований затрагивает происхо­дящие в системе BORIS процессы вспоминания и последствия воспоминаний (Schank, 1982b) для понимания повествователь­ного текста.
Наконец, продолжается работа по изучению абстрактных струк­тур знаний высокого уровня типа сюжетных блоков (Lehnert, 1982) и АТБ (Dyer, 1981b; Dyer, 1982). Такие структуры высо­кого уровня, как ВОЗДАЯНИЯ, НЕЯВНЫЕ-УДАЧИ, ПОИМКИ-С-ПОЛИЧНЫМ и ЗАТРУДНИТЕДЬНЫЕ-ОБСТОЯТЕЛЬСТВА, не­редко заключают в себе мораль или «суть» рассказа. В этом смысле они представляют наиболее глубинный уровень понимания, выхо­дящий далеко за рамки уровня чистых фактов и отражающий те темы и структуры, благодаря которым рассказ остается в па­мяти читателей и воспроизводится ими в каждом уместном случае.
7.3. Смежные исследования
Литература по анализу и пониманию текстов огромна, поэтому здесь мы ограничимся беглым упоминанием тех работ других ис­следователей, которые нам представляются наиболее близкими нашей собственной работе. В число таковых мы включаем раз­работки систем, в которых предпринимаются попытки достичь по­нимания (или синтеза) текста в строгом режиме обработки слева направо, с использованием такого же количества уровней обра­ботки и уровней знаний, как в нашем исследовании, с формиро­ванием семантически ориентированного представления текста в ин­тегральном режиме.
Разработанные ранее в Йейле естественноязыковые системы были предназначены для обработки большого числа рассказов. Например, система FRUMP была способна обрабатывать (на поверх­ностном уровне) около 10% сообщений из телеграфных новостей ЮПИ, а система IPP (см. L e b о w i t z, 1981) обрабатывала на­чальные абзацы из нескольких сотен газетных сообщений, посвя­щенных террористическим актам. Однако для достижения подоб­ной надежности этих программ пришлось пожертвовать глубиной понимания. Иными словами, такие программы „просматривают" текст на разных уровнях, стремясь извлечь „суть" из каждого сооб­щения. Так, если имеется „схематичный сценарий" землетрясения, система FRUMP сможет извлечь из сообщения данные о времени, месте, силе, числе жертв и нанесенном ущербе в каждом конкрет­ном случае сообщения о землетрясении. Все остальное будет проигно­рировано. Так, в следующем предположительном отрывке будет проигнорировано все, что касается чисто „человеческого фак­тора":
Прошлой ночью губернатор Джерри Браун был разбужен мощ­ным землетрясением. Сильный толчок сбросил его с кровати, и он упал на свою собаку, которая укусила его. Официальные источники сообщают, что землетрясение характеризовалось...
Аналогичным образом система IPP при всей своей „надежности" понимает только те части сообщений, которые непосредственно соотносятся со знаниями системы о террористических актах. IPP знает очень много о терроризме, но очень мало о чем-либо еще. В отличие от упомянутых систем в системе BORIS воплощены попытки выявить те знания, которые извлекаются из нескольких довольно сложных рассказов при максимально глубоком понимании. Поэтому представления текста в памяти BORIS должны быть доста­точно богатыми для отображения детальных запросов в ходе про­цедуры ответов на вопросы. Будучи ориентированы на резюми­рование содержания текста, ни FRUMP, ни IPP не имели дела с задачей формирования ответов на вопросы.
/ U&ruCfH
Что касается уровня управления обработкой, то принятый в си­стеме BORIS подход, основанный на демонах, имеет ряд общих черт с исследованиями Аренса (А г ens, 1981) и Смолла (Small, 1981). Однако их исследования, как нам кажется, ориентируются в основном на уровень предложения. В противоположность этому главное внимание в наших разработках уделяется взаимодействию и взаимосвязи между многочисленными источниками знаний в целях построения цельного представления исходного повествовательного текста. Значительная часть наших усилий также направлена на определение конкретного содержания различных структур знаний (например, соглашений и содействий). Аналогичным образом в на­шей работе по совершенствованию системы BORIS нас гораздо больше интересуют способы функционирования конкретных типов множественных перспектив в повествовательных текстах, чем ис­пользование множественных перспектив как общего средства про­граммирования (Bob row, Winograd, 1977).
Генератор системы BORIS имеет ряд общих характеристик с другими системами, синтезирующими цепочки слов в строгом режиме слева направо, такими, как генератор Макдональда MUM­BLE (McDonald, 1980). Однако разработка BORGEN направ­лена в основном на синтез описаний повествовательных эпизодов и тематических конфигураций, а работа Макдональда направлена на синтез текста из исходного материала, имеющего более про­цедурный характер, такого, как запись ходов игроков в некото­рой настольной игре.
никла под влиянием исследования Роузмана (Roseman, 1979).
(2) Другие структуры знаний, используемые в системе BORIS, сами вызывают интерес у специалистов по когнитивной психо­логии и стимулируют соответствующие эксперименты.
Например, был проведен ряд экспериментов по выявлению пси­хологической достоверности аффективно-тематических блоков (АТБ) (Dyer, 1981b; S e i f e r t, 1981). Эти эксперименты показывают, что люди пользуются средствами, в чем-то напоминающими АТБ, при чтении повествовательных текстов, рассматриваемых в разра­ботке проекта BORIS. Другие эксперименты свидетельствуют в пользу психологической достоверности сюжетных блоков Ленерта (Lehnert, Black, Reiser, 1981) и существенности выделе­ния главного персонажа на некоторых отрезках текста (Rei­ser, 1981). Наконец, некоторые эксперименты, описанные в L e li­ner t, Black, Robertson (to appear) говорят о том, что интег­ральная обработка в процессе формирования ответов на вопросы может вызывать модификации в структурах эпизодной памяти.
7.5. Заключительные замечания
Степень сложности процесса обработки текстов на естественном языке оценить очень трудно, потому что люди справляются с этой задачей без малейших усилий. Почти каждый может спокойно прочесть газету или непринужденно участвовать в беседе. Однако задача построения крупных промышленных систем, работающих в режиме естественного языка, остается пока нерешенной.
Люди являют собой наиболее впечатляющий пример интеллек­туальных информационных процессоров, использующих много­численные и разнообразные источники знаний, функционирующие на различных уровнях подробности и в разных режимах взаимо­действия. В настоящее время уникальные человеческие способности обращения с естественным языком наиболее выигрышно проявляют­ся и раскрываются в области естественноязыковой аргументации и понимания повествовательных текстов. Самым важным научным вкладом системы BORIS является то, что она служит одновременно источником и испытательной моделью для интересных теорети­ческих проблем, связанных с указанными базисными когнитив­ными способностями человека.
Приложение А
BORIS функционирует на компьютере DEC-20 в Йейле, реали­зована на языке TLISP (Yale UCI Rutgers LISP). Чтение рас­сказа РАЗВОД-1 и формирование ответов на 30 вопросов тре-
7.4. Система BORIS как когнитивная модель
В ходе разработки и реализации системы BORIS были накоп­лены многочисленные протоколы человеческих ответов на вопросы и резюмирования текстов людьми с целью получения подтвержде­ния того, что BORIS моделирует психологически достоверное по­ведение.
Используемые в системе BORIS структуры знаний отражают современные психологические теории в двух аспектах:
(1) Некоторые структуры знаний в системе BORIS построены на основе экспериментальных данных, полученных в исследо­ваниях восприятия текста человеком.
Например, теория конфигураций организации памяти (КОП) (Schank, 1982b) первоначально разрабатывалась как реакция на эксперименты (Bower, Black, Turner, 1979), касающиеся тех случаев смешения единиц в памяти испытуемых, которые не были предусмотрены в сценариях Шенка. Аналогичным образом теория ПЕРЕЖИВАНИЙ, используемая в системе BORIS, воз-
буют в совокупности приблизительно 20 минут (реального) машин­ного времени. Время работы центрального процессора только для текста РАЗВОД-1—300 секунд. В системе BORIS требуется около 10 секунд работы центрального процессора на обработку вопроса, включающую понимание вопроса, поиск ответа и синтез ответа в виде выражения на английском языке. Можно добиться зна­чительного сокращения этих временных показателей, если произве­сти компиляцию некоторых частей системы. В настоящее время BORIS содержит в словаре всего лишь около 350 слов и оборо­тов. Поскольку BORIS была спроектирована в основном как экспе­риментальный прототип, к настоящему времени была проведена минимальная работа по расширению словаря за пределы того объема, который необходим для понимания двух рассказов — РАЗ­ВОД-1 и РАЗВОД-2.
[Далее в Приложении приводятся фрагменты машинной выдачи, отражающие работу программ системы BORIS в режимах по­нимания, формирования ответов на вопросы и синтеза ответа.]