Р. Шенк, Л. Бирнбаум, Дж. Мей
К ИНТЕГРАЦИИ СЕМАНТИКИ И ПРАГМАТИКИ [1]
1985
см. Уинстон. ИИ, стр. 224
Является ли некоторый данный уровень описания языка автономным относительно соседнего, более „высокого" уровня — этот вопрос представляет большой интерес для лингвистики независимо от того, о каких конкретно уровнях идет речь. Наиболее очевидным примером здесь могут служить разногласия, существующие в генеративной лингвистике по вопросу о соотношении синтаксиса и семантики. Мы уже писали (Schank, Birnbaum, 1984), что, с точки зрения искусственного интеллекта, при построении процессуальной модели языка эти два уровня должны быть объединены (integrated). Поскольку обработка языковых данных требует объединения знаний, содержание которых чрезвычайно разнообразно, мы должны поверить в возможность того, что между уровнями языка не существует функциональных различий (хотя разграничение их и может быть удобно в целях описания). Соответственно, в настоящей работе мы утверждаем, что семантику и прагматику также следует свести в единое целое.
Искусственный интеллект (в дальнейшем — ИИ) занимается разработкой когнитивных процессуальных[2] теорий (theories of cognitive processing), а также экспериментами по компьютерному воплощению этих теорий. Делая упор на процессуальное описание, ИИ применяет особый подход к языку, четко отличающийся от других парадигм лингвистического исследования. С этой точки зрения, уяснение соотношения семантики и прагматики (или любых других аспектов языка) подразумевает уяснение того, как и когда каждый из аспектов используется в процессах понимания и вербализации (language comprehension and production). Важное методологическое положение состоит в том, что специалисты в области ИИ должны целенаправленно решать эту проблему, если они стремятся к построению процессуальной модели, способной выполнять существенные языковые задачи: понимание текста, ответы на вопросы, перевод и др. В ИИ нельзя произвольно рисовать квадраты, обозначающие модули (modules), которые содержат знания разного типа, и соединять их стрелками. Независимые элементы должны действительно работать независимо. Если же это не так, то разграничения между ними нужно переосмыслить. Другим теоретико-лингвистическим парадигмам, как правило, не приходится сталкиваться с таким давлением избранной методологии.
ЧТО СЛЕДУЕТ ИЗ ИНТЕГРАЛЬНОЙ КОНЦЕПЦИИ
Наше утверждение о единстве семантики и прагматики можно сформулировать точнее, как утверждение об их функциональном единстве. Иными словами, процессуальные модели языка не пользуются каким-либо отдельным, независимым уровнем семантической обработки или семантических знаний. Семантические знания применяются в процессе обработки языковых данных точно так же, как прагматические, при этом задействованы те же способности делать умозаключения и пользоваться памятью, что и в процессах обыденного мышления. Семантика — неотъемлемая часть прагматики, то есть нашего общего знания о мире и об использовании языка. Каковы эмпирические последствия такого утверждения? С психологической точки зрения, наиболее кардинальным является то, что процессуальный подход к языку не включает вычисления некоего уровня семантического представления, независимого от прагматических знаний и служащего входом (или, в случае вербализации, выходом) для отдельного компонента прагматического рассуждения (reasoning). Понимание достигается объединенным применением семантических и прагматических знаний. Значение слова или высказывания представлено как составная часть памяти, точно так же, как и другие знания. Важнейшим понятием здесь является память. Иные лингвистические теории могут существовать без адекватной концепции памяти, но процессуальные модели естественного языка — нет.
Для лингвистической семантики из высказанного взгляда следует два главных вывода. Первый состоит в том, что не существует „словаря", а есть только „энциклопедия". Иначе говоря, лексикон тесно связан с прочими нашими знаниями и неотделим от них. Второй вывод касается проблематичности понятия „буквальное значение". Если представление лексем и высказываний включает структуры, неотъемлемо связанные с прочими знаниями, может оказаться, что, вообще говоря, невозможно обособить части этих структур, отождествимые с буквальным содержанием этих слов и высказываний. Таким образом, этот взгляд ставит под сомнение основания простых „восходящих" (bottom-up), чисто комбинаторных теорий значения, таких, например, как теория Катца — Фодора или семантика условий истинности.
Почему же тогда самостоятельная семантика существует, и почему лингвисты пытались строить теории, основанные на такой точке зрения? По-видимому, эта идея явилась побочным продуктом других доктрин. Например, Луи Ельмслев (Hjelmslev, 1953) сумел подчинить семантику автономной системе морфологии и синтаксиса, постулировав полный параллелизм между структурами „плана выражения" и „плана содержания". Казалось, что в его теорию довольно искусно включалась семантика, тогда как в действительности она была изгнана — типичный пример того, «как заниматься семантикой, на самом деле не занимаясь ею». Доктрина автономного синтаксиса в порождающей лингвистике привела к похожему результату. Если считать, что синтаксис не зависит от семантики, то будет естественно предположить, что семантика, в свою очередь, независима от прагматики. Методологический смысл нашего взгляда состоит в том, что, поскольку семантика связана с прагматикой, она не должна изучаться независимо. Семантические теории должны использовать такие крупные структуры для представления обыденных (common-sense) знаний, которые изучались когнитивными науками, то есть фреймы (М i n s k у, 1976; С h a r n i a k, 1978) и сценарии (scripts) (Schank, Abelson, 1977). В работе Филлмора (Fillmore, 1976) дается особенно четкий пример такого подхода:
«В английском языке есть семантическая область, связанная с тем, что можно назвать "торговой сделкой". Фрейм ее имеет форму сценария (scenario), содержащего роли, которые можно обозначить как 'покупатель', 'продавец', 'товар' и 'деньги'; он содержит такие "кадры", в которых показано, как покупатель отдает деньги и берет товар, а продавец отдает товар и берет деньги. Весь сценарий (scenario) торговой сделки активизируется в сознании всякий раз, когда человек встречает и понимает любое из следующих слов: buy 'покупать', sell 'продавать', pay 'платить', cost 'стоить', spend 'тратить', charge 'назначить цену' и т. д., хотя каждое из них выделяет, или выводит на первый план, только небольшой участок фрейма. Каждое из этих слов несет в себе одновременно и фон, и изображение, и всю обстановку, и ту часть этой обстановки, на которую указывает данное слово».
Сложилось так, что стандартное возражение против такой концепции семантики апеллирует к практической невозможности действительно указать все те знания о мире, которыми обладает человек. Например, Катц и Фодор (Katz, Fodor, 1963), приводя аргументы против уместности прагматики в семантической теории, утверждают, что «необходимым условием, которому должна удовлетворять любая разновидность такого рода теории, является способность представить всю неязыковую информацию, нужную говорящему для понимания предложений...». Далее они пишут, что «полная теория такого рода принципиально невозможна, ибо, чтобы удовлетворять вышеуказанному необходимому условию, эта теория должна была бы представлять все знания о мире, имеющиеся у говорящего.» Уязвимость этого довода в том, что способность представлять все релевантные знания есть нечто иное, чем действительное представление их. Иными словами, чтобы удовлетворить условию Катца и Фодора, единая теория семантики и прагматики не должна действительно представлять все эти знания, так же как семантическая теория типа той, на которую ориентировались эти авторы, не должна действительно представлять значение всех слов некоторого языка. Скорее, в обоих случаях требуется потенциальная способность сделать это. Тот факт, что на практике невозможно точно указать все знания говорящего о мире, не обесценивает предлагаемую нами теорию. Цель такой теории — показать, как некоторая совокупность знаний о мире используется при обработке языковых данных в предположении, что говорящий/слушающий эти знания имеет.
Сходное смешение лежит в основе упорного (хотя, вероятно, не преднамеренного) непонимания исследований в области ИИ со стороны некоторых лингвистов и психологов. Для осуществления исследований в области ИИ — по проблемам ли естественного языка, планирования деятельности или решения задач,— нужно выбрать некоторую сферу знания, из которой можно будет черпать примеры и задачи. Сфера эта может оказаться сама по себе интересной, но чаще она скучна (уже задействованы, например, игрушечные кубики, рестораны, детские дни рождения, сборка водяного насоса), и не требуется особого ума для выявления тех фактов из этой сферы, которые должны быть известны для достижения поставленных целей. Суть исследования в этих случаях составляют не факты сами по себе, а методы их представления, организации и применения для понимания и синтеза высказываний или для решения задач. Утверждать, что в исследованиях по ИИ изучается «знание правильного поведения в ресторанах» (М а г s с h а 1, 1980), значит просто не понимать, о чем речь.
ВЫВОД УМОЗАКЛЮЧЕНИЙ И КОНЦЕПТУАЛЬНЫЕ ПРЕДСТАВЛЕНИЯ
Как же могут представляться (be represented) и использоваться крупные структуры значений типа тех, о которых мы уже упоминали, например сценарий торговой сделки, и почему они необходимы для обработки языковых данных? Здесь мы хотим проиллюстрировать тот факт, что учет процедурной проблематики может внести определенный вклад в построение понятийных представлений. (Мы называем семантику и прагматику, вместе взятые, концептуальным *[3] уровнем.) Хотя мы ограничимся обсуждением символьных, или „препозиционных", представлений, не следует слепо верить, что это оптимальный вариант для любой сферы.
Ключевая роль концептуальных представлений состоит в облегчении вывода правдоподобных умозаключений и в упрощении процессов обработки памяти. Такая точка зрения отличается от принятой в лингвистике идеи, что назначение семантического представления состоит в объяснении таких свойств, как синонимия, аномальность и логическое следование. В конечном счете обе эти точки зрения могут считаться подтвержденными лишь в той мере, в какой успешны основанные на них теории; однако вопрос о том, что считать успехом, является спорным. Если вывод правдоподобных умозаключений и обработка памяти рассматриваются как существенные функции семантического представления, то они выдвигаются в центр семантической теории, которая должна, соответственно, заниматься процессами, традиционно не считавшимися „семантическими". Любая семантическая теория, не обращающаяся к этим вопросам, вряд ли прольет свет на то, как язык используется для передачи мыслей, а это, можно с уверенностью утверждать,— наиболее фундаментальная научная проблема, связанная с языком.
Может оказаться полезным соотнести этот вопрос со здравой оценкой того, как и почему люди пользуются языком для общения. Неоднократно отмечалось, что высказывания говорящего не сообщают в открытом виде, то есть эксплицитно, всего того, что слушающий должен понять в соответствии с намерением говорящего; следовательно, нужно допустить наличие скрытого, имплицитного, содержания. Часто то, что должен вывести слушающий, не вытекает с необходимостью из услышанного, и требуется вывести правдоподобное умозаключение о каком-то еще содержании. Отсюда ясно, что концептуальные представления должны способствовать осуществлению процесса вывода правдоподобных умозаключений. Также очевидно, что цель общения часто не достигается, если слушающий не помнит, что ему было сообщено. Следовательно, концептуальные представления должны играть ключевую роль и в организации памяти.
Изучение того, как можно строить концептуальные представления, чтобы они способствовали проведению процессов обработки памяти и правдоподобного вывода, составляет основу теории концептуальных зависимостей (S с h n а к, 1975а). Рассмотрение этой процедурной проблематики заставляет немедленно отбросить возможность того, что слова и предложения естественного языка сами являются приемлемыми представлениями значения, так как слова и предложения неоднозначны и эллиптичны. Предложение Mary gave John a million dollars 'Мэри дала Джону миллион долларов' подразумевает, что у Джона есть миллион долларов, но предложение Магу gave John a kiss 'Мэри поцеловала Джона' (букв. 'Мэри дала Джону поцелуй') не подразумевает, что у Джона что-то есть. Трудно предотвратить такого рода ошибочные умозаключения, если соответствующие правила будут формулироваться исключительно в терминах слов как таковых.
Другая серьезная проблема, возникающая при использовании естественного языка в концептуальных представлениях, связана с тем, что одно и то же (в некотором смысле) значение может быть выражено многими способами, внешне весьма различными. Концептуальное представление, в котором взаимосвязанные значения представлены, насколько это возможно, взаимосвязанно, облегчает поиск в памяти, например при ответе на запрос. Более того, в той мере, в какой сходство значений двух высказываний отражается в их концептуальных представлениях, общие для них правдоподобные умозаключения могут осуществляться на основании общих правил. Это позволяет сократить общее число необходимых правил вывода. Например, говорите ли вы кому-то, что „Фред купил машину у Джерри", или же что „Джерри продал машину Фреду", вы можете ожидать, что слушающий поймет, что теперь машина принадлежит Фреду, что Джерри получил от Фреда какую-то сумму денег в обмен на машину, и т. д. Если представления этих высказываний достаточно сходны, то в обоих случаях могут быть применены одни и те же правила. Это также позволит получить понятийную информацию, общую для разных языков, в модели, охватывающей несколько языков. Экономия такой схемы — не просто эстетическое свойство; она имеет реальные последствия для организации процесса обработки текстов. Например, если имеются общие правила (для сходных значений), то меньшее количество правил подлежит заучиванию, и каждое выученное правило имеет более широкую применимость, следовательно — большую силу.
Чтобы удовлетворить вышеуказанным условиям, нужно максимально ограничить число элементарных символов, из которых строятся концептуальные представления. «Многословие» или избыточность в словаре представлений дает немедленные результаты, порождая большую избыточность и сложность в процессах обработки памяти и вывода умозаключений. Необходимость ограничения словаря представлений подтверждается, если рассмотреть вопрос о том, чем определяются сами концептуальные представления. С точки зрения ИИ наиболее последовательный ответ таков: значение представлений обусловлено их функциональной ролью в ментальных процессах. Тогда, в частности, значение некоторого символа в системе представлений зависит от того, в какие структуры представлений он входит и в каких правилах вывода упоминается. Таким образом, как указывал Хейз (Н ayes, 1979), каждый символ должен играть какую-то роль во многих структурах и правилах вывода, для того чтобы иметь какое-либо существенное содержание или значение. Путь лежит через выражение максимально возможного числа фактов и правил с использованием минимально возможного числа символов. Неправильно было бы просто объявить каждый английский глагол предикатом лежащего в его основе концептуального представления без всякого дальнейшего анализа.
Концептуальные представления могут также облегчить процесс вывода и в том плане, что они очерчивают круг тех выводов, которые должны быть сделаны. Что уже известно о представляемом высказывании, понятии или пропозиции, а что еще остается обдумать,— все это, насколько возможно, должно быть очевидно при „просмотре" представления. Если выражаться языком лозунгов, то можно сказать: представления должны поставлять ожидания. Падежные фреймы — один из видов представления, выполняющего эту функцию: пустые слоты (незаполненные падежи) указывают, хотя бы частично, на информацию, которой недостает и которую нужно вывести.
На основе этих соображений была выработана система для представления значения естественноязыковых высказываний; она является частью теории концептуальных зависимостей. Элементарный словарь системы позволяет представлять действия, объекты, состояния и изменения состояний, а также причинные отношения. (Большая часть усилий была направлена на представление действий и причинных отношений; состояния описаны довольно грубо, а объекты и того хуже, хотя некоторые недостатки были устранены Ленерт ( Lehnert, 1980).) Каждая единица в элементарном словаре имеет набор связанных с ней концептуальных падежей, определяющих наиболее ключевые роли или свойства. У всякого действия, например, есть деятель и объект, у некоторых — источник и цель; факультативно может быть указано инструментальное действие. Первоначально количество элементарных действий в системе колебалось между десятью и пятнадцатью. С течением времени некоторые из них оказались более удачными, чем другие, а с исследованием новых сфер были введены новые (см., например, Schank, Carbon ell, 1979). Приведем описания пяти наиболее часто встречающихся и, следовательно, наиболее полезных действий:
PTRANS: осуществить физическое перемещение объекта из одного места в другое;
ATRANS : передать абстрактное отношение, как, например, обладание объектом или контроль над ним, от донора к реципиенту;
MTRANS : передать информацию (или в пределах психики одного индивида или между индивидами);
ATTEND : сфокусировать орган чувств на стимуле;
PROPEL : приложить силу к объекту в данном направлении.
С каждым элементарным понятием связаны правила правдоподобных умозаключений, которые могут помочь при актуализации данного понятия или при соотнесении его с другими понятиями. Простой пример: из актуализации ATRANS можно сделать какие-то выводы о том, чем обладают упомянутые деятели. Ригер (Rieger, 1975) установил наличие шестнадцати различных типов вывода правдоподобных умозаключений и разработал методику их применения в компьютерной программе.
ВЫВОД УМОЗАКЛЮЧЕНИЙ И ПРАГМАТИЧЕСКИЕ ЗНАНИЯ
Представление причинных отношений в виде концептуальных зависимостей позволяет объединять отдельные представления в более крупные единицы — причинные цепочки (Schank, 1975b). Важность причинных цепочек для процесса обработки текста заключается в следующем: связность текстового описания какого-либо эпизода зависит в первую очередь от того, можно ли построить причинные цепочки, соединяющие описанные события и состояния. Рассмотрим различие между следующими двумя небольшими рассказами:
Мэри дала Джону миллион долларов. Он купил новую машину.
Мэри дала Джону миллион долларов. Она навестила свою тетушку в Милуоки.
В первом случае связность явно имеет место, во втором же — отсутствует. Причина в том, что для первого примера можно построить причинную цепочку, соединяющую описанные события, а для второго — нельзя. Построение представления в виде причинной цепочки в данном случае (как и во многих других) требует вывода промежуточных действий и состояний, оставленных ,,за кадром" в описании. Здесь следует вывести промежуточное состояние, при котором Джон, в результате получения подарка от Мэри, обладает миллионом долларов, что и порождает возможность последующей покупки машины. Такого рода прагматические выводы равно необходимы для построения концептуальных представлений как текстов, так и предложений. Рассмотрим, например, предложения, полученные путем преобразования наших рассказов:
Мэри дала Джону миллион долларов, и он купил новую машину. Мэри дала Джону миллион долларов, и (она) навестила свою тетушку в Милуоки.
Опять мы видим связность первого примера и несвязность второго.
Это различие ясно показывает, что наличие или отсутствие причинной цепочки может быть ключевым свойством концептуального представления отдельного предложения; построение же таких причинных цепочек зависит от прагматического умозаключения. Такое использование умозаключений в построении представления текста в виде причинных цепочек является еще одной иллюстрацией центральной роли вывода умозаключений в понимании языка. Эта роль в свою очередь предъявляет новые требования к нашей модели, отражающей способность понимающего субъекта к выводу умозаключений. Нередко умозаключения (относительно условий и результатов некоторого действия), которые можно вывести по восходящему принципу („снизу вверх") из понятий, эксплицитно выраженных в тексте, вовсе недостаточны для построения причинных цепочек, хотя текст в действительности является причинно-связным. Сравним, например, такие истории из работы Шенка и Абельсона (см. Schan k, Abel-son, 1977).
Фред пошел в парк. Он попросил карлика принести ему мышь. Он поднял коробку и ушел.
Фред пошел в ресторан. Он попросил официантку принести ему каплуна под винным соусом. Он оплатил счет и ушел.'
Внешне эти истории достаточно сходны, но при этом вторая является связной, а первая — нет. Мы понимаем отношения между событиями, упомянутыми во второй истории, поскольку мы можем воспользоваться нашим знанием о том, что обычно происходит в ресторанах. Это позволяет нам построить представление в виде причинной цепочки, основанное на правдоподобных умозаключениях о многих событиях, прямо не упомянутых в истории, например о том, что Фред, вероятно, съел каплуна.
Способность пользоваться знаниями о мире при понимании требует наличия крупных понятийных структур, которые могут в нужный момент поставлять необходимые контекстные знания по нисходящему принципу („сверху вниз"). Практически, простейшая структура такого типа — сценарий (script) (Schan k, Abelson, 1977), который используется для представления информации о стереотипных эпизодах. Хорошо разработанный сценарий это, в сущности, заранее заготовленная причинная цепочка, представляющая обычную последовательность событий. Используя сценарий, понимающий субъект может связать воедино идеи, которые не могут быть соотнесены по своим внешним чертам; он делает это, опираясь на структуру1: памяти, в которой они уже связаны.
Прототипический пример сценария описывает, что происходит в ресторане. Он разбит на сцены, описывающие приход, заказ, еду и уход в терминах действий и состояний, представленных с помощью концептуальных зависимостей, связанных причинными и временными отношениями. В общих чертах сценарии применяются так. Когда дается ссылка на некий сценарий, например при употреблении слова „ресторан", он „активизируется" в сознании, и события, описанные в тексте, сравниваются с теми, которые зафиксированы в сценарии. Если наблюдается достаточное совпадение, то сценарий полностью актуализуется (is instantiated), то есть осуществляется вывод не упомянутых в тексте, но имеющихся в сценарии событий, и в результате получается полное представление в виде причинной цепочки. Каллингфорд (С и 11 i n g f о г d, 1978) разработал этот процесс в деталях и составил компьютерную программу (SAM), использующую сценарии для понимания простых газетных сообщений.
В экспериментальном исследовании, направленном на более четкое уяснение психологической роли сценариев, Бауэр, Блэк и Тернер (Bower, Black, Turner, 1979) обнаружили следующее: когда испытуемым предлагались описания сходных (но различных) эпизодов, они обнаруживали затруднения в распознавании того, какое из описаний реально содержало в себе упоминание сцены, наличие которой можно было ожидать в обоих эпизодах. Например, испытуемым предлагалось описание посещения врача и другое — посещения дантиста. Если одно (и только одно) из описаний содержало упоминание приемной, испытуемые в тесте на вспоминание, как правило, ошибочно считали, что такое упоминание содержалось и во втором тексте. Это означает, что разные аспекты описания (или собственного опыта), будучи однажды поняты, откладываются в разных структурах памяти. Например, в случае посещения врача или дантиста та часть опыта, которая касается приемных, откладывается, по-видимому, в некую структуру, связанную с приемными, общую в каком-то смысле для концептуальных структур, касающихся врачей и дантистов. Следовательно, извлечение опыта из памяти должно быть восстановительным (reconstructive), оно собирает воспоминания из разных структур, что и приводит к возможности ошибок, которые наблюдали Бауэр и др.
Такое объяснение предполагает, что структуры, в которых откладываются воспоминания об опыте,— те же самые структуры, которые предоставляют нам знания, необходимые для первоначального понимания этого опыта. Другими еловами, теория концептуальных структур, используемых в процессе обработки текста, должна одновременно быть и теорией памяти. Из всего этого вытекает такая точка зрения на память: разные структуры памяти организуют разного вида информацию и отвечают за предоставление информации, позволяющей интерпретировать разные аспекты входных данных. Так, например, сценарии не являются статичными структурами данных, которые хранятся в памяти целиком; скорее, они монтируются при необходимости понять нечто на входе. Наоборот, различные аспекты входных данных будут откладываться в разных структурах, которые поставляют информацию, релевантную для этих аспектов. Таким образом, воспоминания об определенном опыте будут расчленяться и распределяться среди структур, использованных для понимания этого опыта.
Наименьшая концептуальная структура, связным образом организующая набор ожиданий,— это сцена. Сцена — это структура памяти, группирующая действия и состояния, относящиеся к единой цели и к единой обстановке, заданной во времени и в пространстве . Отдельные конкретные воспоминания откладываются в сценах с какой-то особой пометой, отличающей их от общих действий и состояний, описываемых сценой. Например, сцена ПРИЕМНАЯ организована вокруг некоторой цели (ожидание профессиональной помощи или услуги) и содержит, в частности, информацию о ее внешнем виде (стулья, столик с журналами), о том, что следует делать (отметиться у регистратора и ожидать вызова). Сцена ПРИЕМНАЯ помогает в понимании любой ситуации, связанной с визитом к специалисту за помощью или услугой, когда клиент должен где-то ждать, пока его обслужат. Таким образом, эта сцена является общей для концептуальных структур, представляющих знания о разного рода профессиональных услугах.
Концептуальные структуры, которые группируют разнообразные сцены, необходимые для понимания данной ситуации (или описывающего ее текста), мы называем конфигурациями организации памяти или КОП (S с h a n к, 1980) *[4]. Например, знания, необходимые для понимания всей информации, связанной с посещением врача, организованы вокруг многих разных целей, нескольких деятелей, функционирующих в разное время и в разных местах, например: приемная; врачебный осмотр; назначение даты следующего посещения; оплата счета. Некоторые из этих сцен являются частями КОП посещения врача (в частности, врачебный осмотр). Но и другие КОП также поставляют некоторые сцены; например, оплата счета есть часть договорного соглашения, в которое неявным образом вступает каждый обратившийся к врачу. Таким образом, КОП могут содержать ссылки на другие КОП, равно как и на сцены.
Хотя первоначально побудительным мотивом разработок восстановительной теории памяти была невозможность объяснить с помощью сценариев ошибки распознавания, объяснение таких ошибок не является главным в теории. Организуя знания в небольшие сценоподобные „куски", или эпизоды (chunks), которые могут относиться сразу к нескольким КОП, мы достигаем гибкости и эффективности (С h a r n i а к, 1978). Но, что еще более важно, при такой общности сцен информация, полученная в какой-то одной ситуации и отложенная в нужной сцене, будет доступна и в другой ситуации, в которой задействована эта сцена. Таким образом, ключевая функция восстановительной памяти состоит в том, что она облегчает обучение (S с h a n к, 1982).
Как же может приведенное выше построение применяться в решении нашей первоначальной задачи — представления значений высказываний естественного языка? Применение будет достаточно простым, если какое-либо слово в высказывании прямо указывает, что перед нами актуализация определенной крупной понятийной структуры. Рассмотрим предложение
Bruno kidnapped Lindbergh's baby boy. 'Бруно похитил мальчика Линдбергов.'
Слово kidnap 'похищать' однозначно указывает на некоторую КОП (назовем ее К-ПОХИЩАТЬ), которая, по-видимому, содержит (или отсылает к другим КОП, содержащим) следующие сцены: деятель захватывает жертву и прячет ее; связывается с родственниками и требует выкупа; договаривается с родственниками об условиях; получает выкуп; отпускает или убивает жертву; пытается избежать поимки. Мы утверждаем, что лучшим представлением этого высказывания является актуализация этой КОП (Schank, Lebowitz, В i г n b a u m, 1980), в которой слоты деятеля, жертвы и родственников заполнены, соответственно, понятиями „Бруно", „мальчик", „Линдберги" и к тому же первая сцена помечена как уже происшедшая. Тот факт, что первая сцена имеет такую помету, объясняет аномальность предложения типа
Bruno kidnapped Lindbergh's baby boy, but failed to grab him. 'Бруно похитил мальчика Линдбергов, но не сумел его поймать.'
Тот факт, что имеются и другие сцены, способные поставлять определенные ожидания, объясняет, почему в предложении типа
Bruno kidnapped Lindbergh's baby boy and left a note. 'Бруно похитил мальчика Линдбергов и оставил запиеку.'
мы так легко понимаем, что слово note означает именно записку, а не музыкальную ноту, и что записка, вероятно, адресована Линдбергам, и что таким образом актуализуется вторая сцена из конфигурации К-ПОХИЩАТЬ (вступление в связь с родственниками и требование выкупа).
Более сложны случаи, когда высказывание не содержит слова, прямо указывающего на концептуальную структуру, наилучшим образом воплощающую значение, которое подразумевал говорящий. Рассмотрим следующие два высказывания:
Joe bought his new TV at Macy's. 'Джо купил новый телевизор у Мейси.'
Joe got his new TV at Macy's.
'Джо достал (букв.: 'получил') новый телевизор у Мейси'.
Первое высказывание, используя слово bought 'купил', прямо указывает на принадлежность к сценарию торговой сделки по Филлмору (мы будем пользоваться обозначением К-ПОКУПАТЬ), следовательно, наилучшим образом оно может быть представлено как актуализация К-ПОКУПАТЬ, где Джо — покупатель, Мейси — продавец, телевизор — объект. Если мы придерживаемся точки зрения, что концептуальные представления должны, насколько возможно, отражать сходство значений, то, поскольку эти два высказывания синонимичны (или почти синонимичны), их представления должны быть тождественны (или почти тождественны). Следовательно, и второе высказывание нужно представлять как актуализацию К-ПОКУПАТЬ.
Достичь этого было бы легко, если бы слово got так же указывало на К-ПОКУПАТЬ, как и bought. Однако, поскольку достать, получить нечто можно самыми разными путями помимо покупки, такой подход означал бы, что слово got — чрезвычайно многозначное, имеет целый ряд трудно различимых смыслов. Если бы got было единственным таким словом, с последствиями можно было бы смириться. Однако это не так. Взяв любой текст, мы найдем слова с такими же характеристиками. Это take 'брать', use 'использовать', go 'идти', have 'иметь', hold 'держать', cut' 'резать', send 'посылать', carry 'нести' и т. д. Собственно говоря, эти методические трудности, связанные с необъятно большим числом различных значений слов (их, между прочим, понимали и пытались преодолеть Ригер и Смолл (R i e g e r, Small, 1979)), возникают потому, что весь подход, по сути, основывается на старом представлении, в соответствии с которым значение высказывания есть простая функция сложения значений входящих в него слов. Если, применяя этот подход, мы возьмем К-ПОКУПАТЬ в качестве представления высказывания „Джо достал новый телевизор у Мейси", а затем вычтем точно установленные значения всех составляющих его слов, то у нас ничего не останется. Все нюансы высказывания, все тонкие оттенки каждого слова в конкретном контексте должны отражаться в одном из бесконечного числа заранее вычисленных смыслов самих слов.
Мы предлагаем альтернативу, основанную на следующих интуитивных соображениях: проблема со словами типа got заключается не в их необычайной многозначности, не в том, что слово име ет большое количество очень конкретных возможных значений, а, скорее, в нечеткости и большой общности их значения. Слово got передает лишь исходное грубое описание того, что got может значить в данном контексте. Чтобы получить более четкое и точное представление целого высказывания (например, К-ПОКУПАТЬ), это исходное описание нужно использовать как ключ для поиска в КОП, актуализированных контекстом (Schank and Birnbaum, 1984); Хоббз (Н о b b s , 1981) вносит, по сути, такое же предложение, а Марр (М а г г, 1977) отмечает общую важность исходных грубых описаний как отправных точек для понимания.
Чтобы рассмотреть эту идею в действии, положим, что значение got представлено просто как ATRANS (передача обладания или контроля). Далее, полагая, что всем известно, что Мейси — название универмага, получаем, что К-ПОКУПАТЬ потенциально может оказаться релевантным, так как универмаги — обычное место действия для К-ПОКУПАТЬ. К-ПОКУПАТЬ включает несколько сцен, и две из них сосредоточиваются вокруг образцов ATRANS: одна представляет передачу товара от продавца покупателю, другая — передачу денег от покупателя продавцу.
Теперь рассмотрим следующее неформальное правило :
Если данное действие происходит в некоторой обстановке, обычно связанной с какой-либо КОП, рассмотри эту КОП и проверь, не может ли это действие служить актуализацией одной из ее сцен. Если это так, актуализируй всю КОП и пометь соответствующую сцену как уже происшедшую.
Поскольку факт передачи телевизора в руки Джо соответствует центральной сцене К-ПОКУПАТЬ, то, в соответствии с этим правилом, высказывание Joe got his new TV at Macy's. может быть понято как актуализация К-ПОКУПАТЬ, причем не нужно, чтобы got имело возможный смысл, указывающий на К-ПОКУПАТЬ. Такой подход не ограничивает значение высказывания простой функцией сложения составляющих его слов. Если мы вычтем значения всех слов этого примера, то получим актуализацию К-ПОКУПАТЬ, которая, будучи подсказана словом «Мейси», не утверждается ни им, ни каким-либо другим словом в высказывании.
Высказывания, требующие, по-видимому, такой же обработки, встречаются чрезвычайно часто; мы приведем здесь еще один пример:
John mailed me a postcard from Mexico.
'Джон отправил мне по почте открытку из Мексики.'
John sent me a postcard from Mexico.
'Джон послал мне открытку из Мексики.'
Эти два высказывания также синонимичны (или почти синонимичны). Значение обоих следует представлять актуализацией концептуальной структуры, которая представляет наши знания о почте (то есть К-ОТПРАВЛЯТЬ ПО ПОЧТЕ). В первом случае на это имеется прямое указание — слово mailed. Во втором случае вместо него употреблено слово sent. Sent, как и got, имеет нечеткое и общее значение. Оно указывает на некое грубое описание того, что оно может значить в каком-то контексте. Положим, что это значение может быть представлено просто как PTRANS (перемена места нахождения). Видимо, слово postcard 'почтовая открытка' подсказывает, что здесь может оказаться релевантным К-ОТПРАВЛЯТЬ ПО ПОЧТЕ. Поскольку главная цель К-ОТПРАВЛЯТЬ ПО ПОЧТЕ состоит в осуществлении действия PTRANS применительно к какому-то объекту и поскольку действие, задаваемое словом sent,— это PTRANS, то будет вполне просто заключить, что следует актуализовать как раз К-ОТПРАВЛЯТЬ ПО ПОЧТЕ.
Такой подход представляет интерес для лингвистики, поскольку он позволяет решить некоторые семантические проблемы с помощью крупных понятийных структур. Рассмотрим, например, предложение «Джо достал телевизор у Мейси за 300 долларов». Правильное понимание выражения «за 300 долларов» зависит от наличия К-ПОКУПАТЬ и от осознания того, что сообщение о получении Джо телевизора актуализирует сцену, в которой продавец передает товар покупателю. Если бы мы не актуализировали К-ПОКУПАТЬ, мы бы не поняли, что можем ожидать сцену, в которой покупатель передает деньги продавцу. Можно предположить, что любое выражение вида «за (некую сумму денег)» подсказывает, что К-ПОКУПАТЬ может оказаться релевантным, ибо если говорящий не знает, что за деньги можно что-то купить, то он просто не понимает, что такое деньги. Однако одно это не может объяснить нашу способность определить, что Джо действительно заплатил Мейси 300 долларов. Здесь включаются знания о том, кто продавец, а кто покупатель, что в свою очередь зависит от осознания того, что сцена, в которой продавец передает товар покупателю, уже произошла (когда Джо получил телевизор). Вообще определение того, кто является продавцом, а кто покупателем, зависит от знания того, что Считается товаром или услугой и кто может их предоставить. В данном случае, К-ПОКУПАТЬ уточняет действие ATRANS как услугу. Но в целом проблема достаточно сложна. В высказывании ,,Я покрасил дом Фреда за 500 долларов" кажется очевидным, что говорящий получил 500 долларов, поскольку покраска дома – трудная работа, и это, следовательно, услуга, которую он оказал. Однако, если изменить предложение на „Я покрасил свой дом за 500 долларов", это будет означать, что говорящий заплатил 500 долларов за то, чтобы ему покрасили дом. Чтобы это понять, в К-ПОКУПАТЬ должно быть включено знание о том, что покупатель и продавец, как правило, разные деятели. В предложении „Фред полетел в Лос-Анджелес за 1000 долларов" неясно, является ли Фред продавцом или покупателем услуги, и, следовательно, невозможно определить, заплатил ли он 1000 долларов или получил их.
Одно из наиболее интересных, хотя и гипотетических, следствий из интегральной концепции состоит в том, что процесс понимания буквальных выражений оказывается весьма похожим на процесс понимания метафорических. (Действительно, накапливается все оольше свидетельств психологии в пользу того, что понимание буквального и небуквального использования языка происходит в виде сходных или даже тождественных процессов; см. G і b b s, 1982.) Рассмотрим, например, пару предложений:
Joe threw out the garbage. 'Джо выбросил мусор.'
Judge Bean threw out the case.
'Судья Бин отказался от ведения дела.' (букв.: 'Судья Бин выбросил дело'.)
В первом употребление выражения threw out 'выбросил' обычно считается буквальным, а во втором — метафорическим. Однако теория понимания, основанная на процессах обработки, которые описаны в предыдущем разделе, будет действовать более или менее одинаково, получив любое из этих предложений на входе: началом послужит исходное грубое описание значения threw out, которое, в соединении с релевантной КОП, будет использоваться для более точного определения значения всеґо сообщения. В каком-то смысле интегральная теория семантики и прагматики приводит нас к выводу о том, что язык всегда в некоторой степени метафоричен.
* * *
Данная работа была доложена на XIII Международном конгрессе лингвистов в Токио (Япония) в 1982 г. Проведенное исследование отчасти финансировалось Управлением перспективных исследовательских проектов Министерства обороны США (DARPA), а отчасти — Национальным научным фондом.
[1] Roger Schank, Lawrence Birnbaum, Jacob M e у. Integrating semantics and pragmatics.— „Quaderni di Semantica", Vol. VI, no. 2, 1985.
[2] Следует отметить, что английский термин processing 'обработка' (применимый и к машинной, и к „человеческой" обработке языковых данных) является производным от слова 'процесс'. Поэтому в переводе, в зависимости от контекста, могут употребляться выражения, построенные на основе либо одного, либо другого из указанных русских корней.— Прим. перев.
[3] Слово conceptual мы переводим как 'концептуальный', а не 'понятийный', потому что в специальной литературе уже утвердилось наименование „теория концептуальных зависимостей Шенка".— Прим. ред.
[4] См. также статью В.Ленерт и др. в настоящем сборнике.— Прим. ред.