Р. Шенк. М. Лебовиц. Л. Бирнбаум

Предлагается анализатор для преобразованин входных предложений в наиболее глубинную форму представления

ИНТЕГРАЛЬНАЯ ПОНИМАЮЩАЯ СИСТЕМА *[1]

IPP

Йельский университет Отделение вычислительных наук

Предлагается новый тип анализатора (parser) естественного языка. Идея, положенная в основу этого анализатора, заключается в преобразованин входных предложений в наиболее глубинную (для данной задачи) форму представления их значения и следующих из них умозаключений. Анализатор не вычленяется из понимающей системы в целом. Для осуществления анализа он использует интегральную концепцию умозаключений, сценариев, планов и других видов знания. Более того, он не пытается анализировать все, что он видит. Напротив, он определяет наиболее интересные части текста и концентрирует свое внимание именно на них, игнорируя все остальное.

I. ОБЗОР АНАЛИЗАТОРОВ, ОСНОВАННЫХ  НА КОНЦЕПТУАЛЬНЫХ   ЗАВИСИМОСТЯХ

На протяжении последних десяти лет исследователи, работающие в рамках нашего проекта, разработали и запрограммировали большое число анализаторов. Задача этих анализаторов состояла в преобразовании исходных выражений естественного языка в некоторое внутреннее представление. (Заметим, что первая фаза процесса понимания традиционно соотносится с выявлением синтаксической формы входного сообщения.) Однако термин "анализ" (parsing) с не меньшим основанием может быть применен к первой фазе понимания в любом ее истолковании. В этой статье мы рассмотрим некоторые из проблем, возникших в ходе создания наших анализаторов, и представим новую теорию анализа, моделирующую реальный процесс понимания, как он осуществляется в ходе обычного чтения текста; опишем программу, которая реализует эту теорию и  понимает газетные сообщения на тему о терроризме.

Все наши анализаторы были программами, которые преобразовывали английские предложения в представления их значений в рамках теории  концептуальных  зависимостей (K3). B основе их построение всегда лежало методологическое допущение о том, что используемый алгоритм анализа должен быть как можно более адекватным в психологическом плане. Таким образом, наши анализаторы предназначены для моделирования того способа анализа, которым, как мы полагаем, пользуются люди; Это методологическое допущение повлекло за собой операционный принцип, соблюдавшийся, за одним исключением, во всех случаях (которые мы обсудим ниже),  а именно,  что алгоритм анализа движется по тексту слева направо и осуществляет его просмотр один раз, не допуская возврата.  Эти анализаторы не были рассчитаны на обработку предложений, похожих на настоящие "садовые тропинки", когда в процессе понимания людям приходится осуществлять возврат назад.

Первый анализатор, который мы разработали (S с h a n k ana T e s 1 е г, 1969), использовал так называемые "правила реализации" и преобразовывал английские синтаксические структуры в КЗ. (Этот термин, взятый из Lamb, 1966, означал, что мы соотносили один языковой уровень с другим.) Главный недостаток этого анализатора состоял в том, что он нарушал нашу методологическую установку на моделирование процессов, осуществляемых человеком.,1 Для многих английских предложений, которые были неоднозначными, применявшийся нами алгоритм не мог определять предпочтительность одной интерпретации по сравнению с другой, хотя люди явно владеют такого рода предпочтениями.

В работе S с h a n k et al., 1970 мы предложили некоторое решение для устранения этого недостатка и реализовали новые принципы при построении нового анализатора, который мы назвали SPINOZA П. SPINOZA II должен был для управления ходом анализа использовать само представление КЗ. Это значит, что в процессе анализа значение любого понятого сегмента (от начала предложения) должно помогать при определении значения остальной части предложения. Эта идея повлекла за собой сопутствующую идею о том, что, поскольку анализом будет управлять значение, мы на самом деле, видимо, почти не должны полагаться на синтаксис как на средство осуществления нашего анализа. (В то же самое время сходную идею разрабатывал Уилкс (W i 1 k s, 1973), и его мнение послужило поддержкой для пашен веры в возможность осуществления этой идеи.) Мы не считали, что сможем обойтись без синтаксиса. Наша точка зрения состояла в том, что опора прежде всего на семантические аспекты существенно уменьшит за- | висимость наших анализаторов от синтаксиса.

В то время,  когда разрабатывались анализаторы указанного типа, другие исследователи также создавали методы для преобразования входных предложений на естественном языке во внутреннее представление. Большинство этих, методов основывалось на синтаксисе предложений. Один из наиболее  популярных  методов  состоял  в  использовании Расширенной сети  переходов (Augmented Transition Network (ATN)). Анализаторы этого типа обсуждались в работах: Thorne et al., 1967; Bobrow and F r a s,e r, 1969; Woods, 1969; Kaplan, 1975. Анализатор, очень близкий к классу ATN, представлен в работе Винограда (см. W i n о g r a d,   1972). Модели типа ATN опирались преимущественно на синтаксис, лишь Изредка обращаясь к установленшо нескольких простых семантических своиств слов. Еще   более   тесно   связаны   с   синтаксисом   анализаторы, базирующиеся на трансформационной грамматике, как, например, в работе: Plath,  1974. Одной из последних публикаций на эту   тему   является   работа:   Msrcus, 1979, где описывается анализатор, основанный на предположении о возможности выделения синтаксиса как самостоятельной части понимания языка. Важно подчеркнуть, что все эти  программы рассматривают синтаксический анализ как процесс, полностью изолированный от остальных сторон   понимания.  Этими   системами   управлял синтаксис, хотя в некоторых случаях синтаксическому  анализатору разрешалось   запрашивать    семантическую информацию. Некоторые системы понимания речи, в частности Hearsay-II (CMU Computer Science Speech Group, 1976), используют более интегральный подход, но они лишь слегка касаются того уровня анализа, который интересует нас. В рамках нашей концепции мы всегда подчеркивали необходимость интеграции    семантики   и   синтаксиса   в   процессе анализа.

Анализатор SPINOZA-II был закончен лишь отчасти, когда мы вынуждены были от него отказаться по соображениям не академического порядка. Было предпринято несколько попыток продолжить разработку этого анализатора, пока Крис Ризбек не создал анализатор, который был похож на SPINOZA-II по идее, но отличался по форме (см. R i e s b e с к, 1975). Программа этого анализатора была основана на так называемых запросах, представлявших собой особую форму проверки выполнения заданных условий (см. Newell, 1973). Запросы активизировались каждый раз, когда могли быть выдвинуты ожидания о некоторой синтаксической или семантической информации, и выполнялись, если включенные в них ожидания оказывались истинными. Таким образом, анализ направлялся посредством ожиданий, что делало систему Ризбека, позже названную ELI, сильно ориентированной на анализ "сверху вниз" (см. R i e s b е с k and S с h a n к, 1976).

ELI была использована в роли "приставки" к системе SAM, нашей системе понимания, основанной на сценариях (S с h a n k et al., 1975; С u 1 1 i n g f о г d, 1978), и была объединена с работой Гершмана (G e r s h m a n, 1977) по именным группам, что привело к созданию анализатора, который мог обрабатывать очень сложные по структуре предложения.

Одним из главных недостатков ELI является ее "негибкость". Грейнджер (Granger, 1977) создал для ELI дополнительный компонент — FOUL-UP, который определяет значение неизвестных слов в контексте, и это придало системе некоторый запас прочности. Но в повседневной практике исследователи приходили к выводу, что проще создавать особые анализаторы, предназначенные для специальных целей и построенные по типу ELI, которые являются менее громоздкими и более удобными при пользовании. Например, программа POLITICS Карбонелля (С а r b о п е 1 1, 1979) — модель субъективного понимания политических событий — использует анализатор, сходный с ELI, но построенный самим  Карбонеллем.

Может быть, самый важный итог работы Карбонелля состоит в том, что она выявила для всех нас основную ошибку, характерную для наших рассуждений о построении больших понимающих систем. Мы всегда склонялись к принципу модульности в проектировании наших программ как потому, что это всегда рассматривалось как хороший стиль в программировании, так и потому, что, поскольку наши системы являются очень большими, каждый отдельный модуль часто составлял тему работы отдельного человека.

Однако эта модульность явилась причиной целого ряда трудностей. При таком подходе система, которую мы строим, должна, например, в идеале, использовать ELI на первом этапе анализа (в качестве "приставки"). Но на практике ELI оказывается очень большой и громоздкой программой. Далее, возникает еще одна практическая проблема, а именно: словарь для любой новой области, в которой должна; работать   создаваемая   система,   является,   скорее   всего, новым для ELI. Поскольку в ELI определения слов являются в известном смысле сами программами, всякая новая система в любом случае потребует написания большой части соответствующей анализирующей программы с самого начала.  Эта   практическая   проблема  приводит,  далее,   к гораздо более интересному вопросу. Подобно тому как несколько лет назад мы осознали, что для построения более интегрированной анализирующей системы важно воспользоваться силой имевшихся у нас представлений КЗ, точно так же любой новый анализатор, разрабатываемый для новой системы, должен в принципе пользоваться результатами,  полученными на более высоких уровнях понимания, которые  являются  частью  новой  системы.   Так,   система POLITICS может проводить анализ более эффективно, если она использует не только частично построенное представление КЗ для того фрагмента текста, который она уже поняла, но также и его место в идеологии, которую использует эта  программа,  его общую значимость и т. д.   С этой точки зрения модульность оказывается весьма серьезным недостатком. Почему не извлекать выгоду  из  всего, что имеется в нашем распоряжении и может помочь в процессе анализа? (Тот факт, что для осуществления анализа люди используют  только  синтаксис и   некоторые  конкретные семантические признаки (именно эти, а не другие), является не более вероятным, чем то, что они используют только  чистый  синтаксис.  Понимание является в полном смысле  этого   слова   интегральным   процессом.) Приверженность принципу построения модульных систем помешала прогрессу в автоматизации анализа, потому что эта задача требует использования наших знаний в полном объеме; это, очевидно, необходимо и для разрешения неоднозначности предложения, и для выявления подходящих смыслов слова, и, что не менее важно (как мы увидим ниже в этой статье), для принятия решений о том, что в тексте следует игнорировать.

Необходимо уточнить, что мы имеем в виду, когда объявляем модульность помехой в развитии систем анализа. Ясно, что с точки зрения программирования наши анализаторы должны иметь модульный характер? Однако, если на поверку оказывается, что модули тратят все свое время на коммуникацию друг с другом, то данная конкретная схема модульной организации должна вызывать подозрения — в реальной действительности модули образуют интегральное единство. (Поскольку коммуникация модулей друг с другом, как правило, весьма трудна, наблюдается стремление избегать ее вообще.] Это может привести к проектированию таких процедур, которые по замыслу должны взаимодействовать друг с другом, а па практике становятся все более и более изолированными друг от друга. Именно это и произошло со стратегией модульной организации  систем,   которую мы описали   выше.

2. В ТЕКСТЕ НЕ ВСЕ ЗАСЛУЖИВАЕТ ВНИМАНИЯ

Один из главных недостатков системы SAM, а также ELI (являющейся частью SAM) состоит в неспособности обрабатывать тексты, к восприятию которых она пе подготовлена. Новая словарная единица, новая область дискурса или ранее не встречавшаяся синтаксическая конструкция часто приводили систему в полное смятение. Одним из видов результатов, выдававшихся системой SAM, было резюме (summary) прочитанного. Нам казалось, что мы могли получать в общем такой же результат с помощью гораздо более надежной и значительно более быстрой программы FRUMP (DeJ ong, 1977). FRUMP не анализирует каждое слово каждого рассказа, поступающего на вход. Напротив, она воплощает в себе некоторую теорию беглого чтения (skimming), которая направляет ее в процессе чтения. FRUMP выделяет то, что представляет для нее интерес,— обычно это единицы информации, которые она хочет включить в свое резюме, относящееся к любой конкретной области, о которой она имеет знания^ Таким образом, FRUMP в высшей степени ориентирована на анализ типа "сверху вниз", по этой причине она не может рассматриваться как простая замена системы SAMJ Программа SAM могла в принципе реагировать на входные тексты, к которым она не была подготовлена, хотя на практике такое случалось совеем не часто! (FRUMP не может реагировать на те аспекты рассказов, к которым она не подготовлена, но это не означает,  что она вообще не в состоянии  обрабатывать

такие рассказы)

Для целей настоящей статьи, однако, в системе FRUMP особенно интересным является то, что она представляет собой   пример   работающей,  надежной,  интегральной  (то есть не модульной) системы. Анализатор системы FRUMP, в сущности, неотделим от блока логического вывода (inferencer). Причина этого проста.(FRUMP знает, что ей необходимо  найти   в   рассказе.   Она  располагает   правилами, определяющими,   как   находить   в  тексте  нужные  вещи; это могут быть как правила вывода умозаключений, так и правила анализа.) Но такие правила являются в действительности только нижним уровнем манифестации решений более высокого уровня, принятых на основе многих соображений, из которых лишь часть связана с процессом анализа. FRUMP работает хорошо, потому что ее интересы непосредственно управляют процессом поиска/Она может игнорировать то, что ее не интересует, и сосредоточивать свое внимание на том, что ей нужно узнать.

Давайте посмотрим, как нормальный грамотный взрослый человек читает рассказ, например газетную заметку. Мы и раньше серьезно задумывались над вопросом о том, читает ли человек (при обычном нормальном процессе чтения) детально, как SAM, пли бегло, как FRUMP. И хотя мы не имеем твердых доказательств в пользу одного или другого из этих способов, нам представляется, что человек больше похож на FRUMP, чем мы раньше думали. Если это так, то отсюда следуют важные выводы о том, как в действительности должен выглядеть анализатор. Мы не утверждаем, что анализатор системы FRUMP является адекватным. Очевидно, что нет, поскольку он пропускает важные аспекты многих рассказов. С другой стороны,  некоторая комбинация типа анализа,  принятого в системе FRUMP, с типом анализа, принятым в EL1, могла бы способствовать созданию очень мощной и надежной системы для понимания текстов на естественном языке.

3. ВРЕМЯ ОБРАБОТКИ В ХОДЕ АНАЛИЗА

Одним из главных факторов, которые необходимо учитывать, па пат взгляд, при рассмотрении устройства анализатора,  является скорость, с которой люди могут читать

текст. Если учесть вывод умозаключений, а также обращение к фоновому знанию и другие проблемы, с которыми человеку приходится иметь дело в ходе чтения или слушания предложения, то следует заключить, что люди решают задачу понимания очень быстро. Они заканчивают понимание большей частью в тот момент, когда перестает звучать то  предложение,  которое они слушают.  Отсюда следует, что время, которым они располагают для вывода умозаключений  и  применения  знаний,  не может растягиваться до конца предложения и продолжаться после того, как закон'чится анализ.  Наоборот, такие дополнительные процессы должны осуществляться в то же самое время, когда осуществляется  анализ.  Это  подтверждается  психологическими данными; см., например, работу MarslenWilson, 1975. В указанной работе исследуются ошибки в повторении предложений и показывается, что на протяжении всего времени чтения предложения должна происходить обработка  информации на  высших  уровнях.  Такое заключение, несомненно,   придает  гораздо  больший  вес  той гипотезе, которую мы сформулировали выше. Из нее следует,    что процессы, происходящие у человека, носят в высокой степени интегральный характер. Иначе говоря,, люди должны выводить умозаключения  из  ранних  частей  предложения до того, как  они   услышат его последующие части. Если это так, то отсюда также следует, что люди будут использовать все, что им удастся обнаружить; тем самым проблемы установления смысла слов и другие оказываются под влиянием процессов высших уровней. Таким образом, с точки зрения  моделирования   процессов  обработки   информации \ человеком,  проекты анализаторов,  которые сначала  полностью осуществляют свою работу, а затем отсылают свои \ результаты в блоки логического вывода, не имеют смысла. Из сказанного вытекает также и еще одно следствие. Мы должны задаться вопросом:; когда происходит этот тип обработки,  не направленной  непосредственно на анализ? Существуют два возможных ответа. Либо люди используют параллельные процессы, и все это происходит буквально в одно и то же время, либо (если обработка является последовательной) для указанного типа обработки должно быть сэкономлено  время  за счет чего-то другого. Этим "чем-то Другим" является, вероятно, полная обработка каждого воспринимаемого слова. Иначе говоря, с точки зрения последовательной (serial) организации обработки, не все слова равноценны. Одним словам выделяется много времени на обработку (тем словам, которые имеют, например, большую синтаксическую, семантическую и логическую значимость), а другие будут едва замечены.

Вопрос о том, какое объяснение правильнее (последовательное или параллельное), сегодня нами решен быть не может. Однако, даже при частичном использовании параллельной обработки, кажется правдоподобным, что общий объем обработки, требующейся в каждый данный момент процесса понимания, имеет некоторые минимальные границы и что скорость ввода часто нарушает эти границы. Таким образом, мы снова приходим к необходимости обрабатывать одни слова за счет других.

Итак, последовательная организация обработки  предполагает такую модель анализа, при которой он осуществляется местами_неполно.уКак мы указывали в другой работе (S с h a n к, 1975), процесс осуществления полного анализа чрезвычайно сложен. Несколько упрощая, можно сказать, что прочтение слова занимает п миллисекунд, а полная обработка слова — m миллисекунд. Поскольку весьма вероятно, что в случае обычной речи и чтения m намного больше, чем п, и поскольку при обычной речи и чтении слова поступают в виде непрерывного потока, то очевидно, что люди не  в  состоянии   полностью  обрабатывать  каждое  слово, которое они слышат. Более вероятной представляется такая организация этих процессов, при которой они решают, на что в ходе анализа обратить серьезное внимание, а к чему отнестись небрежно. Такие решения можно объяснить многими факторами. Один из наиболее очевидных — это интерес. Иначе говоря, люди склонны обращать внимание на то, что им интересно (именно этому посвящая отведенное на обработку время).. Мы обсуждали понятие интереса и его разновидности применительно к проблеме вывода умозаключений   (S с h a n к,   1978).   Главный   наш   постулат состоял  в  том,   что   вывод   умозаключений  управляется интересом.   Вероятно,   аналогичный   постулат  справедлив и по отношению к излагаемой пересмотренной концепции процесса  анализа,   потому  что теперь  мы  рассматриваем весь процесс понимания как интегральный феномен. Рассмотрим   следующее   предложение:

A small twin engine airplane carrying federal marshals and a convicted murderer who was being transported to Leavenworth crashed during an emergency  landing at OTIare Airport yesterday.

'Маленький двухмоторный самолет, на борту которого находились федеральные судебные исполнители и осужденный убийца, который транспортировался в Ливепуорт, потерпел вчера аварию при вынужденной посадке в аэропорту О'Хэр.'.

Интуитивно ясно, что некоторые части этого предложения более интересны, чем другие. Более того, согласно высказанным выше соображениям о количестве времени обработки, которым мы располагаем, чрезвычайно существенно, что обработка некоторых слов должна занимать меньше времени, чем время, требуемое для того, чтобы прочитать или услышать их. Правда, на первый взгляд это может показаться несколько странным. Каким образом слово может обрабатываться за меньший промежуток времени, чем то время, которое требуется, чтобы прочитать или услышать его, если само прочтение или восприятие его на слух является частью этой обработки? Тем не менее мы находимся именно в такой парадоксальной ситуации, если, конечно, мы придерживаемся того взгляда, что обработка любого отдельного слова в предложении может потребовать больше времени, чем нужно для его прочтения или восприятия на слух; при этом обработка предложения в целом занимает не больше времени, чем требуется для восприятия его на слух, и к тому же разные слова поступают с такой скоростью, что между ними нет временных интервалов, которые могли бы использоваться для обработки. (Дело обстоит, очевидно, именно таким образом, ибо простое нахождение словесных границ в предложении является очень сложной задачей, потому что речевой поток непрерывен.)

(Поскольку количество времени обработки, которым располагает человек, ограничено скоростью потока, поступающего на вход (в случае устной речи — непрерывного), то 'некоторые из слов, вероятно, не обрабатываются совсем (или, во всяком случае, они обрабатываются настолько частично, что человек едва успевает их увидеть или услышать)./ Ввиду того что самые важные слова часто идут в конце синтаксической группы (phrase), все предшествующие слова moivt фактически игнорироваться до тех пор, пока их не соберут вместе "справа налево". Далее, обработка по принципу "сверху вниз" помогает человеку определить, что следует игнорировать. Согласно этой схеме, слова хранятся в буферном устройстве и фактически игнорируются до тех пор, пока не будет найдено слово, которое инициирует обработку. Когда такое слово обнаруживается, слова в буферном устройстве собираются вместе и их анализ завершается. Слова, которые инициируют обработку, появляются обычно в конце синтаксических  групп   или   ритмических   групп

(breath  groups).

Значит,   чтобы   провести   обработку   именной   группы, такой, например, как a small twin engine airplane 'маленький  двухмоторный  самолет',   мы  должны   предположить, что процессор фактически игнорирует все слова до слова airplane,    просто   отмечая    их    наличие   в   оперативной памяти (для  возможного   поиска   после   того,  как будет найдено ядерное существительное). Как только мы узнаем, что airplane — субъект предложения, могут быть выдвинуты определенные ожидания, которые позволят нам лучше представить себе,  что следует искать (и, таким образом, что   игнорировать).   Например,   значение   слова carrying 'перевозивший' может фактически игнорироваться, потому что, когда мы еще только начинаем понимать, что это за слово, мы уже слышим нечто о судебных исполнителях и об убийце и решаем уделить внимание этим единицам.

Суть дела здесь заключается в том, что в действительности мы не воспринимаем в предложении   каждое слово: по мере того как поступает непрерывный речевой  поток, мы  выбираем то,   что находим  интересным,   возвращаясь назад,  чтобы выявить те отношения,  которые связывают воедино интересующие нас элементы, и фактически игнорируем все остальное.  Разве нам важно, что в предложении   был   употреблен   глагол carrying 'перевозивший',  а не глагол containing 'содержавший', или что в нем использована  конструкция,  отличная  от  конструкции  in which they were flying 'в котором они летели'? Мы уже осуществили  предсказание,  в соответствии с. которым отношение между людьми и самолетом — это отношение "нахождения внутри", потому что именно это отношение является наиболее обычным. Мы должны только подтвердить тот факт, что этому  предсказанию ничто не противоречит,  а такое подтверждение может быть получено на том основании, что мы имеем дело с ситуацией полета. В свете этой теории нас не должен удивлять тог факт, что люди, понимающие текст, зачастую не могут вспомнить те реальные слова, которые они читают. Ведь они, быть может, в действительности и не прочитывали их совсем!

Следоватёльно, теория частичного анализа гласит, что большинство слов едва замечается нами, до тех пор пока не возникнет какая-то причина, которая заставит нас обратить на них внимание. Главная проблема пашей теории состоит, следовательно, в том, как мы узнаём, каким словам мы должны уделить внимание, чтобы начать их серьезную обработку. '

Если в процессе нормального понимания речи некоторые элементы языка пропускаются вовсе или обрабатываются лишь в слабой степени, то может возникнуть вопрос, почему они вообще присутствуют в речи. Почему автор не опускает их? Ответ сводится к тому, что один и тот же рассказ может пониматься разными читателями с разной степенью полноты. Читатель, обращающий внимание на каждую деталь повествования, имеет возможность выявить нюансы, обычно пропускаемые читателем, который, как в описываемом нами случае, удовольствуется частичным пониманием.

На наш взгляд, имея дело с такими средствами информации, как газеты, люди не осуществляют детальной обработки, но все же в состоянии извлечь огромное большинство сведений, интересующих их. Это тот самый тип обработки, который мы и пытаемся моделировать в рамках пашей концепции. Мы отнюдь не заявляем, что она представляет единственный уровень обработки, которым человек может пользоваться, но полагаем, что этот уровень является очень важным и широко используемым уровнем  понимания.

В этом месте стоит сделать одно попутное замечание. В течение ряда лет мы говорим о том, что ожидания управляют различными частями процесса понимания (например, R i e s b e с к, 1975; Cullingford, 1978). Разграничение, проводимое нами здесь, сводится к противопоставлению обработки, управляемой ожиданиями, и обработки, управляемой интересом. Очевидно, наиболее мощные it ""Важные механизмы, находящиеся в распоряжении понимающего, управляются одновременно и ожиданиями, и интересом.)

Причины полной обработки данного слова могут относиться к любому уровню системы. Укажем некоторые из них:

1 Ожидания  на  уровне  анализатора. Если анализатор ожидает появления слова определенного типа, то удовлетворение этого ожидания может оказаться чрезвычайно важной силой в работе анализатора. Так, например, анализатор может функционировать лучше всего при том условии, что он будет ожидать появления тех или иных синтаксических или концептуальных типов с такой степенью определенности, что будет игнорировать все остальное (до тех пор, пока они  не будут найдены).; Здесь  мы  опять сталкиваемся  с нарушением идеи анализа слева направо, потому что анализатор не может заинтересоваться данным элементом, пока он до него не дошел, не проигнорировал его, а затем увидел единицу,  приведшую   к   активизации ожиданий,   которые могут быть удовлетворены только посредством возвращения назад.

2 Синтаксис. Главное существительное в некоторой временной группе может заставить процессор заняться выявлением всех соответствующих определений, в которых возникла необходимость или которые вызвали к себе интерес. Определенные функциональные слова могут переключить центр внимания па те знаменательные слова, ценность которых с точки зрения интересов читателя установлена с большой степенью вероятностиЛТак, предлог to будет замечен лишь в той мере, в какой он может привлечь внимание к последующему существительному, если уже стало ясно, что указание на направление движения ожидается читающим и представляет для него определенный интерес.

3 Ценность с точки зрения интереса. Как анализатор решает, что он хочет анализировать? Очевидно, мы нуждаемся в полной интегральной системе, в которой анализатор и память общаются в процессе анализа предложения. Без такой интеграции не было бы убедительной основы для того, чтобы замечать одни вещи и не замечать другие. Информирование анализатора о том, на что следует обращать внимание, входит в функции эпизодической памяти и компонента, отражающего знания о мире. Указания на ценность с точки зрения интереса хранятся в памяти как часть знаний, ассоциированных с понятиями. Некоторые понятия являются почти всегда интересными, другие интересны в определенных обстоятельствах. Но самое важное состоит в том, что определенные вещи представляют интерес в свете того, что им предшествовало в тексте, то есть "интересность" является динамическим cboi"ictbomJ Так, можно ожидать, что объект убийства будет представлять больший интерес, если убийство произошло в посольстве, а не в каком-нибудь, вообще говоря, менее интересном месте типа бара. (Но, конечно, могут быть построены и такие контексты, где бары будут играть очень важную роль. Именно поэтому необходимо иметь динамическую память, а не просто словарь.)

4 Ожидания, связанные с высшим уровнем. Если мы читаем текст о событии, которое подходит какой-то структуре высшего уровня организации знания (типа сценария или плана), то предсказания, вытекающие из этого сценария или плана, могут направлять фокус интереса в процессе обработки предложения.\Так, мы можем знать, что жертва убийства и отождествление убийцы имеют решающее значение при чтении рассказа об убийстве, и таким образом можем считать, что предсказания типа "сверху вниз" в ходе анализа текста будут ставить эти единицы в центр внимания (фокус  интереса).

Чтобы увидеть, как все это используется, рассмотрим схему предложения "X went to visit Y". Система обращается к памяти, чтобы определить, следует ли считать X интересным, поскольку он является главным существительным и обладает признаком лица. Если никакой информации не найдено, обработка должна происходить быстрее, чем в том случае, когда информация обнаружена. Так, если X есть John или Sam, то дальше мы идем быстро. Если бы Х-ом был Henry Kissinger 'Генри Киссинджер' или your mother'твоя мать', то мы, вероятно, стали бы продвигаться дальше более медленно, потому что было бы активизировано больше ожиданий об их поведении, которые представляют интерес.

Went является единицей, которая побуждает нас продолжать обработку, поскольку она не имеет никакого конкретного значения в изоляции. (То есть мы могли бы иметь went crazy 'сошел с ума', went fishing 'пошел рыбачить', went to Boston 'поехал в Бостон'; мы не можем ничего понять, пока не увидим последующих слов. Теория здесь проста: "Зачем вообще размышлять? Просто иди дальше".) Visit— слово, которое вызывает сценарий ($VISIT), если объектом визита является человек, равный по положению, или член семьи. Но это же слово может вызвать и другие сценарии, отличные от сценария $VISIT. Если бы объектом глагола visit являлся, например, музей или Конгресс, мы получили бы  совершенно  другие  сценарии  или  даже не получили бы вообще никакого  сценария.   (Какой   сценарий   может вызвать выражение went to visit a mortuary 'пошли навестить морг'?) Очевидно, суть дела здесь в том, что visit также почти полностью игнорируется, поскольку оно значит   здесь   очень  мало.    Его   действительное   предназначение состоит в том, чтобы остановить наше внимание на объекте, который следует за ним. Иначе говоря,  мы действительно начинаем обработку этого предложения на достаточно глубоком уровне лишь после того, как узнаём, что из себя представляет Y. Тогда, если Y отвечает определенным критериям, мы вызываем сценарий $VISIT. Если Y — представитель противоположного пола, то мы имеем дело с неоднозначностью предложения с точки зрения сценариев (и, следовательно, с точки зрения его обработки). В этом случае применимым может оказаться либо сценарий $VISIT либо сценарий ^ROMANCE 'любовная история', и мы должны будем затем вычислить, какой из них нам подходит. Заметим,  что, хотя   большинство  приведенных  примеров, а также тех, которые будут приводиться ниже, опирается при описании событий на сценарии, это не означает, что  предлагаемые  принципы  обработки  текста  не  могут быть применены к рассказам,  которые удобнее представлять с помощью других структур знания,   например планов и целей (S с h a n k and A b е 1 s о п, 1977; W i 1 е n s k y, 1978). На самом деле, мы считаем, что эти принципы будут применимы, вообще говоря, ко всему, что может быть представлено в памяти. Сценарии играют важную роль в наших   ранних   разработках   по   созданию   анализаторов, потому что мы занимались такой областью (заметки в газетах),   которая   характеризуется   наличием  многочисленных стереотипных ситуаций. Однако мы надеемся расширить рамки этой работы и научиться анализировать рассказы, требующие иных типов представления.

4. ПРИМЕР

Ниже   приведено   предложение,   взятое   из   заметки   с первой   страницы   газеты   "Нью-Йорк   Тайме":

An Arabic speaking gunman shot his way into the Iraqi   Embassy   here  (Paris)  yesterday   morning,   held

hostages through most of the day before surrendering to French policemen and then was shot by Iraqi security officials as he was led away by the French officers.

'Вчера утром здесь (в Париже) вооруженный человек, говорящий по-арабски, стреляя на ходу, ворвался в иракское посольство, захватил заложников и держал их большую часть дня, а затем сдался французским полицейским, позднее он был застрелен сотрудниками иракской службы безопасности в то время, когда  его  уводили   французские  офицеры.'

Рассмотрим теперь это предложение слово за словом и попытаемся определить желаемый вид обработки в рамках интегральной схемы понимания. Программа, которую мы опишем ниже, осуществляет именно такую обработку. Модель будет пропускать неинтересные части и строить свое представление, когда это необходимо, стараясь заканчивать полную обработку каждой подчасти без отставаний. Иными словами, мы хотим, чтобы предлагаемая нами модель заканчивала обработку, лишь слегка запаздывая по отношению к моменту, когда была получена входная информация,— точно так же,  как действует человек.

Отметим здесь один важный момент: хотя мы и будем обсуждать анализ этого предложения, следуя слово за словом слева направо, мы не должны думать, что и в действительности человек понимает текст по принципу "не более одного слова одновременно". На деле слова поступают целыми группами, как при визуальном (чтение), так и при слуховом (устная речь) восприятии. Поэтому мы тоже можем производить обработку по тому же принципу. Так, например, для любого рассматриваемого слова мы всегда знаем следующее за ним слово. Такое допущение может упростить решение проблемы снятия неоднозначности.

****************

An Arabic speaking gunman...

'Вооруженный   человек,    говорящий   по-арабски...'

*********************

AN (неопределенный артикль) — это слово, которое сначала нужно только сохранить, чтобы не забыть. Это значит, что система смотрит его в словаре и находит там указание перейти к следующему слову, поместив AN в какой-то отсек оперативной памяти (ОП) с тем, чтобы вернуться к нему  позднее.

ARABIC 'арабский' подается в словаре как слово, которое может быть пропущено, если ему предшествовало другое пропускаемое слово, поэтому наша модель пропускает его и помещает в ОП. (То, что слово ARABIC может быть пропущено, было определено еще при разработке модели и записано в словаре. Сами же критерии определения того, что может пропускаться, составляют одну из интересных актуальных проблем при моделировании языковой способности человека. (Обсуждение этих вопросов можно найти в S с h a n k and S е 1 f r i d g e, 1977). Обычно прилагательные (правда, не все) могут пропускаться. Слово Russian 'русский', например, не может быть пропущено, потому что оно может обозначать деятеля. Не могут пропускаться и прилагательные, отмеченные как представляющие определенный интерес, например disgusting 'отвратительный', murderous 'кровавый',  lecherous 'распутный'  и т. д.)

SPEAKING 'говорящий' также может быть пропущено, пока не встретилось потенциальных деятелей. Поиск обозначений ДЕЯТЕЛЕЙ в ОП приводит к отрицательному результату. Поэтому данное слово также пропускается. GUNMAN 'вооруженный человек' снабжено признаками ACTOR 'деятель', NOUN 'существительное' и HIGH INTEREST ACTOR 'деятель, представляющий большой интерес'. Тот факт, что у нас появилось слово с признаком HIGH INTEREST, заставляет нас построить запросы типа "сверху вниз", связанные с выяснением определенной информации; в частности, теперь мы хотим получить ответы па следующие вопросы:

КТО он? — Заставляет нас собрать вместе накопленные прилагательные (например, ARABIC) и приписать их к элементу памяти, обозначающему данного человека (GUN-MAN).

ЧТО он сделал? — Ответом на этот вопрос служит единица, которую мы находим в памяти при элементе GUNMAN, а именно — SHOOT 'стрелять'. Таким образом, еще до того как в систему поступит продолжение текста, выводится умозаключение, что упомянутый вооруженный человек стрелял или будет в кого-либо стрелять.

В КОГО он стрелял? — Вопрос заставляет пойнтересоваться синтаксическим объектом глагола, которым, по нашему допущению, является SHOOT.

ПОЧЕМУ он стрелял? — Заставляет нас искать  причину.

ГДЕ это случилось? — Заставляет нас искать местонахождение.

КАКИЕ СЦЕНАРИИ могут быть вызваны? — Само слово GUNMAN может послужить причиной вызова того или иного сценария. Наиболее вероятен вызов сценариев $ROBBERY 'ограбление', $TERRORISM 'терроризм' и $KIDNAP 'похищение'. Теперь мы можем заняться поиском подтверждений в остальной части  предложения.

Вопросы, сформулированные выше (в виде запросов; см. R i e s b e с к, 1975), будут теперь управлять анализом остальной части этого предложения. Здесь важно указать на то обстоятельство, что посредством этих запросов па самом деле осуществляется управление не просто разбором предложения, а процессом гораздо более сложного порядка. Эти вопросы затрагивают информацию, которая интересна для нас в более широком плане понимания. Мы осуществляем фактически целостный процесс понимании этого рассказа. Запросы в равной степени затрагивают факторы, существенные и для собственно анализа, и для вывода умозаключений, и для применения сценариев, и для целеполагания.

******************

shot his way into the Iraqi Embassy...

'стреляя на ходу, ворвался в иракское посольство...'

**************************

SHOT 'стреляя' сразу же признается тем словом, которое удовлетворяет ожиданию, вытекающему из информации, приписанной слову GUNMAN. Именно путем удовлетворения подобных ожиданий строятся концептуальные структуры, и в данном случае мы строим первую такую структуру — представление для действия SIIOOT. При этом позиция деятеля заполняется элементом, обозначающим упомянутого вооруженного человека, а позиция направления стрельбы остается незаполненной. Эта незаполненная позиция маркируется так же, как позиция, удовлетворяющая ответу на вопрос типа "КТО . . .?" (см. выше), и теперь анализатор "заинтересован" в том, чтобы найти ответ на указанный  вопрос, связанный с  концептуальной  структурой SHOOT;  с этой  целью система  ищет следующее  главное существительное в последующей именной группе. HIS 'его', 'свой' пропускается и хранится в ОП. WAY  'путь'  не удовлетворяет ожиданию, связанному с заполнением пустой позиции. Слово WAY фиксируется, с одной стороны, как пропускаемое слово, а с другой, как указание   на   направление   или   местоположение.   В   этот момент создается запрос, связанный с  поиском этого местоположения,  и  мы предпринимаем  попытку  пропускать последующие слова до тех пор, пока не найдем обозначение искомого места.

INTO 'в  (вовнутрь)'   подано в словаре  как  пропуска
емое слово.

THE   (определенный   артикль)   записывается   в   ОП   и пропускается.

IRAQI 'иракский' записывается в ОП и пропускается. EMBASSY 'посольство' оказывается обозначением места и фиксируется как местоположение события SHOOT. Более того, EMBASSY помечается как слово, представляющее интерес, и как обозначение места, важного в политическом отношении. Последняя информация удовлетворяет условиям запроса, вызывающего сценарий $TERRORISM, предсказанного нами (среди прочих) на основе анализа слова GUNMAN. Коль скоро EMBASSY представляет интерес, активизируются его запросы. Один из них направлен на поиск страны, которую представляет данное посольство. В результате из ОП извлекается слово IRAQI,  которое удовлетворяет указанному запросу.

Фиксация сценария $TERRORISM приводит к тому, что мы перестаем интересоваться представлением предложения как такового и сосредоточиваем свое внимание на формулировании и удовлетворении запросов, вытекающих из этого сценария и необходимых для представления рассказа в целом. Итак, теперь мы пытаемся найти ответы на следующие запросы:

Были ли взяты ЗАЛОЖНИКИ?

Какие были  предъявлены требования?  (Деньги?  Освобождение политических заключенных?) Был ли причинен какой-либо ущерб?

Какие меры были предприняты против террориста? (Ответный   огонь?   Арест?   Освобождение  заложников?)

*********************

here yesterday  morning...
'здесь вчера   утром...'

*********************

HERE 'здесь' в рамках сообщения о новостях всегда обозначает то место, которое указано в газетной строке, содержащей дату сообщения. Запись этой локализации добавляется к представлению рассказа.

YESTERDAY 'вчера' оказывается обозначением времени и поэтому записывается в позицию времени в структуре данного события.

MORNING 'утро' тоже обрабатывается указанным способом.

*********************

held hostages through most of the day...
'задерживал заложников большую часть дня...'

*********************

HELD 'задерживал' пропускается, потому что оно не соответствует ни одному из запросов. Такого соответствия нет по той причине, что информация о слове HELD, имеющаяся в обозреваемой части словаря, сводится лишь к тому, что это — глагол. Поскольку появление глаголов не предсказывалось, мы пропускаем это слово. Можно, конечно, представить себе случай, когда при этом слове стояла бы помета о его пнтересности. Заметим, что HELD — чрезвычайно многозначное слово; раньше мы, может быть, и стали бы выводить многочисленные предсказания нз него, а потом искать подтверждения того, какое из значений имелось в виду. При интегральной понимающей системе у нас нет необходимости это делать. Причина этого вскрывается при рассмотрении хода последующей обработки данной группы.

HOSTAGES 'заложники' прямо отвечает одному нз имеющихся запросов. Вызывается соответствующая сцепа из сценария ^TERRORISM, а именно сцепа ВЗЯТИЕ ЗАЛОЖНИКОВ. В этот момент производится проверка хранящегося в ОП глагола с целью удостовериться в правильности принятого решения. Если бы, например, в 01] хранился глагол shot 'застрелил', то этот вызов не должен был бы срабатывать. Глагол HELD оказывается в точности таким словом, которое вполне согласуется с вызываемой сценой. Важный момент состоит здесь в том, что значение глагола HELD и не должно было определяться в изолированном виде, что представляется удачным решением, потому что слова типа HELD в действительности не имеют какого-либо конкретного значения. Значение этого глагола вытекает из его связи с HOSTAGES, а слово HOSTAGES понимается посредством сценария $TERRORISM. Таким образом, принцип интегрального понимания плюс анализ типа "пропускать и сохранять" в огромной степени облегчает обработку текста.

THROUGH 'через; в течение' подается в словаре как указание либо на время, либо на место, поэтому формируется запрос на поиск соответствующего слова. Однако на данный момент наша система знает, что именно ее интересует. В частности, очень важно продолжить поиск ответов на неудовлетворенные запросы, имея в виду особенно то, что они связаны с понятием смерти (см. S с h a n к, 1978). Поэтому мы фактически игнорируем остальную часть группы как не представляющую интереса.

MOST 'большая часть' записывается в ОП и пропускается.

OF (предлог) пропускается. THE записывается в ОП и пропускается. DAY 'день' опознается и игнорируется. Вместе с тем это слово отвечает запросу низшего уровня по поводу указания времени, и данная информация добавляется к нашим знаниям о времени; она может быть использована позднее, если у нас когда-нибудь возникнет интерес к тому, что мы сейчас сочли неинтересным.

before surrendering to French policemen...

'перед тем как сдаться французским   полицейским...'

BEF'ORE 'перед' —это слово, связанное с упорядочением во времени; оно подготавливает нас к фиксации нового события и уточняет его время относительно ранее упомянутого события.

SURRENDERING 'сдача' — слово, которое маркировано признаком высокой степени интереса и одновременно охарактеризовано как составная часть нескольких сценариев, включая $TERRORISM. В рамках этого сценария вызывается сцена сдачи властям (в плен) и формулируются запросы, касающиеся причин этого действия, его контрагентов и т. д. Определенные слова считаются указателями этих ролей. Так, because 'потому что' выделяет причины, a to (предлог с дативным значением) выделяет контрагентов.

ТО говорит нам, что далее следуют контрагенты (люди, взявшие в плен).

FRENCH 'французский' откладывается в ОП.

POLICEMEN 'полицейские' помечено как существительное, которое может быть ДЕЯТЕЛЕМ, поэтому система обращается к ОП, чтобы собрать относящиеся к нему компоненты. Это слово может обозначать также контрагента в сцене сдачи властям, так что оно удовлетворяет двум имеющимся запросам.

**********************

and Ihen was shot by Iraqi security  officials...

'n   затем  был  застрелен  сотрудниками   иракской   службы безопасности...'

* ************ ***********

AND 'и' говорит о том, что кончилось одно событие и, вероятно,   начинается  другое  событие.

THEN 'затем' дает указание о времени данного события.

WAS 'был' указывает на то, что деятель, записанный в ОП, является концептуальным объектом нового события. Поэтому формируются запросы о соответствующем деятеле и действии.

SHOT 'застрелен' оказывается словом, представляющим интерес, и обрабатывается так же, как GUNMAN, за исключением того, что мы не будем в этом случае искать некоторые элементы, характерные именно для существительного GUNMAN. В результате мы получаем:

В КОГО они стреляли? —ARAB GUNMAN 'в вооруженного араба'.

КТО СТРЕЛЯЛ? — Ответа нет. ПОЧЕМУ  стреляли? — Ответа  нет. ГДЕ   это   случилось? — Уже   известно.

КАКИЕ  СЦЕНАРИИ   вызываются? — Глагол   SHOOT 'стрелять'   может  вызвать   какой-либо  сценарий.   Обычно здесь  могут  рассматриваться   три   варианта:   $ROBBERY 'ограбление', $TERRORISM 'терроризм' и $KIDNAP 'похищение'. Но мы имеем дело с контекстом, который задается   сценарием   $TERRORISM.   Другие   из   упомянутых сценариев не могут быть нормальным продолжением сценария   ^TERRORISM.   К   такому   выводу   мы   приходим на основе обращения к планам и целям.

КАКОВЫ были РЕЗУЛЬТАТЫ этого действия? — Строится запрос с целью определения результатов. Если в тексте не удается найти элементов, удовлетворяющих этому запросу, то делается умозаключение об обычных результатах этого действия. В данном случае это смерть объекта.

Так как слово SHOT оказывается интересным, мы должны объяснить его. У нас нет для этого сценариев, поэтому мы должны выяснить, кто мог захотеть убить данного вооруженного человека и почему. Эти запросы добавляются к массиву активизированных ранее запросов. BY (предлог) говорит о том, что далее идет обозначение деятеля.

IRAQI 'иракский' пропускается и записывается в ОП. SECURITY 'безопасность', 'служба безопасности' пропускается и записывается в ОП.

OFEICIALS 'сотрудники' используется для завершения обработки данной именной группы. Это слово удовлетворяет запросу о том, КТО стрелял, и раз мы теперь располагаем знанием деятелей, то мы можем задаться вопросом о том, почему они хотели убить ТЕРРОРИСТА. В данный момент мы могли бы установить связь между IRAQI SECURITY OFFICIALS и IRAQI EMBASSY, но это не ведет к какому-либо объяснению. Это только заставляет пас удивляться происшедшему. Мы пытаемся объяснить данное событие, постулируя, например, темы типа МЕСТЬ или ЗАСТАВИТЬ ЕГО МОЛЧАТЬ, но уверенности на этот счет  нет.

*      *       *      *      *      *      *      *      *      *      *      *      *      *      *      *      *      *

as lie was led away by French officers.

'в  то  время,  когда  его  уводили   французские  офицеры'.

д      ;1:      ************************     *

В основном наш анализ закончен, так как больше нет запросов, требующих немедленного удовлетворения. (Мы узнаём это после того, как просмотрели абзац и не нашли новых запросов.) Нас, однако, продолжают интересовать цели каждого из деятелей, поэтому запросы типа ПОЧЕМУ остаются  активизированными.

AS 'в то время, когда' является показателем одновременности. Поскольку у нас нет особого интереса к тому, что происходило в то же самое время (если только это не факты, интересные сами по себе), то мы можем теперь, пропуская слова, искать действия и деятелей, которые представляют интерес. AS может также обозначать причинность, но в этом случае семантические предсказания, сформированные ранее, сами осуществят поиск нужной причины.

НЕ 'он' пропускается. WAS 'был' пропускается.

LED 'уводимый' интереса не представляет, опознается и затем  пропускается.

AWAY 'прочь' пропускается. BY  (предлог)  пропускается. THE пропускается.

FRENCH 'французский' пропускается. OFFICERS   'офицеры'   пропускается,   потому   что   нет запросов,  которые бы интересовались этим словом. Конец абзаца говорит о том, что анализ закончен. Окончательное  представление для   этого   предложения   таково: $TERRORISM   'терроризм'

ACTOR 'деятель' — Arab gunman PLACE 'место' — Paris, Iraqi Embassy SCENES 'сцены'

$HOSTAGES  'заложники' — some  'несколько' ^CAPTURE 'взятие в плен'

ACTOR French  policemen OBJECT Arab  gunman PLACE Paris, Iraqi Embassy UNEXPECTED    RESULT   'неожиданный   результат':

ACTOR Iraqi   officials ACTION SHOOT OBJECT Arab gunman RESULT   'результат'

ACTOR Arab gunman

STATE 'состояние' — dead 'мертвый'

IPP

5. ОБРАБОТКА ТЕКСТА ПО ПРИНЦИПУ ИНТЕГРАЛЬНОГО ЧАСТИЧНОГО АНАЛИЗА

Мы разработали программу, которая реализует теорию анализа, проиллюстрированную выше,— интегральный частичный анализатор (an Integrated Partial Parser) IPP. В  настоящем  разделе мы  рассмотрим,  как  работает этот анализатор. Он нацелен    на    обработку    ограниченного класса   текстов,  а именно   газетных   заметок   на тему о терроризме и на смежные темы. Мы не пытались охватить все проблемы, встающие при автоматизации  анализа. Основное внимание было сосредоточено па тех вопросах, которые  связаны   с   сущностью  такого   рода   анализаторов. Одна  из известных  проблем,  которых мы не  касались,— это обработка  многозначных  слов.   К счастью,  в  рамках обрабатываемого нами класса рассказов большинство слов, особенно   интересных,   имеет   ровно   одно   предпочитаемое значение.   С   помощью   IPP было   успешно   обработано более 200 текстов, взятых непосредственно из различных газет.   Многие  из  них  были   взяты  наугад.   В   настоящее время IPP располагает словарем объемом более 2000 слов. Анализатор    написан   на   LISP'e    п    эксплуатируется   на машине системы  DEC 20/50.

Ограничения данной программы связаны со словарем и знаниями о мире. Объем словаря в 2000 слов, типичный для экспериментальных программ в области искусственного интеллекта, все-таки несколько маловат, даже для текстов о терроризме. В настоящее время мы расширяем словарь. Программа ограничена также тем кругом текстов, для понимания которых она располагает соответствующими знаниями о мире. Мы брали только такие заметки, которые основаны па сценариях, по, как упоминалось выше, мы считаем, что общие методы IPP будут применимы и к другим формам знания. Возможности IPP могут быть усилены как путем добавления новой инфор
мации сценарного типа, аналогичной уже имеющемуся
запасу знаний, так и путем учета ряда других типов зна
ния о мире.

Другое ограничение IPP состоит в том, что он испытывает   трудности   при   анализе   текстов с тонкой   организацией   повествования,— текстов,   в которых не   очень прост переход к заключению. Но именно такой тип текстов  представляет трудности  и для людей, особенно при I быстром   чтении.   Планируемое   решение   этой   проблемы сводится к тому, чтобы обеспечить возможность   возврата I и чтения, текста в более тщательной манере, чем это обычно Сделает IPP.

Схема анализа, реализованная в IPP основана на классификации слов в словаре с точки зрения того, что должен делать анализатор с каждым словом по мере его прочптывания. Следовательно, такие категории, как существительное, глагол и т. п., имеют смысл в анализаторе лишь в том случае, если они приводят к разным типам обработки. Легко говорить, как мы это делали выше, что такое-то слово надо пропустить или сохранить или что-нибудь в этом роде. На практике же подобные решения мы должны принять заранее. Таким образом, ключевые проблемы реализации такого анализатора следующие: во-первых, установление категорий для подачи слов в словаре, которые будут полезны в данной модели; во-вторых, разработка процедуры для определения того, к какой категории подходит каждое данное слово. Как мы вскоре увидим, приписывание слова к определенной категории может зависеть от предметной области.

Возвращаясь к примеру в предыдущем разделе, мы можем сказать, что с прочитываемым словом можно поступать тремя способами. Слово может быть пропущено, оно может быть записано в ОП и затем пропущено или оно может сразу же быть подвергнуто полной обработке.

Первая возможность заключается в том, что его можно прост пропустить. Существует много слов, которые с точки зрения нормального чтения не имеют существенного понятийного содержания. Если вспомнить текст, приведенный в предыдущем разделе, то это будут слова: most 'большая часть',  way  'путь',  held  'держал'.

Вторая возможность,  которая следует из нашего примера, заключается в том, что слово может быть записано в ОП и затем пропущено. Слова, к которым следует применять эту стратегию обработки, несут определенную функциональную нагрузку или какое-то понятийное содержание, но при этом могут считаться банальными и неинтересными. Тем не менее мы не можем их просто игнорировать, потому что их значения могут оказаться важными для конкретизации наших знаний о событиях и предметах, которые нас интересуют. Например, они могут использоваться для заполнения ролей в концептуальных структурах, представляющих интересные события. Они могут также больше не использоваться в последующем анализе. В соответствии с данной стратегией обрабатываются многие слова в нашем примере. Примерами могут служить слова Arabic, Iraqi и his, а также все артикли.

С такими словами система может поступать двумя способами. Либо их значение помогает в конкретизации чего-либо интересного (и в этом случае такое значение будет включено в семантическое представление текста), либо оно не помогает в решении этой задачи. Например, значение слова French 'французский' в сочетании

(1)   before surrendering to French policemen

'перед тем как сдаться французским полицейским'

включается в семантическое представление, потому что нас интересует вопрос о том, кому сдался террорист, то есть нас интересуют полицейские. С другой стороны, значение слова French в сочетании

(2)   as he was led away by the French officers

'в то время когда его уводили французские офицеры'

не включается в семантическое представление, потому что в сферу нашего интереса слово officers не попадает.

Существуют слова, которые, помимо понятийных характеристик, снабжены в словаре определенной информацией о связанных с ними процедурах; она записана в форме ожиданий, помогающих конкретизировать значение таких слов. Объектами подобных ожиданий часто являются слова, которые подлежат обработке в соответствии со стратегией "записать и пропустить". Например, вполне вероятно, что со словом embassy 'посольство' ассоциируется ожидание, направленное на поиск названия страны, которую данное посольство представляет, а слова

policemen, officers и officials связаны с ожиданиями названия правительственного учреждения, от имени которого они действуют. Но если некоторое слово подлежит обработке по стратегии "записать и пропустить", то эти ожидания не должны пускаться в действие до тех пор, пока мы не будем уверены в том, что понятие, связанное с основным словом, действительно уточняет наши знания о чем-то интересном. Нслп оказывается, что нас данное понятие не интересует, то нет смысла осуществлять ненужную обработку. Сравним обработку слова policemen в сочетании (1) с обработкой слова officers в сочетании (2). Поскольку выясняется, что понятие полиции в первом случае расширяет наши знания об интересующем нас событии, то представляется правдоподобным, что будет реализовано ожидание, связанное с указанием на государство, от имени которого действует полиция. Во втором случае, поскольку понятие 'офицеры' не расширяет паши знания о чем-либо интересном, то нет смысла применять здесь подобное   правило.

Третья возможная стратегия обработки слова заключается в том, что оно немедленно и полностью обрабатывается, то есть система обращает внимание па его значение и на ожидания, им порождаемые. Именно эта стратегия применяется ко всякому слову, обладающему существенным и интересным понятийным содержанием. Эти понятия и ожидания управляют всем ходом анализа. Примеры из нашего рассказа включают слова gunman, shot и hostages. Ожидания, порождаемые этими слонами, могут включать тот же тип простых конкретизирующих ожиданий (типа заполнения позиций), которые ассоциируются с некоторыми словами, подлежащими обработке по стратегии "записать и пропустить". Например, вполне возможно, что одно из ожиданий, порождаемых словом gunman, будет направлено на поиск национальной или политической принадлежности данного вооруженного человека.

Эги слова могут также порождать ожидания, оперирующие на гораздо более высоком уровне. Например, когда мы читаем слово gunman, мы ожидаем, что он мог осуществить действие стрельбы из какого-либо оружия. Мы также ожидаем событий, связанных с несколькими возможными сценариями, включая $ROBBFRY 'ограбление' и $TERRORISM. Эти ожидания действуют примерно так же, как происходит применение сценариев (см. С и 1 1 i 11 g f'o r d, 1978): они служат для того, чтобы распознавать события и тем самым определять, разумно ли усматривать их в данном контексте. Так, коль скоро мы знаем, что воору женный человек скорее всего является террористом, мы ожидаем, что он может задерживать заложников, может стрелять и убивать каких-то люден и может выдвигать требования. Мы знаем также, что данный эпизод может иметь лишь очень ограниченное число возможных исходов: террорист может быть взят в плен, он может сдаться сам, он может быть убит, он может сбежать. Эти ожидания высшего уровня помогают нам решить, что является важ ным в рассматриваемом тексте при взгляде на него "сверху вниз". Все это имеет решающее значение для организации анализа. Ио гибкость анализа зависит также от его спо собности отвечать на вопросы относительно таких пред метов и событий, которые не предусматриваются ожида ниями.

Ожидання, используемые в IPP, реализуются в форме запросов (см. R i e s b e с к, 1975). Запрос имеет форму правила выводa (продукции), или пары вида "проверка — действие". Если в результате проверки некоторого действующего запроса выясняется его справедливость, то выполняются соответствующие наборы действий. Список запросов упорядочен так, что, когда система приступает к рассмотрению действующих запросов, первыми рассматриваются запросы, активизированные позже всех, поскольку они представляют более новые и, видимо, более адекватные ожидания. Поскольку теоретически проверки и действия, выполняемые запросами, могут быть совершенно произвольными, в пашен системе мы выделили в качестве необходимого лишь ограниченное множество запросов. У нас запросы могут делать следующее:

строить новые концептуальные структуры — обычно данный  запрос строит только одну  такую структуру;

заполнять какую-то позицию в некоторой концептуально/! структуре некоторой другой концептуальной структурой, например: заполнять позицию ДЕЯТЕЛЬ в сцене ^SIIOOT 'стрелять' концептуальной структурой, соответствующей конкретному вооруженному человеку;

активизировать другие запросы — часто это запросы, которые пытаются заполнить пустые позиции в структуре, создаваемой под воздействием запроса-инициатора; это могут быть также ожидания, касающиеся действий, coстояний или более сложных эпизодов, которые могут cледовать далее;

отменять запросы — в этом случае речь идет об аннулировании какого-либо запроса (возможно, и самого дан ного запроса), когда он перестает быть уместным.

Существует три типа проверок, выполняемых запросами:

проверка конкретных лексических единиц, например: служебные слова часто являются характерным признаком : той или иной конструкции; так, в сочетании surrender to French policemen 'сдаться французским полицейским' запросы, связанные со словом surrender (или со сценарием $SURRENDER), могут быть направлены на поиск слова to (предлог), которое служит признаком следующего за ним обозначения властей, которым некто сдался;

 проверка наличия лексических единиц, удовлетворя ющих некоторому условию; например, это могут быть слова, активизирующие какой-то конкретный сценарий;

поиск объектов или событий определенного структурно-семантического типа. Это может быть такая простая про цедура, как проверка структур па совпадение с образцом; либо речь может идти о проверке семантических признаков вроде "человек" пли "власти".

Тот факт, что запросы могут искать конкретные лексические единицы, играет очень важную роль в сокращении времени обработки. Этот резерв обеспечивается как запросами, которые ищут служебные слова (типа предлогов), так п запросами, которые ищут более существенные факты. Часто слово может вызвать ожидания, направленные на поиск конкретных слов, указывающих, какой сценарий применим в данной ситуации. Например, упоминание вооруженного человека порождает ожидания, которые ищут подтверждения для сценариев, связанных с терроризмом, похищением или ограблением. Запрос, целью которого является поиск подтверждений для сценария налета, может включать проверки на конкретные слова (или сочетания) типа diverted 'отвлекли внимание', hijack 'налет на транспорт (с целью ограбления)', took over 'увезли', которые сигнализируют о наличии сцепы налета. Запросы используют также   проверки   на   концептуальном   уровне. Запрос, активизируемый словом gunman и проверяющий уместность сценария терроризма, обращает внимание на место происшествия. Если это место, где размещается какая-то политическая организация (посольство, штаб-квартира какой-либо партии и т. п.), то мы имеем дело с явным подтверждением пригодности сценария терроризма. Образец запроса приводится ниже (см. стр. 431  и ел.).

Внутри широких категорий слов, подлежащих немедленной обработке, и слов, которые записываются в ОП и пропускаются, существуют подкатегории, помогающие решать вопрос о конкретном способе обработки данного слова. Необходимо высказать еще два условия, влияющие на классификацию слов. Первое связано с тем, как данное слово видоизменяет создаваемую семантическую репрезентацию; второе — это тип ожиданий, вызываемых данным словом. Классификация слов учитывает оба этих условия. Ниже описывается каждый класс слов и указывается, как их обрабатывает IPP. Для каждого класса приводится образец словарной статьи.

Образец запроса

~FIND—                ~Ha основании   обнаружения   подходя-

$HIJACK                щих слов или понятий вызывает сце-

'пайти—                  нарий налета   на транспорт  (с целью

сценарий                 ограбления), строит представление со-

— налёта'               бытия налета и порождает несколько

новых запросов, ожидая сцены и другие действия. (Данная команда вызывается словом GUNMAN.)

(DEF—REQ FIND—$HIJACK

'(дефиниция запроса найти—сценарий—налета'

TEST (HIJACK—INSTANTIATOR             ~Тест ищет слова,
*NEW—-ITEM*)                                              которые указы-
'проверка (слово—вызывающее —
                   вают на сцена-
налет* новая—единица*)'
                                         рий налета

ACTION (REQ—EVENT 8              ~Действие строит собы-

(SCRIPT $HIJACK                               тие по сценарию   на-

'действие                                              лета при уровне инте-

(запрос—события 8                              реса  8,   заполняемые

(сценарий налета'                                  позиции здесь указа-

ны. Позиция деятеля

заполняется последним деятелем, поступившим в НАКОПИТЕЛЬ   ДЕЯТЕЛЕЙ.

ACTOR                    NIL

'деятель'                   'пусто'

DEMANDS              NIL

'требования'              'пусто'

FROM                      NIL

'от'                            'пусто'

DESTINATION      NIL

'цель'                        'пусто'

ТО                            NIL

'к'                              'пусто'

PASSANGERS        N11

'пассажиры'              'пусто'

VEHICLE                NIL)

'транспорт'               'пусто')

((ACTOR. (TOP-OF «ACTOR-STACK*)))

'((деятель, (последний в "нако
пителе—деятелен*)))'
(REDUNDANT—HI JACK-
WORDS
                                         ~   Актнвнзиру-

'(избыточные—слова—налета'               юте я

FIND-HIJACK-                              ~ это новые

DESTINATION                                   запросы

'найти—цель—налета'
FIND -111J А СК—V ЕIIICL Е
'найти- транспорт—налета')
FIND-HIJACK— PASSANGERS
'найти—пассажиров- налета'
FIND—HIJACK—EVENTS
'найти—события—налета'
SURRENDER-SCENE
'сцена -сдачи'
RECOGNIZE—DEMANDS
'распознать—требования'
R ECOGNIZE COUNT E R MEASURES)

'распознать—меры—противодействии')

 

 

А - СЛОВА,  ПОДЛЕЖАЩИЕ НЕМЕДЛЕННОЙ ОБРАБОТКЕ

В рамках теории интегрального анализа слова классифицируются прежде всего в соответствии с типом концептуальных структур, которые они строят. Иначе говоря, наиболее важная роль, которую играет слово с точки зрения предлагаемой концепции анализа, это не его синтаксическая роль ("существительное", "глагол" и т. п.) и даже не его понятийная роль ("деятель", "действие" и т. п.). С нашей точки зрения, наиболее существенная характеристика слова.— это то, как оно влияет на обработку текста в рамках интегрального процесса понимания.

В семантическом представлении, приведенном выше для предложения о вооруженном человеке, говорящем по-арабски, представлены два разных вида единиц. С одной стороны, имеют место определенные события: сценарий терроризма, сцена пленения, убийство вооруженного человека и т. д., с другой стороны — индивидуальные понятия, играющие''ту или иную роль: "вооруженный человек", заполняющий позицию ДЕЯТЕЛЯ в сценарии терроризма, или "иракское посольство", заполняющее позицию МЕСТА в этом сценарии, и т. д. Слова, заполняющие позиции, мы будем называть элементами (tokens). Имея в виду это разграничение между элементами и событиями,  рассмотрим  классификацию слов.

AI— СЛОВА,    ОТВЕТСТВЕННЫЕ    ЗА ПРЕДСТАВЛЕНИЕ СОБЫТИЙ

(Образец словарной статьи А1 см. на с. 436437).

Один класс образуют слова, которые инициируют построение структур событий. Мы называем их словами, ответственными за представление событий (event builders), сокращенно — ПС-слова. Этот класс слов включает много ; глаголов и ряд существительных типа "убийство", "мятеж", "налетчик". Всем ПС-словам приписывается указание на уровень интереса. Это помогает определять, является ли событие достаточно значимым для того, чтобы быть включенным в окончательное представление текста, то есть достаточно ли оно интересно для того, чтобы считать его центральным событием в данном представлении, и достаточно ли оно важно для того, чтобы мы тратили драгоценное время обработки на попытки заполнить его пустые позиции. Всем ПС-словам приписывается также набор ожиданий, помогающих управлять ходом анализа. Эти ожидания   разнообразны — от  запросов,   имеющих  своей

целью заполнить конкретные позиции последующими словами текста, до общих ожиданий относительно событий, которые, по всей вероятности, должны произойти (в соответствии с набором сцен некоторого сценария).

ПС-слова подразделяются далее согласно типу события, построение которого они инициируют. Многие широкоупотребительные слова типа "дал", "пошел", "съел" строят простые события (не представляющие большого интереса с точки зрения своих внутренних свойств). Это события, которые мы всегда могли представлять довольно легко в рамках теории концептуальных зависимостей (S с h a n к, 1972; 1975). В ходе нашей последующей работы над структурами знаний более высокого уровня мы пришли к выводу, что наиболее существенными являются те виды семантических представлений, которые связаны со сценариями, планами и целями (см. S с h a n k and Abel son, 1977). Из сказанного следует, что те ПС-слова, которые строят простые структуры на основе концептуальных зависимостей, требуют меньше всего внимания при обработке, потому что они наименее интересны. Они образуют отдельный подкласс ПС-слов. На них в процессе анализа почти никогда не расходуется много времени. Им приписаны довольно простые ожидания, нацеленные обычно па заполнение таких позиций, как ДЕЯТЕЛЬ, ОБЪЕКТ, К (направление), ОТ (направление), ИНСТРУМЕНТ. Чтобы начать искать информацию для удовлетворения этих ожиданий, эти ожидания в конечном счете должны быть связаны с более интересным событием или должен существовать интересный деятель, который, предположительно, будет участвовать в данном действии.

Другие разновидности ПС-слов — это слова, ответственные за построение сценариев, и слова, ответственные за построение сцен. Слова обоих этих типов могут иметь гораздо более сложные запросы, часто предсказывающие возможные события. Единственное реальное различие между этими двумя разновидностями (с одной стороны, это слова типа "налет", "похищение", а с другой — слова типа "сдаваться", "осужденный") состоит в том, что на основе слов второй разновидности мы делаем умозаключение о вероятном сценарии, так как сцены не могут иметь места в изоляции, а на основе слов первой разновидности мы строим ожидания, касающиеся вероятных сцен данного сценария.

Другие структуры знаний, используемые при понимании текстов, такие, как планы, цели и темы, также ассоциированы с определенными ПС-словами (то есть со словами, которые строят эти структуры непосредственно), но для большого класса газетных сообщений оказывается достаточным учитывать те виды ПС-слов, которые упоминались выше. (Строго говоря, структуры знаний более высокого уровня обычно не фиксируются посредством какого-то конкретного слова непосредственно. Наличие таких структур чаще всего должно устанавливаться посредством умозаключений.)

Когда система прочитывает некоторое ПС-слово, на основе шаблона, хранящегося в словаре, строится пустая структура события. Затем IPP проверяет, есть ли запросы, ожидающие этого события. Часто событие довольно легко получает соответствующую интерпретацию благодаря ожиданиям, созданным на основе контекста рассказа."Если подходящих ожиданий нет, то учитывается уровень интереса данного события, указанный в словаре. Если данное событие не представляет большого интереса, то анализатор переходит к следующему слову. Если же событие представляет значительный интерес, то вызываются ожидания, записанные в словарной статье данного слова, снабженные ссылкой на структуру нового события.

IPP следит за главным событием рассказа. Он проверяет, не возникло ли какого-то нового события, представляющего больший интерес, чем старое главное событие. Если появившееся интересное событие представляет меньший интерес, чем текущее главное событие, и если оно не отвечает никакому ожиданию, то оно хранится в качестве необъясненного события, что указывает на необходимость для IPP искать какое-то объяснение.

А2 - СЛОВА, ОТВЕТСТВЕННЫЕ ЗА СОЗДАНИЕ ЭЛЕМЕНТОВ

(Образец словарной статьи А2 см. на с. 489.)

Многие слова, включая большинство существительных (типа "вооруженный человек" или "посольство"), участвуют в процессе понимания, заполняя пустые позиции в структурах событие. Мы называем этот класс словами, ответственными за создание элементов (token markers), сокращенно — СЭ-слова. Эти слова приводят к построению элемента. Если данное слово представляет интерес или в оперативной памяти   хранится   какое-либо  интересное  определение  (и

только в этих случаях), то из оперативной памяти извлекаются слова, которые модифицируют данный элемент. Создаваемые элементы часто являются объектами, которые ищутся анализатором на основе ожиданий, сформированных во время обработки предыдущих слов предложения. Класс СЭ-слов может разбиваться на подклассы двумя способами. Прежде всего, имеется несколько различных типов элементов по их характеру: элементы, обозначающие деятеля, место, организацию, средства передвижения, время и другие. Тип создаваемого элемента является одним из факторов определения того, удовлетворяет ли данный новый элемент некоторому ожиданию, сформированному ранее.

Образец словарной статьи (А1)

(WORD—DEF OCCUPIED
('описываемое слово "занял"'
INTEREST        5            'интерес'         5
TYPE                 ЕВ          'тип'               'ПС-слово*

SUBCLASS      SEB       'подкласс'       'ПС-слово,

задающее
сцену'

TEMPLATE(SCRIPT                                   Слово OCCU-

$DEMONSTRATE                                      PIED    иниции-

'шаблон' ('сценарий' 'демонстри-             рует построение

ровать'                                                        структуры,    за-

ACTOR           NIL                                      дающей   сцена-

'деятель'          'пусто'                                  рий  демонстра-

OBJECT          NIL                                      ции,   включаю-

'объект'           'пусто'                                  щий сцену зах-

DEMANDS     NIL                                      вата здания,

'требования'  'пусто'
METHOD       (SCENE                 $OCCUPY
'метод'            ('сцена'                   'зани-

мать'
ACTOR        NIL
'деятель'       'пусто'
LOCATION NIL))
'место'          'пусто'))

FILL (((ACTOR)                  (TOP—OF *AC-~ Заполняются

TOR—STACK*))    позиции 'заполнить'   ((('деятель'    ('последний в на-    деятелей

копителе   деяте
лей'))

((METHOD ACTOR)       (TOP—OF   •ACTOR-STACK*)))

(('деятель метода')           ('последний в* накопителе   деятелей*')))

REQS       (FIND—DEMON—OBJECT        ~Ожидание,
'запросы' 'найти—объект       демона'
         связанное о поис-

ком того .против
кого      направ
лена демонстра
ция.

FIND—OCCUPY—LOC          ~Ожидание, свя-

'найти—захваченное—               занное  с   поис-

место'                                            ком   места   де-

монстрации.

RECOGNIZE—                         ~Ожидание, свя-

DEMANDS]                                  занное с   поис-

'распознать—требования']         ком требований.

Другое подразделение СЭ-слов касается того воздействия, которое оказывает СЭ-слово на последующую обработку. Это деление основано на том, насколько интересным является данное СЭ-слово. Интересные СЭ-слова порождают ожидания относительно того, что мы можем ожидать в последующей части предложения. Так, слово gunman порождает ожидания, касающиеся стрельбы, похищения или ограбления. Интересные СЭ-слова, выполняющие роль деятеля в каком-либо событии, порождают, естественно, ожидания, связанные с вероятным появлением дополнительной информации об этих людях. Например, gunman активизирует запросы, которые ищут подходящие

сценарии.

СЭ-слова, не являющиеся интересными и поэтому не порождающие никаких ожиданий, могут быть отнесены к одному из двух подклассов — обычных (normal) СЭ-слов

и пустых СЭ-слов. Обычные СЭ-слова могут быть легко соотнесены с объектами, уже находящимися в памяти, даже если они не представляют интереса. Примеры обычных СЭ-слов: "аэропорт", "Вермонт", "служащие". Элементы, создаваемые обычными СЭ-словами, могут использоваться для заполнения позиций в представлении текста. Пустые СЭ-слова, с другой стороны,— это слова, сведения о которых являются настолько нечеткими, что фактически бессмысленно включать их в окончательное представление предложения. К этому классу относятся слова типа "люди", "место", "кто-нибудь". Эти слова создают элементы, могущие аннулировать ожидания, но в окончательное представление они не включаются. Если к данному элементу не адресовано никакое ожидание и он не представляет интереса сам по себе, то по нашей схеме анализа он игнорируется, так как вряд ли есть смысл запоминать его.

В — СЛОВА,   КОТОРЫЕ  ЗАПИСЫВАЮТСЯ   И  ПРОПУСКАЮТСЯ

Многие слова нет нужды обрабатывать, когда мы прочитываем их в первый раз. Они просто записываются в оперативной памяти, а их обработка, если она оказывается необходимой, завершается позднее. Следует признать два важных положения, касающихся такого рода слов. Во-первых, тот факт, что мы записываем слово, еще не означает, что мы будем обязаны осуществлять его дальнейшую обработку. Большинство записываемых и пропускаемых слов не представляет большого интереса, и если какое-то последующее интересное слово не потребует их рассмотрения, пропущенные слова могут быть оставлены без дальнейшей обработки. Предполагается, что процесс запоминания (записи) слова очень легок, так что записываемые и пропускаемые слова часто требуют очень маленьких затрат времени на их обработку. Другое важное положение, касающееся такого рода слов, состоит в том, что при определении того, какие слова подлежат записи и пропуску, а какие полностью пропускаются, существенную роль играют предметная область и контекст. Так, например, слово типа tall 'высокий' полностью пропускается во многих предметных областях (например, в сообщениях, помещаемых в различных рубриках газеты), но при чтении сообщения из спортивной жизни оно может быть расценено как слово, подлежащее записи и пропуску, так как высокий.

Образец словарной статьи (А2)
(WORD—DEF            GUNMAN

'описываемое слово' 'вооруженный человек'

INTEREST 5                                      -Слово GUNMAN

'интерес'       5                                        является   интерес-

TYPE            ТМ                                    ным СЭ-словом.

'тип'              СЭ-слово

SUBCLASS   ACTOR

'подкласс'    деятель

MEMORY    T

'память'        Т

REQS            (CONFIRM—SHOOT —Ожидание стрельбы

'запросы'      ('подтвердить—стрелять'

FIND—WHY—SHOOT —Ожидание причин,
'найти—почему—стре- заставивших дан-
лять'
                                    ногочеловекастре-

лять в кого-то.

(FIND— $TERRORISM~ Набор    ожиданий,

('найти—сценарий—       которые       задают

терроризм'                       сценарии,    вероят-

F1ND—$ROBBERY       ные    для     данной

'найти—сценарий—        ситуации. Если бу-

ограбления'                     дут   удовлетворены

FIND—$KIDNAP          условия   одного   из

'найти—сценарий—по- них,   то  остальные

хищения'                         будут    аннулирова-

FIND—$HIJACK]            ны.

'найти—сценарий—налета']

рост человека в некоторых ситуациях может выдвигаться на передний план.

Класс записываемых и пропускаемых слов может быть подразделен на несколько подклассов, в зависимости от того, что мы делаем со словом, если мы принимаем решение производить его дальнейшую обработку. (Напомним, что вполне вероятно, никакой обработки может не последовать вообще.)

BI - СЛОВА,  СЛУЖАЩИЕ ДЛЯ  УТОЧНЕНИЯ ПРЕДСТАВЛЕНИЙ ЭЛЕМЕНТОВ

Первый класс записываемых и пропускаемых слов нацелен на пополнение представлений элементов, построенных в результате обработки СЭ-слов. Слова этого класса служат для усовершенствования (уточнения) представлений элементов (token refiners) и сокращенно обозначаются как УЭ-слова. Большинство слов, которые обычно выступают в составе именных групп, в том числе многие прилагательные, являются УЭ-словами в тех областях, где их нельзя пропускать полностью. Так, в рассмотренном выше примере Arabic является УЭ-словом, которое уточняет представление элемента в роли деятеля, построенного для слова gunman; это уточнение состоит в указании "nationality: Arabic" 'национальность: араб'. Обработка всех УЭ-слов начинается одинаково. Каждое УЭ-слово подлежит временному хранению в памяти до тех пор, пока не будет найдено то СЭ-слово, которое оно модифицирует; в этот момент оно может быть извлечено из памяти и подвергнуто дальнейшей обработке; способ обработки зависит от типа УЭ-слова. (Если СЭ-слово оказывается неинтересным, дальнейшая обработка не производится.)

Класс УЭ-слов может быть разбит на подклассы тремя способами в зависимости от того, как изменяются представления элементов, модифицируемых ими. Большой класс УЭ-слов приводит просто к добавлению какого-либо свойства к некоторому элементу. Эти УЭ-слова (будем называть их простыми УЭ-словами) включают употребительные прилагательные типа "красный", "высокий", "арабский", если они в данной области не могут просто пропускаться. Сюда же попадают обычно слова типа "ранний" или "поздний".

Другие УЭ-слова модифицируют свойства, добавленные к элементу другим модификатором. Например, в сочетании about 20 gunmen 'около 20 вооруженных людей' в результате действия числа 20 к элементу, отображающему вооруженных людей, добавляется информация NUMBER 20, а слово about меняет эту запись на другую: NUMBER (APPROX 20), Слова этого класса можно назвать модификаторами УЭ-слов. Остается неясным, как часто слова этого класса могут вообще пропускаться. Скорее всего, большинство этих слов игнорируется почти всегда, но в некоторых случаях их необходимо записывать в ОП и лишь затем пропускать.

Третий класс УЭ-слов — это имена собственные, просто добавляющие к элементу информацию о его имени. Так, в сочетании Kennedy International Airport 'Международный аэропорт им. Кеннеди' слово Kennedy добавляет к элементу, отображающему аэропорт, его название. Обработка, этих УЭ-слов отличается от обработки предыдущего подкласса лишь тем, что они не могут модифицироваться другими модификаторами.

Один общий момент в обработке всех типов УЭ-слов состоит в том, что в их словарных статьях может содержаться указание на то, что модифицируемый ими элемент становится более интересным. Так, Arabic gunman представляет больший интерес, чем просто gunman, благодаря тому,   что   УЭ-слово   Arabic  обладает  высокой   степенью

интересное™.

Заметим, что обработка по принципу "записать и пропустить" облегчает анализ тех УЭ-слов, значение которых зависит от модифицируемых ими слов, так как реальная дефиниция данного УЭ-слова не подвергается обработке до тех пор, пока не становится известным соответствующее СЭ-слово. Такая обработка упрощает также случаи, когда СЭ-слово активно ищет конкретные типы слов, которые могут его модифицировать.

Образец словарной статьи (В1)
(WORD—DEF      ARABIC              ('описываемое'арабский'

слово'
TYPE             TR                          'тип'              'УЭ-слово'

SUBCLASS   STR                        'подкласс'    'простое

УЭ-слово'

INTEREST   2                              'интерес'       2

MEMORY      Т                           'память'       Т

DEF              (NATIONA-           'дефиниция'  '(нацио-

LITY.   ARABIC)                        нальность:

араб)'

В2 — СЛОВА,   СЛУЖАЩИЕ ДЛЯ  УТОЧНЕНИЯ   ПРЕДСТАВЛЕНИЙ СОБЫТИЙ

Уточнители событий (event refiners) (сокращенно УС-слова) очень сходны с УЭ-словами, за исключением того, что они модифицируют не элементы, а события. Типичными

для этого класса являются наречия типа "быстро", "глупо". Сюда же попадают слова "здесь", "прочь", так как они изменяют содержание некоторой позиции в описании модифицируемого события, например в сочетаниях was shot here 'был застрелен здесь' или was led away 'был уведен прочь'. Слова, которые хотелось бы относить к этому классу, на самом деле подлежат пропуску даже чаще, чем УЭ-слова. Упоминавшиеся выше наречия на -1у являются УС-словами в том случае, когда они сохранены в памяти, но чаще всего они расцениваются как пустые слова и полностью пропускаются. Как указывалось выше, определение того, следует ли сохранять данное слово в памяти, зависит от предметной области. УС-слова разделяются на стандартные УС-слова и модификаторы УС-слов (аналогично делению УЭ-слов). Обработка протекает аналогично обработке УЭ-слов, с тем отличием, что она начинается, когда создается представление некоторого события; в этом случае производится 'поиск УС-слов в последующей части текста, а также в оперативной памяти.

Образец словарной ^статьи (В2)
(WORD—DEF    AWAY            ('описываемое    'прочь'

слово'
TYPE            ER                    'тип'                  'УС-слово'

SUBCLASS SER                    'подкласс*        'стандартное

УС-слово' DEF   (TO. NOT-HERE)     'дефиниция'     '(по   направлению к: нездесь)'

ВЗ — ФУНКЦИОНАЛЬНЫЕ СЛОВА

В английском языке есть важный класс слов, которые не обладают собственным значением или обладают им в слабой степени; они существуют исключительно для того, чтобы направлять процесс обработки текста. Эти слова, называемые функциональными словами, весьма употребительны и включают артикли, предлоги и вспомогательные глаголы. Функциональные слова, вообще говоря, не могут быть совсем пропущены, но часто процесс анализа никогда к ним не возвращается во второй раз. Они должны записываться в оперативной памяти, поскольку в случае появления интересных слов они могут стать важными, но сами по себе они не нуждаются в обработке.

Роль артиклей (a, an, the) состоит в том, чтобы отмечать начало именных групп, а также показывать, какие УЭ-слова относятся к каким СЭ-словам. Когда мы читаем текст, они записываются вместе с УЭ-словами. Затем, в процессе обработки некоторого СЭ-слова, мы смотрим назад на предшествующие слова и пытаемся найти среди них УЭ-слова. Если мы встречаем артикль, наш поиск прекращается.

Предлоги (with 'с', 'посредством', to 'k', from 'от' и т. д.) имеют в английском языке немало функций. Часто они указывают, каким образом следующее за ними СЭ-слово должно включаться в создаваемую структуру. В нашей системе предлоги чаще всего используются пассивным образом. ПС-слово нередко формирует ожидания для определенного предлога с указаниями относительно того, как поступать с СЭ-словом, стоящим после данного, предлога. Так, слово shot 'застрелил' формирует ожидание для предлога with 'с помощью' и дает указание о том, что СЭ-слово, следующее после with, должно быть направлено в позицию ИНСТРУМЕНТА для данного события.

Немало функций несут и вспомогательные глаголы, например: фиксация времени (did go 'пошел-таки') или придание событию гипотетического оттенка (may go 'может пойти'). Одно из важнейших употреблений вспомогательных глаголов — это использование форм глагола to be 'быть' для придания основному глаголу значения пассива. Когда событие строится в результате действия причастия прошедшего времени, анализатор проверяет наличие такого вспомогательного глагола, и если находит его, то соответствующим образом модифицирует процесс обработки на низшем уровне.

Образец словарной статьи (ВЗ)

(WORD—DEF       А            ('описываемое  'неопределенный

слово'               артикль'

TYPE               FW        'тип'                  'функциональное

слово' SUBCLASS    ART)      'подкласс'        'артикль')

В4  -  РЕЛЯЦИОННЫЕ СЛОВА

Реляционные слова осуществляют связь между двумя событиями. Обработка всех этих слов проводится, как правило, единообразно. Слово хранится в памяти до тех пор, пока не появляется значительное событие. Тогда устанавливается нужная связь между этим событием и предыдущим. Если реляционное слово соединяет в предложении неинтересные события, то никакой дополнительной обработки не производится.

Реляционные слова устанавливают два главных вида связи — временную и причинную. Первая обозначается словами типа before 'перед тем как', while 'в то время как', after 'после того как', а вторая — словами типа because 'потому что', since 'так как', therefore 'поэтому'.

Образец словарной статьи (В4)

 

(WORD—DEF

BEFORE

('описываемое слово'

'перед тем как'

 

 

 

 

TYPE

RW

'тип'

'реляционное слово'

SUBCLASS

TRW

'подкласс'

'временное слово'

RELATION

AFTER)

'отношение'

'после')

С — ПРОПУСКАЕМЫЕ    СЛОВА

Неожиданно большой класс слов образуют слова, которые пропускаются совсем. Когда мы их обрабатываем, мы абсолютно ничего с ними не делаем. Это один из способов экономии значительного количества времени в ходе обработки текста. Из приводившегося выше примера в этот класс попадают такие слова-, как and 'и', who 'который', speaking 'говорящий'. Важная тема будущих исследований — определение того, какие именно слова подлежат полному пропуску. Чем шире класс пропускаемых слов, тем быстрее будет работать программа. Видимо, существует мало слов (если такие вообще есть), которые могут пропускаться во всех предметных областях, для всех категорий читателей, для любого уровня обработки. Но для данного читателя, действующего в рамках данной предметной области, к категории пропускаемых относятся очень многие слова.

Множество пропускаемых слов может также пополняться в процессе самой работы анализатора, даже за счет, казалось бы, очень интересных слов. Так, если мы уже знаем, что реализуется сценарий "захват заложников", то слова типа "террор", "захват", "стрельба" становятся пропускаемыми, так как мы уже вывели все умозаключения, которые могли бы быть подсказаны этими словами. Относительно таких слов формируются ожидания, которые нейтрализуют   приписанную   им   интересность.

6. ЗАКЛЮЧЕНИЕ

Внимательный читатель заметит, что в окончательных представлениях,  получаемых  на выходе нашего анализатора, мало используются инструменты типа тех, которые составляли  основу  теории   концептуальных  зависимостей (S с h a n к,  1972,  1975). Этот факт отражает произведенный в последние годы пересмотр нашей точки зрения на проблему семантических представлений.  В работе  S с h a n k and   A b е 1 s о п,   1977   мы   предложили   новый   уровень представления,   названный   уровнем   структуры   знаний, который фиксирует более крупные информационные структуры   по  сравнению  с  теми,   которые  использовались   в нашей   первоначальной   концепции.   В   работе  S с h a n k and С а г b о п е 1 1,  1978 было предложено еще одно дополнение к нашей системе представлений, нацеленное на обработку   информации   о   социальных   и   политических актах,   которые   весьма   слабо   поддавались   обработке   в рамках предшествующих систем. Мы и раньше, конечно, сознавали, что существует много факторов, не поддающихся адекватному  представлению в терминах  концептуальных зависимостей.   Потребность   в   новых   репрезентационных схемах была и остается очевидной. Но раньше мы всегда пытались сначала перевести исходный текст на язык концептуальных    зависимостей,    предпочитая    разрабатывать механизмы   вывода   умозаключений, отталкиваясь именно от такого способа представления информации. В этом подходе было два  положительных  момента.   Во-первых,    он позволял большому  числу  людей,  работавших  в  рамках нашего проекта, общаться друг с другом (то же относится и   к   программам,   которые   создавались   этими   людьми). Язык концептуальных зависимостей играл роль интерлинг-

вы, пли концептуального эсперанто, с помощью которого все участники могли общаться, Во.-вторых, помимо этого прагматического достоинства, мы считали, что данный вариант реализации принципа модульности был правильным и с теоретической точки зрения. Попросту говоря, мы верили, что из предложений извлекаются значения, которые затем  подвергаются действию других  процессов.

Очевидная альтернатива, которую мы избрали, когда разрабатывали две дополнительных репрезентационных системы, упомянутых выше, состояла в том, чтобы попытаться переводить анализируемый текст непосредственно в эти репрезентации. Хотя мы продолжали верить, что люди извлекают значения из того, что они слышат, мы уже не видели оснований для того, чтобы считать, будто эти значения могут иметь одну и только одну форму. Если" глагол want 'хотеть' лучше всего представляется на основе связи с понятием цели и в то же время получает довольно сложное представление на языке концептуальных зависимостей, то на каком основании мы должны полагать, что для получения простого представления человек должен пройти через этап более сложной формы? Многочисленные вопросы такого типа лежали в основе возражений ряда ученых против нашего понятия элементарных компонентов (primitives). В частности, к обсуждению наших компонентов несколько раз возвращались Бобров и Виноград (В о b г о w and W i n о g r a d, 1977). Они предложили понятие переменной глубины обработки (в противовес нашему компонентному представлению). В некотором смысле система, описанная в настоящей статье, использует это предложение. Бобров и Виноград правы, утверждая, что различные уровни обработки имеют смысл в разных ситуациях. Но мы не согласны с ними в вопросе о том, каков наилучший набор уровней. Мы не считаем, что разумными конечными точками являются сами слова или синтаксические понятия. Отсутствие инструментов теории концептуальных зависимостей в наших конечных репрезентациях, приведенных выше, допускает возможность более широкой точки зрения. Иначе говоря, мы согласны с тем, что при осуществлении процесса понимания мы должны идти настолько далеко (или глубоко), насколько это нам необходимо.

Какова  же тогда  роль  концептуальных  зависимостей и элементарных компонентов? В рамках нашего анализатора аппарат концептуальных зависимостей применяется как своего рода внутренний язык, используемый в ситуациях, когда целесообразная форма окончательного представления не является очевидной. Его применение позволяет осуществлять вывод умозаключений на концептуальной основе. Как это ни странно, эта его функция стала приобретать черты сходства с нашим способом использования синтаксиса в ходе анализа. Иначе говоря, уровень организации знаний, отражаемый этим метаязыком,— это нечто, находящееся за сценами и осуществляющее свое действие скрытым образом, почти без поверх ностно

проявления.

Главный  вывод из  всего этого заключается,  следовательно, в том, что, по нашему мнению, модульные системы в конечном счете распадутся под действием их собственной громоздкости.   "Человекоподобные"   понимающие   системы должны быть интегрированными в такой степени, чтобы они могли руководствоваться присущими им интересами, подробно  анализируя  то,   что  их   привлекает,   и  пропуская то, что не вызывает у них интереса. Именно таков истинный смысл понятия переменной глубины анализа. Другими словами, если мы действительно будем уделять одинаковое внимание   всему,   что   может  быть  объектом   понимания, может случиться,  что мы никогда не закончим процесса понимания.   Учитывая   соображения   времени   обработки, мы должны  констатировать,  что  безусловное  извлечение абсолютно всех умозаключений и структур знания в худшем случае  невозможно,  а в лучшем — практически неосуществимо. Человек,  понимающий тексты на естественном языке, руководствуется тем, что он хочет знать (а также тем, чего он не хочет знать). Это позволяет ему не замечать всех неоднозначностей, проблем полисемии, бесчисленных импликаций и других трудностей, кроющихся в том, что он слышит. Но то, что он теряет в плане совершенства достигаемого уровня понимания, он компенсирует скоростью и надежностью процесса обработки текста. Возможно, настало время предоставить нашим машинам те же преимущества.

ЛИТЕРАТУРА

В о b г о w, D. G. and F r a s e r, J. B. An Augmented State Transition Network Analysis Procedure.— In: "Proceeding of the International Joint Conference on Artificial Intelligence", I, Washington, 1969.

Bobrow, D. G. and W i n о g r ad, T. An Overview of KRL, a Knowledge Representation Language.—"Cognitive Science", Vol. 1, No 1,   1977.

"CMU Computer Science Speech Group". (Working Papers in Speech Recognilion-IV. The Hearsay II System, 1976).

Carbonell, J. G. Jr. Subjective Understanding: Computer Models of Belief Systems. (Research Report 150, Yale University, Department of Computer Science),   1979.

С и I I i n g f о г d, R. Script Application: Computer Understanding
of Newspaper Stories. (Research Report
116, Yale University, Department
of Computer Science),
1978.                ~   ' '

D e J о n g, G. F. Skimming Newspaper Stories by Computer. (Research Report 104, Yale University, Department of Computer Science), 1977.

Gershman, A. Analyzing English Noun Groups for Their Conceptual Content. (Research Report 110. Yale University, Department of Computer  Science),   1977.

Granger, R. H. FOUL-UP: A Program That Figures Out Meanings of Words from Context.In: "Fifth International Joint Conference on Artificial Intelligence". Cambridge, Massachusetts, 1977, August.

Kaplan, R. M. On Process Models for Sentence Analysis.In: "Explorations in Cognition" (D. A. Norman and D. E. Rumelhart (eds.)). San Francisco, W. H. Freeman and Company,  1975.

Lamb, S. Outline of Stratificational Grammar. Georgetown University Press. Washington, D. C, 1966.

Marcus, M. A Theory of Syntactic Recognition for Natural-Language. Cambridge, Massachusetts, MIT Press, 1979.

Marslcn-Wilson, W. D. Sentence Perception as an Interactive Parallel Process.—"Science", Vol. 189, 1975, p. 226—228.

Newell, A. Production Systems: Models of Control Structures.— In: "Visual Information Processing" (Chase, W. С (ed.)). New York, Academic   Press,   1973.

P 1 a t h, W. J. Tranfsormational Grammar and Transformational Parsing in the REQUEST System.In: "Computational and Mathematical Linguistics" (Zampolli A. (ed.)),  1973.

R i e s b e с к, С. К. Conceptual Analysis.In: "Conceptual Information Processing" (Schank R.C. (ed.)). Amsterdam, 1975.

R i e s b e с k, С. К. and Schank, R.C. Comprehension by Computer: Expectation-based Analysis of Sentences in Context. (Research Report 78, Yale University, Department of Computer Science), 1976.

Schank, R.C. Conceptual Dependency: A Theory of Natural Language Understanding.—"Cognitive Psychology", Vol. 3, No. 4, 1972.

Schank, R.C. Conceptual Information Processing. Amsterdam, 1975. (См. сноску на с. 256.)

S с h a n k, R. С Interestingness: Controlling Inferences. (Research Report 145. Yale University, Department of Computer Science), 1978.

Sella n k, R.C. and A b e 1 s о n, R. P. Scripts, Plans, Goals and Understanding. Lawrence Erbaum Associates, Hillsdale, New Jersey, 1977.

Schank, R,C. and Carbonel 1, J. G. Jr. The Gettysburg Address: Representing Social and Political Acts. (Research Report 127, Department of Computer Science, Yale University), 1978.

Schank, R.C. and S e 1 f r i d g e, M. How to Learn/What to Learn.— In: "Fifth International Joint Conference on Artificial Intelligence". Cambridge, Massachusetts, 1977, August,

S с h a n к, R. С. and T e s 1 e r, L. A Conceptual Parser for Natu-"al Language.In: "Proceedings of the International Joint Conference on Artificial Intelligence". Washington, D. C,  1969.

S с h a n k, R. C, T e s 1 e r, L. and W e b e r, S. Spinoza II: Conceptual Case-Based Natural Language Analysis. (Stanford Artificial Intelligence Project Memo No AIM-109). California, Stanford, Computer Science Department, Stanford University, 1970.

Schank, R.C. Yale AI Project. SAM A story understander. (Research Report 43,  Department of Computer Science, Yale University),

1975.

Thotnc, J., В r a t 1 e y, P. and D e w a r, H. The Syntactic Analysis of English by Machine.In: D. Mi с h i e (ed.). Machine Intelligence, 3. New York, American Elsevier Publishing Company,  1968.

W i 1 e n s к у, R. Understanding Goal-Based Stories. (Research Report 140, Department of Computer Science, Yale LIniversity), 1978.

W i 1 к s, Y. An Artificial Intelligence Approach to Machine Translation.In: "Computer Models of Thought and Language" (R. С Schank and K. Colby (eds.)). San Francisco, W. H. Freeman and Co., 1973.

W i n о g r a d,    T.  Understanding Natural  Language,  New  York,

Academic Press,   1972.

Woods, W. A. Augmented Transition Networks for Natural Language Analysis. (Report CS-1, Computer Lab., Harvard University).
Cambridge,   Massachusetts,  
1969.



[1] * Roger С. S с h a n k, Michael L e b о w i t z, Lawrence В i r n-b a u m. An integrated understander."American Journal of Computational Linguistics", 1980, Vol. 6, No 1, p. 13—30. При переводе настоящей статьи па русский язык редакция сочла возможным сократить ряд примеров.— Прим. ред.

© Association for Computational  Linguistics (1980).