Модель мыслительной системы на сущностно-языковой основе

Казаков А.И., Обухов Л.И.
Киевская лаборатория искусственного интеллекта
alex@kazakov.kiev.ua

  В статье описывается лингвистическая модель мыслительной системы с ориентацией на программную реализацию. Внутреннее представление основано на системах реплик, конфигурирующихся в сценарии, цели, законы и правила. Основным средством развития системы является серия обучающих курсов по различным темам компьютерной лингвистической семантики – курс связи с внешней средой, сенсомоторная лексика, логика здравого смысла, курс ведения диалога и т.д. Главная цель и спецификация проекта – адекватное естественно языковое общение-диалог компьютерной программной системы с человеком-пользователем на русском языке. Остальные цели относительно производные. К ним, например, относится решение задач, составление планов, толкование текстов, «внешнее поведение» и др.



Приведем общее описание Мыслительной Системы (МС) по аналогии с материальной символьной системой Саймона и Ньюэлла [1]. Мыслительная система состоит из Долговременной Памяти (ДП), Рабочей Памяти (РП), содержащих сценарии-программы, и очереди целей (ОЦ). ДП и РП содержат сообщения, цели, сценарии и знания в терминах сообщений (см.ниже), которые разложены на сущности-образы и слова, определяющие отношения и свойства сущностей-образов.

  Мыслительная система также содержит набор процессов, которые оперируют этими сообщениями, строят новые, модифицируют, воспроизводят и разрушают сообщения. Эта машина порождает развертывающийся во времени набор сообщений различных типов. Она обладает знаниями и умеет поддерживать диалог, а также может рассматриваться как погруженная в более широкий мир через диалог с СенсоМоторной Системой (СМС). СМС вербализует сенсорную информацию в сообщения из мира и реализует императивные сообщения от МС в виде реальных действий в мире. Мыслительная система есть абстрактная модель работы как ЭВМ так и мыслительной деятельности человека, абстрагированной от сенсомоторной периферии с акцентом на сущностно-языковые процессы.

Она является компьютерной точкой зрения на мыслительную деятельность человека и ее модель в машине. Одна из важных практических задач заключается в том, чтобы создавать полезные программы, основанные на указанной аналогии с мыслительной деятельностью человека. Другие науки и другие точки зрения предлагают модели мыслительной деятельности на других принципах

-- На принципах автономных агентов с детальным моделированием систем визуального и слухового восприятия, с моделированием действий в реальном мире через модель этого мира.

-- На аналоговых принципах, отвергая принцип дискретности.

-- На биологических принципах нейросетей.

-- На эволюционных принципах, пытаясь воспроизвести филогенетическую эволюцию человеческого разума от уровня амеб и клеток.

-- На эмерджентных принципах, надеясь с помощью генетических алгоритмов и создания коллективов агентов обнаружить явления самоорганизации, которые по замыслу должны привести к поведению схожему с человеческим в результате моделирования эволюции человеческого вида.

-- На принципах синергетики.

  Концепция МС использует знания лингвистической семантики, в меньшей мере – знания когнитивной психологии, прототипы реализаций удобно создавать на скриптовом языке Perl

  Сообщение - есть минимальная группа предложений русского языка, выражающая законченную мысль. В частности это может быть одно предложение.

  Главное предложение сообщения - вершина иерархии зависимостей между предложениями в сообщении.

  Главный глагол сообщения - главный глагол главного предложения сообщения.

  По таксономическому типу главного глагола определяются утвердительные сообщения, вопросительные сообщения и императивные сообщения (а также сообщения речевые-действия) и другие типы.

  Типология сообщений и макросинтаксис - классификация сообщений на базе типологии главных глаголов. Типология сообщений относится также к макросинтаксису, таксономической иерархии предложений и законам связи предложений в сообщении между собой. Приведем некоторые категории макросинтаксиса (из типологии предложений): атрибуция, эквивалентность, уточнение общего факта, объяснение логического заключения, доказательство факта, проведение аналогии, указание отличительного призиака в классе, указание на состав чего-либо, указание на возможность, утверждение альтернативы, причинно-следственная связь, противопоставление, вывод, идентификация, переименование, упоминание, демонстрация примера из класса.

  Альтернативная классификация по Mann - готовность к принятию решения, свидетельство, обоснование, мотивация, основание, следствие, предоставление возможности, использование возможности, переформулировка, условие, обстоятельство, причина, соглашение, предыстория, тезис-антитезис.

  Мыслительная система взаимодейтствует на русском языке с собеседником, от собеседника сообщения принимаются в МС и от МС сообщения передаются собеседнику, возникает диалог.

  Мыслительная система может функционировать без наличия собеседника, в этом случае процессы управляются собственными целями системы, в частности до их возможного полного исчерпания.

  Ментальное действие - какое-либо действие с данными в РП и ДП, например, перемещение фокуса внимания, копирование реплик, сопоставление реплик и т.д. Ментальное действие в отличие от внешнего действия имеет дело только с внутренними данными МС, с мыслями и образами.

  Ментальный сценарий - это узловой (этапный) сценарий со сценариями нижнего уровня и с ментальными действиями на самом нижнем уровне атомов.

  Внешнее действие (или реальное действие) - это ментальное действие по выдаче императивного сообщения сенсомоторной системе.  В нашей схеме внешнее действие существенно предполагает ментальное, как более базисное. МС создает «мотив» для внешнего действия, тогда как его реализацию берет на себя моторный компонент СМС.

Условием называется вопросительное предложение типа да/нет, преобразованное во внутреннее представление. Как правило, на вершине его будет находиться глагол-отношение с аргументами-сущностями.


  Действием называется предложение в форме инфинитива, оно обозначает естественно-языковое действие, которое необходимо совершить.


  Действием-продукцией называется пара из условия и действия, действие выполняется, если условие выполняется. Может быть также указано предложение для результата действия. Важно, чтобы система проверки действий могла предвидеть результаты выполнения действия.


  Конвеерным сценарий называется последовательность-цепь из действий-продукций. Если одно из условий в продукциях дает отказ, то дает отказ и весь сценарий.


  Этапным сценарий называется последовательность из этапов-узлов, каждый этап есть набор из одной или более альтернатив из действий-продукций. Если при реализации "этапного сценария" на определенном этапе продукция дает отказ, то проверяется следующая альтернатива и так далее до исчерпания альтернатив. Конвеерные сценарии есть частные случаи этапных сценариев.


  Процедурой называется этапный сценарий, в котором вместо действий могут быть указаны цели или имена сценариев нижнего уровня.

Имя сценария может рассматриваться как цель, если он появляется в целевом контексте. Целью в этом случае считается успешное выполнение сценария.

Внешний сценарий - это этапный сценарий со сценариями нижнего уровня и с внешними действиями на самом нижнем уровне атомов.

  Внешние сценарии требуют наличия в качестве собеседника СМС, тогда как ментальные сценарии этого не требуют, таким образом процесс мышления чистого разума может проходит в отсутствии контактов с сенсомоторной периферией.

 

Мы не считаем, что функционирование чистого разума МС в форме ментальных сценариев сводится исключительно к логическому выводу! Такое функционирование представляет собой самого различного вида работу с сущностными образами без обращения к реальным образам через СМС.


  Цель – это сообщение рассматриваемое в целевом контексте, так рассматриваются сообщения поставленные в очередь целей ОЦ. Вопрос, утвердительное сообщение, императив и речевые действия могут рассматриваться как цели.

Если с внешним действием связывается сообщение, указывающее его возможный или реальный результат, то такое действие рассматривается как цель, достижению которой способствует это действие. С действием может связываться цель и в случае отсутствия в системе знаний о результате, в таком случае рассматривается «потенциальный результат», и считается, что действие его и достигает. Сценарии, состоящие из действий и имен сценариев нижнего уровня, могут рассматриваться как сценарии-планы по достижению целей, а имена подсценариев - как имена подцелей.


  Предметная деятельность (или внешнее поведение) – есть одна из форм общения мыслительной системы с сенсорно-моторной системой, диалог с СМС во внутреннем представлении. Заметим, что любой курс обучения в нашей концепции обязательно требует учителя-человека, хотя диалог может и вестись с «природой» (СМС). Темой специального обучающего курса могут быть сущности, полученные в диалоге с СМС (в диалоге с природой).

  Процесс предметной деятельности управляется системой ментальных и внешних сценариев. Операции с формулами и схемами считаются чисто мыслительной деятельностью, хотя мы считаем, что это скорее предметная деятельность, объектом которой являются символы и выражения. Всякое поведение человека во внешнем мире может рассматриваться с позиций предметной деятельности. Антитезой к предметной деятельности является чистое мышление МС при отсутствии собеседника.

Опишем некоторые особенности МС.

1.  Взаимодействие с собеседником желательно асинхронное, то есть собеседник не должен дожидаться реакции МС и может вводить в любой момент новое сообщение. МС также может асинхронно выдавать информацию собеседнику.  При моделировании на компьютере обычно собеседником  является пользователь, который вводит сообщения в МС через клавиатуру и получает сообщения от МС на экране дисплея.

 

2.  Важным частным случаем собеседника является сенсомоторная система, которая вербализует визуальные, слуховые, вкусовые, обонятельные и внутренние ощущения, а также приводит в действие императивные сообщения от МС, реализует речевые действия. Мы рассматриваем сенсомоторную систему СМС как мальчика-проводника для слепого мудреца мыслительной системы МС, получающего информацию только в виде вербализованных сообщений. СМС берет не себя всю модель биологической системы восприятия и внешнего действия, позволяя рассматривать МС как чистый разум. Предполагается специальный начальный обучающий курс по общению с СМС. Он дает некоторую интерпретацию лексике восприятия, лексике положений, нахождений, значения многих предлогов и лексике действий. В иерархии знаний, такие знания будут находиться в фундаменте.


3.  Языковое представление сообщений отличается от внутреннего представления сообщения, представления языка мыслей. Внутреннее представление основывается на репликах, представляющих собой тройки вида <ключ><атрибут><значение> . <ключ><атрибут><значение> Ключ есть введение специального временного окказионального обозначения для референтов именных, глагольных и атрибутивных групп в предложении. Ключ является аналогом образного представления, связанного с соответствующей группой. Элементы, стоящие во втором поле <атрибут> должны обладать свойством «финитности», то есть их ассортимент должен быть конечным и, по возможности, не очень большим (в другой терминологии это - слоты), это могут быть слова естественного языка или технические наименования с использованием подчеркиваний. Третье поле <значение> может содержать слово или сущность для простых реплик. Возможны «сложные реплики», когда в области значения допускается произвольное словосочетание или выражение, содержащее также и сущности. Такие «сложные реплики» считаются «полуфабрикатами», которые могут быть разложены на простые реплики по тем же законами, по каким разлагается предложение на простые реплики анализатором. Через «полуфабрикаты» предложение «Петя бросил мяч» может быть представлены в компактной форме


                  С1 это Петя.

                  С2 это мяч.

                  П1 это_то_как С1 бросил С2.

                  Л2 это_то_что_произошло П1

                  Л2 имеет_логическое_значение истинности.


Мы различаем сущности-ситуации и сущности, являющиеся суждениями о ситуациях [3,4]. Иными словами, сущности-ситуации отвечают представлениям, связанным с ситуацией, и не считаются обладающими свойством истинности, тогда как суждения о тех же ситуациях, помимо того, что обладают свойством «истинности» (соответствия окружающему миру или общим законам), могут участвовать в логических операциях.


Кореферентность [7] между предложения представляет собой совмещение обозначений для этих сущностей в разных предложениях. Интерфейс с СМС проводится непосредственно в формате внутреннего представления. Визуальным и слуховым образам как раз в точности соответствуют окказиональные имена сущностей, тогда как их взаимоотношения и связи отвечают словам (и возможно техническим именам, отвечающих <атрибуту> <атрибуту>


4.  Имеется языковый анализатор (ЧАИР), который умеет разлагать приходящие от собеседника сообщения на реплики и ставит в ОЦ для них цель по их пониманию. Анализатор реализует специальный ментальный сценарий анализа. Двойственным образом имеется языковый синтезатор, который может создавать сообщения для собеседника в языковой форме из внутреннего представления в виде реплик. Процесс синтеза управляется целью и специальным ментальным сценарием синтеза.  Как и все ментальные сценарии, эти два сценария первично задаются по умолчанию, а затем неограниченно инкрементально модифицируются курсами обучения.


5. Ментальные сценарии образуют систему «программ», которые взаимно обращаясь друг к другу составляют материал для постоянного функционирования МС. Как возникают эти ментальные сценарии? Каковы источники их возникновения? Предполагается специальный начальный обучающий курс по образованию ментальных сценариев. И в то же время пополнение ментальных сценариев продолжается в течение всего развития МС.  Мы не используем идею «самоорганизации», но основываемся на возможности МС постоянно общаться с тем или иным учителем в режиме обучения. Именно продуманная система обучающих курсов и подбор «правильных учителей» может дать системе правильное развитие. На более поздних этапах развития допустимы элементы самостоятельного приобретения знаний с использованием эксперимента в процессе общения с сенсомоторным «учителем» СМС.

Мы не рассматриваем МС как полигон для проверки биологических теорий восприятия животных и человека.


6. Очередь хронологии - это последовательность сообщений от собеседника, выделенная для отдельных важных сообщений и помещенная в очередь фиксированной длины. В конце этой очереди сообщения забываются или сбрасываются в дальние отделы ДП.  Очередь хронологии позволит, например, анализатору вернуться к последнему сообщению еще раз или к нескольким предыдущим, если в процессе анализа обнаружится неоднозначность. Таким образом очередь хронологии может использоваться для возвратов.


МС много знает и умеет, ее способности обнаруживаются в процессе функционирования или в диалоге.

7. Предполагаются системы обучающих курсов по различным разделам знаний и умений. Проведем некоторую систематизацию по обучающим курсам.

n курс по пониманию значений начальной группы слов, курс по значениям слов, лексика восприятия и действия.

n курс по пониманию визуальных образов, овладение лексикой расположения, нахождения и перемещения объектов, «кубик», «мяч», «небо», «звезды», «предметы», ….

n курс по пониманию слуховых образов, слуховой лексики, «звякнуло», «грюкнуло», «пискнуло», «зашуршало»,...

n курс по реализации внешних действий.

n курс логики.

n курс ведения диалога.

n курс связи с внешней средой, общения с СМС.


8.  По результатам начальных обучающих курсов должна образоваться «объяснительная база» той совокупности знаний, которая позволит давать объяснения и определения словам на следующих стадиях обучения. Всегда тем не менее остается возможность появления слов, для которых нельзя дать исчерпывающее определение или по крайней мере объяснения средствами текущего фонда знаний. В этом случае можно давать частичные описания и роль объяснения играют указания на следствия и контексты употребления.


9. Система обучающих курсов – это другая точка зрения на программирование как таковое. Программирование в настоящее время состоит в том, что ставится определенная узкая задача, проект системы и она решается написанием программ. Создание обучающего курса – это комплексная система задач, имеющая центральную цель и свое место в фонде знаний. Создание библиотеки программ в стандартном программировании – это  тоже своего рода обучающий курс, но обычно для более примитивных схем организации и использования знаний. Описываемая нами модель МС может рассматриваться не более как схема организации и использования знаний.

  Приведем пример, нам важно не просто дать ребенку программу сортировки, а дополнительно и научить его ею пользоваться. Это означает – научить его правильно понимать и использовать смысл и результат сортировки нужного объекта в различных более широких контекстах. Дать возможный список тех сценариев, в которые может входить действие по сортировке. Мы считаем, что на все 90% человек склонен использовать готовое знание по сравнению с поиском новых знаний и правил.


10. Такт работы МС. В любой момент времени в очереди целей имеется текущая активная цель, с ней ассоциируется текущий активный ментальный сценарий, он ассоциируется по ключу и располагается в ДП (или в РП). Этот сценарий, как программа, содержит всю необходимую информацию для активизации различных процессов в МС. Он обращается к сценариям нижних уровней, те ставят в очередь целей свои подцели и т.д. Асинхроно с этой работой может прийти сообщение от собеседника, в этом случае обычная работа прерывается и внимание переключается на обработку пришедшего сообщения. Каждый сценарий обладает определенным временным ресурсом, указанным в его дескрипторе. При превышении этого времени сценарий может досрочно завершаться и уступать место более важному.



Укажем кратко основные темы и вопросы для дальнейших исследований.


r   Проблемы «правильной теории» естественного языка, ориентированной на создание моделей усвоения и обучения языку;

r   Типология сущностей:

субстанции-объекты-предметы,

ситуации-процессы-события,

свойства-атрибуты-признаки.

r   Проблема создания обучающих курсов различных типов;

r   Динамическое прямое и косвенное дообучение;

r   Проблема создания самых начальных обучающих курсов, когда нет опоры ни на фонд знаний, ни на понимание сообщений от СМС;

r   Пополняемая архитектура анализатора и синтезатора естественного языка (ЕЯ)

r   Проблемы макросинтаксиса и макросемантики сообщений.

r   Центральный вопрос - о «врожденных правилах». Существует ли и как ее найти некоторую начальную конфигурацию мыслительного процесса, отвечающего организации 3-летнего ребенка в начале освоения им естественного языка («универсальная грамматика» по Хомскому [2]

r  Одна из проблем организации серии начальных курсов обучения – это порочные круги, когда один обучающий курс вынужден использовать базовую объяснительную лексику, требующую завершения других начальных обучающих курсов. Чтобы избежать таких порочных кругов имеет смысл все начальные курсы проводить в «почти параллельном режиме», т.е. разделить их на «уроки», которые сменяют друг друга для курсов различного типа. И сочетать эту стратегию со стратегией «отложенного понимания», нормальным явлением считается непонимание системой каких-либо слов и понятий вводимых в каком-либо курсе. Необходимая информация запоминается с тем, чтобы позже к ней вернуться после нескольких уроков из других курсов.

r  К механизму синтеза сообщений. Можно высказать гипотезу, что перед выдачей сообщения возникает нечто вроде «интенции» с параметрами. «Интенция» есть некоторый тип из макросинтаксиса (например, выдать комплимент, возразить, аргументировать, и т.д.), а параметры – сущности, имеющиеся временно в наличии, в теме беседы (например, кому выдать комплимент). В таком случае «интенция» может связываться с именем программы (на Perl),  при вызове которой ей передаются через аргументы указанные выше


Заключение


В статье рассмотрена лингвистическая модель мыслительной системы с ориентацией на программную реализацию. Указанные концепции положены в основу проекта системы мыслительной деятельности Forkas, реализуемой на языке Perl. Проект частичного анализатора для русского языка на языке Perl ЧАИР можно найти на сайте www.neurotechnica.com.ua [5,6].


Литература


1.            T. Winograd, Towards a procedural understanding of semantics.-«Revue Internationale de Philosophie», No 117-118, Fasc. 3—4, Bruxelles,1976,p.260-303. (см. Т.Виноград.  К процессуальному пониманию семантики. - «Новое в зарубежной лингвистике», вып. XII. М., 1983. с. 123-170.)

 

2.            Н.Хомский, “О природе и языке”. С очерком “Секулярное священство и опасности, которые таит демократия”; Пер. с англ. – М., КомКнига, 2005. – 288 с.

 

3.            Z. Vendler, Causal relations. – «The Journal of Philosophy”, 1967, 21, p.704-713.

(см. З.Вендлер.О причинных отношениях. - «Новое в зарубежной лингвистике», вып. X. М., 1983. с. 123-170.)

 

4.            Н.Д.Арутюнова, “Язык и мир человека”,  - М.: “Языки русской культуры”, 1999. – I-XV, 896 c.

 

5.         R. Schank, M. Lebowitz, L. Birnbaum. An integrated understander.- “American Journal of Computational Linguistics”, 1980. Vol. 6, No 1, p. 13-20. (см. Р.Шенк, М.Лебовиц, Л.БирнбаумИнтегральная понимающая система. - «Новое в зарубежной лингвистике», вып. XII. М., 1983. с. 401.)

 

6.         R. Schank, L. Birnbaum, J. Mey. Integrating semantics and pragmatics.- “Quaderni di Semantica”, 1985. (см. Р.Шенк, Л.Бирнбаум, Дж.Мей.  К интеграции семантики и прагматики. - «Новое в зарубежной лингвистике», вып. XIV. М., 1985. с. 32.)

 

7.        И. М. Кобозева, “Лингвистическая семантика”: Учебник. Изд. 2-у. – М.: Едиториал УРСС, 2004. – 352 с. (Новый лингвистический учебник).