Часть I.

Постановка задачи и подход к её решению.

Основные понятия.

1. Постановка задачи.

Задачу, решению которой посвящена настоящая работа, сформулируем следующим образом: создание искусственных информационно-логических систем, способных осуществлять полномасштабное моделирование функций, выполняемых животными и человеком – наблюдение за внешней средой, мышление, включая поиск решений, приобретение знаний и выполнение действий. Очевидно, что решение этой задачи в значительной степени сводится к созданию модели представления знаний, обладающей средствами реализации этих процессов.

Представляется, что наиболее важной частью этой задачи является полномасштабное моделирование когнитивных средств, реализующих процессы приобретения системой знаний всех видов, включая приобретение навыков мышления, действий и поведения, и которые, можно полагать, используются не только в процессах приобретения системой знаний, но и в прочих процессах мышления и выполнения действий. Эти средства должны быть сопоставимы по своим возможностям со средствами животных и человека.

Другими словами, задачей настоящей работы является создание информационно- логической системы, функционально эквивалентной нейронным сетям. Структурная аналогия с нейронными сетями при этом остаётся вопросом второго порядка. К структурной аналогии с нейронными сетями следует стремиться лишь в той степени, в какой это требуется для решения основной задачи и позволяют наши современные знания о нейронных сетях.

2. Современное состояние проблемы «искусственный интеллект»

и смежных дисциплин.

2.1. Предварительные замечания.

Прежде, чем перейдём к формулировке подхода к решению поставленной выше задачи, оценим текущее состояние искусственного интеллекта (ИИ) и дисциплин, предметом изучения которых являются различные аспекты организации и функционирования нейронных сетей – психологии и комплекса нейронаук. Поскольку данная работа ориентирована на специалистов, в целом знакомых с интересующей нас проблематикой, не станем здесь детально рассматривать текущее состояние и перспективы этих научных направлений. Это предмет отдельного исследования. Здесь мы дадим оценку применимости и полезности их научных достижений в моделировании мыслительной и поведенческой деятельности животных и человека.

Представители каждого из этих научных направлений относятся к работам, проводимым в рамках других направлений, как правило, с нескрываемым скепсисом.

Надо сказать, для этого у них есть веские основания.

2.2. Искусственный интеллект.

2.2.1. Функциональное направление искусственного интеллекта.

Общая оценка состояния функционального подхода. Достижения функционального направления искусственного интеллекта можно оценивать по-разному. Нельзя отрицать наличия некоторых успехов, достигнутых в рамках этого направления, к числу которых следует отнести шахматные программы, экспертные системы (ЭС) реального времени, ориентированные на решения задач в динамических предметных областях [Попов Э.В., 1995], а также естественно-языковую вопрсо-ответную систему DeepQA/WATSON фирмы IBM (см. раздел Вопросо-ответная система

WATSON/DeepQA фирмы IBM).

В целом же прогресс в области систем искусственного интеллекта, создаваемых в рамках функционального подхода, более чем скромен (см., например, [Интегрированные модели и мягкие вычисления…, 2009, 2011]. Некоторые исследователи [Нариньяни А.С.], [Апрельский У.] весьма пессимистично оценивают текущее состояние и перспективы искусственного интеллекта. Оценки эти относятся в первую очередь к функциональному направлению. Оценки, данные А.С. Нариньяни, особенно ценны тем, что были даны авторитетнейшим специалистом в данной области, наблюдавшим ситуацию в функциональном направлении ИИ «изнутри». Несмотря на то, что эта его статья написана много лет назад, представляется, что и сегодня она не утратила актуальности. Имеющиеся некоторые успехи в этой области ([Осипов Г.С.]) не меняют общей картины. Они не носят революционного характера. В рамках этого направления ИИ задача моделирования мыслительной и поведенческой деятельности животных и человека даже не ставится.

Представляется, что основным недостатком функционального подхода является принципиальный отказ от какой-либо структурной аналогии с нейронными сетями, что предельно затрудняет, если не делает невозможным, достижение функциональной аналогии с нейронными сетями.

Нейронные сети обеспечивают высокий уровень ассоциативной связности содержащихся в них элементов и конструкций представления знаний. Эта черта практически полностью отсутствует в системах ИИ. Следствием этого является ряд серьёзных недостатков СИИ, основным из которых является невозможность включения в состав этих систем эффективных когнитивных средств, способных автоматически, без участия человека, извлекать знания из внешнего входного потока нелингвистической и лингвистической информации, а также из знаний, содержащихся в памяти системы, накапливать опыт собственного функционирования и использовать приобретенные знания в ходе своего функционирования. В лучшем случае такие системы имеют убогие суррогаты таких средств. Это, в свою очередь, делает невозможным полноценное моделирование мыслительных, в том числе, когнитивных, и поведенческих процессов.

Представители этого направления продолжают без конца муссировать идею необходимости интеграции образных и символьно-логических знаний, сформулированную Д.А. Поспеловым [Поспелов Д.А., 1998.], [Панельная дискуссия.

1998], эффективная реализация которой также практически невозможна без хотя бы минимальной аналогии с нейронными сетями.

Отсутствие когнитивных средств влечет необходимость внесистемного, по существу ручного, формирования и корректировки комплекса знаний системы. Это обусловливает высокую трудоемкость модификации комплекса знаний системы в процессе её функционирования. Этот процесс аналогичен по сложности и трудоемкости процессу программирования. «…Для систем реальной сложности трудоемкость разработки ИО (информационного обеспечения – А.Р.) для одного конкретного применения превосходит трудоемкость разработки МО (математического обеспечения – А.Р.)» [Попов Э.В., 1982, с. 87]. Это усложняет устранение ошибок в комплексе знаний, внесение в нее новых знаний, которые появляются вследствие углубления знаний о предметной области или появления изменений в ней, выявление пробелов и противоречий в знаниях системы. Это обусловливает также сложность адаптации системы к изменяющимся внешним условиям, требованиям пользователя и новым предметным областям.

Необходимость наличия у системы развитых когнитивных средств отмечали многие исследователи, например, [Гладун В.П., 1985, с. 93п], [Яворский А.Л., с. 35 - 36] и др.

Цель моделирования когнитивных средств – исключить участие разработчика из процесса накопления знаний (формирования и модификации модели предметной области). Это должна делать система сама в процессе своего функционирования.

Сложность и трудоемкость внесистемной подготовки баз знаний обусловливают их весьма скромные возможности. Отсутствие в системах искусственного интеллекта когнитивных средств, сопоставимых с такими средствами животных и человека, вообще делают неправомерным использование этого термина.

Единственным, пожалуй, исключением в этом плане является формализм РПС, который имеет некоторую структурную аналогию с нейронными сетями. Но это его достоинство для достижения функциональной аналогии не используется.

Высказанную здесь критику функционального направления не следует рассматривать как огульное отрицание полезности всех проводимых в его рамках исследований.

Экспертные системы могут иметь применения в сравнительно простых приложениях. Они требуют сравнительно скромных ресурсов. Высказанная критика касается только того, что работы, выполняемые в рамках функционального направления, не ведут к прогрессу в полномасштабном моделировании процессов мышления и поведения.

Впрочем, может оказаться, что некоторые результаты, полученные в рамках функционального подхода, окажутся применимыми и в ИЛБС как методы решения задач, реализованные средствами приобретённых знаний, в том числе мыслительными сценариями.

Вопросо-ответная система WATSON/DeepQA фирмы IBM. В 2011 году появились сообщения о победе вопросо-ответной системы WATSON/DeepQA (Deep Question Answering) в викторине «Jeopardy!», аналогом которой является российская телевикторина «Своя игра». Затем последовали сообщения об оглушительной победе этой системы в соревновании с двумя командами опытных и уважаемых медиков- кардиологов клиники Кливленда (Cleveland Clinic).

В Интернете имеется весьма объёмная информация по этой системе (например, [David Ferrucci и др.], [Черняк Л.]). Поэтому не станем останавливаться здесь на особенностях построения и функционирования этой системы, а также на некоторых частных вопросах, возникающих, несмотря на наличие достаточно объёмной информации. Оценим лишь применимость использованных в ней подходов к решению задачи моделирования мышления и поведения человека.

Система оперирует исключительно лингвистической информацией. Средств представления и обработки нелингвистических данных она не имеет. Одно это делает её концептуально неприменимой для решения сформулированной выше задачи.

Разумеется, часть нелингвистической сенсорной информации может быть представлена вербально. Но значительная часть нелингвистической сенсорной информации (в частности, видеоинформации, средства обработки которой планируется включить в последующие версии системы), не вербализуема. А она играет колоссальную роль в функционировании обучающихся систем. Отсутствие средств представления нелингвистической информации имеет ещё один очень серьёзный концептуальный недостаток. Оно делает практически невозможным накопление опыта собственного функционирования системы и использования его в своей дальнейшей деятельности. Средства речевого ввода информации, включение которых в состав системы также планируется, могут быть реализованы средствами, концептуально инородными по отношению к используемым в текущей версии системы средствам представления информации.

Несмотря на то, что эта система внешне очень не походит на системы, создаваемые до последнего времени в рамках функционального подхода, эта система, несомненно, должна быть отнесена к системам этого класса. Системе Watson присущи все патологические недостатки систем искусственного интеллекта. Напомним, что основным признаком систем этого класса является полное отсутствие структурной аналогии с нейронными сетями. Отсутствует она и в системе Watson . Да и многие используемые в системе механизмы разрабатывались в рамках этого подхода.

Отсутствие даже минимальной структурной аналогии обусловливает отсутствие и алгоритмической аналогии – процессы формирования комплекса знаний системы Watson и манипулирования ими в ходе формулировки ответов на поставленные вопросы, очевидно, не имеют ничего общего с процессами, протекающими в нейронных сетях. Отсутствие структурной аналогий влечёт, по крайней мере, одно, существенное следствие. Степень ассоциативной связности текстовых элементов либо очень невелика, либо отсутствует вовсе. Это означает, что система не имеет таких мощных средств автоматического (подсознательного) приобретения знаний, как процедуры декомпозиции и обобщения лингвистических конструкций всех уровней вложенности (буквосочетания, морфемы, слова, словосочетания, предложения, дискурсы). Это кардинально снижает когнитивные возможности системы.

В системе Watson, судя по всему, отсутствует понятийный уровень представления информации. Вся информация, которой оперирует система, представлена в виде естественно-языковых текстов. Правда, в ходе поиска ответа система, вероятно, порождает семантические представления отдельных предложений. В качестве такового используется некоторая разновидность семантической сети, в которой узлами отображаются слова, а рёбрами – отношения между ними. Но, во-первых, это представление применяется к очень ограниченным по размеру текстовым конструкциям, а не ко всем тестовым данным, загруженным в систему. Во-вторых, они порождаются динамически по мере необходимости и используются для решения ограниченных задач. Проблемы семантического поиска в лингвистической среде в настоящее время не могут считаться удовлетворительно решёнными. Вообще говоря, сомнительной представляется сама возможность построения совершенной системы семантического поиска информации, базирующейся исключительно на лингвистической информации без отображения её в понятия и понятийные конструкции. Понятийный уровень представления знаний позволяет устранить недостатки, присущие естественным языкам – синонимию, полисемию, омонимию, эллиптические конструкции, анафорические ссылки, идиомы, несоответствие грамматического и реального времени, а во флективных языках – флексии и такую семантически почти бессмысленную категорию, как род слов. Он позволяет отображать ассоциативную связность понятий всех уровней общности, интегрировать лингвистическую и нелингвистическую информацию. Впрочем, последняя, как уже отмечалось, вовсе не представлена в рассматриваемой системе.

В публикациях утверждается, что система Watson способна находить ответы на 85% вопросов в течение 5 секунд. Но 15% вопросов остаются без ответа или правильного ответа. И это при том огромном объёме загруженной в неё информации, о котором человек, вероятно, не может и мечтать. Следует также отметить, что викторина «Jeopardy!» представляет собой пример весьма примитивной области применения систем такого назначения, поскольку не требует выполнения серьёзных понятийно- вербальных рассуждений. Это позволяет полагать, что ошибки системы объясняются, вероятно, не столько дефицитом фактографической информации, сколько недостатками применённых механизмов представления информации в памяти системы, и, в первую очередь, отсутствием понятийного уровня представления знаний, и вытекающими из этого недостатками механизмов поиска вариантов ответа на поставленный вопрос и оценки правильности этих ответов. Правда, из публикаций не ясно, как на этот процент влияет увеличение допустимого времени поиска ответа.

Система Watson реализована на суперкомпьютере огромной производительности, допускающем параллельную обработку 11 520 потоков данных. Нельзя отрицать, что решение такой серьёзной задачи, как семантическая обработка естественного языка, требует серьёзных ресурсов. Но есть сомнения, что эти ресурсы в системе Watson используются рационально. Вследствие отсутствия автоматической декомпозиции и автоматического обобщения лингвистических конструкций всех уровней вложенности, а также отсутствия понятийного уровня представления знаний значительная часть процессов семантической обработки тестов должна выполняться в ходе поиска ответа на вопрос. При наличии указанных средств эти процессы выполняется в ходе обучения системы. При этом формируется среда, удобная для выполнения процедур семантического поиска и логического вывода. Предварительное формирование понятийного представления позволяет при прочих равных условиях снизить требования к производительности системы средств или более эффективно использовать её.

В публикациях подчёркивается, что разработчики системы не внесли в решение проблемы понимания естественного языка никаких новых идей. Новизна подхода заключается исключительно в организации параллельного выполнения тысяч давно известных и проверенных алгоритмов анализа естественно-языковых текстов. Успехи системы достигаются, в основном, за счёт высокой производительности суперкомпьютера Watson и тем обстоятельством, что система располагает гораздо бОльшим объёмом сведений, чем тот объём сведений, которыми оперирует человек. Этот подход характерен для фирмы IBM – минимум новых идей при максимуме железа и денег.

Несмотря на высказанные сомнения и указанные недостатки системы DeepQA, её победы в американской викторине и в соревновании с двумя командами опытных и уважаемых медиков-кардиологов, несомненно, удивляют и впечатляют. Удивление вызывает то обстоятельство, что давно известными в концептуальном плане средствами достигнут впечатляющий результат. Если только за ним не скрывается какое-либо надувательство, подобное тому, подозрение в котором возникло после заключительной партии шахматного матча Г.К. Каспарова с суперкомпьютером Deep Blue и которое (подозрение), насколько мне известно, не рассеяно до сих пор.

Возможно, эту систему удастся в будущем использовать в качестве естественно- языковой вопросно-ответной системы в той или иной предметной области. Для объективной оценки реальных возможностей системы следует дождаться хотя бы одного такого применения системы.

Предлагаемая Вашему вниманию работа посвящена решению более обширного круга вопросов. Построение естественно-языковых вопросо-ответных систем является только его частью, причём не самой сложной.

2.2.2. Структурное направление искусственного интеллекта.

В рамках структурного подхода, в противоположность функциональному направлению, ставится задача структурного моделирования нейронных сетей. На основе структурной аналогии предполагается достичь и функциональной аналогии. В рамках этого подхода создаются нейроподобные сети и ЭВМ (нейрокомпьютеры), часто неправомерно называемые нейронными.

Нельзя отрицать, это направление в последние 10 – 15 лет добилось некоторых успехов.

Созданы прикладные системы, нашедшие применение в различных областях практической деятельности. Однако, все эти системы решают лишь одну задачу, которую трудно назвать интеллектуальной – распознавание образов, а говоря точнее, распознавание сущностей реального мира. Функции нейроподобных систем сводятся к решению этой задачи не только в случае распознавании ими статических и динамических изображений, речи и других звуков, но и в случае медицинской и технической диагностики, идентификации некоторых ситуаций в финансовой, военной и политической областях. Они ориентированы на распознавание ранее встреченных объектов и процессов при обработке потоков зашумленной и противоречивой входной информации.

Так называемые нейроподобные системы в силу заложенных в них принципов изначально ориентированы на структурное моделирование нейронных сетей и протекающих в них процессов, в том числе, процессов обучения. Но качественного моделирования этих процессов не удается добиться. Основными причинами этого являются низкий уровень понимания процессов, протекающих в нейронах, ассоциациях нейронов и нейронных сетях в целом, а также примитивность большей части современных нейроподобных систем.

Низкий уровень понимания процессов, протекающих в нейронных сетях, относится, в первую очередь, к процессам, протекающим внутри нейрона и выполняемым им функциям. Очень мало известно и о принципах взаимосвязи нейронов между собой.

Представляется, что понимание этих процессов есть один из ключевых вопросов в понимании механизмов функционирования нейронных сетей. Правда, имеются некоторые успехи в понимании функционирования малых сетей нейронов. Но эти успехи мало способствуют пониманию процессов мышления, протекающих в больших нейронных сетях. Отсутствие понимания этих процессов делает невозможным в настоящее время осмысленное моделирование нейронных сетей.

Некоторое время назад существовало мнение, что структура и функции известных в настоящее время типов нейронов достаточно хорошо изучены [Захарченко В.М.], [Мкртчан С.О.], [Поляков Г.И.]. Считалось, что созданы весьма совершенные их модели. В среде последователей структурного подхода распространено представление о нейроне лишь как о суммирующе-пороговом элементе. При поверхностном взгляде на нейрон или некоторую их ассоциацию они могут производить именно такое впечатление. Но это, видимо, было заблуждением. Современные данные молекулярной биологии (см. раздел Нейронаучное направление) показывают, что это не так, что функции нейрона несравненно обширнее и сложнее. Впрочем, и без этих данных была очевидна порочность такого взгляда на нейрон. Нейронная сеть таракана насчитывает от нескольких сотен до нескольких тысяч нейронов. Возникает вопрос – неужели огромное число выполняемых тараканом функций, в том числе социальные инстинкты, которыми тараны, судя по некоторым наблюдениям, также обладают, реализуется таким скромным числом таких примитивных элементов? Вывод отсюда может быть сделан только один – функции нейрона гораздо сложнее, чем считают адепты структурного направления. Забегая вперёд, скажем, что результаты исследований, изложенные в данной работе, также косвенным образом подтверждают гипотезу о многообразии и сложности выполняемых нейроном функций.

Нейроподобные сети имеют и другие недостатки, к числу которых следует отнести следующие их черты.

В большинстве нейроподобных сетей используется лишь один тип модели нейрона.

Число «нейроподобных» элементов в моделях намного порядков меньше, чем в нейронных сетях или функционально ограниченных их фрагментах.

Связи между моделями нейронов в большинстве случаев регулярные, что слабо согласуется с данными нейрофизиологии.

Число слоёв «нейроподобных» элементов исчисляется, как правило, несколькими единицами против 102 в коре головного мозга человека. Это также не позволяет всерьез рассматривать эти модели в качестве аналогов нейронных сетей.

В качестве обучающих правил (алгоритмов модификации силы связей между нейронами) используются различные математические методы, которые, едва ли имеют аналогию с процессами, протекающими в естественных нейронных сетях.

Иногда используются вероятностные модели нейрона. Представляется, что использование таких моделей есть следствие непонимания протекающих в нём процессов.

Итак, низкий уровень понимания протекающих в нейронах и нейронных сетях процессов ставит под сомнение правомерность основных принципов построения нейроподобных сетей [Бодякин В.И.]. Обусловленная этим очень далёкая аналогия с нейронными сетями является патологическим недостатком этого направления ИИ. Современное состояние нейронаук и их перспектив (см. раздел Нейронаучное

направление) также не дают никаких оснований для оптимизма.

Исследования в этой области искусственного интеллекта в настоящее время напоминают игру в жмурки. Подходы, применяемые в рамках структурного подхода, так же как и в рамках функционального подхода, близки к пределу своего совершенства. Поэтому направление нейроподобных систем на протяжении нескольких десятилетий остается малопродуктивным. Вероятно, не следует ожидать от нейроподобного подхода в ближайшее время практически значимых результатов. Полагаю, что это тупиковое направление ИИ, способное решать лишь очень ограниченный класс прикладных задач. Тем более, нельзя ожидать от него серьёзного вклада в моделирование мыслительной и поведенческой деятельности.

Нейроподобные системы, создаваемые в рамках структурного направления, могут считаться таковыми только по намерениям адептов этого направления, но не по существу, поскольку достигаемая в современных моделях аналогия с нейронными сетями животных и человека ничтожна.

2.3. Психология.

Вклад психологии и физиологии в моделирование мыслительных и поведенческих процессов в настоящее время можно оценить как ничтожный. Многие представления психологов о нейронных сетях и протекающих в них процессах изумляют своей наивностью и тривиальностью. Например, американские психологи Ричард Гернштейн (Richard Herrnstein) и Джон Серелл (John Cerella) в результате серии экспериментов пришли к выводу, что формировать абстрактные категории могут не только люди, но и птицы [Катаева Т.].

Трудно представить, каким образом такого рода суждения можно применить к построению реально действующей системы. Психологи, как правило, лишь констатируют те или иные психические эффекты, ограничиваясь при этом лишь самыми общими соображениями о причинах их возникновения. Объясняется это, на мой взгляд, тем, что представители этих научных направлений рассматривают те или иные эффекты, имеющие место в памяти, без серьёзной привязки этих эффектов к механизмам их реализации. Поэтому эти исследования носят умозрительный характер и не рассчитаны на воплощение результатов этих исследований в какой-либо материальной конструкции.

Многие представления психологов просто непригодны для целей моделирования, по крайней мере, в рамках МПЗ АПС. Это относится, в частности, к таким категориям как «перцептивные образы» и «образы воображения», «понятия». В АПС образы подразделяются на весьма большое число классов. Но используется эта классификация, в основном, для некоторого удобства изложения. Образы разных типов назначений и типов не имеют серьёзных структурных различий. В данной работе используются только те конструкции, термины, понятия, классы, которые необходимы для достижения поставленной выше цели. Нужды в разделении образов на перцептивные, образы воображения и т.п. нет. Нет нужды и в противопоставление образов и понятий – в АПС и то, и другое – просто разновидности образов.

Тем не менее, роль работ психологов в моделировании мыслительной и поведенческой деятельности может возрасти в будущем. Некоторые наблюдения, сделанные в ходе психологических исследований могут оказаться полезными в качестве исходного материала при моделировании различных нюансов психических и мыслительных процессов. Впрочем, некоторые работы психологов представляют несомненный интерес уже сейчас, поскольку содержат описание эффектов, которые должны быть объяснены с позиций создаваемой модели. Примером такой работы является работа [Хофман]. Модель представления знаний АПС даёт ясное понимание основных механизмов реализации практически всех приведённых в работе Хофмана психологических эффектов. Большой интерес представляют также содержащиеся в работе врененнЫе оценки протекающих в памяти человека процессов. Эти оценки являются ценным исходным материалом, на основе которого можно сделать более или менее определённые предположения относительно организации представления знаний в памяти системы и процедур их обработки. Представляют интерес в этом плане также работы Б. M. Величковского, например [Величковский].

2.4. Нейронаучное направление.

Предварительные замечания. Последние годы ознаменовались беспрецедентным ростом исследований нейронных сетей, вообще, и мозга человека, в частности. По некоторым данным в настоящее время в мире издается около 500 журналов посвящённых мозгу и вопросам его функционирования [Лурье Д.]. И эти массированные усилия не остаются безрезультатными. В изучении нейронных сетей животных и человека достигнуты немалые успехи.

Эти исследования выполняются множеством различных методов в рамках различных научных направлений. Комплекс этих научных направлений зачастую обозначается термином «нейронауки». Многие представители нейронаук, помимо решения основных задач их исследований, также включились в работы по моделированию различных аспектов функционирования нейронных сетей животных и человека.

Успехи нейронаук. При помощи молекулярных зондов с использованием компьютерных методов анализа изображений удалось установить, что гены являются одним из основных инструментов запоминания новой информации при обучении. В частности, удалось выявить всю последовательность процессов передачи сигналов от мембраны к геному нервной клетки, реализующих запоминание информации при обучении [Анохин К.В. Мозг и разум].

Имеются сообщения о разработке весьма детальных карт функциональных зон мозга некоторых видов животных и человека. В частности, выявляются области человеческого мозга, которые вовлекаются в выработку абстрактных понятий [Катаева Т.]. В последнее годы особое внимание стало уделяться составлению нейрокарт, описывающих информационные взаимосвязи этих функциональных областей.

Заметные успехи достигнуты в изучении малых нейронных сетей. Так, в результате изучения нейронной сети морской улитки «морской ангел», содержащей 4 000 нейронов, нейрофизиологам удалось расшифровать её пищевое поведение. Оно изучено с точностью до поведения всех нейронов и контактов между ними. Известно, как изменить это поведение.

В мозге человека выявлены отдельные нейроны, активность которых обусловливает выполнение человеком тех или иных действий. Эти открытия легли в основу мозго- машинных или мозго-компьютерных интерфейсов, которые представляют собой устройства, позволяющие снимать сигнал с отдельного нейрона и, после его усиления, подавать на вход исполнительного механизма или устройства. Таковыми могут быть механические протезы, управляемые «силой мысли» пациента.

Имеются успехи в расшифровке электроэнцефалограмм, позволяющие реализовать на практике ввод текстов в компьютер непосредственно на основе этих расшифровок. Предполагается использовать такие устройства для ввода текстовой информации в компьютер, для управления различными роботами, в частности, военного назначения, для организации «телепатических» систем связи.

В рамках эволюционной роботики выполняется разработка различных компьютерных моделей живых существ – боидов, обитателей виртуального подводного мира, а также исследовательских физических или виртуальных (компьютерных программ) роботов – аниматов. Наибольшего распространения получили эксперименты с аниматами. В рамках этого научного направления выполняется моделирование процессов приобретение системой свойств, необходимых для целесообразного поведения в ходе эволюции систем определённого вида. Изначально в некоторое множество систем закладываются только «определенный набор примитивных понятий, правила принятия новых решений и критерии отбора» [Катаева Т.]. В этих моделях используется мотивация поведения моделей. Системы сначала выполняли хаотические движения, из последовательности которых впоследствии отбирались сценарии целесообразного поведения. Особи, не нашедшие таких сценариев, погибали. Эксперименты показали, что нескольких десятков поколений достаточно для приобретения исследуемыми системами навыков вполне целесообразного поведения. При этом отмечались случаи выработки системой совершенно неожиданных форм поведения.

Оценка имеющихся результатов. Экспериментальные и теоретические достижения нейронаук неоспоримы. Наиболее ценным в ракурсе интересующей нас проблемы представляется открытие того факта, что гены являются одним из основных инструментов запоминания новой информации при обучении. Это открытие чрезвычайно интересно и важно для понимания процессов функционирования нейронов как элементной базы нейронных сетей. Они позволяют считать, что функции нейрона как информационно-логического процессора реализуются размещёнными в нём генами, а геном рассматривать как логическую схему, способную выполнять огромное число сложных логических функций. Кодировка информации при выполнении логических операций в нейроне осуществляется путём выработки сложных комбинаций различных белков, которые затем воздействуют на различные участки генома нервной клетки – регуляторные участки так называемых ранних генов. При этом активность части генов-мишеней возрастает, а активность других подавляется.

Эти фундаментальные выводы хорошо согласуются с выводами, вытекающими из алгоритмов метапроцедур, декларируемых в рамках МПЗ АПС – функции узла АПС очень разнообразны и сложны. Поостережёмся в данной работе проводить прямую аналогию между нейроном и узлом АПС. Тем не менее, можно с уверенностью сказать, что функции нейрона вовсе не ограничиваются суммирующе-пороговой функцией, как это принято считать в структурном направлении ИИ. Одного этого достаточно, чтобы считать концепции, на которых базируется это направление, порочными.

Но этим открытием, пожалуй, исчерпывается вклад нейронаук в функциональное моделирование нейронных сетей. Современный уровень понимания протекающих в нейроне биохимических процессов при обучении логику функционирования нейронных ассоциаций никоим образом не проясняет.

Прочие достижения для понимания и моделирования процессов мышления и поведения не дают почти ничего. Большинство протекающих в нейронах и нейронных сетях процессов остаются непонятными. При этом бесспорно огромное прикладное значение в медицине некоторых из достижений нейронаук.

Работы по нейрокартированию, т.е. составлению карт функциональных областей памяти и их информационных взаимосвязей, несомненно, углубляют наши знания об организации мозга. Но разработка нейрокарт не позволяет понять принципы функционирования нейронной сети, в целом, и функциональных областей, в частности. Нейрокартирование существенно не углубит понимания протекающих в памяти процессов, в частности выработки абстрактных понятий (в терминах АПС – обобщения). Такого же мнения придерживается и один из ведущих российских нейрофизиологов Анохин К.В.: «Но одно их (областей – А.Р.) описание не даст ответа на вопрос о фундаментальных принципах процесса категоризации» [Катаева Т.].

Исследования структуры и информационных взаимосвязей в малых сетях нейронов очень интересны, но неясно, в какой степени они могут быть полезны для понимания процессов мышления человека.

Невозможно отрицать колоссального прикладного значения в медицине разработки мозго-компьютерных интерфейсов. Но выявление локализации отдельных функций мозга в определённых его компонентах также ничего не даёт для понимания процессов мышления и поведения и их моделирования. Об этом же говорит и Анохин К.В.: «Мы имеем мозго-машинные интерфейсы, но не понимаем нейрофизиологическую природу мышления.

Самая главная задача – выяснить, как протекают мыслительные процессы, когда человек дает команду устройству. Как в это время работает его мозг? Как сознание вступает во взаимодействие с мозгом?» [Анохин К.В. Мозговой бум].

Опыты с аниматами очень интересны. Они доказывают, что эволюционным путём могут быть получены существа, аналогичные животным и человеку. Вместе с тем, эволюционная роботика моделирует самые примитивные виды поведения и процессы их приобретения, не замахиваясь на мышление и сознательное поведение. Надо признать, что эволюционная роботика доказывает совершенно банальные истины. То, что животное и человек для своего успешного функционирования должны иметь ряд наследственных механизмов, которые вырабатывают в ходе филогенеза совокупность целесообразных процедур поведения, очевидно и без этих экспериментов.

Эволюционная роботика доказывают необходимость априорных знаний – оценок образов и рефлексов. Но для понимания процессов мышления, поиска и принятия решений, когнитивных процессов, процессов подсознательного и сознательного поведения ничего не даёт. К.В. Анохин утверждает что «…ученые получают возможность подсматривать за работой модельных нервных клеток, что пока не удается делать с реальными существами». И далее «Изучая же поведение искусственных агентов, ученые могут не только отслеживать процесс эволюции и обучения своих аниматов, но и видеть, как работает их нервная система в целом, все контакты в ней, каждая клетка» [Катаева Т.]. Трудно согласиться с этим мнением. Какова степень аналогии применённых в моделях нейроподобных элементов и нейронов? Какова степень аналогии структуры этих модельных и нейронных сетей? Полагаю, недостаточная, для того, чтобы из поведению модели делать какие-либо заключения относительно поведения реальных нейронных сетей.

Вместе с тем, при всех недостатках этого подхода, надо сказать, что сам подход правильный – если в настоящее время нельзя понять нейронные сети в масштабе, достаточном для их моделирования, то надо придумать свою сеть, функционально аналогичную нейронной. Именно этот подход и применён в данной работе.

Основная проблема – исследование процессов функционирования больших ассоциаций нейронов – средствами нейронаук остаётся нерешённой. По крайней мере, в настоящее время и в обозримом будущем. Основных причин тому две.

Первая заключается в том, что самые современные методы исследования нейронных сетей не позволяют одномоментно увидеть работу всех нейронов, участвующих в некотором процессе, «не дают возможность наблюдать их взаимосвязи и понять, что происходит с каждым из нервных контактов в момент совершения организмом какого-либо действия» [Катаева Т.].

Второй причиной является комбинаторная сложность объекта исследования – мозга – и его компактность. Это признают и ведущие нейрофизиологи. «Даже относительно простые организмы, например, пчелы, улитки, или дрозофилы, обладают нервной системой, состоящей из десятков и сотен тысяч нейронов». «Даже если можно было бы описать работу всех клеток мозга человека в любой момент времени, все равно не удастся понять, как же функционирует столь сложный механизм, как возникают мышление, восприятие, психика» [Катаева Т.]. Эта причина особенно серьёзна.

Представим себе, что нам удалось зафиксировать всю последовательность процессов во всех нейронах, принимающих участие в некотором процессе, а также в их связях.

Возникает практически неразрешимая проблема осознания и интерпретации этого гигантского массива информации. Как понять назначение компонентных процессов, из которых складываются более сложные процессы, и функции каждого из нейронов, участвующего в этих процессах на разных их стадиях процесса? Из сказанного можно сделать неутешительные выводы. Во-первых, несмотря на значительные успехи нейронаук, их достижения для моделирования мышления и поведения практически ничего не дают. Нынешние успехи нейронаук могут служить только подтверждением некоторых гипотез. Второй вывод ещё более удручающ – ожидать разгадки механизмов функционирования нейронных сетей, являющихся процедурным фундаментом мышления и поведения, средствами нейронаук едва ли следует ожидать, по крайней мере, в обозримом будущем. Это, в свою очередь, означает, что для решения этой задачи требуется принципиально иной подход, который позволит моделировать эти процессы, не дожидаясь эпохальных открытий нейронаук.

Такой подход предложен в следующем разделе.

3. Подход к решению задачи.

3.1. Возможно ли в настоящее время полномасштабное моделирование мыслительной и поведенческой деятельности животных и человека?

Большинству специалистов сама постановка задачи полномасштабного моделирования мыслительной и поведенческой деятельности животных и человека в настоящее время представляется фантастической, неразрешимой, а то и бредовой. Да и приведённая выше очень беглая оценка состояния и перспектив современного искусственного интеллекта и смежных научных дисциплин, как будто, приводит к такому же заключению. Современные представления о структуре нейронных сетей, функциях, выполняемых каждым из их компонентов и, тем более, алгоритмах их работы таковы, что не позволяют говорить об их моделировании. Ведь, кажется, невозможно строить модель объекта, о внутреннем устройстве и алгоритмах функционирования которого почти ничего не известно! Тем не менее, это возможно. В данной работе предлагается аппарат практического решения этой задачи. Чтобы преодолеть естественное недоверие к этому утверждению, начнём изложение существа дела с весьма детального освещения применённого подхода. По существу это есть изложение последовательность основных этапов выполненной работы. Разумеется, эта последовательность этапов пережила много итераций. Изложение этой схемы, я полагаю, докажет со всей очевидностью возможность достижения поставленной цели.

3.2. Существо подхода.

Нейрофизиологи отмечают, что нейронные сети различных животных имеют серьёзные различия. И все они значительно отличаются от нейронной сети человека. Тем не менее, значительную часть сходных задач животные и человек решают в значительной степени сходным образом. Скажем, птицы распознают обобщённые образы дерева [Катаева Т.]. Это позволяет полагать, что в нейронных сетях всех видов действуют одни и те же или, по крайней мере, в значительной степени, сходные механизмы. Возникает вопрос, если видов нейронных сетей множество, то почему не разработать ещё один вид? Но для этого нужно знать эти механизмы.

Выявить эти механизмы путём анализа процессов в нейронных сетях большой размерности, как указывалось выше – задача практически неразрешимая. Но их вполне можно выявить на основе изучения основных процессов мышления и поведения, и моделирования процедур, реализующих эти процессы. Такой подход представляется вполне здравым, тем более что такие попытки уже предпринимались и предпринимаются. В качестве примера можно привести работы в области эволюционной роботики.

Общая схема подхода. Кто-то (или что-то) несколько тысячелетий назад создал нейронные сети животных и человека. Каждая из этих нейронных сетей может рассматриваться как информационно-логическая машина, построенная на биологической элементной базе – нейронах. Можно полагать, что каждый нейрон сети выполняет две взаимосвязанные функции – хранение некоторого кванта информации и обработку информации, хранящейся в этом нейроне и связанных с ним нейронах. Процедуры, выполняющие эту обработку, будем называть метапроцедурами. Комплекс метапроцедур, реализуемых нейронами сети, представляет систему команд нейронной сети, подобно тому, как в современном компьютере фон-неймановской архитектуры комплексом метапроцедур является система его команд.

Поскольку устройство этого процессора в настоящее время изучено недостаточно, единственным плодотворным в этой ситуации подходом представляется построение новой машины на иной элементной базе, функционально эквивалентной или, по крайней мере, аналогичной нейронной сети. В терминах функционального направления искусственного интеллекта эта задача означает, по существу, разработку модели представления знаний, компонентами которой являются, как минимум, множество конструкций представления знаний и множество метапроцедур манипулирования этими конструкциями. Ниже будет показано, что эта модель включает в себя, помимо этого, ещё множество совершенно необходимых компонентов.

На основе анализа основных процессов, протекающих в естественных обучающихся системах – процессов наблюдения за внешней средой, мышления, приобретения знаний и выполнения действий – следует выявить составляющие их процессы – метапроцедуры. Система метапроцедур должна реализовать все основные процессы, протекающих в памяти обучающейся системы, включая когнитивные процессы, а также процессы выполнения системой мышления и действий. Множество разрабатываемых метапроцедур должно быть функционально эквивалентно системе метапроцедур нейронной сети. Поскольку приобретение знаний обучающейся системой есть одна из наиболее важных её функций, моделированию когнитивных средств, вообще, и когнитивных метапроцедур, в частности, следует уделить первостепенное внимание.

Система конструкций представления знаний должна обеспечивать эффективное функционирование этих метапроцедур. Конструкции представления знаний должны быть достаточно универсальными в том смысле, что для представления знаний всех видов, которыми оперирует обучающаяся система, должно использоваться ограниченное число конструкций.

3.3. Основные компоненты обучающейся системы.

3.3.1. Память обучающейся системы.

Первый вопрос, который возникает при решении поставленной задачи – какова структура памяти обучающейся системы. Нейрофизиология даёт некоторые ответы на этот вопрос.

Первое: память представляет собой совокупность зон, каждая из которых ориентирована на выполнение некоторого множества определённых функций.

Второе: память представляет собой сетевую конструкцию. Она состоит из огромного числа элементов – узлов. Она характеризуется высочайшей степенью ассоциативной связности узлов.

Наконец, данные нейрофизиологии дают основания полагать, что нейронная сеть имеет явно выраженную слоистую, иерархическую структуру.

3.3.2. Конструкции представления знаний.

Система конструкций представления знаний. Один из фундаментальных вопросов заключается в следующем: как представляется информация в нейронных сетях? Как представляется сенсорная (зрительная, акустическая, тактильная, вкусовая, обонятельная, соматосенсорная), эффекторная информация – описатели механических и биохимических действий, выполняемых системой? Как представляется информация, описывающая внешние по отношению к системе процессы и действия самой системы? Как представляются понятия и символьно- логическая (в терминологии Д.А. Поспелова) информация? Современная нейрофизиология на эти вопросы вразумительного ответа не даёт. Казалось бы, тупик! Вовсе нет! Есть один вид информации, о представлении которой можно иметь вполне аргументированные суждения. Это лингвистическая информация – буквы, буквосочетания, морфемы, слова, словосочетания, предложения, дискурсы.

Можно предположить, что знания всех видов представляются конструкциями, число видов которых очень ограничено. Тогда представление лингвистической информации может стать ключом к пониманию схемы представления знаний всех видов.

Конструкции представления знаний. В дальнейшем тексте будут широко использоваться термины «узел сети» или просто «узел». Этими терминами будем называть узлы Активной Пирамидальной Сети. Поскольку функции нейронов в настоящее время до конца не выяснены, не станем отождествлять узлы АПС с нейронами. Это соотношение ещё только предстоит понять.

Лингвистические конструкции всех уровней вложенности представляют собой кортежи символов. Если предположить, что каждый непроизводный лингвистический символ – буква – представляется одним узлом сети, то производные лингвистические конструкции представляются кортежами узлов. Но каждый кортеж узлов образует конструкцию, которая в большинстве случаев является компонентом конструкции более высокого уровня вложенности. Очевидно, что в последнюю целесообразно включать не саму первоначальную конструкцию, а её идентификатор. Но какова взаимосвязь между компонентами конструкции и её идентификатором? Можно предположить – линейная (см. рис. I-1).

Идентификатор С Л О В О

Рис. I-1. Но такая схема порождает ряд проблем. Во-первых, не ясно как идентификатор слова, включить в описатель предложения. Во-вторых, есть основания полагать, что помимо кортежей для представления знаний могут использоваться и неупорядоченные множества символов-узлов. Это, в частности, относится к понятийной информации, порядок следования компонентов в которой безразличен. В данной работе будут приведены и другие аналогичные виды знаний.

Этих недостатков лишена пирамидальная конструкция представления знаний (см. рис. I-2).

Идентификатор

С Л О В О

Рис. I-2. Отсюда можно сделать следующие выводы: а) конструкции представления знаний имеют пирамидальную структуру; б) для представления знаний применяются конструкции, по крайней мере, двух типов (на самом деле их больше), описывающие неупорядоченные множества и кортежи символов.

Семантика связей в сети. Для того, чтобы знания всех семантических классов и всех видов могли быть представлены ограниченным числом унифицированных конструкций, связи между узлами сети должны отображать только факт связности узлов. Тогда носителями семантики будут только узлы сети.

Представление других видов знаний. Теперь следовало оценить, применимы ли конструкции такого вида для представления других видов знаний. Очевидно, что пирамиды-кортежи применимы для представления образов тех сущностей реального мира, которые могу быть представлены как последовательность компонентов.

Помимо лингвистических конструкций, к числу таковых относятся различного рода процессы, протекающие во внешней по отношению к системе среде, и действия, выполняемые самой системой. Кортежами можно представить в зрительных образах контуры проекций поверхностей объектов как последовательности аппроксимирующих линий контура, а также акустические образы как последовательности выборок акустического сигнала.

Неупорядоченными множествами можно описывать совокупности одновременно происходящих событий, зрительные образы проекций объектов как композицию контура проекции, её цвета, яркости и, вероятно, фактуры, а также координаты проекции одного объекта относительно проекций других объектов в зрительном кадре. Такими множествами могут быть представлены также понятийные конструкции.

Можно показать, что эти конструкции взаимозаменяемы. Неупорядоченные множества могут быть заменены множеством упорядоченных множеств. Кортеж может быть представлен неупорядоченным множеством, если каждый элемент последнего имеет ссылку хотя бы на последующий элемент кортежа.

Многоярусный характер конструкций представления знаний. Идентификатор одной конструкции является элементом конструкции более высокого уровня вложенности. Число уровней такого соподчинения определяется только структурой сущности реального мира и возможностями системы.

3.3.3. Метапроцедуры.

Предварительные замечания. Анализ применения пирамидальных конструкций представления знаний позволяет выявить несколько любопытных и чрезвычайно важных их свойств. Выявление этих свойств позволило, в свою очередь, выявить ряд важных преобразований образов, каждое из которых, как оказалось, являются важнейшими метапроцедурами, составляющими процедурный фундамент обучающихся систем. Ниже, в данном разделе, кратко рассмотрены некоторые из них. Эти метапроцедуры формируют совокупность знаний системы – образов сущностей реального мира. Их разработка предопределила весь дальнейших ход работ над данным проектом.

Декомпозиция образов. Рассмотрим следующую пару лингвистических конструкций: «заехать» и «проехались». Эти конструкции содержат одну общую компонентную конструкцию – «еха». Выделение её в отдельную конструкцию с присвоением ей идентификатора, например, «10» приводит к преобразованию исходных конструкций к виду «за10ть» и «про10лись». Преобразование этого вида будем называть декомпозицией образов.

В АПС декомпозиция образов – это фундамент всей когнитивной деятельности обучающихся систем. Это фундамент, на котором строится вся познавательная деятельность этих систем. Декомпозиция порождает новое знание. Конструкция 10, порождённая в результате декомпозиции, несёт в себе определённую семантику, т.е. описывает некоторую сущность реального мира.

Обобщение конструкций. Конкретизация обобщенных конструкций. С процессом декомпозиции конструкций представления знаний тесно связано их обобщение, на результатах которого, в свою очередь, базируется порождение конкретных конструкций путём конкретизации обобщённых конструкций, а также другие когнитивные, мыслительные и поведенческие процессы.

Вернёмся к приведённому выше лингвистическому примеру – «за10ть» и «про10лись».

Совершенно естественным выглядит преобразование этой пары образов, в результате которого конструкция 10 связывается, с одной стороны, с парой префиксов «за» и «про» и с парой флексий «ть» и «лись».

Новая конструкция описывает множество аналогичных лингвистических конструкций.

Эта операция порождения новой конструкции представляет собой операцию обобщения конкретных конструкций, в результате которой порождается обобщённая конструкция. В рамках АПС декларируются обобщённые конструкции различных уровней общности.

Обобщённые конструкции используются для классификации сущностей реального мира (чтобы отличать человека от кота), идентификации классов сущностей реального мира (это – человек), а также для синтеза новых образов, никогда не поступавших на вход системы, и выполнения иных очень важных функций.

Нетрудно видеть, что на основании обобщённой конструкции, порождённой на основе обобщения двух конкретных конструкций, могут быть порождены четыре конкретные конструкции, в том числе две конструкции – «про10ть» и «за10лись», которые никогда не поступали на вход системы. Эту операцию будем называть конкретизацией обобщённых образов. Конкретизацией могут порождаться обобщённые конструкции меньшего уровня общности, а также конкретные конструкции.

Операцию порождения конкретных конструкций на базе обобщённых будем называть метапроцедурой конкретизации обобщённых конструкций.

Обращает на себя внимание то обстоятельство, что конструкция «за10лись» некорректна. Это является следствием того, что операции обобщения и последующей конкретизации обобщённых конструкций в большинстве случаев являются индуктивными преобразованиями. В этом случае они дают лишь правдоподобный результат.

Процессы обобщения и конкретизации в АПС реализуются одноимёнными метапроцедурами.

Прочие метапроцедуры. Разработка конструкций представления знаний, метапроцедур декомпозиции, обобщения и конкретизации обобщённых образов явилась предпосылкой разработки прочих когнитивных метапроцедур – метапроцедур композиции образов, забывания, порождения образов по аналогии и подражанием, формирования понятий и понятийных образов.

Разработка этих метапроцедур, в свою очередь, создала предпосылки для разработки прочих метапроцедур некогнитивного свойства – метапроцедур обработки входного потока информации, подсознательного и сознательного выполнения действий и мышления.

Важнейшими среди них являются метапроцедуры, моделирующие основные процессы возбуждения – метапроцедуры афферентного, эфферентного и горизонтального возбуждения. Первые две из них моделируют одноимённые процессы, протекающие в нейронных сетях. Афферентное возбуждение моделирует процессы обработки входной сенсорной информации. Кроме того, оно является компонентом горизонтального возбуждения. Эфферентное возбуждение используется для выполнения системой действий и мышления. Оно также является компонентом горизонтального возбуждения. Горизонтальное возбуждение используется для выполнения системой действий и мыслительных операций в подсознательном и сознательном режимах. Из известных мне работ по нейрофизиологии не ясно, обнаружено ли в нейронных сетях горизонтальное возбуждение. Но что-то похожее там непременно быть должно, поскольку это основной механизм мышления и выполнения действий.

3.3.4. Априорные знания.

Априорными знаниями будем называть знания, помещаемые в память системы на стадии её создания.

Основной функцией обучающейся системы является выработка и реализация целесообразной реакции на входную информацию и информацию, содержащуюся в памяти системы. Целесообразное поведение, несмотря на предельную неопределённость этого понятия, предполагает сообразность этой реакции некоторой цели – глобальной цели функционирования обучающейся системы. Решение задачи целесообразного поведения системы требует разработки средств представления глобальной цели функционирования обучающейся системы. В АПС глобальная цель функционирования системы реализуется совокупностью локальных целей, в качестве которых выступают априорные (наследственные) обобщённых образов сущностей реального мира, каждому из которых приписана априорная оценка. Оценка, приписанная образу сущности реального мира, характеризует степень полезности/опасности этой сущности реального мира для системы. Эти образы будем называть априорными оценочными образами. Это один из видов априорных знаний обучающихся систем. Наличие априорных оценочных образов позволяет относить обучающиеся системы к категории систем с внутренней семантикой. С момента создания такой системы она знает, что ей полезно, и что вредно или даже опасно.

Огромную роль оценочные образы играются также в когнитивных процессах.

Вторым видом априорных знаний обучающихся систем являются безусловные рефлексы, основным назначением которых является реализация типовых реакций системы в типовых ситуациях. Безусловные рефлексы реализуют защитные функции, функции жизнеобеспечения системы, а также когнитивные функции на ранних стадиях развития системы. На ранних стадиях развития обучающейся системы без аппарата безусловных рефлексов просто не могут выжить.

3.3.5. Подсознание и сознание.

Анализ процессов мышления, выполняемых средствами мыслительного горизонтального возбуждения, позволяет выявить два режима выполнения протекающих в памяти системы процессов (в том числе – мышления) – подсознательный и сознательный. Осмысление этих процессов позволяет сформулировать различия между этими формами функционирования и мышления.

Подсознательный режим выполнения процессов протекает под управлением исключительно метапроцедур, которые выполняются узлами сети и диспетчером памяти. Это обеспечивает выработку и выполнение быстрой реакции на внешнее воздействие. Но это быстродействие достигается в ущерб качеству принимаемых решений, поскольку широта и глубина охватываемых при этом знаний, хранящихся в памяти системы, весьма ограничена.

В сознательном режиме основную работу по управлению мышлением и выполнением действий выполняют метапроцедура управления мыслительными процессами и один из видов конструкций представления знаний – приобретённые мыслительные сценарии. В сознательном режиме вспомогательные функции выполняют также метапроцедуры, используемые в подсознательном режиме. Управление процессами в памяти со стороны приобретённых сценариев обеспечивает выполнение мышления по более гибким и совершенным схемам, чем при подсознательном мышлении.

Управление со стороны этих сценариев обусловливает индивидуальный характер мышления каждой системы. Процессы мышления в сознательном режиме сопровождаются их вербализацией вслух или «про себя» (понятийно-вербальные рассуждения). В ходе сознательного мышления могут использоваться практически все знания, накопленные в памяти системы. Это обеспечивает более высокое, как правило, качество принимаемых решений. Но система может выполнять сознательное мышление только тогда, когда это позволяет ситуации в операционной среде, т.е.

когда не требуется быстрая реакция системы на внешние воздействия.

4. Основные понятия.

4.1. Обучение и обучающиеся системы.

Обучающиеся системы. Под обучающейся системой будем понимать систему, способную выполнять процессы наблюдения за внешней средой, мышления, включая поиск решений, приобретения знаний и выполнения действий. Основными функциями обучающихся систем являются выработка и реализация реакций на внешние воздействия. Одной из фундаментальных особенностей обучающихся систем является их способность приобретать знания в ходе своего функционирования и использовать эти знания в своей практической деятельности. Приобретение знаний и их использование обучающаяся система осуществляет в течение всей её жизни.

Обучающиеся системы будем подразделять на естественные (ЕОС) и искусственные (ИОС). Искусственные обучающиеся системы, базирующиеся на модели представления знаний АПС, будем называть информационно-логическими биоморфными системами (ИЛБС).

Из всего множества возможных типов искусственных обучающихся систем будем рассматривать только информационно-логические биоморфные системы, т.е. системы, концептуальным базисом которых является модель представления знаний АПС.

Отметим, что соображения и выводы, содержащиеся в данной работе, могут быть отнесены не только к ИЛБС, но, в той или иной степени, и к ЕОС.

Обучение и приобретение знаний. Уточним трактовку в данной работе термина «обучение». Под термином «обучение» будем понимать приобретение знаний всех видов, которыми оперирует обучающаяся система, приобретение знаний всеми средствами и способами. Под процессами обучения будем понимать процессы извлечения знаний из потока внешней входной нелингвистической и лингвистической информации, процессы порождения новых знаний на основе имеющихся в памяти системы, а также процессы накопления опыта собственного функционирования – навыков мышления, движений и поведения.

Обучение может протекать с учителем и без учителя. Строго говоря, учитель наличествует всегда. В том случае, когда нет учителя в общепринятом смысле этого слова, роль учителя играет операционная среда. Отметим, что разного рода научные исследования можно рассматривать как одну из форм обучения.

4.2. Реальный мир и сущности реального мира. Операционная среда.

Реальный мир состоит из сущностей. Под сущностями реального мира (СРМ) будем понимать все реально существующие в нем: объекты, свойства объектов, отношения (плоскостные, пространственные, качественные, количественные и т.п.), свойства отношений, и т.п. Сущностями реального мира являются естественные и искусственные обучающиеся системы, включая их компоненты, а также пространство и время. «Другими словами, не существует ничего, что не являлось бы сущностью» [Попов Э.В., 1982, с. 133]. Все сущности конкретны (индивидуальны).

Некоторый фрагмент реального мира, включающий в себя множество сущностей, участвующих в процессах функционирования отдельной обучающейся системы, будем называть операционной средой этой обучающейся системы.

4.3. Модель представления знаний «Активная Пирамидальная Сеть - 2010».

4.3.1. Предварительные замечания.

Фундаментальной при создании любой искусственной системы представления и обработки знаний является проблема выбора или разработки модели представления знаний.

Задача полномасштабного моделирования мыслительной и поведенческой деятельности потребовала разработки модели представления знаний, обладающей необходимыми для этого свойствами. Эта модель имеет существенную специфику по сравнению с ранее использовавшимися в области искусственного интеллекта моделями. Многие из составляющих её компонентов специфичны именно для этой модели представления знаний.

4.3.2. Модели представления данных и знаний.

Будем полагать, что модели представления знания отличаются от моделей представления данных наличием универсальных процедур дедуктивного и индуктивного логического вывода. Универсальными они должны быть в том смысле, что способны манипулировать знаниями любого вида, любой семантической категории. Другими словами, эти процедуры должны принимать во внимание только синтаксис конструкций представления знаний и полностью игнорировать их семантику.

Многие из известных моделей представления данных имели процедуры, которые можно отнести к числу процедур дедуктивного и индуктивного вывода, но никогда они не носили универсального характера. В этом смысле модели, обычно причисляемые к числу моделей представления знаний, – логические, фреймовые (в смысле М. Минского [Минский М.]), продукционные и семантико-сетевые – моделями представления знаний не являются, поскольку не имеют универсальных метапроцедур индуктивного вывода.

4.3.3. Основные черты модели представления знаний,

ориентированной на создание ИЛБС. Модель представления знаний, ориентированная на создание ИЛБС, должна обладать следующими чертами.

Модель представления знаний должна иметь унифицированные средства для

представления и обработки знаний всех видов знаний, указанных в разделе Виды знаний в обучающихся системах, а также представление знаний всех семантических классов. Другими словами, для представления всех видов знаний должно

использоваться ограниченное число типов элементов и конструкций представления знаний. Это создает возможность оперировать этими видами знаний как унифицированными конструкциями, что в свою очередь, позволяет использовать ограниченное число метапроцедур. Кроме того, унификация ЭЗ упрощает стыковку между отделами памяти, содержащими различные виды знаний. Все это позволит упростить средства реализации ОС.

Модель представления знаний рассматриваемого класса должна включать в себя комплекс когнитивных средств, указанных в разделе Когнитивные средства

обучающихся систем. Эти средства являются фундаментом когнитивных процессов.

Они должны практически в полном объеме моделировать аналогичные средства животных и человека различных уровней развития.

Рассматриваемая МПЗ должна быть моделью сетевого типа. Модель представления знаний должна обеспечивать эффективную реализацию всех метапроцедур, необходимых для функционирования ОС, в том числе, когнитивных. Как будет показано ниже, эти метапроцедуры (в том числе метапроцедуры декомпозиции, обобщения образов, порождения образов по аналогии и подражания) требуют высокой степени ассоциативной связности элементов представления знаний, т.е.

наличия явных связей между узлами, обозначающими сущности реального мира. Функционирование указанных выше метапроцедур в моделях, не обладающих этим свойством, в реальных предметных областях достаточно высокого уровня сложности практически невозможно, т.к. даже для сравнительно простых предметных областей число возможных вариантов, подлежащих перебору при выполнении этих метапроцедур, астрономически велико (1010 - 1011) [Гладун В.П., 1977, с. 16].

4.3.4. Схема модели представления знаний

«Активная Пирамидальная Сеть - 2010».

4.3.4.1. Общие сведения.

Состав всех указанных в приведённой ниже схеме компонентов-множеств определяется спецификой конкретной обучающейся системы. Ведь невозможно же унифицировать, например, перечни безусловных рефлексов всех видов животных и ИЛБС. Но в модели представления знаний любой обучающейся системы непременно присутствуют все указанные в данном разделе компоненты.

Состояния большинства элементов, образующих МПЗ, изменяется в ходе функционирования системы. Априорными будем называть те состояния, которые были им присвоены в ходе создания системы и которые система имеет в самом начале своего функционирования. Большая их часть остаётся неизменной в течение всего жизненного цикла системы.

Строгое определение АПС-2010 требует весьма детального рассмотрения этих компонентов, чему и посвящены последующие разделы данной работы.

Модель представления знаний АПС-2010 определим следующим образом: M = <R, Eо, Eу, S, L, T, P, Iа, Us>. (I-1)

4.3.4.2. Множество R сенсоров.

R – множество сенсоров (рецепторов, датчиков). Сенсоры осуществляют восприятие внешних воздействий (изображение, звук и т.п.), а также восприятие состояния эффекторов системы и органов её жизнеобеспечения. Сигналы с сенсоров через кодировщики поступают в память системы.

4.3.4.3. Множество Eо эффекторов.

Eо – множество механических и биохимических эффекторов (исполнительных механизмов). При помощи эффекторов система воздействует на операционную среду.

4.3.4.4. Множество Eу управляющих и служебных элементов.

Eу – множество управляющих и служебных элементов, служащих для управления процессами, протекающими в памяти системы. Элементы этого множества могут рассматриваться как разновидность эффекторов.

4.3.4.5. Множество S узлов сети.

Общие сведения. S – множество узлов и элементов знаний.

S = Sт V Sп, Sт – множество внешних терминальных (непроизводных) узлов сети.

Sп – множество нетерминальных (производных) узлов сети.

Sп = Sп,п V Sп,а, где Sп, п – множество производных (нетерминальных) пассивных узлов сети. Sп,а – множество производных (нетерминальных) активных узлов сети.

Каждому узлу сети приписываются следующие величины, характеризующие его текущее состояние: а) p – приоритет; б) uа – уровень афферентного возбуждения; в) uэ – уровень эфферентного возбуждения; г) t – тип данного узла, t T (см. раздел Множество T типов композиции узлов в

ассоциации и образы сущностей реального мира).

Суть уровней афферентного и эфферентного возбуждения разъясняется в последующем тексте данной работы.

Множество Sт непроизводных (внешних терминальных) узлов сети. Sт – множество внешних терминальных (непроизводных) узлов сети.

Каждый элемент множества Sт априори (т.е. с момента создания системы) связан с одним определённым сенсором или эффектором.

Sт = {a1, a2, …, ai,, … , aq}, (I-2) где ai – внешний терминальный узел памяти, i = 1, q .

Априорное фиксирование связей элементов этого множества с сенсорами и эффекторами предопределяет то, что их семантика также априори задана.

Множество Sп, п производных (нетерминальных) пассивных узлов сети. Sп,п = {sп,п,1, sп,п,2, … , sп,п,j, … , sп,п,r,}, (I-3) где sп,п,j – пассивный производный узел памяти, j = 1, r , r >> q.

Каждый пассивный производный узел сети имеет приоритет, равный нулю.

Множество Sп,а производных (нетерминальных) активных узлов сети. Sп,а = {sп,а,1, sп,а,2, … , sп,а,k, … , sп,а,v}, (I-4) где sп,а,k – активный производный ЭЗ памяти обучающейся системы, k = 1, v , v >> q.

Приоритет каждого активного производного узла больше нуля. Таким образом, производные пассивные и активные узлы различаются значениями приписанных им приоритетов. Активные узлы сети будем также называть элементами знаний (ЭЗ).

В начальный момент существования обучающейся системы множество Sп,а составляют лишь идентификаторы и компоненты априорных образов – элементов множества Iа (см. раздел Множество априорных Iа образов (знаний)).

Под воздействием метапроцедур (см. раздел Множество P метапроцедур) пассивные узлы переходят в активное состояние и обратно. При этом формируются и ликвидируются образы сущностей реального мира (см. раздел Типы композиции элементов знаний в ассоциациях и образах).

51

4.3.4.6. Множество L связей сети.

Общие сведения. Каждый узел АПС имеет множество связей. Связи будем подразделять на нисходящие и восходящие. Нисходящие связи ориентированы от данного узла вниз сети, в сторону сенсоров и эффекторов. Восходящие связи ориентированы в противоположную сторону, в сторону верхних ярусов сети.

Каждой связи lm L приписывается две величины, характеризующие текущее её состояние – афферентная clm,а и эфферентная clm,э проводимости.

Каждая связь может находиться в одном из двух состояний – активном и пассивном.

L = Lп V Lа, где Lп – множество пассивных связей, Lа – множество активных связей. Множество Lп пассивных связей сети. Пассивная связь имеет следующие значения проводимостей: clm,а = 0, clm,э = 0.

Пассивные связи имеют практически все узлы сети. Они не связывают между собой узлы сети. Они являются лишь потенциальными связями между ЭЗ.

Пассивными связями являются а) часть восходящих связей терминальных узлов, б) все связи производных пассивных узлов, в) часть нисходящих и часть восходящих связей производных активных узлов.

Пассивные связи, указанные в п. в), являются резервом, который используется при модификации образов сущностей реального мира.

Множество Lа активных связей сети. При активизации узла некоторые из его пассивных связей также переходят в активное состояние. При этом их афферентные проводимости приобретают значения, отличные от нуля: clm,а > 0.

Впоследствии отличными от нуля становятся и их эфферентные проводимости: clm,э > 0.

Таким образом, пассивные и активные связи различаются только проводимостями.

Активизироваться могут пассивные восходящие связи непроизводных узлов, а также нисходящие и восходящие пассивные связи производных ЭЗ.

Каждый непроизводный (терминальный) узел имеет единственную нисходящую связь.

Эта связь является априорно активной. Это означает, что каждый определённый выход определённого сенсорного кодировщика и определённый вход определённого эффекторного кодировщика связаны с определённым терминальным (непроизводным) узлом памяти системы.

4.3.4.7. Множество T типов композиции узлов в ассоциации и образы сущностей реального мира.

Элементы знаний, описывающие внутреннюю структуру сущности реального мира, образуют ассоциации элементов знаний. Существуют также ассоциации элементов знаний, описывающих множества в некотором смысле сходных СРМ. Элементы знаний могут объединяться в ассоциации различными способами. В этом смысле можно говорить о типах композиции элементов знаний в ассоциации, а также о типах ассоциаций.

На ассоциациях строятся образы сущностей реального мира. Образ наследует тип ассоциации, на котором он построен. Тип образа определяется типом его идентификатора. Это означает, что тип образа приписывается каждому пассивному и активному узлу АПС.

Множество T типов композиции узлов в ассоциации представления знаний представляет собой, по существу, множество синтаксических правил построения образов СРМ из непроизводных и производных узлов, а также правил манипулирования образами.

4.3.4.8. Множество P метапроцедур.

P – множество процедур манипулирования элементами множеств S, а также процедур функционирования диспетчера памяти. Эти процедуры будем называть метапроцедурами. Некоторые из метапроцедур перечислены в разделе Метапроцедуры. Рассмотрению метапроцедур посвящена значительная часть настоящего обзора.

4.3.4.9. Множество априорных Iа образов (знаний).

Общие сведения. Априорные знания, т.е. знания, которые помещаются в память системы на стадии её создания, представляют собой совокупность а) множества Iао априорных оценочных сценариев, которые для краткости будем называть априорными оценками, б) множества Iбр безусловных рефлексов, в) множества Iас априорных стереотипов поведения и эмоций.

Iа = Iао V Iбр V Iас.

Элементами множества Iа являются идентификаторы образов, реализующих эти виды знаний.

Множество Iао априорных оценок. Элементы множества Iао представляют собой оценки обобщённых априорных образов сущностей реального мира. Эти оценки служат для определения меры полезности/опасности для системы сущностей реального мира, с которыми ей доводится сталкиваться.

Элементы множества Iао являются одним из важнейших механизмов определения локальных целей, совокупность которых реализует глобальную цель функционирования обучающейся системы. Они могут также служить побуждениями к выполнению действий и процессов мышления.

Множество Iбр безусловных рефлексов. Iбр – множество безусловных рефлексов, реализующих защитные функции, функции жизнеобеспечения системы, и прочие функции, направленные на достижение глобальной цели функционирования системы.

Множество Iас априорных стереотипов поведения. Iас – множество априорных стереотипов поведения, описывающих поведение системы в стереотипных ситуациях.

4.3.4.10. Текущий уровень Us возбуждения системы.

Текущее состояние системы в каждый момент времени характеризуется её текущим уровнем возбуждения Us.

4.3.5. Соотношение ИЛБС и модели представления знаний АПС-2010.

Модель представления знаний АПС-2010 содержит описания механизмов, являющиеся непременными компонентами ИЛБС. В этом смысле МПЗ АПС является конструктивным и процедурным фундаментом ИЛБС. На этом фундаменте может быть построено множество инструментальных, исследовательских и прикладных ИЛБС различного назначения и уровня сложности. Эти ИЛБС могут иметь различные схемы и различное наполнение компонентов МПЗ.