УДК 512.6, 517.9, 519.6 Дата подачи статьи: 03.08.22, после доработки: 07.09.22
DOI: 10.15827/0236-235X.141.014-025 2023. Т. 36. № 1. С. 014-025
Когнитивные регуляторы: технологии мягких вычислений и информационно-термодинамический закон самоорганизации интеллектуального управления
А.А. Шевченко 1, научный сотрудник, allabard@yandex.ru А.В. Шевченко 1, научный сотрудник, sh3vchenkoav@yandex.ru Д.П. Зрелова 1,2, аспирант, стажер-исследователь, zrelova@ijinr.ru С.В. Ульянов 2, д.ф.-м.н, профессор, ulyanovsv46_46@m-ail.ru
1 Государственный университет «Дубна» - Институт системного анализа и управления, г. Дубна, 141980, Россия
2 Объединенный институт ядерных исследований - лаборатория информационных технологий им. М.Г. Мещерякова, г. Дубна, 141980, Россия
В работе рассматривается методология проектирования интеллектуальных когнитивных систем управления сложными динамическими системами. Кратко описаны информационные и термодинамические подходы, объединяющие однородным условием критерии динамической устойчивости, управляемости и робастности.
Обозначены проблемы обучения и адаптации нечеткого регулятора, которые являются актуальными в современной теории управления. Многие существующие решения используют модели искусственных нейронных сетей, основанные на алгоритме обратного распространения ошибки, многослойной структуре Кохонена и т.д. К сожалению, подобные алгоритмы не гарантируют требуемого уровня надежности и точности управления в сложных и непредвиденных ситуациях.
Предложено одно из решений проблемы разработки системы когнитивного управления. Оно заключается в поиске конструктивного решения задач проектирования баз знаний и интеллектуального ро-бастного когнитивного управления в заданном проблемно-ориентированном приложении. Сравниваются различные типы регуляторов, в том числе интеллектуальный регулятор на основе эмоционального обучения мозга. Описаны преимущества проектирования робастных баз знаний на основе программно-алгоритмического комплекса Оптимизатор баз знаний (SCOptKBTM) на мягких вычислениях.
Рассматривается одна из ключевых задач современной робототехники - разработка технологий когнитивного взаимодействия, позволяющих выполнять интеллектуальные функции управления за счет перераспределения знаний и управления на программном уровне. На практическом примере показана эффективность предложенной гибридной когнитивной системы управления, повышающей точность и надежность распознавания ментальных команд.
Ключевые слова: мягкие вычисления, интеллектуальные регуляторы, информационно-термодинамический закон, когнитивные системы управления, оптимизатор баз знаний.
Интерфейсы «мозг-компьютер» с использованием когнитивных интеллектуальных систем распространены практически повсеместно. Однако для полномасштабного применения и взаимодействия этих систем как между собой, так и с пользователями уровень интеллектуальности данных интерфейсов недостаточен. Они требуют системного подхода, фильтрации и структуризации обрабатываемой информации. Две парадигмы построения интерфейсов - глубокое обучение и обучение без учителя - представляют собой вычислительные абстракции механизмов, заложенных в коре головного мозга. Эксперименты демонстрируют [1], что, например, чувство восприятия человеком понятия числа может быть приобретено без яв-
ного контроля со стороны эксперта, который свободно участвует в манипуляциях с объектами. По аналогии с головным мозгом нейронная сеть наблюдает за манипуляциями над набором объектов и учится предсказывать действия. Созданный в процессе образ изображения определяет закономерности, придающие модели ряд новых свойств, и может быть использован для эффективного управления событиями как новый инструментарий традиционной теории управления.
Современные объекты управления (ОУ) представляют собой сложные плохо формализуемые динамические системы. Примером таких объектов могут служить подвижные летательные и наземные беспилотные аппараты,
встраиваемые биопроцессорные системы навигации и захвата деформируемых предметов, вспомогательные роботы сервисного обслуживания людей с физическими недостатками и пожилых людей, склонных к деменции, и т.д. Системы характеризуются информационной неопределенностью структур моделей и целей управления, высокой степенью свободы и существенных нелинейностей с перекрестными связями, нестабильностью, распределенными датчиками и исполнительными механизмами, высоким уровнем шума, резкими скачкообразными изменениями в структуре и динамике и т.д., то есть являются типичными информационными источниками нештатных и непредсказуемых ситуаций управления. Проектирование надежных современных систем управления для непредвиденных ситуаций - краеугольный камень современной теории систем управления. Насколько успешно система справится с вышеуказанными трудностями зависит от интеллектуального уровня усовершенствованной системы управления.
Регуляторы интеллектуальных систем управления
На практике в качестве системы управления на объекте устанавливают регулятор, который в зависимости от ментальных команд оператора вырабатывает управляющее воздействие для исполнительных механизмов. Как правило, используют типовые регуляторы, названия которых соответствуют названиям типовых звеньев.
• П-регулятор, пропорциональный регулятор. Передаточная функция П-регулятора: Wn(s) = K\. Принцип действия заключается в том, что регулятор вырабатывает управляющее воздействие на объект пропорционально величине ошибки (чем больше ошибка Е, тем больше управляющее воздействие Y). Отвечает за точность управления.
• И-регулятор, интегрирующий регулятор. Передаточная функция И-регулятора: Wn(s) = Ko/s. Управляющее воздействие пропорционально интегралу от ошибки. Отвечает за накопление ошибки и длительность переходного процесса.
• Д-регулятор, дифференцирующий регулятор. Передаточная функция Д-регулятора: Wk(s) = Krs. Генерирует управляющее воздействие только при изменении регулируемой величины: Y = fadE/dt. Отвечает за перерегулирование.
В качестве такого регулятора может выступать, например, простой релейный регулятор, где для конечного множества выходных команд (например, вперед, назад, влево, вправо) вырабатываются одни и те же постоянные управляющие воздействия. Структура системы пропорционального регулятора управления основана на принципе реле и выработке управляющего воздействия, пропорционального величине распознанного сигнала. Для более эффективной работы системы управления можно использовать и более сложный регулятор, например, пропорционально-интегрально-дифференциальный (ПИД) регулятор, объединяющий П-, И- и Д-регуляторы. Передаточная функция ПИД-регулятора: W^(s) = Ki + Ko/s + + K2s.
В системах управления и принятия решений в режиме реального времени успешно применяются биологически мотивированные когнитивные интеллектуальные регуляторы на основе эмоционального обучения мозга [2-4]. Эти регуляторы являются мощной методологией благодаря своей простоте, низкой вычислительной сложности и быстрому обучению, в то время как методы на основе градиента и эволюционные алгоритмы трудно применять из-за их высокой вычислительной сложности [5-7].
Для описания эмоционального обучения мозга была создана математическая модель -регулятор эмоционального обучения мозга (BELC). Структурно эта модель разделена на две части: сенсорная нейронная сеть, которая приблизительно соответствует миндалине, и эмоциональная нейронная сеть, соответствующая орбитальной префронтальной коре. Основными для сенсорной нейронной сети являются самообучающиеся и регулирующие параметры, а для эмоциональной нейронной сети -функции реагирования на внешние факторы и установления сенсорно-эмоциональной корреляции. Эмоциональная нейронная сеть оказывает косвенное влияние на сенсорную нейронную сеть. Более того, они влияют и друг на друга. Важно отметить, что условные рефлексы, возникающие в миндалине, отличаются от происходящих в мозжечке: в миндалине они устанавливают эмоциональные связи, а в мозжечке участвуют в обучающих стимулах.
Базисом системного проектирования интеллектуальных систем, основанных на эмоциональных сигналах, являются методы управления на основе искусственных нейронных сетей, нечеткого управления и генетических алгорит-
мов. На базе смоделированной математической модели млекопитающих BEL была разработана архитектура микропроцессорного контроллера под названием «Интеллектуальный регулятор на основе эмоционального обучения мозга» (BELBIC) - нейробиологически мотивированный интеллектуальный регулятор, основанный на вычислительной модели эмоционального обучения в лимбической системе млекопитающих [8]. Возможности обучения, многоцелевые свойства и низкая вычислительная сложность BELBIC делают его очень перспективным инструментом для применения в приложениях реального времени [9].
Работа электрогидравлической системы на основе BELBIC-регулятора сравнивалась в [10] с регулятором линеаризации обратной связи, обратного шага и с ПИД-регулятором (рис. 1).
BELBIC BACKSTEPPING — — — FEEDBACK LINEARIZATION .......PID
Рис. 1. Сравнение регуляторов без внешних шумов
Fig. 1. A comparison of regulators without external noise
Результаты показывают, что BELBIC-регу-лятор обеспечивает точность и угловую скорость гидромотора до желаемой скорости намного быстрее, чем регуляторы линеаризации с обратной связью, обратного шага и ПИД-регуляторы, и за более короткое время устанавливает переходные процессы. Потребление энергии BELBIC примерно такое же, как ПИД-регулятором. При этом у BELBIC наблюдается меньше ошибок отслеживания опорного сигнала, он демонстрирует хорошую инженерную устойчивость к изменениям в динамике системы, а также приемлемую точность (по сравнению с ПИД-регулятором [11]). Основное преимущество в производительности рассмат-
риваемой электрогидравлической системы заключается в высокой степени адаптируемости управления и надежности по отношению к первоначальной даже при полном отсутствии знаний о модели ОУ.
По сравнению с простыми регуляторами BELBIC показывает очень хорошие результаты. Он имеет два основных входа: сенсорный ввод ^Г) и первичное вознаграждение (Rew), гибкость настройки делает его оптимальным в многоцелевых задачах. Поскольку BELBIC обладает способностью к обучению, он показывает такую же реакцию, как робастные регуляторы. Одной из важных особенностей применения BELBIC для корректного управления системой является назначение оптимального параметра как для Rew, так и для SI (рис. 2). Существует несколько методов настройки этих параметров: подход на основе роя частиц [12], алгоритм на основе метода Ляпунова [13], нечеткая настройка [14] и метод проб и ошибок.
В работе [15] рассматривается возможность разработки модели эмоционального обучения мозга на основе нечетких вейвлетов (WFBELC), которая может быть применена для гораздо более эффективного решения неопределенности нелинейных систем [16].
Одним из эффективных методов для описания системы со случайными характеристиками с точки зрения структуры и параметров является объединение системы нечеткого вывода и нейронной сети при построении моделей. Нечеткая нейронная сеть не только предлагает уникальную и гибкую структуру для представления знаний, но и способна к быстрому обучению. Кроме того, технология вейвлет-анализа использует параметры расширения и трансляции «материнского» вейвлета, поэтому аппроксимация сигнала может быть более точной и более быстрой из-за частотно-временных свойств локализации нечетких вейвлетов. Если эта технология используется в качестве функции активации, то она приобретает способность анализировать нестационарные сигналы для нахождения локальных деталей сигнала.
Следовательно, объединение нечеткого логического вывода, нейронной сети и вейвлет-функции для построения вейвлет-нечеткой нейронной сети способствует получению более быстрой глобальной сходимости и обогащает отношения отображения за меньшее число итераций при работе с нелинейными и неопределенными системами.
Частично расширить область применения ПИД-регуляторов позволяют нечеткие регуля-
Рис. 2. Схема системы с обратной связью с применением BELBIC Fig. 2. A feedback system diagram using BELBIC
торы (НР) путем добавления продукционных правил нечеткой логики и частичной адаптации системы. Совместное использование генетических алгоритмов и нечеткой нейронной сети позволило полностью адаптировать систему, но для ее обучения требуется время, что крайне важно в чрезвычайных и непредвиденных ситуациях. Моделирование оптимального обучающего сигнала позволяет создать частичную самоорганизацию в системе за счет формирования оптимальных траекторий усиления ПИД-регулятора.
Повышение эффективности управления возможно за счет применения технологий мягких вычислений. Такой подход позволяет выполнять требования одного из принципов эффективности работы систем управления - неразрушение нижнего исполнительного уровня управления - за счет проектирования соответствующих БЗ НР. Модели НР демонстрируют повышенную способность управления динамическими ОУ, которые обладают слабоформа-лизованной структурой или функционируют в условиях неопределенности исходной информации.
В работе [17] показано, что основным результатом применения процесса самоорганизации является гарантированная возможность достижения необходимого уровня надежности и гибкости (адаптивности) воспроизводимой структуры когнитивной интеллектуальной системы управления (ИСУ). Для этой цели используются информационный и термодинамический подходы, объединяющие однородным условием критерии динамической устойчивости (функция Ляпунова), управляемости и ро-бастности.
На рисунке 3 приведено интегральное описание информационно-термодинамического закона распределения качеств управления, применяемого в задачах проектирования когнитивных ИСУ.
Приведенные соотношения между количеством информации, извлекаемой свободной энергии и работы подтверждают отмеченный выше вывод - робастность ИСУ можно повысить за счет производства энтропии когнитивного регулятора (КР), который уменьшает потери полезного ресурса ОУ, а негэнтропия снижает требования к минимуму исходной информации для достижения требуемого уровня робастности.
Поэтому извлекаемая информация, основанная на знаниях в БЗ КР, позволяет получить дополнительный информационно-энергетический ресурс для совершения полезной работы, что эквивалентно появлению целенаправленного действия на ОУ для гарантированного достижения цели управления. Этот факт подтверждает справедливость утверждения о физической природе информации [18-20], а управление, использующее данную информацию, позволяет совершить дополнительную полезную работу.
Проектирование когнитивной системы управления с применением оптимизатора БЗ на мягких вычислениях
Технология проектирования робастных ИСУ для настройки БЗ НР на основе оптимизатора БЗ (ОБЗ) [21] с применением технологии мягких вычислений позволяет проектировать ИСУ без использования системы стохастического моделирования. Это дает преимущество при проектировании нечетких систем управления для сложных и слабоформа-лизованных ОУ в непредвиденных ситуациях управления, а также возможность максимально адаптировать нечеткую систему управления для конкретной (непредвиденной) ситуации независимо от времени и места нахождения ОУ. С алгоритмической точки зрения эффективное решение актуальной проблемы обеспе-
Информационно-термодинамические аспекты когнитивного интеллектуального управления: устойчивость, управляемость и робастность
qi il ■ p(q, t,k(Soy - (STp + SKp)),u) + (Soy Физический критерий - (STP + SKp)) • (Soy - (STp + SKp)) < 0
Устойчивость Управляемость Робастность
dd ^ dv=5q (p(q,t,k(Hoy -(Htp + Hkp)),u) + (Hoy - Информационный критерий (Htp + Нкр)) • Hoy - (HTp + Нкр)) < 0
Устойчивость Управляемость Робастность
Извлеченная квантовая информация, скрытая в классических состояниях, является информационным ресурсом для совершения дополнительной полезной работы
(M) + kB ln2ЛH > 0 Модифицированный второй закон термодинамики
t Wmjt) = k |тттißt < mc О Информационный закон извлечения полезной максимальной работы
Рис. 3. Информационно-термодинамический закон распределения качеств управления Fig. 3. An information-thermodynamic law of control quality distribution
чения устойчивого функционирования ОУ в условиях неопределенности и сохранения ро-бастности ИСУ означает, что в используемом алгоритме достижения цели управления выполняются следующие необходимые и достаточные условия [22]:
- минимум исходной информации о внешней среде (или о возмущении, действующем на
ОУ);
- минимальный расход обобщенного полезного ресурса в ОУ и ИСУ.
Практическим применением ИСУ на основе интеллектуального инструментария ОБЗ является возможность гарантированного достижения цели управления с максимальным качеством управления на верхнем уровне и минимальным расходом полезного ресурса системы «ОУ + регулятор» на нижнем (исполнительском) уровне иерархической ИСУ как в заданных, так и в непредвиденных ситуациях управления. Проблемы физических ограничений и информационных границ решаются возможностью формирования БЗ с требуемым уровнем робастности в процессе проектирования ИСУ путем извлечения знаний и ценной информации из динамического поведения модели самого физического ОУ. Под термином БЗ пони-
мается стандартное для теории нечетких систем управления определение БЗ в виде конечного множества продукционных логических правил определенной модели нечеткого вывода с конкретными типами и параметрами функций принадлежности, формирующих законы управления ОУ. Параметры и тип функции принадлежности хранятся в БД НР.
Основу ОБЗ составляет метод извлечения, обработки и формирования знаний с использованием обучающего сигнала, полученного в результате работы сверточной нейронной сети. Обучающий сигнал подается на вход ОБЗ, который аппроксимирует его с помощью заданной пользователем модели нечеткого вывода, используя разработанный инструментарий.
Рассмотрим подробнее процесс настройки функционирования подобной системы (рис. 4).
Система управления считывает показания датчиков и отправляет их на компьютер для последующей обработки. После регистрации сигналов они преобразуются с использованием таких методов, как пространственная фильтрация, измерение амплитуды напряжения, спектральный анализ или разделение одиночных нейронов. Следующим этапом является преобразование характеристик сигнала в ко-
Сигнал ЭЭГ
Интерфейс « мозг-компьютер»
Модуль машинного обучения
Оптимизатор БЗ на мягких вычислениях
Обработанный сигнал ЭЭГ и коэффициент классификации эмоции
Рис. 4. Схема обработки сигнала ЭЭГ с применением машинного обучения и ОБЗ на мягких вычислениях
Fig. 4. A block diagram of EEG signal processing using machine learning and SCOptKBTM on soft computing
б)
Рис. 5. Структура когнитивной интеллектуальной системы управления (а) и исполнение команд «разжатие» (слева) и «сжатие» (справа) руки-протеза (б)
Fig. 5. The structure of the cognitive intelligent control system (a). Execution of the "unload" command, the execution of the "compression " command of an arm prosthesis (б)
манды управления устройством. Алгоритм перевода может использовать методы линейного анализа, например, классический статистический анализ или нелинейные методы, такие как анализ с использованием команд управления устройством, а также различные имплемента-ции нейронных сетей. Далее результат работы алгоритма отправляется в ОБЗ. Приняв входные значения, ОБЗ оценивает предыдущее решение и осуществляет нечеткий вывод для проверки следующего решения. Результат нечеткого вывода отправляется на удаленное устройство. После этого система управления, обработав входные значения, вырабатывает управляющее воздействие. В данной модели важнейшим аспектом является факт получения оператором обратной связи как результата своей деятельности. Так образуется замкнутый контур управления между системой и оператором.
На рисунке 5 а представлена обобщенная схема интеллектуальной когнитивной системы управления с обратной связью на основе глубокого машинного обучения с применением нейронных сетей с оптимальной структурой, учитывающая существующие подходы к когнитивному управлению роботизированной рукой-протезом [22].
На рисунке 5б показан эксперимент: оператор генерирует ментальную команду, которая считывается нейроинтерфейсом Emotiv EPOC+, тем самым управляя процессом сжатия-разжатия руки-протеза.
Особенностью схемы гибридной интеллектуальной когнитивной системы управления (рис. 6) является наличие двух взаимодействующих регуляторов: нечеткого интеллектуального и когнитивного. БЗ когнитивного и интеллектуального технического регуляторов проектируются и создаются на основе сигнала
ошибки управления и соответствующих обучающих сигналов, описывающих динамическое поведение ОУ или ЭЭГ коры головного мозга человека-оператора. Ошибка управления содержит в себе данные о непредвиденной ситуации управления, а также выступает в роли входных данных для рассматриваемых регуляторов. Выходные сигналы регуляторов отражают реакции БЗ, которые в общем случае являются неточными и могут приводить к потере робастности системы управления. Оба сигнала поступают в блок квантового нечеткого вывода, который осуществляет самоорганизацию неполных БЗ, формируя в реальном времени новую робастную БЗ гибридного квантового интеллектуального КР [23].
Пример практического применения интеллектуального когнитивного управления
Для иллюстрации практического применения интеллектуального когнитивного управления был проведен эксперимент, целью которого являлось управление автономным подвижным мини-роботом-машинкой по лабиринту посредством воздействия с помощью
Рис. 6. Схема гибридной интеллектуальной когнитивной системы управления Fig. 6. A block diagram of a hybrid intelligent cognitive control system
сигнала ЭЭГ и подхода воображения движения [24]. Как дополнительный элемент управления использовался ультразвуковой датчик для предотвращения столкновения с препятствием.
Применяемая аппаратная часть робота-машинки:
- робот-машинка с контроллером на базе Arduino UNO, Bluetooth-модулем HC-05 и ультразвуковым датчиком;
- нейроинтерфейс OpenBCI и EEG Electrode Cap Kit;
- ПК под управлением ОС Windows с Bluetooth-модулем;
- ПО SCOptKB™.
Общая схема взаимодействия программной и аппаратной платформ показана на ршунке 7.
Эксперимент проходил следующие этапы: обучение оператора генерации ментальных команд, на основе обучающего сигнала обучение
системы управления, переход в фазу активного управления: робот-машинка осуществляет движение вперед по произвольно спроектированному лабиринту и на основе данных от ультразвукового датчика останавливается в 20 см от препятствия. Оператор воображает движения левой или правой рукой, на основе чего принимается решение об изменении направления движения.
Процесс обучения оператора осуществлялся следующим образом. Через специальное ПО регистрировались сигнал ЭЭГ оператора в состоянии покоя, а затем ментальные команды. Для этого оператор наблюдал за ОУ, тем самым генерируя ментальную команду движения в нужном направлении посредством концентрации внимания и возбуждения определенных участков головного мозга. Для каждой ментальной команды записывался индивидуальный сигнал.
Рис. 7. Схема взаимодействия когнитивной системы управления с применением ОБЗ
на мягких вычислениях
Fig. 7. The interaction scheme of the cognitive control system with using SCOptKB™ on soft computing
Команды управления передавались в закодированном виде посредством В1ие1ооШ-сиг-нала на АМшпо-модуль робота-машинки для выполнения запрограммированных команд движения (вперед, назад, повернуть вправо, повернуть влево, остановиться).
Следует отметить, что принципиальной значимости связи возбуждения определенного участка головного мозга и ментальной команды нет. С точки зрения системы управления подразумевается, что оператор способен вновь генерировать записанные команды, которые интерпретируются системой для управления устройством.
Эксперимент проводился с помощью КеигоРуре™ - мощной платформы для упрощения организации интерфейса «мозг-компьютер» в режиме реального времени, нейрови-зуализации и обработки бионейронных сигналов. С помощью данного ПО был создан конвейер обработки данных для предсказания воображаемых движений (рис. 8). Основным узлом этого конвейера является общий про-
странственный фильтр (СБР), используемый для извлечения компонентов или шаблонов в сигнале ЭЭГ, наиболее подходящих для представления желаемых категорий или классов.
Стандартный конвейер состоит из четырех основных частей.
1. Получение данных. Включает импорт данных из внешнего источника, ввод/вывод внешнего потока данных и калибровки входных данных. Возможно использование сигнала ЭЭГ как в реальном времени (например, с нейрокомпьютерного интерфейса), так и из записанных данных. Калибровочные данные обрабатываются адаптивными алгоритмами и алгоритмами машинного обучения для первоначального обучения и определения их первоначальных параметров.
2. Предварительная обработка данных. Включает назначение цели (применимо для алгоритмов обучения с учителем, где предварительно размечаются маркеры классов данных), выбор диапазона, фильтр с конечной импульсной характеристикой и узлы сегментации.
Рис. 8. Конвейер обработки данных Fig. 8. Data processing pipeline
3. Извлечение признаков. Включает узел общего пространственного фильтра, извлекающего спектральные и пространственные закономерности в данных.
4. Классификация. Состоит из дисперсии, логарифма, логистической регрессии и измерения потерь.
Результат проверки показал точность распознавания воображаемой команды оператора около 61 %, то есть каждая четвертая команда распознавалась некорректно.
Для повышения качества распознавания ментальных команд был применен ОБЗ на мягких вычислениях. На первом этапе создания БЗ полученный обучающий сигнал использовался для формирования лингвистических переменных для входных значений. Количество нечетких множеств в каждой лингвистической переменной было ограничено до 4. На следующем этапе проектирования БЗ НР осуществлялись формирование и оптимизация количества правил НР. Выходные значения на данном этапе равнялись 0, так как их настройка производилась на следующем этапе проектирования НР. Далее настраивались входные значения НР.
Результаты эксперимента с применением ОБЗ на мягких вычислениях показали, что в непредвиденной ситуации система управления обрела большую устойчивость, повысив до 82,7 % точность распознавания движения.
Заключение
В работе сравниваются различные технологии управления ИСУ, показаны способы и преимущества проектирования когнитивных интеллектуальных систем с применением ОБЗ на мягких вычислениях. Проведен эксперимент для проверки эффективности систем на примере управления роботом-машинкой в произвольном лабиринте.
Результаты показали, что для проектирования качественной и робастной ИСУ с когнитивной составляющей недостаточно использовать только алгоритмы классификации и распознавания без нечеткой логики. Однако совместное использование таких информационных ресурсов с нечеткой логикой и мягкими вычислениями дает синергетический эффект повышения качества проектирования ИСУ.
Литература
1. Kondapaneni N., Perona P. A number sense as an emergent property of the manipulating brain. ArXiv, 2021. URL: https://arxiv.org/pdf/2012.04132.pdf (дата обращения: 29.07.2022).
2. Sharma P., Kumar V. Design and analysis of a BELBIC controlled semi active suspension system. J. of Physics: Conf. Ser., 2019, vol. 1240, art. 012017. DOI: 10.1088/1742-6596/1240/1/012017.
3. Baghbani F., Akbarzadeh-T. M.-R., Naghibi-Sistani M.-B., Akbarzadeh A. Emotional neural networks with universal approximation property for stable direct adaptive nonlinear control systems. Engineering Applications of Artificial Intelligence, 2020, vol. 89, art. 103447. DOI: 10.1016/j.engappai.2019.103447.
4. Jafari M., Mohammad Shahri A., Elyas S.H. Optimal tuning of brain emotional learning based intelligent controller using clonal selection algorithm. Proc. III ICCKE, 2013, pp. 30-34. DOI: 10.1109/ICCKE. 2013.6682810.
5. Lee C.H., Chang F.Y., Lin C.M. An efficient interval type-2 fuzzy CMAC for chaos time-series prediction and synchronization. IEEE Transactions on Cybernetic, 2014, vol. 44, no. 3, pp. 329-341.
6. Chung C.C., Lin C.M. Fuzzy brain emotional cerebellar model articulation control system design for multi-input multi-output nonlinear. Acta Polytechnica Hungarica, 2015, vol. 12, no. 4, pp. 39-58.
7. Xu S., Jing Y. Research and application of the pellet grate thickness control system base on improved CMAC neural network algorithm. J. of Residuals Science & Technology, 2016, vol. 13, no. 6, pp. 1501-1509.
8. Lucas C., Shahmirzadi D., Sheikholeslami N. Introducing belbic: Brain emotional learning based intelligent controller. Intelligent Automation & Soft Computing, 2004, vol. 10, no. 1, pp. 11-21. DOI: 10.1080/ 10798587.2004.10642862.
9. Wu Q., Lin C.-M., Fang W., Chao F. et al. Self-organizing brain emotional learning controller network for intelligent control system of mobile robots. IEEE Access, 2018, vol. 6, pp. 59096-59108. DOI: 10.1109/ ACCESS.2018.2874426.
10. Sadeghieh A., Roshanian J., Najafi F. Implementation of an intelligent adaptive controller for an elec-trohydraulic servo system based on a brain mechanism of emotional learning. Int. J. of Advanced Robotic Systems, 2012, vol. 9, no. 3, pp. 84. DOI: 10.5772/51841.
11. Daryabeigi E., Namazi M.M., Emanian A., Rashidi A., Saghaian-Nejad S.M. Torque ripple reduction of switched reluctance motor (SRM) drives, with emotional controller (BELBIC). Proc. XXVII Annual IEEE APEC, 2012, pp. 1528-1535. DOI: 10.1109/APEC.2012.6166023.
12. Dorrah H.T., El-Garhy A.M., El-Shimy M.E. PSO-BELBIC scheme for two-coupled distillation column process. J. of Advanced Research, 2011, vol. 2, no. 1, pp. 73-83. DOI: 10.1016/J.JARE.2010.08.004.
13. Jafarzadeh S., Motlagh M.R.J., Barkhordari M., Mirheidari R. A new Lyapunov based algorithm for tuning BELBIC controllers for a group of linear systems. Proc. Conf. MED, 2008, pp. 593-595.
14. Garmsiri N., Najafi F. Fuzzy tuning of brain emotional learning based intelligent controllers. Proc. VIII World Congress on Intelligent Control and Automation, 2010, pp. 5296-5301. DOI: 10.1109/WCICA.2010. 5554831.
15. Zhao J., Lin C.M., Chao F. Wavelet fuzzy brain emotional learning control system design for MIMO uncertain nonlinear systems. Frontiers in Neuroscience, 2019, vol. 13, no. 01, art. 918. DOI: 10.3389/fnins. 2018.00918.
16. Jafari M., Fehr R., Carrillo L.R.G. et al. Implementation of brain emotional learning-based intelligent controller for flocking of multi-agent systems. IFAC-PapersOnLine, 2017, vol. 50, no. 1, pp. 6934-6939. DOI: 10.1016/J.IFATOL.2017.08.1219.
17. Ульянов С.В., Шевченко А.А., Шевченко А.В., Тятюшкина О.Ю. Термодинамические ограничения и информационные условия устойчивости, управляемости и робастности интеллектуального когнитивного управления // Программные продукты и системы. 2021. № 4. C. 524-542. DOI: 10.15827/ 0236-235X.136.524-542.
18. Feng Q., Li W. Hypoelliptic entropy dissipation for stochastic differential equations. ArXiv, 2021, pp. 1-43. URL: https://arxiv.org/abs/2102.00544 (дата обращения: 29.07.2022).
19. Ulyanov S.V. Quantum algorithm of imperfect KB self-organization. Pt. I: Smart control-information-thermodynamic bounds. Artificial Intelligence Advances, 2021, vol. 3, no. 2, art. 3171. DOI: 10.30564/aia. v3i2.3171.
20. Yoshimura K., Ito S. Information geometric inequalities of chemical thermodynamics. Physical Review Research, 2021, vol. 3, no. 1, art. 013175. DOI: 10.1103/PhysRevResearch.3.013175.
21. Ulyanov S., Litvintseva L. Soft Computing Optimizer of Intelligent Control System Structures. Patent US-7219087-B2. USA, 2007. URL: https://pubchem.ncbi.nlm.nih.gov/patent/US-7219087-B2 (дата обращения: 29.07.2022).
22. Ульянов С.В., Кореньков В.Ю., Шевченко А.А., Шевченко А.В. Интеллектуальная когнитивная робототехника. Ч. 1: Технологии квантовых когнитивных вычислений. М.: КУРС, 2022. 557 с.
23. Ульянов С.В., Шевченко А.В., Мамаева А.А. Когнитивное интеллектуальное управление. Ч. I: Система оценки эмоций оператора с применением глубокого машинного обучения на основе мягких вычислений // Робототехника и техническая кибернетика. 2020. Т. 8. № 3. С. 217-232. DOI: 10.31776/ RTCJ.8307.
24. Maksimenko V.A., Kurkin S.A., Pitsik E.N. et al. Artificial neural network classification of motor-related EEG: An increase in classification accuracy by reducing signal complexity. Complexity, 2018, vol. 2018, pp. 1-10. DOI: 10.1155/2018/9385947.
Software & Systems
DOI: 10.15827/0236-235X.141.014-025
Received 03.08.22, Revised 07.09.22 2023, vol. 36, no. 1, pp. 014-025
Cognitive regulators: soft computing technologies and the information-thermodynamic law
of intelligent control self-organization
A.A. Shevchenko 1, Research Associate, allabard@yandex.ru
A.V. Shevchenko 1, Research Associate, sh3vchenkoav@yandex.ru
D.P. Zrelova1,2 Postgraduate Student, Researcher Assistant, zrelova@jinr.ru
S.V. Ulyanov1,2, Dr.Sc. (Physics and Mathematics), Professor, ulyanovsv46_46@mail.ru
1 Dubna State University - Institute of System Analysis and Management, Dubna, 141980, Russian Federation
2 Joint Institute for Nuclear Research - Meshcheryakov Laboratory of Information Technologies, Dubna, 141980, Russian Federation
Abstract. The paper considers a methodology for designing intelligent cognitive control systems for complex dynamic systems. There are brief descriptions of informational and thermodynamic approaches that unite dynamic stability, controllability and robustness criteria under a homogeneous condition.
The authors indicate the problems of training and adaptation of a fuzzy controller, which are relevant in modern control theory. Many existing solutions use artificial neural network models based on the backpropa-gation algorithm (BP), the Cohen multilayer structure, etc. Unfortunately, such algorithms do not guarantee the required level of reliability and control accuracy in complex unforeseen situations. These schemes work successfully if the control task is performed in the absence of underdetermined stochastic noise in the environment, in sensors, in the control loop, etc.
The paper proposes one of the solutions to the problem of developing a cognitive control system, which proposes a constructive solution to the problems of designing knowledge bases and intelligent robust cognitive control in a given problem-oriented application. There is a comparison of various types of regulators, including an intelligent regulator based on emotional brain training. The paper describes the advantages of designing robust knowledge bases based on the software-algorithmic complex Soft Computing Optimizer based on fuzzy logic.
The paper also considers one of the key tasks of modern robotics that is the development of technologies for cognitive mechanical interaction, which makes it possible to implement intelligent control functions through the redistribution of knowledge and control at the program level. A practical example shows the effectiveness of the proposed hybrid cognitive control system, which increases the accuracy and reliability of recognizing mental commands.
Keywords: soft computing, intelligent controllers, information-thermodynamic law, cognitive control systems, knowledge base optimizer.
1. Kondapaneni N., Perona P. A number sense as an emergent property of the manipulating brain. ArXiv, 2021. Available at: https://arxiv.org/pdf/2012.04132.pdf (accessed July 29, 2022).
2. Sharma P., Kumar V. Design and analysis of a BELBIC controlled semi active suspension system. J. of Physics: Conf. Ser, 2019, vol. 1240, art. 012017. DOI: 10.1088/1742-6596/1240/1/012017.
3. Baghbani F., Akbarzadeh-T. M.-R., Naghibi-Sistani M.-B., Akbarzadeh A. Emotional neural networks with universal approximation property for stable direct adaptive nonlinear control systems. Engineering Applications of Artificial Intelligence, 2020, vol. 89, art. 103447. DOI: 10.1016/j.engappai.2019.103447.
4. Jafari M., Mohammad Shahri A., Elyas S.H. Optimal tuning of brain emotional learning based intelligent controller using clonal selection algorithm. Proc. IIIICCKE, 2013, pp. 30-34. DOI: 10.1109/ICCKE. 2013.6682810.
5. Lee C.H., Chang F.Y., Lin C.M. An efficient interval type-2 fuzzy CMAC for chaos time-series prediction and synchronization. IEEE Transactions on Cybernetic, 2014, vol. 44, no. 3, pp. 329-341.
6. Chung C.C., Lin C.M. Fuzzy brain emotional cerebellar model articulation control system design for multi-input multi-output nonlinear. Acta Polytechnica Hungarica, 2015, vol. 12, no. 4, pp. 39-58.
7. Xu S., Jing Y. Research and application of the pellet grate thickness control system base on improved CMAC neural network algorithm. J. of Residuals Science & Technology, 2016, vol. 13, no. 6, pp. 1501-1509.
8. Lucas C., Shahmirzadi D., Sheikholeslami N. Introducing belbic: Brain emotional learning based intelligent controller. Intelligent Automation & Soft Computing, 2004, vol. 10, no. 1, pp. 11-21. DOI: 10.1080/ 10798587.2004.10642862.
References
9. Wu Q., Lin C.-M., Fang W., Chao F. et al. Self-organizing brain emotional learning controller network for intelligent control system of mobile robots. IEEE Access, 2018, vol. 6, pp. 59096-59108. DOI: 10.1109/ ACCESS.2018.2874426.
10. Sadeghieh A., Roshanian J., Najafi F. Implementation of an intelligent adaptive controller for an elec-trohydraulic servo system based on a brain mechanism of emotional learning. Int. J. of Advanced Robotic Systems, 2012, vol. 9, no. 3, pp. 84. DOI: 10.5772/51841.
11. Daryabeigi E., Namazi M.M., Emanian A., Rashidi A., Saghaian-Nejad S.M. Torque ripple reduction of switched reluctance motor (SRM) drives, with emotional controller (BELBIC). Proc. XXVII Annual IEEE APEC, 2012, pp. 1528-1535. DOI: 10.1109/APEC.2012.6166023.
12. Dorrah H.T., El-Garhy A.M., El-Shimy M.E. PSO-BELBIC scheme for two-coupled distillation column process. J. of Advanced Research, 2011, vol. 2, no. 1, pp. 73-83. DOI: 10.1016/J.JARE.2010.08.004.
13. Jafarzadeh S., Motlagh M.R.J., Barkhordari M., Mirheidari R. A new Lyapunov based algorithm for tuning BELBIC controllers for a group of linear systems. Proc. Conf. MED, 2008, pp. 593-595.
14. Garmsiri N., Najafi F. Fuzzy tuning of brain emotional learning based intelligent controllers. Proc. VIII World Congress on Intelligent Control and Automation, 2010, pp. 5296-5301. DOI: 10.1109/WCICA.2010. 5554831.
15. Zhao J., Lin C.M., Chao F. Wavelet fuzzy brain emotional learning control system design for MIMO uncertain nonlinear systems. Frontiers in Neuroscience, 2019, vol. 13, no. 01, art. 918. DOI: 10.3389/fnins. 2018.00918.
16. Jafari M., Fehr R., Carrillo L.R.G. et al. Implementation of brain emotional learning-based intelligent controller for flocking of multi-agent systems. IFAC-PapersOnLine, 2017, vol. 50, no. 1, pp. 6934-6939. DOI: 10.1016/J.IFACOL.2017.08.1219.
17. Ulyanov S.V., Shevchenko A.A., Shevchenko A.V., Tyatyushkina O.Yu. Thermodynamic constraints and information conditions of intelligent cognitive control stability, controllability, and robustness. Software and Systems, 2021, no. 4, pp. 524-542. DOI: 10.15827/0236-235X.136.524-542 (in Russ.).
18. Feng Q., Li W. Hypoelliptic entropy dissipation for stochastic differential equations. ArXiv, 2021, pp. 1-43. Available at: https://arxiv.org/abs/2102.00544 (accessed July 29, 2022).
19. Ulyanov S.V. Quantum algorithm of imperfect KB self-organization. Pt. I: Smart control-information-thermodynamic bounds. Artificial Intelligence Advances, 2021, vol. 3, no. 2, art. 3171. DOI: 10.30564/aia. v3i2.3171.
20. Yoshimura K., Ito S. Information geometric inequalities of chemical thermodynamics. Physical Review Research, 2021, vol. 3, no. 1, art. 013175. DOI: 10.1103/PhysRevResearch.3.013175.
21. Ulyanov S., Litvintseva L. Soft Computing Optimizer of Intelligent Control System Structures. Patent US-7219087-B2. USA, 2007. Available at: https://pubchem.ncbi.nlm.nih.gov/patent/US-7219087-B2 (accessed July 29, 2022).
22. Korenkov V., Ulyanov S., Shevchenko A., Shevchenko A. Intelligent Cognitive Robotics. Pt. 1: Quantum Cognitive Computing Technologies. Moscow, 2022, 557 p. (in Russ.).
23. Ulyanov S., Shevchenko A., Mamaeva A. Cognitive intelligent control. Pt. I: System of operator emotions' assessment with application of deep machine learning based on soft computing. Robotics and Technical Cybernetics, 2020, vol. 8, no. 1, pp. 41-52. DOI: 10.31776/RTCJ.8307.
24. Maksimenko V.A., Kurkin S.A., Pitsik E.N. et al. Artificial neural network classification of motor-related EEG: An increase in classification accuracy by reducing signal complexity. Complexity, 2018, vol. 2018, pp. 1-10. DOI: 10.1155/2018/9385947.
Для цитирования
Шевченко А.А., Шевченко А.В., Зрелова Д.П., Ульянов С.В. Когнитивные регуляторы: технологии мягких вычислений и информационно-термодинамический закон самоорганизации интеллектуального управления // Программные продукты и системы. 2023. Т. 36. № 1. С. 014-025. DOI: 10.15827/0236-235X. 141.014-025.
For citation
Shevchenko A.A., Shevchenko A.V., Zrelova D.P., Ulyanov S.V. Cognitive regulators: soft computing technologies and the information-thermodynamic law of intelligent control self-organization. Software & Systems, 2023, vol. 36, no. 1, pp. 014-025 (in Russ.). DOI: 10.15827/0236-235X.141.014-025.