Научная статья на тему 'Разработка системы видеораспознавания графических образов на основе мультиагентных рекурсивных когнитивных архитектур'

Разработка системы видеораспознавания графических образов на основе мультиагентных рекурсивных когнитивных архитектур Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
244
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
MULTI-AGENT SYSTEM / COGNITIVE ARCHITECTURE / AGENT / RECOGNITION / VIDEORASPOZNAVANIE / MULTIMODAL DATA / ARTIFICIAL INTELLIGENCE / МУЛЬТИАГЕНТНАЯ СИСТЕМА / КОГНИТИВНАЯ АРХИТЕКТУРА / АГЕНТ / РАСПОЗНАВАНИЕ ОБРАЗОВ / ВИДЕОРАСПОЗНАВАНИЕ / МНОГОМОДАЛЬНЫЕ ДАННЫЕ / ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Пшенокова И. А., Денисенко В. А., Сундуков З. А., Макоева Д. Г., Нагоева О. В.

В работе рассматривается вопрос создания системы распознавания графических объектов в видеопотоке на основе мультиагентных рекурсивных когнитивных архитектур. Предложена структура системы, иерархия агентов и их взаимодействие. В статье приведено описание разработанного протокола обмена сообщениями между подсистемой кодирования информации полученной с устройств ввода видеосигнала и ядром мультиагентной рекурсивной когнитивной архитектуры.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Пшенокова И. А., Денисенко В. А., Сундуков З. А., Макоева Д. Г., Нагоева О. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Development of the system videoraspoznavaniya graphic images based on multi-agent recursive cognitive architectures

The paper deals with the issue of establishing recognition of graphic objects in the video stream based on multi-agent recursive cognitive architectures. A structure of the system, a hierarchy of agents and their interactions. The article describes the developed messaging protocol between the subsystem coding information obtained from a video input device and the core of the multi-recursive cognitive architecture

Текст научной работы на тему «Разработка системы видеораспознавания графических образов на основе мультиагентных рекурсивных когнитивных архитектур»

Разработка системы видеораспознавания графических образов на основе мультиагентных рекурсивных когнитивных архитектур

И.А. Пшенокова1, В.А. Денисенко1, З.А. Сундуков1, Д.Г. Макоева1, О.В.

1 2 Нагоева , В. В. Бова

1 Федеральное государственное бюджетное учреждение науки Институт

информатики и проблем регионального управления Кабардино-Балкарского научного

центра РАН

2Южный федеральный университет, Ростов-на-Дон

Аннотация: В работе рассматривается вопрос создания системы распознавания графических объектов в видеопотоке на основе мультиагентных рекурсивных когнитивных архитектур. Предложена структура системы, иерархия агентов и их взаимодействие. В статье приведено описание разработанного протокола обмена сообщениями между подсистемой кодирования информации полученной с устройств ввода видеосигнала и ядром мультиагентной рекурсивной когнитивной архитектуры. Ключевые слова: мультиагентная система, когнитивная архитектура, агент, распознавание образов, видеораспознавание, многомодальные данные, искусственный интеллект.

Введение

Теория распознавания образа - раздел информатики и смежных дисциплин, развивающий основы и методы классификации и идентификации предметов, явлений, процессов, сигналов, ситуаций и т. п. объектов, которые характеризуются конечным набором некоторых свойств и признаков [1].

Задача распознавания графических образов является классической задачей теории информатики, и в настоящий момент можно выделить два основных направления [2]:

• Изучение способностей к распознаванию, которыми обладают живые существа, объяснение и моделирование их;

• Развитие теории и методов построения устройств, предназначенных для решения отдельных задач в прикладных целях.

В статье рассматриваются вопросы построения системы распознавания использующей первое направление к теории распознавания графических

образов, и ее применение в коллаборативных робототехнических системах

[3].

Постановка задачи

Дано множество М объектов ы. Объекты задаются значениями некоторых признаков*;^ = 1, ..,Ы, наборы которых одинаковы для всех объектов. Совокупность признаковобъекта ы определяет некоторым образом его описание =

Значения признаков могут быть как числовыми, так и перечислимыми.

На всём множестве М существует разбиение на подмножества (классы объектов):

т

м = у п

¿=о

Задача распознавания состоит в том, чтобы для каждого данного объекта ы по егоописанию /(^)и априорной (обучающей) информации /0 вычислить значенияпредикатов

= 1,..,т

Для описания невозможности распознавания объектов предикаты Р^заменяютсявеличинамиа^ е (0, {ш е е П),).

Таким образом, для рассматриваемого объекта ю необходимо вычислить егоинформационный вектор — (_а1(ы),а1(ы>),...,а1т(ы>))

Процедура, строящая информационный вектор а(ш)в данном случае выражаеталгоритм принятия решения об отнесении объекта ы к тому или иному классу иназывается «решающей функцией».

Архитектура системы и принципы работы

Разработанная программная система основывается на теории мультиагентных рекурсивных когнитивных архитектур [4, 5, 6]. В

программном комплексе можно выбелить несколько подсистем (агентов) взаимодействующих друг с другом посредством сообщений:

• подсистема предобработки видео сигналов;

• ядро мультиагентной системы;

• подсистема вывода.

Подсистема предобработки видео сигналов реализована с использованием библиотеки ОрепСУ, и решает следующие задачи: захват видео с подключенных устройств;

• поиск объектов на изображении;

• построение контуров объектов, их локализация и определение дополнительны характеристик;

• передача информации в ядро мультиагентной рекурсивной когнитивной архитектуры.

Подсистема предобработки изображения, как и ядро мультиагентной рекурсивной когнитивной архитектуры, реализованы в виде сетевых сервисов взаимодействующих посредством сообщений. Сообщение представляет собой 1БОК документ структура которого представлена на рис. 1.

"Data": {

"Image1': "binary data of image",

"Objects": [

{

"Color": {"B": 255, "G": 255, "R": 255 },

"Form": "linework of object",

"Place": "binary data of object location11

}

L

"Size": {

"Height": 100, "TotalSize": 18066, "Width": 100

}

"Operation": "sendVideo"

Рис. 1.-JSON документ описывающий структуру сообщения между подсистемой предобработки видеосигнала и ядром мультиагентной рекурсивной когнитивной архитектуры.

Сообщение содержит 2 обязательных поля: ОретЫопи Data. В поле Operation указывается информация, позволяющая определить назначение передаваемого сообщения и воспринимается системой как заголовок сообщения. Поле Data содержит информацию которой обмениваются подсистемы между собой - тело сообщения.

При поступлении сообщения от подсистемы предобработки видеосигнала в ядро мультиагентной системы, для каждой входной сигнатуры определяется агент, отвечающий за эту сигнатуру. В случае отсутствия в системе агента распознающего такую сигнатуру, создается новый агент, в базу знаний которого закладывается набор правил, позволяющих ему распознавать эту сигнатуру.

Агенты, распознавшие входные сигнатуры различных модальностей, формируют сообщения отсылают их агентам следующего слоя, распознающим объекты по набору признаков. В том случае, если в системе присутствует агент-объект, распознающий сообщения от агентов-признаков,

система считает, что распознавание объекта выполнено. Если ни один агент-объект не распознал входную ситуацию, то создается новый агент в базе знаний которого записаны правила позволяющие идентифицировать объект по указанному набору сообщений от агентов-признаков.

Заключение

В статье приведено описание системы распознавания графических образов на основе мультиагентных рекурсивных когнитивных архитектур, применение которой возможно в системах технического зрения различных робототехнических систем. Предложенный подход позволяет расслоить информацию об объектах на несколько модальностей и для идентификации объектов использовать систему баз знаний агентов, каждый из которых отвечает за конкретное значение некоторой модальности или объект, описываемый комбинацией этих модальностей.

Благодарности

Работа выполнена при поддержке грантов:

1. Грант РФФИ, проект № 15-01-05844 «Разработка методов интеллектуального принятия решений на основе самоорганизации нейроподобных мультиагентных рекурсивных когнитивных архитектур»;

2. Грант РФФИ, проект № 5-07-08309 «Мультиагентное когнитивное моделирование и исследование многомодальных знаний в интеллектуальных системах».

Литература

1. Вапник В. Н., Червоненкис А. Я. Теория распознавания образов. М.: Наука, 1974.с.16-17.

2. Горелик А.Л., Скрипкин В.А. Методы распознавания. 4 изд. М.: Высшаяшкола, 2004.с.22-23.

3. Anchokov M., Denisenko V., Nagoev Z., Sundukov Z., Tazhev B. Interactive collaborative robotics and natural language interface based on multiagent Recursive cognitive architectures // First International Conference, ICR 2016 . Budapest, Hungary: 2016.pp.107-112.

4. Пшенокова И.А., Денисенко В.А., Нагоева О.В., Токмакова Д.Г., Сундуков З.А. Представление знаний в системах искусственного интеллекта на основе принципов онтонейроморфогенеза и мультиагентного моделирования // Известия Кабардино-Балкарского научного центра РАН. 2015. №6-2. с.158-165.

5. Денисенко В.А., Анчеков М.И., Кармоков М.М., Сундуков З.А. Разработка компьютерной модели мультиагентной когнитивной архитектуры // Известия Кабардино-Балкарского научного центра РАН. 2015. №6-2. с.61-65.

6. Денисенко В.А., Пшенокова И.А., Хамуков А.К. Нейрофизиологические алгоритмы зрительного анализатора головного мозга // Известия Кабардино-Балкарского научного центра РАН. 2015. №6-2. с. 6672.

7. Романов Д.Е. Нейронные сети обратного распространения ошибки// Инженерный вестник Дона, 2009, №3. URL: ivdon.ru/magazine/archive/n3y2009/143.

8. Артемьев И.С. , Лебедев А.И., Долгий А.И., Хатламаджиян А.Е. , Меерович В.Д. Метод блочного оптического распознавания инвентарных номеров железнодорожных подвижных единиц на основе комитетной нейроиммунной модели классификации// Инженерный вестник Дона, 2016, №4. URL: ivdon.ru/ru/magazine/archive/n1y2014/2259.

9. Lee, SW. Integrated segmentation and recognition of handwritten numerals with cascadeneural network / SW Lee, SY Kim // Systems, Man, and Cybernetics, Part C: Applications and Reviews, pp. 285-290, 1999.

10. Hastie T., Tibshirani R., Friedman J., The elements of statistical learning: Datamining, inference, andprediction. Springer, 2001- 533 p.

References

1. Vapnik V. N., Chervonenkis A. Ya. Teoriya raspoznavaniya obrazov. [Theory of image recognition]. M.: Nauka, 1974. pp.16-17.

2. Gorelik A.L., Skripkin V.A. Metody raspoznavaniya. [Methods of recognition]. 4 izd. M.: Vysshaya shkola, 2004. pp.22-23.

3. Anchokov M., Denisenko V., Nagoev Z., Sundukov Z., Tazhev B. Interactive collaborative robotics and natural language interface based on multiagent Recursive cognitive architectures First International Conference, ICR 2016. Budapest, Hungary: 2016. pp.107-112.

4. Pshenokova I.A., Denisenko V.A., Nagoeva O.V., Tokmakova D.G., Sundukov Z.A. Izvestiya Kabardino-Balkarskogo nauchnogo tsentra RAN. 2015. №6-2. pp.158-165.

5. Denisenko V.A., Anchekov M.I., Karmokov M.M., Sundukov Z.A. Izvestiya Kabardino-Balkarskogo nauchnogo tsentra RAN. 2015. №6-2. pp.61-65.

6. Denisenko V.A., Pshenokova I. A., Khamukov A.K. Izvestiya Kabardino-Balkarskogo nauchnogo tsentra RAN. 2015. №6-2. pp.66-72.

7. Romanov D.E. Inzenernyj vestnik Dona (Rus), 2009, №3. URL: ivdon.ru/magazine/archive/n3y2009/143.

8. Artem'ev I.S. , Lebedev A.I., Dolgiy A.I., Khatlamadzhiyan A.E. , Meerovich V.D. Inzenernyj vestnik Dona (Rus), 2016, №4. URL: ivdon.ru/ru/magazine/archive/n1y2014/2259.

9. Lee, SW. Integrated segmentation and recognition of handwritten numerals with cascade neural network. SW Lee, SY Kim. Systems, Man, and Cybernetics, Part C: Applications and Reviews, pp.285-290, 1999.

10. Hastie T., Tibshirani R., Friedman J., The elements of statistical learning: Data mining, inference, and prediction. Springer, 2001- 533 p.

Й Инженерный вестник Дона, №4 (2016) ivdon.ru/ru/magazine/arcliive/n4y2016/3911

i Надоели баннеры? Вы всегда можете отключить рекламу.