Подходы и методологии распознавания образов во встраиваемых системах

Шахин Гадир

УДК 04

Информационные технологии

Шахин Гадир, аспирант Санкт-Петербургский Национальный Исследовательский Университет Информационных Технологий, Механики и Оптики, РФ, г. Санкт-Петербург

ПОДХОДЫ И МЕТОДОЛОГИИ РАСПОЗНАВАНИЯ ОБРАЗОВ ВО

ВСТРАИВАЕМЫХ СИСТЕМАХ

Аннотация: Распознавание образов является важной частью встраиваемых систем. В этой статье широко известны методологии и наиболее важные технические решения, используемые для реализации систем распознавания образов. Наконец, мы представляем сложности и текущие тенденции исследований в этой захватывающей и сложной области.

Ключевые слова: распознавание образов; встраиваемые системы; алгоритм; нечеткая логика; нейронные сети; нейроморфные вычисления; квантовые вычисления.

Annotation: Pattern recognition is an important part of embedded systems. In this article, the widely known methodologies and the most important technical solutions used to implement pattern recognition systems are presented. At last, we present the challenges and current trends of research in this exciting and complex field.

Keywords: pattern recognition; embedded systems; algorithm; fuzzy logic; neural networks; neuromorphic computing; quantum computing.

I. Введение

Распознавание образов - это научная дисциплина, которая изучает процесс классификация объектов по нескольким категориям или классам. Оно очень широкой областью исследований, и включает в себя такие разные

факторы, как выделение признаков, классификация образов и другие. Обработанные сигналы обычно бывают одно-, двух- или трехмерными, обработка выполняется в реальном времени или занимает часы и дни, некоторые системы ищут один узкий класс объектов, другие ищут в огромных базах данных записи, по крайней мере, с небольшим сходством.

Алгоритмы распознавания образов имеет дело не только с изображением и звуком, но с совершенными разными сигналами, такими как: биоэлектрические сигналы, температура, давление, сигналы от аналоговых или цифровых промышленных датчиков и т. д.

Общая цель распознавания образов во встраиваемых системах состоит в том, чтобы интегрировать информацию от доступных датчиков со знанием в области распознавания, чтобы последующие решения и команды управления приводам выполняются автоматически в соответствии с алгоритмами распознавания.

II. Приложения

Распознавание образов использовалось в различных задачах, такие как: медицинская визуализация (например: ультразвук, рентген или магнитный резонанс), Компьютерная диагностика (например: Электрокардиография (ЭКГ), детекция специфического рака с использованием ДНК, анализ сигнала ЭЭГ, кожные заболевания), компьютерное зрение (например: роботизированное зрение, анализ сцены, сегментация), биометрия и создание компьютерные модели физиологических (например: лицо, улыбка, геометрия руки, отпечатки пальцев, отпечаток ладони, радужной оболочки и т. д.) и поведенческих (например: нажатие клавиши, сигнатура, речь, жест, походка, тип поведения) характеристик человека для идентификации и верификации одного или нескольких людей, перевод речи, оптическое распознавание символов (OCR), распознавание зип-код, распознавание банковских чеков, наблюдение, осмотр промышленных деталей, классификация документов, криминалистика, поиск изображений, поиск в интернете и аффективные вычисления и т.д.

Приложения распознавания образов используются в различных секторах: мобильные приложения, производство и промышленность, энергетические решения, безопасность, здравоохранение, оборона, авионика и телекоммуникационное оборудование.

III. Подходы

Многие предложения существуют в литературе и варьируются от оптимизации кода для обычных процессоров с ограниченной мощностью процессора и памятью, до проектирования аппаратных средств специального назначения:

- Использование интегральных микросхем общего назначения: Дизайны аппаратное обеспечение могут быть нагружены в реконфигурируемые цепи как ПЛИС или стать чипами VLSI. Программные реализации алгоритмов ядра распознавания образов на CPU [1], GPU или микроконтроллере MCU [2] также возможны.

- Использование интегральных микросхем специального назначения требует детальной оптимизации кода нижнего уровня, а иногда и адаптации некоторых операций к специализированным DSP [3], ASIC и FPGA [4] (например: графические ускорители и мультимедийные чипы кодирования / декодирования).

- Гетерогенные вычисления: Различные процессоры в гетерогенной системе имеют разные наборы инструкций или даже разные вычислительные модели. Основными преимуществами гетерогенной системы являются скорость вычислений и энергоэффективность. Медиапроцессор [5] имеет структуру система-на-кристалле с высокопроизводительным DSP и многоядерным процессором общего назначения. Он специализируется на обработке видео и изображений. GPGPU [6] означает вычисления общего назначения на графических процессорах, чтобы использовать эти устройства в качестве сопроцессоров для других приложений, помимо графики. SoC [7] обеспечивает беспрецедентный уровень производительности.

Эти различные технологии предлагают разную степень параллелизма, обработки в реальном времени, операций с плавающей точкой, реконфигурируемость, интегрирования, гибкости программирования, энергопотребления, времени разработки, размер, охлаждение и стоимость. Таким образом, разработчики систем должны учитывать их соответствие характеристикам, необходимым для встраиваемых систем распознавания, чтобы обеспечить требуемую точность и скорость классификации.

IV. Методологии

Мы можем столкнуться с несколькими подходами, использующиеся обычно в системах распознавания образов:

1. Статистический подход

Как правило, статистические системы распознавания образов [8] основаны на представлении каждого образа d-признаков как точки в d-мерном пространстве d-мерных признаков. Следовательно, векторы-образы занимают компактные и непересекающиеся области в пространстве представлений. Образы из разных классов могут быть разделены границами принятия решений между классами образов. Границы принятия решений определяются распределением вероятностей моделей, принадлежащих каждому классу.

2. Синтаксический (Структурный) подход

В структурном подходе [9] каждый образ представлен в виде иерархической (древовидной) структурной информации. Образ описывается в терминах более простых подобразо, а каждый более простой подобразов описывается в терминах еще более простых подобразов и т. д. (так же, как фразы и предложения создаются путем объединения слов, а слова создаются из символов различными способами композиции). Самые простые выбранные подобразы называются «примитивы образов». Грамматические правила, управляющие составом примитивов в образы, должны быть получены из доступных обучающих образцов для каждого класса образов.

Этот подход обеспечивает возможность описания большого набора сложных образов с использованием небольших наборов примитивов образа и

грамматических правил. Синтаксический анализ выполняется путем разбора «предложения», описывающей данный образ (обычно в форме древовидной структуры), чтобы определить, является ли он синтаксически (или грамматически) правильным в отношении указанной грамматики. Процесс распознавания включает в себя синтаксический анализ, возможность классификации образа к определенному классу, а также способность описывать аспекты образа, которые делают его непригодным для присвоения другому классу.

3. Сопоставление с шаблоном

Шаблонами могут быть определенные объекты в сцене, буквы, образующие слова в письменном или устном тексте. Задача сопоставления с шаблоном [10] включает в себя определение «сходства» между доступными (известными шаблонами) эталонными образами и (неизвестным) тестовым образом путем выполнения операции сопоставления с учетом всех допустимых поз (перевод и поворот) и изменения масштаба и т.д. Наличие обучающего набора позволяет изучать сам шаблон и оптимизировать меру сходства.

4. Нейронные сети

Модели нейронных сетей неявно основаны на классических статистических подходах распознавания образов. Вся модель нейронной сети основана на многоуровневой архитектуре, позволяющей использовать слои «нейронов» для обработки необработанных данных и поиска в них образов. Слой принимает входные данные, извлекает признак и подает на следующий слой. Процесс обучения включает обновление архитектуры сети и модификация весов между нейронами, чтобы сеть могла эффективно выполнять определенную задачу классификации. Используется в этом подходе некоторые организационные принципы, такие как обучение, обобщение, адаптивность, отказоустойчивость, распределенное представление и вычисления, чтобы изучить сложные нелинейные отношения ввода-вывода, использовать последовательные процедуры обучения и адаптировать себя к данным [11].

5. Нечёткая логика

В некоторых задачах распознавания перекрытие классов образов приводит к неоднозначности в распознавании объектов. В таких случаях принадлежность образа к классу является вопросом степени. Нечёткая техника, способная разделять образы, используя мягкие границы. Таким образом, образ может быть классифицирован на один или несколько классов с определенной степенью принадлежности к каждому классу [12].

6. Квантовый подход

Квантовые системы позволяют вычислять на беспрецедентных уровнях массивного параллелизма, используя кубиты и квантовые феномены, такие как суперпозиция и запутанность. Растущее число участников пытается улучшить классических алгоритмов распознавания образов методами квантовой теории информации. Эти системы обещают способность решать задачи, требующие чрезмерного количества времени на современных суперкомпьютерах [13].

7. Гибридные подходы

Гибридный подход объединяет различные аспекты предыдущих подходов для разработки более сложных алгоритмов в некоторых приложениях [14].

V. Сложности и будущие тенденции

Разработчики систем должны сбалансировать огромные вычислительные и коммуникационные требования со строгими ограничениями ресурсов встроенных платформ с учетом надежности, адаптации а месте эксплуатации или переподготовки, инсталляции, сопровождения и обновлений.

Гениальность биовдохновленных вычислений заключается в том, что они достигают определенных целей более эффективным и простым способом, чем многие из уже существующих «традиционных» вычислительных механизмов. Это привело исследователей и инженеров к быстрому изучению биоинженерии. и разработке различных технологий, методов и алгоритмов, имитирующие различные биологические процессы. Нейроморфные исследования [15] сталкиваются с ключевыми проблемами в соответствии гибкости человека и его способности учиться на неструктурированных стимулах с энергетической

эффективностью биологического мозга. Преимущества нейроморфной инженерии заключаются в повышении точности, а также снижении латентности и энергопотребление. Вычислительные строительные блоки в нейроморфных вычислительных системах логически аналогичны нейронам.

Квантовые вычислительные системы сталкиваются с огромными проблемами при разработке, например, большими размерами, глубокой холодной рабочей температурой и потерей данных из-за хрупкости кубитов. Исследование спиновых кубитов является одним из предложенных подходов к решению некоторых проблем, присущих квантовым процессорам, основанным на сверхпроводящих кубитах.

IV. Заключение

В этом обзоре мы представили подходы и методологии различных систем распознавания образов, и некоторые примеры их применения. В последние годы наблюдается растущий интерес к исследованиям по распознаванию образов. Это происходит главным образом из-за технологических достижений и растущей вычислительной мощности. Ни один человек не может претендовать на опыт и экспертные знания во всей области, которая быстро развивается, обновляет свои парадигмы и охватывает несколько философских и технологических подходов.

Библиографический список:

1. Wu Yi-Chao, Fei Yin, and Cheng-Lin Liu. "Evaluation of neural network language models in handwritten Chinese text recognition." 2015 13th International Conference on Document Analysis and Recognition (ICDAR). IEEE, 2015.

2. Xu, Ke, et al. "A prosthetic arm based on EMG pattern recognition." 2016 IEEE International Conference on Robotics and Biomimetics (ROBIO). IEEE, 2016.

3. Zoican, Sorin. "Digital signal processing system for image pattern recognition." 5th International Conference on Telecommunications in Modern

Satellite, Cable and Broadcasting Service. TELSIKS 2001. Proceedings of Papers (Cat. No. 01EX517). Vol. 2. IEEE, 2001.

4. Tschope, Constanze, et al. "An embedded system for acoustic pattern recognition." 2017 IEEE SENSORS. IEEE, 2017.

5. Kisacanin, Branislav. "Examples of low-level computer vision on media processors." 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'05)-Workshops. IEEE, 2005.

6. Ding, Dajun, Jihwan Yoon, and Chanho Lee. "Traffic sign detection and identification using SURF algorithm and GPGPU." 2012 International SoC Design Conference (ISOCC). IEEE, 2012.

7. Mirzaei, M. Ali, et al. "Heterogeneous computing system platform for high-performance pattern recognition applications." 2017 6th International Conference on Modern Circuits and Systems Technologies (MOCAST). IEEE, 2017.

8. Jain, Anil K., Robert P. W. Duin, and Jianchang Mao. "Statistical pattern recognition: A review." IEEE Transactions on pattern analysis and machine intelligence 22.1 (2000): 4-37.

9. KS Fu, Syntactic (Linguistic) Pattern Recognition, in "Digital Pattern Recognition". Ed. King Sun Fu. Berlin: Springer-Verlag, 1976. pp. 95-134.

10. Kalina, Darina, and Roman Golovanov. "Application of Template Matching for Optical Character Recognition." 2019 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering (EIConRus). IEEE, 2019.

11. Oommen, John, Ke Qin, and Dragos Calitoiu. "The science and art of chaotic pattern recognition." in Handbook of applications of chaos theory. Ed. Skiadas, Christos H., and Charilaos Skiadas. Chapman and Hall/CRC, 2017. pp. 745804.

12. Mahapatra, Ansuman, et al. "Background subtraction and human detection in outdoor videos using fuzzy logic." 2013 IEEE International Conference on Fuzzy Systems (FUZZ-IEEE). IEEE, 2013.

13. Prousalis, Konstantinos, and Nikos Konofaos. "Quantum Pattern Recognition for Local Sequence Alignment." 2017 IEEE Globecom Workshops (GC Wkshps). IEEE, 2017.

14. Yan-hong, Xu, et al. "Fuzzy neural networks pattern recognition method and its application in ultrasonic detection for bonding defect of thin composite materials." 2009 IEEE International Conference on Automation and Logistics. IEEE, 2009.

15. Li, Cheng, et al. "A Compact and Accelerated Spike-based Neuromorphic VLSI Chip for Pattern Recognition." 2018 IEEE Biomedical Circuits and Systems Conference (BioCAS). IEEE, 2018.

Подходы и методологии распознавания образов во встраиваемых системах Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шахин Гадир

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Шахин Гадир

Текст научной работы на тему «Подходы и методологии распознавания образов во встраиваемых системах»