Научная статья на тему 'Обзор методов, применяемых при решении задач распознавания образов'

Обзор методов, применяемых при решении задач распознавания образов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
657
181
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ ОБРАЗОВ / АВТОМАТИЗАЦИЯ / НЕЙРОННЫЕ СЕТИ / PATTERN RECOGNITION / AUTOMATION / NEURAL NETWORKS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Забара В. О., Максимов П. В.

Целью работы является систематизация возможных задач распознавания образов и анализ существующих методов распознавания. Приведен перечень типовых задач. Выполнен анализ и сравнение методов распознавания образов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

OVERVIEW OF THE METHODS USED FOR SOLVING THE PROBLEMS OF PATTERN RECOGNITION

The aim is to systematize the problems of pattern recognition and performing of analysis of existing methods of recognition. A list of typical tasks is shown. The analysis and comparison of pattern recognition methods are performed.

Текст научной работы на тему «Обзор методов, применяемых при решении задач распознавания образов»

сферы жизни сделаны. Военные разных стран уже тестируют шлемы и очки, позволяющие им видеть данные о текущем местоположении, расположении собственных войск и передавать данные в штаб или авиационным силам. В медицине приложения дополненной реальности не менее востребованы. Хирурги проводят операции в очках Google Glass, которые позволяют врачам вести видеоконференции с коллегами и вызывать с помощью голоса результаты различных анализов. А вот приложение от Phobious позволит избавиться, например, от арахнофобии или от боязни уколов. Дополненная реальность станет отличным помощником при изучении школьных предметов или получении новых навыков. Проект Chostman позволяет пользователям повторять действия, которые он видит поверх своих рук. Сейчас даже простые учебники становятся интереснее с технологией дополненной реальности. Ученики могут наглядно с помощью приложений рассмотреть то, о чем они читают.

Разработчикам приложений дополненной реальности и новых аппаратных средств есть, к чему стремиться. Исследования и разработки ведутся в разных направлениях. Например, гиганты Apple, Samsung и другие ведут разработки носимых устройств, управление которыми будет осуществляться с помощью голоса. А в будущем возможным станет и управление с помощью глаз. Важным вопросом является внедрение дополненной реальности в медицину, образование и военную промышленность.

6. Технические средства дополненной реальности

Для работы с приложениями дополненной реальности чаще всего используют портативные устройства: новейшие мобильные телефоны, смартфоны, планшеты и пр. Но всех их объединяет 4 составляющие - дисплей, устройство ввода, устройство отслеживания и процессор.

Есть три основных типа дисплеев, используемых в дополненной реальности:

• Head mounted displays (HMD), которые могут быть видео-прозрачным или оптико-прозрачным. Это устройство, которое не нужно держать в руках, потому что оно закрепляется на голове пользователя. Примером подобных устройств являются Google Glass, немецкие Talking Places, Smart Glasses от Vuzix;

• ручные дисплеи. Это широко распространенные и всем известные устройства: смартфоны и планшеты.

• пространственные дисплеи. Суть подобных дисплеев заключается в использовании видеопроекторов, оптических элементов, голограмм.

В данный момент существует несколько типов устройства ввода для работы с дополненной реальностью. В случае смартфонов, телефон сам по себе может быть использован в качестве указательного устройства.

Наши гаджеты оснащены цифровыми камерами, GPS, акселерометрами, магнитометрами, гироскопами, которые и являются устройствами отслеживания. От данных, получаемых с этих устройств, зависит результат работы приложения AR.

Система дополненной реальности должна обладать мощным процессором и иметь достаточный объем оперативной и видео памяти для обработки изображений с камеры. В наше время вопрос мощности не столь актуален, так как современные устройства являются достаточно мощными, чтобы удовлетворить большую часть пользовательских запросов.

7. Технические средства, применяемые при разработке программного обеспечения AR

Существует целый набор библиотек для разработки приложения дополненной реальности:

• OpenCV - библиотека алгоритмов компьютерного зрения, обработки изображений и численных алгоритмов общего назначения с открытым кодом;

• Vuforia SDK - это программное обеспечение для мобильных устройств, которое позволяет создавать приложения дополненной реальности. Оно использует технологию компьютерного зрения для того, чтобы распознавать и отслеживать плоские изображений и простые SD-объекты в режиме реального времени;

• ARToolkit - это библиотека компьютерного слежения для создания приложений с дополненной реальностью Для этого ПО использует возможности видео слежения, расчет реального положения и ориентации камеры по отношению к квадратному физическому маркеру в режиме реального времени;

• Metaio SDK - готовая библиотека для создания мобильных приложений дополненной реальности;

• String - библиотека для создания мобильных приложений ориентирована на iOS устройства;

Не стоит путать дополненную реальность с виртуальной. В виртуальной реальности окружающий реальный мир полностью заменяется виртуальностью, пользователь не наблюдает реальные объекты. Дополненная реальность отличается тем, что позволяет человеку видеть и реальный мир, и виртуальные объекты.

Уже сегодня дополненная реальность применяется во многих отраслях человеческой деятельности. Благодаря активному развития мобильных и портативных устройств сфера применения дополненной реальности будет только расширяться.

Литература

1. R.T. Azuma. A Survey of Augmented Reality // In Presence: Teleoperators and Virtual Environments. - №6(4). -1997. -P.355-385.

2. H. Kato, M. Billinghurst. Marker Tracking and HMD Calibrationfor a Video-based Augmented Reality Conferencing System // Proceedings of the 2nd IEEE and ACM International Workshop on Augmented Reality. -1999. - P.85-94.

3. Бойченко И.В., Лежанкин А.В. Дополненная реальность: состояние, проблемы и пути решения // Доклады Томского государственного университета систем управления и радиоэлектроники. -2010. -1(21), часть 2. - С. 161-165.

Забара В.О.1, Максимов П.В.2

1Студент; 2кандидат технических наук, доцент, Пермский национальный исследовательский политехнический университет ОБЗОР МЕТОДОВ, ПРИМЕНЯЕМЫХ ПРИ РЕШЕНИИ ЗАДАЧ РАСПОЗНАВАНИЯ ОБРАЗОВ

Аннотация

Целью работы является систематизация возможных задач распознавания образов и анализ существующих методов распознавания. Приведен перечень типовых задач. Выполнен анализ и сравнение методов распознавания образов.

Ключевые слова: распознавание образов, автоматизация, нейронные сети.

Zabara V.O.1, Maksimov P.V.2

'Student; 2PhD in Technical Science, assosiate professor, Perm National Research Polytechnic University OVERVIEW OF THE METHODS USED FOR SOLVING THE PROBLEMS OF PATTERN RECOGNITION

Abstract

The aim is to systematize the problems of pattern recognition and performing of analysis of existing methods of recognition. A list of typical tasks is shown. The analysis and comparison of pattern recognition methods are performed.

Keywords: pattern recognition, automation, neural networks.

Ни для кого не секрет, что в мире быстро развивающихся технологий не менее быстро развиваются и информационные ресурсы, причём темпы развития вторых в разы больше темпов первых. Для того, чтобы поддерживать последующее совершенствование этих процессов, человечеству необходима постоянная работа со всеми данными. Такая потребность привела к автоматизации процессов хранения обработки и передачи информации. Ярким примером подобной автоматизации является такой раздел информатики как распознавание образов.

Целью данной работы является систематизация возможных задач распознавания образов и анализ существующих методов распознавания.

62

Распознавание образов - это научная дисциплина, целью которой является классификация объектов по нескольким категориям или классам [1]. Практичность этого метода очевидна, так как после классификации работа с определённым классом информации требует меньше ресурсов, нежели работа с полным её объёмом.

На практике решение задач, связанных с распознаванием образов, является сложной теоретической и практической задачей. Это связано в первую очередь с тем, что каждый конкретный случай обладает своей спецификой, что не позволяет создать универсального алгоритма работы с информацией [2]. Однако, несмотря на данные трудности, был сформулирован следующий перечень задач распознавания образов:

- первая задача связана с построением набора измерений исходных данных, представленных некоторым образом. Такой набор измерений называется вектором образа;

- вторая задача распознавания образов связана с выделением характерных признаков или свойств из полученного вектора образа;

- третьей задачей является формулировка алгоритмов, на основе которых объекты будут относиться к определённым классам по полученным признакам. [3].

В случае рассмотрения целой картины объектов следует выделить четвёртую задачу, связанную с решением вопроса разбиения всех исходных данных на отдельные объекты. В итоге получается пространство образов [1].

В ходе независимых рассуждений на эту тему, исследователи в большинстве случаев приходили к выделению основных методов распознавания образов. Конечно, классификации этих методов отличаются друг от друга (в основном различия заключаются в сложности организации классификации, в наличии разного рода групп, подгрупп методов), но всё же в них можно выделить четыре основных метода: метод сопоставления с эталоном, статистический метод, метод, использующий искусственные нейронные сети (ИНС) и структурный метод [2, 4].

В основе метода сопоставления с эталоном лежит набор векторов эталонных образов, описывающих классы. В ходе выполнения метода исходный образ относят к тому классу, чей эталонный вектор имеет наибольший коэффициент схожести с исходным.

Статистический метод основан на построении функции плотности распределения вероятностей образов (с учётом того что решена четвёртая задача) для каждого класса объектов и классификации появления каждого из классов по какому-либо правилу.

Метод, использующий искусственные нейронные сети получает на вход вектор образа, а на выходе выдаёт сигналы, соответствующие заданным образам. Сигнал, имеющий большую амплитуду, определяет класс, к которому относится объект. При этом одновременно выполняются следующие действия: происходит отнесение объекта к классу, а в случае отсутствия такого класса в базе, происходит пополнение базы этим классом.

Структурный метод основывается на анализе самого вектора образа. Основное внимание в этом методе уделяется структурным связям между составляющими вектора образа (измерениями). На основе этих связей производится выделение признаков и отнесение объектов к определённым классам (выполнение второй и третьей задач теории распознавании образов) [3].

Однако, следует отметить, что алгоритм выполнения задач для каждого конкретного случая свой. Так, например, в с структурном методе, может быть сначала построен алгоритм распределения объектов по классам, а затем уже способ выделения признаков, ориентирующийся по набору имеющихся классов.

В силу определения перечисленных методов как основных для них характерен ряд очевидных недостатков.

Метод сопоставления с эталоном сопровождается искажениями рассматриваемых образцов, что требует учета немалого множества случаев небольших отклонений от эталона.

Статистические методы встречаются с рядом трудностей при решении практических задач, так как выборки образцов из каждого класса часто оказываются недостаточно представительными, а функции плотности распределения вероятностей сложны для построения.

Для нейронных сетей характерно длительное обучение, основанное на рассмотрении множества примеров.

Структурные методы чувствительны к искажениям распознаваемых образов и требуют сложной процедуры построения набора признаков. [2].

Такая ситуация приводит к необходимости комбинирования данных методов с целью компенсации недостатков одних подходов преимуществами других, что активно используется в решении практических задач. Так в том же структурном методе можно сразу после получения векторов имеющихся образов задействовать ИНС, что со временем даст ряд наборов связей, которые можно будет брать в качестве эталона для сравнения с последующими (ещё не рассмотренными) векторами объектов (применение метода сопоставления с эталоном).

Литература

1. Местецкий Л.М. Математические методы распознавания образов: курс лекций. - М.:МГУ, 2002. - 86 с.

2. Верн Х., Васильев В.И., Сафронов К.В., Чушенков И.М. Иерархический итерационный метод распознавания образов при анализе многомерных данных // Вестник УГАТУ. Управление, ВТиИ. -2007. -Т.9. -№5(23). -C.3-8.

3. Новикова Н.М. Структурное распознавание образов: учебное пособие для вузов. - ВГУ, Воронеж, 2008. - 30 с.

4. Бабаян П.В., Смирнов С.А. Слежение за объектом на основе алгоритма сопоставления с эталоном при одновременном наблюдении в видимом и инфракрасном диапазонах // Цифровая обработка сигналов. -№4. -2010. -С.18-21

Манжула М.В.

Студент, Институт сферы обслуживания и предпринимательства (филиал) Донского государственного технического

университета в городе Шахты Ростовской области

ПРОГРАММНАЯ РЕАЛИЗАЦИЯ АЛГОРИТМА ФОРМИРОВАНИЯ МНОЖЕСТВА ЭЛЕМЕНТОВ ИНТЕГРИРОВАННОЙ ФУНКЦИОНАЛЬНОЙ ПОДСХЕМЫ

Аннотация

В статье рассмотрен вариант программной реализации алгоритма формирования множества элементов интегрированной функциональной подсхемы. Приводится программное обеспечение для пакета MatLab, позволяющее проводить интеграцию множеств функциональных подсхем.

Ключевые слова: система, агрегирование, интеграция.

Manzhula M.V.

Student, Institute of the service and enterprise (branch) of Don State Technical University SOFTWARE IMPLEMENTATION THE ALGORITHM FOR GENERATING THE SET OF ELEMENTS INTEGRATED

FUNCTIONAL SUBCIRCUIT

Abstract

The article describes the software version of the algorithm generate a plurality of elements of the integrated functional subcircuit. Provides a software package MatLab, which allows to carry out the integration of many functional subcircuits.

Keywords: system, aggregation, integration.

63

i Надоели баннеры? Вы всегда можете отключить рекламу.