Труды БГТУ, 2017, серия 3, № 1, с. 79-81
79
УДК 004.031.43-044.962
А. Д. Новицкая, Н. А. Жиляк
Белорусский государственный технологический университет
МЕТОДЫ РАСПОЗНАВАНИЯ И ОТСЛЕЖИВАНИЯ ИЗМЕНЕНИЯ ОБЪЕКТА С ТЕЧЕНИЕМ ВРЕМЕНИ
В данной статье рассмотрены простейшие методы и алгоритмы, предназначенные для распознавания объектов на изображениях как с последующим анализом исторических данных, так и с анализом данных в режиме реального времени. В качестве простейших способов описаны методы ковариации и сравнения шаблонов. Алгоритм ковариации двух изображений рассмотрен как возможный способ реализации методов сравнения шаблонов. Также изучены особенности контурного анализа для решения задачи распознавания конкретного объекта, не прибегая к попик-сельному сравнению, а также для увеличения производительности программного средства.
Приведен пример реализации метода отслеживания объекта в динамике путем анализа координат изменения цвета.
Реализация вышеназванных методов поможет получить полноценную и рабочую систему анализа передвижения и изменения заданных искомых объектов на кадрах видеопотока (записи камеры видеонаблюдения).
Ключевые слова: распознавание образа, ковариация, сравнение шаблонов, контурный анализ, бинаризация.
А. D. Novitskaya, N. A. Zhilyak
Belarusian State Technological University
METHODS OF OBJECT RECOGNITION AND TRACKING ITS CHANGES OVER TIME
This article describes the image recognition methods and algorithms that deal with historical analyzing and real-time processing. As the simplest ways the covariance method and the pattern matching were described. The covariance of the two images was considered as a possible way to implement the templates matching methods. The features of contour analysis as a solution of specific object recognition task without resorting to pixel comparison, as well as a way to increase software tools performance were also described.
An example of an object dynamics tracking method by analyzing the origin of color change was shown.
The implementation of the methods mentioned above will help to get a complete and working system of movement and modification analysis of desired objects in the frames of the video stream (video camera recording).
Key words: object recognition, covariance, template matching, contour analysis, binarization.
Введение. Теория распознавания образа -раздел информатики, развивающий основы и методы идентификации предметов, которые характеризуются конечным набором некоторых свойств и признаков. На основе этих методов можно найти не только объект, но и отследить и проанализировать его изменения [1].
Данная область информатики является широко используемой, поэтому существует необходимость внедрять в указанную сферу задачи, которые помогли бы развить представление о работе таких алгоритмов.
Основная часть. В большинстве случаев, когда необходимо простое сравнение двух достаточно похожих фрагментов изображения, реализация осуществляется через их ковариа-цию. На примере этот метод можно представить следующим образом: изображение, содержащее искомый образец, передвигается по координатам X, У по изображению, в котором вы-
полняется поиск. Работа алгоритма считается успешной, когда находится такая точка, где отличие искомого образца от изображения, в котором производился поиск, достигает своего минимума [2]:
^ [I(х+и У+]) - ^(и /)],
н
где I - изображение, в котором производится поиск; ^ - образец для сравнения; Ж - ширина образца (в пикселях); Н - высота образца (в пикселях); х, у - координаты текущего пикселя изображения, в котором осуществляется поиск.
Этот способ быстр в реализации и интуитивен. Однако у него есть свои недостатки:
- низкая скорость работы при обработке больших изображений. Если будет задействован образец а ■ а пикселей и изображение поиска Ь ■ Ь пикселей, то количество операций составит а2 ■ (Ь - а)2;
80
Методы распознавания и отслеживания изменения объекта с течением времени
- нестабильная работа в случае смены освещения;
- нестабильная работа при изменении масштаба или повороте изображения;
- нестабильная работа, если часть изображения - изменяющийся фон.
С этими недостатками можно бороться с помощью следующих методов:
1) недостатки в скорости работы устраняются путем проведения поиска с большим шагом при маленьком разрешении;
2) недостатки освещения можно нейтрализовать нормировкой или переходом к бинаризации области;
3) искажения объекта поиска можно устранить изменением разрешения при корреляции;
4) с коррекцией фона при вышеописанном подходе работа не проводится.
Очень схожий подход применяется при использовании методов сравнения шаблонов (Template Matching), где для сопоставления областей изображения необходимы простейшие алгоритмы наподобие попиксельного сравнения. Их основным принципом является выделение областей на изображении. Каждая совпавшая область увеличивает меру сходства [3].
При использовании таких алгоритмов можно столкнуться со следующими недостатками:
- метод ресурсоемкий (хранение промежуточной информации, эталонов для сравнения, сама обработка всей имеющейся информации);
- нестабильная работа в случае смены освещения;
- нестабильная работа при изменении масштаба или повороте изображения;
- нельзя с точностью сказать, был ли найден искомый объект, так как результатом работы является вероятностная характеристика;
- ложные срабатывания (у разных изображений могут быть сходные детали или области).
Когда мы говорим о простейших алгоритмах распознавания, то должны учитывать их ресур-соемкость и сравнительно низкую скорость работы. Одним из выходов может стать использование контурного анализа.
Контурный анализ - метод описания и поиска графических образов (объектов) по их контурам. В данном контексте контур - это кривая, которая описывает границы объекта на изображении. Предполагается, что данная линия содержит достаточно информации о форме объекта, при этом его внутренние точки не учитываются. Рассмотрение только контуров объектов позволяет уйти от пространства изображения к пространству контуров, что снижает сложность алгоритмов и вычислений. Еще одно преимущество вышеназванного метода состоит в том, что вращение, изменение масштаба и
смещение контура на изображении не влияют на скорость работы. Метод имеет следующие недостатки [4]:
1) нестабильная работа с изображениями, обладающими низким контрастом;
2) невозможность определения объекта при перекрывании его другими объектами на изображении.
На основе этих подходов можно найти не только объект, но еще обработать его в динамике. Например, определить движение. Для решения поставленной цели можно просто представить два изображения в виде матрицы и вычесть эти матрицы друг из друга.
Реализовать это можно следующим образом: создать две матрицы, которые будут содержать данные о цвете каждого пикселя. При таком подходе точные значения цвета не нужны, так как производится поиск перемещения объекта. Если движение происходило, то значение цвета будет разным, этой информации уже достаточно для оценки перемещения объекта. Чтобы максимально отсечь шумы, необходимо обработать полученное значение, задав минимальное предельно допустимое значение изменения цвета. Можно бинаризировать изображения до начала анализа, сделать их монохромными. Однако необходимо учитывать специфику задачи, чтобы знать, применима ли бинаризация, поскольку это приведет к нежелательной потере данных о цвете.
В данном случае бинаризация не применялась.
Меняя порог (допуск изменения цвета), получим различные результаты (рис. 1 и 2).
ЩгЯ к М ^ а А*
Load lit йаде Load ¿id йаде CakxJalt
Рис. 1. Визуализация результата выполнения при пороге разности 50 (канал цвета RGB)
Рис. 2. Визуализация результата выполнения при пороге разности 20 (канал цвета RGB)
A. Ä. Новицкая, Н. А. Жиляк
81
В ходе выполнения вышеописанного алгоритма имеем матрицу, содержащую координаты перемещений объекта на изображении, которая может быть использована для дальнейшей обработки данных.
Заключение. Алгоритм реализован в программном средстве, областью применения которого в совокупности с приведенными выше ме-
тодами может стать обработка различных больших массивов видеоданных, например, для анализа аварийно опасных участков дорог, отслеживания нестандартного поведения пассажиров аэропорта (метрополитена), системы видеонаблюдений на складе (отслеживание движения объектов на территории при отсутствии разрешения на передвижение), а также в жилых домах.
Литература
1. Фомин Я. А. Распознавание образов: теория и применения. М.: ФАЗИС, 2012. 429 с.
2. Weisstein E. W. Covariance [Electronic resource] // Wolfram MathWorld. URL: http://mathworld. wolfram.com/Covariance.html (date of access: 12.12.2015).
3. Brunelli R. Template Matching Techniques in Computer Vision: Theory and Practice [Electronic resource] // Wiley. URL: http://www.wiley.com/legacy/wileychi/brunellitemplate/supp/tmCodeCompanion.pdf (date of access: 07.12.2015).
4. Фурман А. Я. Введение в контурный анализ. Приложения к обработке изображений и сигналов. М.: Физматлит, 2003. 592 с.
References
1. Fomin Ja. A. Raspoznavaniye obrazov: teoriya iprimeneniye [Objects recognition: Theory and practice]. Moscow, FAZIS Publ., 2012. 429 p.
2. Weisstein E. W. Covariance. Wolfram MathWorld. Available at: http://mathworld.wolfram.com/ Covariance.html (accessed 12.12.2015).
3. Brunelli R. Template Matching Techniques in Computer Vision: Theory and Practice. Wiley. Available at: http://www.wiley.com/legacy/wileychi/brunellitemplate/supp/tmCodeCompanion.pdf (accessed 07.12.2015).
4. Furman A. Ya. Vvedeniye v konturnyy analiz. Prilozheniya k obrabotke izobrazheniy i signalov [Introduction to the contour analysis. Annexes to an image processing and signals]. Moscow, Fizmatlit Publ., 2003.592 p.
Информация об авторах
Новицкая Александра Дмитриевна - магистрант. Белорусский государственный технологический университет (220006, г. Минск, ул. Свердлова, 13а, Республика Беларусь). E-mail: liloddy@ gmail.com
Жиляк Надежда Александровна - кандидат технических наук, доцент кафедры информационных систем и технологий. Белорусский государственный технологический университет (220006, г. Минск, ул. Свердлова, 13а, Республика Беларусь). E-mail: [email protected]
Information about the authors
Novitskaya Aleksandra Dmitriyevna - Master's degree student. Belarusian State Technological University (13a, Sverdlova str., 220006, Minsk, Republic of Belarus). E-mail: [email protected]
Zhilyak Nadezhda Aleksandrovna - PhD (Engineering), Assistant Professor, the Department of Information Systems and Technologies. Belarusian State Technological University (13a, Sverdlova str., 220006, Minsk, Republic of Belarus). E-mail: [email protected]
Поступила 12.12.2016