Некумулятивное преобразование признаков в системах оптического текстурного распознавания

Бойченко К.Ю.

УДК 004.93

К.Ю. БОЙЧЕНКО, аспирант ЗНТУ (г. Запорожье)

НЕКУМУЛЯТИВНОЕ ПРЕОБРАЗОВАНИЕ ПРИЗНАКОВ В

СИСТЕМАХ ОПТИЧЕСКОГО ТЕКСТУРНОГО РАСПОЗНАВАНИЯ

Впервые предложено использовать многослойные карты разнонаправленных градиентов для представления и сравнения изображений в системе распознавания. Получил дальнейшее развитие метод эталонов, который модифицирован для решения задач оптического текстурного распознавания за счет введения некумулятивного преобразования связности на пространстве признаков. Разработана система автоматической классификации автотранспортных средств. Ил.: 1. Табл.: 1. Библиогр.: 9 назв.

Ключевые слова: некумулятивное преобразование, многослойные карты разнонаправленных градиентов.

Постановка проблемы. С развитием и повсеместным внедрением компьютерной техники в различные области жизнедеятельности человека приобретает все большую популярность как использование систем машинного зрения как наиболее универсальных средств контроля, так и разработка методов анализа информации в таких системах. Общей задачей такого анализа является интерпретация визуальной сцены, частной, более часто встречаемой -идентификация отдельных объектов контроля - распознавание визуальных образов с необходимостью их выделения из остальной сцены (фона).

Система оптического распознавания, получая в качестве входной информации набор дискретизированных изображений сцены, возможно содержащих объекты контроля, должна продуцировать данные о наличии, положении в пределах сцены и классе объектов контроля. При этом задача осложнятся тем, что изображения объектов могут подвергаться различным преобразованиям вследствие оптических искажений, положения объектов в пространстве и помех датчиков, принимающих входные сигналы. Также модель должна позволять учитывать новые данные об объектах контроля.

Анализ литературы. Рассматриваемые в литературе и используемые в описываемых системах обработки визуальной информации методы и модели отличаются отсутствием достаточной общности и применимы лишь к узкому кругу задач, для которого они были разработаны.

В оптическом распознавании по способу представления данных об объекте различают два класса методов - контурное [1, 2] и текстурное [3, 4] распознавание. Контурный подход использует информацию о структуре объекта, поэтому признаки, используемые в таких методах, априорно инвариантны целому ряду преобразований изображения, но, с другой стороны, такое представление объекта сужает круг задач, для которых могут быть применены отдельные методы построения моделей контурного распознавания.

В текстурном оптическом распознавании в качестве набора признаков используются непосредственно точки изображения объекта [3], точки, подвергнутые тем или иным преобразованиям [5], или расчетные признаки на

основании значений яркости точек изображения [6]. Преобразования изображений объектов и вычисление расчетных признаков призвано сделать их инвариантными [7], сократить размерность пространства признаков, повысить точность сопоставления при тех же или меньших вычислительных затратах, но при этом, как правило, повышается зависимость от решаемой конкретной практической задачи.

Среди методов распознавания необходимо выделить статистические методы [8] и методы, основанные на предположении о типе решающей функции [5], и отметить их неспособность использовать новую информацию об объекте после построения модели, а также сильную зависимость от распределения экземпляров различных классов в пространстве признаков.

Метод эталонов [4, 9], представляющий знания в модели не в виде схемы связей между признаками, а в виде описания конкретных объектов, позволяет пополнять знаниями уже построенные модели и является достаточно прозрачным для интерпретации результатов сопоставления с прототипами новых экземпляров, но эффективность моделей, построенных по методу эталонов, зависит от размерности пространства признаков и меры расстояния на пространстве признаков.

Цель работы - разработка методов построения моделей выделения и распознавания объектов визуальных сцен, позволяющих, при реализации на современных ЭВМ, получать результат в реальном масштабе времени.

Метод оптического текстурного распознавания. Анализ литературных источников показал, что наиболее гибким и прозрачным с точки зрения интерпретации результатов сопоставления является метод эталонов, который так же позволяет дополнять построенную модель распознавания новыми данными об объектах контроля. При этом текстурное представление предполагает использование точек изображения в качестве признаков, что может значительно понизить эффективность модели, построенной по методу эталонов, особенно в случае плохой разделяемости классов.

Таким образом, преобразование набора признаков должно позволить сделать его инвариантным с целью уменьшения необходимого количества эталонов, а так же повысить точность сопоставления в случаях локальных искажений изображений объектов. Преобразования, учитывающие взаимное расположение точек разной интенсивности, инвариантно самим значениям интенсивности, а за счет увеличения связности набора признаков повышается точность сопоставления с шаблоном в целом.

При использовании разности либо отношения значений яркости в точке к значениям яркости в точках из некоторой окрестности принято говорить о преобразовании градиента

ох (р,/)=с()х(р+с®)-С0 (1)х(р), (1)

где GX(p,l) - значение градиента функции яркости в точке p на слое l; C0,C

- коэффициенты; X(p) - значение ярости точки p; c(l) - l-ая точка несмещенного ядра свертки.

Традиционные градиентные преобразования, такие как преобразования Собеля, Роберта, Привита, манипулируя коэффициентами C, получают в качестве признаков кумулятивное значение градиента

GXm(p) = liGx (p,î). (2)

î

При этом учитывается информация о направлении максимального изменения интенсивности с учетом весовых коэффициентов.

Используя общую формулу (1) анализ текстуры осуществляется более точно (каждый слой описывает значение градиента в одном из направлений, поэтому G (Р, 1 ) можно назвать многослойной картой разнонаправленных градиентов) и такой набор признаков менее подвержен влиянию локальных искажений. Обозначим как Nx - количество точек в области х, тогда для C0 (î) = 1, C(l) = 1, Vî и квадратной компактной области c для выброса в одной неграничной точке p получим количество ложных значений преобразованных признаков из расчета на затрагиваемую искажением область ( Nerr ) для кумулятивного и обобщенного подходов в указанной области

2Nc 2 Лтсит Nc +1

N =_________с =__________ Ncum = с______ (3)

err -КТ î-КТ i\ -КТ î’ err ЛТ л ' ^ '

Nc (Nc + 1) Nc + 1 Nc + 1

Для сопоставления с шаблоном в случае использования формулы (1)

используется выражение вида

XIGt(t,l)-G! (p +1,l)

Q(p,T )= ------------------------------------------, (4)

V ' NT • Nc

где Q(p,t ) - значение степени совпадения шаблона T с фрагментом изображения в точке p.

Методы повышения эффективности. Как видно из формулы (2), кумулятивное преобразование призвано сократить количество признаков после преобразования связности. В качестве способа сокращения количества признаков для некумулятивного метода предлагается осуществить бинаризацию значений градиентов на каждом слое. При этом будет использоваться информация о наличии градиента в том или ином

направлении. Обозначим бинаризированный вариант (1) как GbXn (p), полученный путем упаковывания битов слоев а одно значение параметра.

Тогда для сопоставления с шаблоном в случае использования бинаризированных значений градиентов используется выражение вида

^ьш{рТт(г)® сь1,п(р + г))

0{р-т )=“—^-----------------------• (5)

где bits{x) - количество единиц в бинарном представлении числа х.

Из выражения (5) видно, что в случае бинаризации сравнение каждой точки шаблона происходит за одну операцию исключающего или, что при выборе области с таким образом, что бы Ыс было пропорционально разрядной сетке современных ЭВМ, позволит существенно повысить эффективность алгоритма, реализующего данную модель.

Для выбора ядра с использовались средние значения ошибок классификации первого и второго рода для различных значений неровности текстуры шаблона, выраженной в процентном отношении единиц к общему количеству бит в бинарном представлении градиента. Результаты сравнения квадратных ядер с приведены в таблице.

Таблица

Ошибки классификации для различных ядер с (для 230 тестовых изображений)

с N Неровности текстуры, % Неверная классификация, % Ошибочные срабатывания, % Общая ошибка классификации, %

3x3 8 30% 5,65% 22,17% 27,83%

40% 4,35% 14,78% 19,13%

50% 3,91% 3,91% 7,83%

60% 1,30% 1,30% 2,61%

5x5 24 30% 3,04% 9,13% 12,17%

40% 4,78% 1,74% 6,52%

50% 5,22% 0,43% 5,65%

60% 9,13% 0,00% 9,13%

7x7 48 30% 3,04% 6,09% 9,13%

40% 4,35% 0,87% 5,22%

50% 5,22% 0,00% 5,22%

60% 20,43% 0,00% 20,43%

Как видно из таблицы, с увеличением поля связности увеличивается количество ошибок первого рода и уменьшается второго, при этом средняя ошибка классификации для значений Ыс 24 и 48 вполне приемлема. При меньших значениях Ыс ошибка увеличивается из-за недостаточной точности сопоставления текстуры.

С целью снижения времени обработки также предлагается снизить размерность пространства эталонов для сравнения за счет наложения на него иерархической структуры - группы "близких" эталонов усредняются в один, образуя при этом второй уровень иерархии. Такой подход позволяет снизить порог для сопоставления с эталонами первого уровня, снижая, таким образом, ошибку, связанную с пропуском изображений объектов контроля.

При проверке очередного экземпляра сравнение производится с эталонами первого уровня иерархии, и в случае успешного сопоставления - с соответствующими исходными эталонами, находящимися на втором уровне, и использованными для усреднения, если такое имело место.

Автоматическая система распознавания автотранспортных средств.

На основе изложенных методов была создана программная система для решения задачи распознавания автотранспортных средств, движущихся по автомагистралям, на основании изображений их задней части, полученных с устройств видео наблюдения, расположенных над дорожным полотном.

На рисунке представлена схема функционирования автоматической системы распознавания.

Рис. Схема функционирования автоматической системы распознавания

На этапе инициализации набор эталонов преобразуется к виду, необходимому для непосредственного сопоставления с новыми экземплярами

- подвергается преобразованию исходного набора признаков, которыми описываются эталоны для более удобной работы с ними. Входные изображения, поступающие на вход распознающей системы, подвергаются такому же преобразованию, параллельно происходит выделение активных областей изображения путем сопоставления соседних кадров видео последовательности либо другими специфическими средствами выделения региона интереса, например, в случае распознавания на статических изображениях. В процессе сканирования последовательно указываются области-кандидаты преобразованных входных изображений сцен из диапазона активных областей, при этом используется обратная связь, учитывающая

знания о предыдущем положении объекта на сцене. Отобранные кандидаты сравниваются с набором эталонных представителей распознаваемых классов. На основании такого сравнения принимается решение о том, какие из рассмотренных областей являются изображениями искомых объектов и к какому из распознаваемых классов они принадлежат.

Для тестирования системы были использованы две выборки изображений автомобилей, использованных для обучения описанной системы и действующей системы, использованной для сравнения, и изображений сцен, использованных для контроля правильности выделения и распознавания. Обучающая выборка составила 1555 изображений автотранспортных средств трех распознаваемых классов, тестовая выборка - 2457 изображений сцены, содержащей одно или несколько автотранспортных средств. При этом точность распознавания описанной в работе системы составила 80,5% при среднем времени обработки одного изображения 0,6 с против 72% точности при средних затратах времени 1,1 с индустриальной системой ASPI, используемой на автострадах Италии.

Выводы. С целью решения актуальной задачи распознавания оптических изображений впервые предложено использовать многослойные карты разно направленных градиентов для представления и сравнения изображений в системе распознавания.

Получил дальнейшее развитие метод эталонов, который модифицирован для решения задач оптического текстурного распознавания за счет введения некумулятивного преобразования связности на пространстве признаков.

Разработана система автоматической классификации автотранспортных средств, использующая предложенные методы и модели.

Работа выполнена в рамках НИР ООО "МПА Групп" “Разработка математического и информационного обеспечения интеллектуальной системы визуального контроля транспортных средств” (№ гос. регистрации 0106U012013) и “Разработка методов и программных средств на основе обучения, распознавания, оптимизации та адаптации для принятия решений в автоматизированных системах управления транспортными средствами” (№ гос. регистрации 0107U0006781).

Список литературы: 1. Кормановський C.I. Око-процесорна обробка та розпізнавання образної інформації за геометричними ознаками: дис. ... канд. техн. наук: 05.13.06 / Кормановський Сергій Іванович. - Тернопіль, 2006 - 1б2 с. 2. Лавріненко С.В. Ідентифікація форми рухомих об’єктів на основі сигнально та спектрально-структурних моделей: дис. . канд. техн. наук: 05.13.06 I Лавріненко Сергій Вадимович. - Одеса, 2002. - 149 с. З. Leibe B. Learning semantic object parts for object categorization I B. Leibe, A. Ettlin, B. Schiele II Image and Vision Computing. - Newton: Butterworth-Heinemann, 2008. - Vol. 2б. - N° 1. - P. 15-2б. 4. Zabih R. Non-parametric local transforms for computing visual correspondence I R. Zabih, J. Woodfill II Proceedings of the Third European Conference on Computer Vision. Stockholm, May 2-б, 1994. - New York: Springer-Verlag, 1994. - Vol. 2. - P. 151-158. 5. Messelodi S. Vision-based bicycleImotorcycle classification I S. Messelodi, C.M. Modena, G. Cattoni II Pattern Recognition Letters. Oct. 2007. - New York: Elsevier Science Inc., 2007. - Vol. 28. - N° 13. - P. 1719-172б. б. Bebis G. Monocular Precrash Vehicle Detection: Features and Classifiers I G. Bebis, R. Miller II IEEE Transactions on Image Processing. July 200б. - New York:

Springer-Verlag, 2006. - Vol. 15. - №2 7. - P. 2019-2034. 7. Гороховатский В.О. Распознавание изображений в условиях неполной информации / В.О. Гороховатский. - Харьков: ХНУРЭ, 2003. -112 с. 8. Айвазян С.А. Прикладная статистика: Классификация и снижение размерности: Справ. изд. / С.А. Айвазян, В.М. Бухштабер, И.С. Енюков, Л.Д. Мешалкин; Под ред. С.А. Айвазяна. - М.: Финансы и статистика, 1989. - 607 с. 9. Люгер Дж.Ф. Искусственный интеллект: стратегии и методы решения сложных проблем / Дж.Ф. Люгер. - М.: Вильямс, 2005. - 864 с.

Статья представлена д.ф.-м.н. проф. ЗНУГоменюком С.И.

УДК 004.93

Некумулятивні перетворення ознак в системах оптичного текстурного розпізнавання / Бойченко К.Ю. // Вісник НТУ "ХПІ". Тематичний випуск: Інформатика і моделювання. -Харків: НТУ "ХПІ". - 2009. - № 43. - С. 3 - 9.

Вперше запропоновано використовувати багатошарові карти різнонаправлених градієнтів для представлення та порівняння зображень в системі розпізнавання. Отримав подальшого розвитку метод еталонів, який модифіковано для вирішення задач оптичного текстурного розпізнавання за рахунок введення некумулятивного перетворення зв’язності на просторі ознак. Розроблена система автоматичної класифікації автотранспортних засобів. Ил.: 1. Табл.: 1. Бібліогр.: 9 назв.

Ключові слова: некумулятивне перетворення, багатошарові карти різнонаправлених градієнтів.

UDC 004.93

Non-cumulative feature conversion in optical texture recognition systems / Boichenko C.Yu.

// Herald of the National Technical University "KhPI". Subject issue: Information Science and Modelling. - Kharkov: NTU "KhPI". - 2009. - №2 43. - P. 3 - 9.

Multilayer multi-direct gradient maps for presentation and comparison of image in recognition systems are first proposed. Template method is advanced to solve optical texture recognition problems by applying non-cumulative coherence conversion in feature space. Automatic vehicles classification system is developed. Figs: 1. Tables: 1. Refs: 15 titles.

Key words: non-cumulative conversion, multilayer multi-direct gradient maps.

Поступила в редакцию 16.10.2009

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бойченко К. Ю.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Бойченко К. Ю.

Non-cumulative feature conversion in optical texture recognition systems

Текст научной работы на тему «Некумулятивное преобразование признаков в системах оптического текстурного распознавания»