РАСПОЗНАВАНИЕ ОБРАЗОВ В УСЛОВИЯХ ГЕОМЕТРИЧЕСКИХ И ФОТОМЕТРИЧЕСКИХ ИЗМЕНЕНИЙ

Сайфудинов И.Р.; Мокшин В.В.

УДК 004.931, 681.518.3

Сайфудинов И.Р. аспирант 4 года обучения кафедра «Автоматизированных систем обработки информации и управления» Мокшин В.В., к техн. н.

доцент

кафедра «Автоматизированных систем обработки информации и управления» Казанский национальный исследовательский технический

университет им. А.Н. Туполева Россия, г. Казань

РАСПОЗНАВАНИЕ ОБРАЗОВ В УСЛОВИЯХ ГЕОМЕТРИЧЕСКИХ И ФОТОМЕТРИЧЕСКИХ ИЗМЕНЕНИЙ

Аннотация: Эта работа рассматривает проблему визуального распознавания при двух источниках изменчивости: геометрических и фотометрических. Геометрические рассматривают связь между 3D - объектами и их представлениями относительно параллельной, перспективной и центральной проекции. Фотометрические рассматривают связь между 3D - матовыми объектами и их образами в условиях изменяющегося освещения.

Ключевые слова: распознавание образов, структурная значимость, проекционная модель.

Saifudinov I.R. graduate student

4 year of training, the department "Automated systems of information

processing and management" Kazan National Research Technical University them of A.N. Tupolev

Russia, Kazan Mokshin V.V. Ph.D., Associate Professor Associate Professor of the Department "Automated Systems of

Information Processing and Management" Kazan National Research Technical University them of A.N. Tupolev

Russia, Kazan

PATTERN RECOGNITION UNDER GEOMETRIC AND PHOTOMETRIC CHANGES

Abstaract: This paper discusses the problem of visual recognition at two sources of variability: the geometric and photometric. Geometric considering the link between 3D - objects and their representations with respect to the parallel, perspective and the central projection. Photometric considering the link between 3D - opaque objects and their images under varying illumination.

Keywords: pattern recognition, structural significance, flat model.

Введение

Проблема распознавания визуального объекта является предметом большого интереса в человеческом и компьютерном зрении [1]. Задача кажется очень легкой и естественной для биологических систем, тем не менее, ее, оказалось, очень трудно разместить в рамках комплексной аналитической структуры.

Есть много аспектов проблемы распознавания, существуют многие соответствующие источники информации, и, видимо, ни один широко не приняли определения того, какова проблема.

Источники изменчивости

Одной из характерных проблем визуального распознавания является один-ко-многим отображение отдельного объекта в пространстве и образов, которые он может производить [2]. По мере движения наших глаз, изменения положения относительно объекта, или перемещения объекта относительно к себе, образ объекта претерпевает изменение. Различают основные источники изменчивости:

- Геометрические: изменения в пространственном расположении информации об изображении, в результате относительного изменения положения просмотра.

- Фотометрические: изменения распределения интенсивности света в результате смены условия освещения.

Геометрическая задача (как показано на рис. 1) предполагает, что мы можем определить небольшое количество соответствующих точек через различные представления одного и того же объекта, которые предположим, могут быть установлены с помощью корреляции.

» 0 30 объект

Рис.1. Иллюстрация геометрической проблемы распознавания. Учитывая небольшое количество соответствующих точек между новым входным представлением и двумя представлениями модели, определенными для любых 5 точек Р, проецирующих на р и р' в двух представлениях модели, местоположение р" его проекция на новое изображение.

Фотометрическая проблема

Дается три изображения произвольной выпуклой матовой поверхности. Изображения взяты под тремя различными произвольными настройками точек источников света. Для любого произвольного образа определить, может ли изображение быть получено на поверхности при некоторых условиях освещения. Фотометрической проблемой является вопрос о том, как можно компенсировать эффект изменения освещения путем непосредственного предсказания входного сигнала, при условии, что он пришел из той же самой поверхности, которая произвела изображения модели. Как и в случае геометрической задачи, этот подход следует подходу выравнивания для распознавания [3]. Фотометрическая проблема также поднимает вопрос представления изображения.

Другими словами, какова минимальная необходимая информация, извлеченная из изображений, которая отменит эффекты меняющегося освещения?

На практике работа ведется с приближенной версией фотометрической проблемы, допуская невыпуклые, приблизительно матовые поверхности, освещенные при ситуациях, которые производят литые тени и блики. Рисунок 2 иллюстрирует фотометрическую проблему на виде из объектов и представлений входных изображений.

взято из различных условий освещения, сопровождаемых операцией по пороговой обработке. Узнаваемость пороговых изображений предполагает, что некоторое знание об объектах требуется, чтобы вынести освещение за скобки.

Аффинные координаты из двух точек зрения

Обозначим точки объекта заглавными буквами и точки изображения маленькими буквами. Если Р обозначает точку объекта в 3D пространстве, р,р',р'' обозначают ее проекцию на первую, вторую и новую проекцию, соответственно. Мы рассматриваем точки изображения в качестве лучей (однородные координаты) в 3D-пространстве, и обращаемся к обозначению

р = (х, у, 1) как стандартному представлению плоскости изображения. Заметим, что истинные координаты плоскости изображения связаны со стандартным представлением посредством проективного преобразования плоскости. В этом случае мы имеем дело с центральной проекцией, все представления координат изображения разрешены, и таким образом, без потери общности, мы работаем со стандартным представлением.

Пусть 0,Р1,Р2,Р3 четыре некомпланарные точки объекта, указанные в качестве опорных точек, и пусть 0', Р', РР3 координаты опорных точек из второго положения камеры. Пусть Ъг,Ь2, Ъ3 аффинные координаты точки объекта интереса Р по отношению к базису 0Рг, 0Р2, 0Р3 т.е.,

ор= ^ъ-щ)

]='

где, 0Р обозначает вектор от 0 к Р. При параллельной проекции преобразование просмотра между двумя камерами может быть представлено произвольным аффинным преобразованием, т.е., 0'Р' = Т(0Р) для некоторого линейного преобразования Т. Поэтому, координаты Ъг, Ъ2, Ъ3 из Р остаются фиксированными при преобразовании просмотра, т.е.

3

о'р' = ^ь(о',р;)

Поскольку глубина теряется при параллельной проекции, мы имеем аналогичное соотношение в координатах изображения:

ор = 13=1Ъ](ор]) (1.1)

о'р' = Т/3=1Ъ](о'р^) (1.2)

Принимая во внимание соответствующие точки р,р' (в координатах изображения), обе формулы 1.1,1.2 обеспечивают четыре уравнения для решения для трех аффинных координат, связанных с точкой объекта Р которая проецируется к точкам р,р'. Кроме того, поскольку аффинные координаты фиксированы для всех преобразований просмотра, мы можем предсказать местоположение, р'' на новом представлении сначала восстановив аффинные координаты из двух видов модели, а затем подставляя их в следующую формулу:

'' '' '' ''

=1

Мы имеем, таким образом, способ восстановления аффинных координат из двух точек зрения и метод для достижения повторной проекции

при наличии двух видов модели и четырех соответствующих точек во всех трех точках зрений.

Более краткое представление не метрической структуры и более прямой метод повторной проекции может быть получен, если вместо восстановления аффинных координат, мы определим и восстановим аффинный инвариант. Аффинный инвариант то, что Koenderink и Van Doom's [4] назвали «аффинная структура», которая оказывается просто Ь3. Еще более важным, однако, является понятие описания структуры как инвариантное измерение по отношению к геометрической конструкции, определяемой опорными точками.

Использованные источники:

1. Сайфудинов И.Р., Мокшин В.В. Адаптация алгоритмов распознавания образов к системам реального времени. - Казань: Перспективные информационные технологии (ПИТ 2014) труды Международной научно-технической конференции. 2014. С. 153-157.

2. Суздальцев В.А., Тахавова Э.Г., Шлеймович М.П. Представление знаний в информационных системах. Математическое моделирование. - учебное пособие; М-во образования и науки Российской Федерации, Казанский гос. технический ун-т им. А. Н. Туполева. Казань, 2005.

3. D.P. Huttenlocher and S. Ullman. Recognizing solid objects by alignment with an image. International Journal of Computer Vision 5 (2), 195-212

4. J.J. Koenderink and A.J. Van Doorn. Photometric invariants related to solid shape. Journal of Modern Optics 27 (7), 981-996

УДК 004

Сальникова В.А.

Южно-Российский институт управления Российская академия народного хозяйства и государственной службы при Президенте российской федерации

Барашко Е.Н. научный руководитель ЮРИУ РАНХиГС Россия, г. Ростов-на-Дону БИЗНЕС-АНАЛИТИКА В БАНКОВСКОМ СЕКТОРЕ

Аннотация:

Банковская сфера - одна из сложнейших, связанных с финансовой активностью. Каждый день жизни банка состоит из огромного числа бизнес-процессов, по исполнению которых достигается определенные, фиксируемые результаты, на основании которых принимаются дальнейшие решения. И естественно возникает вопрос в обработке и анализе данных результатов. Именно здесь на помощь, как банкам, так и различного рода предприятиям приходит бизнес-аналитика, целью которой является повышение

РАСПОЗНАВАНИЕ ОБРАЗОВ В УСЛОВИЯХ ГЕОМЕТРИЧЕСКИХ И ФОТОМЕТРИЧЕСКИХ ИЗМЕНЕНИЙ Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Сайфудинов И.Р., Мокшин В.В.

Похожие темы научных работ по математике , автор научной работы — Сайфудинов И.Р., Мокшин В.В.

PATTERN RECOGNITION UNDER GEOMETRIC AND PHOTOMETRIC CHANGES

Текст научной работы на тему «РАСПОЗНАВАНИЕ ОБРАЗОВ В УСЛОВИЯХ ГЕОМЕТРИЧЕСКИХ И ФОТОМЕТРИЧЕСКИХ ИЗМЕНЕНИЙ»