Научная статья на тему 'ОПРЕДЕЛЕНИЕ ИНВАРИАНТНЫХ ХАРАКТЕРИСТИК ЦИФРОВОГО ИЗОБРАЖЕНИЯ И ИХ ВЫЧИСЛЕНИЕ В СИСТЕМЕ MATLAB'

ОПРЕДЕЛЕНИЕ ИНВАРИАНТНЫХ ХАРАКТЕРИСТИК ЦИФРОВОГО ИЗОБРАЖЕНИЯ И ИХ ВЫЧИСЛЕНИЕ В СИСТЕМЕ MATLAB Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
20
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОДНОКАНАЛЬНОЕ ЦИФРОВОЕ ИЗОБРАЖЕНИЕ / ИНВАРИАНТЫ ВТОРОГО ПОРЯДКА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Самарина Ольга Владимировна, Самарин Валерий Анатольевич

Предмет исследования: одноканальное полутоновое цифровое изображение, инварианты второго порядка относительно группы движений и растяжений. Цель исследования: определить новую группу инвариантов одноканального цифрового изображения относительно сдвигов, поворотов и растяжений цифрового изображения. Методы и объекты исследования: объектом исследования являются одноканальные изображения. Разработанные вычислительные алгоритмы основаны на комплексном использовании аналитических и геометрических методов исследования, теории инвариантов и вейвлетов. Основные результаты исследования: разработана вычислительная схема определения группы инвариантных характеристик относительно таких преобразований цифрового изображения как сдвиги, повороты и растяжения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DETERMINATION OF INVARIANT CHARACTERISTICS FOR DIGITAL IMAGE AND THEIR CALCULATION IN THE MATLAB SYSTEM

Subject of research: single-channel digital image, second-order invariants to movements and stretching. Purpose of research: to determine a new group of invariants of a single-channel digital image with respect to shifts, rotations and stretching. Methods and objects of research: the object of research is single-channel images. The developed computational algorithms are based on the complex use of analytical and geometric research methods, the theory of invariants and wavelets. Main results of research: a computational scheme for determining the group of invariant characteristics with respect to such digital image transformations as shifts, rotations and stretching has been developed.

Текст научной работы на тему «ОПРЕДЕЛЕНИЕ ИНВАРИАНТНЫХ ХАРАКТЕРИСТИК ЦИФРОВОГО ИЗОБРАЖЕНИЯ И ИХ ВЫЧИСЛЕНИЕ В СИСТЕМЕ MATLAB»

ВЕСТНИК ЮГОРСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА

_2023 г. Выпуск 1 (68). С. 77-82_

УДК 528.7:004 DOI: 10.18822/byusu20230177-82

ОПРЕДЕЛЕНИЕ ИНВАРИАНТНЫХ ХАРАКТЕРИСТИК ЦИФРОВОГО ИЗОБРАЖЕНИЯ И ИХ ВЫЧИСЛЕНИЕ В СИСТЕМЕ MATLAB

Самарина Ольга Владимировна

кандидат физико-математических наук, доцент, руководитель инженерной школы цифровых технологий, Югорский государственный университет Ханты-Мансийск, Россия E-mail: O_Samarina@ugrasu.ru

Самарин Валерий Анатольевич

кандидат технических наук, доцент, доцент инженерной школы цифровых технологий, Югорский государственный университет Ханты-Мансийск, Россия E-mail: V_Samarin@ugrasu.ru

Предмет исследования: одноканальное полутоновое цифровое изображение, инварианты второго порядка относительно группы движений и растяжений.

Цель исследования: определить новую группу инвариантов одноканального цифрового изображения относительно сдвигов, поворотов и растяжений цифрового изображения.

Методы и объекты исследования: объектом исследования являются одноканальные изображения. Разработанные вычислительные алгоритмы основаны на комплексном использовании аналитических и геометрических методов исследования, теории инвариантов и вейвлетов.

Основные результаты исследования: разработана вычислительная схема определения группы инвариантных характеристик относительно таких преобразований цифрового изображения как сдвиги, повороты и растяжения.

Ключевые слова: одноканальное цифровое изображение, инварианты второго порядка.

DETERMINATION OF INVARIANT CHARACTERISTICS FOR DIGITAL IMAGE AND THEIR CALCULATION IN THE MATLAB SYSTEM

Olga V. Samarina

Candidate of Physical and Mathematical Sciences, Associate Professor, Head of Engineering school of Digital Technologies,

Yugra State University Khanty-Mansiysk, Russia E-mail: O_Samarina@ugrasu.ru

Valery A. Samarin

Candidate of Technical Sciences, Associate Professor, Associate Professor school of Digital Engineering,

Yugra State University Khanty-Mansiysk, Russia E-mail: V_Samarin@ugrasu.ru

Subject of research: single-channel digital image, second-order invariants to movements and stretching.

Purpose of research: to determine a new group of invariants of a single-channel digital image with respect to shifts, rotations and stretching.

Methods and objects of research: the object of research is single-channel images. The developed computational algorithms are based on the complex use of analytical and geometric research methods, the theory of invariants and wavelets.

Main results of research: a computational scheme for determining the group of invariant characteristics with respect to such digital image transformations as shifts, rotations and stretching has been developed.

Keywords: single-channel digital image, second-order invariants.

Введение

Инвариантные характеристики изображения являются точным математическим инструментом, позволяющим решать широкий класс задач обработки и анализа одноканальных и многоканальных изображений, таких так распознавание образов, поиск объектов по образцу и другие. Инварианты способны передавать характерные особенности изображения и выступать в роли существенных признаков при преобразованиях первичного изображения, таких как сдвиг, поворот, масштабирование, изменения контрастности и яркости. Также инвариантные характеристики характеризуются способностью к обобщению, что в свою очередь является необходимым качеством для моделей и методов искусственного интеллекта, нейронных сетей.

В настоящее время исследования, направленные на поиск и исследование инвариантных характеристик цифрового изображения, являются достаточно актуальными. Они получают развитие в областях распознавания текста, анализа 3D-изображений [1-3]. Однако на практике реальные цифровые содержат помехи, неточности и шумы. Кроме того, цифровые изображения не являются непрерывными, они определятся значениями пикселей в дискретных координатах. Таким образом перед исследователями встает задача определения методов и моделей обработки цифрового дискретного изображения и определения для данного изображения ряда устойчивых инвариантных характеристик [4].

В данной работе представлены инварианты второго порядка (числовые функции, содержащие производные первого и второго порядков) относительно группы аффинных преобразований, а также яркости, контрастности изображения. Использование в методах обработки и анализа цифровых изображений инвариантов второго порядка позволяет найти достаточно устойчивую относительно помех и шума изображения числовую характеристику и существенно снизить сложность метода, что является ощутимым преимуществом при практической реализации алгоритма.

Результаты и обсуждение

Представим цифровое полутоновое изображение в виде непрерывной функции / (X, у) . Будем считать, что данная функция цифрового изображения дважды непрерывно дифференцируема. Тогда справедливо разложение Тейлора второго порядка с произвольной точкой рассматриваемой области в виде центра. При помощи простых преобразований любую точку области можно перевести в начало координат. Тогда функция цифрового полутонового изображения будет иметь вид:

/(ху) = а + р1х + р2у + -[Ь(20)х + 2Ь(1Л)ху + Ъ(^2)у ] + о[х + у'

В данной записи коэффициенты разложения представляют собой значения функции, дифференциалов первого и второго порядка в начале координат:

a = f (0, О), А = f (0,0), p2 = f (0, О),

дx oy

<2 г "Л г <-,2

-С Г р2

b<2,0> = 0), b(U) (О, О), V2> = 0).

Представим, что цифровое изображение претерпело некоторые преобразования (такие как сдвиг, масштабирование, поворот). Обозначим эту группу преобразований как G. В таком случае можем записать

G ( Л, p, ф): f (x, y) ^ exf (ep (x cos(^) - y sin(^)), ep (x sin(^) + y cos(^))).

В этой записи коэффициент ep соответствует преобразованию плоскости цифрового

А

изображения, угол ф - повороту, а множитель e - можно описать как коэффициент соответствующий частотному диапазону данного изображения, а также как фактор поглощения среды, действующий в окрестности рассматриваемой точки.

Определение. Числовая функция I нетождественно равная константе является инвариантом цифрового изображения порядка к, если она сохраняет свое значение под действием преобразований группы G .

Замечание. Размерность пространства инвариантов определяется по формуле:

dim I = dim J\ - dim G

Заметим, что группа преобразований G(Л, p, ф) действует в пространстве параметров t = pi, p, bii, b22, b12 } и образует трехмерную коммутативную группу Ли

рх, фх) о р2, ф2 ) = G(J1+J2,pl+ р2,фг + ф2)

Для произвольной функции Ф параметров Ф( a, p1, p2, b11, b22, b12 ) детерминированы инфинитезимальные дифференциальные операторы ХЛФ , XрФ , XфФ

Теорема 1. Дифференциальные операторы ХЛФ , XрФ, ХфФ представимы в следу-

ющем виде

^ ОФ ОФ ОФ ОФ , ОФ , ОФ ,

X,Ф = — aч--p ч--p ч--bu ч--b99 ч--b,9

Л л J. 1 л J- 2 11 22 /"ч т 12

да Ор Ор2 ОЬц ОЬ22 оЬ12

ОФ ОФ ОФ ОФ ОФ

—Pi +-Рг +-2bn +-2b22 +-

ОР1 ОР2 ОЬ11 ОЬ22 ОЬ12

ОФ ОФ ОФ _ ОФ _ О^

ХФФ^— Р2 Р1 2 b12 2 b12 ^^-(-b11 + b22 ) .

ОР1 ОР2 ОЬ11 ОЬ22 ОЬ12

Доказательство:

Параметр t преобразуется по формуле t ^ Q(t) , т.е.

Л

а ^ ae , Р ^ eЛ+pР со<ф) + eЛ+pР2 sin(ф), Р2 ^ -p1eЛ+p s^) + p2eЛ+p cos(ф)

bn ^ elp+\x cos2 (ф) + elp+\2 sin (ф) cos (ф) - e2p+\2 cos2 (ф) + е2р+лЬ,

22 2p

Ъ12 ^ 2Ъ12 cos2 (ф) + е2р+яЪ22 cos (ф) sin (ф) - J sin (ф) cos (ф) - е2р+яЪ12 Ъ22 ^ - e2p+\ cos2 (ф)- 2е2^Ъ12 sin(ф)cos(ф) + elp+\2 cos2 (ф)

Воспользовавшись данным преобразованием, найдем значения следующих дифференциальных операторов:

,))

АфИ ,)) '))

= хлф

Л=0,р=0,ф=0

X рФ

л=0,р=0,ф=0

= ХфФ

Л=0,р=0,ф=0

Выполнив вычисления с учетом указанных выше начальных условий, получим:

Л ао ао ао ао, ао, аФ,

I,Ф = — aч--p ч--p ч--Ьи ч--b99 ч--b9

Л >"ч >"ч J- 1 ^ J- 2 11 22 /"ч т 12

aa ар ф2 аьп аь22 аь12 . оф ОФ ОФ ао ао

I Ф =-p +-p +-2h. +-2b99 +-2b,9

р Irl ^ sr 2 11 лт 22 лт 12

dPl dP2 abn 0b22 0b12 ,

ао оф ао^, ао а^, , , ч

ХфФ = — Р2 Р1 2 Ь12 2 Ь12 + Ь22 )

0P1 0P2 0b11 0b22 0b12 .

Теорема доказана.

Теорема 2. Данные функции являются инвариантами цифрового изображения второго порядка относительно группы преобразований, включающих в себя движения, растяжения и калибровку цифрового полутонового изображения:

Inv =

Inv- =

(b11 + Ь22 )(b1lPl2 + 2b 1 2 P1 P2 + b22P^ ) 1 = '

(b11 + b22 )(tó - 2b12P1P2 + b22P\ )

2 (P12 + P22)(b21 + 2b2 + b222)

Доказательство. Проверяется непосредственно.

Замечание. Для представленных инвариантов справедлива следующая оценка:

1—^^ < 1пV, 1пк~ < 1 + ^

2 1 2 2

Для выполнения расчетов данных инвариантов в системе Ма^аЬ необходимо дополнительно рассмотреть дискретную модель цифрового полутонового изображения.

В силу технических ограничений память компьютера способна хранить и обрабатывать только дискретные числа. Поэтому при оцифровке непрерывная функция изображения

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

/ (X, У) превращается в дискретную - возникает прямоугольная решетка точек изображения. И таким образом при любых операциях с использованием цифровых технических средств, таких как хранение, обработка и анализ, полутоновое изображение представляет собой матрицу определенного размера со значениями пикселей в узлах сетки (рис. 1).

Рисунок 1 - Дискретная сетка цифрового изображения

Система Ма^аЬ обладает широкими возможностями обработки и анализа цифровых изображений. При помощи встроенных функций системы была проведена загрузка группы тестовых изображений. Данные группы содержат изображения одной и той же области, но содержащие определенные отличия, такие как уровень яркости, сдвиг по вертикали и горизонтали, угол поворота (рис. 2).

Рисунок 2 - Пример группы изображений Для каждого из изображений группы были проведены вычисления инвариантных характеристик 1шх, 1пУ2 . Для оценки результативности характеристик рассматривались значения функции распределения разностей между инвариантными характеристиками вычисленных для значения дискретной функции во всех узлах сетки. Проведенные исследования позволяют сделать вывод: для предполагаемого наличия общих областей на изображениях размером

п х т достаточно, чтобы у 0.12 х п х т значений сумма попарных разностей по рассмотренным инвариантным характеристикам не превышала величину Б = 200.

Заключение и выводы

Проведенные теоретические исследования и вычислительные эксперименты позволяют сделать вывод о том, что представленные в данной работе инвариантные характеристики цифрового одноканального изображения относительно группы аффинных преобразований, а

также яркости, контрастности изображения можно эффективно использовать при решении различных задач анализа и обработки цифрового изображений, таких как сортировка изображений, поиск снимков по образцу, распознавание изображений и другие.

Литература

1. Абрамов, Н. С. Обзор методов распознавания образов на основе инвариантов к яркостным и геометрическим преобразованиям / Абрамов Н. С., Фраленко В. П., Хачумов М. В. - Текст : непосредственный // Современные наукоемкие технологии. - 2020. - № 6-1. - С. 110-117.

2. Нгуен, З. Т. Инварианты в задачах распознавания графических образов / Нгуен З. Т. -Текст : непосредственный // Вестник РУДН. Серия Математика. Информатика. Физика. -2016. - № 1. - С. 76-85.

3. Самарина, О. В. Применение интегральных топографических характеристик в решении задач обработки данных дистанционного зондирования / Самарина О. В., Славский В. В., Семенов С. П. - Текст : непосредственный // Математические заметки СВФУ. - Январь-март 2020. - Т. 27, № 1. - С. 41-50.

4. Сергиенко, А. Б. Цифровая обработка сигналов / А. Б. Сергиенко. - СПб. : Питер, 2003. - 608 с. - Текст : непосредственный.

i Надоели баннеры? Вы всегда можете отключить рекламу.