Научная статья на тему 'Метод описания контура объекта наблюдения'

Метод описания контура объекта наблюдения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
107
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИЗОБРАЖЕНИЕ / КОНТУР ОБЪЕКТА / ЭФФЕКТИВНОСТЬ / СЖАТИЕ / ДИСПЕРСИЯ / КОВАРИАЦИЯ / КОРРЕЛЯЦИЯ / КОЭФФИЦИЕНТЫ ПРЕОБРАЗОВАНИЯ / IMAGE / OBJECT / DESCRIPTION / EFFICIENT ENCODING / COMPRESSION / DISPERSION / COVARIANCE / CORRELATION / FILTRATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Митюхин А. И., Астровский И. И.

Рассмотрен эффективный метод представления данных, описывающих контур объекта наблюдения. Эффективность описания достигается посредством представления контура функциональным рядом коэффициентов разложения по базису дискретных собственных функций ковариационной матрицы и применения дисперсионного критерия. Метод позволяет осуществлять сжатие данных практически без потерь. Ошибка восстановления изображения в этом случае приближается к нулевому значению. Приведены результаты оценки эффективности кодирования изображения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Method of description of the observed object contour

The task is a compact presentation of the contour of the object of observation. The proposed method performs data compression using uncorrelated conversion factors. Method enables data compression without loss. Simplified solution of tasks related to the detection and finding certain objects on images. The results of the evaluation of the effectiveness of encoding image object are shown.

Текст научной работы на тему «Метод описания контура объекта наблюдения»

Доклады БГУИР

Doklady BGUIR

2019, № 5 (123) 2019, No. 5 (123)

УДК 004.9

МЕТОД ОПИСАНИЯ КОНТУРА ОБЪЕКТА НАБЛЮДЕНИЯ

A.R МИТЮХИН1, ИИ. АСТРОВСКИЙ2

1 Институт информационных технологий Белорусского государственного университета информатики и радиоэлектроники, Республика Беларусь

2Белорусский государственный университет информатики и радиоэлектроники, Республика Беларусь

Поступила в редакцию 10 апреля 2018

Аннотация. Рассмотрен эффективный метод представления данных, описывающих контур объекта наблюдения. Эффективность описания достигается посредством представления контура функциональным рядом коэффициентов разложения по базису дискретных собственных функций ковариационной матрицы и применения дисперсионного критерия. Метод позволяет осуществлять сжатие данных практически без потерь. Ошибка восстановления изображения в этом случае приближается к нулевому значению. Приведены результаты оценки эффективности кодирования изображения.

Ключевые слова: изображение, контур объекта, эффективность, сжатие, дисперсия, ковариация, корреляция, коэффициенты преобразования.

Abstract. The task is a compact presentation of the contour of the object of observation. The proposed method performs data compression using uncorrelated conversion factors. Method enables data compression without loss. Simplified solution of tasks related to the detection and finding certain objects on images. The results of the evaluation of the effectiveness of encoding image object are shown.

Keywords: image, object, description, efficient encoding, compression, dispersion, covariance, correlation, filtration.

Doklady BGUIR. 2019, Vol. 123, ]Чо. 5, pp. 32-37 Method of description of the observed object contour A.I. Mitsiukhin, I.I. Astrovski

DOI: http://dx.doi.org/10.35596/1729-7648-2019-123-5-32-37

Введение

При решении задач, связанных с обнаружением или поиском определенных объектов на изображениях, с распознаванием или идентификацией, возникает проблема эффективного описания объектов. Эта же проблема возникает при выделении объектов интереса в задачах промышленного контроля. Всегда актуальной задачей является экологический контроль с использованием методов аэрокосмического зондирования, например, областей затопления и др. Во многих приложениях, таких как топография, анализ медицинских изображений, для снижения объема массива данных желательно заменить множество пикселей, изображающих объект, описанием его контура. Например, возможный подход к решению проблемы стандартизации цитологической диагностики основывается на применении методов и техники распознавания образов, представляемых в виде контуров ядра, клетки и пр. Представление контурами подходит для тех случаев, когда в центре внимания находятся геометрические характеристики объекта: длина, площадь, изгибы, очертания, вогнутости. Пространственные данные, описывающие контур, могут иметь высокую размерность. В статье

показано решение задачи компактного представления контура объекта на основе статистического и спектрального подходов. При этом эффективность оценивается с точки зрения сжатия данных практически без потерь. Ошибка восстановления изображения после устранения избыточности в этом случае приближается к нулевому значению.

1. Теоретические принципы

Отличительной особенностью многих изображений является свойство значительной коррелированности данных, описывающих эти изображения. Эта особенность сравнительно высокой линейной зависимости - высокой коррелированности в наибольшей степени проявляется для изображений объектов в виде контуров. Наличие этого свойства позволяет реализовать эффективное сжатие данных практически без потерь. Для этого необходимо выполнить кодирование случайных пространственных данных с помощью линейного ортогонального преобразования в базисе собственных векторов ковариационной матрицы этих данных [1]. Результатом кодирования данных с сильными корреляционными связями между смежными элементами изображения G является полная декорреляция в области преобразований. Исходные данные после кодирования представляются малым числом коэффициентов преобразования. Переход к описанию в базисе собственных векторов устраняет избыточность за счет перераспределения энергии сигналов в новой системе координат. Полная декорреляция данных в пространственной области получается, если в качестве ядра преобразования использовать транспонированную матрицу собственных векторов ковариационной матрицы cov(G) цифрового изображения [2]. Соотношение, преобразующее

коррелированные случайные величины G в некоррелированные случайные величины G, определяется выражением

G = ATG, (1)

где G - матрица изображения размером L = M х N пикселей, G - матрица коэффициентов преобразования размером M х N, A - ядро прямого преобразования размером M хM. Общее число операций умножений, связанное с вычислением (1), равно C = M N. Величину C можно уменьшить, если кодировать данные с учетом анализа значений матрицы Л, описывающей распределение дисперсий коэффициентов преобразования (1) [3]. Дискретная функция распределения дисперсий определяется выражением

diag [а2] = Л = diag [eig(cov(G))], (2)

где diag [eig(cov(G))] - диагональная матрица собственных значений \ ковариационной

матрицы G коэффициентов преобразования. Собственные значения \,i = 1,...,M в области коэффициентов преобразования соответствуют дисперсиям координат векторов

g = gMXSt

Результатом (2) является матрица дисперсий, имеющая в качестве элементов главной диагонали положительные числаА^,А^,...,А,m и остальные элементы которой равны нулю. Для компактного описания - передачи данных достаточно использовать только коэффициенты gj,, которые характеризуются максимальными дисперсиями 'ki [4]. После лексикографической перестановки элементов главной диагонали матрицы (2) формируется матрица фильтрации, структура которой позволяет выделить зону сохраняемых коэффициентов. В этом случае эффективность кодирования изображения G определяется числом коэффициентов, попадающих в эту зону. Кроме того, перестановка определяет вид усеченной матрицы восстановления исходных данных, что в целом также повышает эффективность обработки изображения объекта интереса.

1.1. Описание контура

Процесс описания объекта включает в себя три этапа.

1. Упорядочение контура набором сегментов. Изображение контура представляется дискретной последовательностью р(х, у) двух действительных пространственных переменных х и у. Эти переменные задают положения точек (пикселей) изображения в прямоугольной декартовой системе координат. Будем считать, что значения р (х, у) = ((х1, уД( х2, у2),...,( хР, уР)) определяют энергетические характеристики изображения, состоящего из совокупности Р пикселей. Они упорядочены так, что координаты (х,,Уj) и (хг+1,Уj+\) являются ближайшими соседями вдоль линии контура. Цифровое изображение контура, состоящее из Р пикселей, можно представить матрицей Р размерностью В х С , отображающей только линию контура. В практических случаях величина (В х С) = (М х И) . Очевидно, упорядочение пикселей в виде матрицы Р без совокупности пикселей, составляющих все изображение G , приведет к уменьшению вычислительной сложности описания. Кроме того, обработка значительно меньшего массива данных позволяет снизить вычислительные затраты на этапе вычисления собственных векторов и собственных чисел. Каждому значению

последовательности р(х, у) соответствует двумерный вектор р^ = (хг, у^) е Ъ+. Таким

образом, матрица Р будет состоять из 2Р элементов. Значение размерности матрицы Р выбирается исходя из требования понижения размера входа процессора или уменьшения вычислительной сложности обработки.

2. Преобразование. Используем одномерное прямое преобразование матрицы

т

Р = (р1, р2), т. е. преобразование каждого столбца рг = (рг1,..., Ру,..., ргВ) , г = 1,2.

Л Л Л Л т

Коэффициенты преобразования р1 = (рг1,...,Ру,...,ргВ) для г = 1,2 в базисе разложения по собственным векторам ковариационной матрицы определяются как

Р = АТ Р, (3)

где А - матрица собственных векторов размерностью В х В. С точки зрения более эффективного практического аппаратно-программного выполнения процедуры сжатия коррелированных данных вычисление (3) представим в другой форме. Сформируем матрицу

(Р - Р) такую, что Е( Р - Р) = 0, где Е - оператор математического ожидания,

_________ т

Р = (р1, Р2), Рг = (рг1, -, ру ,•••, ргв) , г = 1,2 - средний вектор матрицы, р1 = р2 = р. Используя свойство линейности преобразования (3), можно записать выражение для перевода множества {рг - рг}, г = 1,2 в некоррелированное множество {рг}, г = 1,2 коэффициентов. Требуемая матрица коэффициентов преобразования равна

Р" = АТ (Р - Р), (4)

где Р" = (р" р2), р" = (р"1,..., р",..., р"в )т, г = 1,2.

Выражение для восстановления исходных величин можно получить, пользуясь соотношением (4). Умножая это равенство на матрицу А АР" = ААТ (Р — Р), получаем

Р = АР" + Р. (5)

3. Фильтрация. Для предварительной оценки эффективности сжатия вычисляется распределение величин дисперсий diag [eig(cov(Р))] в области исходных коррелированных данных:

2

diag [а ] = Л = diag [eig(cov(P))] =

хв )

(6)

Так как diag [а2] = diag [б2] [2], значения ,I = 1,...,Б матрицы (6) позволяют

определить зону фильтрации коэффициентов Р" Для сжатия входных данных матрица Р" представляется уменьшенным количеством Di,I = 1,2 координат векторов. Отфильтрованные (Б—Di), i = 1,2 координаты заменяются средними значениями координат вектора

________т

Pi = (Рл,-.,Ру,. .,Р1 (Б—й)) ,i = 1,2. Ошибка восстановления, возникающая при отбрасывании

(Б—Di), i = 1,2 координат, определяется как VP = Р — Р' где Р - матрица восстановленных данных. Среднеквадратическая ошибка задается выражением

8 = £{|| VIII2}. (7)

Эффективность описания объекта наблюдения можно оценить по формуле

К = У—. (8)

£ Б

1.2. Эффективность описания объекта

Пример 1. Упорядочение. На рис. 1 показано 50-точечное изображение контура объекта в виде двух внешних сегментов (по сути - одной формы). Начальная и конечная точки р(х^, уу)

верхнего сегмента имеют соответственно координаты (х,. у7 ) и (х21 .>'7).

х

О 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

0 1 2

3

4

5

6

У 7 8

9

10 11 12

13

14

Цифровые представления сегмента в виде векторов матрицы Р = (р1, р2) и среднего вектора р показаны как

р = (1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 17,3 17,5 17,7 17,9 18 19 19,5 20 21)Т, р2 = (7 6 5,7 5,5 5,3 5,1 5 5 5 5 4,8 4 3 2 1,5 1 1 1 2 3 4 5 5 6 7 7)Т. р = (4 4 4,35 4,75 5,15 6 6,5 7 7,5 7,9 8 8 8 8,25 8,5 9 9,15 9,75 10,35 10,95 11,5 12 12,75 13,5 14)Т

Преобразование. Фильтрация. Для предварительной оценки эффективности сжатия изображения Р сегмента рассчитано распределение дисперсий (6) Л = diag [eig(cov(P))] пространственного положения 26 точек. Собственные значения Л ковариационной матрицы со^Р) в области исходных данных совпадают с собственными значениями Л р

ковариационной матрицы Р) в области преобразований Лр = АТ [соу(Р)]А = Л.

Поэтому достаточно вычисления значения Л . На рис. 1 показан график распределения дисперсий Х коэффициентов преобразования ру, I = 1,2, у = 1,...,26.

Из графика видно, что имеется одно доминирующее собственное значения Х26. Матрица дисперсий Л имеет вид

(

\

Р5ис. 1. Изображение объекта

Г 0

л =

1,4768

1.5

ё 0.5

о К

ч:

ооооооооооооооооооооеоооой

10

15

20

25

30

Номер коэффициента преобразования

Рис. 1. Распределение дисперсий коэффициентов р>1

Вся энергия сигнала в области преобразований сосредоточена в двух коэффициентах р26,1 и р26,2 матрицы р (4):

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Г 0 0 А

Р" = : :

у 27,1736 -27,1736у

Изображение сегмента представляется двумя сохраняемыми дескрипторами р", I = 1,2.

Матрица А размером В х В = 26 х 26, используемая для выполнения обратного преобразования (5), трансформируется в матрицу (вектор-столбец) размером 26 х1. При этом реализуется точное восстановление исходных данных. Среднеквадратическая ошибка (7)

8 = £{|| VPII2} = 0.

Эффективность кодирования (8) одного сегмента составляет значительную величину

=

В - D 26 - 2

= 0,923.

В 26

Таким образом, на описание изображения сегмента требуется массив данных, в 13 раз меньший исходного. Так как изображения сегментов, из которых состоит объект, идентичны, то эффективность полного описания объекта сохраняется.

Выводы

1. Вместо передачи всех данных, описывающих контур, достаточно передавать только коэффициенты в области преобразований, характеризующиеся максимальными дисперсиями.

2. Для компактного описания контура достаточно сохранять только коэффициенты с максимальными дисперсиями, вектор математического ожидания и усеченное ядро преобразования.

3. Применение дисперсионного критерия при описании контура объекта наблюдения позволяет осуществлять сжатие данных без потерь.

4. Предварительное вычисление функции распределения дисперсии позволяет ускорить процесс передачи, обработки и анализа изображения, дешифрацию его основных характеристик и информационных признаков.

5. Упрощается решение задач, связанных с обнаружением или поиском определенных объектов на изображениях.

6. В настоящее время рассмотренный метод можно считать практической вычислительной процедурой.

Список литературы

1. Mitsiukhin A.I. Efficient description of the boundary of the object under observation // Proceedings of 59th IWK, Ilmenau Scientific Colloquium, Technische Universität Ilmenau, Band 59, 2017, Heft 2.2.02, 6 Seiten.

2. Митюхин А.И. Цифровая обработка речи и анализ изображений. Минск: БГУИР, 2016. 72 c.

3. Стренг Г. Линейная алгебра и ее применения. М.,1980. 456 c.

4. Gonzalez R.C., Woods R.C. Digital Image Processing. Prentice Hall, New Jersey, 2002. 976 p.

References

1. Mitsiukhin A.I. Efficient description of the boundary of the object under observation // Proceedings of 59th IWK, Ilmenau Scientific Colloquium, Technische Universität Ilmenau, Band 59, 2017, Heft 2.2.02, 6 Seiten.

2. Mitjuhin A.I. Cifrovaja obrabotka rechi i analiz izobrazhenij. Minsk: BGUIR, 2016. 72 s. (in Russ.)

3. Streng G. Linejnaja algebra i ee primenenija. M.,1980. 456 s. (in Russ.)

4. Gonzalez R.C., Woods R.C. Digital Image Processing. Prentice Hall, New Jersey, 2002. 976 p.

Сведения об авторах

Митюхин А.И, доцент, доцент Института информационных технологий Белорусского государственного университета информатики и радиоэлектроники.

Астровский И.И, к.т.н., доцент, доцент кафедры инфокоммуникационных технологий Белорусского государственного университета информатики и радиоэлектроники.

Адрес для корреспонденции

220037, Республика Беларусь,

г. Минск, ул. Козлова, 28,

Институт информационных технологий

Белорусского государственного университета

информатики и радиоэлектроники

тел. +375-29-111-20-57;

e-mail: [email protected]

Митюхин Анатолий Иванович

Information about the authors

Mitsiukhin A.I., associate professor, associate professor of Institute of information technologies of Belarusian state university of informatics and radioelectronics.

Astrovski I.I., PhD, associate professor, associate professor of the department of infocommunication technologies of Belarusian state university of informatics and radioelectronics.

Address for correspondence

220037, Republic of Belarus, Minsk, Kozlova str., 28, Institute of information technologies of Belarusian state university of informatics and radioelectronics tel. +375-29-111-20-57; e-mail: [email protected] Mitsiukhin Anatoliy Ivanovich

i Надоели баннеры? Вы всегда можете отключить рекламу.