Научная статья на тему 'Об оценке локальной энтропии изображения в скользящем окне'

Об оценке локальной энтропии изображения в скользящем окне Текст научной статьи по специальности «Математика»

CC BY
5
2
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Компьютерная оптика
Scopus
ВАК
RSCI
ESCI
Область наук
Ключевые слова
обработка изображений / формирование локальных признаков / скользящее окно / локальная гистограмма / оценка энтропии / разложение по базису / рекурсивная обработка / иерархическая аппроксимация / погрешность оценки / вычислительная сложность / image processing / local feature generation / sliding window / local histogram / entropy estimation / basis function decomposition / recursive processing / hierarchical approximation / estimation error / computational complexity

Аннотация научной статьи по математике, автор научной работы — Сергеев Владислав Викторович, Баврина Алина Юрьевна, Зайцев Илья Дмитриевич, Лазутов Марк Юрьевич, Шапиро Давид Александрович

В статье рассмотрен ряд вопросов, связанных с вычислением локальной энтропии в скользящем окне обработки изображения. Предложен новый алгоритм оценки энтропии, обладающий в несколько раз меньшей вычислительной сложностью по сравнению с известными. Алгоритм основан на приближенном представлении гистограммы в виде усеченного разложения в ряд по некоторой системе ортогональных базисных функций, рекурсивного вычисления коэффициентов этого разложения в скользящем окне и последующего пересчета коэффициентов в оценку энтропии. Рассмотрены вопросы выбора ортогонального базиса для представления локальной гистограммы в виде усеченного ряда, показана целесообразность использования базиса Хаара. Описана методика построения иерархического аппроксиматора, осуществляющего быстрый пересчет коэффициентов разложения гистограммы в значение энтропии. Теоретические положения статьи верифицированы экспериментами на изображениях дистанционного зондирования Земли.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Сергеев Владислав Викторович, Баврина Алина Юрьевна, Зайцев Илья Дмитриевич, Лазутов Марк Юрьевич, Шапиро Давид Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On estimating the local entropy of an image in a sliding window

The paper considers a number of issues related to the calculation of the local entropy in a sliding window for image processing tasks. A new algorithm for entropy estimation is proposed, which has several times lower computational complexity than the known ones. The algorithm is based on the approximate representation of the histogram in the form of a truncated series expansion over some system of orthogonal basis functions, recursive calculation of the coefficients of this expansion in a sliding window and subsequent recalculation of the coefficients into the entropy estimate. Questions of an orthogonal basis selection for representing the local histogram as a truncated series are considered and the appropriateness of using the Haar basis is shown. A technique of constructing hierarchical approximator, which realizes fast recalculation of histogram decomposition coefficients into entropy value, is described. The theoretical statements of the paper are verified by experiments on the Earth remote sensing images.

Текст научной работы на тему «Об оценке локальной энтропии изображения в скользящем окне»

Об оценке локальной энтропии изображения в скользящем окне

В.В. Сергеев12, А.Ю. Баврина13, И.Д. Зайцев1, М.Ю. Лазутов1, Д.А. Шапиро1 1 Самарский национальный исследовательский университет имени академика С.П. Королёва, 443086, Россия, г. Самара, Московское шоссе, д. 34;

2Институт систем обработки изображений, НИЦ «Курчатовский институт», 443001, Россия, г. Самара, ул. Молодогвардейская, д. 151;

3АО «Самара-Информспутник», 443080, Россия, г. Самара, пр-т Карла Маркса, д. 192, оф. 717

Аннотация

В статье рассмотрен ряд вопросов, связанных с вычислением локальной энтропии в скользящем окне обработки изображения. Предложен новый алгоритм оценки энтропии, обладающий в несколько раз меньшей вычислительной сложностью по сравнению с известными. Алгоритм основан на приближенном представлении гистограммы в виде усеченного разложения в ряд по некоторой системе ортогональных базисных функций, рекурсивного вычисления коэффициентов этого разложения в скользящем окне и последующего пересчета коэффициентов в оценку энтропии. Рассмотрены вопросы выбора ортогонального базиса для представления локальной гистограммы в виде усеченного ряда, показана целесообразность использования базиса Хаара. Описана методика построения иерархического ап-проксиматора, осуществляющего быстрый пересчет коэффициентов разложения гистограммы в значение энтропии. Теоретические положения статьи верифицированы экспериментами на изображениях дистанционного зондирования Земли.

Ключевые слова: обработка изображений, формирование локальных признаков, скользящее окно, локальная гистограмма, оценка энтропии, разложение по базису, рекурсивная обработка, иерархическая аппроксимация, погрешность оценки, вычислительная сложность.

Цитирование: Сергеев, В.В. Об оценке локальной энтропии изображения в скользящем окне / В.В. Сергеев, А.Ю. Баврина, И. Д. Зайцев, М.Ю. Лазутов, Д.А. Шапиро // Компьютерная оптика. -2024. - Т. 48, № 5. - С. 714-725. - DOI: I0.18287/2412-6179-C0-I509.

Citation: Sergeyev VV, Bavrina AY, Zaitsev ID, Lazutov MY, Shapiro DA. On estimating the local entropy of an image in a sliding window. Computer Optics 2024; 48(5): 714-725. DOI: 10.18287/2412-6179-C0-1509.

Введение

В практике компьютерной обработки изображений широкое распространение получили операции поэлементной обработки - от простой пороговой обработки, контрастирования или препарирования [1 -4] до тематической классификации пикселов [5, 6]. В последнем случае, как правило, обрабатываются многокомпонентные (цветные, многоспектральные) изображения, каждый пиксел которых интерпретируется как вектор признаков, поступающий в процедуру классификации и в итоге преобразующийся в номер класса, к которому он относится.

Поскольку отдельные пикселы не могут описывать пространственные связи на изображении, результаты поэлементной классификации, как правило, содержат много ошибок. Для повышения качества классификации принято дополнять изображения синтетическими компонентами - полями различных признаков, учитывающих статистические и/или структурные особенности изображения в окрестности обрабатываемого пиксела [1, 5, 6]. Технология классификации при этом остается поэлементной, однако теперь работает с расширенным вектором характеристик, описывающих пиксел.

Каждое поле признаков имеет те же размеры (в пикселах), что и исходное изображение. Обычно оно формируется в результате локальной обработки одной из компонент изображения по известной схеме «скользящего окна» [1, 3].

Среди разнообразных локальных признаков изображений можно выделить класс гистограм-мных признаков, основанных на вычислении и использовании эмпирической оценки распределения вероятности (гистограммы) значений пикселов в окне обработки [1, 2, 4, 5]. Подмножество этого класса составляют признаки, вычисляемые по одномерной гистограмме, среди которых важное место занимает локальная энтропия изображения [2, 7, 8] - признак, являющийся предметом рассмотрения настоящей статьи.

Основная проблема, возникающая при формировании гистограммных признаков как синтетических компонент изображения, состоит в высокой вычислительной сложности соответствующих процедур. Действительно, для каждого положения локального окна необходимо построить гистограмму значений яркости в этом окне, а затем по гистограмме вычислить агрегирующую, зачастую нелинейную, характеристику (в нашем случае - энтропию).

Прямое построение гистограммы имеет сложность, пропорциональную площади (числу пикселов) окна, что неприемлемо при работе с окнами достаточно больших размеров. Использование рекурсивных методов пересчета гистограммы при скольжении двумерного прямоугольного окна вдоль одной из пространственных координат изображения [1, 7, 9, 10] позволяет снизить вычислительные затраты до уровня, пропорционального стороне окна, но все равно такого ускорения может оказаться недостаточно для практики. Более перспективным с точки зрения экономии вычислений представляется подход, согласно которому гистограмма заранее представляется в сглаженной форме, в виде суммы нескольких слагаемых - усеченного разложения в ряд по какой-либо системе базисных функций, при этом задача построения гистограммы заменяется на задачу нахождения небольшого числа ненулевых коэффициентов этого разложения [1, 11, 12]. Именно такой подход мы развиваем в настоящей статье.

После того как гистограмма тем или иным способом получена, необходимо выполнить еще одну операцию - преобразовать ее в оценку энтропии. Данное преобразование также вычислительно весьма затратно: даже если заранее протабулировать значения логарифма, входящего в формулу энтропии (см. ниже), неизбежным представляется суммирование большого (равного числу ячеек гистограммы) слагаемых в этой формуле. В работе [8] предпринята попытка заменить вычисление локальной энтропии на ее оценку нейросетью, настраиваемой с помощью машинного обучения. Но, на наш взгляд, достигаемое при этом ускорение оказывается незначительным, а сама процедура - недостаточно универсальной: нейросеть приходится заново настраивать для каждого размера окна и для каждого обучающего набора изображений.

Исходя из сказанного выше, можно заключить, что задача быстрой оценки локальной энтропии изображения в скользящем окне не утратила своей актуальности. В нашей статье мы предлагаем один из вариантов ее эффективного решения.

Потенциал снижения вычислительной сложности алгоритма, решающего поставленную задачу, состоит в переходе от точного вычисления энтропии к ее приближенной оценке. Поэтому разработку нового алгоритма, выбор его параметров нельзя осуществлять в отрыве от анализа погрешности такой оценки, которая, безусловно, должна лежать в некоторых приемлемых пределах. Анализ точности формируемой оценки энтропии, выработка рекомендаций по рациональному распределению допустимой погрешности по этапам осуществляемых преобразований также является предметом рассмотрения в данной статье.

1. Задача вычисления энтропии изображения

Введем основные обозначения и термины, необходимые для дальнейшего изложения, сформулируем

принятые ограничения и поставим задачу вычисления поля локальной энтропии изображения.

Пусть {х(щ, п2)} - матрица пикселов однокомпо-нентного (полутонового) изображения, щ, п2 - их целочисленные индексы. И пусть значения пикселов -целые числа, лежащие в интервале [0, Ь - 1]. В практике обработки изображений чаще всего пикселы представляются в байтовом формате (Ь = 256).

Считаем пикселы изображения случайными величинами, которые принимают значения в соответствии с некоторым распределением вероятностей Р (х), обладающим очевидными свойствами [13]:

Ь-1

Р(х) > 0 при 0 < х < Ь -1, X Р(х) = 1 (1)

х=0

(здесь и ниже индексы можно опустить). Как известно, энтропия (Шеннона) такого распределения вычисляется по формуле [14]:

Н = -Х Р( х)1см2 Р( х). (2)

х=0

Экспериментальная оценка распределения вероятности случайной величины осуществляется через гистограмму [13]. В нашем случае случайная величина х - целочисленная, поэтому достаточно просто подсчитать, сколько раз она принимает каждое значение:

Р(х) Ж(х), 0 < х < ь -1, (3)

где N (х) - число пикселов, равных х, в области Б, в котором анализируется изображение, ||Б|| - размер этой области в пикселах. Знак приближенного равенства в соотношении (3) обусловлен тем, что область Б на практике всегда ограничена, поэтому, строго говоря, называть вероятностью получаемый результат нельзя, это всего лишь относительная частота реализации значений случайной величины в конкретном эксперименте. Иногда на практике удобнее использовать не относительную частоту, а непосредственно массив целочисленных значений N(х), обычно он называется ненормированной гистограммой.

Область Б может соответствовать всему анализируемому изображению, тогда оценка (3) будет характеризовать изображение в целом, являться глобальной гистограммой. Или она может соответствовать некоторому относительно небольшому окну обработки, тогда и область, и гистограмму принято называть локальными. Мы рассматриваем именно второй случай.

Итак, «базовый» вариант решения поставленной задачи, с которым мы будем сравнивать наш алгоритм, выглядит следующим образом. По изображению «скользит» окно обработки определенного (назначаемого нами как параметр) размера. Каждое положение окна задает область Б, в пределах которой по формуле (3) вычисляется локальная гистограмма, а затем по формуле (2) рассчитывается энтропия, зна-

чение которой относится к центру окна. В результате мы получаем искомую синтетическую компоненту изображения - двумерное поле локальной энтропии Н (щ, п2). Иллюстрацией к сказанному служит рис. 1.

Ф„Пг)

Скользящее окно обработки

X

Построение Вычисление \

гистограммы энтропии

Рис. 1. Базовый алгоритм вычисления поля локальной энтропии

В рамках данной статьи будем считать размеры изображения достаточно большими, чтобы не рассматривать особенности описанной вычислительной процедуры в ситуации, когда скользящее окно, как правило, имеющее относительно малый размер, одной из своих сторон выходит за край изображения. Для обхода указанной коллизии существуют простые стандартные решения [3].

2. Предлагаемый алгоритм вычисления локальной энтропии изображения

Известно, что распределение вероятностей Р (х) может быть представлено (и оценено эмпирически) в виде разложения по некоторой системе базисных функций [11]. В нашем случае для такого представления можно использовать одну из известных систем ортогональных базисных функций дискретного аргумента [3, 15 - 17], заданных на конечном интервале определения функции Р (х).

Очевидно, полное описание распределения Р (х), соответствующего условиям (1), обеспечивают Ь базисных функций: {/к (х)}^ . Коэффициенты разложения по ним задаются выражением:

Е = Х Л (х)Р(х), 0 < к < Ь -1.

(4)

Поскольку базис ортогонален, исходная функция Р (х) может быть однозначно восстановлена непосредственно по коэффициентам разложения:

Р( х) = Q X Рк/к (х),

(5)

где 0> - некоторый коэффициент, зависящий от конкретного базиса. Но мы, преследуя цель экономии вычислений, усечем ряд (5) и будем аппроксимировать Р (х) суммой небольшого числа базисных функций:

р( х) * е X ъл (х),

(6)

где К << Ь - число используемых коэффициентов разложения. После представления плотности распределения вероятностей в виде (6) открывается возможность вычисления энтропии не как функции Ь значений гистограммы (см. формулу (2)), а как функции К коэффициентов ее разложения:

Н = Н (Е0, Ек-,).

(7)

Такое вычисление даст заведомо приближенный результат оценки энтропии: погрешность возникает из-за усечения ряда при переходе от (5) к (6). Поэтому мы можем допустить и некоторую дополнительную погрешность, не вычисляя сложную многомерную функцию (7) точно, а используя какую-либо ее простую аппроксимацию.

Отметим, что преобразования, описываемые соотношениями (4) - (7), должны выполняться для каждого положения окна обработки изображения. Также отметим, что формула (4), корректная математически, непригодна для практического применения. Мы располагаем не самой функцией Р (х), а лишь ее эмпирической оценкой (3), получаемой по окну обработки, поэтому на практике следует использовать альтернативную формулу:

Е(«1,«2) = Б X /к[х(пг -ти« -т2)],

||Б|| (тьт2)еВ (8)

0 < к < К -1,

в которой дополнительно учтен скользящий характер окна и восстановлены индексы, задающие пространственное положение пикселов на входе и выходе осуществляемого преобразования. Здесь ть т2 - локальные индексы, задающие смещение входных пикселов относительно центра окна. В формуле (8), в отличие от (4), отсутствует функция распределения вероятностей, она учитывается здесь неявно, через частоту встречаемости конкретного значения пиксела в окне обработки.

Анализируя структуру формулы (8), легко заметить, что каждое слагаемое в ней - результат простого в реализации поэлементного преобразования изображения:

Ук («1, «2) = /к [ х(«ь «2)],

(9)

а сама сумма, с учетом коэффициента перед ней, задает усреднение преобразованных пикселов по окну обработки Б.

Таким образом, мы получаем быстрый алгоритм приближенного вычисления локальной энтропии изображения, который можно проиллюстрировать рис. 2.

Важно отметить, что режим скользящего окна позволяет выполнить суммирование пикселов в окне рекурсивно, с минимальными вычислительными затратами [3]. Пусть скользящее окно обработки в формуле (8) имеет прямоугольную форму, симметричную относительно своего центра:

х=0

к=0

к=0

Б: к < (М\ -1)/2, \т2\< (М2 -1)/2,

(10)

где М1, М2 - размеры (в пикселах) окна обработки по вертикали и горизонтали. Тогда в каждой ветке алгоритма сумма пикселов Sk (п\, п2) вычисляется каскад-но (последовательно), например, сначала рекурсивным преобразованием двумерного поля пикселов по вертикали (переменной п\), а затем - по горизонтали (переменной п2):

wk (П\, П2) = wk (П\ -1, П2) + Ук (П\ + М 1, П2) -

( М\ +1 ) -Ук (п\---—, П2),

Si (п\, П2) = Sk (п\, П2 -1) + wk (п\, П2 + М2 +1

М2 -1

(11)

) -

- Wk (п\, П2 --

где wk (п\, П2) - промежуточный результат преобразования. Далее переход от суммирования к усреднению пикселов осуществляется очевидным образом:

Рк (П\,П2) =

1

М\М;

^к (П\, П2).

(12)

Построение аппроксиматора - блока быстрого получения приближенных значений функции многих

переменных (7), используемого на последнем шаге алгоритма, будет описано в параграфе 6.

Ф1.П2) \

1

Поэлементное преобразование Поэлементное преобразование Поэлементное преобразование

Ук-1(П1-П2>.

Усреднение Усреднение Усреднение

Ро(»1:"2). Р(п„гь) Рк-1(П1,"2>

Апттроксиматор

Щщ.п^

Рис. 2. Алгоритм приближенного вычисления локальной энтропии изображения

3. Тестовые изображения

Для проведения вычислительных экспериментов в качестве тестовых изображений были выбраны три снимка дистанционного зондирования Земли с космических аппаратов РшскБМ и 8еШте1-2, соответствующие разным типам подстилающей поверхности (см. рис. 3). Каждый снимок представляет собой полутоновое изображение в байтовом формате (Ь = 256) размером 1024*1024 пикселов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 3. Тестовые изображения. (а) QB, (б) S1, (в) S2

Для этих изображений в режиме скользящего окна размером 25*25 пикселов построены локальные ги- ^ N (х) =| |б|| .

стограммы. Общий объем полученной коллекции гистограмм составил примерно 3 000 000 экземпляров -полагаем, этого достаточно для обоснования качественных выводов проводимого анализа.

4. О точности оценки энтропии в скользящем окне

Прежде чем перейти к экспериментам и выбору параметров предлагаемого алгоритма, нужно ответить на вопрос, насколько точно локальная гистограмма описывает истинное распределение вероятностей пикселов.

Распределение Р (х) является для нас гипотетическим, ненаблюдаемым, его экспериментальное измерение (оценка) осуществляется в соответствии с формулой (3), т.е. подсчетом целочисленных значений N (х) ненормированной гистограммы по выборке из ||Б|| наблюдаемых случайных величин,

(13)

Ниже для краткости выкладок временно опустим аргумент х.

Величина N - случайное число. Если проигнорировать вытекающий из (13) факт его ограниченности сверху, что вполне допустимо при больших ||Б|| и отсутствии аномально больших отдельных вероятностей в распределении (1), оно имеет распределение Пуассона [13], плотность которого в наших обозначениях задается соотношением:

(N) = е-БИР

N!

N > 0.

(14)

Как известно, это случайное число имеет одинаковые математическое ожидание и дисперсию:

Мы = Бм =| |Б||Р. (15)

Абсолютная среднеквадратическая погрешность оценивания Р равна

е р =

1

Бм =

1т,

(16)

СТр =-=

Р

(17)

В табл. 1 приведены примеры значений стр (в процентах) для некоторых типичных размеров двумерного окна обработки.

а относительная среднеквадратическая погрешность Р -

Табл. 1. Относительная погрешность оценивания вероятности (в процентах)

Объем выборки Б Оцениваемая вероятность Р

0,001 0,002 0,005 0,01 0,02 0,05 0,1 0,2 0,5

81 (9x9) 351 248 157 111 79 50 35 25 16

225 (15x15) 211 149 94 67 47 30 32 15 9

625 (25x25) 126 89 57 40 28 18 13 9 6

1225 (35x35) 90 64 40 29 20 13 9 6 4

В таблице жирным шрифтом выделены относительные погрешности больше 50 %, курсивом -больше 20 %. Видно, что при небольшом объеме выборки, характерном для скользящего окна, гистограмма описывает истинное распределение вероятностей с очень большой погрешностью, которая может оказаться неприемлема для практики. Однако в рамках данного исследования нас интересует не точность представления гистограммы, а точность оценки энтропии. Определим и ее. Рассмотрим любое слагаемое в формуле (2):

N ||б|| h = -Р 1о§2 Р * Б = Н(N).

(18)

Формула (18) задает нелинейное преобразование случайной величины N в случайную величину Н. Её математическое ожидание и дисперсия [13] выражается формулами (19) и (20). А если вернуть аргумент х в обозначения исходного распределения вероятностей и связанных с ним величин, то (19) и (20) перепишется в виде (21) и (22).

» е-1 Б1Р » .. .. (IБ||Р)"

Мк = X К ^^ (N) = „X (1о§2 II Б|| - 1од2 N ,

N=0 ||Б|| N=1 (^ 1)!

» е-||бр ™ (Iб|1р)"

Бк = X(N)-М2 = —— XN(1оё^|Б||- 1о§2N)2 ( '' ' -Ы1.

N=0 Б N=1 (" 1)!

е-И|рм » (Iб||р(х))"

М (=1БГ X Б " '^йуп

е-№« » .. .. Л||Б||Р(х))" 2

б (х)=ТБГ X 'М (^ Б - N)(N -в! - м (х).

И далее просуммируем все функционально преобразованные случайные величины в соответствии с формулой (2). Нет оснований считать случайные величины h статистически зависимыми при разных х. Поэтому в силу центральной предельной теоремы теории вероятностей [13] результат суммирования будет иметь распределение, близкое к нормальному, которое с достаточной полнотой описывается своими математическим ожиданием и дисперсией:

Мн =X Мн (х),

х=0

Бн Бн (х).

(23)

(24)

От дисперсии (24) можно перейти к среднеквадратичной погрешности этой оценки, как абсолютной:

= л/ Бн

(25)

так и относительной:

Н

(19)

(20) (21) (22)

(26)

Расчеты по формулам (21) - (24) могут быть выполнены только для конкретного распределения вероятностей Р (х). Важно заметить, что энтропия инвариантна к порядку расположения отдельных элементов дискретного распределения вероятности, на нее влияет лишь степень неравномерности значений этих элементов, которые можно расположить в порядке убывания. Поэтому для численных экспериментов было выбрано усеченное экспоненциальное распределение целочисленной случайной величины:

Р(х) = ———ах, 0 < х < Ь-1, 1- аЬ

(27)

где а - единственный параметр распределения, который регулирует его неравномерность (0 < а <1). Обос-

1

н

х=0

нованием такого выбора является достаточная близость к распределению (27) усредненных и переупорядоченных гистограмм многих реальных изображений (см. рис. 4).

Р(х)х10"

125 -100 -75 -50 -25 -О -

1-1-1-

О 100 200 *

Рис. 4. Сравнение переупорядоченной усредненной гистограммы тестового изображения QB (рис. 3а) с усеченным экспоненциальным распределением (пунктир), Ь = 256

Неравномерность распределения (27) также можно задать через отношение между максимальным и минимальным значением вероятности, соответственно, на левом и правом краю области определения:

Ртп Р(Ь - 1)

Р .

Р(0)

■ = а

(28)

В табл. 2 приведены показатели точности оценивания энтропии (23) - (26) в зависимости от показателя неравномерности усеченного экспоненциального распределения (28) для различных размеров скользящего окна. Из таблицы видно, что, во-первых, оценка энтропии является смещенной в меньшую сторону, причем смещение особенно велико для малых окон, которые чаще всего используются на практике. Впрочем, систематическая погрешность (смещение) может и не влиять на результат обработки изображения, т. к. ее легко учесть при настройке (обучении) процедуры поэлементной классификации (см. Введение).

Более серьезную проблему представляет случайная погрешность оценки энтропии, которая также велика для окон малого размера. Интересно заметить, что дисперсия (и среднеквадратичная погрешность) оценки слабо зависит от степени неравномерности распределения вероятностей значений пикселов, а относительная среднеквадратичная погрешность (26) вообще остается практически постоянной.

Для байтовых пикселов, для которых максимально возможное значение энтропии равно 8, абсолютная среднеквадратичная погрешность оценки энтропии для окна 15*15 лежит в диапазоне 0,35 - 0,45, а для окна 25*25 - в диапазоне 0,2 ^ 0,25.

5. Выбор базиса для приближённого представления гистограммы

Поиск системы базисных функций для разложения (5) и его усеченного варианта (6), оптимальной для

решения задачи оценки энтропии, является предметом отдельного исследования и лежит за рамками настоящей статьи. Для демонстрации работоспособности и эффективности предлагаемого алгоритма мы ограничимся рассмотрением трех известных систем функций дискретного аргумента, ортогональных на интервале [0, Ь - 1]:

- дискретного преобразования Фурье [1, 3 - 5, 15, 16] в вещественной форме (синусная и косинусная компоненты каждой гармоники считаются двумя функциями разложения);

- дискретного косинусного преобразования (ДКП-2) [15];

- дискретного преобразования Хаара [1, 4, 16].

Табл. 2. Показатели точности оценивания энтропии в скользящем окне

Рт1п / Ртах \ 0,\ 0,0\ \\0 -3 \\0 -4

а \,0 0,99\0 0,982 \ 0,9733 0,9645

Н 8,0 7,7\6 7,\53 6,637 6,233

Мн 6,043 5,939 5,7\9 5,492 5,288

сл x Вн 0,4\58 0,39\7 0,3448 0,30\8 0,2676

вн 0,6448 0,6258 0,5872 0,5494 0,5\73

СТн 0,0806 0,08 \\ 0,082 \ 0,0828 0,0830

Мн 7,07 \ 6,866 6,468 6,\0\ 5,798

x Вн 0,\877 0,\7\7 0,\439 0,\2\6 0,\055

1г1 ВН 0,4332 0,4\44 0,3793 0,3487 0,3248

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

а о »о стн 0,054\ 0,0537 0,0530 0,0525 0,052 \

- в Мн 7,670 7,389 6,864 6,404 6,044

'А - <-n1 x Вн 0,0703 0,0648 0,0542 0,0455 0,0392

о ^ Вн 0,265 \ 0,2545 0,2328 0,2 \ 32 0,\98\

СТн 0,033 \ 0,0330 0,0325 0,032 \ 0,03\8

Мн 7,842 7,554 6,997 6,506 6,\26

x Вн 0,0354 0,0330 0,0279 0,0234 0,0202

1г1 Вн 0,\882 0,\8\7 0,\67\ 0,\53\ 0,\422

СТн 0,0235 0,0235 0,0234 0,023 \ 0,0228

Для выбора наилучшего базиса из перечисленных был проведен следующий вычислительный эксперимент. Для каждой локальной гистограммы, взятой из заранее сформированной коллекции (см. параграф 3) и рассматриваемой в качестве оценки распределения вероятностей Р (х), вычислялся ее спектр, т.е. все 256 коэффициентов ее разложения в заданной системе базисных функций (см. формулу (4)). Далее спектр усекался, т.е. в нем оставлялось только К младших коэффициентов разложения, остальные обнулялись. После чего по формуле (6) выполнялся обратный переход к теперь уже приближенной гистограмме.

На рис. 5 на примере конкретной локальной гистограммы показано, как выглядят ее приближения, полученные с помощью усеченного спектра в трех рассматриваемых системах базисных функций.

Р(х)х10

"1-Г

О 100 200

Рис. 5. Приближённое представление гистограммы с помощью усечённого спектра различных базисов: Фурье, косинус, Хаар (К = 8)

Функция, полученная в результате описанной процедуры, аппроксимирует гистограмму, но, строго говоря, таковой не является. Чтобы ее считать гистограммой, необходимо осуществить нормировку, обеспечивающую выполнение условия (1). Как видно из рис. 5, эта функция иногда может принимать отрицательные значения, которые перед нормировкой следует отсечь (приравнять нулю). Далее по формуле (2) находились значения энтропии для точной локальной гистограммы и ее аппроксимации, соответственно, Н и Ну, вычислялась их разность - погрешность оценивания энтропии за счет усечения спектра гистограммы:

Д у = Ну - Н.

(29)

Затем по множеству локальных гистограмм, полученных для конкретного тестового изображения, находились статистические характеристики этой погрешности: среднее значение Му и среднеквадратичное отклонение еу. На рис. 6 и рис. 7 представлены их значения в зависимости от К - числа используемых коэффициентов разложения гистограммы.

2,0-

- — Хаар 2,5-

- Косинус

1,5- ---- Фурье 2,0-

Л

\\ 1,5-

1,0- \\

\\

1,0-

0,5-

\ * > II н и | 0,5-

По этим рисункам видно, что погрешность оценивания энтропии по аппроксимациям гистограммы быстро убывает с увеличением используемых коэффициентов разложения. Среднеквадратичное отклонение этой погрешности оказалось минимальным для базиса Хаара. Его, очевидно, и следует использовать в предлагаемом алгоритме.

Необходимо отметить специфику базиса Хаара: иерархический характер его локальных базисных функций. Поскольку неизвестно, в какой части диапазона своих аргументов будет располагаться конкретная гистограмма, при ее аппроксимации целесообразно полностью исчерпывать определенный иерархический уровень базисных функций, т. е. выбирать число используемых коэффициентов разложения равным целой степени двойки: К = 4, 8, 16...

Как видно из рис. 7, при К = 8 среднеквадратичная погрешности оценки энтропии, возникающая за счет усечения спектра в базисе Хаара, лежит в диапазоне 0,25 - 0,45, то есть становится сопоставимой со среднеквадратичной погрешностью оценки энтропии из-за ограниченного числа пикселов в окне (см. параграф 4). Такое значение К мы и будем использовать далее.

Заметим, что все три рассмотренные системы ортогональных функций, включая систему Хаара, в качестве младшей функции /о (х) используют константу. Значение соответствующего ей коэффициента разложения ^0 предопределено условием нормировки (1). Поэтому в схеме алгоритма (рис. 2) можно исключить крайнюю левую ветвь и тем самым, во-первых, несколько уменьшить объем вычислений, во-вторых, упростить аппроксиматор, снизив на единицу число его входов. В этом случае при К = 8 аппроксиматор будет принимать на вход коэффициенты ^ -г ^7, т.е. окажется семиканальным.

- Хаар -- Косинус Фурье

К

М,

1,21,00,80,60,4-

— — Хаар

- Косинус

---- Фурье

у —

а) 0 10 20 30 " б) 0 10 20 30 ^ в) 0 10 20 30

Рис. 6. Зависимости среднего значения погрешности оценивания энтропии от числа используемых коэффициентов разложения гистограммы в различных базисах (Хаар, косинус, Фурье) для трёх тестовых изображений.

(а) дв, (б) Б1, (в) $2

К

6. Построение аппроксиматора

Известно много вариантов построения аппрокси-матора - блока получения приближенных значений функции многих переменных (7), см., например, об-

зор [18]. Однако большинство известных аппрокси-маторов, включая широко используемые в последнее время нейросетевые [8, 12, 18], ориентированы на достижение требуемой точности аппроксимации, но не на минимизацию ее вычислительной сложности. По-

этому мы предлагаем использовать в нашем алгоритме простой метод многомерной иерархической аппроксимации [3], возможно, не самый точный, но обеспечивающий наиболее быстрое получение значений аппроксимируемой функции.

Кратко напомним принцип построения иерархического аппроксиматора применительно к нашему алгоритму. В общем случае, если не учитывать, что младшая базисная функция является известной константой (см. предыдущий параграф), строится К-мерный гиперкуб, в котором по осям откладываются значения коэффициентов разложения, нормированные к удоб-

ному диапазону возможного изменения, например, к стандартному интервалу байтовых целых чисел [0, 255]. В процессе обучения (настройки) этот гиперкуб последовательно разбивается по осям и порождает в памяти компьютера древовидную структуру. В каждой из областей, полученных в результате разбиения, осуществляется аппроксимация функции константой. Области с малой погрешностью аппроксимации принимаются за терминальные вершины дерева. Области, в которых погрешность велика, подвергаются дальнейшему разбиению. Условная «двумерная» (для К = 2) иллюстрация к изложенному приведена на рис. 8а.

Еу

0,70,60,50,40,30,20,1-

\\ »V - — Хаар - Косинус ---- Фурье

\ ч N Ч _ \

0,6- - — Хаар Косинус ----Фурье

0,5- \ ^

0,4- \ » \ "С»%

0,3- \ \

0,2- \ \

а)

0

10

20

30

К

б)

о

10 20 30 к в) 0

Рис. 7. Зависимости среднеквадратичного отклонения погрешности оценивания энтропии от числа используемых коэффициентов разложения гистограммы в различных базисах для трех тестовых изображений. (а) QB, (б) 81, (в) 82

0,60,50,40,30,20,1-

К

—г-

10

—г-

20

30

К

а)

Рис. 8. Построение иерархического аппроксиматора. (а) Результирующая схема разбиения гиперкуба (остались терминальные вершины), (б) выборочный анализ точности аппроксимации в отдельной области

Если считать аргументы аппроксимируемой функции (7) приведенными к целочисленному байтовому формату, то К-мерный гиперкуб потенциально вмещает в себя 28К ее значений - столь большое число точек делает затруднительной или даже невозможной полную проверку точности аппроксимации. Поэтому мы предлагаем выполнять выборочную проверку, опираясь на предположение о достаточно гладком поведении аппроксимируемой функции. На рис. 8б условно показана отдельная область гиперкуба, для которой нужно принять решение либо об отнесении ее к терминальной вершине дерева, либо о разбиении. Рассматриваются 2К угловых точек области (очевидно, она тоже является гиперкубом, но меньшего размера, нежели исходный). В них вычис-

ляются значения функции Н, (Н\, Н2, Н3 и Н4 на рис. 2б) и проверяется выполнение условия:

шах{Н,-} - шт{Н,-} < 2Д А

(30)

где , - условный номер вычисляемого значения функции, ДА - допустимая максимальная погрешность её аппроксимации. При нарушении неравенства (30) область подлежит дальнейшему разбиению. Если неравенство выполняется, то множество контролируемых значений расширяется, например, добавлением центральной точки области (на рис.8б - Н5) и других точек (Не, Н7, Н8, Н9 и т.д.), число которых определяется лишь лимитом времени и вычислительных ресурсов для настройки аппроксиматора. Если для расширенного множества контролируемых точек также выполняется условие (30), область считается терминальной вершиной дерева и ей приписывается аппроксимирующее значение функции:

Н =1 (шах{Н,-} - шт{Н,}).

2 , ,

(3\)

Остановимся на выборе значения ДА в формуле (30). Случайное отклонение значения энтропии, возвращаемого аппроксиматором, от значения, точно вычисленного по К коэффициентам спектрального разложения гистограммы, очевидно, лежит в интервале [-ДА, ДА]. Если предположить, что это отклонение равномерно распределено на указанном интервале, то его среднеквадратичное значение равно

— д J V3.

(32)

Эта величина характеризует погрешность оценки энтропии за счет аппроксимации функции (7), добавляемую к погрешности еу, возникающей за счет усечения спектра гистограммы. Суммарная среднеквадратичная погрешность оценивания задается формулой

(33)

Из (33) следует, что добавочная среднеквадратичная погрешность (32) несущественно (для определенности - на 10 %) увеличит погрешность из-за усечения спектра, т.е. стЕ = 1,1 су, если

eA — 0,46ey.

Из (32) и (34) получаем: Д A — 0,80e y.

(34)

(35)

В параграфе 5 было установлено, что при описании гистограммы восемью младшими компонентами спектра в базисе Хаара минимальное значение еу и 0,25, ориентируясь на него, из (35) находим:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Д A = 0,2.

Выше также было упомянуто о преобразовании аргументов аппроксимируемой функции (7) в целочисленный байтовой формат. Такое преобразование должно опираться на исходный диапазон изменения указанных величин. Если коэффициент Fk разложения гистограммы принимает значения в диапазоне [min Fk, max Fk], то его линейное преобразование к диапазону [0, 255], очевидно, задается формулой

Fk — 255-

Fk - min Fk max Fk - min Fk

(36)

где Fk - нормированный коэффициент - входной параметр иерархического аппроксиматора. Экспериментально установлено, что для используемых тестовых изображений средние значения коэффициентов разложения гистограмм по базису Хаара близки к нулю, но имеют сильный разброс среднеквадратичных отклонений eF (см. рис. 9).

Рисунок показывает, что среднеквадратичные отклонения коэффициентов немонотонно зависят от номера коэффициента (в интересующем нас диапазоне), но нигде не превышают максимального значения eF = 0,045. Поэтому, ориентируясь на известное правило «трех сигм», можно принять с запасом:

- min Fk — max Fk — 0,135,1 < k < 7.

7. Вычислительная сложность оценки энтропии в скользящем окне

Сравним вычислительную сложность предлагаемого алгоритма с базовым алгоритмом оценки энтро-

пии по локальной гистограмме в скользящем окне, кратко описанным в параграфе 1. Теоретическую (алгоритмическую) сложность оценим числом операций сложения/вычитания (Ц+), умножения (Ц<) и обращения к таблице (Ц), выполняемых в каждом положении скользящего окна, а также суммарным показателем:

UV— U ++ Ux + UT.

(37)

Как уже было оговорено в параграфе 1, мы не рассматриваем особенности работы алгоритмов на краях изображения.

4 6 8 к Рис. 9. Среднеквадратичные отклонения коэффициентов разложения гистограмм по базису Хаара

Базовый алгоритм. Сначала формируется гистограмма. Значение каждого пиксела в окне рассматривается как адрес в предварительно заполненной нулями таблице длиной в Ь ячеек, по которому в таблицу добавляется единица (или, если сразу формируется нормированная гистограмма, то величина ||Б||-1), см. формулу (3). Каждое такое действие - одно обращение к таблице и одно сложение. При заданном положении окна его нужно выполнить для каждого пиксела, т.е. ||Б|| раз. Если окно прямоугольное с размерами М\ ХМ2 пикселов, то ||Б|| = ММ2. Но мы будем использовать известный рекурсивный алгоритм формирования гистограммы [1, 7, 9, 10], более эффективный в вычислительном плане, в нем удается снизить повторение описанного выше действия до 2 (М1+1) раз (предполагается, что окно движется по горизонтали, а М1 - его вертикальный размер).

После того, как гистограмма получена, по формуле (2) производится вычисление энтропии. Вычисление непосредственно по этой формуле требует многократного выполнения операций логарифмирования и умножения. Но можно заранее протабулировать значения слагаемых, входящих в (2), в зависимости от вероятности, т.е. свести вычисления к обращению к таблице. После Ь-кратного извлечения из таблицы значений слагаемых остается (Ь - 1) раз выполнить их сложение для вычисления энтропии.

Таким образом, получаем следующие показатели алгоритмической сложности базового алгоритма:

U+ — 2(M1 +1) + L -1, Ux — 0, UT — 2(Mi +1) + L.

(38)

Предлагаемый алгоритм. Здесь вычислительный процесс разделяется на K параллельных ветвей (см. рис. 2). В каждой ветви сначала выполняется поэлементное преобразование изображения в соответствии с формулой (9). Следуя общепринятой технологии LUT «Look Up Table» [4], это преобразование сводится к обращению к таблице, в которую заранее занесены значения преобразованных пикселов. Поскольку число положений скользящего окна примерно равно числу пикселов в изображении, можно считать, что для одного положения окна в одной ветви алгоритма выполняется одно обращение к таблице.

Затем в соответствии с разностными уравнениями (11) выполняется рекурсивное суммирование пикселов преобразованного изображения в пределах окна. На его реализацию требуется четыре операции сложения /вычитания независимо от размеров окна. Кроме того, чтобы перейти от суммы к среднему значению, нужно выполнить одно умножение, см. формулу (12).

В результате получаем значение коэффициента разложения гистограммы по выбранному базису. Это значение затем масштабируется к диапазону, нужному для аппроксиматора. Согласно формуле (36), это линейное преобразование выполняется за одно сложение и одно умножение.

Далее все ветви алгоритма объединяются в иерархическом аппроксиматоре. Поскольку для конкретного набора входных переменных неизвестно, на каком уровне построенного дерева его вершина окажется терминальной, невозможно дать точную оценку алгоритмической сложности аппроксиматора. Поэтому мы ограничимся ее оценкой сверху, считая, что все ветви дерева доходят до нижнего, восьмого уровня. Для каждой входной переменной на каждом уровне необходимо выполнить операцию сравнения с порогом (по сути - вычитания) и обращения к иерархической таблице. В целом для всех переменных эта процедура должна повториться ровно 8K раз.

Итого, показатели алгоритмической сложности предложенного алгоритма равны:

U+= 13K, U= 2K, UT = 9K.

(39)

В табл. 3 для конкретных значений параметров алгоритмов (Ь = 256, М\ = 25, К = 7) приведены значения величин (38), (39), суммарного показателя вычислительной сложности (37), а также относительный выигрыш предлагаемого алгоритма по сравнению с базовым.

Табл. 3. Алгоритмическая сложность алгоритма оценки энтропии (Ь = 256, Мг = 25, К = 7)

U+ Ux Ut Us

Базовый алгоритм 308 0 307 615

Предлагаемый алгоритм 91 14 63 168

Относительный выигрыш 3,38 - 4,87 3,66

Из таблицы видно, что теоретически предлагаемый алгоритм в 3-4 раза обыгрывает базовый алгоритм по числу выполняемых операций.

8. Результаты экспериментов

Результаты представленного выше анализа не являются точными, поскольку опираются на ряд допущений. Особенно это касается оценки вычислительной сложности алгоритмов, которая должна непременно учитывать особенности современных компьютеров: число ядер процессора, скрытые функции операционной системы, особенности транслятора и т.д.

Чтобы подтвердить и отчасти верифицировать теоретические результаты статьи, были разработаны программы, реализующие и базовый, и новый алгоритм оценки энтропии. Был использован компьютер со следующими характеристиками: Intel Pentium Gold G6405 4.10GHz, 2 ядра, ОЗУ Kingston Hyper X Fury Black 8 GB, 2400 МГц.

Время обработки на этом компьютере одного тестового изображения (полутоновое, 1024 *1024 байтовых пиксела) составило: 0,325 с для базового алгоритма, 0,074 с для нового. То есть экспериментально подтвержденный выигрыш нового алгоритма в скорости составляет 4,39 раз.

На рис. 10 представлено тестовое изображение QB (см. рис. 3а) и поля его локальной энтропии в окне 25*25, построенные программами, реализующими базовый и предложенный алгоритм. Чтобы лучше визуально представить поля энтропии, значения их пикселов увеличены в 32 раза.

Рис. 10. Иллюстрация построения поля энтропии. (а) тестовое изображение, (б) поле энтропии по базовому алгоритму,

(в) поле энтропии по предложенному быстрому алгоритму

В дополнение к рис. \0 на рис. \\ приведены одномерные графики локальной энтропии, построенные для средней строки изображения рв.

Для всех трех тестовых изображений (рис. 3) среднеквадратичные погрешности оценки энтропии предлагаемым алгоритмом составили соответственно

0,469, 0,417 и 0,401. Эти значения вполне сопоставимы с погрешностью, вызванной неопределенностью описания гистограммой, построенной по окну ограниченного размера, истинного (ненаблюдаемого) распределения вероятностей пикселов изображения (см. параграф 4).

Значение пиксела - поле энтропии (предложенный алгоритм) шттт. поле энтропии (базовый алгоритм)

и i • " V \ у Номер столбца

ми —I-1-1-1-1-1—

0 200 400 600 800 1000

Рис. 11. Графики локальной энтропии для строки 511 изображения дв, вычисленной по базовому и предложенному алгоритмам

Заключение

В статье рассмотрен ряд вопросов, связанных с вычислением важной характеристики - локальной энтропии в скользящем окне обработки изображения. Предложен и исследован новый алгоритм приближенной оценки энтропии, обладающий в несколько раз меньшей вычислительной сложностью по сравнению с известными.

Для предложенного алгоритма осуществлен экспериментальный выбор ортогонального базиса для представления локальной гистограммы в виде усеченного ряда. Из числа рассмотренных базисов наилучшим оказался базис Хаара.

Рассмотрена методика построения иерархического аппроксиматора, осуществляющего быстрый пересчет множества коэффициентов разложения гистограммы в значение энтропии.

В качестве замечаний, дополняющих содержание статьи или указывающих направления дальнейших исследований и разработок, можно отметить следующее.

1. В ряде публикаций [7, 8, 12] отмечена нежелательность использования при обработке изображения прямоугольного окна, порождающего анизотропность (различие по направлениям в плоскости изображения) результатов обработки. В рамках предложенного алгоритма данный недостаток легко нивелируется применением многократного сглаживания. В статье [19] показано, что рекурсивное сглаживание, описанное в параграфе 2, будучи примененным трижды, делает результат обработки практически изотропным. При этом общая вычислительная сложность алгоритма оценки энтропии возрастает незначительно.

2. Предложенный быстрый алгоритм легко обобщается на построение других полей признаков изображения, основанных на локальной гисто-

грамме, вычисляемой в режиме скользящего окна. Такое обобщение потребует всего лишь замены аппроксиматора, теперь настроенного на другой признак. Наибольший эффект в скорости вычислений будет достигнут при одновременном синтезе нескольких полей локальных гистограммных признаков, когда обобщенный алгоритм будет состоять из общей части (вычисления коэффициентов разложения гистограммы) и набора нужных аппроксиматоров.

3. Можно попытаться распространить предложенный подход к построению полей локальных признаков, основанных на использовании многомерных, в частности, двумерных гистограмм [2, 4]. Однако это является предметом будущих исследований.

Благодарности

Работа выполнена при поддержке гранта РНФ №

23-11-20013 (параграфы 1- 3, 8) и по государственному заданию НИЦ «Курчатовский институт» (параграфы 4 - 7).

References

[1] Yaroslavsky LP. Introduction to digital image processing [In Russian]. Moscow: "Sovetskoe Radio" Publisher; 1979.

[2] Pratt WK. Digital image processing. New York: Willey; 1978. ISBN: 0471018880.

[3] Gashnikov MV, Glumov NI, Ilyasova NY, Myasnikov VV, Popov SB, Sergeyev VV, Soifer VA, Khramov AG, Chernov AV, Chernov VM, Chicheva MA, Fursov VA. Computer image processing methods [In Russian]. Moscow: "Fizmatlit" Publisher; 2003. ISBN: 5-9221-0270-2.

[4] Gonzalez RC, Woods RE. Digital image processing. London: Pearson; 2018. ISBN: 978-0-13-335672-4.

[5] Shapiro L, Stockman J. Computer vision [In Russian]. Moscow: Binom, Knowledge Laboratory; 2006. ISBN: 594774-384-1.

[6] Schowengerdt_RA. Remote sensing: models and methods for image processing. Academic Press; 2006. ISBN: 9780123694072.

[7] Wei Y, Tao L. Efficient histogram-based sliding window. IEEE Computer Society Conf on Computer Vision and Pattern Recognition 2010: 3003-3010. DOI: 10.1109/CVPR.2010.5540049.

[8] Velichko A, Belyaev M, Wagner MP, Taravat A. Entropy approximation by machine learning regression: application for irregularity evaluation of images in Remote Sensing. Remote Sens 2022; 14(23): 5983. DOI: 10.3390/rs14235983.

[9] Huang TS, Yang GY, Tang GY. A fast two-dimensional median filtering algorithm. IEEE Trans Acoust Speech Signal Process 1979; ASSP-27(1): 13-18. DOI: 10.1109/TASSP.1979.1163188.

[10] Huang TS, Eklund JO, Nussbaumer GJ, et al. Fast algorithms in digital image processing [In Russian]. Moscow: "Radio i Svyaz" Publisher; 1984.

[11] Chentsov NN. Estimation of unknown distribution density from observations [In Russian]. Report USSR Academy of Sciences 1962; 147(1): 45-48.

[12] Kass M, Solomon J. Smoothed local histogram filters. ACM Trans Graph 2010; 29(426): 100. DOI: 10.1145/1778765.1778837.

[13] Ventzel ES. Probability theory [In Russian]. Moscow: "Nauka" Publisher; 1969.

[14] Shannon K. Works on information theory and cybernetics [In Russian]. Moscow: Publishing House of Foreign Literature; 1963.

[15] Oppenheim A, Schafer R. Digital signal processing [In Russian]. Moscow: "Tehnosphera" Publisher; 2012. ISBN: 978-5-94836-329-5.

[16] Zalmanzon LA. Fourier, Haar, Walsh transforms and their application in control, communications and other areas [In Russian]. Moscow: "Nauka" Publisher; 1989. ISBN: 5-02014094-5.

[17] Dedus FF, Kulikova LI, Pankratov AN, Tetuev RK. Classical orthogonal bases in problems of analytical description and processing of information signals [In Russian]. Moscow: VMKMGU Publisher; 2004.

[18] Shvedov AS. Approximation of functions using neural networks and fuzzy systems [In Russian]. Problems of Control 2018; 1: 21-29.

[19] Sergeev VV, Myasnikov VV. Algorithm for fast implementation of the Gabor filter [In Russian]. Avtometria 1999; 6: 51-55.

Сведения об авторах

Сергеев Владислав Викторович, 1951 года рождения. В 1974 году окончил Куйбышевский авиационный институт (ныне Самарский университет). В 1978 г. защитил кандидатскую, а в 1993 году - докторскую диссертацию. В настоящее время является заведующим кафедрой геоинформатики и информационной безопасности Самарского университета, по совместительству - начальником лаборатории математических методов обработки изображений Института систем обработки изображений, НИЦ «Курчатовский институт». Область научных интересов: цифровая обработка сигналов, анализ изображений, распознавание образов, геоинформатика. E-mail: vserg@geosamara.ru

Баврина Алина Юрьевна, 1980 года рождения, в 2003 году окончила Самарский государственный аэрокосмический университет имени академика С.П. Королёва (ныне Самарский университет), в 2006 году защитила кандидатскую диссертацию. Работает инженером-математиком в АО «Самара-Информспутник», а также в Самарском университете в должности старшего научного сотрудника по совместительству. Области научных интересов: обработка изображений, распознавание образов, дистанционное зондирование Земли, защита цифровых изображений. E-mail: bavrina@mail.ru

Зайцев Илья Дмитриевич, 2002 года рождения, студент 3 курса специалитета «Информационная безопасность автоматизированных систем» Самарского университета. Область интересов: обработка изображений, оптимизация вычислений. E-mail: dp.io1866@yandex. ru

Лазутов Марк Юрьевич, 2002 года рождения, студент 4 курса бакалавриата «Прикладная математика и информатика» Самарского университета. Область интересов: обработка изображений, распознавание образов. E-mail: lazutov.mark@mail.ru

Шапиро Давид Александрович, 1999 года рождения. В 2022 году окончил Самарский национальный исследовательский университет. Аспирант Самарского университета. Область интересов: анализ изображений, цифровые водяные знаки, стеганография. E-mail: david-shapiro@mail.ru

ГРНТИ: 28.23.15

Поступила в редакцию 16 февраля 2024 г. Окончательный вариант - 7 мая 2024 г.

On estimating the local entropy of an image in a sliding window

V.V. Sergeyev A.Y. Bavrina13,I.D. Zaitsev1, M.Y. Lazutov1, D.A. Shapiro1 1 Samara National Research University, 443086, Samara, Russia, Moskovskoye Shosse 34;

2Image Processing Systems Institute, NRC «Kurchatov Institute», 443001, Samara, Russia, Molodogvardeyskaya 151;

3 JSC «Samara-Informsputnik», 443080, Samara, Russia, Karl Marx ave. 192, off. 717

Abstract

The paper considers a number of issues related to the calculation of the local entropy in a sliding window for image processing tasks. A new algorithm for entropy estimation is proposed, which has several times lower computational complexity than the known ones. The algorithm is based on the approximate representation of the histogram in the form of a truncated series expansion over some system of orthogonal basis functions, recursive calculation of the coefficients of this expansion in a sliding window and subsequent recalculation of the coefficients into the entropy estimate. Questions of an orthogonal basis selection for representing the local histogram as a truncated series are considered and the appropriateness of using the Haar basis is shown. A technique of constructing hierarchical approximator, which realizes fast recalculation of histogram decomposition coefficients into entropy value, is described. The theoretical statements of the paper are verified by experiments on the Earth remote sensing images.

Keywords: image processing, local feature generation, sliding window, local histogram, entropy estimation, basis function decomposition, recursive processing, hierarchical approximation, estimation error, computational complexity.

Citation: Sergeyev VV, Bavrina AY, Zaitsev ID, Lazutov MY, Shapiro DA. On estimating the local entropy of an image in a sliding window. Computer Optics 2024; 48(5): 714-725. DOI: I0.18287/2412-6179-C0-I509.

Acknowledgements: This work was financially supported by the Russian Science Foundation under project No. 23-11-20013 (Sections 1-3, 8) and the RF Ministry of Science and the State assignment of NRC "Kurchatov Institute" (Sections 4-7).

Authors' information

Vladislav Victorovich Sergeyev (b. 1951) graduated from Kuibyshev Aviation Institute (presently, Samara National Research University) in 1974. In 1978 he received his PhD and in 1993 - DrSc. Currently he works as the head of GIS and Information Security department at Samara National Research University, also holding a part-time position as the head of a laboratory at the Image Processing Systems Institute, NRC «Kurchatov Institute». Research interests are digital signals and image processing, GIS and pattern recognition. E-mail: vserg@geosamara.ru

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Alina Yurievna Bavrina (b. 1980) graduated from Samara State Aerospace University (presently, Samara National Research University) in 2003, received her PhD in 2006. Currently she is an engineer-mathematician at JSC «Samara-Informsputnik» and has a part-time position as senior researcher at Samara National Research University. Area of interests: digital image processing, pattern recognition, Earth remote sensing, watermarking. E-mail: bavrina@mail. ru

Ilya Dmitrievich Zaitsev (b. 2002) is the 3-rd year student of a specialist program «Information Security of Automated Systems» at Samara National Research University. Area of interest: image processing, computational optimization. E-mail: dp. io1866@yandex.ru

Mark Yurievich Lazutov (b. 2002) is the 4-th year student of a bachelor's program «Applied Mathematics and Informatics» at Samara National Research University. Area of interests: digital image processing, pattern recognition. E-mail: lazutov.mark@mail.ru

David Aleksandrovich Shapiro (b. 1999) graduated from Samara National Research University in 2022. Postgraduate student at Samara National Research University. Area of interest: image analysis, digital watermarks, steganogra-phy. E-mail: david-shapiro@mail.ru

Code of State Categories Scientific and Technical Information (in Russian - GRNTI)): 28.23.15 Received February 16, 2024. The final version - May 7, 2024.

i Надоели баннеры? Вы всегда можете отключить рекламу.