Antropov Dmitry Alekseevich, candidate of technical sciences, docent, senior researcher, vnkantropov@mail. ru, Russia, Moscow, Military Academy of the General Staff of the Armed Forces of the Russian Federation
УДК 004.932
ПРИМЕНЕНИЕ ДИСКРЕТНЫХ ОРТОГОНАЛЬНЫХ ПРЕОБРАЗОВАНИЙ ДЛЯ СЖАТИЯ БИНАРНЫХ ИЗОБРАЖЕНИЙ
С.И. Бабаев, Б.В. Костров, Н.В. Лукина
Рассматривается сжатие документов для хранения и передачи в информационных системах, позволяющее устранить информационную избыточность содержащихся в них изображений в зависимости от целевого назначения системы и характеристических показателей восстановленных изображений.
Ключевые слова: бинарное изображение, ортогональное преобразование Уол-ша, компрессия/сжатие изображения.
В современных информационных системах особое место занимает проблема хранения и передачи между участниками информационных процессов различных видов документов. Эти документы, как правило, представляют из себя структурированный текст с включением стилизованных изображений в виде эмблем, логотипов, изображений наград и т.п. При большом объеме документооборота задача сжатия и быстрой передачи накопленной информации становится весьма актуальной. Отличительной особенностью данного вида информационного обслуживания, является факт приближения хранимых документов к бинарным изображениям. Применение ортогональных преобразований к таким изображениям наталкивается на проблему сходимости разложения в ряд по семейству ортогональных функций. Для решения этой задачи необходимо использовать преобразования, построенные на нетригонометрических базисных функциях. Поэтому цель данной работы заключается в теоретическом и практическом обосновании необходимости использования преобразования Уолша-Адамара для передачи документов, сжатых до уровня обеспечения необходимого качества, по вычислительным корпоративным сетям при обеспечении соответствующей пропускной способности каналов передачи данных и уменьшения объема хранимой информации.
Таким образом решение поставленной задачи приводит к использованию аппарата теории представления сигналов на конечных интервалах, которая основывается на замкнутости области определения, введении понятия невещественного сдвига и системы базисных функций более общих чем дискретные экспоненциальные функции (ДЭФ), являющиеся основой для построения дискретного преобразования Фурье. Такой системой,
36
адекватной понятию невещественного сдвига, является система функций Виленкина - Крестенсона (ВКФ) [4], которая в отличие от теории сигналов на бесконечных интервалах имеет следующие важные особенности:
- для представления и обработки сигналов могут быть использованы многие варианты систем базисных функций, в частности при различных т и задании интервала определения сигнала как N = тп, где «=1,2,3... При m=N, приходим к базису ДЭФ, а при т=2 получаем базис функций Уолша;
- спектральные преобразования выполняются как правило точно, поскольку формулы преобразования выражаются конечными суммами;
- эти преобразования лучше отражают реальные физические процессы, в которых сигнал и его спектр имеют ограниченную длительность;
- вычисление прямого и обратного преобразования может быть ускорено за счет применения быстрого преобразования.
Важнейшими свойствами функций Уолша являются следующие:
- по функциям Уолша можно раскладывать произвольные сигналы, в том числе бинарные;
- они принимают только два значения +1 и -1 и поэтому удобны для реализации на цифровых вычислительных машинах.
Сведенные вместе и пронумерованные функции Уолша разных порядков образуют систему. Число функций, включаемых в систему, обычно равно числу отсчетов каждой функции, так как при дискретном спектральном анализе сигналов с N отсчетами число спектральных составляющих также должно быть равно N. Ниже будет показано, что функции Уолша являются периодическими с двоично-рациональным периодом, поэтому их задают на интервале N=2« где «=1, 2, ...
Поскольку нумерация (упорядочение) функций Уолша может быть произведена разными способами, то возможны различные системы функций Уолша. Удобным способом представления этих систем, являются квадратные матрицы, в которых каждая строка — это функция Уолша.
Рассмотрим одну из возможных систем функций Уолша —систему Уолша=Адамара. В этой системе функции Уолша расположены одна под другой в таком порядке, что из них образуется матрица Адамара [1]. Систему Уолша=Адамара легко построить, основываясь на свойствах матриц Адамара.
Элементарная матрица Адамара, состоящая из одного элемента ^ = 1), имеет вид Н1 =[1]. Для N=2 элементами матрицы Адамара будут элементарные матрицы ±Н1
Н
2 =
+1 +1" +1 -1
(1)
Для N=4 она будет иметь ту же структуру, но ее элементами будут уже элементарные матрицы ±Ш:
Н 4 =
Н
Н
Н 2 - Н2
(2)
Число элементов в строке при переходе от одной матрицы к другой удваивается. Вообще для N=2n имеем
Н п -
Н 2 п-1 Н 2 п-1 Н 2 п-1 - Н 2 п-1
(3)
Н 2 п
Матрица Адамара (3) есть кронекеровское произведение матриц: Н2п-1 X Н2 и т.д., то матрица Н^п есть п-я кронекеровская сте-
пень: Н 2 п - Н 2
Помимо систем Уолша=Адамара широко известна система Уолша [6] {^а1(1,])}„ в которой функций расположены в порядке увеличения их числа знакоперемен на интервале определения. Эта система:
Н
и>,
(3)
+1 +1 +1 +1 +1 +1 +1 +1
+1 +1 +1 +1 -1 -1 -1 -1
+1 +1 -1 -1 -1 -1 +1 +1
+1 +1 -1 -1 +1 +1 -1 -1
+1 -1 -1 +1 +1 -1 -1 +1
+1 -1 -1 +1 -1 +1 +1 -1
+1 -1 +1 -1 -1 +1 -1 +1
+1 -1 +1 -1 +1 -1 +1 -1
(4)
Номера строк в матрице Уолша=Адамара и в матрице (4) связаны соотношениями:
(5)
- (^п-1 + +1-1)2'Щ - 0 Щ - (^п + Ип-1 + ••• + Ип+1-1 )2
Данное преобразование упорядочено по частостям (или по Уолшу) [2]. Будем обозначать множество функций Уолша по формуле (6)
Sw - (/,]),\ - 0,1,...,N -1} (6)
где N - 2п,п -1,2,3,...; w - индекс, обозначающий упорядочение по Уолшу. Если через обозначить частость walw, то 81 определяется как (7).
0,1 - 0
1 .
—, I
2
I +1
четное
I - нечетное
(7)
В дискретном представление упорядочение по Уолшу определяется матрицей [1], элементы которой имеют вид (8)
8
п-1
2 Г (и )ь1 (8)
Н„ = (-1)'=0 ;и,и = 0,1,...,N -1,
где г0(и ) = ип-1; г1(и) = ип-1 +ип - 2; г2(и ) = ип - 2 +ип-3,...;
г«-1(и) = и1 +и«.
Преобразование Ндля некоторого блока («х п), где X(«) = {X(0),X(1),...,X(N - 1)}определяется матричным уравнением вида
(9)
ВX(«) = Х(«) • Н^(«), (9)
где X («) - матрица исходного изображения, а В х («) - матрица коэффициентов прямого преобразования Уолша.
Исходя из свойств преобразования Уолша: НW(n) - ортогональная
и симметрическая, тогда обратное преобразование записывается в следующем виде:
х («)=N н ^(«) •в х («). (10)
Для рассмотрения и исследования выбран часто встречающийся документ, использующийся в информационных системах - письмо. Кодирование, скорость передачи, а также возможность передачи от отправителя к получателю в большом размере и соответствующем качестве мероприятие затратное и возможность его осуществления связана с большими трудностями. Поэтому, принято решение, первостепенно разделить требуемое изображение на составляющие и работать с каждым его элементом в отдельности [11]. Элементная часть изображения имеет размерность в 512x512pi и для более удобной работы приведена к типу полутоновой функцией rgb2gray (МайаЬ) [2,8]. По исходному изображению проведен ряд экспериментов:
1) преобразование Уолша выполнено на полутоновом изображении;
2) полутоновое изображение приведено к черно-белому, затем применено преобразование Уолша;
3) перед преобразованием Уолша проведена инверсия изображения. Общая структура процесса сжатия изображения представлена на
рис. 1.
Каждый случай позволяет по-разному провести преобразование, получить разные результаты по измеряемым показателям. Для оценки исследуемых изображений можно использовать среднеквадратический показатель отклонения значений яркостей пикселей исходного и сжатого изображения. СКО (в английском варианте MSE) применяется для оценки искажений восстановленных изображений и рассчитывается по формуле (11) [10, 4]:
1
N-1К-1
у-1л —1/л \2
а=л — II л—ъ(1,л)), (11)
К I=о л=о
где N, К - размеры изображений в пикселах; Ъ(1,Л) и Ъ(г,Л)- элементы матриц яркостей восстановленного и исходного изображений соответственно. Если изображения одинаковы, то о = 0.
Загрузить изображение
Сронить С ИОСОДНЫИ!
изображение).!
Преобразовать в полутоновое
Преобразовать в ЧБ или нне ер снр овать
Выполнить
преобразование
Уолша
Рассчитать Получить Выполнить обратное Выполнить
показатели ■4— восстановленное ч— преобразование ■м— процесс сжатия *—
изображение Уолша
Рис. 1. Схема структуры процесса сжатия изображения
При использовании сжатия информации в изображении после произведенного ортогонального преобразования Уолша производится удаление (или отбрасывание) малозначимых элементов, потеря которых не несет видимых глазу человека изменений по сравнению с исходным изображением. Количество отбрасываемых элементов, определяется исходя, из матричного представления спектра и задается порогом значений элементов, ниже которого составляющие спектра приравниваются к нулю. Доля отброшенных элементов задается формулой (7) [3,9]:
с
Б = -° • 100%, (12)
ск
где Ск и Со- общее количество элементов спектра и количество отброшенных элементов соответственно.
Рассмотрим выделенные ранее три варианта преобразования и их выходные показатели, рассчитанные по восстановленному изображению по сравнению.
Проведение преобразования на полутоновом изображении проще двух других. Пример преобразованного таким образом исходного изображения представлен на рис.2. Применяется отбрасывание элементов, значение которых меньше порогового и потеря которых не значительно влияет на качество обратного преобразования. Спектр располагается в диапазоне (-75;512), отброшенные элементы находятся в диапазоне (0;0,99). Результат - восстановленное изображение визуально не отличается от исходного. Среднеквадратический показатель отклонения а = 0,49, что подтверждает визуальное восприятие (визуально два изображения неотличимы друг от друга если, а = 0 ... 2,0.
а
б
в
г
Рис. 2. Эксперимент по преобразованию Уолша на полутоновом изображении: а - исходное изображение; б - спектр, полученный в результате прямого преобразования Уолша; в - спектр преобразования Уолша в результате отбрасывание части элементов; г - восстановленное изображение 8 = 51,34%,
а = 0,49
Преобразование с начальной обработкой до черно-белого изображения отражено на рис. 3. Для исходного изображения задается порог 0,85. Большим и меньшим соответствующего порогового значениям присваиваются 1 и 0, таким образом, формируется бинарное изображение, к которому применяется преобразование Уолша. Порядок отбрасывания элементов аналогичен предыдущему, но отражает иные пороговые значения от 0 до 3, включая большую часть элементов, в том числе и значимых, от этого процент сжатия существенно выше, что позволяет уменьшить изображение практически в 3 с лишним раза.
Эксперимент с инверсированным изображением, удобен в своей практической интерпретации, где значимые пиксели изображения отображены единицами, а не значимые (белый фон - основное составляющее изображения) - нулями. Спектр инверсированного изображения располагается в диапазон спектра от -65.7 до 118.3. Заданное пороговое значения отброшенных элементов составляет (0; 1) и сжатие осуществлено на 54,23% (рис.4).
В восстановленном изображение в результате преобразовании, при отбрасывании определенного количества элементов, происходит нарушение равенства Парсеваля между сжатым и исходным изображением [4,7,9]. Это приводит к искажению постоянных составляющих в столбцах обрабатываемого изображения.
На рис. 4, г отчетливо видны искажения в виде характерных полос по столбцам, по которым и происходил процесс преобразования Уолша. Из-за этого среднеквадратическое отклонение яркостей пикселей от исходного изображения составляет 12,75 и воспринимается наблюдаемым как некачественное. Для устранения данного дефекта необходимо доба-
вить значения отброшенных элементов в корректирующую строку при обратном преобразовании Уолша. Исправленный результат представлен на рис.5.
Общество с ограниченной
ответственностью
«АбсолютСтрой»
Вокзальная ул., 41, г. Рязань, 390013 Телефон/факс; (4912) 90-07-00
E-mail: [email protected] https://absolutstroy.ru/ ОКПО 34470220, ОГРН 1156234009491, ИНН/КПП 6234145637 №
а
ШШ
б
ишЯшшШ1ШВж
Общество с ограниченной ответственно стью «АбсолютСтрой»
Вокзальная ул., 41, г. Рязань, 390013 Телефон/факс: (4912) 90-07-00 E-mail: [email protected] https://absolutstroy.ni/ ОКПО 34470220, ОГРН 1156234009491, ИНН/КПП 6234145637 _№_
в
г
Рис. 3. Эксперимент по преобразованию Уолша на бинарном черно-белом изображении: а - исходное изображение; б - спектр, полученный в результате прямого преобразования Уолша; в - спектр преобразования Уолша в результате отбрасывание части элементов; г - восстановленное изображение 8 = 71,07%, а = 0,56
Общество с ограниченной ответственностью «АбсолютСтрой»
Вокзальная ул., 41, г. Рязань, 390013 Телефон/факс: (4912) 90-07-00 E-mail: [email protected] https://absolutstroy.ru/ ОКПО 34470220, ОГРН 1156234009491, ИНН/КПП 6234145637 _№_
На №_от_
а
б
в
г
Рис. 4. Эксперимент по преобразованию Уолша на инверсном черно-белом изображении: а - исходное изображение; б - спектр, полученный в результате прямого преобразования Уолша; в - спектр преобразования Уолша в результате отбрасывание части элементов; г - восстановленное изображение 8 = 54,23%, а = 12,75
Все измерения и показатели отражены в сводной таблице, а также определено время по реализации каждого алгоритма. Исходя из представления общих показателей, в таблице наиболее рациональным на наш взгляд является преобразование Уолша над черно-белым изображением. Визуально качество изображенияя оценить сложно, но с точки зрения сжатия, а для нас это главный аспект преобразования, именно это преобразование является оптимальным. Также здесь достаточно неплохой показа-
тель качества яркости пикселей по сравнению с исходным, о равно 0,56 и время чуть больше 1 с. не так принципиально по времени реализации алгоритма.
С?3>«*ТИЯ»И»* КОМПАНИЯ
Общество с ограниченной ответственностью «АбаииотСгрой»
Вогаалкмш ;ул., 41, г. Рязань, 390013 Телефон/факс: (4912) 90-07-00 E-mail: mfolgabsniitteoy.ra htt ps ://abso lutst toy ml ОКП034470220, ОГРН 3156234009491, ИНН/КГШ 6114 <45637 №
Ha №
or
а
\6солют(трой
СТРОИТЕЛЬНАЯ КОМПАНИЯ
Общество с ограниченной ответственностью «АбсолютСтрой»
Вокзальная ул., 41, г. Рязань, 390013 Телефон/факс: (4912) 90-07-00 E-mail: [email protected] https://absolutstroy.ru/ ОКПО 34470220, ОГРН 1156234009491, ИНН/КПП 6234145637 №
На №
от
б
Рис. 5. Коррекция правила Парсеваля на инверсном черно-белом изображении: а - изображение с нарушение равенства Парсеваля; б - исправленное изображение £ = 54,23%, о = 1,21
Результаты исследования
"^•■^Тип изобра-Показатели Полутоновое Черно-белое Инверсное черно-белое
о 0,49 0,56 1,21
S, % 51,34 71,07 54,23
Время, с 0,98 1,16 2,05
Таким образом, результаты проведенных экспериментов показали, что метод сжатия изображений на основе ортогонального преобразования Уолша с упорядочением по Уолшу не приводит к специфическим искажениям, свойственным другим преобразованиям и по степени сжатия и качеству восстановления не уступает другим известным методам. Все три разновидности представления изображений и реализованные алгоритмы могут быть использованы для сжатия информации. В данном случае ключевое значение имеет процент сжатия и качество результирующего восстановленного изображения на выходе.
Список литературы
1. Ахмед Н., Рао К. Р. Ортогональные преобразования при обработке цифровых сигналов: пер. с англ. / под ред. И. Б. Фоменко. М.: Связь, 1980. 248 с.
2. Гонсалес Р., Вудс Р., Эддинс С. Цифровая обработка изображений в среде Matlab. М.: Техносфера, 2006. 616 с.
3. Залманзон Л.А. Преобразования Фурье, Уолша, Хаара и их применение в управлении, связи и других областях. М.: Наука, 1989. 496 с.
4. Злобин В.К., Костров Б.В., Свирина А.Г. Спектральный анализ изображений в конечных базисах. М.: КУРС: ИНФРА 2016. 172 с.
5. Сэломон Д. Сжатие данных, изображений и звука. Пер. с англ.
B.В.Чепыжова. М.: Техносфера, 2004. 368 с.
6. Костров Б.В., Гринченко Н.Н., Геращенко Е.С., Потапова В.Ю., Тарасов А.С., Токарев А.В. Моделирование канала передачи аэрокосмических изображений с использованием каскадного кода // Известия Тульского государственного университета. Технические науки, 2016. Вып. 2.
C. 124 - 129.
7. Костров Б.В., Бастрычкин А.С. Сжатие изображений на основе ортогональных преобразований // Известия Тульского государственного университета. Технические науки, 2016. Вып. 9. С.113 - 118.
8. Костров Б.В., Соломенцева Н.И. Моделирование канала связи // Известия Тульского государственного университета. Технические науки, 2017. Вып. 2. С. 95 - 100.
9. Костров Б.В., Бастрычкин А.С. Метод передачи изображений с квантованием высокочастотной составляющей // Известия Тульского государственного университета. Технические науки, 2018. Вып. 2. С. 75 - 82.
10. Avcibas I., Sankur B., Sayood K. Statistical evaluating of image quality measures // Journal of Electronic Imaging, 2002. Vol. 11. № 2. Р. 206 - 223.
11. Журавель И.М. Краткий курс теории обработки изображений. [Элекстронный ресурс] URL: http://matlab.exponenta.ru/ imagepro-cess/book2/index.php (дата обращения 24.01.2019).
Бабаев Сергей Игоревич, старший преподаватель, babaev.s.i@,gmail. com, Россия, Рязань, Рязанский государственный радиотехнический университет,
Костров Борис Васильевич, д-р техн. наук, заведующий кафедрой, [email protected], Россия, Рязань, Рязанский государственный радиотехнический университет,
Лукина Наталья Владимировна, магистрант, [email protected], Россия, Рязань, Рязанский государственный радиотехнический университет
IMAGE COMPRESSION BASED ON THE TRANSFORMATION OF WALSH
IN INFORMATION SYSTEMS
S.I. Babaev, B.V. Kostrov, N.V. Lukina
This article discusses the compression of images for storage and transmission in information systems, which allows to eliminate the information redundancy of images depending on the purpose of the system as a whole and the characteristics of the recovered images.
Key words: binary image, orthogonal transformation, Walsh, compression/compression of the image.
Babaev Sergey Igorevich, Senior Lecturer, babaev. s. i@,gmail. com, Russia, Ryazan, Ryazan State Radio Engineering University,
Kostrov Boris Vasilevich, doctor of technical science, manager of department, [email protected], Russia, Ryazan, Ryazan State Radio Engineering University,
Lukina Natalia Vladimirovna, magister, notalukina@,yandex. ru, Russia, Ryazan, Ryazan State Radio Engineering University
УДК 004.932
МЕТОДЫ ОПТИМИЗАЦИИ В ЗАДАЧЕ ВЫЧИСЛЕНИЯ ОПТИЧЕСКОГО ПОТОКА В СИСТЕМЕ НА КРИСТАЛЛЕ
П.В. Беляков, М.Б. Никифоров
Производится анализ алгоритма вычисления оптического потока как задачи оптимизации модифицированным методом множителей Лагранжа для его аппаратно-программной реализации в системе на кристалле.
Ключевые слова: оптический поток, регуляризация, метод множителей Лагранжа, ADMM, оптимизация, ПЛИС.
Вычисление оптического потока активно используется в различных областях компьютерного зрения [1] для выделения объектов, сегментации, компрессии видео, 3D-реконструкции, технического зрения роботов [2]. Хотя современные подходы, основанные на глубоком обучении, показывают серьезные перспективы, большинство алгоритмов вычисления оптического потока являются развитием основополагающих подходов Лукаса-Канаде или Хорна-Шунка [3]. В отечественной литературе подобный поход вычисления поля смещения можно встретить в работах П.Р. Кузнецова [4].