УДК 004.627
О.О. Евсютин, М.М. Милихин
Сжатие цифровых изображений, используемых в геоинформационной системе электронного генерального плана промышленного предприятия
Рассматривается сжатие цифровых изображений, используемых в веб-ориентированной геоинформационной системе электронного генерального плана промышленного предприятия, с помощью метода, построенного на основе математического аппарата теории клеточных автоматов.
Ключевые слова: сжатие цифровых изображений, клеточные автоматы, геоинформационная система.
Геоинформационные технологии и системы, реализующие возможность представления и анализа пространственных данных, востребованы во многих отраслях производства [1]. Данные технологии в сочетании с веб-ориентированным подходом обеспечивают возможность создания единой распределенной системы мониторинга инженерных коммуникаций промышленного предприятия, ведения административного и инвентаризационного учета объектов предприятия, а также разработки генерального плана как основного инженерного проектного документа организации. В настоящей статье рассматриваются вопросы сжатия цифровых изображений - картографических подложек, используемых в такой системе, получившей название геоинформационной системы электронного генерального плана промышленного предприятия (ГИС ЭГП) [2].
Описание ГИС ЭГП. В процессе эксплуатации ГИС ЭГП можно выделить этапы создания (решение задач предварительной подготовки, организации хранения и загрузки данных описаний объектов генерального плана в хранилище пространственно-временных объектов системы), ведения и эксплуатации ЭГП (решение задач планирования регламентных работ, создания выкопировки области генплана, аппроксимации данных с помощью методов нечеткого моделирования и т.д.). Общая схема эксплуатации ЭГП представлена на рис. 1.
Инстру ментальная
Пользователь
Рис. 1. Общая схема эксплуатации ЭГП инженерной инфраструктуры
В соответствии с приведенной схемой пространственные и атрибутивные данные, введенные в систему на этапе создания ЭГП, служат основой формирования генерального плана на протяжении всего жизненного цикла системы.
Описание объектов ЭГП включает в себя атрибутивную и пространственную составляющие (рис. 2). Пространственные данные, в свою очередь, в соответствии с моделью послойного представления геоданных, представлены совокупностью слоев описаний геометрических свойств объектов инфраструктуры предприятия, а также графических подложек, служащих основой картографического представления информации в системе.
Рис. 2. Структура данных ГИС ЭГП
Исходные данные для ЭГП представляются на бумажных или электронных носителях. Если исходные данные на электронных носителях могут быть представлены принятыми промышленными стандартами (файлами форматов *^Ьр, *^хГ, *.ші£), то через инструментальные ГИС такие данные могут быть загружены в хранилище пространственно-временных данных системы.
Данные с бумажных носителей и электронных носителей (например, растровые изображения), которые невозможно представить в соответствии с промышленными стандартами, должны быть оцифрованы с использованием инструментальных ГИС. Такие данные становятся картографическими подложками в системе. Характерными чертами подложек является отсутствие изменений (таких, как возможность добавления описаний новых объектов, характерная слоям геоданных) с течением времени, а также невозможность привязки атрибутивных описаний и характеристик к объектам, представленным на подложке.
С точки зрения организации хранения пространственных данных в системе основное различие между слоями пространственных объектов и картографическими подложками заключается в различии формата представления данных. В то время как описание слоев геоданных и отдельных пространственных объектов хранится в виде соответствующих структур объектно-реляционной базы данных, подложки представлены, как правило, растровыми изображениями (в форматах *0р§, *.рп§ и т. д.).
Обеспечивая наглядность представленной информации и отвечая за отражение соотношения объектов генерального плана с географическими объектами окружающей местности и предоставление дополнительных (таких, как фотоснимки из космоса) данных для анализа, подложки служат основой многих формируемых в системе отчетов и печатных документов [6].
В соответствии с клиент-серверной архитектурой программного обеспечения ЭГП, каждое действие пользователя веб-ГИС-клиента по изменению картографического представления пространственных данных (операции масштабирования, навигации, изменение видимости отдельных слоев) требует обращения к веб-ГИС-серверу для обновления графического представления карты. Объем передаваемых данных в течение одного запроса может достигать нескольких мегабайт в зависимости от качества и степени заполнения изображения карты генерального плана. Такие растровые изображения формируют большую часть данных, передаваемых между отдельными программными комплексами системы в ходе ее эксплуатации, и создают значительную нагрузку на сеть. Являясь фоновой составляющей карты, графические подложки в значительной степени определяют объем всего изображения карты, поэтому задача оптимизации объема памяти, выделяемой для представления картографических подложек, становится особенно актуальной при проектировании и разработке веб-ориентированной ГИС.
В отличие от картографического представления послойного описания пространственных данных ЭГП, представляющего собой классическое дискретно-тоновое изображение, картографические подложки, в качестве которых выступают, как правило, фотографические изображения объектов инфраструктуры предприятия, являются полутоновыми или непрерывно-тоновыми изображениями. Присущая таким изображениям пространственная избыточность позволяет эффективно применять методы сжатия с потерями информации, выводя на передний план качество восстанавливаемых после сжатия изображений, определяемое характером и степенью искажений - так называемых артефактов сжатия. В рассматриваемой ГИС ЭГП для сжатия цифровых изображений - картографических подложек был использован метод сжатия с потерями, построенный на основе математического аппарата теории клеточных автоматов.
Метод сжатия цифровых изображений на основе клеточных автоматов. В рамках рассматриваемого метода сжатия цифровых изображений математический аппарат теории клеточных автоматов используется для построения ортогонального базиса, являющегося основой преобразования элементов изображения к виду, когда между ними отсутствует пространственная избыточность и наличествует лишь статистическая, называемого декоррелирующим клеточным преобразованием (ДКлП) [3].
В общем случае размерность базиса ДКлП может быть произвольной, однако на практике уместно использовать ДКлП, построенные на основе базисов, имеющих размерность 8x8, поскольку в пределах данной области пространственная избыточность является наиболее выраженной [4].
ДКлП цифрового изображения осуществляется в несколько итераций, на первой из которых матрица значений пикселей разделяется на четыре равных квадранта: квадрант низкочастотных составляющих и три квадранта высокочастотных составляющих. В ходе каждой последующей итерации аналогичным образом преобразуется квадрант низкочастотных составляющих, полученный на предыдущей итерации. Число таких итераций обозначим ? > 3 и будем говорить о ? -уровневом ДКлП.
Очевидно, что для осуществления подобного преобразования стороны исходного изображения
должны быть кратны 2Г. Кроме того, преобразуемая часть матрицы элементов данных должна каждый раз разбиваться на целое число блоков размера 8x8. Поэтому исходная матрица значений пикселей, которую обозначим Р = (/Ху) °, 0 , на этапе предварительной обработки преобразуется в
V ’-Г/Х=1. У=1
X=1, y=1
m, n
x=1, y=1'
mo, если mo = 0 (mod 2t+2
mo - go mod 2t+2 ) + 2t+2, в противном случае,
г (1)
n o, если no = 0 (mod 2t+2),
no - ( mod 2r+2) 2t+2, в противном случае.
Значения элементов матрицы F' определяются следующим образом:
fXy, если x < m и y < n,
f'x,y = j fm-xo, y, если x = m-1 + xo, xo > o, (2)
fx,m-yo , если У = n -1 + У0, yo > °.
Если преобразуемое изображение является непрерывно-тоновым, то осуществляется переход от цветовой модели RGB к модели YCbCr [5]. Для полутоновых цифровых изображений этот шаг опускается.
После предварительной обработки изображения осуществляется t -уровневое ДКлП. Матрицу
полученных в результате значений обозначим G = (gx y) , . Здесь необходимо отметить, что в
v ’-r/x=1, y=1
рассматриваемом методе сжатия может использоваться любое ДКлП, определяемое базисом раз-
мерности 8x8 и характеризующееся частотным спектром с равным количеством низко- и высокочастотных составляющих среди преобразованных элементов данных.
На следующем этапе преобразованные элементы данных подвергаются скалярному квантованию по уровням декоррелирующего преобразования. Выбор данной схемы определяется тем, что частотные составляющие различных уровней преобразования не являются равноценными в отношении той части информации (энергии) исходного изображения, которая в них сосредоточена, вследствие чего уместно использовать разные значения квантователя для высокочастотных составляющих разных уровней. Таким образом, схему квантования по уровням декоррелирующего преобразования можно описать как SQ = (дн , Об), где дн представляет собой некоторое вещественное
значение, используемое для квантования низкочастотных составляющих, а Об = (д) ^ - вектор
коэффициентов квантования для высокочастотных составляющих каждого из ? уровней преобразования.
Схема квантования по уровням декоррелирующего преобразования может быть применена к преобразованным элементам данных только после завершения всех итераций преобразования с перегруппировкой частотных составляющих после каждого итерации.
Для описания расположения частотных составляющих в О введем матрицу аналогичного раз-
мера
У =
w=Ку)Т г
V 5-'/х=1, у =1
значения
элементов
которой
определяются
как
, т п
к, если х>—г или у>—т,
2к 2к
т т
і + 1, если х <— и у <—, і ^ Л
к = 1, і , где значение і + 1 указывает на низкочастотные со-
соответственно матрицу квантованных зна-
2 2
ставляющие, расположенные в верхнем левом квадранте і -го уровня.
Обозначим є'=(§ х, у) п 1 и с"=(§ х, у )т’п 1
V ^ /х=1, у=1 V ’-г/х=1, у=1
чений элементов данных и матрицу значений элементов данных, восстановленных после квантования. Тогда квантование и обратное ему преобразование будут осуществляться по формулам:
§х, у
§ х, у
ёх,у :
если Wx, у
= І + 1,
если Wx, у
< і,
если Wx, у
=і + 1, , < і.
(3)
(4)
,х>у • Ях,у, если ^х,у-
Основной целью квантования является получение вместо вещественных значений на выходе ДКлП малых целочисленных значений из алфавита малой мощности, которые могут быть эффективно сжаты посредством энтропийного кодирования.
Типичное распределение малых величин по квадрантам преобразованных элементов данных для рассматриваемого метода сжатия выглядит следующим образом. В правых верхних квадрантах всех уровней декоррелирующего преобразования малые величины с одинаковыми значениями образуют вертикально ориентированные полосы, в левых нижних квадрантах - горизонтально ориентированные. Расположение элементов в диагональных квадрантах не дает такой выраженной закономерности, однако там содержится большое количество значений, равных 0 или ±1.
После преобразования и квантования цифрового изображения элементы матрицы О' собираются в три вектора, которые обозначим 02, Оз и 04 . Вектор 02 содержит элементы правых верхних квадрантов, обход которых производится по столбцам сверху вниз, начиная с верхнего левого угла, вектор Оз - элементы левых нижних квадрантов, обход которых производится по строкам слева направо, начиная с верхнего левого угла, вектор 04 - элементы диагональных квадрантов, обход которых производится по побочным диагоналям, начиная с верхнего левого угла (рис. з).
Квадрант низкочастотных составляющих обрабатывается отдельно. Прежде всего отдельно записывается элемент, стоящий в верхнем левом углу данного квадранта. Обозначим его а. Затем элементы квадранта обходятся по строкам слева направо, начиная с первой строки, и формируется вектор Qi, каждый очередной элемент которого представляет собой разность между текущим и
предыдущим элементами просматриваемой строки.
После завершения обхода квантованных элементов данных каждый из сформированных векторов Qi, i = 1,4 , заменяется вектором Qi , элементы которого образуют пары вида (a, c), где a - значение элемента данных, c - количество подряд идущих значений.
Далее векторы Qi, i = 1,4 , подвергаются арифметическому кодированию и результат записывается в файл.
Восстановление изображения из сжатого файла происходит аналогичным образом и может быть описано следующей последовательностью этапов:
1. Восстановление векторов Qi, i = 1,4 , из арифметического кода.
2. Формирование матрицы G' из серий квантованных элементов данных.
3. Получение матрицы G" в результате преобразования, обратного квантованию.
4. Получение матрицы F" в результате обратного ДКлП.
5. Восстановление цветовой модели исходного изображения.
В результате применения описанного метода на основе клеточных автоматов для сжатия картографических подложек, используемых в ГИС ЭГП, было достигнуто повышение качества восстанавливаемых изображений на величину от 0,5 до 1,5 Дб при равной степени сжатия по сравнению с используемым ранее методом JPEG.
Заключение. Выполнение данной работы проводилось при финансовой поддержке Министерства образования и науки Российской Федерации в рамках мероприятия 2.4 федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы». Проект «Разработка Web-ориентированных гео-информационных технологий формирования и мониторинга электронного генерального плана инженерной инфраструктуры», государственный контракт № 07.524.11.4013 от 03 ноября 2011 г.
Литература
1. Гриценко Ю.Б. Типовые архитектурные решения геоинформационных систем ведения инженерной инфраструктуры предприятия / Ю.Б. Гриценко, О.И. Жуковский // Доклады ТУСУРа. - 2011. -№ 2 (24), ч. 2. - С. 171-175.
2. Ехлаков Ю.П. Автоматизация процессов управления инженерной инфраструктурой промышленного предприятия на базе электронного генерального плана / Ю. П. Ехлаков, Ю. Б. Гриценко, О.И. Жуковский // Доклады ТУСУРа. - 2011. - № 2 (24), ч. 3. - С. 108-117.
3. Евсютин О.О. Приложения клеточных автоматов в области информационной безопасности и обработки данных / О.О. Евсютин, А.А. Шелупанов // Доклады ТУСУРа. - 2012. - № 1 (25), ч. 2. -С.119-125.
4. Сэломон Д. Сжатие данных, изображений и звука. - М.: Техносфера, 2004. - 368 с.
5. Strutz T. Bilddatenkompression. - Wiesbaden: Vieweg+Teubner, 2009. - 394 S.
6. Зыков Д.Д. Проблема информационной безопасности наноэлектроники / Д.Д. Зыков, РВ. Мещеряков, С.С. Бондарчук // Доклады ТУСУРа. - 2010. - № 1 (21), ч. 1. - С. 93-96.
НЧ 1-1
—V /
► ►-
►-
Рис. 3. Формирование серий квантованных элементов данных
Евсютин Олег Олегович
Аспирант каф. комплексной информационной безопасности электронно-вычислительных систем ТУСУРа Тел.: +7-923-403-09-21 Эл. почта: [email protected]
Милихин Михаил Михайлович
Студент каф. автоматизации обработки информации ТУСУРа Эл. почта: [email protected]
Evsutin O.O., Milikhin M.M.
Compression of digital images, used in geo-information system of electronic general plan in an industrial enterprise
In the article we describe the compression of digital images, which are used in Web-based geographic information system of electronic general plan in an industrial enterprise, by means of method, based on mathematical apparatus of cellular automata theory.
Keywords: digital images compression, cellular automata, geographic information system.