УДК 004.451.34
Информационные технологии
СЖАТИЕ ВЫХОДНЫХ ДАННЫХ В ПРОГРАММНОМ КОМПЛЕКСЕ ”ТКОР1С8” НА ОСНОВЕ АЛГОРИТМА ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЯ ИНФОРМАЦИИ В.А. Г алкин, Д.А. Моргун, Т.К. Филиппов
В статье представлены программные способы обработки и сжатия данных, формирующихся в результате проведенных экспериментов по моделированию траекторий движения частиц в осевых и плоскостных каналах кристалла. На основе полученных выходных данных проведен сравнительный анализ сжатия по определенным в ходе эксперимента параметрам
Ключевые слова: сжатие, вейвлет-преобразование, кристалл, моделирование
Основные задачи, для решения которых используются вейвлеты, — это сжатие
сигналов и удаление шума. При этом чаще всего используется пороговая обработка вейвлет-коэффициентов, которая обнуляет коэффициенты, не превышающие заданного порога. Наличие шума и процедуры пороговой обработки неизбежно приводят к погрешностям в оцениваемом сигнале. Свойства оценки таких погрешностей (риска) исследовались во многих работах[1,2]. При определенных условиях оценка риска является асимптотически нормальной [1] .
В ряде рассмотренных работ, связанных с вейвлетами[8-12], процесс сжатия и все операции, связанные с предварительным преобразованием информации предполагается проводить над изображениями.
В данной работе исследуется вопрос сжатия данных, основанного на устранении избыточности, содержащейся в исходных данных с применением вейвлет-обработки информации. Сокращение объёма данных достигается за счёт замены часто встречающихся данных короткими кодовыми словами, а редких — длинными (энтропийное кодирование). Главной задачей в каждом виде обработки данных является нахождение эффективного представления, которое позволяет отобразить его в компактной форме. В современной теории и практике цифровой обработки сигналов активно используются сигналы специального вида - вейвлеты, показавшие свою эффективность в спектральном анализе сигналов. Двумерное
Галкин Валерий Алексеевич - ОИАЭ, руководитель ИАТЭ НИЯУ МИФИ, д-р физ.-мат. наук, профессор, e-mail: [email protected]
Моргун Дмитрий Алексеевич - СурГУ, канд. физ.-мат. наук, доцент, тел. 8 (3462) 76-31-01,
e-mail: [email protected]
Филиппов Тимур Константинович - СурГУ, аспирант, e-mail: [email protected]
дискретное вейвлет-преобразование (2Б) -один из самых важных инструментов.
2Б получается в результате применения одномерного вейвлет-преобразования (Ю)
последовательно к строкам и столбцам[3].
Вейвлеты Хаара представляют собой кусочно-постоянные функции, заданные на конечных интервалах различных масштабов и принимающие два значения {-1; +1}. Вейвлеты Хаара единичного масштаба и нулевого смещения (материнский вейвлет Хаара) - это функция, равная +1 на интервале [0; /) и -1 на интервале [/; 1). Вейвлеты Хаара хорошо зарекомендовали себя в практических задачах обработки дискретных сигналов, таких, как массивы отсчетов аудиосигналов и цифровые фотографии.
Преобразование Хаара и быстрое преобразование Хаара
Преобразование Хаара является одним из простейших и базисным вейвлет -
преобразованием. Пусть имеется одномерный дискретный сигнал / = (/1, /2,..., /ы ).
Преобразование Хаара разлагает каждый сигнал на два компонента, один из которых называется средним, а другой известен как разность [13]. Первое среднее значение подсигнала а =(а,а2,...,аы ) на первом
уровне для одного сигнала длиной Ы,
(/ = (/1, /2,.., /ы )) вычисляется по формуле:
А і + А N
ап = 72п2п ,п = 1,2,3..., —, и первый
л/2 2
детализирующий подсигнал
С = (С1, с12,..., с1ы ) вычисляются по формуле:
d
f2 n-1 J2
2 n
n
1,2,3....
N
42 ' ''' 2
Эти значения формируют два новых сигнала а = {ап},пе Z и ё = {ёп},пе Zодин из которых является огрубленной версией исходного сигнала (каждой паре элементов /
соответствует их среднее арифметическое), а другой содержит информацию (будем называть ее детализирующей), необходимую для восстановления исходного сигнала.
Обработка выходных данных в программном комплексе «TROPICS»
Все результаты исследований и эксперименты проведены над выходными данными программного комплекса
TROPICS[4], предназначенного для моделирования траекторий движения быстрых заряженных частиц в осевых и плоскостных каналах. В основе комплекса лежит ранее хорошо зарекомендовавший себя подход [5,6] к описанию каналирования. Комплекс предназначен для ведущих ускорительных центров мира, например, CERN для решения задачи отклонения быстрых заряженных частиц.
В ходе экспериментов по моделированию траекторий движения частиц на выходе были получены данные, размер которых варьируется от десятков мегабайт до десятков гигабайт. В данном случае возникла необходимость сжатия данных для их дальнейшего обработки и хранения.
При проведении эксперимента[7], в котором учитывалось угловое разрешение детектирующей системы и расходимость пучка, число частиц было выбрано в диапазоне 2000040000, количество узлов решения системы дифференциальных уравнений (отношение длины кристалла к шагу по глубине) было выбрано в интервале 1000-5000 штук. В ходе эксперимента по сжатию выходных данных, были использованы файлы различного объема: 1009, 2921, 5300, 9972, 15257 мегабайт.
Основными техническими
характеристиками процессов сжатия и результатов их работы являются:
- степень сжатия или отношение объемов исходного и результирующего потоков;
- скорость сжатия - время, затрачиваемое на сжатие некоторого объема информации входного потока, до получения из него эквивалентного выходного потока;
В качестве дополнительного критерия был взят параметр загрузки процессора во время проведения процесса сжатия данных.
С целью эффективного сжатия был создан программный продукт для архивации файлов большого размера с применением вейвлет-обработки данных: WaveRar. Также для
сравнительного анализа были использованы архиваторы WinRAR, WinZip, 7-Zip. В
таблицах и на графиках ниже представлены результаты сжатия по объему, времени и загрузке процессора.
Как видно из графиков и таблиц результатов сжатия, положительный результат достигнут во времени, причем значительное преимущество выделяется на массивах данных с большим объемом, что принципиально важно при работе с выходными данными большого размера, как например, в комплексе TROPICS.
Результаты сжатия по объему хоть и продемонстрировали отрицательный результат по отношению к программам-аналогам, но тем не менее коэффициент сжатия является вполне пригодным для последующего использования.
Также положительные результаты наблюдаются в сжатии данных по загрузке процессора. В некоторых экспериментах данное преимущество вырастает практически в два раза, что говорит о грамотно подобранном алгоритме преобразования и сжатия цифровых данных.
Таблица 1
Результаты сжатия данных по объему______________
Размер файла, mb WinRAR, mb 7-Zip, mb W aveRar, mb
1009 711 652 882
2921 836 776 1033
5300 3709 3445 4295
9972 4327 4015 4295
15257 1111 1171 1550
5000
4500
1009 мб 2921 мб 5300 мб 9 9 72 мб 15257 мб
Рис. 1. График результатов сжатия данных по объему
Таблица 2
________Результаты сжатия данных по времени______________
Размер файла, mb WinZip, с WinRAR, c 7-Zip, с WaveRar, с
240 9 18 32 48
529 13 29 62 99
1009 140 658 445 280
2921 --- 605 550 444
5300 --- 2719 2013 1487
9972 --- 2987 2199 1890
15257 --- 1744 1758 589
I ■ ■ ■ ■
Литература
1. А.В. Маркин, Предельное распределение оценки риска при пороговой обработке вейвлет-коэффициентов // Информатика и её применения, 2009. Т. 3.№4. С. 57-63.
2. А.В. Маркин, О.В. Шестаков, О состоятельности оценки риска при пороговой обработке вейвлет-коэффициентов // Вестник Московского университета. Сер. 15. Вычисл. матем. и киберн., 2010.№1. C. 26-34.
3. http://www.lib.tpu.ru/fulltext/v/Bulletin TPU/2011/ v318/i5/15.pdf
4. Д.А.Моргун, В.П.Кощеев, Ю.Н. Штанов, Численное решение стохастических дифференциальных уравнений движения частиц в плоскостных каналах кристалла // Тезисы докладов XL международной конференции по физике взаимодействия заряженных частиц с кристаллами // Под. ред. проф. А.Ф. Тулинова. -М.: Университетская книга, 2010 - 226с.
5. В.П.Кощеев, Ланжевеновский поход в теории каналирования. Сургут: СурГУ, 2001. С. 86.
6. В.П.Кощеев, Д.А.Моргун, Н.В.Сафин,
А.К.Холодов, Компьютерное моделирование траекторий каналированных ионов // Поверхность. Рентгеновские, синхротронные и нейтронные исследования. - 2006. - №7.
- с.48-51.
7. W.Scandale et al., Phys. Rev. Lett. 101, 164801 (2008).
8. A.V.Shokurov, Image coding with afterwards possible optimal decoding, Fundamentalnaya i prikladnaya matematika, vol. 13 (2007), no. 5, pp. 225—255.
9. О. В. Шестаков, Аппроксимация распределения оценки риска пороговой обработки вейвлет-коэффициентов нормальным распределением при использовании выборочной дисперсии. Информатика и ее применения, 2010. Т.4. Вып. 4. С. 72-79.
10. И.Я.Богатушин, Р.И.Полонников. Методы обработки одномерных сигналов на основе вейвлет-преобразований // Труды СПИИРАН, Вып. 2, т. 2. — СПб.: Наука, 2005.
11. R.Duits, B.Romeny, M.Felsberg “Image Analysis and Reconstruction using a Wavelet Transform Constructed from a Reducible Representation of the Euclidean Motion Group”, International Journal of Computer Vision 72(1), 79102, 2007.
12. S.Tan, L.Jiao “Multivariate Statistical Models for Image Denoising in the Wavelet Domain”, International Journal of Computer Vision 75(2), 209-230, 2007.
13. B.Anuj, A.Rashid, Image compression using modified fast Haar wavelet transform // World Appl. Sci. J. 2009. V. 7, N 5. P. 647-653.
Обнинский институт атомной энергетики (филиал "Национальный исследовательский ядерный университет "МИФИ")
Сургутский государственный университет
OUTPUT COMPRESSION USING "TROPICS" BASED ON THE ALGORITHM OF WAVELET
TRANSFORMATION OF INFORMATION
V.A. Galkin, D.A. Morgun, T.K. Filippov
The article presents the methods of processing software and data compression, formed as a result of the experiments on modeling the trajectories of particle motion in the axial and planar channels of the crystal. Based on the output of a comparative analysis of compression on certain parameters during the experiment
13 140 --- --- --- ---
529 мб 1009 мб 2921 мб 5300 мб 9972 мб 15257 мб
Рис. 2. График результатов сжатия данных по времени
Таблица 3
Размер файла, мб Сжатие WinZip, % Сжатие WinRAR, % Сжатие 7-Zip, % Сжатие WaveRar, %
240 50 75 62 50
529 50 69 62 48
1009 45 60 83 47
2921 - 73 90 49
5300 - 74 83 47
9972 - 70 91 49
15257 - 70 65 50
100
90
80
70
60
50
40
30
20
10
0
iJj Jl
I 1
240 529 1009 2921 5300 9972 15257
мб мб мб мб мб мб мб
RAR
7.Z
I Wave Rar
Рис. 3. График результатов сжатия данных по загрузке процессора
7.Z
Wave
0
9
Key words: compression, wavelet transform, modeling, the crystal