38/2004
Вестник Ставропольского государственного университета
1:1=1*1
ИСПОЛЬЗОВАНИЕ НЕЙРОСЕТЕВОГО ПОДХОДА К РЕШЕНИЮ ЗАДАЧИ СЖАТИЯ ИЗОБРАЖЕНИЙ С ВОЗМОЖНОСТЬЮ ОСУЩЕСТВЛЕНИЯ ГЕНЕТИЧЕСКОГО ПОИСКА
P.A. Воронкин
THE USE OF NEURONET APPROACH TO THE SOLUTION OF THE PROBLEM CONCERNING IMAGE COMPRESSION WITH THE POSSIBILITY OF GENETIC SEARCH REALISATION
Voronkin R.A.
The paper views the possibility of using auto-associative neuronet trained by the genetic algortthm while solving the image compression problem that allows to realise compression with relatively high compression coefficient under the assigned signal-noise relation at the system output
Рассматривается возможность использования автоассоциативной нейронной сети, обучаемой с помощью генетического алгоритма, при решении задачи сжатия изображений, что позволяет осуществить сжатие с относительно высоким коэффициентом компрессии при заданном отношении сигнал-шум на выходе системы/.
УДК 004.032.026: 004.3
Первыми для сжатия изображений стали применяться алгоритмы сжатия без потерь информации [1]. Те, что использовались и используются в системах резервного копирования, при создании дистрибутивов и т.п. Эти алгоритмы архивировали информацию без изменений. Однако основной тенденцией в последнее время стало использование новых классов изображений. Старые алгоритмы перестали удовлетворять требованиям, предъявляемым к сжатию. Многие изображения практически не сжимались, хотя «на взгляд» обладали явной избыточностью. Это привело к созданию нового типа алгоритмов - сжимающих с потерей информации. Как правило, степень сжатия и, следовательно, степень качества в них можно задавать. При этом достигается компромисс между размером и качеством изображений.
Одна из серьезных проблем машинной графики заключается том, что не найден адекватный критерий оценки потерь качества изображений. Можно привести пример простого критерия: среднеквадратическое отклонение значений пикселов (L2 мера, или root mean square - RMS):
d (x, у ) =
i V
X (xj - y,jl
i=i, j=i
(i)
n
По нему изображение будет сильно испорчено при понижении яркости всего на 5%. Свои недостатки есть и у других критериев.
У 'S Воронкин P.A.
ГЙИИ «Использование нейросетевого подхода к решению задачи сжатия изображений...»
Рассмотрим, например, максимальное отклонение:
d (х, у ) =
maF х - у л
i, ] 1 1
(2)
Эта мера крайне чувствительна к биению отдельных пикселов. То есть во всем изображении может существенно измениться только значение одного пиксела (что практически незаметно для глаза), однако согласно этой мере изображение будет сильно испорчено. Мера, которую сейчас используют на практике, называют мерой отношения сигнала к шуму (peak-to-peak signal-to-noise ratio - PSNR):
d (х, у) = 10 • log10
2552•n2
n,n , *
X ta - у И f
(3)
Iх./ -Уч.
i=l, y=l
Данная мера, по сути, аналогична среднеквадратическому отклонению, однако
пользоваться ею несколько удобнее за счет логарифмического масштаба шкалы. Ей присущи те же недостатки, что и среднеквадратическому отклонению.
Применение нейронной сети позволяет получить новые решения для сжатия изображений с потерей при хороших обобщающих способностях и относительно высоким коэффициентом компрессии [2,3]. Далее будет использована сеть с одним скрытым слоем, изображенная на рис. Скрытый слой содержит ц нейронов, причем ц << п. Входной и скрытый слои выполняют собственно компрессию данных, тогда как скрытый и выходной слои осуществляют декомпрессию. Сеть является автоассоциативной, поэтому ее обучающий вектор d
совпадает с входным вектором х, а выходные сигналы сети соответствуют входным сигналам Хн = хн .
У У
4j
Xnj
Входной слой
Скрытый слой
Рис. Автоассоциативная сеть с прямой связью
Выходной слой
38/2004 ЯШ
Вестник Ставропольского государственного университета
Компрессии подвергаются данные, разделенные на кадры, представляемые последовательностью «-элементарных векторов (п - количество входных узлов). Кадры имеют форму прямоугольника с размерами h пикселов по горизонтали и v - по вертикали. Градации интенсивности пикселов, входящих в кадр, задаются значениями компонентов вектора х . Поскольку q << п, в скрытом слое может храниться меньше информации, чем во входном слое, однако она будет репрезентативной для множества данных и достаточной для реконструкции с заранее заданной точностью оригинальных входных данных. Сигналы скрытого слоя образуют главные компоненты преобразования PCA (Principal Component Analysis -анализ главных компонент), из которых образуется информационное ядро [2, 3]. Количество этих компонентов равно числу нейронов q скрытого слоя. Большее значение q соответствует увеличению объема информации, хранящейся в нейронах скрытого слоя, что в свою очередь обеспечивает лучшее восстановление информации в процессе декомпрессии.
Определенную сложность вызывает обучение описанной нейронной сети, в случае когда нейронами выходного и/или скрытого слоя используются недифференцируе-мые активационные функции, тем более, в задаче сжатия изображений наиболее приемлемым является использование функции «единичного скачка» в качестве функции активации нейронами скрытого и выходного слоев, как это показано на рис. Следовательно, сеть не может быть обучена ни одним методом, связанным с вычислением элементов вектора градиента целевой функции и матрицы Гессе. На основание этого утверждения, можно предложить использование для обучения сетей, выполняющих сжатие изображений, одного из методов глобальной оптимизации, в частности, генетического алгоритма. Тем более использование механизмов генетической эволюции для обучения нейронных сетей кажется естественным, поскольку модели нейронных сетей разрабатываются по аналогии с мозгом и
реализуют некоторые его особенности, появившиеся в результате биологической эволюции [4]. Генетические алгоритмы робаст-ны и особенно эффективны в поиске глобальных экстремумов адаптивных рельефов, так как ими исследуются большие области допустимых значений параметров нейронной сети.
В качестве целевой функции, используемой генетическим алгоритмом, возможно использование отношения сигнала к шуму Р8М? полученного из формулы (3). Эволюция особей популяции генетического алгоритма будет направлена на увеличение значения Р8МЯ и, тем самым, на улучшение качества изображения после применения последовательности действий компрессия-декомпрессия над исходным изображением.
Таким образом, применение автоассоциативной нейронной сети, обучаемой при помощи генетического алгоритма, позволяет по-новому взглянуть на задачу сжатия изображений с потерями. Благодаря высокой обобщающей способности обученной нейронной сети, возможно осуществить сжатие с относительно высоким коэффициентом компрессии. Более высокие показатели сжатия можно иногда достичь с помощью дополнительных скрытых слоев [2].
ЛИТЕРАТУРА
1. Ватолин Д., Ратушняк А., Смирное М., Юкин В. Методы сжатия данных. Устройстео архиеаторое, сжатие изображений и еидео. -М.:ДИАЛОГ-МИФИ, 2002.
2. Калан, Роберт. Осноеные концепции нейронных сетей / Пер. с англ. - М.: Издательский дом «Вильямс», 2001.
3. Осоеский С. Нейронные сети для обработки информации / Пер. с польского И.Д. Рудинского. - М.: Финансы и статистика, 2002.
4. Круглое В.В., Борисое В.В. Искусстеенные нейронные сети. Теория и практика. - М.: Горячая линия - Телеком, 2001.
Об авторе
Воронкин Роман Александрович, кандидат технических наук. Область научных интересов -сжатие данных, искусственный интеллект, нейронные сети, генетические алгоритмы.