Научная статья на тему 'Разработка системы распознавания контента цифровых изображений формата JPEG на основе линейного дискриминантного анализа'

Разработка системы распознавания контента цифровых изображений формата JPEG на основе линейного дискриминантного анализа Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
89
22
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Своеволин Д. В., Скурнович А. В., Ревякин А. М.

В статье рассматриваются способ и построенная на его основе система распознавания контента сжатых цифровых изображений (ЦИ) формата JPEG, позволяющие анализировать коэффициенты дискретного косинусного преобразования (ДКП). В качестве классов рассматриваются ЦИ, содержащие текст и не содержащие текст. Разработанный способ основан на применении математического аппарата линейного дискриминантного анализа.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Своеволин Д. В., Скурнович А. В., Ревякин А. М.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Разработка системы распознавания контента цифровых изображений формата JPEG на основе линейного дискриминантного анализа»

Разработка системы распознавания контента цифровых изображений формата JPEG на основе линейного дискриминантного анализа

Своеволин Д.В.,ФГКВОУ ВО «Академия ФСО России »

svoevolinl @yandex.ru Скурнович А.В., ФГКВОУ ВО Академия ФСО России [email protected] Ревякин А.М., ФГКВОУ ВО Академия ФСО России [email protected]

Аннотация

В статье рассматриваются способ и построенная на его основе система распознавания контента сжатых цифровых изображений (ЦИ) формата JPEG, позволяющие анализировать коэффициенты дискретного косинусного преобразования (ДКП). В качестве классов рассматриваются ЦИ, содержащие текст и не содержащие текст. Разработанный способ основан на применении математического аппарата линейного дискриминантного анализа.

1 Введение

Одной из основных задач при обработке цифровых изображений является автоматизация процесса классификации контента. Проектирование системы распознавания контента предполагает выполнение этапов, представленных на рисунке 1 [Горелик, 2004].

Постановка задачи распознавания

Формирование априорного словаря признаков

Обучение системы распознавания

Нормирование признаков

I

2 Этап обучения

Задача системы распознавания заключается в классификации, поступающих на ее вход цифровых изображений.

Априорный алфавит классов - это графические сообщения формата JPEG с текстом и без него. В качестве управляющего воздействия на систему используется обучение с учителем. Модель системы представлена на рисунке 2.

Результаты обучения системы

Рис. 3. Этапы проектирования системы распознавания

Принадлежность к классу «Текст»

Принадлежность к классу «Не текст»

Рис. 4. Модель предлагаемой системы распознавания

Одним из этапов построения системы распознавания является формирование априорного словаря признаков. На рисунке 3 приведена последовательность этапов декодирования алгоритма JPEG.

Процедуры 1-4 на рисунке 3 - отдельные этапы декодирования. Большинство современных автоматизированных систем распознавания анализируют либо карту пикселей, либо палитру YCbCr [Замарин, Сазонов, 2013]. В предлагаемой системе распознавания используются коэффициенты ДКП в качестве исходной информации для формирования признакового пространства. Это позволяет уменьшить количество операций декодирования (рис. 3) и соответственно время обработки сжатого ЦИ.

Рис. 5. Последовательность этапов декодирования алгоритма JPEG [Скурнович, Ревякин, 2016]

"Ê ! ' !: " г' ! Ê ' "Ê ! ! " ! ! " "Ê Г! ! " " " ¡НИВЙП^ПНКЁКГП

жшттшттЩштш^шттшштУ:

ШЩШЩЩШШШШШШЁЁШ^

illlMl |li|l|rT„,J:rf

г;., ,

|||||Ш|

Рис. 4. ЦИ с пейзажем в палитре RGB (слева) и в коэффициентах ДКП (справа)

ГрвдвТТрИГЧ ( I »кот :г : JÈkïï "Ï" t

Ih^l]^ il?-'-II":''...........

г;;:j;:;:";;г. иявкгив ятог

...

si Sprras; grrffBff да ?

«ЦВрЕ-

fis? ^гК^яр^г.;';;.

jr....,....,

^ j^-FcmiE ФЯВЖВЕЬФ^ПИК.:: '»f-r- " jf-jfKtp-c SfSTEjf ^суу^ццургригау}

...................

Рис. 5. ЦИ с текстом в палитре RGB (слева) и в коэффициентах ДКП (справа)

На рисунках 4 и 5 [Скурнович, Ревякин, 2016] представлены изображения с текстом и без него в цветовой схеме RGB и соответствующие массивы значений коэффициентов ДКП яркостной составляющей Y.

Анализируя изображения, представленные на рисунках, можно утверждать о существовании определенной зависимости между картой пикселей цветовой схемы RGB (на рисунках слева) и массивами значений коэффициентов ДКП (справа) цветовой схемы YCrCb. Следует отметить, что в качестве исходных

данных рассматриваются коэффициенты ДКП только яркостной составляющей У. Выбор элементов яркостной составляющей У основывается на том факте, что данная составляющая цветовой схемы УСгСЬ несет основную информацию о контенте сжатого ЦИ.

На рисунках 6 и 7 [Скурнович, Ревякин, 2016] приведены гистограммы коэффициентов ДКП яркостной компоненты У цветовой схемы УСгСЬ для цифровых изображений, представленных выше в правых частях на рисунках 4 и 5 соответственно.

Рис. 6. Гистограмма значений коэффициентов ДКП цветовой компоненты Y для ЦИ с пейзажем

Рис. 7. Гистограмма значений коэффициентов ДКП цветовой компоненты Y для ЦИ с текстом

Полученные гистограммы свидетельствуют о том, что основные различия между ними на «хвостах» распределений, то есть там, где сосредоточены большие (по модулю), но маловероятные значения коэффициентов ДКП. Для описания каждого сжатого ЦИ из обучающей выборки на языке априорного словаря признаков формируется собственный характеристический вектор ЦИ (1), который включает значения центральных моментов различных порядков, вычисленных из распределения коэффициентов ДКП цветовой компоненты У и характеризующих особенности частотной области анализируемого ЦИ:

,тм ,т(*+2) ,к '} (1)

Формирование априорного словаря признаков на основе значений центральных моментов базируется на утверждении о том, что основными статистическими характеристиками, описывающими распределение случайной величины, являются центральные моменты некоторых порядков, в общем виде вычисляемых согласно выражению (2):

m

(s )

= — "V n (x - x )

/_J l\ l вf

n

(2)

где хв - выборочное среднее, п.- частота появления величины со значением х , п = > п -

г 5 / / г

объем выборки. Отмечается, что моменты более высоких порядков позволяют охарактеризовать и «усилить роль» больших, но маловероятных значений случайной величины [Вентцель, 1969; Гмурман, 2003].

Из векторов всех ЦИ, включенных в обучающую выборку, формируются двумерные массивы признакбов апбриорбного сбловаря для

каждого класса ^). На ос-

нове векторов сжатых ЦИ всей обучающей выборке без разбиения на классы вычисляют среднее арифметическое и среднее квад-

ратическое отклонение ау для каждого у'-го

признака с целью нормирования всех значений признаков априорного словаря в соответствии с выражением (3):

mn

s

(3)

где - т у исходное значение у-го признака г-го ЦИ в обучающей выборке, /т' - соответствующее ему нормированное значение у-го признака г-го сжатого ЦИ. Нормирование элементов векторов признаков приводит к приведению их к безразмерным величинам и к определенному диапазону изменений значений этих признаков.

С целью повышения качества распознавания далее реализуется процедура отбора информативных признаков и формируется рабочий словарь признаков. Используя вектора нормированных признаков обучающей выборки и математический аппарат классификатора оцениваются величины ошибок данного классификатора при использовании всех возможных комбинаций признаков (полный перебор). В рабочий словарь признаков включаются комбинация признаков I, дающая минимальную величину ошибки распознавания на основе сжатых ЦИ обучающей выборки.

Далее используя рабочий словарь признаков производится обучение системы распознавания, основанной на модели линейного дискриминантного анализа. Для двух классов оценивается средняя ковариационная матрица V в соответствии с выражением (4):

1 - (/'(1)г/'(1) + /'(^/'(Ч), (4)

V = -

П + п2 - 2

где п1 и п2 - количество сжатых ЦИ в классах в обучающей выборке, /(к) - двумерные массивы, у которых по строкам расположены координаты центрированных векторов.

/(к) = б'(к) - 1(к\' = 1,...,пк, к = 1,2, (5)

где 1((к> - выборочное среднее у'-го признака для

сжатых ЦИ одного класса.

Для двух классов строится оптимальное линейное прогностическое правило следующего вида [Горелик, 2004; Лепский, 2009]:

У (1,2)(б')= ^б -1 (/'(1) +/'(2 ^. V-1 (/'« -/'(2))Т (6)

где V"1 - обратная ковариационная матрица.

Результатом формирования решающего правила для двух классов является уравнение разделяющей поверхности, которое в общем виде можно представить следующим выражением:

Y (Z/)=b'1/ + bo (7)

Л =(bi,K ,pq ), /30 - коэффициенты линейной прогностической функции, полученные на основе выражения (6).

Сохраняются результаты выполнения этапа обучения:

- вычисленные на основе обучающей выборки значения средних арифметических (m, m2,..., m ) и среднеквадратических отклонений значений всех признаков априорного словаря для нормирования признаков на последующем этапе распознавания;

- список отобранных информативных признаков рабочего словаря ;

- результаты вычислений коэффициентов линейных прогностических функций для каждой пары классов из обучающей выборки.

3 Этап распознавания

Распознавание контента ЦИ в общем виде включает следующие основные процедуры:

1. Считывание результатов обучения классификатора (s,s2,...,s), (m1,m2,...,m), I,

Л л ).

2. Считывание сжатого ЦИ формата JPEG.

3. Формирование двумерного массива коэффициентов ДКП цветовой компоненты Y.

4. Вычисление центральных моментов из распределения коэффициентов ДКП компоненты Y в соответствии с выражением (2).

5. Формирование собственного характеристического вектора признаков ЦИ I в соответствии с (1), учитывая список ианформатив-

ных признаков рабочего словаря I .

6. Нормирование значений признаков собственного характеристического вектора ЦИ в соответствии с выражением (3).

7. Вычисление результатов подстановки нормированных значений признаков собственного характеристического вектора распознаваемого ЦИ в линейное прогностическое правило, сформированное на этапе обучения системы распознавания для двух классов (7), используя сохраненные коэффициенты линейной прогностической функции.

8. Принятие решения по отнесению сжатого ЦИ к одному из распознаваемых классов. При этом руководствуютася правилом: если

результат вычислений YI* )> 0 , то ЦИ принадлежит к первому заданному классу, иначе ко второму.

В настоящее время существуют сложности при формировании эффективного рабочего словаря признаков и подборе необходимого и достаточного размера обучающей выборки. Для оценки эффективности системы распознавания предложены в качестве рабочего словаря признаков центральные моменты со 2-го по 4-ый порядок включительно и обучающая выборка размером по 1 000 ЦИ для каждого из рассматриваемых классов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Необходимо отметить, что эффективность системы распознавания контента ЦИ можно оценить на основе двух показателей: вероятности правильного обнаружения Робн содержащих текст ЦИ в общем массиве и вероятности ложной тревоги Рлт , т. е. когда не содержащие текст ЦИ определяются системой как ЦИ с текстом.

После обучения системы распознавания для ее тестирования был проведен эксперимент: на вход обученной системы распознавания подавалась тестовая выборка из 5 000 ЦИ (4 000 без текста и 1 000 с текстом). Размер файлов ЦИ варьировался в пределах 400800 кбайт. Вероятность правильного распознавания ЦИ с текстом определялась, как отношение правильно отобранных неподвижных ЦИ с текстом к общему их количеству в тестовой выборке. Вероятность ложной тревоги определялась, как обратная величина к отношению ошибочно отобранных неподвижных графических сообщений к общему числу цифровых изображений без текста. Результаты эксперимента представлены в таблице 1.

Для определения временных затрат также был проведен эксперимент, заключающийся в вычислении среднего времени анализа отдельного ЦИ. Результаты эксперимента представлены в таблице 1.

Табл. 1. Оценки показателей эффективности

разработанной системы

Робн Рл.т Время обработки

0,93 0,08 0,5 сек

Представленные результаты проведенных экспериментов свидетельствуют о том, что разработанная система позволяет решать задачу классификации контента с достаточно высокой степенью достоверности. С учетом предложенных теоретических положений и полученных практических результатов, в ходе дальнейшей исследовательской работы необ-

ходимо сформировать более информативный рабочий словарь признаков, проанализировать требуемые размеры обучающей выборки.

Список литературы

Горелик А. Л. 2004. Методы распознавания. Учебное пособие для вузов / А. Л. Горелик, В. А. Скрипкин. - Изд. 4. - Москва : Букинист. -262 с.

Замарин А.И. 2013. Способ распознавания кон-тентного содержания сообщений графических форматов. Патент на изобретение ЯИ № 2479028 / А.И. Замарин, К.В. Сазонов. - Бюл. № 10 от 10.04.2013.

Скурнович А.В. 2016. Подходы к разработке системы распознавания для решения задачи определения контента цифровых изображений. // А.В. Скурнович, А.М. Ревякин. / Электронное научное издание «Науковедение», [Электронный ресурс - Москва : Науковедение, 2016. -Т.8, №4 - 14 с. - Режим доступа: http://naukovedenie.ru/ РБГ/30ТУК416^.

Вентцель Е.С. 1969. Теория вероятностей. Пособие для высших технических учебных заведений / Е.С. Вентцель. Москва : «Наука». - 576 с.

Гмурман В.Е. 2003. Теория вероятностей и математическая статистика. Учеб. пособие для вузов / В.Е. Гмурман. - 9-е изд., стер. - Москва : Высш. шк. - 479 с.: ил.

Лепский А. Е. 2009. Математические методы распознавания образов. Курс лекций. - Таганрог : Изд-во ТТИ ЮФУ. - 155 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.