Научная статья на тему 'ПРЕОБРАЗОВАНИЕ ЦВЕТОВОЙ ПАЛИТРЫ ИЗОБРАЖЕНИЯ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ РАДИАЛЬНО-БАЗИСНЫХ ФУНКЦИЙ'

ПРЕОБРАЗОВАНИЕ ЦВЕТОВОЙ ПАЛИТРЫ ИЗОБРАЖЕНИЯ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ РАДИАЛЬНО-БАЗИСНЫХ ФУНКЦИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
127
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИСКУССТВЕННАЯ НЕЙРОННАЯ СЕТЬ / СЕТЬ РАДИАЛЬНО-БАЗИСНЫХ ФУНКЦИЙ / РБФ-СЕТЬ / СЖАТИЕ ИЗОБРАЖЕНИЯ / ЦВЕТОВАЯ ПАЛИТРА / ARTIFICIAL NEURAL NETWORK / RADIAL BASIS FUNCTION NETWORK / RBF NETWORK / IMAGE COMPRESSION / COLOR GAMUT

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Петров Иван Дмитриевич, Дударов Сергей Павлович

В статье рассмотрена нейронная сеть радиально-базисных функций (РБФ-сеть), обученная для преобразования исходного полноценного изображения к заданной ограниченной цветовой палитре. Разработано программно-алгоритмическое обеспечение для обучения нейронной сети и воспроизведения поданного изображения в нужной палитре с помощью ранее обученной сети. Рассмотрены две структуры РБФ-сети, различающиеся форматом представления выходов

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Петров Иван Дмитриевич, Дударов Сергей Павлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CONVERSION OF COLOR GAMUT OF IMAGE USING NEURAL RADIAL BASIS FUNCTION NETWORKS

The article describes a neural radial basis function network (RBF network), trained to convert a full-fledged image into a limited color gamut. Algorithmic software for training the neural network and reproducing of the filed image in the proper gamut using the previously trained network was developed. Two structures of the RBF network, differing in the format of the outputs, are discussed.

Текст научной работы на тему «ПРЕОБРАЗОВАНИЕ ЦВЕТОВОЙ ПАЛИТРЫ ИЗОБРАЖЕНИЯ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ РАДИАЛЬНО-БАЗИСНЫХ ФУНКЦИЙ»

УДК 004.8

Петров И.Д., Дударов С.П.

ПРЕОБРАЗОВАНИЕ ЦВЕТОВОЙ ПАЛИТРЫ ИЗОБРАЖЕНИЯ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ РАДИАЛЬНО -БАЗИСНЫХ ФУНКЦИЙ

Петров Иван Дмитриевич, студент 1 курса магистратуры кафедры информационных компьютерных технологий; Дударов Сергей Павлович, к.т.н., доцент, декан факультета информационных технологий и управления, e-mail: dudarov@muctr.ru,

Российский химико-технологический университет имени Д. И. Менделеева, Москва, Россия 125047, Москва, Миусская пл., д. 9

В статье рассмотрена нейронная сеть радиально-базисных функций (РБФ-сеть), обученная для преобразования исходного полноценного изображения к заданной ограниченной цветовой палитре. Разработано программно-алгоритмическое обеспечение для обучения нейронной сети и воспроизведения поданного изображения в нужной палитре с помощью ранее обученной сети. Рассмотрены две структуры РБФ-сети, различающиеся форматом представления выходов.

Ключевые слова: искусственная нейронная сеть, сеть радиально-базисных функций, РБФ-сеть, сжатие изображения, цветовая палитра.

CONVERSION OF COLOR GAMUT OF IMAGE USING NEURAL RADIAL BASIS FUNCTION NETWORKS

Petrov I.D., Dudarov S.P.

D. Mendeleev University of Chemical Technology of Russia, Moscow, Russia

The article describes a neural radial basis function network (RBF network), trained to convert a full-fledged image into a limited color gamut. Algorithmic software for training the neural network and reproducing of the filed image in the proper gamut using the previously trained network was developed. Two structures of the RBF network, differing in the format of the outputs, are discussed.

Keywords: artificial neural network, radial basis function network, RBF network, image compression, color gamut.

Современный уровень информационных технологий и, в частности, средств визуализации графической информации очень высок. Существует большое количество инструментов, позволяющих целенаправленно преобразовывать изображения. Среди решаемых в этом направлении задач интересными и актуальными остаются сжатие изображений, преобразование цветовой палитры, применение фильтров и спецэффектов. Отдельный интерес вызывает возможность использования искусственных нейронных сетей для перечисленных целей. В данной работе предлагается использование нейронной сети радиально-базисных функций для преобразования изображения из более широкого, а значит и более емкого диапазона цветов, к ограниченной палитре заданного состава.

Решаемую задачу можно сформулировать как задачу классификации, когда известны эталонные классы (цвета результирующей палитры) и нужно к ним привести все цвета исходной палитры, из которых лишь малая часть совпадает с эталонными цветами. В качестве нейросетевого инструмента решения поставленной задачи могут использоваться однослойный и многослойный перцептрон, сеть радиально-базисных функций, сеть

гетероассоциативной памяти, сеть Хэмминга [1]. У каждого из этих классов есть преимущества, недостатки и ограничения. Некоторые из них еще плохо изучены применительно к рассматриваемой предметной области. Поскольку речь идет о сжатии изображения за счет уменьшения количества цветов,

возьмем для примера стандартную 16-цветовую результирующую палитру: черный, синий, морская волна, фуксин, серый, зеленый, ярко-зеленый, бордовый, темно-синий, оливковый, фиолетовый, красный, серебряный, серо-зеленый, желтый, белый. Таким образом, получим всего 16 классов, на которых будет обучена нейронная сеть и к которым нужно будет привести все остальные входные цвета.

РБФ-сети достаточно просты по своей структуре, легко настраиваемы и быстро обучаются [2]. Перечисленные преимущества позволяют остановить выбор нейросетевого математического аппарата для классификации данных на них. Структура РБФ-сети содержит два слоя нейронов. Выходы первого слоя активируются множеством радиально-базисных функций. Фактически они обрабатывают вектор входных значений, определяя степень близости каждого из них к центрам радиально-симметричных функций. Выходы нейронов второго слоя - это линейные комбинации выходов первого слоя [1].

В данной задаче характеристическим признаком, обуславливающим принадлежность к тому или иному классу, будет набор каналов цветовой модели RGB, определяемой тремя входами - компонентами первичных цветов: красного, зеленого и синего. Выходные значения, показывающие

принадлежность к эталонным классам, можно закодировать двумя способами:

- вектором из 16 бинарных выходных элементов, только один из которых может быть активирован (равен 1), остальные - нулевые;

- вектором из 4 бинарных выходных элементов, которые составляют 16 различных комбинаций нулей и единиц, соответствующих 16 эталонным классам.

Таблица 1. Форматы представления выходов РБФ-сети

Второй вариант представления выходов обычно позволяет получать несколько менее точные результаты, однако менее время- и ресурсоемкий за счет более простой структуры нейронной сети.

Форматы представления выходов нейронных сетей для двух описанных вариантов представлены в таблице 1.

Цвет 1 вариант - 16 выходов 2 вариант - 4 выхода

Черный 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

Синий 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1

Морская волна 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0

Фуксин 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1

Серый 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0

Темно-зеленый 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 1

Зеленый 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 1 0

Бордовый 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 1 1

Темно-синий 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0

Оливковый 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 1

Красный 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 1 0

Фиолетовый 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 1 1

Серебряный 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 0

Серо-зеленый 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 1 0 1

Белый 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 1 1 0

Желтый 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1

В качестве радиально-базисной функции выбрана традиционная для данного класса нейронных сетей функция Гаусса:

Н(х ) = ехр(— X — <?||2 ),

где О - параметр насыщения, с - вектор центров радиально-базисных функций, соответствующих ЯОБ-координатам эталонных цветов

результирующей палитры.

Схемы структур нейронных сетей с обоими вариантами представления выходов приведены на рис. 1.

Элементы Н\-Н\6 скрытых слоев нейронных сетей показывают степень близости поданного входного вектора к каждому из эталонных цветов.

Алгоритм обучения РБФ-сети подробно описан в работе [1]. В ходе обучения были выбраны настройки радиально-базисных функций: центры и параметр насыщения. Так как количество эталонных образов невелико, каждому центровому вектору слоя радиальных элементов поставлен в соответствие входной вектор соответствующего примера обучающей выборки. Параметр насыщения определялся с учетом среднего расстояния между нормализованными координатами первичных цветов эталонного набора: О □ □□.

Для линейного комбинирования сигналов в выходном слое РБФ-сети с использованием эталонных примеров получены весовые

коэффициенты. Для структуры с 16 выходами рассчитано 256 таких коэффициентов, для структуры с 4 выходами - 64 коэффициента.

Для реализации программного обеспечения, моделирующего работу двух вариантов нейронных сетей, были выбраны среда Qt и язык программирования C++. Объектно-ориентированная программная модель Qt позволяет эффективно работать с изображениями, так как при их загрузке для обработки в программу независимо от исходного формата и размера оно может быть представлено как объект класса Qlmage. Это позволяет использовать различные методы данного класса по отношению к изображению.

Созданное программное обеспечение, пример работы которого приведен на рис. 2, и нейронные сети протестированы на примере исходного полноцветного несжатого изображения в формате BMP, занимающего 956 кб памяти. В результате преобразования такого изображения к 16-цветной палитре с использованием стандартных графических инструментов получается файл размера 161 кб. Аналогичный размер BMP-файла получается и в результате обработки исходного изображения обученной нейронной сетью, причем независимо от формата выходного вектора. Таким образом, получаем сжатие на уровне 83 % в сравнении с первоначальным объемом.

Рис. 1. Схемы структур нейронных сетей с 4 и с 16 бинарными выходами

Рис. 2. Интерфейс программы

Проведены качественная визуальная оценка и сравнение оригинальных и полученных с помощью РБФ-сети изображений, по результатам которых можно заключить:

1. 16-цветное изображение, полученное с помощью стандартных графических инструментов, практически неотличимо от 16-цветного изображения, полученного с помощью обученной нейронной сети с 16 выходами при базовых настройках;

2. Изображение, полученное с помощью нейронной сети с 4 выходами, заметно проигрывает по качеству цветопередачи в сравнении с

изображением, получаемым с помощью сети с 16 выходами;

3. Независимо от выбранной структуры нейронной сети все объекты на результирующих изображениях различимы и идентифицируемы.

Наиболее перспективными направлениями дальнейших исследований авторы считают:

- применение нестандартных и адаптируемых цветовых палитр для улучшения качества изображения, воспроизводимого нейронной сетью, с сохранением эффективности сжатия;

- анализ влияния настроек активационных функций на результат преобразования;

- создание нейросетевых фильтров и наложение эффектов на исходные изображения.

Список литературы

1. Дударов С. П., Папаев П. Л. Теоретические основы и практическое применение искусственных нейронных сетей. - М.: РХТУ им. Д. И. Менделеева, 2014. - 104 с.

2. Дударов С. П. Классификация данных нейронными сетями на основе радиально-базисных функций/ С. П. Дударов, М. В. Васильев, Г. В. Калайчев. - Информационные технологии в моделировании и управлении: подходы, методы, решения: Сборник научных статей I Всероссийской научной конференции: 12-14 декабря 2017 г. В двух частях, Часть 1: Материалы секций I, II. - Тольятти: Тольяттинский государственный университет, 2017. - с. 86-92.

i Надоели баннеры? Вы всегда можете отключить рекламу.