Научная статья на тему 'Принцип согласованноcти оценок в задаче идентификации моделей цветовоспроизведения'

Принцип согласованноcти оценок в задаче идентификации моделей цветовоспроизведения Текст научной статьи по специальности «Математика»

CC BY
103
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Компьютерная оптика
Scopus
ВАК
RSCI
ESCI
Область наук

Аннотация научной статьи по математике, автор научной работы — Никоноров А. В., Попов С. Б., Фурсов В. А.

Приводится общая постановка задачи идентификации моделей цветовоспроизведения. Для линейных моделей описывается метод идентификации, основанный на принципе согласованности оценок. Предложена процедура сокращенного перебора при помощи генетических алгоритмов оптимизации. Проведено сравнение с полным перебором вариантов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Принцип согласованноcти оценок в задаче идентификации моделей цветовоспроизведения»

ПРИНЦИП СОГЛАСОВАННОСТИ ОЦЕНОК В ЗАДАЧЕ ИДЕНТИФИКАЦИИ МОДЕЛЕЙ ЦВЕТОВОСПРОИЗВЕДЕНИЯ

А.В. Никоноров, С.Б. Попов, В.А. Фурсов Институт систем обработки изображений РАН, Самарский государственный аэрокосмический университет

Аннотация

Приводится общая постановка задачи идентификации моделей цветовоспроизведения. Для линейных моделей описывается метод идентификации, основанный на принципе согласованности оценок. Предложена процедура сокращенного перебора при помощи генетических алгоритмов оптимизации. Проведено сравнение с полным перебором вариантов.

Постановка задачи идентификации модели цветообразования Рассмотрим задачу формирования цвета при офсетной печати в несколько красок, которые в дальнейшем будем называть базовыми. Оставив пока в стороне систему восприятия цвета человеком, будем работать со спектральными коэффициентами отражения печатных оттисков в видимом диапазоне длин волн, в дальнейшем для краткости называемых спектрами. Спектр печатного оттиска образуется комбинацией базовых красок, взятых в определенных концентрациях и наложенных в заданной последовательности на печатную основу. Базовые краски характеризуются их спектрами в стопроцентных концентрациях, печатная основа также имеет свой спектр. Тогда образование спектра красочной смеси г описывается некоторым физическим законом 3 в зависимости от спектров базовых красок гы (I = 1, N), спектра печатной основы гр и набора концентраций красок а:

г = 3(rp,Гр!,...,rpN,а) .

(1)

На практике спектры красочных смесей измеряются в диапазоне от 380нм до 700нм с шагом в 10нм. Тогда соотношение (1) можно записать в операторной форме:

г = 3(Я р, а), (2)

где r =

" r1 " Г r1 p rh ... rpN

r 2 R = r2 p rpi ...

r32 _ r32 _ p r 32 rp N-1 r 32 pN

= [

a2,...a

Mi

Будем искать наилучшее приближение 3 в параметрически заданном семействе (_Р(Кр,а,с)}. Конкретное значение параметра с определяет конкретный вид оператора ^(Яр,а).

В зависимости (2) участвуют разнородные параметры скаляры а, и вектора г1. Для удобства построения модели (2) модифицировать и представить зависимость спектра смеси не от спектров г1 чистых базовых красок и теоретических плотностей краски а,, а от спектров базовых красок, соответствующих концентрациям а^ - г1. Тогда получим г = 3(Я, а), а поиск приближение ищется в семействе (Р(Я,с)} [4, 5].

Задачу идентификации модели цветообразова-ния можно формализовать как минимизацию функционала - критерия качества подобранной зависимости

I(F) = JФ(гр(К,с))0К .

(3)

Лучшим приближением зависимости (2) по выбранному нами критерию будет значение ^(Я,а,с ), доставляющее минимум этому функционалу.

В качестве критерия качества может быть выбрано расстояние между г и ^(Я,а,с) в метрике Ь2 или Ьм. Для Ь2 получим следующую модификацию (3)

I(F) = J (r -F( R ,c ))2 dR.

(4)

В таком случае будет получено лучшее приближение физической природы процесса цветообразования при офсетной печати.

Однако в качестве критерия может быть использована близость цветов соответствующих реальному и рассчитанному на модели спектрам. Если описать переход от спектров красочных смесей к цветам этих смесей как: q=Q(R,c), где q принадлежит некоторому цветовому пространству, в общем случае с римановой метрикой |||| . В таком случае

ii iir

(3)принимает вид

I(F) = |Q(r) - Q(F(R, c))||R . (5)

В частности, в качестве Q(R) может быть использован переход от спектров отражения в пространство Lab [1, 2, 5]. В этом пространстве задана евклидова метрика.

Минимизация соотношений (4) и (5) в общем случае не эквивалентна. Следует также отметить, что работа с функционалом в пространстве спектров приводит к тому, что полученное значение F(R,c ) является приближением физического закона смешивания красок при печати. Использование же критерия качества в цветовом пространстве ведет к получению модели видеоинформационного тракта: печатный оттиск - человеческое зрение. Так как конечной оценкой качества построенной модели цветообразования будет человеческая экспертная оценка, то использование критерия (5), согласованного с этой экспертной оценкой, предпочтительно. Однако использование (5) приводит к увеличению вычислительной сложности.

В данной статье рассмотрим линейную регрессионную модель для Б

г = Яе + (6)

Оптимальное по среднеквадратичному отклонению (СКО) оценивание в предположении того, что случайная помеха имеет нормальную природу, выполняется по методу наименьших квадратов (МНК). Однако в случае отличного от СКО критерия качества (5) или отличной от нормальной природы помехи МНК в чистом виде теряет оптимальные качества [4].

Общая схема решения на основе принципа согласованности

В работе [6] на примере была продемонстрирована эффективность применения принципа согласованного оценивания параметров регрессии при малом числе экспериментальных данных. Для линейной по параметрам регрессионной задачи (6) в работе [4] было проведено теоретическое обоснование метода. Для задачи (6) в этой работе был предложен следующий алгоритм формирования согласованных оценок: на системе (1) выбирается несколько вариантов - переопределенных систем меньшей размерности, получаемых из исходной вычеркиванием некоторых строк. Порядок выбора вариантов предполагается заданным априорно. На каждом из вариантов производится перебор всех подсистем некоторой заданной меньшей размерности. На каждой из подсистем выполняется МНК оценивание вектора параметров е. По некоторому критерию взаимной близости выбираются наиболее согласованные оценки. Такой метод позволяет выделить подпространство строк матрицы X, наиболее свободное от шума, и, таким образом уменьшить невязку в соотношении (6).

В случае, когда нельзя определить подсистемы-варианты исходя из априорной информации, можно организовать нахождение согласованных оценок при помощи полного перебора переопределенных подсистем.

Переборная реализация переборного оценивания по принципу согласованности

Пусть в общем случае матрица Я в задаче (6) имеет размерность МхМ. Тогда согласованное оценивание будет выполняться на подсистемах

г„ = Я пе п , (7)

где Яп - матрица МпхМ, М<Мп<М, строки матрицы Яп формируются из строк матрицы Я, взятых в произвольном порядке. Аналогичным образом из г и получаются соответственно гп и

Каждая подсистема кодируется в виде бинарного Ьк вектора, в котором 1 в к-том разряде означает присутствие к-той строки исходной матрицы в системе, 0 - ее отсутствие. Норма Хэмминга вектора Ьк равна Мп.

Прямой перебор всех возможных подсистем в задаче (1) требует больших вычислительных затрат,

что приводит к практической невозможности решения таких задач на персональных компьютерах.

Сокращение временных затрат возможно либо за счет использования высокопроизводительной вычислительной техники либо за счет алгоритмического сокращения перебора. Рассмотрим подробнее оба варианта.

Принципы параллельной реализации согласованного оценивания

Было показано, что вычислительная сложность МНК оценки для подсистем сильно различается, поэтому при параллельной реализации перебора на кластере необходимо загружать все процессоры задачами одинаковой размерности, при этом вычислительные затраты на решение каждой задачи будут одинаковыми. Общее количество задач размерности Мп, равное числу сочетаний из М по Мп, можно разделить между всеми процессорами кластера поровну. Выдачу заданий каждому процессору в виде набора векторов Ък должен проводить процессор-планировщик. При гетерогенной структуре кластера объем всех наборов одинаков. Иначе на некоторой размерности проводится калибровка скорости вычислений на каждом процессоре, в дальнейшем размер наборов должен быть скорректирован обратно пропорционально скорости вычислений.

Перебор Ьп в порядке возрастания в двоичном коде или коде Грея не может обеспечить постоянство нормы Хэмминга для всех вариантов. Это приводит к появлению большого количества «холостых» итераций перебора в случае, когда необходимо организовать совместную обработку подсистем одинаковой размерности.

Осуществить перебор Ъъ где / изменяется от 0

до I = СМ" _1, с сохранением нормы Хэмминга позволяет алгоритм, состоящий из следующих шагов.

1. Пусть стартовым значением процедуры перебора будет Ь 0 = 0...01...1.

М -Мп Мп

2. На 1-ом шаге выполняется следующая процедура. Пусть ' - наименьший разряд, для которого

Ь1-1 = 1 и Ь'_ = 0 . Тогда Ь/ = Ь _ при1 > ', Ь' = 1 и

Ь = 0 . Если ь0_1 = 0 и ' > 1, тогда Ь'-1__ = Ь

при 1 < ' -1.

Если необходимого ' не найдено, значит, перебор завершен и получен вектор Ь1 = 1...10...0 . Тогда

к М _к

размерность Мп увеличивается на 1 и выполняется переход на шаг 1.

3. Если не получено Ъ1 - переход на шаг 2.

В таблице 1 приведена последовательность Ь для М = 5 и к=3, I = С3_ 1 = 19.

Задача оценивания выполняется для каждой переопределенной системы, определяемой вектором Ь/. Оценивание для нескольких значений размерности переопределенных систем, можно выполнить для каждой размерности при помощи описанной

процедуры. Назовем такой алгоритм поиска согласованных оценок алгоритмом с последовательным увеличением размерности.

Таблица 1. Формирование двоичного представления переопределенных систем

i bi i bi I bi

0 000111 7 011001 14 101010

1 001011 8 011010 15 101100

2 001101 9 011100 16 110001

3 001110 10 100011 17 110010

4 010011 11 100101 18 110100

5 010101 12 100110 19 111000

6 010110 13 101001

Идея применения генетического алгоритма при получении согласованных оценок

Кроме использования высокопроизводительной вычислительной техники возможно алгоритмическое сокращение перебора при расчете оценок с использованием эволюционных методов поиска оптимального значения функции взаимной близости. Особенно эффективна данная методика, когда достаточно получить оценку параметров, дающую не обязательно глобальный оптимум критерия взаимной близости, а, хотя бы, гарантированно близкое к нему значение. Такими свойствами обладает оценивание с использованием генетического алгоритма оптимизации.

Реализацию базового генетического алгоритма (ГА) можно представить как итерационный процесс, включающий несколько этапов:

1. генерация начальной популяции,

2. воспроизводство «потомков»:

- выбор родительской пары,

- реализация оператора скрещивания,

- реализация оператора мутации,

3. процедура отбора по наилучшему значению функции приспособленности и формирование на его основе нового поколения,

4. если не выполнено условие останова, то перейти к п.2.

Реализация согласованного оценивания с использованием технологии ГА отличается от классической схемы ГА. Отличие заключается в том, что при согласованном оценивании необходимо организовывать перебор подсистем с одинаковой размерностью. Рассмотрим модификацию классической схемы ГА, учитывающую эту особенность.

Начальная популяция формируется из взятых случайным образом бинарных векторов Ь с заданной нормой Хэмминга Мп. В терминах ГА каждая подсистема образует особь, причем записанную не в коде Грея, как принято в ГА, а в обычном двоичном коде.

Критерий взаимной близости, используемый при оценивании по принципу согласованности, принимается в качестве функции приспособленности.

Можно модифицировать операторы скрещивания и мутации таким образом, чтобы получаемая /тая подсистема имела размерность di е[Д;Б2]. При близких значениях Д и Б2 сложность оценивания на наборах подсистем обрабатываемых каждым процессором будет приблизительно одинаковой.

Модифицированный оператор определяется как суперпозиция двух операторов: оператора изменяющего размерность подсистемы соответствующей особи (т.е. норму Хемминга соответствующего бинарного вектора) и оператора инвертирующего значения генов особи без изменения нормы Хемминга. Действие первого оператора заключается в следующем.

Пусть норма Хемминга особи до мутации. Случайным образом выбирается ^ новая норма Хемминга. Если изменение нормы Д1 = ^ - положительно, то Д1 случайно выбранных бит бинарного вектора меняются с 0 на 1, если Д1 отрицательно, то наоборот, значения бит меняются с 1 на 0.

После изменения нормы Хемминга применяется второй оператор, случайным образом меняющий к бит с 0 на 1 и столько же бит с 1 на 0.

Рассмотрим оператор скрещивания. Пусть Ь1 и Ь2 родительская пара бинарных векторов, участвующая в скрещивании. Рассмотрим следующие бинарные вектора щ = Ь1л—Ь2 - вектор, содержащий единичные биты на тех, где они есть в первом родительском векторе, то же самое для второго родительского вектора щ 2 = Ь 2 л— Ьх, и щ12 = Ьх л Ь2. Выбирается норма Выбираются случайные числа

0 < k1 < min(

Cl;

2 'Ihllя^' ""~2 - —ч /2>ГПв> Строятся вектора wi', w2', w12,' содержащие, соответственно, k¡, k2 и k3 случайно выбранных единиц из векторов w¡, w2, w12. Результирующий вектор-потомство образуется как b = w1 'aw2'aw12' .

При параллельной организации ГА каждый процессор реализует свою популяцию, в которой происходит отбор. С некоторой периодичностью происходит объединение популяций и отбор лучших значений на всем кластере. Модификация ГА для сохранения нормы Хэмминга в определенных границах позволяет обеспечить равномерную загрузку процессоров кластера.

Численный пример

С использованием описанного метода было выполнено оценивание параметров смеси двух красок голубой и пурпурной в концентрациях 50% и 60% соответственно, при этом N=2. В качестве критерия взаимной близости использовался цветовой контраст в пространстве lab [5]

„), 0 < k 2 < min(

d;

w2

и k3 = di - k1 - k2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

AE = y¡(AL)2 + (Да)2 + (ДЬ)2 .

(7)

МНК оценка параметров модели дала ошибку AE=2,3192.

Полный перебор подсистем с размерностями от 6 до 10 включительно дал минимальное значение ДЕ=0,01347. На рис. 1 показан график зависимости цветового контраста от размерности подсистемы.

67 89 10 67 89 Размерность подсистемы

Рис. 1. Зависимость ошибки от размерности системы при полном переборе

При таком переборе было выполнено 27 000 000 итераций.

Та же задача решалась с использованием генетических алгоритмов, при этом было выполнено всего лишь 17 000 итераций. Остальные параметры генетического алгоритма были следующие. Размер популяции до отбора 320, размер после отбора 80. Селекция при скрещивании равновероятная, вероятность мутации 0,07. Оптимизация выполнялась в течение 50 эпох. На рис. 2 приведена зависимость лучшего значения ошибки в популяции от эпохи.

10 20

30 40 Номер

50 эпохи

Рис. 2. Зависимость ошибки

от эпохи генетического алгоритма

Полученное при этом значение ошибки модели составило ДЕ=0,0239, что всего лишь в два раза хуже, чем при полном переборе. Такой результат позволяет сделать вывод о том, что предлагаемый метод реализации оценивания с использованием генетического алгоритма оптимизации дает очень существенное уменьшение вычислительной сложности при незначительном (при определенных требованиях) снижении точности. В частности, при решении задачи идентификации системы цветовоспроизведения такое снижение является приемлемым, так как такая точность сравнима со значением повторяемости измерительного прибора, которая составляет ДЕ=0,01.

Заключение

Рассмотренный пример показывает целесообразность применения предложенных методов формирования согласованных оценок параметров моделей. Два варианта вычислительной реализации позволяют управлять соотношением «время на расчет» - «ошибка аппроксимации» модели.

Литература

1. Джадд Д., Вышецки Г. Цвет в науке и технике // М., Мир, 1978. - 580 с.

2. Шашлов Б. А. Цвет и цветовоспроизведение // М., Мир книги, 1995. - 316 с.

3. Фурсов В. А. Идентификация моделей систем формирования изображений по малому числу наблюдений. - Самара: ИПО СГАУ, 1998. -128 с.

4. Фурсов В.А. Проблемы вычисления оценок по малому числу наблюдений // Лекции молодежной школы «Математическое моделирование 2001», Самара, 13-16 июня 2001. С. 56-63.

5. Никоноров А.В., Попов С.Б. Сравнительный анализ моделей цветообразования при офсетной многокрасочной печати // Компьютерная оптика. №23. 2002.

6. Никоноров А.В., Попов С.Б., Фурсов В.А. Идентификация моделей цветовоспроизведения // 6-я международная конференция «Распознавание образов и анализ изображений, новые информационные технологии» Великий Новгород 21-26 октября 2002. С. 431-436.

i Надоели баннеры? Вы всегда можете отключить рекламу.