УДК 535.6 62.50
ПРИМЕНЕНИЕ ПРИНЦИПА СОГЛАСОВАННОСТИ ОЦЕНОК В ЗАДАЧЕ ИДЕНТИФИКАЦИИ МОДЕЛЕЙ ЦВЕТОВОСПРОИЗВЕДЕНИЯ
© 2002 А.В. Никоноров1, С.Б. Попов2, В.А. Фурсов2
1 Самарский государственный аэрокосмический университет
2 Институт систем обработки изображений РАН, г. Самара
Решается задача идентификации параметров модели цветовоспроизведения. Метод опирается на так называемый принцип согласованности оценок, позволяющий строить оценки в условиях априорной неопределенности, связанной с тем, что число наблюдений на исходных образцах изображений мало. Разрабатываемый метод может применяться как для формирования изображений наиболее точно воспроизводящих цвет при офсетной печати, так и для создания электронных коллекций изображений, интернет-ресурсов и др.
Постановка задачи
Рассматривается задача построения модели цветовоспроизведения, позволяющий на каждом этапе допечатной подготовки адекватно отображать цветовой состав изображения. В пространстве спектральных коэффициентов отражения печатных оттисков (в дальнейшем называемых спектрами) эта задача формализуется следующим образом. Пусть задана модель, характеризующая зависимость спектра смеси красок r от вектора
искомых концентраций c = (c), i = 1,n красок, входящих в смесь:
r = F (а ,rp,rp), (1)
где Rp - спектр отражения печатной основы, Rp. спектр стопроцентной концентрации i-той краски, входящей в смесь, лежащей поверх основы.
Введем в рассмотрение так называемое цветовое пространство Lab, координаты которого определяются соотношениями [1, 2]:
L = 116f (YIY ж)-16, (2)
a = 500[(f (XIXN) - f(YIYn)] , (3)
b = 200[f (Y IYn ) - f ( ZIZn )], (4)
где XN = 96,422; YN = 100; ZN = 82,521,
f (t) = t13 np^ < 0,009 и f (t) = 7,7867t +161116 при t > 0,009. (5)
Координаты цвета в пространстве XYZ определяются через спектр отражения образца R(l) как:
X = k f S(l)x(2)R(l)d1,
JA
Y = k fS(l)y(l)R(1 )d1, (6)
A
Z = k f S(l)z(1)R(1 )d1
A
где k = 100/ f S(l)y(1 )d1, S(l) - спектраль-
A
ный состав излучения от источника освещения; из некоторого набора стандартизированных спектров для типичных источников, а x(l), y(l) и z(l) - так называемые кривые сложения, характеризующие чувствительность глазных рецепторов человека.
Количественной мерой различия между цветами является цветовой контраст. Он определяется как расстояние между точками, в цветовом пространстве Lab [1, 2]:
DE = 7(DL)2 + (Aa)2 + (Ab)2 , (7)
где AL = L. - L, A a = at - a,, A b = b. - b., а
1 J 1 J . J
L,, a., b., L, a, b - координаты i-го и j-го цвета соответственно. Единичное расстояние в пространстве Lab совпадает с порогом цве-торазличения человеческого зрения.
Качество модели (1) характеризуется величиной цветового контраста AE между реальным цветом красочной смеси и цветом, оцененным с использованием модели. Зада-
ча заключается в нахождении вида и параметров модели, обеспечивающих минимальную разницу в пространстве Lab между реальным и рассчитываемым значением цвета красочной смеси. Для этого решается задача минимизации функционала, полученного на основе соотношения (7):
mjn^/((L -L(n))2 + (а -~(п))2 + (b -b(n))2 . (8)
q
Здесь (L, a, b) - координаты цвета, полученные на обучающей выборке, (~, ~, ~) - рассчитанные по формулам (2-6) с использованием модели цветовоспроизведения (1).
Проблема заключается в том, что задача оценки векторного параметра c должна решаться по малому числу обучающих образцов. Объективной причиной этого является не только высокая стоимость цветных тестовых изображений (хотя и это существенно), но, главным образом, то, что не для всех базовых красок существуют тестовые шкалы для измерения спектров. Традиционно задача оценивания параметров решается в рамках статистической теории. При малом числе наблюдений использование стандартных априорных вероятностных гипотез не вполне правомерно.
В настоящей работе рассматривается общая схема и пример решения сформулированной задачи на основе так называемого принципа согласованности оценок. Используемые в рамках этого принципа критерии не требуют задания априорных вероятностных моделей ошибок измерений.
Общая схема решения задачи на основе принципа согласованности
Для описания зависимости типа (1) широко используется линейная модель вида
r = Xc +x, (9)
где X= [ r Т p, r Tpi, r Tp2, r ^ ...] - NxM матрица, компоненты которой суть измеренные спектры заданных концентраций базовых цветов, а c=[c0 ,cFc2, c12, ...] искомый Nx1-вектор параметров модели.
Задача заключается в построения оцен-
ки с вектора параметров с уравнения (9) по доступной для непосредственного наблюдения NхM - матрице X и Мх1 - вектору г (Ы>М), при неизвестном ^1-векторе ошибок измерений X.
Предполагается, что соответствующая уравнению (10) точная модель оцениваемой системы:
г* = Хс (10)
где г * = г - X существует. Ясно, что равенство (10) выполняется также для всех подсистем меньшей размерности, сформированных из строк системы (9). Опираясь на это свойство, простейшая схема отыскания оценки с вектора параметров с уравнения (9) на основе принципа согласованности строится следующим образом.
С использованием строк системы уравнений (9) строятся переопределенные системы меньшей, чем исходное матричное уравнение (10) размерности к. Максимальное число таких систем будет равно числу сочетаний из N по к, где М<к<Ы - заданная (для простоты фиксированная) размерность формируемых вариантов систем. Далее на каждом из построенных таким образом вариантов формируется множество подсистем размерности М<д<к, наибольшее число которых также равно числу сочетаний из к по q.
Пусть с к - оценка, полученная для <^-й
подсистемы К-го варианта, а Жк [ск ] - функция, характеризующая взаимную близость решений ск , полученных для различных подсистем на К - м варианте. Задается также критерий отбора наиболее подходящих вариантов по значениям полученных функций
близости Жк [скд ]. Искомое решение задачи
является точечной оценкой с , вычисленной в соответствии с заданным критерием на вариантах, для которых функция взаимной близости удовлетворяет критерию отбора.
В рамках принципа согласованности могут быть заданы различные функции взаимной близости, критерии отбора вариантов
(по вычисленным значениям функций взаимной близости), а также критерии построения точечных оценок на отобранных вариантах. В частности, в работе [6] рассматривалась
функция взаимной близости решений с на множестве подсистем вида:
W„
Т в |)
|= X С ■ —
д=1
С
где
в д=1
(11)
(12)
- 1-я компонента вектора с, вычисленного путем усреднения оценок {ск }, вычисленных на вариантах, для которых значения фун-
С
(ї — 1)С —1 + Ск>д
Рассчитанное таким образом для всех переопределенных систем среднее принимается за оценку параметров системы (10). В предположении непрерывности изменения ошибки аппроксимации такая оценка должна быть оптимальной по критерию (11).
Другой способ использования приближения критерия (11) это расчет среднего и
пересчет в связи с этим значения
не
кции взаимной близости Жк [ск \ оказались
менее заданного порога. а ск - I -е компоненты вектора оценок с , полученные в результате решения q-й подсистемы к-го варианта. При этом искомая точечная оценка определяется путем усреднения оценок полученных на этом варианте.
Данный критерий интегральный, т.е. его значение в некоторой точке зависит от значения во всех остальных точках. Таким образом, при переборе, с появлением нового варианта должен происходить пересчет значений критерия для всех предыдущих вариантов. На практике это приведет к значительным затратам памяти и увеличению вычислительной сложности.
Точечные критерии вроде (8) лишены этого недостатка. Однако при использовании (8) вычисляется не близость значений оценок, а ошибка аппроксимации целевой функции. Расчет ошибки аппроксимации невозможен при экстраполяции, что является существенным недостатком критерия (8).
Критерий (11) представляет собой отклонение оценки ск от среднего значения, полученное по выборке. Оптимальное значение оценки по этому критерию можно заменить на точечную оценку выборочного среднего С. Возможно рекуррентное вычисление выборочного среднего как:
для всех ск д, а для некоторого набора значений, на предыдущих итерациях показавших лучшее значение критерия. Такое приближение также основано на требовании непрерывности. Это приближение может использоваться при генетических алгоритмах поиска переопределенной системы дающей оптимальное значение оценки.
Пример решения задачи
В качестве примера решалась задача идентификации модели для двух базовых красок (голубой и пурпурной). Строилась линейная модель для зависимости спектра отражения этих двух базовых красок взятых в некотором процентном соотношении, от спектров печатной основы (бумаги) и спектров соответствующих концентраций базовых красок. В частности, исследовался случай решения для 30% голубой и 20% пурпурной краски.
Для этого случая модель (9) принимает вид:
Гк= С0Гр(к)+С1Г’р1(к)+С2Г’р2(к)+С12Гр12(к)+Х’ (13)
где к = 1, N гр - спектр бумаги; г ’р1 и г’ -спектры соответственно голубой и пурпурной краски поверх бумаги. Для линейной модели (13) матрица X формируется из заданных спектров гр, г’, г ’р2 и г ’п12, образующих
р12’
вектор-столбцы. Причем г ’р1 и г ’р2 являются спектрами не стопроцентных концентраций базовых красок, а тех концентраций, которые входят в смесь. Это связано с тем, что на практике задача моделирования спектра произвольной красочной смеси представляется в
виде суперпозиции двух задач: получение спектра необходимой концентрации базовых красок, и нахождения спектра смеси. Вторая задача фактически является обобщением первой, поэтому предполагаем первую задачу решенной и спектры г ’ и г ’ известными.
Спектры отражения образцов измерялись в диапазоне 380-700 нм с шагом 10 нм, так, что N = 32, М = 4. Измерения проводились по шкале цветового охвата напечатанной на цветопробном принтере Scitex Iris 4Print с использованием спектрофотометра Techcon SP810, повторяемость прибора
0,02AE. Lab координаты цвета результирующей смеси следующие: (74, 1, 15). Результаты оценивания приведены в табл. 1 и на рисунке.
Для MHK-оценок параметров модели ошибка аппроксимации составила 1,2844 AE. В рамках принципа согласованности, используя цветовой контраст (8) в качестве функции взаимной близости, удалось получить ошибку аппроксимации в 0,1132 AE. При этом перебирались все варианты формирования переопределенных систем меньшей размерности. Наибольшая точность была достигнута на варианте размерности 8, в котором переопределенная система была составлена из строк (2, 6, 8, 14, 17, 20, 24, 27) исходной матрицы. Для других размерностей ошибка увеличивается, что иллюстрируется на графике.
Для нескольких других спектров из шкалы цветового охвата для двух красок сравнительные данные точности MHK-оценок и оценок, полученных на основе принципа согласованности, приведены в таблице 1. В графе Noptim приведена размерность варианта переопределенной системы, для которой достигалась наименьшая ошибка аппроксима-
Таблица 1. Ошибки аппроксимации
№ Конц. голу- аой краски Конц. пур- пурной краски Ошиака (AE) МНК- оценок Ошиака (AE) согласо- ванных оценок Nopt
1 30% 20% 1,2844 0,1132 8
2 60% 20% 1,1955 0,1228 11
3 70% 90% 4,4230 0,2988 9
4 10% 40% 0,4305 0,1266 10
5 50% 50% 2,3162 0,1495 11
Рис. Зависимость ошибок аппроксимации от размерности варианта системы
ции согласно критерию минимума цветового контраста.
Вычислительные аспекты реализации
Рассмотрим вопрос реализации оценок с использованием принципа согласованности. Это задача полного перебора. Если необходимо решить задачу для полного набора подсистем (с размерностями от 1 по ^), то вычислительная сложность зависит от N как 0(2К). Однако сложность можно существенно сократить, если задан некоторый интервал изменения размерности подсистем. В частности для одной размерности к<^ необходимо перебрать I = С N вариантов.
Сформулируем задачу перебора. Переопределенные системы, размерности к, построенные на основании системы (9) можно представить в виде двоичного вектора Ь размерности 1х N. Единица в /-том разряде вектора Ь означает наличие /-той строки исходной системы в переопределенной системе, ноль
- отсутствие. Норма Хэмминга вектора Ь равна размерности переопределенной системы. Таким образом, перебирая вектора Ь; с нормой равной к мы перебираем все переопределенные системы размерности к.
Перебор Ь; в порядке возрастания в двоичном коде или коде Грея не может обеспечить постоянство нормы Хэмминга для всех вариантов. Это приводит к появлению большого количества "холостых" итераций перебора.
Осуществить перебор Ь; , где г изменяется от 0 до I = С N -1, с сохранением нормы
Хэмминга позволяет алгоритм, состоящий из следующих шагов.
1. Пусть стартовым значением процедуры перебора будет Ь 0 = 0...01...1.
Ж-к к
2. На г-ом шаге выполняется следующая процедура. Пусть / наименьший разряд, для
которого Ь1-1 = 1 и Ь/-1 = 0 . Тогда Ь/ = Ь/при у > /, Ь1 = 1 и Ь1 -1 = 0. Если Ь0-1 = 0 и
/ > 1, тогда Ь /-1-у = Ь при у < / -1.
Если необходимого / не найдено, значит, перебор завершен и получен вектор
Ь1 =1...10..:0
к Ж-к
3. Если не получено Ь; переход на шаг 2. В табл.2 приведена последовательность
Ь. для N = 5 и к=3, I = С6-1 = 19 .
Задача оценивания выполняется для каждой переопределенной системы, определяемой вектором Ь.. Оценивание для нескольких значений размерности переопределенных систем, можно выполнить для каждой размерности при помощи описанной процедуры. Назовем такой алгоритм поиска согласованных оценок алгоритмом с последовательным увеличением размерности.
Рассмотрим изменение вычислительной сложности с увеличением размерности на 1. Вектор оценок параметров модели (9) находится по МНК.
с = [хг х] Хт г. (14)
Вычислительная сложность формирования информационной матрицы пропорциональна к2, сложность обращения матрицы методом Гаусса равна [8]
2к (к + 1)(к + 2)
+ к (к -1) .
Тогда вычислительную сложность операции (14) можно оценить как
= 2к + 1)(к + 2) + 3^2
к 3
При увеличении к на 1 получим
АС = Ск+1 - вк = 2(к + 3)2 -11. (15)
Число операций (14) с увеличением к
! N - к С
на 1 увеличивается в ------ раз. С учетом
к +1
(15) получим квадратичное увеличение сложности.
Параллельная обработка может выполняться так, что все процессоры решают задачи одной размерности, при этом вычислительные затраты на решение каждой задачи будут одинаковыми. Общее количество задач размерности к, равное числу сочетаний из N по к, можно разделить между всеми процессорами кластера поровну. Выдачу заданий каждому процессору в виде набора векторов Ь; должен проводить процессор-планировщик. При гетерогенной структуре кластера объем всех наборов одинаков. Иначе на некоторой размерности проводится калибровка скорости вычислений на каждом процессоре, в дальнейшем размер наборов должен быть скорректирован обратно пропорционально скорости вычислений.
Кроме вычислений на кластере описание переопределенных систем в виде двоичных векторов позволяет проводить численные эксперименты с использованием генетических алгоритмов перебора. Такой подход в комбинации с ограничением размерности позволяет получать неплохое приближение оптимального решения на
Таблица 2. Формирование двоичного представления переопределенных систем
і Ьі і Ьі і Ьі і Ьі
0 000111 5 010101 10 100011 15 101100
1 001011 6 010110 11 100101 16 110001
2 001101 7 011001 12 100110 17 110010
3 001110 8 011010 13 101001 18 110100
4 010011 9 011100 14 101010 19 111000
персональном компьютере.
Заключение
Применение принципа согласованности оценок позволяет уменьшить ошибку аппроксимации по сравнению с МНК-оценками более чем на порядок. Однако достигается это, кроме прочего, за счет существенного возрастания вычислительных затрат. Добиться приемлемого времени счета удается за счет применения высокопроизводительных системы обработки информации, например, кластеров или суперкомпьютеров.
Работа выполнена при частичной поддержке РФФИ (гранты № 01-01-00097, 0001-05001).
СПИСОК ЛИТЕРАТУРЫ
1. Джадд Д., Вышецки Г Цвет в науке и технике. М.: Мир, 1978.
2. Шашлов Б. А. Цвет и цветовоспроизведение. М.: Мир книги, 1995.
3. Berns S.R. The Spectral Modeling of Large-Format Ink-Jet Printers. Barselona: RIT Munsell Color Science Laboratory. 1996.
4. StollnitzE. J. Reproducing Color Images Using Custom Inks. University of Washington.
5. Фурсов В.А. Идентификация моделей систем формирования изображений по малому числу наблюдений. Самара: СГАУ, 1998.
6. Фурсов В.А. Проблемы вычисления оценок по малому числу наблюдений // Труды молодежной школы "Математическое моделирование 2001". Самара, 2001.
7. Попов С.Б., Никоноров А.В. Сравнительный анализ моделей цветообразования при офсетной многокрасочной печати. Компьютерная оптика. 23. 2002.
8. Демидович Б.П., Марон И.А. Основы вычислительной математики. М.: Наука, 1979.
THE CALCULATING APPEARANCE OF COLOR REPRODUCTION
MODEL IDENTIFICATION
© 2002 A.V. Nikonorov1, S.B. Popov2, V.A. Fursov2
1 Samara State Aerospace University
2 Image Processing Systems Institute of Russian Academy of Sciences, Samara
Problem of color reproduction model parameters identification is resolved. The method is based on so-called conformity estimator principle by which estimations are made in conditions of expected uncertainty. This uncertainty arises from small number of original pattern observation. Developed method could be used for most accurately color matching during offset printing as well as creation of electronic picture collections, Internet resource and others.