Сравнительный анализ моделей цветообразования при офсетной многокрасочной печати

Никоноров А.В.; Попов С.Б.

сравнительный анализ моделей цветообразования

при офсетной многокрасочной печати

А.В. Никоноров, С.Б. Попов Институт систем обработки изображений РАН Самарский государственный аэрокосмический университет

Постановка задачи Для программного обеспечения современных издательских комплексов необходим механизм, позволяющий на каждом этапе допечатной подготовки адекватно отображать цветовой состав изображения. Важнейшее преобразование с цветами изображения происходит на этапе печати. В пространстве спектральных коэффициентов отражения печатных оттисков (в дальнейшем называемых спектрами) описание данного преобразования можно формализовать в виде следующей задачи.

Задана модель, характеризующая зависимость спектра смеси красок Я от вектора концентраций

а = (а), где 1 = 1, п, красок, входящих в смесь:

R = F (а, Rp, Rpi )

(1)

где Rp - спектр отражения печатной основы, Rpi спектр стопроцентной концентрации /-той краски, входящей в смесь, лежащей поверх основы.

Рассматривается так называемое цветовое пространство Lab. Координаты Lab определяются соотношениями (2,3):

L = 116 f (Y ¡Yn) -16

а = 500[( f (X /X N) - f (Y /Y n )], (2)

b = 200[ f (Y /Yn ) - f (Z / Zn )]

где X, Y и Z -координаты цвета в пространстве XYZ, XN = 96,422; YN = 100; ZN = 82,521,

f (t ) = 7^7t + 1б/11б,

(3)

f (t ) = t1/3 при t < 0,009.

Координаты X, У, Z определяются через спектр отражения образца Я()) как:

X = к |л S ())x())R())d) Y = к|л S())y())R())d) , Z = к |л S ())z()) R())d)

(4)

где к =

100

{л S ()) y())d)

S(X) - спектральный состав излучения от источника освещения; из некоторого набора стандартизированных спектров для типичных источников, а x(X), y(X) и z(X) - так называемые кривые сложения, характеризующие чувствительность глазных рецепторов человека.

Количественная мера различия между цветами определяется как расстояние в цветовом пространстве Lab между точками, соответствующими данным цветам [1, 7]:

ДЕ = y¡ (M)2 + (Да)2 + (ДЬ)2

где

ДЬ = L i - L

Да = ai - а

ДЬ = b- b j

(Li, ai, b) и (Lj, üj, bj) - координаты /'-того и j-того цвета в пространстве Lab.

Расстояние в пространстве Lab ДЕ = 1 совпадает с порогом цветоразличения человеческого зрения и используется в качестве единицы измерения цветового контраста.

Качество модели (1) характеризуется величиной цветового контраста ДЕ между реальным цветом красочной смеси и цветом, оцененным с использованием модели. Максимально допустимым значением ошибки аппроксимации модели является 3ДЕ.

Задача моделирования заключается в нахождении вида и параметров модели (1), обеспечивающих минимальную разницу в пространстве Lab между реальным и рассчитываемым значением цвета красочной смеси.

Методы моделирования

Существуют различные подходы к моделированию процесса цветообразования при многокрасочной печати. Большая группа моделей основана на теоретических исследованиях природы цветооб-разования и закономерностей процесса печати. Модели этой группы можно условно назвать физическими. Возможен также подход, в рамках которого никакой дополнительной информации о природе процесса печати не используется. Такой формальный подход к моделированию заключается в использовании различных математических методов анализа и исследования данных (data mining) для построения моделей на основе экспериментальных данных.

В любом случае параметры моделей находятся из решения задачи минимизации функционала, полученного на основе выражения (5):

minJ((L - L(<9))2 + (a - a(~))2 + (b - b(~))2 . (6)

в

Здесь (L, a, b) - координаты цвета из обучающей выборки, ( L,в, b ) - координаты цвета, соответствующего смоделированному спектру (1), рассчитанные по формулам (2-4).

Этот критерий оптимизации достаточно сложен в вычислительном отношении. В качестве альтернативы может решаться задача минимизации СКО реальных значений спектра отражения от рассчитанных:

min

in2

а, Rp , -^рЬ..^ Rpn ) - R

(7)

2

Здесь F - приближение (1), соответствующее некоторой модели, в - вектор оценок значений параметров. Реальные значения спектров берутся из набора экспериментальных данных (обучающей выборки) о спектральном отражении печатных оттисков.

Этот критерий проще предыдущего в вычислительном отношении и является более строгим. Однако СКО-критерий не отражает специфики предметной области. Модели, дающие оптимум в пространстве спектров могут не совпадать с моделями, оптимальными в пространстве Lab. Это происходит потому, что адекватность модели определяется не разницей между реальным и рассчитанным спектрами, а цветовым контрастом между реальным и смоделированным цветами.

Авторами была исследована эффективность различных подходов к моделированию в сочетании с применением обоих приведенных критериев оптимизации, проведен сравнительный анализ полученных результатов. В статье приводятся результаты моделирования и характеристики моделей.

Физические модели

Один из физических подходов к описанию процесса цветообразования при офсетной печати основывается на вероятностном описании наложения красочных слоев при автотипном синтезе цвета [1,2]. При этом модель определяется уравнением Нойгебауэра:

r=(i-q)(i-a)R +a(i-a)Ri +(i-q)oRtô +qaRi2, (8)

где R - спектр красочной смеси, Rp - спектр бумаги, Rpi - цвет i-той краски поверх бумаги (г-тый первичный цвет), RpiJ - цвет /-той краски поверх г-той краски и поверх бумаги (соответственно вторичный цвет), а - концентрации базовых красок. Уравнение приведено для двух базовых красок. Это уравнение в чистом виде дало неприемлемо большую ошибку аппроксимации.

Существуют различные варианты дополнительной параметризации уравнения (8) с целью уменьшения погрешности моделирования [5, 6]. При исследовании этой группы моделей подбор параметров осуществлялся по критерию (6) с использованием градиентных методов оптимизации. В случае нелинейного вида модели использовались методы Ньютона-Рафсона или Левенберга-Марквардта. Данные методы оказались чувствительными к погрешностям экспериментальных данных, особенно при использовании нелинейных моделей.

Более предпочтительным, с точки зрения вычислительной устойчивости, является использование поисковых методов оптимизации на основе генетических алгоритмов (ГА). При этом пространство параметров оптимизационной задачи преобразуется в пространство двоичных векторов. При проведении оптимизации не требуется вычисления производных, а используются только значения самой целевой функции [12].

Приведем пример с использованием уравнения Юла-Нейлсона для моделирования системы «краска-бумага» - важного частного случая уравнения (8), модифицированного Нейлсоном:

R = (cRip," + (1 - c)R1 n )n

) n

(9)

где п - параметр Нейлсона, с - относительная площадь покрытия красочного слоя. Для простоты параметр с считаем равным теоретической концентрации краски. В таком случае получаем однопарамет-рическую задачу оптимизации. При минимизации величины цветового контраста АЕ методом Левенберга-Марквардта в шести из 30 проведенных экспериментов ошибка аппроксимации намного превысила допустимую. Данные из обучающей выборки с недопустимым значением ошибки отбраковывались. При оптимизации с использованием ГА отбракованных данных не было. Результаты приведены в таб. 1.

Таблица].

Ошибки для уравнения Юла-Нейлсона

Краска Генетические алгоритмы (ГА) Метод Левенберга-Марквардта

n Среднее Á n Среднее Á

Cyan 1.75 1.83 1.6 2.56

Magenta 1.4 1.72 1.7 2.84

Yellow 2.5 1.37 1.5 4.8

Другой подход к построению физической модели процесса цветообразования заключается в описании преобразования световых пучков при взаимодействии с печатным оттиском. Наименьшую среднюю ошибку аппроксимации среди рассмотренных моделей этого типа показала модель Ю.П. Селиванова [3]. Им предложено следующее соотношение:

я=(яр - ярСек )(1-а)+я^К

С = ЯР1 ек .

Параметр К по физическому смыслу является коэффициентом внутреннего отражения рассеивающей светопроницаемой основы. Если нет возможности определить параметр к экспериментально, то его можно найти, решая задачу оптимизации на основе обучающей выборки. Средняя ошибка при таком подходе составила 0,275АЕ. При обработке данных методами оптимизации, использующими значение производной, количество отбракованных данных составило около половины обучающей выборки. Но значения ошибок для всех других физических моделей получились на порядок большие.

Модель линейной регрессии

Аппроксимационные модели цветовоспроизведения возможно строить в классе линейных и нелинейных функций.

Линейная регрессионная модель для смеси трех красок (голубой, пурпурной и желтой) имеет вид:

R = b0 Rp + biRpi + b2 Rp2 + b3 Rp3 + bu RpU +

+>13 Rpl3 + b 23 Rp23 + bl23 Rpl23 + #, (Ю)

где b = (b0,b1,b2,b3,b12,b13,b23,b123)- вектор параметров регрессии, Rp12, Rp13, Rp23, Rp123 - спектры

смеси стопроцентных концентраций нескольких красок поверх печатной основы, - случайная погрешность.

МНК-оценка параметров, в предположении того, что является 5-коррелированным белым шумом, имеет вид:

b = [ XT X]-1 XT R,

где X - матрица составленная из вектор-столбцов Rpi.

В этом уравнении можно положить равными нулю до четырех параметров и при этом получать приемлемые значения ошибки аппроксимации. Вообще, наименьшая средняя ошибка аппроксимации достижима при 8 ненулевых параметрах и составляет 0,207AE, максимальная ошибка при этом 0,92^£. При четырех не равных нулю параметрах (b0, bb b2, b3) средняя ошибка составляет 0,82^E, максимальная - 2,764E. Приведенные значения были получены при вычислительном эксперименте на шкалах цветового охвата печатной машины Speed Master 74 объемом в 800 образцов.

Для физических моделей (за исключением модели Селиванова) получено сходное значение ошибки аппроксимации.

Нейросетевое моделирование

В качестве моделей, у которых явный вид уравнения (1) не задан, выбраны нейронные сети (НС) слоистой архитектуры с обучением по методу обратного распространения ошибки. В качестве ак-тивационных функций нейронов использовались

гиперболический тангенс и логистическая функция:

f (*)=( + « " ' )

Использовались два варианта построения нейронной сети. В первом варианте для каждого спектра образца из обучающей выборки строится отдельная НС с двумя (или тремя) нейронами в скрытом слое. Входов у такой сети столько же, сколько аргументов Rpi присутствует в выражении (1), выход у сети один - компонента спектра смеси, соответствующая некоторой длине волны. Таким образом, за один цикл работы обрабатывается одна компонента дискретного спектра. Такую обработку можно условно назвать покомпонентной.

Во втором варианте сети на ее вход подаются спектры базовых красок целиком, на выходе - вектор компонент спектра красочной смеси. Сеть этого типа аппроксимирует всю обучающую выборку. Такую постановку задачи можно назвать векторной.

НС в векторной постановке задачи обладает наиболее высокой экстраполирующей способностью из всех рассмотренных моделей. Однако обучение такой сети (с 30 нейронами в двух скрытых слоях)

на обучающей выборке из 18 векторов 32x1 продолжалось около 8 часов на РШ-800. Ускорить обучение можно за счет предварительного сокращения размерности выборочного пространства при помощи метода выделения главных компонент [8, 12]. В описанном примере удалось снизить размерность с 32 до 5, при этом время обучения сократилось до получаса.

При таком подходе была получена наименьшая ошибка аппроксимации на экспериментальном наборе данных. Средняя ошибка составила 0,15АЕ, максимальная - 0,5АЕ.

Однако, несмотря на все преимущества, нейро-сетевой подход имеет несколько недостатков. При обучении сетей обратного распространения ошибки используется оптимизация значений весов по градиентному алгоритму. Это приводит к так называемому эффекту переобучения сети. Он заключается в появлении ложных экстремумов на аппроксимируемой кривой, при этом теряется гладкость исходной функции, существенно возрастает СКО. Избавиться от этого эффекта можно, модифицируя используемый при обучении МНК-критерий введением регу-ляризирующей добавки. Например, в [8] предлагается следующая модификация критерия МНК: 1 м

Б = уБ + — У (м>, )2 ,

7 мр 1

где - веса синаптических связей, у - коэффициент скорости обучения, Б - классическая целевая функция сети - среднеквадратичная ошибка между входом р и требуемым выходом /:

1 N

Б = 1У Й - рг )2.

N

i=1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Применение такого метода обучения при моделировании цветообразования позволило снизить ошибку аппроксимации в 2 - 2,5 раза.

Отметим, что при использовании НС слоистой архитектуры для моделирования процесса цветообразования невозможно применение при обучении критерия минимизации цветового контраста.

Если отказаться от использования слоистых сетей обратного распространения, то возможно применение критерия минимума цветового контраста. Для этого сеть с покомпонентной обработкой спектров можно представить в явном виде в виде некоторого многочлена от активационных функций нейронов (для однослойной сети в виде линейной комбинации активационных функций). Для сети с тремя нейронами в скрытом слое имеем (с некоторой модификацией):

у = а1 ^ sig(a2 х1 + а3) + а4 logsig(a5 х2 + а6 ) +

+ а7 logsig(а8 х1 + а9 х2 + а10 )

где ai - параметры, logsig - логистическая функция, х1 и х2 - компоненты спектров базовых красок, у - компонент спектра красочной смеси. Параметры а{ определяются методами оптимизации, причем

оптимизация выполняется на всем множестве нейронов, а не послойно. Целевой функцией является цветовой контраст между реальным и спрогнозированным спектрами. Средняя ошибка при 15% процентах отбракованных данных составила 0.3 АЕ.

Из приведенных данных об аппроксимацион-ных погрешностях моделей разного типа можно сделать следующий важный вывод: погрешность лучших физических моделей процесса цветовоспроизведения и погрешность нейросетевых моделей, не использующих никакой априорной информации о процессе цветовоспроизведения, практически одинакова.

Модификация исходной модели

Спектры Яр,, входящие в выражение (1) косвенно зависят от спектра печатной основы. Чтобы получить более общую модель, желательно исключить эту зависимость. Для этого предлагается подход, основанный на выделении спектра краски из известного спектра краски поверх печатной основы. На основе уравнения Юла-Нельсона (9) можно записать:

Я = с

(я1/п - (1 - с)я}рп Л"

с

(11)

где Яс - искомый спектр краски.

Таким образом, на основе выборочных данных можно найти целое семейство {Я'с}, соответствующее различным значениям спектров красочной смеси Яр Для данной краски Яс имеет единственное значение. Будем минимизировать СКО в семействе

{Я'с} за счет выбора п. То есть оптимальное п* находится как решение задачи минимизации:

■:е(п*)

= ш1п Q(n),

п

где

Q(n)=^ Я'С" (п)ЯС (п).

Решение этой задачи также было выполнено как с использованием ГА, так и классических алгоритмов оптимизации. ГА показали несколько лучший результат.

В результате выделения спектра базовой краски модель становится пригодной для любой применяемой печатной основы. Для описания этой основы достаточно знать ее спектр отражения. Например, погрешность аппроксимации линейной регрессионной модели при таком подходе, как видно из таб. 2, почти не увеличивается.

В первой колонке таблицы приведены ошибки для уравнения (10) при четырех ненулевых коэффициентах - Ь0, Ъ\, Ь2, Ь3. Во второй - ошибки для того же уравнения с коэффициентами, усредненными для трех различных красок. Наконец, в третьей приведены ошибки для случая, когда вместо спектра стопро-

центной краски поверх основы в уравнении (10) использовался чистый спектр краски.

Таблица 2. Ошибки аппроксимации регрессионной модели

Сочетания красок Ошибка регрессии Ошибка усреднения Ошибка при чистом спектре

СМ 0.6302 3.0456 0.7053

МУ 1.2422 2.4133 1.1904

СУ 0.6438 1.5045 0.8018

Таким образом, уравнение (10) было преобразовано к виду:

Я = Ъ0 Яр + Ъ1Яс1 + Ъ2 Яс2 + Ъз Ясз,

где Яы - спектры чистых красок. Аналогичная замена Яр1- на Яы возможна при любом виде модели (1).

Основные результаты

Проведенный анализ различных моделей цветовоспроизведения позволяет выделить наиболее перспективные модели. Основные результаты сведены в таб. 3. Уравнения теории цвета, которые использовались при моделировании и приводятся в таб. 3, описаны в [1, 2, 5].

Точность, которую дают линейные регрессионные модели, достаточна для построения на их основе базовой, использующей стандартный набор красок, системы описания цветовоспроизведения в печатном процессе. Характеристики большинства эвристических и физических моделей (за исключением модели Селиванова) схожи с характеристиками линейных регрессионных моделей.

При программной реализации нейросетевых моделей необходимо учитывать большую вычислительную сложность обучения НС. Поэтому, использование НС в конечном программном продукте, а не в экспериментальных условиях, возможно при наличии мощных вычислительных систем или быстрых алгоритмов обучения. Точность, которая получится при этом, будет сравнима с точностью лучших спектрофотометров и в несколько раз меньше порога цветоразличения человеческого зрения. Линейные и нейросетевые модели позволяют проводить замену спектра отражения печатной основы без потери точности. Таким образом, на основе этих моделей можно строить системы, описывающие печатный процесс с фиксированным набором красок на различной бумаге.

В таблице приведены только средние ошибки и не указаны особенности распределения ошибок. В общем, по гистограммам ошибок можно сказать, что чем выше степень нелинейности используемой модели, тем меньше дисперсия ошибки.

В таблице 3 приведены экспериментальные оценки вычислительной сложности задачи определения параметров моделей. За единицу принята сложность оценки параметров модели линейной регрессии.

Используемая модель, метод подбора параметров Количество красок Средняя ошибка, AE Оценка вычислительной сложности

Физические модели Модель Селиванова 1 0,26 0.5

Уравнение Юла-Нельсона, ГА, кривые растискивания известны 1 1,43 0.7

Уравнение Юла - Нельсона, оптимизация методом ГА 1 1,6 2.5

Уравнение Юла-Нельсона, ГА, усредненные кривые растискивания 1 1,63 2.5

Уравнение Нойгебауэра модифицированное Стольницом 2 1,67 1

Модели линейной регрессии Линейная регрессия, 8 параметров 3 0,2 1

Линейная регрессия, 4 параметра 3 0,8 1

Линейная регрессия, использование спектров чистых красок 2 0,9 1

Линейная регрессия, усреднение коэффициентов 2 2 1

Нейросетевые модели Нейронные сети, векторная обработка 2 0,15 50

Использование нейросетевой парадигмы в явном виде 2 0,3 30

Нейронные сети, покомпонентная обработка 2 2 20

Нейронные сети, прогнозирование первичных цветов 1 2,9 5

Для дальнейшего исследования наиболее перспективными представляются модель Селиванова и НС модели. Только эти модели возможно в дальнейшем обобщить на случай произвольного набора базовых красок.

Процедуру обучения НС целесообразно совершенствовать в двух направлениях: повышение способности сети к обобщению (экстраполяции) и увеличение скорости обучения. Первого можно достичь, используя для нахождения оптимальных значений весов ГА вместо градиентных алгоритмов.

При любом методе обучения НС этот процесс легко поддается распараллеливанию. При обучении с использованием градиентных методов веса каждого нейрона можно рассчитывать независимо, а значит параллельно. Также легко распараллеливаются вычисления при применении ГА - на каждой итерации обычно 98% времени занимают вычисления значений критерия, а эти вычисления независимы. Таким образом, можно существенно ускорить обучение НС.

Другой перспективный подход к ускорению обучения НС - сокращение числа нейронов в процессе обучения с использованием контрастирования сети.

8. Заключение В данной работе на основе экспериментальных данных исследованы различные модели цветовоспроизведения. Использовался новый для данной области нейросетевой подход к моделированию. Впервые для определения параметров модели использовалась минимизация цветового контраста. Это позволило значительно снизить ошибку моделирования. Результаты позволяют говорить о возможности построения системы моделирования печати с произвольным набором базовых красок.

Работа выполнена при частичной поддержке

РФФИ, грант № 01-01-00097.

Литература

1. Джадд Д., Вышецки Г. Цвет в науке и технике // М., Мир, 1978. 580 с.

2. Шашлов Б. А. Цвет и цветовоспроизведение // М., Мир книги, 1995. 316 с.

3. Селиванов Ю.П. Основы программирования и оптимального моделирования автотипного процесса // М., Книга, 1978. 238 с.

4. Каныгин Н.И. Цветовоспроизведение изобразительной информации репродукционными системами // М., Мир книги, 1998. 187 с.

5. S.R. Berns The Spectral Modeling of Large-Format Ink-Jet Printers // Отчет о НИР / Barselona: RIT Munsell Color Science Laboratory, 1996. 57 с.

6. E. J. Stollnitz Reproducing Color Images Using Custom Inks // Отчет о НИР / University of Washington, 8 c.

7. J.M. Lammens A Computational Model of Color Perception and Color Naming // Диссертация на соискание докторской степени / University of New-York, Graduated School, 1994. 256 с.

8. H. Demuth, M. Beale Neural Network Toolbox For Use with MATLAB // Электронная документация к программному пакету / Natick, The MathWorks, Inc., 1997. 700 c.

9. Optimization Toolbox User's Guide // Электронная документация к программному пакету / Natick, The MathWorks, Inc., 1997. 170с.

10. Бендат Дж., Пирсол А. Измерение и анализ случайных данных // М., Мир, 1974. 463 с.

11. Марпл - мл. С. Л. Цифровой спектральный анализ и его приложения // М., Мир, 1990. 584 с.

12. Змитрович А.И. Интеллектуальные информационные системы // Минск, ТетраСистемс, 1997.368 с

Сравнительный анализ моделей цветообразования при офсетной многокрасочной печати Текст научной статьи по специальности «Компьютерные и информационные науки»

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Никоноров А. В., Попов С. Б.

Текст научной работы на тему «Сравнительный анализ моделей цветообразования при офсетной многокрасочной печати»