Applications Society Conference Phoenix. - Arizona, USA, 1999. - 3 - 7 October.
5. Saito, N. Local discriminant bases / N. Saito, R.R. Coifman // A.F. Laine and M.A. Unser, editors, Mathematical Imaging: Wavelet Applications in Signal and Image Processing
II. - 1994. - V. 2303.
6. Mallat, S.G. A theory for multiresolution signal decomposition: the wavelet representation, IEEE Trans / S.G. Mallat. - Pattern Anal. Mach. Intell. - 1989. - № 11.
7. Surface defect inspection of cold Rolled Strips with Features Based on Adaptive Wavelets Packets, Chang Su Lee, Chong-Ho Choi, Jin Young Choi, Se Ho Choi, IEICE TRANS. INF. & SYST. - 1997. - V. E80-D. - № 5.
УДК 004.932.2
А.В. Цветков, Л.Л. Малыгин
РЕШЕНИЕ ЗАДАЧИ ОПРЕДЕЛЕНИЯ ЧИСЛА ОБЪЕКТОВ ОДНОГО КЛАССА НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ СО СЛОЖНЫМ ФОНОМ ПРИ ПОМОЩИ ОБУЧАЕМОГО АЛГОРИТМА, РЕАЛИЗОВАННОГО НА ОСНОВЕ МНОГОМЕРНОЙ ИНТЕРПОЛЯЦИОННОЙ МОДЕЛИ
В работе дается краткое описание существующих методик определения числа объектов одного класса на изображениях. Рассматриваются их достоинства и недостатки. Предлагается решение задачи подсчета объектов одного класса на цифровых изображениях при помощи обучаемого алгоритма, основанного на многомерной интерполяционной модели. Определен критерий оптимальности алгоритма, представлены результаты тестирования алгоритма при анализе снимков мембран.
Цифровая обработка, анализ изображений, интерполяция, аппроксимация, машинное обучение, случайные функции.
The paper gives a brief description of the existing methods of determining the number of objects of the same class on the images, considers their advantages and disadvantages. The article proposes the solution to the problem of counting of objects of one class on digital images with the help of training algorithm based on a multi-dimensional interpolation model. The optimality criterion of algorithm is defined and the results of testing the algorithm in the analysis of pictures of membranes are presented in the paper.
Digital processing, image analysis, interpolation, approximation, machine learning, random functions.
В данной работе предлагается описание решения задачи подсчета объектов одного класса на видеоизображениях. Задачи контроля на производстве, в медицине и других отраслях зачастую сводятся к решению, при котором необходимо производить подсчет однородных объектов (например: общий анализ крови выполняется как подсчет кровяных телец на изображении; определение параметров мембран выполняется на основе подсчета отверстий (пор) на мембранах и т.д.). Зачастую такие задачи решаются вручную. Другим распространенным решением является использование алгоритмов сегментации и локализации объектов с последующей оценкой их числа.
В данной работе для решения описанной задачи предлагается алгоритм, который сводится к решению задачи регрессии. Предложенный алгоритм по заданному небольшому набору обучающих данных вычисляет функцию плотности для изображения. Далее вычисляется интеграл от этой функции, который и дает оценку числа объектов. Решение подходит как для полутоновых, так и цветных изображений. Элементом новизны является метод решения задачи регрессии с использованием многомерной интерполяционной модели.
Предметная область работы
Предлагаемое решение может применяться в областях, в которых существует задача подсчета объек-
тов одного класса. В качестве тестовых данных используются выборки изображений микрофильтраци-онных мембран [5] (см. рис. 1).
Объект исследования
Объектом исследования являются цифровые изображения с неоднородным, сложным фоном, содержащие набор объектов одного класса.
При анализе подобных снимков основной характеристикой является число одиночных объектов, которые обладают следующими особенностями:
1. Объекты на изображении не обладают абсолютным визуальным подобием между собой.
2. Изображения имеют неоднородный, сложный фон, что исключает решения использующие оценки фона и текстуры фона.
3. Объекты на изображении могут частично перекрывать друг друга. Это создает трудность подсчета одиночных объектов (рис. 2).
Существующие методики для подсчета объектов
Все основные методики подсчета объектов по цифровым изображениям можно разделить на основные группы:
- подсчет с использованием сегментации;
- подсчет с использованием детектирования объектов;
- подсчет с использованием методов регрессии.
а б
Рис. 1. а - пример изображения с неоднородным фоном, содержащего набор объектов одного класса (снимок микрофильтрационной мембраны); б - пример снимка со сложным фоном (группа людей)
Рис. 2. Фрагменты снимков, содержащие перекрывающие друг друга объекты (поры)
Подсчет с использованием сегментации. Данный подход является сегодня общепринятым и используется чаще других. Задача подсчета сводится к решению задачи сегментации объектов интереса, далее эти объекты анализируются, и дается оценка о числе одиночных объектов. При этом используются специализированные алгоритмы сегментации изображений и локализации объектов [1, с. 1072], [3], [6, с. 250]. Проблема заключается в сложности подбора таких алгоритмов для заданных условий, сложности выбора признаков при настройке. Кроме этого, существует проблема подсчета объектов, которые соприкасаются или пересекаются в зоне контроля. Для решения подобной задачи используется оценка размерных характеристик и формы объекта, что является неэффективным и дает существенную погрешность для оценки числа пересекающихся объектов [6, с. 250].
Подсчет с использованием детектирования. Подход предполагает использование визуального детектора объекта, который выполняет локализацию всех отдельных объектов на изображении. Локализовав все объекты, их легко посчитать. Методики такого рода дают низкий результат для изображений с большим числом соприкасающихся и пересекающихся объектов. При использовании некоторых методов предполагается, что объекты имеют тенденцию быть однородными и отделенными друг от друга различными цветами фона, так что их можно локализовать в отдельных случаях с помощью морфологического анализа [7, с. 1043], [12, с. 63] или вариационной оптимизации [11, с. 101 - 108].
Подсчет с использованием регрессии. При подсчете объектов с использованием регрессии избегают
решения сложной задачи локализации. Вместо этого используют глобальные характеристики изображения (гистограммы от различных свойств) и число объектов и на основании этих данных обучаются подсчету. Такая стандартная задача регрессии может быть решена множеством инструментов машинного обучения (например, нейронные сети [8, с. 535 - 541]). Этот подход, однако, отбрасывает любую имеющуюся информацию о местонахождении объектов, используя только общее количество для обучения. В результате требуется большое число изображений для обучающей выборки, что требует сложной подготовки.
Предлагаемая методика. Для решения задачи подсчета объектов в работе предлагается использование регрессионного подхода.
Основная идея - это восстановление функции плотности F как вещественной функции от векторов признаков, вычисленных по окрестности пикселей изображения. F рассчитывается на основании тестовой выборки так, что интеграл от F дает оценку количества объектов на изображении. В качестве признаков используются SIFT дескрипторы [9, с. 1150 -1157] инвариантные относительно масштаба и поворота, устойчивые к ряду аффинных преобразований, шуму, изменению в освещении.
Пусть Л,12 , • • • , 1N - обучающая выборка, состоящая из N изображений. Учитывая, что подсчитываемые объекты похожи и многократно повторяются в пределах одного изображения, размер тестовой выборки для обучения может быть очень маленьким. Это возможно благодаря тому, что обучение выполняется уже в пределах одного изображения.
P = {Р1, P2,..., Pc(i)} - выделенные центры объектов на изображениях тестовой выборки. Ci - число объектов на 1 изображении.
pi = {p1,p2,..., pi} - пиксели изображения. Функция плотности, которую нам необходимо вычислить (1).
Функция плотности (2) для обучения (1). Функция (2) использует нормализованное двумерное ядро Гаусса [3, с. 1072], которое было выбрано, исходя из того, что оно имеет круглый вид (близкий к форме искомого объекта), и интеграл от ядра равен единице. Размер ядра определяется, исходя из среднего размера искомого на изображении объекта.
F(p) = w x„ [10],
(1)
F(x) = 2VIt (x), x є Rn
(3)
¿=1
где х е Я" , £i (х) - координатные функции, -
случайные величины.
Для каждой реализации случайной функции мы можем поставить в соответствие некоторый вектор V. Рассмотрим вариант, когда случайные величины в уравнении (3) имеют нормальный закон распределения. Тогда мы можем вычислить плотность вероятности для любой реализации:
P(Vl,..., vm) =
m
( 2p) 2
(4)
где
"pє Ji,F(p|w) =
i i w xp,
w - обучаемый вектор, хгр - вектор признаков,
описывающий пиксели изображения (используется SIFT дескрипторы).
F?(p) = 2 N(p; P, °2l2x2)-
(2)
Рассчитав функцию плотности для обучающей выборки, мы можем дать оценку числа объектов для подобных изображений. Для этого требуется выполнить несколько шагов:
1. Рассчитать вектор признаков для каждого пикселя изображения.
2. Вычислить плотность для каждого вектора признаков при помощи найденной функции плотности.
3. Просуммировать плотность по изображению (части изображения) для получения оценки числа объектов.
Таким образом, задача обучения сводится к нахождению функции плотности. Для нахождения функции предлагается использовать аппарат случайных функций. При этом функцию плотности (1) мы заменяем случайной функцией (3). При таком подходе естественным критерием для поиска требуемой функции будет вероятность ее как реализации. Поиск нужной функции в этом случае превращается в поиск наиболее вероятной из реализаций случайной функции, которые удовлетворяют обучающим примерам.
Считая искомую функцию реализацией случайной функции, не уточняя ее характеристик, мы пока еще не делаем никаких дополнительных предположении или допущений, но в то же время можем использовать математический аппарат теории случайных функций.
Рассмотрим в задачу построения по данным наблюдения математической модели. Используем каноническое разложение случайной функции:
где у1,...,Ут - вектор, описывающий реализации.
В этом случае мы можем поставить задачу построения модели как поиск реализации, удовлетворяющей данным наблюдения и обеспечивающей максимум уравнения (4). Таким образом, получаем задачу квадратичного программирования. Поиск минимума функции (5) при системе ограничений (6).
2 2 2 V + V +... + v ® min
12 m ■
2 vi£i(x1) =
¿=1
m
2 Vi£i (x2) = *^2 ,
(5)
(6)
2 Vi£i (xk ) = Ук,
¿=1
где хі є Я" - і-й вектор входных значений обучающей выборки, уі - значение выхода для і-го вектора.
Решив задачу методом множителей Лагранжа, получим:
d1Kf (x1, x1) + d2 Kf (x1, x2) +... +
+ dkKf(^ xk) = У1
d1Kf (x2, x1) + d 2 Kf (x2, x2) +... +
+ dkKf (x2 , xk ) = У2 (10)
d1Kf (xk, x1) + d2 Kf (xk, x2) +... +
+ dkKf(xk, xk) = yk
/ (х) = Ку (х, х1) + ^2 Ку (х, х2) +... + dkKf (х, хк ). (11)
Наиболее вероятная реализация всегда будет выражаться линейной комбинацией корреляционных функций. Вычислим корреляционную функцию, обеспечивающую одинаковую вероятность для реализаций, преобразующихся друг в друга сдвигом поворотом или равным изменением масштаба по всем осям. Этих условий достаточно, чтобы вычис-
2
V
¿=1
1
2
e
лить спектральную плотность корреляционной функции. Более подробно соответствующие преобразования представлены в литературе [2, с. 5 - 8].
В одномерном случае:
£(ю) = ю 3
В многомерном случае:
(12)
п+2
£(Юі, Ю2,..., Ю" ) = (Юі2 + Ю22 + ... + ю„2) 2 . (13)
Спектром, близким к требуемому, обладает функция:
К (Ті, І2,..., X") = е " + а (14)
к » 0,85 + 0,98; г — ¥; а — ¥
Таким образом, получаем конечные формулы:
т
У (х) = I Й • К(х, хг) (15)
і=1
( хі!-хД )2 +( хі 2 -хі 2 )2 +...+ ( хіт - х)т )'
\0.95
К (хг, х,) = е
+ кг (16)
Й1К(хъ хі) + Й2К (xl, х2) +... + Й"К(хъ х" ) = Уі й1К(х2, х1) + Й2 К(х2, х2) +... + й"К(х2, хп ) = у2 (і7)
Й1К(х", х1) + Й2К(х", х2) + ... + Й"К(х", х" ) = У"
к —— ¥; к2 — ¥ .
Модель описывается линейной комбинацией (15) корреляционных функций (16), коэффициенты перед которыми вычисляются из системы линейных уравнений (17). При вычислениях (поскольку использовать бесконечность затруднительно) в качестве коэффициентов функции &! и к2, необходимо использовать значения на порядки больше, чем диапазон значений точек (хь ..., хт, уi) (например, кь к2 = 106; хц, у1 е (0,1)). Из (15) и (16) видно, что данный метод можно рассматривать как вариант КБГ нейронной сети со специальной передаточной функцией.
Экспериментальные исследования. В ходе экспериментальных исследований определен математический вид критерия оптимальности параметров алгоритма оценки числа объектов:
-> Ш1П ,
(18)
где " - число объектов, определенное экспертом;
пА - число объектов, определенное алгоритмом; к -количество исследуемых снимков.
Результаты. Для проверки адекватности конечный алгоритм оценки числа объектов был протестирован на группе из 100 снимков мембран, для которых известны результаты счета лаборанта. Каждый снимок содержит порядка 400 - 800 объектов. Также все примеры были обработаны алгоритмом подсчета объектов, который основан на сегментации [6, с. 250]. Данная реализация позволяет провести сравнительный анализ эффективности подходов.
Результаты эксперимента представлены на рис. 4,
5.
-10 -8 -Б А -2 0 2 4
Отклонение %
Рис. 4. Гистограмма распределения абсолютной ошибки между расчетными и реальными данными для алгоритма, использующего классический подход, основанный на сегментации
10 -8 -Е 4 -2 0 2 4
Отклонение %
Рис. 5. Гистограмма распределения абсолютной ошибки между расчетными и реальными данными для алгоритма, использующего адаптивный обучаемый алгоритм, реализованный на основе многомерной интерполяционной модели
При проведении сравнительного анализа гистограмм можно сделать следующие выводы:
1. Максимальная ошибка отклонения результатов алгоритма от результатов эксперта меньше на 2 % у метода, основанного на интерполяционной модели.
2. Алгоритм, основанный на интерполяционной модели, менее склонен к пересчету объектов.
Литература
1. Бахвалов, Ю.Н. Использование многомерной интерполяционной модели при распознавании государственных регистрационных номеров автотранспорта / Ю.Н. Бахвалов, А.В. Цветков // Сб. науч. тр. ИМИТ СПбГПУ. -Череповец, 2010. - Вып. 3. - С. 22 - 28.
2. Бахвалов, Ю.Н. Метод распознавания образов на основе теории случайных функций / Ю.Н. Бахвалов, А.Н. Зуев, Т.А. Ширабакина // Известия вузов. Приборостроение. - СПб., 2005. - Т. 48. - № 2. - С. 5 - 8.
3. Гонсалес, Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс. - М., 2005.
(Ті2 +Т22 +...+Т„ )к
к
э
п
2=1
4. Интернет-Университета Информационных Технологий. - URL: http://www.intuit.ru
5. Лаборатории ядерных исследований ОИЯИ. - URL: http ://flerovlab.jinr.ru
6. Цветков, А.В. Разработка математического и программного обеспечения системы определения параметров трековых микро и нанофильтрационных мембран / А.В. Цветков // Научно-технические ведомости СПбГПУ. -2009. - № 3.
7. Anoraganingrum, D. Cell segmentation with median filter and mathematical morphology operation. Image Analysis and Processing, International Conference on, 0:1043 / D. Anoraganingrum. - 1999.
8. Cho, S.-Y. A neural-based crowd estimation by hybrid global learning algorithm / S.-Y. Cho, T.W.S. Chow, C.-T. Leung // IEEE Transactions on Systems, Man, and Cybernet-
ics. - Part B. - 1999. - № 29(4). - P. 535 - 541.
9. David, G. Object recognition from local scale-invariant features / G. David // Proceedings of the International Conference on Computer Vision. 2, 1999. - P. 1150 - 1157.
10. Lempitsky, V. Learning To Count Objects in Images / V. Lempitsky, A. Zisserman // Advances in Neural Information Processing Systems (NIPS). - Vancouver, 2010 (NIPS spotlight).
11. Nath, S.K. Cell segmentation using coupled level sets and graph-vertex coloring / S.K. Nath, K. Palaniappan, and F. Bunyak. - MICCAI (1), 2006. - P. 101 - 108.
12. Selinummi, J. Software for quantification of labeled bacteria from digital microscope images by automated image analysis / J. Selinummi, J. Seppala, O. Yli-Harja, J.A. Puhakka Biotechniques, 2005. - № 39(6).
УДК 669.02/09
Н.И. Шестаков, А.Л. Кузьминов, Ю.А. Калягин
К ВОПРОСУ УПРАВЛЕНИЯ ТЕПЛООБМЕНОМ В КРИСТАЛЛИЗАТОРЕ МАШИНЫ НЕПРЕРЫВНОГО ЛИТЬЯ ЗАГОТОВОК
Получено аналитическое решение о температурном поле в слитке. Найденное решение может быть применено для целей автоматического управления теплообменом в кристаллизаторе машины непрерывного литья заготовок.
Автоматическое управление, кристаллизатор, температура, слиток.
The analytical solution of the temperature field in the ingot is received in the paper. The found solution can be applied to the purposes of automatic control of heat exchange in the crystallizer of the machine of continuous casting billets.
Automatic control, crystallizer, temperature, ingot.
В реальных условиях работы машины непрерывного литья заготовок непрерывно измеряются: расход воды, подаваемый на охлаждение кристаллизатора (Ое), и перепад температур (АТе). Тогда тепловой поток определится по формуле:
Q - cepeGeATe,
(1)
где св, рв - удельная массовая теплоемкость воды и ее плотность соответственно.
В методике, изложенной в [1], наиболее слабым звеном является процесс нахождения параметра Ь, так как он базируется на вычислении термических сопротивлений с использованием весьма приближенных аналитических или эмпирических соотношений. В условиях действующей машины непрерывного литья заготовок указанная задача существенно упрощается.
В [2] установлено, что полный тепловой поток от слитка в кристаллизаторе определяется по формуле:
q = 2F,k (Ts — T. WУзРз/ p x T^erf [p /(27^)]
^ткр + s + b2/(4«3) s + b2 /(4a3)^
4~s
(2)
где К,.к - полная площадь контакта слитка с кристаллизатором, Тв - температура охлаждающей воды в кристаллизаторе; 1 - коэффициент теплопроводности; х - время; ^(т) - толщина твердой фазы; а - коэффициент температуропроводности; р, Ь, 5 - параметры, подлежащие определению. Здесь и далее индексы 3 и 1 относятся соответственно к твердой и жидкой фазе стали.
С учетом того, что 5 = (Ь/р)2 , из (1) и (2) получим:
2F3Kœ(Ts - TeУ V3P3/ Р
H / œ + s + sp2 / (4а3 )
H erf[P /(2^/0")]
s + sp2 /(4o3)
4nl
œ+s
= Св РвGe ATe
(3)
где И/ю = хкр - продолжительность пребывания слитка в кристаллизаторе; ю - скорость вытягивания слитка.
Толщина твердой фазы на выходе из кристаллизатора:
4(Н ) = pVH7 œ + s — b ,
(4)
/