РАЗРАБОТКА МЕТОДОВ ФОРМИРОВАНИЯ ЦВЕТО-ТЕКСТУРНЫХ ПРИЗНАКОВ ДЛЯ АНАЛИЗА БИОМЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ
А.И. Пластинин, А.В. Куприянов, Н.Ю. Ильясова Институт систем обработки изображений РАН Самарский государственный аэрокосмический университет
Аннотация
В статье рассматривается метод формирования цвето-текстурных признаков. Метод основан на вычислении характеристик многомерного распределения вероятности интенсивностей цветовых компонент. Представлены экспериментальные исследования метода на натурных изображениях. Приводится сравнение разработанного метода с уже существующими.
Введение
Одним из важнейших диагностических методов, который до сих пор выполняется вручную лаборантами, остается общеклиническое исследование крови. Именно данный анализ крови тонко отражает реакцию кроветворных органов на воздействие на организм различных физиологических и патологических факторов [1]. Важным диагностическим показателем является количество и процентное соотношение каждого из типов лейкоцитов (лейкоцитарная формула). Лейкоциты различны по внешнему виду и функциям. Различают следующие виды лейкоцитов: нейтрофилы (палочко-ядерные, сегментноядерные), эозинофилы, базофилы, моноциты, лимфоциты [2].
Широкое распространение, трудоемкость выполнения и низкое качество результатов при ручном анализе делает автоматизацию общеклинического анализа крови необходимой и актуальной задачей. Рассмотрим принцип работы системы автоматической диагностики. Изображение препарата крови формируется подключенной к окуляру микроскопа фотокамерой. Оно представляет собой фон, с относительно постоянной яркостью, на котором присутствуют различные форменные элементы (клетки крови). Затем на изображении выделяются лейкоциты, которые представляют собой связные области. Для каждого лейкоцита определяется его тип. И подсчитывается общее количество клеток каждого типа.
Целью работы является разработка признаков для классификации изображений лейкоцитов. Рассматриваются классы: эозинофилы, базофилы, моноциты, лимфоциты.
Рис. 1. Изображения лейкоцитов
В качестве основы для исследований был выбран метод, предложенный Хараликом в [3], называемый в дальнейшем статистическим текстурным анализом. Задачей является выделение признаков, связанных с локальными текстурными особенностями
лейкоцитов. Подход, основанный на матрицах вероятностного распределения (МВР) яркости, уже не раз очень успешно использовался для выделения аналогичной информации [4, 5, 6].
К недостаткам методов МВР можно отнести: работу с полутоновыми изображениями; использование целочисленного формата данных; высокую вычислительную сложность, заключающейся в необходимости работы с трёхмерными матрицами распределения вероятности. В данной работе рассматривается модификация существующих методов для устранения указанных недостатков.
1. Метод цвето-текстурного анализа
Текстурные признаки - это статистические характеристики многомерного вероятностного распределения интенсивности отсчетов цветовых компонент.
Будем рассмотривать цветное изображение в формате ЯвВ, которое представляется отсчетами функции интенсивности цветовых компонент
/(т,п) = ((ш,п)/в(ш,п)/в(ш,п)), где т,п<еЪ .
Как известно в пространстве ЯвВ присутствует кросс-канальная корреляция, что приводит к статистической зависимости признаков, вычисленных по разным цветовым каналам. Поэтому необходимо использовать декоррелированное цветовое пространство. Таким является цветовое пространство ЯМегшап Iар [7], которое получено на основе анализа главных компонент в пространстве 1М [7].
Переход в цветовое пространство Iар из ШвВ осуществляется в два этапа.
1) Переход из КвВ в 1МБ [7]:
( Ь Л (0,3811 0,5783 0,0402VДЛ
м
0,1967 0,7244 0,0782 0,0241 0,1288 0,8444
О
2) Переход из 1МБ в 1ав [7]:
(і Л
а
в
(0,5774 0,5774 0,5774 Л
0,4082 0,4082 -0,8164
0
ч 0,7071 -0,7071
ІЕ Ь ІЕ М ІЕ 5
Здесь цветовые компоненты ВСБ нормированы так, чтобы принимать значения в диапазоне [0;1].
Для того, чтобы достичь инвариантность к цвету, необходимо привести статистические характеристики каждой компоненты к заранее определенным величинам, например, т = 0; ст = 1. Это можно сделать, выполнив для каждого канала поэлементную обработку следующего вида:
l - m , а-ma в-me
-; а =-
-; в =-
где т - математическое ожидание, ст - дисперсия.
В данной работе рассматриваются статистические методы формирования признаков, основанные на 3-х мерной функции распределения вероятности яркости в 3-х соседних точках.
Рассмотрим интенсивности заданного цветового канала С (одного из Iар ) в трех точках, находящихся на заданном расстоянии друг от друга:
М 0 = /с (т, п ) , М1 = /с (т + Ат1, п + Аи1) ,
М 2 = /с (т + Ат2, п + Ап2).
Обозначим р (м 0 = х, М1 = у, М 2 = г) - вероятность появления точек с яркостями х, у, г . Тогда функция распределения вероятности будет определена как: Г1 (х, у, г) = р (М 0 < х, М1 < у,М 2 < г).
щ м2
Mi
м0
м2
Рис. 2. Примеры взаимного расположения точек Так как нет необходимости учитывать порядок расположения соседних отсчетов, перейдем к следующей функции распределения, усреднением по следующей схеме:
Г2 (х, у, г) = 6 (Г1 (х, у, г) + Г1 (х, г, у) +
+F1 (у, x, z) + F1 (у, z, x) + +F1 (z, x, у) + F1 (z, у, x)).
Для обеспечения инвариантности, относительно поворота на угол кратный 45°. Будем рассматривать следующие расположения точек:
1. Ат1 = Ак{, Ап1 = А/1; Ат2 = Ак2; Ап2 = А12,
2. Ат1 = А/1; Ап1 = Аk1; Ат2 = А/2; Ап2 = Ак2 ,
3. Ат1 = А/1; Ап1 = Ак^ Ат2 = -А/2; Ап2 = Аk2,
4. Ат1 = -Акр Ап1 = А/1; Ат2 = -Ак2; Ап2 = А12 .
Пусть каждому из случаев соответствуют функции распределения Flг (х, у, г), F22 (х, у, г),
Р’1 (X, у, г ) , (X, у, г ) .
В результате усреднения получим функцию распределения:
F Х Уг) = -г (^ (( У’г)+^ (х. У,г) +
+F32 (x, у, z) + F42 (x, у, z)).
ведем следующие чис орреляция:
R = j x)zdF (x, у, z).
Введем следующие числовые характеристики:
1. Корреляция:
2. Затенение:
^ =| (х + у + г) dF(х, у, г).
я3
3. Контраст:
К1 = — | (х - у| + |х - г| + |у - г| (х, у, г),
3 я3
К = Ц( х - у)(х - г)(у - г )| dF(х, у, г).
я3
4. Инерция:
71 = 31 ((х - у )2+(х - г )2+(у- г)2)^(х= у>г),
3 я3
12 = I (х - у)2 (х - г)2 (у - г)2 ^(х у,г),
я3
Признаки записаны для нулевого математического ожидания. Общий вид признака, можно представить как:
с = I ё(х, у, г) dF( х, у, г).
я3
В случае, если исходная функция распределения не известна, можно использовать эмпирическую функцию распределения вероятности [8]:
Г(х, у, г) = — , где к - количество элементов выборки, попадающих в область х' < х, у' < у,
г' < г. Тогда получим следующую выборочную оценку:
1 N -1
C = N X g(x, у<, z>).
Nto
Значение признаков вычисляется для каждой цветовой компоненты, поэтому далее будем использовать обозначения, включающие название цветового канала и признака, например: l Shading (IS) - затенение, рассчитанное по компоненте l.
Таким образом, процедура вычисления признаков заключается в одном проходе по изображению заданными шаблонами взаимного расположения то-
R
чек. Экспериментальные исследования на натурных изображениях показали, что предложенный метод вычисления признаков является более быстрым и требует меньше памяти по сравнению с методом, основанным на вычислении 3-х мерной матрицы вероятностного распределения (гистограммы).
2. Дискриминантный анализ признаков Для определения степени эффективности признаков при классификации используются элементы дискриминантного анализа [9, 10]. Цель выбора признаков состоит в выделении признаков, которые являются наиболее эффективными с точки зрения разделимости классов. Разделимость классов зависит только от распределения объектов в классах, а также от используемого классификатора.
В дискриминантном анализе критерий разделимости записывают с использованием матриц рассеяния внутри классов и матриц рассеяния между классами. Пусть , - матрица рассеяния внутри классов, Бь - матрица рассеяния между классами, Бт -матрица рассеяния смеси. Для выбора признаков рассматривались три критерия:
J1 = 1х 5 / 1х 5 ,
1 т я '
J 2 =1 5т | / | 5^ | ,
J 3 = 1г(5„-15ь).
Наилучшие признаки те, для которых критерий разделимости максимален [9, 10]. В данной работе рассматривалась задача выбора трёх признаков. Из всего множества векторов признаков, построенных по обучающей выборке, вычислялись критерии разделимости по всем тройкам, количество которых равно С138 = 816 . В таблицах 1-3 показаны результаты вычисления критериев разделимости.
Таблица 1. Значения критерия 1
IS а K 2 eS 10,бб213
а S а K 2 eS 10,бб211
а R а S eS 2,0810б
Таблица 2. Значения критерия 2
IS а K 2 eR 1б3,95
IS а K 2 eS 159,8б
IK 2 ІІ2 а R 3,38
Таблица 3. Значения критерия 3
IS а K 2 e S 17,09
Ill а S а K2 17,01
IK 2 ІІ2 а R 1,80
Из таблиц видно, что критерии J1 и J3 дали одинаковые результаты, при этом наилучшими оказались признаки: l Shading (IS), a Contrast2 (aK2), b Shading (PS) - 1-ый набор. А по критерию J2 лучшими признаками являются: l Shading (IS), a Contrast2 (a K2), b Correlation (РЛ) - 2-ой набор. Расположения объектов в пространстве признаков данных наборов показано на рисунках 2, 3, из которых видно, что обрабатываемые четыре класса лейкоцитов линейно разделимы.
Можно заметить, что полученные наборы признаков отличаются одним признаком (признак PS и РЛ). Вследствие этого, в дальнейшем для построения классификатора планируется использовать четыре признака, максимизирующие выбранные критерии разделимости классов.
<=р 0,0161 0,014
-а
0,012-
0,010-
0,008-
О □
R]
/0,01 "2
0,02 a Contrast2
a Contrast2
Рис. 3. Расположение объектов в пространстве 1
Рис. 4. Расположение объектов в пространстве 2
Заключение
В работе предложен метод вычисления цветотекстурных признаков, основанный на вычислении статистических характеристик двумерных случайных полей. Экспериментальные исследования проводились на натурных изображениях клеток крови. Работа алгоритма сравнивалась с уже реализованными алгоритмами на основе МВР. В результате сделаны следующие выводы:
1. Полученные признаки позволяют проводить автоматическую классификацию клеток крови.
2. Алгоритм обладает высокой скоростью, в сравнении с методами, основанными на анализе матрицы вероятности [5, 6].
Анализ проведенных экспериментальных исследований свидетельствует о том, что разработанные алгоритмы могут применяться для системы диагностики заболеваний крови. Одним из достоинств работы можно назвать сокращение затрат времени на обработку изображения.
Благодарности
Работа выполнена при поддержке российско-американской программы «Фундаментальные исследования и высшее образование» (BRHE) и программы Президиума РАН «Фундаментальные науки - медицине», гранта РФФИ № 06-07-08006-офи, гранта РФФИ № 07-08-96611.
Литература
1. Kern W. PDQ Hematology. - B.C. Decker. Published October, 2002. - 440 p.
2. Theml H. Color Atlas of Hematology, 2nd revised ed. -Thieme, 2004. - 198 p.
3. R.M.Haralick, K.Shanmugam, I.Dinstein Textural features for image classification // IEEE Trans.Syst.Man Cybern. 1973. - V. 3. - P. 610-621.
4. Shirvaikar M., Trivedi M. Developing texture-based image clutter measures for object detection // Optical Engineering, 1992. - Vol. 31(12). - P. 2628-2639.
5. Basset O., Dupont F., Herandez A., Odet C. Texture image analysis: application to the classification of bovine muscles from meat slice images // Optical. Engineering, 1999.
- V. 38(11). - P. 1950-1959.
6. Hozman J., Bernas M., Kubinek R. Biomedical Image Processing Applications // Biomedical Engineering & Biotechnology, Publishing House of the Czech Technical University, 1994.
7. Ruderman D.L., Cronin T.W. and Chiao C.C. Statistics of Cone Responses to Natural Images: Implications for Visual Coding // J. Optical Soc. of America, 1998. - Vol. 15.
- No. 8. - Pp. 2036-2045.
8. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: основы моделирования и первичная обработка данных /- М.: Финансы и статистика, 1983.
- 471 с.
9. Фукунага К. Введение в статистическую теорию распознавания образов. - М.: Наука, 1979. - 270 с.
10. Theodoridis S., Koutroumbas K. Pattern Recognition, 2nd ed // Academic press, 2003.