Научная статья на тему 'Классификация кристаллограмм с использованием методов статистического анализа текстурных изображений'

Классификация кристаллограмм с использованием методов статистического анализа текстурных изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
274
62
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ильясова Н. Ю., Куприянов А. В., Храмов А. Г.

Работа посвящена исследованию применимости статистических признаков текстурных изображений для классификации кристаллограмм. В качестве признаков текстурных изображений использовались моментные характеристики второго порядка, рассчитываемые на основе многомерного распределения функции яркости. Для классификации кристаллограмм использовался метод k-ближайших соседей. Экспериментальные исследования проводились на кристаллограммах слезной жидкости. Были выделены семь различных классов кристаллограмм и две группы: группа нормы и группа патологии. Проинтерпретирована зависимость качества классификации от набора признаков и типа изображении.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Классификация кристаллограмм с использованием методов статистического анализа текстурных изображений»

КЛАССИФИКАЦИЯ КРИСТАЛЛОГРАММ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ СТАТИСТИЧЕСКОГО АНАЛИЗА ТЕКСТУРНЫХ ИЗОБРАЖЕНИЙ

Н.Ю.Ильясова, А.В.Куприянов, А.Г.Храмов* Институт систем обработки изображений РАН * Самарский государственный аэрокосмический университет

Работа посвящена исследованию применимости статистических признаков текстурных изображений для классификации кристаллограмм. В качестве признаков текстурных изображений использовались моментные характеристики второго порядка, рассчитываемые на основе многомерного распределения функции яркости. Для классификации кристаллограмм использовался метод ^-ближайших соседей. Экспериментальные исследования проводились на кристаллограммах слезной жидкости. Были выделены семь различных классов кристаллограмм и две группы: группа нормы и группа патологии. Проинтерпретирована зависимость качества классификации от набора признаков и типа изображении.

1. Введение

В данной работе предлагается использовать методы текстурного анализа для классификации фотографических изображений кристаллограмм слезной жидкости. Главной целью исследования является оценка возможности классификации кристаллов с использованием признаков, получаемых при текстурном анализе изображений.

Кристаллами называют вещества, в которых составляющие их частицы расположены правильными, симметричными, периодически повторяющимися рядами, сетками, решетками. Термин "текстура" обозначает ткань, связь, строение. Кристаллы слезы - это так называемые дендритные кристаллы, или дендриты [1], то есть кристаллы, состоящие из лучей, идущих из одного или нескольких центров кристаллизации.

Фотографическое изображение кристалла называется кристаллограммой.

Для описания кристаллограмм необходимо провести анализ изображения и описать обнаруженные текстуры. Человек достаточно легко справляется с разделением текстурных изображений, в то время как автоматическая классификация часто является сложной задачей. В этом случае необходимо определить, какая информация используется наблюдателем для классификации изображений. Такой информацией может быть наличие неровностей, регулярности и привилегированных направлений, то есть локальные текстурные свойства изображения. Эти наблюдения могут помочь при выборе подходящих характеристик для построения метода анализа. Таким образом, выбираемый метод должен быть основан на количественном описании текстурных свойств изображения. В данном случае текстура рассматривается как важная перцепционная величина, то есть совокупность количественных показателей, которые человек обычно связывает с текстурами [2].

В работе [3] была предложена качественная визуальная классификация типов кристаллов, образующихся при кристаллизации слезы. Основанием для разработки классификации стал общий анализ кристаллографической картины. В работе представлен свод графических схем важнейших классов и типов кристаллов: нормотипы, кристаллы переходных и

смешанных типов и кристаллы с воспалительными и дистрофическими признаками. При классификации в текстуре кристаллограммы выделялся преобладающий тип, который сравнивался с результатами в таблице.

Автоматизированный анализ является более объективным и дает возможность получать не только качественные, но и количественные оценки структурных изменений кристалла, основанные на перцепционных свойствах изображения. Перцепционные характеристики [2] определяют, что именно является отличительной особенностью данного изображения как объекта, принадлежащего некото -рому классу.

Любой показатель, который фокусируется на исходном изображении, можно использовать для характеристики перцепционных эффектов, описания текстур и квазипериодических структур лишь в самом общем случае. Для более детального описания необходимо определенное преобразование изображения, которое позволило бы выделить особенности данного изображения, как представителя некоторого класса.

Различные типы кристаллограмм характеризуются наличием квазипериодических структур, примерами являются кристаллограммы слезной жидкости (рис.1а), кристаллограммы кровяной плазмы (рис.1Ь) и многие другие изображения естественного и искусственного происхождения.

а Ь

Рис.1. Различные типы кристаллов: (а) кристаллограмма слезной жидкости, (Ь) кристаллограмма плазмы крови.

Квазипериодические структуры [4] определяются наличием многоконтурной упорядоченной текстуры с выраженной ориентацией. В каждой малой области квазипериодической структуры функция яр-

кости является периодическои вдоль определенного направления, что визуально выражается в системе полос. Основными параметрами таких изображений являются преимущественное направление полос и их густота в каждой точке изображения. Кроме того, на таких изображениях выделяются особые точки и линии (сингулярности), в которых нарушается периодическая структура.

Известен метод анализа кристаллограмм слезной жидкости, основанный на построении поля частот и поля направлений [5]. В работе [6] представлены методы автоматизированного анализа и распознавания кристаллограмм, исследование их диагностической ценности, методы формализации медико-диагностических признаков и формирования количественных вероятностных оценок патологии органов зрения на основе системы геометрических признаков кристаллограмм. На основе этих методов были разработаны алгоритмы интегральной оценки вероятности патологии исследуемой кристаллограм-мы, объединяющей выбранные критерии классификации. Все они базировались на использовании понятия поля направления. Однако эта методика не позволяет выделять классы изображений, а лишь показывает степень патологии. Кроме того, используемые признаки, такие как критерий чёткости лучей кристаллов, критерий прозрачности кристалло-граммы, преобладающая частота, признак однонаправленности не обладают достаточной информативностью.

Поскольку метод диагностики заболеваний на основе классификации кристаллограмм слезы изначально был предложен в [3] как выделение визуальных различий между различными типами кристаллов, в настоящей работе проводится исследование именно тех признаков, которые так или иначе связаны с восприятием человеком изображений.

В качестве основы для данной работы был выбран метод, предложенный Хараликом в [7], называемый в дальнейшем статистическим текстурным анализом. Описание изображений с помощью текстурного анализа требует вычисления различных признаков и расчета величин, образующих вектор, называемый сигнатурой текстуры [2]. Текстурные признаки - это статистические характеристики многомерного вероятностного распределения яркости полутонового изображения.

Задачей является выделение признаков, связанных с локальными текстурными особенностями кристаллограмм. Подход, основанный на матрицах вероятностного распределения яркости, уже не раз очень успешно использовался для выделения такой информации [2,8,9]. Он предлагает достаточное число показателей, представляющих собой различные статистические признаки второго порядка. Исследование этих признаков применительно к диагностическим кристаллограммам является основным содержанием данной работы.

2. Формирование пространства признаков на основе матриц вероятностного распределения яркости

Визуальные различия в текстуре между различными классами могут быть описаны различными способами. Для описания свойств текстур и, если возможно, указания невидимых специфических текстурных элементов, были выбраны статистические признаки второго порядка, вычисляемые на матрицах вероятностного распределения яркости.

2.1 Матрицы вероятностного распределения яркости Для описания изображений с использованием статистики второго порядка был реализован метод, основанный на матрицах вероятностного распределения яркости на изображении (МВР). Такой подход часто используется при текстурном анализе [8,9], поскольку он дает большой набор признаков, и можно предполагать, что, по крайней мере, один из них отражает текстурные изменения между классами. Элементами матрицы являются вероятности второго порядка, которые учитывают как уровни яркости, так и относительное расположение пикселей на изображении.

Введем необходимые обозначения: П - область изображения, М х N точек, Хтп - яркость точки с координатами (т, п) на изображении, (т, п) е П ,

С - число уровней яркости на изображении,

Л1 (хт

.] (хт п,Хт+к, п+1

) =

1 Хт,п ' ,Хт+к,п+1 1 . . „ , „ , (1)

; 1,1 =0Д..., С-1

ХЩп & или Хт+к,п+1 &

Функция-индикатор (1) показывает, имеют ли точки, лежащие на соответствующем расстоянии друг от друга, определенные уровни яркости.

Ненормированные значения МВР яркости определяются как

С к ,1 О,1 ) = 1,1 (Х т ,п ,Х т +к ,п+1 ) ,

(т ,п )еП

(т +к ,п+1 )еП

к,I = 0, ± 1, ±2, ...

Общее число пар меняется в зависимости от заданного смещения (к, I) между отсчетами изображения, потому удобно перейти к нормированным значениям, поделив каждый элемент матрицы на число пар:

Рк ,1 0', 1) =

ск ,10,1) Цсма, 1) .

Матрица Ры имеет размерность Ох О.

Поскольку нет необходимости учитывать различие между противоположными направлениями, можно использовать симметричные матрицы Р■1, которые определяются равенством:

Р■ =

Рк ,1 -

Р + Р

1 к,1 ^ -к -I 2

Также для того, чтобы устранить зависимость элементов матрицы от поворота изображения для

вычисления признаков использовалась матрица Р4 ,

как среднее четырех матриц вычисленных при каждом из четырех углов поворота (0°,45°,90° и 135°):

Р4 = Р,0 + Р^ + Р0ы + Р-44 )/ 4 . (2)

Таким образом, матрица позволяет оценить преимущественное расположение отсчетов на изображении и их коррелированность.

На рис.2а показана графически МВР яркости кристаллограммы с 256 уровнями яркости (размеры матрицы - 256x256). На рис.2Ь показаны первые 64x64 отсчета этой матрицы. Для визуализации использована обратная адаптивная логарифмическая шкала яркости: чем больше значение, тем темнее точка на рисунке.

а Ь

Рис.2. Визуализация матрицы вероятностного распределения яркости кристаллограммы: (а) полная матрица (256x256 точек); (Ь) фрагмент матрицы (64x64 точек)

2.2 Статистические признаки второго порядка.

Для численного анализа матриц вероятностного распределения яркости был выделен набор статистических признаков второго порядка - текстурных признаков. Этими признаками являются: второй угловой момент, корреляция, контраст, инерция, энтропия и затенение.

1. Первый момент - характеризует среднюю яркость по всему изображению:

О-1 О-1

Мх (', 1).

1=0 1=0

Эта величина не зависит выбранного расстояния 4 .

2. Второй угловой момент - характеризует степень однородности:

/4 = Х X [ (1,1)]2.

1=0 1=0

3. Контраст - характеризует степень контрастности изображения,

О-1 О-1

/2 = ХХ 1 - №(1,1).

1=0 1=0

4. Инерция - характеризует наличие резких границ и т. п.:

О-1 О-1

/4 =ХХ(1 - Л2 Р4 (1,1).

1=0 1=0

5 Корреляция - характеризует степень статистической зависимости отсчетов изображения:

О-1 О-1

/4 = ХХ(1 - Мх )(1 - Мх) р; (1,1).

1=0 1=0

6. Затенение - степень равновероятного появления темных и светлых областей, есть ли тень у светлых областей и т.п.:

О-1 О-1

/4 =ХХ(1 +1 - Мх )3 Р4 (1,1).

1=0 1=0

7. Энтропия - мера "беспорядочности" изображения:

0-1 О -1 |- 1

// = -!!Ф; а ж ('", л.

1=0 ]=0

Для ограничения размерности вектора признаков были рассмотрены только два расстояния й=1 и ё=2 .

Таким образом, для каждого изображения имеем набор признаков

р=(/;,..., л1, /Л-, /62).

(3)

Средняя яркость М х исключена из набора признаков, поскольку она базируется фактически на одномерном распределении яркости, не несет никакой информации о текстурных свойствах изображения и определяется условиями его регистрации.

3. Экспериментальные исследования

Для классификации изображений кристалло-грамм на основе статистических текстурных признаков предлагается использовать методику, применявшуюся ранее к исследованию изображений срезов мышечной ткани [8] и обработки изображений плазмы крови [9].

После предварительной обработки (фильтрации и выравнивания яркости) первичных изображений формировались исходные данные - обучающая и тестовая выборки. Для каждого изображения строились матрицы вероятностного распределения и вычислялся вектор признаков (3). На основе обучающей выборки строился классификатор по к -ближайшим соседям, качество работы которого проверялось с помощью тестовой выборки.

На рис.3 последовательно представлены все этапы проведенного исследования. Пунктиром отмечены задачи, решенные ранее в работах других исследователей. Разбиение кристаллограмм на классы проводилось в соответствии с работой Дво-ряновой [3]. Пространство признаков подробно исследовано Хараликом [7], классификатор по к -ближайшим соседям рассмотрен в [10].

3.1 Обработка исходного изображения и формирование исходных данных

После визуального исследования кристалло-грамм с использованием серии формальных признаков, таких как однонаправленность лучей кристалла и количество центров кристаллизации, плотность линий на изображении кристалла и др., изображения были априори разделены на несколько классов. Все классы можно разделить на две группы: группа нормы и группа патологий.

Кристаллы нормальной группы имеют правильную форму, преимущественно однонаправлены, очень небольшое число центров кристаллизации. Кристаллы группы патологий имеют много центров кристаллизации, развитую дендритную структуру, а так же возможны посторонние включения. В них более ярко выражены квазипериодические структуры.

Рис.3. Схема исследования

Таким образом, всего было выделено 7 классов (рис.4). Классы а и Ь относятся к нормальной группе, остальные образуют группу патологий.

На изображениях наблюдалось два типа искажений. Это шум, связанный с оцифровкой изображения, и искажения вследствие плавного изменения яркости на изображении, возникающие при использовании направленного источника света при фотографической съемке. Эти искажения корректировались с помощью совмещенного выравнивания яркости и высокочастотной фильтрации.

При фильтрации использовался полосовой фильтр [8]. Низкочастотная часть фильтра, используемая для уменьшения электронного шума, состоит из одинаковых коэффициентов с суммой равной единице. Высокочастотная часть фильтра получается из оставшихся коэффициентов, чтобы сумма все коэффициентов маски равнялась нулю.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

I а = ^ Ь = 1

Общий вид маски приведен на рис.5. Использовалась маска размером 21x21, с размером цен-

тральной части 3x3, таким

образом а = -9-

Ь =

1

212 -32

ff

p > ; :Л

П да

к- л

iïiy.

d e f

Рис.4. Образцы кристаллограмм каждого класса: (a)-(b) - группа нормы; (c)-(g) - группа патологий

-b

-b

-b

-b

-b

-b

-b

-b

a a a

a a a

a a a

-b

-b

-b

-b

-b

-b

-b

-b

Рис.5 Коэффициенты фильтрующей маски.

Такой фильтр уменьшает эффект равномерного изменения яркости освещения и подчеркивает текстурные особенности на изображении.

После фильтрации изображение приводилось к стандартному диапазону яркости [0..255]

Из-за малого числа образцов каждого класса, изображения кристаллограмм были разделены на информативные области, из которых были сформированы новые изображения. Полученные текстурные изображения были достаточно велики, чтобы быть представителями различных типов кристалло-грамм.

Для каждого образца вычислялся вектор набора признаков (3). В дальнейшей обработке использовалось множество полученных векторов.

3.2 Метод классификации

Все множество векторов случайным образом делилось на две равные группы - тестовую и обучающую выборки так, чтобы обе выборки содержали равное число образцов из каждого класса.

Был использован метод классификации по k -ближайшим соседям. В качестве метрики использовалось расстояние Махланобиса [10]

d(Fl,F2) = (F -F2)'B-1(Fi -F2).

Корреляционная матрица B оценивалась по векторам из обучающей выборки. Для каждого образца из тестовой выборки вычислялись расстояния до k его ближайших соседей.

Первые попытки классификации выполнялись при всех возможных значениях числа соседей к. Выбор максимального значения равного 6 связан с тем, что минимальное число образцов для класса равнялось 12, следовательно, только шесть из них можно было использовать в обучающей выборке. Результаты, полученные при классификации по шести соседям, были наилучшими, поэтому проводился анализ классификации именно с таким значением параметра.

3.3 Анализ результатов

Было исследовано 14 больших образцов размерами до 2198 х 1976, по два из каждого класса, которые затем были разбиты на более мелкие информативные изображения размером не более 512 х 512 отсчетов. Таким образом, было доступно 120 образцов для представления набора из 7 классов, число представителей каждого класса менялось от 12 до 20.

В ходе эксперимента 20 раз проводилось случайное формирование обучающей и тестовой выборки. После каждого формирования проводилась классификация, и фиксировалось число верно проклассифицированных образцов из каждого класса, а также число верно проклассифицированных образцов из группы нормы и группы патологий. Классификация признавалась верной, если исследуемый объект, относящийся к группе норма, по результатам классификации относился либо к первому, либо ко второму классу. Аналогично формировались результаты для группы патология.

Таким образом было получено среднее число верно проклассифицированных образцов для каждого класса и группы. Результаты представлены в таблице 1.

Практически все типы классифицировались правильно. Отметим, что классы Ь и с часто ошибочно классифицировались, как класс / А класс /, как классы е и g.

b

a

c

g

Практически все образца из класса й попали в этот же класс, только в двух случаях из 20 один из образцов относился к классу е.

Результаты очень хорошо согласуются с визуальным наблюдением. Действительно, принимая во внимание используемый набор признаков, на кри-

Результаты классификации образцов кристаллограмм

сталлах класса й преобладают очень тонкие лучи и большие межлучевые расстояния, что делает его непохожим на остальные. Класс / может быть признан похожим на класс с или е, поскольку в основном отличается от них толщиной кристаллов и плотностью линий.

Таблица 1

Класс (группа) a b c d e f g Норма Патология

Число различных образцов 20 18 16 12 18 20 16 38 82

Число образцов в выборках 200 180 160 120 180 200 160 380 820

Проклассифицировано без ошибок 194 138 144 118 176 142 154 334 810

Процент безошибочной классификации 97.0 76.7 90,0 98,3 97,8 71,0 96,3 87,9 98,8

Следует отметить очень низкую вероятность ошибок ложного пропуска. Практически все объекты из группы патологии по результатам классификации попали в эту группу. Вероятность ошибок ложной тревоги также достаточно мала, около 13%.

Высокая точность классификации может быть связана также с тем, что при проведении экспериментов крупные изображения подвергались разбиению на части, а части одного изображения больше похожи друг на друга, чем на образцы другого представителя класса. Результаты могут несколько измениться при использовании большего числа образцов каждого класса, без дополнительного разбиения.

4. Заключение

На основе статистического текстурного анализа построен классификатор, который позволяет определять тип кристаллограмм слезной жидкости. Доказана принципиальная возможность использования метода для диагностики заболеваний.

В некоторых экспериментах было практически 100% точность. Однако при работе ощущался недостаток исходных изображений, наличие большего числа образцов должно повысить точность классификации и сделать её более универсальной.

Кроме того, возможно повышение качества работы классификатора путем увеличения размерности пространства признаков, так как в данной работе использовались далеко не все признаки, предложенные в [7]. Дальнейшие исследования также будут посвящены проверке информативно -сти признаков с использованием методов дискри-минантного анализа. Поскольку некоторые из признаков, вероятно, имеют высокую степень корре-лированности с другими, результаты анализа информативности признаков приведут к улучшению качества классификации. Использование расстояния Махланобиса в методе k -ближайших соседей, как и сам метод, были выбраны из соображений простоты и удобства реализации. Выбор наилучших метрики и классификатора также предполагается в дальнейших исследованиях.

Есть большой потенциал в возможности построения теории статистических текстурных признаков третьего порядка и в использовании треугольной растеризации изображений.

Литература

1. Д.Д.Саратовкин, Дендритная кристаллизация // Металлургиздат, Москва, 1953.

2. M.Shirvaikar, M.Trivedi, Developing texture-based image clutter measures for object detection // Optical Engineering, vol.31(12), p.2628-2639, 1992.

3. Т.П.Чухман, Кристаллографическое исследование слезной жидкости при воспалительных заболеваниях глаза // Дис. на соиск. учен. ст. канд. мед. наук, Волгоград, 1999.

4. V.A.Soifer, V.V.Kotlyar, S.N.Khonina, and A.G.Khramov, The Method of The Directional Field in the Interpretation and Recognition of Images with Structure Redundancy // Pattern Recognition and Image Analysis, v.6, No.4, p.710-724, 1996

5. Н.Ю.Ильясова, А.В.Устинов, А.Г.Храмов, Численные методы и алгоритмы построения полей направлений квазипериодических структур // Компьютерная оптика, вып.18, с.150-165, 1998.

6. Т.ПДворянова, Н.Ю.Ильясова, А.В.Устинов, А.Г.Храмов, Компьютерная система анализа диагностических кристаллограмм // Компьютерная оптика, вып.16, с.90-96, 1996.

7. R.M.Haralick, K.Shanmugam, I.Dinstein, Textural features for image classification // IEEE Trans.Syst.Man Cybern. v.3, p.610-621, 1973.

8. O.Basset, F.Dupont, A.Herandez, C.Odet, Texture image analysis: application to the classification of bovine muscles from meat slice images // Optical. Engineering, v.38(11), p.1950-1959, 1999.

9. J.Hozman, M.Bernas, R.Kubinek, Biomedical Image Processing Applications // Biomedical Engineering & Biotechnology, Publishing House of the Czech Technical University, 1994.

10. Р.Дуда, П.Харт, Распознавание образов и анализ сцен // Издательство "Мир", Москва, 1976.

i Надоели баннеры? Вы всегда можете отключить рекламу.