Научная статья на тему 'Анализ изображений в автоматизированной флуоресцентной системе диагностики рака шейки матки (доклинический этап)'

Анализ изображений в автоматизированной флуоресцентной системе диагностики рака шейки матки (доклинический этап) Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
49
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАННЯЯ ДИАГНОСТИКА / РАК ШЕЙКИ МАТКИ / ФЛУОРЕСЦЕНТНЫЕ ИЗОБРАЖЕНИЯ / СЕГМЕНТАЦИЯ И КЛАССИФИКАЦИЯ ИЗОБРАЖЕНИЙ / НЕЧЕТКАЯ ЛОГИКА / EARLY DIAGNOSIS / CERVICAL CANCER / FLUORESCENT IMAGES / IMAGES SEGMENTATION AND CLASSIFICATION / FUZZY LOGIC

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Канг Ук, Бэ Су-джин, Папаян Гарри Вазгенович, Обухова Наталья Александровна

Рассмотрены методы предварительного анализа и классификации изображений с целью ранней диагностики рака шейки матки. Исходными данными для обработки являются пять типов изображений: изображения в белом и поляризованном белом свете, флуоресцентные изображения при возбуждающем излучении с длинами волны 360 и 390 нм с лазерной подсветкой 625 и 430 нм. Методы используют математический аппарат нечеткой логики. На этапе предварительного анализа выделяют области, отличающиеся от большей части изображения. На этапе классификации строят карту патологии на основе информации базы данных. Экспериментальная проверка, проведенная на тестовых изображениях мышей, подтвердила работоспособность предложенных методов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Канг Ук, Бэ Су-джин, Папаян Гарри Вазгенович, Обухова Наталья Александровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Image analysis in the automated fluorescence system for cervical cancer diagnosis (preclinical stage)

The methods of image preliminary analysis and classification for early cervical cancer diagnostics are offered. The methods use several types of images: the image in white light, the image in polarized white light, fluorescent images obtained with the exciting wavelength of 360 nm, 390 nm with laser illumination at 625 nm and 430 nm. The image processing is based on mathematical apparatus of fuzzy logic. At the preliminary analysis stage the areas differ from the most part of image are detected. At the classification stage pathology map is created according to data base information. The experimental research was performed on images of mice.

Текст научной работы на тему «Анализ изображений в автоматизированной флуоресцентной системе диагностики рака шейки матки (доклинический этап)»

Телевидение и обработка изображений

УДК 621.397.13:656.021

Ук Канг, Су-Джин Бэ

Корейский электротехнологический исследовательский институт

Г. В. Папаян

Санкт-Петербургский государственный медицинский университет

им. Академика Павлова Н. А. Обухова

Санкт- Петербургский государственный университет

аэрокосмического приборостроения

I Анализ изображений в автоматизированной флуоресцентной системе диагностики рака шейки матки (доклинический этап)

Рассмотрены методы предварительного анализа и классификации изображений с целью ранней диагностики рака шейки матки. Исходными данными для обработки являются пять типов изображений: изображения в белом и в поляризованном белом свете, флуоресцентные изображения при возбуждающем излучении с длинами волны 360 и 390 нм с лазерной подсветкой 625 и 430 нм. Методы используют математический аппарат нечеткой логики. На этапе предварительного анализа выделяют области, отличающиеся от большей части изображения. На этапе классификации строят карту патологии на основе информации базы данных. Экспериментальная проверка, проведенная на тестовых изображениях мышей, подтвердила работоспособность предложенных методов.

Ранняя диагностика, рак шейки матки, флуоресцентные изображения, сегментация и классификация изображений, нечеткая логика

Рак шейки матки по уровню смертности занимает лидирующее место среди различных видов онкологических заболеваний [1], поэтому одними из важнейших направлений работ в сфере охраны здоровья являются обеспечение его ранней диагностики и лечение патологии на начальных стадиях развития.

Обязательной процедурой, проводимой для выявления рака шейки матки, является кальпоскопия - диагностический метод, при котором врач проводит визуальный анализ тканей шейки матки и принимает решение о наличии патологического процесса, а также о необходимости взятия проб (биоптатов) из конкретных областей. Признаками патологии являются изменения цвета тканей, появление специфических сосудистых рисунков, нарушение однородности ткани, уменьшение расстояния между капиллярами и другие. Результативность визуального анализа в значительной мере зависит от опыта и квалификации врача. Повышение эффективности кальпоскопии обеспечивается использованием систем автоматического и автоматизированного анализа изображений шейки матки.

Цель исследования, описанного в настоящей статье, - разработка автоматизированной системы ранней диагностики рака шейки матки, реализующей следующие функции:

© Канг Ук, Бэ Су-Джин, Папаян Г. В., Обухова Н. А., 2012

79

Известия вузов России. Радиоэлектроника. 2012. Вып. 2======================================

• подчеркивание характерных признаков патологии на полученных в ходе обследования изображениях и обеспечение возможности их количественной оценки;

• сегментацию изображений на основе одного признака патологии и по совокупности признаков с оценками площадей каждой сформированной области;

• выделение области изображения вокруг указанной специалистом точки с близкими к ней свойствами;

• формирование карты патологии - изображения, разбитого на области с определенным диагнозом (мерой соответствия различным степеням развития злокачественного процесса);

• формирование карты проб - изображения с маркерами в точках, где необходимо взятие биоптата для гистологического анализа.

В разработанной системе исходными данными для обработки являются пять типов изображений (мод): изображение в белом свете (мода 1), изображение в поляризованном белом свете (мода 2), флуоресцентные изображения, полученные при возбуждающих излучениях с длинами волн 360 нм (мода 3), 390 нм (с лазерной подсветкой 625 нм) (мода 4) и 430 нм (мода 5).

Основные задачи доклинического этапа:

• определение признаков патологии на изображении для каждой моды;

• оценка эффективности признаков и мод изображений;

• разработка методов предварительного анализа и классификации изображения.

Особенностью доклинического этапа является использование для решения перечисленных задач изображений лап мышей с трансплантированной опухолью ТС-1 (этот вид опухоли по своим свойствам, особенностям и характеристикам автофлуоресценции близок к раку шейки матки).

Признаки патологии и оценка их эффективности. Выделяют три группы признаков патологии на изображении: яркостные, морфологические и текстурные [2]-[4].

Яркостные и цветовые признаки: изменение координат цвета у элементов изображения, соответствующих тканям с патологией. Например на изображениях в белом свете, в пораженной области проявляется эффект "выбеливания" после воздействия уксусной кислоты [2]. Морфологические признаки: изменения в структуре и рисунке сосудов у тканей с патологией; появление характерных сосудистых рисунков: "мозаики", "пунктуации", "шпилек", "запятых" и др. [3], [4]. Текстурные признаки: увеличение неоднородности у тканей с патологией.

В силу особенностей экспериментального материала на доклиническом этапе исследования были использованы только признаки яркости и цвета. В вектор признаков были включены координаты цвета Я, О, В и цветности г, Ь, цветоразностные координаты и яркость Сг, СЬ, У, а также отношения координат цвета Я/О, Я/В.

С целью выделения наиболее эффективных признаков для проведения сегментации и классификации изображения в рамках одной моды, а также для оценки информативности собственно мод, проведена селекция признаков. Реализована предварительная фильтрация набора признаков по следующим критериям (мерам) [5], [6]:

• Кр - критерий расстояния (разделимости): признак х предпочтительнее, чем признак у,

если х обеспечивает большее различие между условными вероятностями двух классов (большее расстояние между классами);

• Кк - критерий корреляции: признак х предпочтительнее, чем признак у, если корреляция признака х с классом с выше, чем признака у;

• Ки - критерий информативности (информационное усиление): определяется разностью между априорной неопределенностью до и после использования признака х;

• Кн - критерий непрерывности: под нарушением непрерывности при использовании

признака х понимают наличие образцов, имеющих одинаковое значение признака, но относящихся к разным классам.

Моды были ранжированы по каждому критерию (определены ранги Яр, Як, Яи,

Ян ) и определен суммарный рейтинг каждой моды: Я = Яр + Як + Яи + Ян. На основе рейтинговых оценок мод определены весовые коэффициенты и, 1 = 1, 5, учитываемые при проведении предварительного анализа и классификации изображений:

и=Яшп/я/Е (Яши/я ),

/ 1=1

где Яш|п - минимальное значение рейтинга; Я - рейтинг анализируемой моды.

Проведенный сравнительный анализ яркостных и цветовых признаков на тестовых изображениях мышей позволил сделать вывод, что для мод 1 и 2 наиболее эффективным признаком является цветоразностная координата Сь , для мод 3-5 - отношение Я/В.

Моды изображений ранжированы следующим образом: 1 - флуоресцентные изображения, полученные при возбуждающем излучении с длиной волны 390 нм и лазерной подсветкой 625 нм (мода 4); 2 - флуоресцентные изображения при длине волны 430 нм (мода 5); 3 - изображения в поляризованном белом свете (мода 2); 4 - флуоресцентные изображения при длине волны 360 нм (мода 3); 5 - изображения в белом свете (мода 1).

Предварительный анализ изображения. Цель предварительного анализа - выделение областей, отличающихся по какому-либо признаку от усредненных по моде областей. Предварительный анализ изображения выполняется по текущему изображению без использования какой-либо априорной информации.

Основными шагами метода являются следующие.

Изображение разбивают на элементарные квадратные блоки с размерами N х N пикселей. Размеры блока определяются двумя конкурирующими факторами - степенью усреднения и качеством сегментации. Увеличение размеров блока снижает влияние точечных помех, однако может повысить систематическую ошибку сегментации изображения. Для обработки тестовых изображений мышей использованы фрагменты размером 32*32 пикселя. Для каждого блока оценивается среднее значение признака:

P (Хк, У1 ):

^ N

X X P (xk+1, У1+у)

I =1 у =1

^ 2,

где Хк, У1 - координаты левого верхнего угла блока; Р (Хк +I, У1 + у) - значение признака в пикселе с координатами Хк + I, У1 + у. Например для мод 3-5, Р (Хк + i, У1 + у ) = = 5 (Хк +1, У1 + у У^ (Хк +1, У1 + у), где 5 (•, •), ^ (•, •) - координаты цвета пикселя.

Для каждого блока определяют нормированное отклонение его признака от признака, усредненного по данной моде:

^ (Хк, У1 ) = 1 -ехр{-[Р(Хк, у1)-М]7(252)},

где I = 1, 5 - номер моды; М, 5 2 - оценки математического ожидания и дисперсии, полученные по совокупности значений признака Р для всех блоков анализируемой моды.

Указанные шаги позволяют получить по пять частных оценок для каждого блока каждой моды (Хк, У1), характеризующих отличие блока от результата усреднения по всем блокам моды. На рис. 1 приведены исходные изображения (рис. 1, а-г) и карты отклонений Мга (Хк, У1) (рис. 1, д-з), полученные в результате предварительного анализа в одной моде

(рис. 1, а, д - мода 2; рис. 1, б, е - мода 3; рис. 1, в, ж - мода 4; рис. 1, г, з - мода 5).

На основании этих оценок формируют обобщенную оценку дс0 мажоритарным усреднением с учетом весовых коэффициентов и, I = 1, 5. Принцип мажоритарного усреднения состоит в том, что в качестве результирующей оценки используют значение, повторившееся в выборке Дс, I = 1, 5, наибольшее количество раз.

Оценки являются непрерывными величинами, принимающими значения в интервале от 0 до 1. При реализации алгоритма этот интервал разбивается на К подынтервалов и

определяется количество /к, к = 1, К, оценок, попавших в каждый к-й подынтервал.

Рис. 1

Рис. 2

При определении , к = 1, К, г = 1, 5, учитываются весовые коэффициенты ^ : /к1 = /кг + где $ =1 если дсг- принадлежит в к-му интервалу, и Ф = 0

- в противном случае. Введение весовых коэффициентов позволяет подчеркнуть влияние наиболее эффективных мод. Например, отдать предпочтение наиболее эффективной по данным предварительного анализа моде, если значения всех оценок различны (в каждый интервал попало по одной оценке).

Для получения итоговой оценки выбирается интервал с максимальным значением

/к. Оценка дсо формируется как среднее оценок, попавших в данный интервал.

Таким образом, в результате предварительного анализа для каждого блока определяется мера его отличия от усредненного по моде значения дсо (Хк, у\). На рис. 2 представлены исходные изображения (рис. 2, а, б) и результирующие карты, полученные в результате предварительного анализа (рис. 2, в, г), для двух объектов исследования (рис. 2, а, в -мышь 5, серия 1; рис. 2, б, г - мышь 4, серия 1).

Классификация изображения (построение карты патологии). Классификация выполняется с помощью базы данных значений признака в областях патологии и нормы, найденных при обработке ранее полученных изображений и подтвержденных данными гистологического анализа.

На основе базы данных определяются функции принадлежности [7]-[9], характеризующие меру соответствия фрагмента изображения нечетким множествам "область нормы" и "]-я область патологии" Доы ■ *, 1 = 1, 3, в зависимости от значения признака Р.

Для формирования функций принадлежности строится гистограмма распределения значений признака Р в базе данных и определяется мода полученного распределения Рм.

Функция принадлежности формируется на основе гистограммы с учетом моды распределения и направления изменения признака на областях с патологией по отношению к области с нормой. Мера соответствия фрагмента изображения множеству " ]-я область патологии" Дсгы при попадании значения признака Р в ]-й интервал определяют

следующим образом:

• при убывании признака в области патологии

CIN - Cervical intraepithelial neoplasia - цервикальная интраэпителиальная неоплазия; другое название -cervical dysplasia - дисплазия шейки матки. Выделяют три стадии развития: CIN1 (дисплазия слабой степени), CIN2 (дисплазия средней степени), CIN3 (дисплазия тяжелой степени).

-

1, Ру < рш, 0.9, Ру - Рш, чу/чш, Ру > рш;

при возрастании признака в области патологии

Дспчу -

1, Р) > Рш,

0.9, Ру - Рш,

чу/чш, Ру < Рш,

где Ру, чу - значение признака в у-ш интервале и количество попаданий в этот интервал соответственно; чш - количество попаданий в интервал, соответствующий шоде распределения. На интервале Ру < Рш в первош случае и Ру > Рш - во второш полученная функция

принадлежности аппроксишируется зависишостью Дсгы - ехР

-к (Ру - зт)

где к и зт

парашетры, определяешые шетодош нелинейного програшширования в результате реше-

Ь

ния оптишизационной задачи шт ¥

к

- ¥

I-1

Дсшу - ехР

-к(Р -зт)2]}2-

Такиш образош, функции принадлежности ишеют вид: к нечеткошу шножеству "область патологии":

Дсвч у

1 Р (хк, У1 )>

ехр{-к [ Р ( Хк, У1 )-зту ] 2} , Р ( Хк, У1 )< зту

(1)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

или

Дспчу -

1 Р (Хк, У1 )< зту;

ехР{-к[Р(Хк, У1)-зту]2}, Р(Хк, У1 )>зту;

(2)

к нечеткошу шножеству "область норшы":

1 Р ( Хк, У1 )> зтн

Дн -

или

Дн -

ехр{-к[Р(Хк, У1)-зтн]2}, Р(Хк, У1 )< зтн

1Р (Хк, У1 )< т;

ехр{-к[Р(Хк, У1 )-зтн]2}, Р(Хк, У1 )> зтн-

(3)

(4)

На доклиническош этапе при анализе изображений лап шышей база данных содержала значения признака только для норшы и объединенной области патологии. На рис. 3 представлена эксперишентальная гистограшша, полученная на основе указанной базы данных по оценкаш признака Я/Б в зоне патологии (рис. 3, а), а также сфоршированная на

q

6 42-

I1' Мсм

0.75

0.5

0.25 0

I

и

Мсм 11

0.7

1.05

1.4

а

1.75

Р

Рис. 3

0.7

1.05

1.4

б

1.75

P

а б в

Рис. 4

основе гистограммы функция принадлежности |сш и ее аппроксимация |1 (рис. 3, б) (мыши 1 и 2, мода 4). Полученные в результате обработки карты представлены на рис. 4: a - карта предварительного анализа; б - карта, полученная на основе функции принадлежности к норме; в - карта, полученная на основе функции принадлежности к патологии (мышь 3, серия 1). Переход к дифференциации на несколько областей патологии с формированием оценок по (1)-(4) планируется на клиническом этапе исследований.

Определение мер соответствия фрагмента изображения норме и конкретным стадиям заболевания выполняется для каждой моды. Таким образом, для каждого фрагмента изображения получают матрицу оценок:

1н1 1н2 ^3 1н4 1н5

М€Ши Мсш12 Дсш13 Мсш^ |с1М15

Мсш21 Мсш22 Мсш23 Мсш24

^сШ31 Мсш32 ^сш33 Дс!М34 |с!М35

где второй индекс обозначает номер моды.

По полученной матрице оценок формируются четыре мажоритарные оценки: |н0,

1сш10, 1сш20, 1сш30. Из трех оценок принадлежности к областям патологии С1Ш,

СШ2, сШ3 выбирается максимальная.

Таким образом, после предварительного анализа изображения и классификации для каждого блока изображения формируются три оценки: |80 (Xk, У1 ) - отличия блока от основной части изображения; |п0 (Xk, У1 ) - соответствия норме и |^0 (Xk, у! ) - соответствия определенной стадии заболевания. Окончательно оценка соответствия фрагмента изо-

0

Рис. 5

бражения патологии формируются перемножением указанных частных оценок, реализуя тем самым вероятностное пересечение трех нечетких множеств:

Дг ( xk, У1 ) = ^s0 ( xk, У1 )Дп0 ( xk, У1 j0 ( xk, У1) • На рис. 5 приведены исходные изображения (рис. 5, а-в) и карты патологии (рис. 5, д-ж): а, д - мышь 3, серия 1; b, е - мышь 6, серия 2; в, ж - мышь 4, серия 2.

Экспериментальное исследование. На доклиническом этапе исследования экспериментальная проверка предложенных методов проводилась на тестовых изображениях мышей. Изображения были получены с помощью мультиспектрального флуоресцентного прибора "AnimaScope" (рис. 6). Прибор состоит из осветителя, датчика для регистрации изображений и компьютера со специальным программным обеспечением.

Осветитель реализован на ртутных лампах и полупроводниковых лазерах. Плотность

мощности 26, 69, 73, 170 мВт/см2 при длинах волн 360, 390, 430, 635 нм соответственно. Мультиспектральная система регистрации изображений построена на базе одноматрично-

го ПЗС-приемника формата 2/3" с прогрессивным сканированием ICX285AQ производства фирмы "SONY". Максимальная кадровая частота составляет 14 Гц при числе элементов разложения 1280х1024. Объектив имеет фокусное расстояние 75 мм, относительное отверстие 1/2.8, поле зрения 20.8Х26 мм.

Проведено две серии экспериментов. В первой серии участвовали шесть мышей: одна мышь без патологий - референтная мышь и пять с трансплантированной опухолью TC-1 на каждой задней лапе. Наблюдение проводилось с 3-го по 33-й день после имплантации. Раз в три дня делались фотографии пораженных лап каждой мыши в пяти модах. Таким образом, исход-

Рис. 6

======================================Известия вузов России. Радиоэлектроника. 2012. Вып. 2

ная выборка включала 660 изображений: 110 изображений референтной мыши и по 110 в каждой моде. В ходе экспериментов получены карты предварительного анализа для всех изображений на 3-й, 6-й и 9-й дни. Выделение области патологии достигнуто на всех изображениях. Ошибка сегментации составила 10 %.

На основании изображений, полученных в первой серии экспериментов, сформирована база данных и построены функции принадлежности.

В следующей серии экспериментов с мышами были получены 120 изображений (24 изображения в каждой моде). По ним выполнена классификация. На всех изображениях (24 карты патологии) задача классификации была решена корректно.

Библиографический список

1. Global cancer statistics / D. M. Parkin, F. Bray, J. Ferlay, P. Pisani // CA cancer & clin. 2005. № 55. P. 74-108.

2. Alush A., Greenspan H., Goldbergen J. Automated and interactive lesion detection and segmentation in uterine cervix images // IEEE Trans. on medical imaging. 2010. Vol. MI-29, № 2. P. 488-501.

3. Qiang Ji, Engle J., Craine E. Texture analysis for classification of cervix lesions // IEEE Trans. on medical imaging. 2000. Vol. MI-19, № 11. P. 1144-1149.

4. Segmentation and classification of cervix lesions by pattern and texture analysis / Bhaklti Tulpule, Shuyu Yang, Yeshwanth Srinivasan et al. // IEEE Int. conf. on fuzzy system, May, 22-25 2005, Reno, USA. P. 173-176.

5. Huan Liu, Lei You. Toward integrating feature selection algorithms for classification and clustering // IEEE Trans. knowledge and data engineering. 2005. Vol. KDE-17, № 4. P. 491-502.

6. Arauro-Arofa A., Benitez J. M., Castro J. L. Consistency measures for feature selection// J. intell. inf. syst. 2008. Vol. 30. P. 273-292.

7. Yager R., Filev D. Essentials of fuzzy modeling and control. New-York, USA: John Wiley & Sons. 1984. 387 p.

8. Rotshtein A. P. Modification of saaty method for the construction of fuzzy set membership functions // Proc. of the int. conf. "Fuzzy logic and its applications", May, 18-21 1997, Zuchron, Israel. P. 125-130.

9. Zimmermann H.-J. Fuzzy set theory and its applications. 3rd ed. Dordrecht: Kluwer academic publishers, 1996. 315 p.

Uk Kang, Soojin Bae

Korea electrotechnology research institute, Republic of Korea G. V. Papayan

Pavlov state medical university, Saint-Petersburg N. A. Obouckhova

Saint-Petersburg state university for aerospace instrumentation

Image analysis in the automated fluorescence system for cervical cancer diagnosis (preclinical stage)

The methods of image preliminary analysis and classification for early cervical cancer diagnostics are offered. The methods use several types of images: the image in white light, the image in polarized white light, fluorescent images obtained with the exciting wavelength of 360 nm, 390 nm with laser illumination at 625 nm and 430 nm. The image processing is based on mathematical apparatus offuzzy logic. At the preliminary analysis stage the areas differ from the most part of image are detected. At the classification stage pathology map is created according to data base information. The experimental research was performed on images of mice.

Early diagnosis, cervical cancer, fluorescent images, images segmentation and classification, fuzzy logic Статья поступила в редакцию 1 июля 2011 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.