Федотов Н.Г. , Кольчугин А.С., Романов С.В. ТРИПЛЕТНЫЕ ПРИЗНАКИ РАСПОЗНАВАНИЯ ГИСТОЛОГИЧЕСКИХ ИЗОБРАЖЕНИЙ
В диагностике онкологических заболеваний наиболее достоверным методом по-прежнему остается цитологический и гистологический анализ. Однако, цитологическое исследование достаточно дорого и болезненно для пациента, и поэтому его применение ограничено. Для ранней диагностики рака (так называемого скрининга) в настоящее время используется УЗИ, но оно с трудом позволяет выявить очаги поражения малых размеров, а также определить характер опухоли. Для повышения эффективности ультразвуковой диагностики рака щитовидной железы была поставлена цель - найти существенные связи между признаками, выделяемыми на гистологических и ультразвуковых изображениях. Поскольку эти виды изображений имеют различную природу и масштаб (микро- и макроуровень), их прямое сравнение невозможно. Для выявления связей необходимо использовать интеллектуальные методы, находящиеся на стыке математики, информатики и медицины. Дело в том, что профессиональные врачи-диагносты используют весьма ограниченное число признаков, имеющих четкую медицинскую интерпретацию и различимые зрением человека. Использование математических методов позволяет расширить «понимание» изображений путем формирования абстрактных числовых признаков. Такие признаки не имеют смысла с точки зрения медицины, но их информативность может быть доказана путем эксперимента.
Для автоматической генерации абстрактных признаков мы используем аппарат стохастической геометрии, эффективность которого была подтверждена в [1, 2]. Признаки распознавания в рассматриваемом подходе имеют структуру в виде композиции трех функционалов, в связи, с чем они были названы триплетными. Применение процедуры минимизации признакового пространства позволяет отобрать наиболее информативные признаки.
Методы стохастической геометрии также применимы и для экстракции признаков, имеющих медицинский смысл, если они основаны на геометрии рассматриваемых объектов. Зная геометрические характеристики, существенные для вычисления признака, мы можем подобрать чувствительные к ним функционалы.
Трейс-преобразование и триплетный признак
Ключевым моментом формирования триплетного признака является трейс-преобразование. Пусть имеется изображение, описанное функцией интенсивности F . Рассмотрим случайную прямую l , которая может пересекать изображение. Предположим, что пересечение прямой l и изображения F позволяет нам вычислить некоторое число g , характеризующее их взаимное расположение.
Прямая l , если введены полярные координаты на плоскости, однозначно определяется расстоянием p от начала координат до нее и углом 0 ее направляющего вектора. При пересечении изображения F с прямой l мы рассматриваем функцию f (0,p,t), где t - естественный параметр прямой l .
Действуя функционалом Т на функцию f (0,p,t) , получим функцию g(0, p) = Tf (0, p, t). Функция g является результатом трейс-преобразования. В качестве понятного практического примера трейс-преобразования можно рассмотреть сумму длин отрезков, высекаемых прямой l (0, p) на изображении F при каждом возможном значении p и 0 .
При дискретной реализации вычислений результат трейс-преобразования представляет собой матрицу, каждым элементом которой является результат действия функционала Т на пересечение изображения F со сканирующей прямой l(0, p). Параметры сканирующей линии l (0, p) определяют позицию этого элемента в матрице. Последующее вычисление признака заключается в последовательном свертывании столбцов матрицы с помощью диаметрального функционала Р . Результатом применения функционала Р к трейс-трансформанте является 2 К -периодическая кривая, а в дискретном варианте - вектор. Дальнейшее сжатие информации осуществляется с помощью циркового функционала 0 , в результате чего для изображения получается некоторое число-признак.
Таким образом, мы вычисляем новый триплетный признак как последовательную композицию трех функционалов: П(.Р) = ©оРoT(FГ\1(0^р^У) , где каждый функционал (0 , Р и Т ) действует на функции
одной переменной ( о, p и t ) соответственно. В работе [1] можно найти более подробное рассмотрение теории триплетных признаков, и примеры их реализации применительно к бинарным изображениям. Функционалы, используемые при построении признака, не обязательно должны иметь аналитическое представление - это может быть также некоторый алгоритм, эмпирически выведенный способ вычисления преобразования.
Формирование признаков гистологических изображений
Классификатор гистологических изображений ткани щитовидной железы должен обеспечивать их разделение на следующие классы: нормальная щитовидная железа, неопухолевые поражения (зоб), доброкачественная опухоль (аденома) и злокачественная опухоль (рак).
Попытка применения рассмотренных выше преобразований непосредственно к исходным изображениям не позволяет получить информативные признаки. Это обусловлено тем, что изображения гистологических препаратов тканей щитовидной железы представляют собой цветные, многокомпонентные, семантически насыщенные изображения. На них изображены ядра, фолликулы, соединительная ткань и другие виды объектов, каждый из которых имеет свои значимые характеристики. Триплетные признаки хорошо «схватывают» геометрические особенности изображенных объектов, но для этого сначала необходимо выполнить предварительную обработку изображений с целью выделения на них объектов определенного вида.
В качестве основных объектов на изображениях 4 00-кратного увеличения, рассматриваемых в данной статье, выделяют ядра и фолликулы. Для построения классификатора представляют интерес форма и размеры ядер, и фолликул, взаимное расположение и ориентация ядер, плотность расположения объектов в препарате и т.п. Исходя из этого, в качестве цели предварительной обработки было поставлено выделение отдельных изображений фолликул и ядер препарата. Данная задача была успешно решена путем применения пороговой фильтрации и морфологических операций [2]. На рис. 1 показаны пример исходного изображения и полученных в результате предобработки изображений ядер и фолликул.
Рис.1. Гистологическое изображение
Поскольку нам известен ряд геометрических свойств, используемых для постановки диагноза врачами- гистологами, мы можем построить ряд признаков путем экстракции. Для этого мы выберем функционалы, чувствительные к этим геометрическим свойствам.
Одной из таких важных характеристик является размер фолликул, который можно оценить, используя для построения признака следующие функционалы:
1 Л
Т(Р п I) = —— | / (в, Р, Г
п(в, р у р П=0
К
Р(Т(Р п I)) =| Т(р п 1)Лр
-К
п
П(р) = 0(Р(Т(Р п I))) = | Р(Т(Р п 1))Лв ,
-п
где п( р,в) - функция числа пересечений изображения Р лученный признак позволяет различать опухолевые и неопухолевые поражения, но не пригоден для определения типа опухоли. Проанализировав множество признаков, отражающих только характеристики фолликул, мы пришли к выводу, что это является их общим свойством.
Для различения типа опухоли необходимо задать признаки, отражающие свойства ядер.
Используя бинарные изображения ядер, мы определяем признаки, характеризующие правильность формы ядер. Ядра нормальных клеток имеют форму, близкую к эллипсу. Ядра раковых клеток, как правило, отличаются неправильной, угловатой формой. Определим функционал Т как число пересечений изображения со сканирующей прямой:
Т(Р п I) = п( р,в)
Функционал Р определим как среднее значение функции на интервалах, в которых ее значение отлично от нуля. Функционал 0 определим как среднее значение. Полученный признак будет являться числовой характеристикой правильности формы объекта. Если значения признака близко к двум - объект имеет правильную форму, если значительно больше двух - неправильную.
1(в,р) 1
1(в,р)
ф
t
Рис.2. Вычисление признака, характеризующего однородность ядра
Используя полутоновые изображения ядер, мы можем определить более сложные признаки, основанные на трейс-функционалах, чувствительных к перепадам интенсивности, распределению интенсивности и т.п. Ядра доброкачественных опухолей, как правило, имеют более равномерную интенсивность, в то время как для ядер злокачественных опухолей характерно наличие темного контура и светлых, «прозрачных» областей в центре. Для формирования признаков, чувствительных к этому свойству ядер,
предлагается в качестве функционала T взять площадь области S между сечением изображения F
прямой l и выпуклой оболочкой этого сечения. На рис. 2 область S выделена штриховкой.
Работа выполнена при поддержке гранта РФФИ №09-07-00089
Литература
1. Fedotov N.G. The Theory of Image Recognition Features Based on Stochastic Geometry // Pattern Recognition and Image Analysis. - 1998. - Vol. 8. - No. 2. - pp. 264-267.
2. Fedotov N.G., Shulga L.A., Kolchugin A.S., Romanov S.V. Histological image analysis in diagnostic system based on stochastic geometry methods // Proc. of the 9th Int. Conf. «Pattern
Recognition and Information Processing» (PRIP 2007), Minsk, May 2007. - Vol. 1, p. 113-117.
прямой l(в, p) , R - радиус сетчатки. По-