Научная статья на тему 'Методы поиска биомедицинских изображений в базе данных по их содержанию'

Методы поиска биомедицинских изображений в базе данных по их содержанию Текст научной статьи по специальности «Медицинские технологии»

CC BY
58
14
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по медицинским технологиям, автор научной работы — Ковалев В.А.

Рассматривается проблема поиска биомедицинских изображений в больших базах данных по их содержанию. Характеризуется современное состояние проблемы и возможные пути ее решения на основе использования обобщенных матриц совместной встречаемости различных типов. Приводится общая схема организации систем поиска. Изложение иллюстрируется на широком спектре примеров с использованием баз данных реальных биомедицинских изображений.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по медицинским технологиям , автор научной работы — Ковалев В.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

This paper is dedicated to the problem of image retrieval from large databases of biomedical images using the query by example paradigm. The specific characteristics of biomedical images are briefly discussed in the context of similarity retrieval and possible ways of image searching are outlined. A versatile method is suggested which is based on extended multi-sort and multi-dimensional co-occurrence matrices. The use of the method is illustrated on a variety of image retrieval tasks using real databases of biomedical images of different types.

Текст научной работы на тему «Методы поиска биомедицинских изображений в базе данных по их содержанию»

УДК 004.9

МЕТОДЫ ПОИСКА БИОМЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ В БАЗАХ ДАННЫХ ПО ИХ СОДЕРЖАНИЮ

© Ковалев В.А.

Объединенный институт проблем информатики HAH Беларуси ул. Кирова, 32-А, 246050 Гомель, Беларусь, лаб. Анализа биомедицинских изображений

e-mail: vassili.kovalev@gmail.com

Abstract. This paper is dedicated to the problem of image retrieval from large databases of biomedical images using the query by example paradigm. The specific characteristics of biomedical images are briefly discussed in the context of similarity retrieval and possible ways of image searching are outlined. A versatile method is suggested which is based on extended multi-sort and multi-dimensional co-occurrence matrices. The use of the method is illustrated on a variety of image retrieval tasks using real databases of biomedical images of different types.

Введение

Несмотря на появление h развитие разнообразных методов количественного анализа изображений для медицинской диагностики, одним из популярных диагностических приемов по-прежнему остается сравнение полученного изображения с предыдущими и/или с похожими снимками и случаями из клинической практики [1]. Технической основой для повышения эффективности диагностических процедур, основанных на оперативном привлечении информации о похожих случаях, является развитие так называемых систем архивирования и передачи медицинских изображений [2], которые известны по их англоязычной аббревиатуре PACS (Picture Archiving and Communication Systems), а так же современных технологий баз данных (БД). Однако в подавляющем большинстве случаев, существующие методы и программные средства БД обеспечивают поиск не по содержанию самих изображений, а по ассоциированным с ними метаданным. Указанные метаданные представляют собой информацию о содержании изображений БД, подготовленную вручную, а так же клиническую и другую информацию о самих пациентах. В обоих случаях такие индексирующие данные представлены в обычной фактографической, но не в визуальной (зрительной) форме.

По мере развития технических средств регистрации медицинских изображений, объем хранимых видеоданных растет экспоненциально. По данным организации «Грид Компьютинг Нау» при Министерстве торговли и промышленности Великобритании [3], полный переход на цифровые диагностические изображения приведет к тому, что суммарный объем изображений, производимых госпиталями, может достигнуть петабайт, т.е. величины 1015, Естественно, что при подобных сверх-болыпих объемах хранимых изображений никакой речи о «ручном», т.е. визуальном поиске в БД «похожих» снимков и подборе аналогичных диагностических ситуаций речь идти не может.

Таким образом, разработка средств автоматического индексирования содержания и поиска изображений БД по заданному образцу является одной из актуальных проблем в области обработки, анализа и распознавания медицинских изображений.

1, Особенности поиска медицинских изображений

Проблема поиска изображений по образцу активно разрабатывается в области машинного зрения и распознавания образов на протяжении последнего десятка лет. За это время достигнуты определенные успехи использования данной технологии для изображений общего характера типа цветных цифровых фотографий. Одним из основных итогов исследований данного направления является выделение трех групп признаков изображений, используемых для организации поиска, которые условно определяются как текстура, цвет и форма. Медицинские же изображения значительно отличаются от изображений общего характера как минимум по следующим трем основным признакам,

1, Несопоставимость различных классов. Семантические и форматные различия меду классами медицинских изображений обычно столь велики, что их прямое сопоставление на растровом уровне не представляется возможным. При этом под «классами» здесь понимаются разнородные группы, отличающиеся друг от друга как диагностируемыми органами (например, снимки печени и снимки мозга), так и типом используемой модальности (например, ультразвуковые и компьютерно-томографические изображения),

2, Небольшие внутриклассовые различия. По сравнению со снимками общего характера, медицинские изображения, как правило, имеют гораздо более ограниченный контекст, меньшую вариабельность в композиции отображаемой сцены и, с точки зрения непрофессионала, могут выглядеть почти недифференци-руемыми. Поэтому любые признаки с невысокой чувствительностью, предложенные для описания обычных изображений со значительными визуальными различиями, оказываются здесь неэффективными,

3, Специфичность классообразующих признаков. В отличие от обычных изображений, при поиске и распознавании которых важную роль играет их общий вид и явные визуальные отличия, ключевые признаки медицинских изображений могут носить неявный и даже скрытый характер. Например, различия между МРТ изображениями головного мозга в норме, при шизофрении и при болезни Альцгеймера определяются очень тонкими и специфическими признаками, характерными для данных видов патологии. Указанные различия никак не связаны с различиями в размерах, форме или особенностями строения извилин мозга пациентов, которые в первую очередь бросаются в глаза при визуальном анализе.

2, Многосортные матрицы совместной встречаемости как

универсальная основа систем поиска изображений

Поскольку «понимание» изображений, как основная проблема машинного зрения все еще весьма далека от своего решения, наиболее реалистичной стратегией решения практических задач поиска изображений остается стратегия прямого поиска изображений по их содержанию, рассматриваемому на уровне растровых, а не семантических представлений. При этом отправной точкой является выбор подходящих дескрипторов, обеспечивающих компактное представление характерных признаков изображений и уникально характеризующих каждое изображение среди всех остальных,

В данной работе рассматривается универсальный подход к организации систем поиска медицинских изображений по образцу, основанный на расширенных матрицах совместной встречаемости различных видов. Данный тип дескрипторов является достаточно гибким и аккумулирует все основные признаки изображений - текстуру, цвет и форму. Поэтому он одинаково хорошо подходит для описания изображений самых различных типов, начиная от плоских силуэтов объектов (двумерная форма), представленных в растровом виде замкнутыми контурами пикселов, до трехмерных томографических изображений головного мозга, хранящихся в базах данных современных неврологических клиник и исследовательских центров. Поиск изображений по образцу включает в себя две следующие основные стадии,

1, Включение изображений в базу данных и генерация их дескрипторов, представляющих собой список ненулевых элементов матриц совместной встречаемости подходящего типа,

2, Собственно поиск, включающий задание изображения-образца, генерацию его дескриптора либо загрузку готового дескриптора из базы данных, сравнение дескриптора образца с дескрипторами, хранящимися в БД, выбор первых N (обычно 10-20) изображений, наиболее близких к образцу и выдача их пользователю, На первой стадии предварительно накопленные изображения обрабатываются и для каждого из них генерируется дескриптор, представляющий в сжатой форме его содержание. После этого он запоминается в базе данных и устанавливается перекрестная ссылка на исходное изображение, используемая в дальнейшем в целях визуализации изображений, найденных по их дескрипторам.

На стадии поиска, дескриптор заданного изображения-образца сравнивается с дескриптором каждого изображения БД, вычисляется соответствующая мера близости (как правило, это Ы расстояние или Евклидова метрика) и пользователю предъявляются изображения, наиболее похожие на заданный образец. При этом дескриптор изображения-образца либо генерируется для каждого нового изображения, либо просто извлекается из БД в случае, когда образцом является одно из существующих изображений БД, Легко представить, как данная последовательность действий может быть использована циклически для обеспечения итеративных схем поиска, когда одно из найденных изображений

вновь подается пользователем на вход системы в виде образца и так далее. Во всех случаях необходимо помнить, что основной задачей систем поиска медицинских изображений как правило является лишь предварительный отбор изображений, близких к заданному пользователем образцу. Окончательное же решение о их релевантности решаемой задаче принимается самим пользователем на основе глубоких профессиональных знаний, личного опыта и зачастую с использованием неких неформализуемых критериев.

3, Поиск изображений объектов по 2Б форме

Предметом данного параграфа является рассмотрение задачи поиска изображений объектов по их двумерной (планарной) форме, т.е. по изображениям их силуэтов, Среди наиболее известных методов, используемых для анализа и распознавания формы, следует отметить метод частотного анализа, базирующийся на сферических гармониках, метод моментов, метод прокрустова анализа, морфологические методы, а так же методы, основанные гистограммных признаках формы, К последней группе методов в частности относится рассматриваемый ниже подход к поиску объектов по их форме, основанный на матрицах совместной встречаемости [1]. Целью данного параграфа является адаптация общего подхода к описанию структуры изображений на основе расширенных матриц совместной встречаемости и его применение к задаче поиска изображений биологических объектов в базах данных по их форме.

Предполагается, что форма рассматриваемого объекта изображения представлена простым контуром, т.е. упорядоченной цепочкой пикселов на плоскости, которая не касается и не пересекает саму себя. Следует подчеркнуть, что цепочка пикселов является направленной. Данный факт имеет значение, поскольку при определении углов (см, ниже), учет свойства направленности приводит к появлению положительных и отрицательных величин. Для описания формы замкнутого контура будем использовать элементарные структуры, образуемые всевозможными парами его пикселов. Очевидно, что любая точка контура однозначно определяется ее индексом, т.е. порядковым номером в цепочке, имеющей начальную и конечную точки, В соответствии с общей методикой, введем следующие параметры, описывающие произвольную пару пикселов контура (г, А;).

/г(г, к) - кратчайшее расстояние между точками контура, т.е. расстояние по хорде, с( /. к) - кратчайшее расстояние между точками вдоль контура. Очевидно, что с(г, к) > /г(г, к) и равенство достигается только для отрезка контура, являющегося прямой линией, В случае, когда при решении задачи необходимо обеспечить независимость от абсолютных размеров сравниваемых объектов, расстояние с(/. к) нормируется на его максимальное значение. Максимальным расстоянием в контуре является половина его длины, поскольку всегда рассматривается кратчайший путь между любой парой точек,

о(г), а(к) - углы наклона касательных к контуру в точках { ъ. к соответственно. Для некоторой точки ] дискретного контура п с координатами х(п[]\) и у{п[]\) на плоскости угол касательной определяется как угол прямой, проходящей через две

точки контура, находящихся на расстоянии Д до и после текущей, т.е. как:

\y(n[j + R}) - y(n[j - R]Y ~ arCtan [x(n[j + R]) - x(n[j - R})_

где R является управляющим параметром, который называется радиусом касательной и фактически задает отступ от рассматриваемой точки вдоль контура в обе стороны. Радиус касательной выбирается в соответствии с характерной величиной локальной кривизны, т.е. сообразно со степенью извилистости анализируемых контуров и обычно изменяется в пределах от 2 до 5 пикселов контура,

A(i, к) - угол между касательными в точках i и к. опирающийся на хорду и изменяющийся в пределах от 0 (пара точек на отрезке прямой) до 180 градусов (пара диаметрально противоположных точек контура),

t(i,k) = c(i, k)/h(i, к) - отношение расстояния по контуру к расстоянию по хорде для рассматриваемой пары пикселов (/'. к). Данный параметр измеряет величину отклонения участка контура от прямой и в случае, когда абсолютные размеры сравниваемых контуров не важны, может использоваться в матрицах совместной встречаемости вместо параметра c(i,k), либо вместо обоих параметров, через которые он определен.

Компактной формой частотного представления введенных выше параметров контура является трехмерная матрица совместной встречаемости вида:

Ws = \\ws(c(i,k),h(i,k), A(i,k))\\,

где ws(c, h, А) есть количество пар точек контура, относительное расстояние между которыми по контуру равно с, по хорде - h, а угол между касательными в этих точках равен А. На практике, для сокращения размерности матриц и уменьшения количества пустых (нулевых) элементов, наличие которых обусловлено дискретностью контура, все перечисленные выше параметры пар пикселов квантуются. Общие рекомендации по выбору размеров интервалов квантования даны в [1], Конкретные значения обычно выбираются экспериментально в соответствии с целями решаемой задачи и особенностям формы анализируемых объектов (степень гладкости или извилистости, различия контуров в максимальных размерах и их важность для решаемой задачи, пространственное разрешение при оцифровке исходного физического объекта и т.п.).

Для формального определения описанных выше матриц совместной встречаемости, обозначим номера интервалов расстояния между точками по контуру через be = 1,.... /¿( •. интервалы расстояния по хорде - через Ьц = 1..... Нц. интервалы углов между касательными - через Ъа = 1.....И а интервалы величины отношения

/(/'. к) - через 6/ = 1.....И/. Тогда элементы содержательно описанной выше трехмерной матрицы совместной встречаемости U s. обозначаемой в тексте по первым буквам ее параметров через СНА, могут быть формально определены как:

СНА : ws(bc, Ьн, Ъа) = card{i, к Е R2 \ i ф к, c(i, к) Е bc, h(i, к) Е Ьн, А{%, к) Е Ъа },

где card, как обычно означает количество, а выражения типа c(i, к) Е be означают, что величина соответствующего параметра находится в пределах интервала с

указанным номером, В ситуациях, когда при анализе формы объектов необходимо обеспечить как можно большую независимость от линейных размеров, более предпочтительным оказывается использование матриц типа СТА с элементами следующего вида:

СТА : ъиз(Ьс, ЬТ, Ъа) = сагй{г, к Е В2 \ %фк, с(г, к) Е Ьс, ¿(г, к) Е Ът, к) Е Ъа }.

Наконец, при проведении анализа может оказаться, что помимо глобальной формы, важную роль играют также особенности локального строения сравниваемых объектов, т.е. форма сравнительно небольших «извилин», петель и углов, В данной ситуации более эффективным может оказаться использование двумерных матриц совместной встречаемости типа СА, являющихся редуцированной версией матриц СНА с элементами вида:

СА : гизфс, Ъа) = сагё,{г, к Е Е2 | г ф к, с(г, к) Е Ьс, А(г, к) Е Ъа }■

Предложенный подход исследовался экспериментально на примере БД морских животных [4], включающей 958 изображений. Длина контуров объектов варьировала от 256 до 1653 пикселов. Размеры охватывающего прямоугольника при этом изменялись от 16 до 380 пикселов по оси X и от 23 до 526 пикселов по оси У, Основными причинами выбора для тестирования именно этой БД являлось разнообразие, а порой и чрезвычайная замысловатость формы представленных в ней природных объектов, а так же наличие достаточно большого количества интуитивно понятных и визуально дифференцируемых классов. Предварительные эксперименты, проведенные на ограниченной подвыборке из 116 контуров, показали, что качество поиска изображений при использовании каждого из трех типов матриц, описанных выше, достаточно близко. Поскольку вычислительные затраты и размер получаемых дескрипторов были существенно ниже в случае использования матриц типа С А, то основная часть экспериментов на полной БД проводилась с использованием матриц данного типа.

Размеры матриц С А принимались равными 15 интервалам по 1/15 половины длины контура каждый для расстояния с( /. к) и 10 интервалам по 18 градусов каждый для угла . 1(7. к). Таким образом, полный размер дескрипторов составлял 15 х 10 х 4 = 600 байт. Матрицы нормировались построчно, т.е. по каждому расстоянию отдельно. При осуществлении поиска матрица образца и матрицы (дескрипторы) изображений БД сравнивались поэлементно, В качестве расстояния в пространстве признаков использовалась Ы норма. Детальное тестирование данного способа показало, что результаты поиска хорошо согласуются с экспертной оценкой близости найденных изображений к заданному образцу в подавляющем большинстве случаев. Примеры запросов-образцов и соответствующих результатов поиска в БД морских животных приведены на рис, 1,

образец-1

образец-2

образец-3 образец-4

Рис. 1, Изображения-образцы (верхний ряд) и результаты поиска в базе данных морских животных, ранжированные по степени близости к образцу (под ними).

Проведенные экспериментальные исследования предложенного метода поиска изображений объектов по их 2Б форме на основе специализированных матриц совместной встречаемости позволяют сделать вывод, что предлагаемый подход обеспечивает высокое качество поиска биологических объектов, имеющих нетривиальную форму. Вопреки достаточно распространенному мнению о необходимости вычисления признаков матриц совместной встречаемости как способа избавиться от их «громоздкости» и сокращения размеров памяти, требуемой для их хранения, проведенные экспериментальные оценки показали высокую компактность используемых дескрипторов. Так, например, при размере БД в 10 тысяч изображений, потребуется всего лишь около 6 мегабайт памяти для хранения дескрипторов. Что касается времени поиска, то проведенные вычислительные эксперименты показали, что для

указанного размера БД в 10 тысяч изображений, общее время поиска по образцу составляет и не более 1-3 секунд на рядовом настольном компьютере,

4, Поиск цветных двумерных изображений

Следуя общей методике конструирования матриц совместной встречаемости [5, 6], а также учитывая необходимость квантизации большого количества цветов, трехмерные матрицы совместной встречаемости цветов типа цвет-цвет-расстояние CCD могут быть определены как:

CCD: Wc = \\wc(V(i),V(k),d(i,k))\\,

u>c(bvi, bvk, bd) = card{i, k £ R2\ i Ф k, V(i) e V(k) e byk, = round(d(i, k)),

Xk = (xi+Ax),yk = (yt+Ay), ^D < Ax < D, ^D < Ay < I). AyS+Ax > 0, S = 2D+1}.

В приведенном определении через (г, к) обозначена произвольная пара пикселов, расположенная на расстоянии d(i, к) в плоскости изображения, a V(i) и V(k) соответствуют цветам этих пикселов. Весь диапазон RGB цветов квантуется путем

равномерного разбиения на by = 1.....Н( • интервалов, а межпиксельное расстояние

изменяется в пределах от 1 до D пикселов. Следует отметить, что в отличии от большинства других типов матриц, представленных в данной работе, матрицы совместной встречаемости цветов типа CCD имеют несколько другую историю. Они были предложены независимо в 1997 году группой американских исследователей под руководством профессора Хуанга [7] и автором данной работы во время его работы с доктором Волмером в Фраугоферовском институте компьютерной графики в Дармштадте [8]. Однако, поскольку публикация Хуанга и коллег вышла в том же 1997 году, а работа [8] - только в следующем, то приоритет принадлежит американским коллегам и именно их работа цитируется в большом количестве последующих публикаций в области поиска цветных изображений общего характера, В качестве некоторой «компенсации» авторам может рассматриваться лишь то, что работа [8] вошла в число трех лучших работ первой Международной конференции по системам мультимедиа в Лозанне,

Целью экспериментов, описанных ниже являлась оценка качества поиска 2D слоев цветокодированных SPECT изображений головного мозга, а так же оценка принципиальной возможности использования технологии поиска изображений в качестве одного из инструментов диагностики заболеваний на примере болезни Алзгеймера, В качестве исходных данных использовались 79 функциональных SPECT изображений головного мозга, включающих 45 изображений пациентов с диагнозом болезни Алзгеймера на различных стадиях развития заболевания и 34 контрольных изображения здоровых добровольцев. Значительная часть указанных исходных материалов представляла собой те же самые SPECT изображения, которые использовались для оценки методов детектирования нейро-дегенеративных изменений головного мозга, описанных в [9], Соответственно, за более детальной информацией касающейся пациентов, используемого томографического оборудования, а так же содержания процедур подготовки SPECT изображений к анализу следует обратиться к работе [9],

Для создания БД трехмерные изображения были вначале сконвертированы в цвето-кодированное представление с использованием одной из стандартных нейрологиче-ских цветовых палитр, а затем экспортированы в виде набора цветных двумерных изображений, каждое из которых представляло отдельный аксиальный слой с помощью известного пакета программ МШсго, В результате данного преобразования была получена БД, состоящая из 1580 изображений, включая 900 изображений мозга пациентов, страдающих болезнью Алзгеймера и 680 контрольных изображений.

Тестирование проводилось путем последовательной автоматической выборки из БД и использования каждого из 1580 изображений в качестве изображения-образца, подаваемого на вход системы. Как и в предыдущих примерах, качество поиска формально оценивалось путем подсчета количества изображений, принадлежащих тому же классу, что и изображение-образец. Типичные примеры результатов поиска по изображениям-образцам, представляющим норму и болезнь Алзгеймера показаны на рис, 2, В приведенных примерах среди двадцати трех изображений, наиболее близких к образцу нормы, два принадлежат к противоположному классу, т.е. болезни Алзгеймера (предпоследнее изображение во втором ряду и третье изображение в последнем ряду на верхней панели рис, 2), При поиске по образцу нормы (нижняя панель) ошибочное отнесение к противоположному классу отсутствует,

В целом, анализ результатов поиска по всем 1580 запросам показал, что среди найденных изображений 91,3% принадлежат к правильному классу, т.е. тому же, что и изображение-образец. Не вызывает сомнения, что указанный процент корректного отнесения представляет определенную информацию о качестве процедуры поиска. Однако при интерпретации результатов не следует также забывать, что основным функциональным назначением средств поиска в данном случае является поиск изображений, имеющих похожий ЭРЕСТ паттерн (близкую пропорцию активных и пассивных участков мозга), а не задача классификации и распознавания как таковая. Действительно, наличие, например, в изображениях болезни Алзгеймера участков (здесь - слоев), похожих на некоторые участки изображений нормы и обратная ситуация совсем не обязательно является чем-то недопустимым или ошибочным.

5, Поиск полутоновых 2D изображений (на примере шизофрении)

В качестве основы для проведения исследования использовалось 40 трехмерных изображений головного мозга испытуемых, включающих группу из 19 пациентов, больных шизофренией и группу из 21 контрольных изображений мозга здоровых добровольцев. Все исходные изображения были получены на томографе GE Signa (General Electric Medical Systems, Milwaukee) с напряженностью магнитного поля 1,5 Тесла в одной из психиатрических клиник Великобритании, При проведении магнитно-резонансного сканирования в качестве управляющих параметров последовательности использовались следующие значения: ТН 1000 мс, ТК 20.85 мс. Исходные изображения имели пространственное разрешение внутри слоев 0,856 х 0,856 мм при толщине слоя 3 мм. Аксиальные слои были ориентированы параллельно плоскости передней и задней комиссур.

INSPECT image retrieval (Vassili Kovalev)

File Retrieval Options About

^SEARCHING RESULTS (sorted by similarity, query image

ц ц Ц Ц

сН 46 N0934 d=15.1 N0935 d=15.7 N1343 d=l 5.9 N1' шш d=15.9 А2541 d=15.9 N0741 ШШ

щ 1*1 Ш lgl

d=16.7 N1638 ц d=16.8 N0444 d=168 N0228 ц S

d=17.0 N0442 ШГШ d=17.0 N1746 d=171 А2646 щж d=17.2 N0229 щщ а=1/.и IN 1J4U ШШ л

1Щ w W

INSPECT image retrieval (Vassili Kovalev)

File Retrieval Options About

lii SEARCHING RESULTS (sorted by similarity, query image

d=G.O А2435 □ rl,-1 Ъ С А9ЙАО .:Ы0 1 --IK'j шш ш rJ-1 Т С АПС37 а-12.7 А1039 Ц rJ-1 'î С AORAA d=13.1 А4141 m rj_1 Л 1 АЛЛ АП d-13.2 A1038 □ rJ-1 А А ПИП d=13 5 A0538 □ А С AOQOO

а- I J.D Р^со^с rJ-1 А С А1 TQC Q-IJ.D AUDJ/ щ а-1 j.b ALU44 rJ-1 A Я ЛЛ1 ТП u= I *H. I Ач I HU Щ 0- I ч.ч Al UTU Ш u- 1 4.0 AJJJC Ц

а-н.ь AIJJO □ d=14.6 А4138 ц а- I Ч.о А Я 1 jU Q d=14.8 A1041 □ d=14.8 A1937 а d=14.9 A0542 □

d=15.0 А0941 ш d=15.1 А3035 i d=15.1 А1936 Q d=15.1 A1336 i d=15.1 A07jj □ d=15.2 A2841

Рис. 2, Примеры результатов поиска цветокодировашшх ЭРЕСТ изображений головного мозга по заданному изображению-образцу здорового добровольца (верхняя панель) и пациента, страдающего болезнью Алзгеймера (нижняя панель),

Для подготовки тестовой БД, описанные выше трехмерные изображения мозга сорока испытуемых были экспортированы в качестве отдельных файлов, каждый из которых представлял собой один аксиальный слой. Учитывая, что каждое исходное

изображение состояло из 32 слоев, общее число изображений тестовой БД насчитывало 32 х 40 = 1280, в том числе 608 изображений больных шизофренией и 672 контрольных изображения. Следует подчеркнуть, что исследуемые группы изображений имеют очень незначительные визуальные отличия (рис, 3), Поэтому задача поиска похожих изображений в случае трактовки понятия «похожести» как принадлежности к одному и тому же классу, является чрезвычайно сложной.

норма 1

рЛту г- ~ 1 J \ ' к < ? f X N - A >v ' ®

норма 2 > "V. ; », О ' * да? fk - III

шизофрения 1 iJU - - ■Г j * • vi/: V Cv.', > t A ^ '^jr r HiKify» ©

шизофрения 2 - w V* щ ш /fTTv^ $ ! % < 7 К г Л [>Ц W

Рис. 3, Примеры аксиальных слоев МРТ изображений мозга здоровых добровольцев (два верхних ряда) и больных шизофренией (два нижних ряда),

В соответствии с результатами сравнительного исследования текстурных свойств мозга в норме и при шизофрении, описанными в [10|, наибольшая степень дифференциации классов достигается не в случае описания изображений с помощью матриц общего вида типа IIGGAD (интенсивность, градиент, угол, расстояние, см, |1|), а при использовании их редуцированных версий, В частности, хорошо проявили себя дескрипторы GGAD, являющиеся матрицами совместной встречаемости градиентов, которые отличаются от матриц общего вида тем, что измерения, соответствующие интенсивностям вокселов, исключены. Это объясняется тем, что при распознавании

данного типа изображений более важной оказалась не непосредственно яркость вок-селов как таковая, а скорость ее пространственного изменения, т.о. градиент. При выполнении тестирования оценивалось качество поиска для каждого из изображений БД, подаваемого на вход системы в качество образца. Как и ранее, качество оценивалось путем подсчета процента найденных изображений, принадлежащих «правильному» классу. На рисунке 4 приведен пример изображения-образца, представляющего один из аксиальных слоев изображения мозга пациента, больного шизофренией, а так же 15 ближайших к нему изображения, найденных в БД общим объемом 1280 изображений. В условиях данного примера оказалось, что все 15 изображений-результатов также принадлежат различным больным, страдающим шизофренией.

C084t209

C078t211

Cl49t210

C084t210

C080t209

C070t209

Cl99t209

C078t210

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

« V ly ^

-tW^y образец

n208t215

cl99t211

C027t209

C095t210

C095t209

Рис. 4. Пример поиска изооражепий в оазо данных двумерных МРТ изображений мозга в норме и при шизофрении.

Статистический анализ результатов 1280 запросов показал, что среди 15 ближайших результатов поиска, процент изображений, принадлежащих к ожидаемому классу, составляет 82.6%. Надо отметить, что такая точность является достаточно высоким показателем для столь трудно различимых МРТ изображений как норма и шизофрения. Данный результат согласуется с точностью классификации для различных частей мозга, приведенной в [ 10|Г

6, поиск полутоновых 3d изображений мозга по возрасту и по

полу

Ранее нами было показано [1], что возрастные изменения мозга проявляются анатомически весьма незначительно для широкого диапазона возрастов, вплоть до вступления в период преклонного возраста порядка 80 лет и более. Поэтому проверка средств поиска медицинских изображений на базе данных МРТ изображений головного мозга здоровых людей молодого и раннего пожилого возраста могла бы служить очень хорошим тестом чувствительности разработанного метода.

Для проведения подобного тестирования было отобрано 55 трехмерных анатомических Ti-взвешенных МРТ изображений мозга высокого разрешения, полученных путем сканирования здоровых добровольцев в возрастном диапазоне от 16 до 70 лет. Тестовая выборка была разбита на две группы, В первую группу, условно называемую молодыми людьми, входили изображения 33 испытуемых в возрасте от 16 до 25 лет, 17 из которых были мужчины, а остальные 16 - женщины. Во вторую группу, условно называемую людьми зрелого возраста, входило 22 изображения мозга испытуемых в возрасте от 50 до 70 лет, в том числе 11 мужчин и 11 женщин, В качестве дескрипторов изображений использовались обобщенные шестимерные матрицы типа IIGGAD со стандартными значениями управляющих параметров квантизации всех входящих в них величин [1], Поиск изображений осуществлялся по обычной схеме с последовательной подачей на вход системы в виде изображения-образца каждого из 55 изображений БД, После выполнения автоматического поиска проводился анализ N наиболее близких к образцу изображений. Анализ проводился раздельно для N = 20 (двадцать ближайших изображений), N = 15, N = 10, N = 5 и N = 1 (изображение БД, самое близкое к заданному образцу). При этом подсчитывалось количество правильно найденных изображений, т.е. изображений, принадлежащих той же самой возрастной группе, что и заданный образец.

На рис, 5 показаны слои трехмерных МРТ изображений, иллюстрирующие достаточно типичные образцы поиска и N = 4 наиболее близких к ним изображений, найденных в БД, В данном примере все изображения, полученные в результате поиска, принадлежат к тем же возрастным группам, что и образцы, т.е. в условиях данного теста являются корректными. Статистические данные по результатам выполнения всех 55 запросов для каждого из рассмотренных выше значений N наиболее близких изображений представлены в первой строке таблицы 1,

Таблица 1, Точность поиска изображений мозга по возрасту и по полу

% корректных среди N ближайших N = 1 N = 5 N = 10 N = 15 N = 20

молодой/зрелый возраст 96.4 93.8 90.6 86.3 82.2

мужчины/женщины 67.6 65.1 61.9 61.1 60.5

Рис. 5, Примеры изображений-образцов мозга здоровых добровольцев, входящих в группу молодых людей (слева) и людей зрелого возраста (справа) и четыре наиболее близких изображения-результата поиска, принадлежащие испытуемым из тех же возрастных групп (под ними).

Кроме поиска по возрасту, были проведены аналогичные эксперименты по по-искау изображений мозга мужчин и женщин с использованием 210 молодых добровольцев (103 мужчины и 107 женщин), количественные результаты которых обобщены во второй строке таблицы. Как видно из таблицы, общее качество поиска по возрасту является достаточно высоким и достигает 96,4% корректных случаев при рассмотрении N = 20 ближайших к образцу изображений. Учитывая незначительность различий классов изображений (ср. левую и правую половины рис, 5) и довольно высокую точность поиска (первая строка таблицы), можно сделать вывод о высокой чувствительности и надежности рассматриваемого метода. Следует так же подчеркнуть, что задача поиска изображений по полу является экстремально сложной, поскольку изображения мозга мужчин и женщин визуально практически неразличимы, Как следует из данных, приведенных в таблице, количество изображений корректного класса заметно превышает вероятность случайного угадывания и изменяется в пределах от 60,5% для единственного изображения до 67,6%) для двадцати наиболее похожих изображений. Следует заметить, что приведенные статистические

данные являются достаточно надежным основанием для оценки качества поиска, поскольку они базируются на результатах обработки 210 запросов к базе данных. Соответственно, для N = 1 среднее значение было подсчитано по 210 изображениям, в то время как для N = 20 общее количество оцененных изображений в 210 сериях результатов поиска составляло 210 х 20 = 4200,

Выводы

В данной работе был рассмотрен новый подход к организации систем поиска биомедицинских изображений по образцу, основанный на расширенных матрицах совместной встречаемости различных видов. По результатам проведенных исследований и экспериментов можно сделать вывод, что предложенный метод описания содержания биомедицинских изображений является универсальным и высоко эффективным. Он одинаково хорошо подходит для описания изображений самых различных типов, начиная от плоских силуэтов объектов (двумерная форма) до трехмерных МРТ изображений головного мозга высокого разрешения,

список литературы

1. Ковалев В.А. Анализ текстуры трехмерных медицинских изображений. Минск: Белорусская наука, 2008, ISBN 978-985-08-0905-6. - 264 с.

2. Huang Н.К. PACS and imaging Informatics: Basic principles and applications. Wiley, Hoboken, New Jersey, USA, ISBN 0-471-25123-2, 2004. - 704 p.

3. Osborne I. The next information infrastructure: towards 2012. Roadmap version 1.0. - Grid Computing Now! Knowledge Transfer Network. UK Department of Trade and Industry, London, September 2007. - 26 p.

4. Mokhtarian F., Abbasi F, Kittler J. Robust and efficient shape indexing through curvature scale space. In: 6th British Machine Vision Conference (BMVC-96), Edinburgh, 10-12 September, British Machine Vision Association, 1996, pp. 53-62.

5. Kovalev V., Petrou M. Multidimensional co-occurrence matrices for object recognition and matching. Graphical Models and Image Processing, vol. 58. No 3, 1996, pp. 187-197.

6. Kovalev, V.A., Kruggel, F., Gertz, H.-J. and von Cramon D.Y. Three-dimensional texture analysis of MRI brain datasets. IEEE Transactions on Medical Imaging, vol. 20, No 5, 2001, pp. 424-433.

7. Huang J., Kumar S.R., Mitra M., Zhu W.-J., Zabih R. Image indexing using color correlograms. IEEE Computer Society Conference on Computer Vision and Pattern Recognition, San Juan, Puerto Rico, 1997, pp. 762-768.

8. Kovalev V., Volmer S. Color co-occurrence descriptors for querying-by-example. International Conference on Multimedia Modelling. Oct. 12-15. Lausanne, Switzerland, IEEE Computer Society Press, 1998, pp. 32-38.

9. Kovalev V.A., Thurfjell L., Lundqvist R. and Pagani M. Asymmetry of SPECT Perfusion Image Patterns as a Diagnostic Feature for Alzheimer's Disease. In: Medical Image Computing and Computer-Assisted Intervention (MICCAI 2006), Copenhagen, Denmark, 1-6 October, Larsen R., Nielsen M. and Sporring J. (Eds), Springer Verlag, LNCS, vol. 4191, 2006, pp. 421-428.

10. Kovalev V.A., Petrou M., Suckling J. Detection of structural differences between the brains of schizophrenic patients and controls. Psychiatry Research: Neuroimaging, vol.124, 2003. pp. 177-189.

Статья поступила в редакцию 18,04-2008

i Надоели баннеры? Вы всегда можете отключить рекламу.