Научная статья на тему 'Согласованные полиномиальные признаки для анализа полутоновых биомедицинских изображений'

Согласованные полиномиальные признаки для анализа полутоновых биомедицинских изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
540
69
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
текстурный анализ / дискриминантный анализ / построение признаков / отбор признаков / компьютерная диагностика / полиномиальные признаки / texture analysis / discriminant analysis / feature construction / feature selection / computer-aided diagnostics / polynomial features

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гайдель Андрей Викторович

В работе в общем виде вводятся полиномиальные признаки, представляющие собой многочлены на множестве отсчётов изображения. Показывается, что при наложении естественных ограничений предложенные полиномиальные признаки обращаются в линейные комбинации отсчётов автокорреляционной функции изображения. Предлагается ряд подходов к согласованию этих признаков с текстурными свойствами изображений из обучающей выборки. С помощью вычислительных экспериментов на трёх наборах реальных диагностических изображений демонстрируется эффективность рассмотренных признаков, выражающаяся в снижении вероятности ошибочного распознавания рентгеновских изображений костной ткани с 0,10 до 0,06 по сравнению с ранее изученными методами.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гайдель Андрей Викторович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Matched polynomial features for the analysis of grayscale biomedical images

We considered the general form of polynomial features represented as polynomials in the image pixels domain. We showed that under natural constraints these polynomial features turned to linear combinations of the image autocovariance function readings. We proposed a number of approaches for matching the features under study with texture properties of images from a training sample. During computational experiments on three sets of real diagnostic images we demonstrated the efficiency of the proposed features, which involved the decrease of the recognition error probability of X-ray bone tissue images from 0.10 down to 0.06 in comparison with the previously studied methods.

Текст научной работы на тему «Согласованные полиномиальные признаки для анализа полутоновых биомедицинских изображений»

СОГЛАСОВАННЫЕ ПОЛИНОМИАЛЬНЫЕ ПРИЗНАКИ ДЛЯ АНАЛИЗА ПОЛУТОНОВЫХ БИОМЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ

А.В. Гайдель1,2

1 Самарский государственный аэрокосмический университет имени академика С.П. Королёва (национальный исследовательский университет) (СГАУ), Самара, Россия, 2Институт систем обработки изображений РАН, Самара, Россия

Аннотация

В работе в общем виде вводятся полиномиальные признаки, представляющие собой многочлены на множестве отсчётов изображения. Показывается, что при наложении естественных ограничений предложенные полиномиальные признаки обращаются в линейные комбинации отсчётов автокорреляционной функции изображения. Предлагается ряд подходов к согласованию этих признаков с текстурными свойствами изображений из обучающей выборки. С помощью вычислительных экспериментов на трёх наборах реальных диагностических изображений демонстрируется эффективность рассмотренных признаков, выражающаяся в снижении вероятности ошибочного распознавания рентгеновских изображений костной ткани с 0,10 до 0,06 по сравнению с ранее изученными методами.

Ключевые слова: текстурный анализ, дискриминантный анализ, построение признаков, отбор признаков, компьютерная диагностика, полиномиальные признаки.

Цитирование: Гайдель, А.В. Согласованные полиномиальные признаки для анализа полутоновых биомедицинских изображений / А.В. Гайдель // Компьютерная оптика. - 2016. -Т. 40, № 2. - С. 232-239. - Б01: 10.18287/2412-6179-2016-40-2- 232-239.

Введение

В процессе медицинской диагностики многих заболеваний возникают задачи анализа изображений различных тканей на наличие характерных для патологии особенностей. Традиционно эти задачи решаются квалифицированными экспертами путём визуальной оценки. Между тем разработка компьютерных систем автоматической диагностики, способных обучаться и распознавать биомедицинские изображения, может существенно повысить скорость процедуры диагностики и удешевить её.

Важным этапом решения задачи статистического распознавания образов является выбор признаков для описания объекта распознавания. В некоторых ситуациях набор признаков определяется естественным образом, однако в случае с распознаванием сложных объектов, таких как цифровые изображения, признаки обычно выбирают эвристически, исходя из особенностей прикладной задачи. В литературе описано большое количество разнообразных признаков, подходящих для тех или иных задач [1].

Стандартной практикой при решении новой задачи является выбор большого набора подходящих признаков и последующий отбор с целью выделить небольшое подмножество признаков, наиболее эффективное для этой задачи. Часто такой отбор осуществляется эвристически в ходе ряда вычислительных экспериментов, хотя имеются методы, автоматизирующие этот процесс.

Известный способ снижения размерности признакового пространства заключается в дискриминантном анализе [2], но он предполагает линейное преобразование полного набора исходных признаков, так что все исходные признаки должны быть предварительно вычислены. Чтобы вычислять лишь некоторое подмножество исходных признаков, дискриминантный

анализ дополняют предварительной оптимизацией по таким подмножествам.

В случае небольшой размерности исходного признакового пространства для предварительной оптимизации можно использовать полный перебор, как это сделано в работе [3]. В противном случае приходится прибегать к квазиоптимальным процедурам отбора, одна из которых была успешно использована для анализа рентгеновских изображений костной ткани [4], ультразвуковых нефрологических изображений [5] и изображений компьютерной томографии лёгких [6]. Эти и другие более специфические подходы к отбору признаков для задач анализа биомедицинских данных исследуются в работах [7] и [8].

При этом остаются открытыми проблемы автоматического построения новых признаков и отбора из потенциально бесконечных множеств параметрических признаков. В большинстве работ новые признаки строятся путём выполнения некоторых операций над исходным набором признаков [9, 10]. Однако в работе [11] предлагается способ тонкой настройки параметров некоторых признаков и даже области интереса с помощью генетического алгоритма. Богатая теория построения линейных локальных признаков описана и исследована в работах [12, 13].

Общая задача построения признаков, согласованных с характеристиками изображений из обучающей выборки, ранее была поставлена в [14]. Там же был предложен простейший подход согласования известных направленных текстурных признаков. В настоящей работе вводятся общие полиномиальные признаки, допускающие согласование с особенностями решаемой задачи. Целью данной работы является разработка согласованных полиномиальных признаков и исследование их практического применения в задачах анализа биомедицинских изображений.

1. Полиномиальные признаки

Определение полиномиальных признаков

Пусть О - множество полутоновых цифровых изображений, подлежащих распознаванию, каждое из которых представляет собой функцию

ю(т,п): Бю ® О ,

отображающую из некоторой области интереса Бю с 1? в множество из 2 уровней яркости О = [0, <-1]п1.

Будем строить признаки, как многочлены на О. Определим мультииндекс [15] порядка деМ0, как век-

тор у = (т(1) у(2) ... "ке[1; |Бю|]п1: у(£)еМо и

У(|Бю|))г, такой что

2 у(к )=?.

к=1

Здесь и далее в статье оператор А| для конечного множества А возвращает количество элементов в нём.

Кроме этого, введём на области интереса Бю отношение лексикографического порядка

((т1,п1) X (т2,п2)) = (т < т2 V т1 = т2 лп1 < п2)

и занумеруем все отсчёты (т, п)еБю в соответствии с ним, в результате чего получим конечную последовательность отсчётов {(тк, пк)}Б"', такую что

V/,]е {1,2,...,|Б„|| : (/ < ]) ^ ((т,,п) X (mj,nj)).

Обозначим 19 множество всех мультииндексов порядка д. Тогда многочлен порядка д определяется как

(ю, в) = 22 6(у)П(ю( тк, пк ))у(). (1)

р=0 уе I р к=1

Здесь в(у): - это коэффициенты перед соответствующими членами с мультииндексом у.

Различные наборы коэффициентов соответствуют различным полиномиальным признакам, некоторые из которых могут лучше или хуже подходить для конкретной задачи. Выбор наилучших для данной задачи коэффициентов в, при которых образованное оператором (1) признаковое пространство обеспечивает наилучшее описание изображений ю(т, п), и является согласованием признаков (1) с задачей.

Ограничения на полиномиальные признаки

Далее предлагается наложить на полиномиальные признаки (1) ряд естественных ограничений, чтобы отсечь их заведомо непригодные вариации.

1. Инвариантность к сдвигу. Признаки не должны меняться от сдвига координатного пространства

ю( т, п') = ю( т + Ат, п + Ап),

поскольку положение отсчёта в глобальной системе координат не несёт никакой информации о классе изображения.

Очевидно, что линейная часть полинома (1) не зависит от сдвига, только если все соответствующие коэффициенты при отсчётах изображения одинаковы. Для квадратичной части полинома (1)

Ч ,(2)(ю, в) = 2 в(у)П(ю( тк + Ат, пк +Ап ))у(к ) =

уе12 к=1

\бю\ |бю|

= 22 в' ] ю( т1 + Ат, п1 + Ап )ю( mj + Ат, nj + Ап) =

/=1 ]=1

= 2 2 nl,^п2)х

(т,,п, )еВ„ (т2,п2 )еВ„

хю( т1 +Ат, п1 +Ап )ю( т2 + Ат, п2 +Ап)). Рассмотрим дополненное нулями изображение

[ш(m,п), (m,п)е Б„;

со (т, п ) =

V 7 [0, (т,п)й Ба.

Коэффициенты в'' также доопределим за пределы

Бю. Тогда логично потребовать, чтобы

+™ +™ +™ +™

2 2 2 2 (в'(т1 +Ат,п1 +Ап,т2 +Ат,

т1 =-¥ п =-¥ т2 =-¥ п2 =-¥

п2 +Ап )ю (тр п1 )ю (т2, п2)) =

+¥ +¥ +¥ +¥

= 2 2 2 2 (в'( ml, nl, ^ п2 )х

т?1 =-¥ п =-¥ т2 =-¥ п2 =-¥

хю (т1, п1 )ю (т2, п2)).

Это выполняется, когда при сдвиге координат коэффициенты не меняются, то есть

в ( т1, п1, т2 , п2 ) =

= в (т1 + Ат, п1 + Ап, т2 + Ат, п2 + Ап) = = в''(Ат, Ап).

Последнее означает, что коэффициенты при квадратичных членах зависят только от сдвига между отсчётами, а не от расположения одного из них в глобальной системе координат.

Таким образом, квадратичная часть многочлена может быть переписана в виде

Ч ,(2)(ю, в)= 2 2 (в(Ат, Ап )х

(Ат,Ап)еЖ+ (т,п)еВЮ(Ат,Ап)

хю( т, п )ю( т + Ат, п + Ап)),

(2)

где

БЮ(Ат,Ап) = {(т,п)е Бю | (т + Ат,п + Ап)е Бю| -

множество отсчётов из Бю, таких что сдвинутые на (Ат, Ап) отсчёты также лежат в Бю, а 1+ = {ке1 | к > 0} -

множество целых неотрицательных чисел.

2. Инвариантность к сдвигу яркости. Увеличение или уменьшение яркости всех отсчётов изображения на одну и ту же величину не должно влиять на признаки. Это означает инвариантность к преобразованиям вида

Б

ю'( т, п) = ю( т, п) + Аю.

Для обеспечения инвариантности любого признака к такому сдвигу яркости целесообразнее всего выполнить предварительное нормализирующее преобразование изображения, заключающееся в вычитании среднего значения яркости:

ю'(т,п)-(1/|Dю|) X ю'(т,п) = ю(т,п) + Аю-

(т,п)еОа

-(!/|°ю\) X (ю(т,п) + Аю) =

(т,пУ-От

= ю(т,п)-(1/|) X ю(т,п).

(т,п)е-Ош

В дальнейшем предполагается, что полиномиальные признаки вычисляются по нормализованным изображениям.

3. Инвариантность к размеру области интереса. Это не означает инвариантность к масштабу, но расширение области интереса на однородном изображении не должно приводить к существенному изменению значений признаков. Чтобы это обеспечить, нормируем все суммы (2) по отсчётам изображения на количество слагаемых в них:

Р(2)(ю, Э)= X ((1: |^ю(Ат, Ап )|) х

(Ат,Аи)ЁЖ+

(0(Ат, Ап )х

(3)

х X

(т,п)ейш(Дт,Дп)

хю( т, п )ю( т + Ат, п + Ап))).

При этом коэффициент при каждом слагаемом зависит от размера области интереса, но это обеспечивает общую инвариантность построенных признаков к изменениям размера этой области.

4. Локальность. Признаки должны агрегировать локальные свойства текстуры на изображении, а не глобальные её изменения, поскольку далеко стоящие отсчёты слабо связаны друг с другом.

Для каждого отсчёта (т, п)еДш определим его окрестность ^(т, п): Dю®2Dю, как квадратное окно радиуса й:

Wd = [-й; +й]2 пZ2. (4)

Яркость ш(т, п) зависит только от яркостей отсчётов из его окрестности

т,п) = {(т + Ат,п + Ап) | (Ат, Ап)е Цгй} .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Квадратичные полиномиальные признаки в форме (3) представляют собой суммирование произведений отсчётов, стоящих друг относительно друга в определённых конфигурациях, причём коэффициент при яркостях отсчётов, стоящий в одинаковой конфигурации, также одинаков. Таким образом, квадратичные признаки (3) окончательно примут вид

¥р(2)(ш,0)= X ((9(Ат, Ап): |^ю(Ат,Ап)|)х

(Ат,Ап)еШе

Л

х X ю(т, п )ш(т + Ат, п + Ап)

(т,п)ейш(Дт,Дп)

(5)

Ограничив так зависимость между отсчётами изображения, удалось добиться сокращения количества неизвестных коэффициентов, поскольку большую часть из них мы положили равными нулю. В признаке (5) количество неизвестных параметров оценивается как

О

" к\' (2ё +1)2

2 2

= О (й2)

и не зависит от размера изображения. Размер окна делится пополам, поскольку противоположные направления неотличимы, то есть

"(Ат,Ап)е : 0(Ат,Ап) = 0(-Ат,-Ап).

Остаётся лишь выбрать радиус окна й исходя из объёма обучающей выборки так чтобы

(2ё +1)2 /2~| < ,

ведь иначе количество неизвестных параметров превысит количество измерений. Например, для обычной выборки из 100 изображений нельзя брать окно размерами более чем 13*13. При этом желательно всё же выбирать окно меньших размеров, чтобы уменьшить число степеней свободы в процедуре оптимизации и повысить тем самым её качество.

В случае использования общих итеративных процедур глобальной оптимизации пространство, из которого выбираются неизвестные коэффициенты, также должно быть ограничено, поскольку такие процедуры должны выбирать точку оптимума из ограниченной области. В случае, если удобнее решать задачу оптимизации с ограничениями, можно положить, например, 6 = [-1; +1](2й+1)2, а иначе 6 = К(2й+1)2.

Пусть

Лю(Ат, Ап )=|-1-г х

Рю^ Ап )| (6)

х X ю(т, п )ю(т + Ат, п + Ап )-

(т,п)е Dш(Аm,Аn)

оценка автоковариационной функции изображения. Тогда квадратичные признаки (5) запишутся более коротко, как линейная комбинация отсчётов таких функций:

¥

Р(2)

(ю, 0)= X 0(Ат, Ап) Лю(Ат, Ап)

(Ат.Аи)Е

(7)

Следует отметить спектральную интерпретацию признаков в форме (7): они в точности равны линейной комбинации отсчётов плотности пространственной спектральной мощности уровней яркости изображения ю. Проще говоря, эти признаки равны сумме с некоторым окном отсчётов энергии изображений в определяемой носителем окна области.

Аналогичные рассуждения для кубической части многочлена (1) приводят к формированию признаков с О(й 3) неизвестными параметрами 0, нуждающимися в согласовании. Это уже довольно большое число,

препятствующее физической реализации таких признаков, так что в данной работе исследовались именно квадратичные признаки в форме (7).

2. Критерии качества полиномиальных признаков

Пусть множество подлежащих распознаванию изображений О разбито на два класса: О1 и О2, так что О1и О2 = О и О1П О2 = 0. В данной работе эти классы соответствуют изображениям здоровой биологической ткани и ткани с некоторой патологией.

Обозначим Ф(ю): О ®{ О1, О2} идеальный оператор распознавания, отображающий объект распознавания в его класс. Решить задачу распознавания -значит построить оператор Ф(ю): П ® {й1,П2|, который принимает решение об отнесении объекта к одному из классов, исходя из структуры самого объекта. В статистической теории распознавания образов оператор распознавания обычно строится как суперпозиция оператора вычисления признаков Ч(ю): О ®3 и классификатора С(х): 3®{ О1, О2}, где векторное пространство 3 называется признаковым пространством.

В настоящей работе в качестве оператора вычисления признаков используется оператор (7), а в качестве классификатора - алгоритм ближайшего соседа [2], но расстояние вычисляется по значениям признаков, нормированных на их дисперсию, как в работе [4]. На вход системе изначально поступает конечная обучающая выборка Ос О, которая также разбита на два класса: П = Пп О1 и (2 = Пп О2. В этом разделе рассматриваются критерии качества признакового пространства, использующиеся в качестве целевых функций процедуры оптимизации для согласования параметров в(Ат, Ап) оператора (7).

1. Достоверность распознавания - доля правильно распознанных изображений из некоторой конечной выборки О с П:

Л(ф) = (1/П)|{юе О | Ф(ю) = Ф(ю)}|.

Этот критерий наиболее очевидным образом связан с вероятностью правильного распознавания, поскольку является её статистической оценкой. В данной работе он вычислялся по обучающей выборке П методом исключения одного объекта, то есть из выборки последовательно исключается один из объектов, который подлежит распознаванию, а обучение системы производится на всех остальных объектах [2].

2. Расстояние Бхатачария:

т(1/2) = (1/8)(а1 - а2) ((Я1 + Я2)/2)-1 (а1 -а2) +

+(1/2) ln

( 1 Л

1 R +

где

= Ш I Y(w)-

U,

, weU,

оценки внутриклассовых математических ожиданий,

1 T

R = ЦдЕИю)" a, )(Y(m)-a,) -

, meU,

оценки внутриклассовых корреляционных матриц.

3. Четвёртый критерий дискриминантного анализа из [2]:

Л4 = *-1 (ЯЕ) 1г(Я),

где

Rs= 0,5 •( R + R2) -

V 1 2.1

средняя внутриклассовая корреляционная матрица,

Я = 101 2(Ч(ю)-а)(Ч(ю)-а) -

0 I юеО

корреляционная матрица смеси распределений. Здесь имеется в виду, что

а = 1(1 2 Ч(ю) -

01 юе О

оценка математического ожидания смеси распределений.

[7]:

4. Критерий дискриминантного анализа из работы

JSNR

tr (R) + tr (R2)

На практике для вычисления этого критерия использовалась евклидова норма.

5. Ещё один критерий дискриминантного анализа:

Jdiff = tr (R - Rs) = tr R - tr Rs .

Для оптимизации первых пяти критериев использовались те же три итерационных алгоритма глобальной оптимизации, что и в работе [14]: метод случайного поиска, генетический алгоритм и алгоритм имитации отжига. Отличие заключается в том, что в данном случае оптимизировать необходимо вектор параметров, а не единственный параметр. Обобщение выполнено единственным образом: операторы скрещивания, мутации и другие просто выполняются поэлементно.

6. Первый критерий дискриминантного анализа из

[2]:

Ji = tr ( Rs1R ).

7. Второй критерий дискриминантного анализа из

[2]:

J2 = ln|R—R .

Согласование параметров 9(Am, An) с помощью этих двух критериев может быть осуществлено с помощью обычной процедуры дискриминантного анализа, подробно описанной в [2], поскольку признаки (7) можно считать линейными комбинациями примитивных признаков (6). Задача выбора параметров 9(Am, An) по сути является задачей выбора оптималь-

a1 — a2

a

ного линейного преобразования признакового пространства, образованного отсчётами ковариационной функции (6), которая решается методом главных компонент.

8. Критерий, основанный на методе наименьших квадратов:

2 1/ >2 ^а(0)=-]С ^ X К(2)(Ю, 0)-«, ) ,

1=1 \и 1\ ЮЁО,

где а1 = -1, а а2 =+1. Этот критерий тем больше, чем меньше значения признаков отличаются от требуемых значений, одинаковых для одного и того же класса и отличающихся для различных классов.

Вычислив производные этой функции с учётом (6) и (7), можно в явном виде выписать необходимое условие экстремума:

1

'' ^ " (т, п )

X 0{АтА) XX /?ю(Ат,Ап)т,п) =

(Ат.Аи)е ¡¥й

а,

и,

= X Ц] X т, п).

1=1 и 1\ юе и,

Это условие представляет собой неоднородную систему линейных алгебраических уравнений вида А0 = Ь , где

1 1

А(',1) = Xш X *ю(г(|))^ 1)),

м и

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

I шеи,

Ь(|) = XТ«1 X *ю(г(|)),

1( к ) =

1=1 |0,| шеи, к + й -1 2й +1

к-(2й +1)

к + й -1 2й +1

-1

Решением является единственный набор параметров, соответствующий единственному признаку (6). Другие признаки с другими наборами параметров уже не являются оптимальными по этому критерию. Таким образом, процедура согласования параметров с использованием восьмого критерия качества признакового пространства сводится к решению СЛАУ.

3. Результаты вычислительных экспериментов

Для проверки эффективности квадратичных признаков (7) при использовании для согласования различных критериев качества были проведены серии экспериментов, схема которых представлена и подробно описана в работе [14]. Входными данными для отдельной серии экспериментов являются:

1) один из трёх наборов изображений: рентгеновские изображения шейки бедра (95 штук, 1040*860), ультразвуковые изображения почек (84 штуки, 640*480) или изображения компьютерной томографии лёгких (160 штук, 140*200);

2) критерий качества признакового пространства, который будет использоваться в качестве целевой функции при оптимизации;

3) алгоритм оптимизации, подходящий для данного критерия.

Сама серия экспериментов проводится следующим образом.

1. Весь набор изображений случайным образом делится на обучающую и контрольную выборки равных объёмов, причём изображения нормальных тканей и тканей с патологией также делятся между выборками поровну.

2. С помощью заданной процедуры согласования выбираются параметры 0(Ат, Ап), соответствующие максимуму заданного критерия качества. На выходе получается обученная система, хранящая в памяти все векторы согласованных признаков, соответствующие изображениям из обучающей выборки.

3. Среди всех признаков производится отбор наиболее эффективного подмножества с помощью процедуры, описанной в работе [4].

4. Эффективность построенной системы распознавания проверяется на контрольной выборке и путём оценки доли неверно распознанных изображений

е = (1/и)|{юе и | Ф(ю) Ф Ф(ю)}

(8)

Конкретные параметры алгоритмов:

й = 2 - радиус окна (4), в котором вычисляются признаки;

К = 13 - количество квадратичных признаков;

= 200 - количество шагов итерационных алгоритмов глобальной оптимизации: метода случайного поиска, генетического алгоритма и алгоритма имитации отжига;

Мрор = 10 - размер популяции генетического алгоритма;

рти = 0,1 - вероятность мутации в генетическом алгоритме;

/0 = 10 - начальная температура в алгоритме имитации отжига;

-1 < 0(Ат, Ап) < +1 - ограничения на коэффициенты для процедур оптимизации, не работающих без ограничений.

Принципы работы алгоритмов оптимизации и назначение указанных параметров подробно описаны в работе [14].

Табл. 1. Результаты исследования согласованных квадратичных признаков для задачи распознавания рентгеновских изображений шейки бедра

Алгоритм согласования Лучший критерий Ошибка Число признаков

Случайный поиск т(1/2) 0,14 2

Генетический алгоритм т(1/2) 0,10 1

Имитация отжига л 0,06 4

Метод главных компонент 31 0,18 11

Решение СЛАУ За 0,18 1

В табл. 1 приведены результаты исследования эффективности согласованных квадратичных признаков для задачи автоматической диагностики остеопороза

I=1 юёО

по рентгеновским изображениям костной ткани шейки бедра. Для каждого способа согласования параметров приведён критерий качества признакового пространства, наилучший по доле правильно распознанных изображений из контрольной выборки, а также ошибка распознавания (8) и число признаков в наиболее эффективном наборе. Выделена строчка с наименьшей долей неправильно распознанных изображений.

Аналогичным образом в табл. 2 показаны результаты исследования эффективности согласованных квадратичных признаков для задачи автоматической диагностики нефрологических заболеваний по ультразвуковым изображениям почек. Видно, что результаты, полученные с использованием дискрими-нантного анализа, незначительно превосходят результаты, полученные в работе [14] для этой задачи, но не превосходят результатов, полученных в работе [5] для другого набора данных.

Табл. 2. Результаты исследования согласованных квадратичных признаков для задачи распознавания ультразвуковых изображений почек

В табл. 3 приведены результаты исследования эффективности согласованных квадратичных признаков для задачи автоматической диагностики эмфиземы по двумерным срезам компьютерной томографии лёгких. Наилучшие результаты были получены случайным поиском, но они значительно превосходят результаты, полученные в работе [6].

В среднем по всем задачам наилучшим по доле правильно распознанных изображений алгоритмом оптимизации является метод случайного поиска, что свидетельствует о том, что более сложные алгоритмы оптимизации не повышают качество процедуры согласования. Наилучший критерий качества в среднем по всем задачам - Л.

Табл. 3. Результаты исследования согласованных квадратичных признаков для задачи распознавания изображений компьютерной томографии лёгких

Доверительные интервалы Агрести-Коула [16] для наилучших оценок вероятностей ошибочного распознавания составляют для рентгеновских изображений шейки бедра - (0,01; 0,17), для изображений УЗИ почек - (0,06; 0,28), для изображений КТ лёгких - (0,02; 0,14). Все доверительные интервалы приведены для уровня значимости a = 0,05.

Заключение

В данной работе предложены локальные квадратичные признаки для задач анализа полутоновых изображений биологических тканей, отличающиеся возможностью предварительного согласования с обучающей выборкой. Согласование этих признаков представляет собой выбор коэффициентов при одночленах путём решения задачи оптимизации с использованием критерия качества признакового пространства в качестве целевой функции.

Экспериментальные исследования предложенных признаков на реальных задачах автоматической диагностики заболеваний по биомедицинским изображениям продемонстрировали снижение вероятности ошибочного распознавания для рентгеновских изображений костной ткани с 0,10 до 0,06 в сравнении с использованием согласованных направленных признаков, описанных в работе [14]. Кроме того, эксперименты продемонстрировали снижение вероятности ошибочного распознавания изображений компьютерной томографии лёгких до

0.06. что меньше, чем в работе [17].

Разумеется, предложенные признаки подходят для задач анализа и распознавания произвольных полутоновых текстурных изображений, а не только биомедицинских. Дальнейшего исследования заслуживает влияние выбранного классификатора на общее качество распознавания с помощью предложенных признаков. Также интерес представляет разработка новых критериев качества, для которых можно аналитически получить оптимальные значения коэффициентов.

Благодарности

Работа выполнена при поддержке гранта РФФИ 14-07-97040-р_поволжье_а и Министерства образования и науки РФ в рамках мероприятий Программы повышения конкурентоспособности СГАУ среди ведущих мировых научно-образовательных центров на 2013-2020 годы, а также Программы фундаментальных исследований ОНИТ РАН «Биоинформатика, современные информационные технологии и математические методы в медицине».

Литература

1. Методы компьютерной обработки изображений / М.В. Гашников, Н.И. Глумов, Н.Ю. Ильясова, В.В. Мясников, С.Б. Попов, В.В. Сергеев, В.А. Сойфер,

A.Г. Храмов, А.В. Чернов, В.М. Чернов, М.А. Чичёва,

B.А. Фурсов; под ред. В.А. Сойфера. - 2-е изд., испр. - М.: Физматлит, 2003. - 784 с.

2. Fukunaga, K. Introduction to statistical pattern recognition / K. Fukunaga. - San Diego: Academic Press, 1990. - 592 p.

3. Ильясова, Н.Ю. Формирование признаков для повышения качества медицинской диагностики на основе

Алгоритм согласования Лучший критерий Ошибка Число признаков

Случайный поиск m(1/2) 0,06 6

Генетический алгоритм J4 0,12 4

Имитация отжига J4 0,15 7

Метод главных компонент J1 0,20 13

Решение СЛАУ Ja. 0,34 1

Алгоритм согласования Лучший критерий Ошибка Число признаков

Случайный поиск Jsnr 0,16 8

Генетический алгоритм J4 0,26 2

Имитация отжига J 0,26 3

Метод главных компонент J1 0,14 7

Решение СЛАУ Ja. 0,38 1

методов дискриминантного анализа / Н.Ю. Ильясова, А.В. Куприянов, Р.А. Парингер // Компьютерная оптика. -2014. - Т. 38, № 4. - С. 851-855.

4. Гайдель, А.В. Исследование текстурных признаков для диагностики заболеваний костной ткани по рентгеновским изображениям / А.В. Гайдель, С.С. Первушкин // Компьютерная оптика. - 2013. - Т. 37, № 1. - С. 113-119.

5. Гайдель, А.В. Исследование текстурных признаков для диагностики нефрологических заболеваний по ультразвуковым изображениям / А.В. Гайдель, С.Н. Ларионова, А.Г. Храмов // Вестник Самарского государственного аэрокосмического университета им. академика С.П. Королёва (национального исследовательского университета). - 2014. - № 1(43). - С. 229-237.

6. Гайдель, А.В. Возможности текстурного анализа компьютерных томограмм в диагностике хронической об-структивной болезни / А.В. Гайдель, П.М. Зельтер, А.В. Капишников, А.Г. Храмов // Компьютерная оптика. - 2014. - Т. 38, № 4. - С. 843-850.

7. Yang, M. Feature selection and construction for the discrimination of neurodegenerative diseases based on gait analysis / M. Yang, H. Zheng, H. Wang, S. McClean // 3rd International Conference on Pervasive Computing Technologies for Healthcare: Pervasive Health'09, London, United Kingdom, 1-3 April, 2009. - 7 p.

8. Peng, Y. A novel feature selection approach for biomedical data classification / Y. Peng, Z. Wu, J. Jiang // Journal of Biomedical Informatics. - 2010. - Vol. 43(1). - P. 15-23.

9. Neshatian, K. Feature construction and dimension reduction using genetic programming / K. Neshatian, M. Zhang, M. Johnston // Lecture Notes in Computer Science. - 2007. - Vol. 4830. - P. 160-170.

10. Fan, W. Generalized and heuristic-free feature construction for improved accuracy / W. Fan, E. Zhong, J. Peng,

O. Verscheure, K. Zhang, J. Ren, R. Yan, Q. Yang // Proceedings of the 10th SIAM International Conference on Data Mining, Columbus, OH, United States, 29 April - 1 May 2010. - P. 629-640.

11. Lillywhite, K. A feature construction method for general object recognition / K. Lillywhite, D.-J. Lee, B. Tippetts, J. Archibald // Pattern Recognition. - 2013. - Vol. 46, № 12. - P. 3300-3314.

12. Myasnikov V.V. Constructing efficient linear local features in image processing and analysis problems / V.V. Myasnikov // Automation and Remote Control. -2010. - Vol. 71(3). - P. 514-527.

13. Мясников, В. В. Анализ методов построения эффективных линейных локальных признаков цифровых сигналов и изображений / В.В. Мясников, А.Ю. Баврина, О.А. Титова // Компьютерная оптика. - 2010. - Т. 34, № 3. - С. 374-381.

14. Гайдель, А.В. Метод согласования направленных текстурных признаков в задачах анализа биомедицинских изображений / А.В. Гайдель // Компьютерная оптика. -2015. - Т. 39, № 2. - С. 287-293

15. Raymond, X.S. Elementary Introduction to the Theory of Pseudodifferential Operators / X.S. Raymond. - Boca Raton: CRC Press, 1991. - 120 p.

16. Agresti, A. Approximate is Better than "Exact" for Interval Estimation of Binomial Proportions / A. Agresti, B.A. Coull // American Statistician. - 1998. -Vol. 52(2). - P. 119-126.

17. Ginsburg, S.B. Automated Texture-based Quantification of Centrilobular Nodularity and Centrilobular Emphysema in Chest CT Images / S.B. Ginsburg, D.A. Lynch, R.P. Bowler, J.D. Schroeder // Academic Radiology - 2012. - Vol. 19(10). - P. 1241-1251.

Сведения об авторе

Гайдель Андрей Викторович, 1989 года рождения, кандидат технических наук, в 2012 году окончил Самарский государственный аэрокосмический университет имени академика С. П. Королёва (СГАУ) по направлению «Прикладная математика и информатика», в 2015 году защитил кандидатскую диссертацию. Работает ассистентом кафедры технической кибернетики СГАУ и стажёром-исследователем в Институте систем обработки изображений РАН. Область научных интересов: компьютерная обработка изображений, теория распознавания образов, интеллектуальный анализ данных, теория алгоритмов. E-mail: andrey.gaidel@,gmail.com .

Поступила в редакцию 6 апреля 2016 г. Окончательный вариант - 22 апреля 2016 г.

MATCHED POLYNOMIAL FEATURES FOR THE ANALYSIS OF GRAYSCALE BIOMEDICAL IMAGES

A.V. Gaidel1

1 Samara State Aerospace University,

2 Image Processing Systems Institute,

Russian Academy of Sciences

Abstract

We considered the general form of polynomial features represented as polynomials in the image pixels domain. We showed that under natural constraints these polynomial features turned to linear combinations of the image autocovariance function readings. We proposed a number of approaches for matching the features under study with texture properties of images from a training sample. During computational experiments on three sets of real diagnostic images we demonstrated the efficiency of the proposed features, which involved the decrease of the recognition error probability of X-ray bone tissue images from 0.10 down to 0.06 in comparison with the previously studied methods.

Keywords: texture analysis, discriminant analysis, feature construction, feature selection, computer-aided diagnostics, polynomial features.

Citation'. Gaidel AV. Matched polynomial features for the analysis of grayscale biomedical images. Computer Optics 2016; 40(2). 232-39. DOI. 10.18287/2412-6179-2016-40-2-232-239.

Acknowledgements: The work was partially funded by Russian Science Foundation (RSF), grant No. 14-07-97040-r_povolzhye_a, the Russian Federation Ministry of Education and Science and Fundamental Research Program NITD RAS «Bioinformatics, modern information technologies and mathematical methods in medicine».

References

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[1] Gashnikov MV, Glumov NI, Ilyasova NYu, Myasnikov VV, Popov SB, Sergeev VV, Soifer VA, Khramov AG, Chernov AV, Chernov VM, Chicheva MA, Fursov VA. Methods for computer image processing [In Russian]. Ed by Soifer VA. Moscow: Fizmatlit; 2003.

[2] Fukunaga K. Introduction to statistical pattern recognition. San Diego: Academic Press; 1990.

[3] Ilyasova NYu, Kupriyanov AV, Paringer RA. Formation of features for improving the quality of medical diagnosis based on discriminant analysis methods. Computer Optics 2014; 38(4): 851-855.

[4] Gaidel AV, Pervushkin SS. Research of the textural features for the bony tissue diseases diagnostics using the roentgenograms. Computer Optics 2013; 37(1): 113-119.

[5] Gaidel AV, Larionova SN, Khramov AG. Research of the textural features for the diagnostics of nephrological diseases using the ultrasound images [In Russian]. Herald of the Samara State Aerospace University 2014; 43(1): 229-237.

[6] Gaidel AV, Zelter PM, Kapishnikov AV, Khramov AG. Computed tomography texture analysis capabilities in diagnosing a chronic obstructive pulmonary disease. Computer Optics 2014; 38(4): 843-850.

[7] Yang M, Zheng H, Wang H, McClean S. Feature selection and construction for the discrimination of neurodegenerative diseases based on gait analysis. 3rd International Conference on Pervasive Computing Technologies for Healthcare: Pervasive Health'09; London, United Kingdom, 1-3 April, 2009.

[8] Peng Y, Wu Z, Jiang J. A novel feature selection approach for biomedical data classification. J Biomed Inform 2010; 43(1): 15-23.

[9] Neshatian K, Zhang M, Johnston M. Feature construction and dimension reduction using genetic programming. LNCS 2007; 4830: 160-170.

[10] Fan W, Zhong E, Peng J, Verscheure O, Zhang K, Ren J, Yan R, Yang Q. Generalized and heuristic-free feature construction for improved accuracy. Proceedings of the 10th SIAM International Conference on Data Mining, Columbus, OH, United States, 29 April - 1 May 2010: 629-640.

[11] Lillywhite K, Lee D-J, Tippetts B, Archibald J. A feature construction method for general object recognition. Pattern Recogn 2013; 46(12): 3300-3314.

[12] Myasnikov VV. Constructing efficient linear local features in image processing and analysis problems. Automat Rem Contr 2010; 71(3): 514-527.

[13] Myasnikov VV, Bavrina AY, Titova OA. Analysis of methods for construction of efficient linear local features for digital signals and images description [In Russian]. Computer Optics 2010; 34(3): 374-381.

[14] Gaidel AV. A method for adjusting directed texture features in biomedical image analysis problems. Computer Optics 2015; 39(2): 287-293.

[15] Raymond XS. Elementary Introduction to the Theory of Pseudodifferential Operators. Boca Raton: CRC Press; 1991.

[16] Agresti A, Coull BA. Approximate is Better than "Exact" for Interval Estimation of Binomial Proportions. Am Stat 1998; 52(2): 119-126.

[17] Ginsburg SB, Lynch DA, Bowler RP, Schroeder JD. Automated Texture-based Quantification of Centrilobular Nodularity and Centrilobular Emphysema in Chest CT Images. Acad Radiol 2012; 19(10): 1241-1251.

Authors' information

Andrey Viktorovich Gaidel (b. 1989) graduated from Samara State Aerospace University in 2012, majoring in Applied Mathematics and Informatics. He received his PhD in 2015. Teaching assistant of the Technical Cybernetics Department and Engineer of SRL-35 of Samara State Aerospace University, intern researcher of the Image Processing Systems Institute of the Russian Academy of Sciences. Research interests are currently focused on computer image processing, pattern recognition, data mining and theory of computation. E-mail: andrey.gaidel@gmail.com .

Received April 6, 2016. The final version - April 22, 2016.

i Надоели баннеры? Вы всегда можете отключить рекламу.