Научная статья на тему 'Метод согласования направленных текстурных признаков в задачах анализа биомедицинских изображений'

Метод согласования направленных текстурных признаков в задачах анализа биомедицинских изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
274
72
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕКСТУРНЫЙ АНАЛИЗ / ПОСТРОЕНИЕ ПРИЗНАКОВ / ДИСКРИМИНАНТНЫЙ АНАЛИЗ / ГЕНЕТИЧЕСКИЙ АЛГОРИТМ / АЛГОРИТМ ИМИТАЦИИ ОТЖИГА / TEXTURE ANALYSIS / FEATURE CONSTRUCTION / DISCRIMINANT ANALYSIS / GENETIC ALGORITHM / SIMULATED ANNEALING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гайдель Андрей Викторович

В рамках общей задачи автоматического построения информационных признаков рассматривается конкретная прикладная задача настройки направления вычисления текстурных признаков, предназначенных для последующей диагностики различных заболеваний по цифровым биомедицинским изображениям. В качестве критериев качества признакового пространства рассматриваются достоверность классификации, расстояние Бхатачария, а также серия критериев дискриминантного анализа. В качестве алгоритмов оптимизации используются метод случайного поиска, генетический алгоритм и алгоритм имитации отжига. Предложенный подход обеспечивает снижение оценки вероятности ошибочного распознавания для задачи диагностики рентгеновских изображений костной ткани в два раза (с 0,20 до 0,10), а также для задачи диагностики изображений компьютерной томографии лёгких на 45 % (с 0,11 до 0,06) в сравнении с использованием обычной процедуры отбора из большого числа разнородных признаков.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гайдель Андрей Викторович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A METHOD FOR ADJUSTING DIRECTED TEXTURE FEATURES IN BIOMEDICAL IMAGE ANALYSIS PROBLEMS

As part of the general problem of automatic information feature construction, we considered a particular applied problem of the calculation direction adjustment for the directed texture features intended to diagnose various diseases from digital biomedical images. As feature space quality criteria, we considered the classification accuracy, Bhattacharyya distance and the discriminant analysis criteria. We used random search, a genetic algorithm and simulated annealing as the optimization algorithms. The proposed approach enables a two-fold reduction in the error probability estimation when diagnosing bone tissue X-ray images (from 0.20 to 0.10), also enabling a 45-percent error reduction when diagnosing computed tomography (CT) lung images (from 0.11 to 0.06) in comparison with conventional procedures of selecting from a large number of heterogeneous features.

Текст научной работы на тему «Метод согласования направленных текстурных признаков в задачах анализа биомедицинских изображений»

МЕТОД СОГЛАСОВАНИЯ НАПРАВЛЕННЫХ ТЕКСТУРНЫХ ПРИЗНАКОВ В ЗАДАЧАХ АНАЛИЗА БИОМЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ

Гайдель А. В.

Институт систем обработки изображений РАН, Самарский государственный аэрокосмический университет имени академика С.П. Королёва (национальный исследовательский университет) (СГАУ)

Аннотация

В рамках общей задачи автоматического построения информационных признаков рассматривается конкретная прикладная задача настройки направления вычисления текстурных признаков, предназначенных для последующей диагностики различных заболеваний по цифровым биомедицинским изображениям. В качестве критериев качества признакового пространства рассматриваются достоверность классификации, расстояние Бхатачария, а также серия критериев дискриминантного анализа. В качестве алгоритмов оптимизации используются метод случайного поиска, генетический алгоритм и алгоритм имитации отжига. Предложенный подход обеспечивает снижение оценки вероятности ошибочного распознавания для задачи диагностики рентгеновских изображений костной ткани в два раза (с 0,20 до 0,10), а также для задачи диагностики изображений компьютерной томографии лёгких -на 45 % (с 0,11 до 0,06) в сравнении с использованием обычной процедуры отбора из большого числа разнородных признаков.

Ключевые слова: текстурный анализ, построение признаков, дискриминантный анализ, генетический алгоритм, алгоритм имитации отжига.

Введение

Текстурный анализ является важным инструментом в решении задач диагностики самых разных заболеваний по цифровым изображениям биологических тканей. Математические методы для его использования с этой целью подробно описаны в различных монографиях, таких как [1] и [2]. Общим подходом к решению конкретной задачи является выбор большого количества подходящих текстурных признаков, выбор алгоритма классификации и последующая настройка полученной системы распознавания, состоящая в выборе параметров признаков и алгоритмов, а также в отборе небольшого числа наиболее эффективных признаков. В большинстве случаев как настройка, так и отбор признаков производятся вручную эвристическими методами в ходе серии вычислительных экспериментов.

Существуют попытки автоматизации процедуры отбора признаков, основанные на критериях качества признакового пространства. Одна такая несложная процедура последовательного включения признаков, подобная описанной в [3], уже показала себя с лучшей стороны в трёх прикладных задачах: диагностике остеопороза по рентгеновским снимкам шейки бедра [4], диагностике нефрологических заболеваний по цифровым изображениям УЗИ почек [5] и диагностике хронической обструктивной болезни лёгких (ХОБЛ) по изображениям компьютерной томографии [6]. Эта процедура позволяет из большого числа разнородных информационных признаков отобрать небольшую группу признаков, квазиоптимальных по критерию дискриминантного анализа. Однако для отбора признаков следует сначала из каких-нибудь соображений задать множество признаков, из которых будет производиться отбор. Если же признаки содержат параметры, то обычно вместо одного признака рассматривается целое семейство признаков с раз-

личными значениями параметров. Остаётся открытым вопрос о способах построения новых признаков с нуля, а также о способах настройки параметрических признаков, особенно если значения параметров можно выбирать из бесконечного множества.

Эти задачи во многом оптимизационные и часто решаются с помощью общих методов оптимизации, предназначенных для произвольных функций. Чаще всего прибегают к генетическому алгоритму [7, 8] или к алгоритму имитации отжига [9]. При этом в качестве целевых функций используют различные критерии качества признакового пространства или системы распознавания в целом. Тем не менее, обычно речь идёт о построении новых признаков как определённого рода преобразований над некоторым множеством примитивных признаков, как это сделано в работах [7] и [8], или же о локальных линейных признаках, как в работе [9].

В данной работе предлагается общая постановка задачи построения признаков, а также рассматривается один из практически значимых примеров использования предложенного подхода для автоматической настройки направления вычисления направленных текстурных признаков. Эффективность метода настройки признаков проверяется экспериментально на трёх наборах реальных диагностических изображений. Основной целью работы является разработка эффективного метода автоматической настройки направления вычисления текстурных признаков, позволяющего повысить достоверность классификации по сравнению с использованием обычной процедуры отбора из большого числа гетерогенных признаков.

1. Постановка задачи построения признаков

Пусть имеется множество объектов распознавания П , разбитое на Ь классов А = {П;};=12 ь, и обучающая выборка и с П, для объектов которой заранее из-

вестен их класс. Обозначим за Ф(ю): П ® А идеальный оператор распознавания, который отображает объект юе П; в его класс П;. Решить задачу распознавания - значит построить оператор Ф (ю): П ® А , который занимается тем же самым, но использует при этом ограниченную информацию об объектах распознавания.

Поскольку пространство П чаще всего не является метрическим (например, в случае, если П - это множество цифровых изображений), оператор распознавания Ф (ю) строят как суперпозицию двух операторов

Ф (ю) = С (¥(ю)),

где ¥(ю): П ® Е измеряет информационные признаки объекта и переводит объект распознавания юе П в его вектор признаков хе Е, а С (х): Е ® А называется классификатором и переводит вектор признаков в класс его прообраза. Пространство Е называется признаковым пространством.

Задача построения признаков заключается в выборе оператора вычисления признаков ¥(ю): П ® Е,

который обеспечивает оптимум некоторого критерия качества признакового пространства ](¥). Для оценивания значения критерия можно использовать обучающую выборку и.

На практике выбор оператора построения признаков всегда осуществляется из некоторого множества допустимых операторов ¥. Если элементы функционального пространства ¥ разнородны и не удовлетворяют никаким свойствам, то единственный способ осуществить выбор лучшего из них - перебрать их все и для каждого вычислить критерий качества. Очевидно, если пространство ¥ содержит бесконечно много элементов, сделать это не удастся.

Пусть тогда пространство ¥ содержит конечное множество параметрических семейств операторов, элементы каждого из которых отличаются значением некоторых параметров. Поскольку семейства операторов всё равно придётся перебирать, можно без потери общности считать, что ¥ вообще содержит только одно семейство операторов вычисления признаков ¥(ю,9): Пх0 ® Е, где 0 - множество допустимых значений параметров, каждое из которых задаёт некоторый оператор вычисления признаков. Теперь задача построения признаков состоит в выборе параметра 9 е 0, обеспечивающего максимум некоторого критерия качества признакового пространства ](¥, и), который рассчитывается по оператору и обучающей выборке:

Y(w) = YI w,argmax J(Y(w,9),U) I.

(1)

Критерий качества ](¥,и следует выбирать таким образом, чтобы иметь возможность быстро и точно решить задачу оптимизации. Поскольку при фиксированной обучающей выборке и фиксированном семействе операторов вычисления призна-

ков ¥(ю,9) критерий ](¥, и) зависит только от 9, то можно для удобства кратко записывать ](9) = ](¥(ш,9),и).

В указанной постановке задача построения признаков превращается в обычную оптимизационную задачу, которая решается с использованием подходящих методов оптимизации. В зависимости от особенностей оператора ](0) и множества параметров 0 для её решения следует выбрать один из подходящих методов оптимизации. К сожалению, в большинстве случаев какая-либо информация о характере функции ](0) отсутствует, так что приходится использовать наиболее общие во многом эвристические методы оптимизации, такие как различные методы Монте-Карло [10], псевдоградиентный алгоритм [11], эволюционные алгоритмы [12], имитация отжига [13].

2. Метод автоматической настройки

направленных текстурных признаков

Одним из простейших параметров текстурных признаков является направление. Хотя гистограм-мные признаки, основанные на моментах, инвариантны к сдвигу и повороту, большинство других характеристик, таких как корреляционные признаки, признаки Харалика и признаки, основанные на длинах серий, изменяются в зависимости от направления. Все эти признаки зависят от некоторого координатного сдвига (т,п), который означает сдвиг на расстояние \/т2 + л2 в направлении агС^(у/х). В работах [4-6] отбор производится из четырёх семейств признаков в горизонтальном, вертикальном и двух диагональных направлениях, однако не исключено, что лучшего качества распознавания можно было бы достигнуть в некотором промежуточном направлении.

В угоду универсальности метода, чтобы не менять способ вычисления признаков, будем изменять не направление для признака, а угол поворота изображения, в то время как признаки всегда будем вычислять в горизонтальном направлении. Так для всех изображений ю(т,л) будем выполнять одно и то же преобразование поворота т' ] ( т ]

n j ^ nj

где А0 - это матрица Гивенса, поворачивающая систему координат на угол 9 : I cos 9 - sin 91 ^ sin 9 cos 9 j Поскольку для перечисленных признаков противоположные направления не различаются, то множество возможных направлений, из которого следует выбрать оптимальное, 0 = [0; я]. Требуется из всех

углов 9е [0;я] выбрать тот угол 9, который обеспечивает максимум некоторого критерия качества признакового пространства J(0). Для этого необходимо воспользоваться некоторой процедурой оптимизации.

Выбирая различные критерии 7(9) и различные алгоритмы их оптимизации, можно получить разные алгоритмы автоматической настройки признаков.

Критерии качества признакового пространства

Обозначим

и, ={¥(ю) | юе ип П,} -

векторы признаков из обучающей выборки, относящиеся к классу П,,

и ={^(ю) | юе и} - все векторы признаков из

обучающей выборки. В работе исследовались и сравнивались следующие критерии качества признакового пространства.

1. Доля правильно распознанных объектов

У(е) = щ|{юе U| Ф(ю) = Ф(w)}| .

(2)

Здесь и далее в работе для конечных множеств оператор возвращает количество элементов во множестве. Чтобы эффективно использовать сравнительно небольшую обучающую выборку для вычисления этого критерия, предлагается использовать метод исключения одного объекта [14]. Он предполагает проведение |и| шагов обучения и классификации, в каждом из которых из обучающей выборки и исключается очередной входящий в неё объект, обучение производится только по оставшимся объектам, а в качестве объекта распознавания используется исключённый объект. Для классификации, как и везде в работе, использовался алгоритм ближайшего соседа.

2. Расстояние Бхатачария [14]

IV =((а, - а )Г/8)(3 + ¿2/2)-1 (а, - а) +

+ 1ln 2

f

1 |R + R\

где a, =

(1/И) Е

xeU,

x - оценка внутриклассового ма-

тематического ожидания, R, (m,n) = (l/|U;|) Е (x(m)-a, (m))(x(n)-a; (n)) -

xeU1

оценка внутриклассовой корреляционной матрицы.

3. Первый критерий дискриминантного анализа

L

Ji = tr (R-1R0) , где RS = (1/L) Е R, - матрица средне-

,=i

го внутриклассового рассеяния.

4. Второй критерий дискриминантного анализа

J2 = ln|. (3)

5. Четвёртый критерий дискриминантного анализа J = tr-1 (RE)tr(R). (4)

6. Ещё один критерий дискриминантного анализа из работы [15]

IIa — a II

JSNR =

tr (R) + tr (R)

На практике для вычисления этого критерия использовалась евклидова норма.

Все критерии дискриминантного анализа описаны в [14]. Критерий J3, описанный там же, было решено не использовать, так как выбор параметра в нём представляет собой отдельную задачу.

Алгоритмы оптимизации В силу сложности формул вычисления признаков в зависимости от угла поворота изображения выявить прямую зависимость между значениями критериев оптимальности J(0) и углом поворота не представляется возможным. Также нет никаких оснований утверждать о выпуклости или унимодальности этих критериев по углу поворота. Поэтому для решения задачи оптимизации (1) остаётся лишь использовать достаточно общие методы стохастической оптимизации.

1. Метод случайного поиска. Возьмём Nopt случайных точек {еj} opt, равномерно распределённых на

отрезке [0;я], вычислим значения {J(ej)} = и выберем из них максимальное.

2. Генетический алгоритм. В начале работы алгоритма генерируется начальная популяция точек

г т N o

{еj} =op . Это можно сделать, например, случайно с

помощью предыдущего алгоритма. Далее на каждом шаге алгоритма происходит три этапа: скрещивание, мутация и отбор [12].

Оператор скрещивания c(ei, е2) должен из двух

точек получить одну, сочетающую их свойства. В одномерном случае можно задать его как случайную величину, каким-нибудь образом распределённую на

интервале (min {ei, е2 };max {ei, е2}). На этапе скрещивания из старой популяции отбираются Npop различных пар точек {(е1 (j),е2 (j))} " и формируется

новая популяция {с(б1 (7),92 (7'))} рр .

На этапе мутации ршМ от всех точек подвергаются мутации посредством оператора мутации. Например, можно выбрать £(9) как значение случайной величины 9, распределённой по гауссовскому закону с математическим ожиданием 9 и дисперсией я2 / 36 (из правила трёх сигм). Если значение 9 не лежит на отрезке [0;я], то в качестве значения £(9) выбирается

такой угол 9ШЙ е [0; я], что существует к е Z , такое что 9ШЙ = 9 + як.

На последнем этапе очередного шага происходит отбор. Среди всех точек старой и новой популяции остаются только те Ырор штук, для которых целевая функция 7(9) максимальна. Они используются в качестве старой популяции на следующем шаге. Алгоритм останавливается, когда функция 7(9) вычислена уже для Ыор1 точек. После этого из точек последней

популяции выбирается точка 8, в которой целевая функция 7(9) максимальна.

3. Алгоритм имитации отжига [13] характеризуется начальной температурой (0, убывающей последовательностью температур {(к} , а также оператором

изменения текущей точки £(9), например, таким же, как оператор мутации для генетического алгоритма. Последовательность температур должна быть бесконечно малой, так что подходит, например, гармонический ряд 4= (о/к.

Сам алгоритм хранит некоторую текущую точку 8шгг, которая изначально может выбираться произвольным образом, например, дсшт = 0 . На к -м шаге рассматривается новая точка впеЛ = ^(8сигг). Если 7{®сигг)< 7(8^), то вполне закономерно на следующем шаге полагается 8шгг = 8ЛЫ}. Если же 7(®т,т)- 7(8лей), то на следующем шаге всё равно с

7 (8 сигг )- 7 (0лей)

вероятностью

(

Ра, = еХР

полагается, что 8сшт = 8лей, иначе текущая точка остаётся прежней.

3. Результаты вычислительных экспериментов

Исследование качества описанной процедуры оптимизации направления поворота изображения для повышения качества его текстурного признакового описания проводилось экспериментально на трёх наборах данных.

1. Рентгеновские изображения шейки бедра, полученные в клиниках Самарского государственного медицинского университета в ходе исследования пациентов с подозрением на остеопороз. Примеры таких изображений приведены в работе [4]. Общее количество изображений - 95. Средний размер изображений - 1040x860.

2. Ультразвуковые изображения почек, полученные в клиниках Самарского государственного медицинского университета в ходе нефрологических исследований. Примеры таких изображений приведены в работе [5]. Общее количество изображений - 84. Средний размер изображений - 640x480.

3. Двумерные срезы рентгеновских изображений компьютерной томографии лёгких, полученные в клиниках Самарского государственного медицинского университета. Примеры таких изображений приведены в работе [6]. Общее количество изображений -160. Средний размер изображений - 140x200.

Все наборы изображений были случайным образом разделены на две выборки одинакового объёма: обучающую и контрольную (из 95 изображений костной ткани 47 были помещены в обучающую выборку, а 48 - в контрольную). После этого для различных сочетаний критериев качества и алгоритмов оптимизации производилась настройка угла поворота изображений, в результате для полученного оптимально-

го угла также оказывались посчитанными значения признаков. Затем значения признаков также рассчитывались для контрольной выборки, и производилась проверка качества классификации полученных векторов признаков по критерию (2). При этом для отбора эффективной группы признаков использовалась процедура, основанная на критерии дискриминантного анализа (4), так же как это проделывалось в работах [4-6]. Наглядная схема экспериментальных исследований, проведённых для каждого набора данных в отдельности, представлена на рис. 1.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Набор изображений

Рис. 1. Схема экспериментальных исследований

В качестве направленных информационных признаков использовались следующие.

1. Значения ковариационной функции через 1 и через 5 отсчётов, поскольку они были признаны наиболее эффективными для распознавания рентгеновских изображений шейки бедра в работе [4].

2. Признаки Харалика, основанные на матрицах вхождений, поскольку они были признаны наиболее эффективными для распознавания изображений УЗИ почек в работе [5].

3. Признаки на основе длин серий, поскольку они были признаны наиболее эффективными для распознавания изображений компьютерной томографии лёгких в работе [6].

Так как для вычисления признаков использовалось только горизонтальное направление, общее количество уникальных признаков составило 40 штук.

В качестве параметров алгоритмов оптимизации выбирались количество итераций = 20, размер популяции генетического алгоритма Ырор = 5, вероятность генетической мутации рШ1Л = 0,1, начальная температура в имитации отжига (0 = 10. В качестве алгоритма классификации использовался метод ближайшего соседа, но расстояние между векторами признаков вычислялось по стандартизованным признакам, нормированным на дисперсию. Обоснование последнего было дано в работе [6].

В табл. 1 приведены результаты серии экспериментов с рентгеновскими изображениями шейки бедра. Чтобы не загромождать статью результатами для каждого сочетания алгоритма оптимизации и критерия качества признакового пространства, для каждого алгоритма оптимизации приведён только лучший по значению оценки вероятности ошибочного распознавания критерий.

к

Табл. 1. Результаты исследования автоматической настройки признаков для задачи распознавания рентгеновских изображений шейки бедра

Алгоритм оптимизации Лучший критерий Ошибка Значение угла

Случайный поиск 0,10 2,62

Генетический алгоритм к 0,12 2,47

Имитация отжига л 0,10 2,49

Кроме этого, приведена оценка вероятности ошибочной классификации,

г = (У|Щ)|{юе#| Ф(ю) = Ф(ю)}|, (5)

вычисленная по изображениям из контрольной выборки

О, а также сами значения оптимальных углов в радианах. Видно, что полученные значения ошибки в два раза ниже, чем в работе [5]. Аналогичным образом в табл. 2 приведены те же самые данные для задачи распознавания изображений УЗИ почек. Полученная оценка ошибочного распознавания значительно превышает значение, полученное в [5]. Это связано с тем, что по техническим причинам эксперименты проводились на другом наборе данных, для которого и описанный в [5] подход также даёт схожие значения ошибки. Кроме того, видно, что оптимальным оказалось нулевое значение угла, так что поворот изображений почек никак не повышает качество их распознавания.

Табл. 2. Результаты исследования автоматической настройки признаков для задачи распознавания изображений УЗИ почек

Алгоритм оптимизации Лучший критерий Ошибка Значение угла

Случайный поиск 0,16 0,0

Генетический алгоритм 0,16 0,0

Имитация отжига к2 0,16 0,0

Наконец, в табл. 3 приведены результаты экспериментов с изображениями компьютерной томографии лёгких.

Табл. 3. Результаты исследования автоматической настройки признаков для задачи распознавания изображений компьютерной томографии лёгких

Алгоритм Лучший Ошибка Значение

оптимизации критерий угла

Случайный поиск Л1 0,07 0,95

Генетический 0,07 2,18

л

алгоритм

Имитация отжига к 0,06 1,75

Полученные оценки вероятности ошибочной классификации (5) ниже, чем в работах [6] и [16]. Однако, как и в предыдущих задачах, существенных преимуществ использования того или иного алгоритма оптимизации не наблюдается.

На рис. 2 изображены графики зависимости достоверности классификации (2), рассчитанной по обучающей выборке методом исключения одного объекта, от угла поворота изображения в радианах. Значения угла поворота на графиках выбирались в ходе алгоритма имитации отжига. Кривые соответствуют

различным наборам биомедицинских изображений. Точки, по которым построен график, были получены в ходе процедуры оптимизации, основанной на алгоритме имитации отжига. Заметно, что для ультразвуковых изображений почек достоверность классификации меняется довольно хаотично, в то время как для рентгеновских изображений шейки бедра и для изображений компьютерной томографии лёгких зависимость выглядит плавной. Для них некоторые диапазоны значений углов лучше, чем другие.

0,96 0,94 0,92' 0,90 0,88 0,86 0,84 0,82 0,80

.А... Л"' '" А. .А Л "'Л'' '•• Л 6...... Л ..... —Л

■•¿У""

А ■

---■ -/• Д/

ч-/ / * -V

/" — Изображения костей 1 Изображения почек Изображения лёгких )

О

0,5 1,0

1,5 2,0 2,5 3,0 3,5 Угол поворота изображения

Рис. 2. Зависимость достоверности классификации от угла поворота изображения в радианах

В среднем для всех трёх задач алгоритм случайного поиска обеспечивает оценку вероятности ошибочной классификации 0,122 при среднем размере эффективной группы признаков 16,5, генетический алгоритм - ошибку 0,123 в среднем при 17,4 признака, а алгоритм имитации отжига - ошибку 0,120 в среднем при 20,7 признака. Среди критериев качества признакового пространства наиболее эффективным в среднем по всем задачам является критерий (3). Он обеспечивает среднюю оценку вероятности ошибочной классификации 0,118 при среднем размере эффективной группы признаков 15,44, что незначительно лучше аналогичных показателей у других критериев качества.

Напоследок приведём полученные оценки вероятности ошибочной классификации с доверительными интервалами Агрести-Коула [17], как это было сделано в [6]. Для изображений костной ткани оценка вероятности ошибочной классификации составляет 0,13± 0,08, для изображений УЗИ почек - 0,19±0,11, а для изображений компьютерной томографии лёгких - 0,08±0,05. Все значения приведены с уровнем доверия а=0,05.

Заключение

В работе поставлена общая задача настройки признаков и на её основе предложен простой практически полезный подход к автоматической настройке направления для направленных текстурных признаков. Этот подход исследован на трёх реальных задачах медицинской диагностики заболеваний по радиологическим изображениям биологических тканей. В результате экспериментов показаны преимущества использования такого подхода, а также найдены наиболее эффективные для этой задачи алгоритмы оптимизации и критерии качества признакового пространства.

Использование автоматической настройки направленных текстурных признаков обеспечивает снижение

оценки вероятности ошибочного распознавания для задачи диагностики рентгеновских изображений костной ткани в два раза (с 0,20 до 0,10). Кроме того, для задачи диагностики изображений компьютерной томографии лёгких ошибка уменьшается на 45 % (с 0,11 до

0.06. по сравнению с использованием обычной процедуры отбора из большого числа разнородных признаков. Это показывает практическую пригодность предложенного подхода для решения задач текстурного анализа биомедицинских изображений.

В ходе экспериментов также показано, что использование сложных алгоритмов оптимизации, таких как генетический алгоритм и алгоритм имитации отжига, не даёт существенных преимуществ по сравнению с простейшим методом случайного поиска. Тем не менее, можно порекомендовать на практике использовать алгоритм имитации отжига, поскольку он обеспечивает среднее значение ошибки распознавания на 2,4 % меньше, чем два других алгоритма.

К сожалению, не просматривается единого наиболее эффективного критерия качества признакового пространства. На практике, вероятно, можно порекомендовать использование критерия дискриминантно-го анализа (3), поскольку он обеспечивает в среднем несколько лучшие показатели ошибки распознавания, хотя на самом деле следовало бы разработать комбинированные критерии или использовать многокритериальную оптимизацию [18].

Также в дальнейшем требуется дополнительно исследовать новый набор данных изображений УЗИ почек, поскольку он продемонстрировал отсутствие повторяемости результатов, полученных в работе [5]. Вероятно, это связано с низким качеством нового набора данных, а также с тем фактом, что разные изображения в нём были получены на разных аппаратах УЗИ с разными настройками.

Благодарности

Работа выполнена при финансовой поддержке гранта РФФИ 14-07-97040-р_поволжье_а и Министерства образования и науки РФ в рамках мероприятий Программы повышения конкурентоспособности СГАУ среди ведущих мировых научно-образовательных центров на 2013-2020 годы.

Литература

1. Rangayyan, R.M. Biomedical image analysis / R.M. Rangayyan. - CRC press, 2004. - 1272 p.

2. Ильясова, Н.Ю. Информационные технологии анализа изображений в задачах медицинской диагностики / Н.Ю. Ильясова, А.В. Куприянов, А.Г. Храмов. - М.: Радио и связь, 2012. - 424 с.

3. Глумов, Н.И. Метод отбора информативных признаков на цифровых изображениях / Н.И. Глумов, Е.В. Мясников // Компьютерная оптика. - 2007. - Т. 31, № 3. - С. 73-76.

4. Гайдель, А.В. Исследование текстурных признаков для диагностики заболеваний костной ткани по рентгеновским изображениям / А.В. Гайдель, С.С. Первушкин // Компьютерная оптика. - 2013. - Т. 37, № 1. - С. 113-119.

5. Гайдель, А.В. Исследование текстурных признаков для диагностики нефрологических заболеваний по ультразвуковым изображениям / А.В. Гайдель, С.Н. Ларионова,

А.Г. Храмов // Вестник Самарского государственного аэрокосмического университета им. академика С.П. Королёва (национального исследовательского университета). -2014. - № 1(43). - С. 229-237.

6. Гайдель, А.В. Возможности текстурного анализа компьютерных томограмм в диагностике хронической об-структивной болезни / А.В. Гайдель, П.М. Зельтер,

A.В. Капишников, А.Г. Храмов // Компьютерная оптика. - 2014. - Т. 38, № 4. - С. 843-850.

7. Neshatian, K. Feature construction and dimension reduction using genetic programming / K. Neshatian, M. Zhang, M. Johnston // Lecture Notes in Computer Science. - 2007. -Vol. 4830. - P. 160-170.

8. Lillywhite, K. A feature construction method for general object recognition / K. Lillywhite, D.-J. Lee, B. Tippetts, J. Archibald // Pattern Recognition. - 2013. - Vol. 46, Issue 12. - P. 3300-3314.

9. Мясников, В. В. Анализ методов построения эффективных линейных локальных признаков цифровых сигналов и изображений / В.В. Мясников, А.Ю. Баврина, О.А. Титова // Компьютерная оптика. - 2010. - Т. 34, № 3. - С. 374-381.

10. Schneider, J.J. Stochastic Optimization / J.J. Schneider, S. Kirkpatrick. - Berlin: Springer, 2006. - 568 p.

11. Gill, Ph. Practical optimization / Ph. Gill, W. Murray, M. Wright. - Academic Press, 1982. - 418 p.

12. Емельянов, В.В. Теория и практика эволюционного моделирования / В.В. Емельянов, В.В. Курейчик,

B.М. Курейчик. - М.: Физматлит, 2003. - 432 с.

13. Optimization by simulated annealing / S. Kirkpatrick,

C.D. Gelatt-Jr, M.P. Vecchi // Science. - 1983. -Vol. 220(4598). - P. 671-680.

14. Fukunaga, K. Introduction to statistical pattern recognition / K. Fukunaga. - Academic Press, 1990. - 592 p.

15. Yang, M. Feature selection and construction for the discrimination of neurodegenerative diseases based on gait analysis / M. Yang, H. Zheng, H. Wang, S. McClean // 3rd International Conference on Pervasive Computing Technologies for Healthcare - Pervasive Health 2009. - London, United Kingdom, 1-3 April, 2009. - 7 p.

16. Ginsburg, S.B. Automated texture-based quantification of centri-lobular nodularity and centrilobular emphysema in chest CT images / S.B. Ginsburg, D.A. Lynch, R.P. Bowler, J.D. Schroeder // Academic Radiology. - 2012. - Vol. 19(10). - P. 1241-1251.

17. Agresti, A. Approximate is Better than "Exact" for Interval Estimation of Binomial Proportions / A. Agresti, B.A. Coull // American Statistician / American Statistical Association.

- 1998. - Vol. 52(2). - P. 119-126.

18. Keeney, R.L. Decisions with Multiple Objectives: Preferences and Value Trade-Offs / R.L. Keeney, H. Raiffa. -Cambridge: Cambridge University Press, 1993. - 569 p.

References

1. Rangayyan, R.M. Biomedical image analysis / R.M. Rangayyan. - CRC press, 2004. - 1272 p.

2. Ilyasova, N.Yu. Information technologies of the image analysis in the medical diagnosis problems / N.Yu. Ilyasova, A.V. Kupriyanov, A.G. Khramov. - Moscow: "Radio I Svyaz" Publisher, 2012. - 424 p. - (In Russian).

3. Glumov, N.I. Method of the informative features selection on the digital images / N.I. Glumov, E.V. Myas-nikov // Computer Optics. - 2007. - Vol. 31(3). - P. 73-76.

- ISSN 0134-2452. - (In Russian).

4. Gaidel, A.V. Research of the textural features for the bony tissue diseases diagnostics using the roentgenograms / A.V. Gaidel, S.S. Pervushkin // Computer Optics. - 2013. -Vol. 37(1). - P. 113-119.

5. Gaidel, A.V. Research of the textural features for the nephrological diseases diagnostics using the ultrasound images / A.V. Gaidel, S.N. Larionova, A.G. Khramov // Her-

ald of the Samara State Aerospace University. - 2014. -Vol. 43(1). - P. 229-237. - ISSN 1998-6629. - (In Russian).

6. Gaidel, A.V. Computed tomography texture analysis possibilities of the chronic obstructive pulmonary disease diagnosis / A.V. Gaidel, P.M. Zelter, A.V. Kapishnikov, A.G. Khramov // Computer Optics. - 2014. - Vol. 38(4). - P. 843-850.

7. Feature construction and dimension reduction using genetic programming / K. Neshatian, M. Zhang, M. Johnston // Lecture Notes in Computer Science. - 2007. - Vol. 4830. - P. 160-170.

8. A feature construction method for general object recognition / K. Lillywhite, D.-J. Lee, B. Tippetts, J. Archibald // Pattern Recognition. - 2013. - Vol. 46, Issue 12. - P. 3300-3314.

9. Myasnikov, V.V. Analysis of methods for construction of efficient linear local features for digital signals and images description / V.V. Myasnikov, A.Y. Bavrina, O.A. Titova // Computer Optics. - 2010. - Vol. 34(3). - P. 374-381. - (In Russian).

10. Schneider, J.J. Stochastic Optimization / J.J. Schneider, S. Kirkpatrick. - Berlin: Springer, 2006. - 568 p.

11. Gill, Ph. Practical optimization / Ph. Gill, W. Murray, M. Wright. - Academic Press, 1982. - 418 p.

12. Emelyanov, V.V. Theory and practice of the evolutionary computation / V.V. Emelyanov, V.V. Kureychik, V.M. Kureychik. -Moscow: "Fismatlit" Publisher, 2003. - 432 p. - (in Russian).

13. Optimization by simulated annealing / S. Kirkpatrick, C.D. Gelatt-Jr, M.P. Vecchi // Science. - 1983. -Vol. 220(4598). - P. 671-680.

14. Fukunaga, K. Introduction to Statistical Pattern Recognition / K. Fukunaga. - Academic Press, 1990. - 592 p.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

15. Yang, M. Feature selection and construction for the discrimination of neurodegenerative diseases based on gait analysis / M. Yang, H. Zheng, H. Wang, S. McClean // 3rd International Conference on Pervasive Computing Technologies for Healthcare - Pervasive Health 2009. - London, United Kingdom, 1-3 April, 2009. - 7 p.

16. Automated Texture-based Quantification of Centrilobular Nodularity and Centrilobular Emphysema in Chest CT Images / S.B. Ginsburg, D.A. Lynch, R.P. Bowler, J.D. Schroeder // Academic Radiology. - 2012. -Vol. 19(10). - P. 1241-1251.

17. Approximate is Better than "Exact" for Interval Estimation of Binomial Proportions / A. Agresti, B.A. Coull // American Statistician / American Statistical Association. - 1998. -Vol. 52(2). - P. 119-126.

18. Keeney, R.L. Decisions with Multiple Objectives: Preferences and Value Trade-Offs / R.L. Keeney, H. Raiffa. -Cambridge: Cambridge University Press, 1993. - 569 p.

A METHOD FOR ADJUSTING DIRECTED TEXTURE FEATURES IN BIOMEDICAL IMAGE ANALYSIS PROBLEMS

A. V. Gaidel Image Processing Systems Institute,

Russian Academy of Sciences Samara State Aerospace University,

Abstract

As part of the general problem of automatic information feature construction, we considered a particular applied problem of the calculation direction adjustment for the directed texture features intended to diagnose various diseases from digital biomedical images. As feature space quality criteria, we considered the classification accuracy, Bhattacharyya distance and the discriminant analysis criteria. We used random search, a genetic algorithm and simulated annealing as the optimization algorithms. The proposed approach enables a two-fold reduction in the error probability estimation when diagnosing bone tissue X-ray images (from 0.20 to 0.10), also enabling a 45-percent error reduction when diagnosing computed tomography (CT) lung images (from 0.11 to 0.06) in comparison with conventional procedures of selecting from a large number of heterogeneous features.

Keywords: texture analysis, feature construction, discriminant analysis, genetic algorithm, simulated annealing.

Сведения об авторе

Гайдель Андрей Викторович, 1989 года рождения, в 2012 году с отличием окончил Самарский государственный аэрокосмический университет имени академика С. П. Королёва по направлению «Прикладная математика и информатика», работает инженером НИЛ-35 СГАУ и стажёром-исследователем в Институте систем обработки изображений РАН. Область научных интересов: компьютерная обработка изображений, теория распознавания образов, математическое моделирование, теория алгоритмов.

E-mail: andrey.gaidel@gmail. com.

Andrey Viktorovich Gaidel (b. 1989) graduated with honors from Samara State Aerospace University in 2012, majoring in Applied Mathematics and Informatics. Engineer of SRL-35 laboratory of Samara State Aerospace University, intern researcher of the Image Processing Systems Institute of the Russian Academy of Sciences. Research interests are currently focused on computer image processing, pattern recognition, mathematical modeling and theory of computation.

Поступила в редакцию 23марта 2015 г. Окончательный вариант - 10 апреля 2015 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.