Научная статья на тему 'Отбор признаков для задачи диагностики остеопороза по рентгеновским изображениям шейки бедра'

Отбор признаков для задачи диагностики остеопороза по рентгеновским изображениям шейки бедра Текст научной статьи по специальности «Математика»

CC BY
252
30
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Компьютерная оптика
Scopus
ВАК
RSCI
ESCI
Область наук
Ключевые слова
текстурный анализ / отбор признаков / компьютерная диагностика / остеопороз / линейный классификатор / полиномиальные признаки / texture analysis / feature selection / computer-aided diagnosis / osteoporosis / linear classifier / polynomial features

Аннотация научной статьи по математике, автор научной работы — Гайдель Андрей Викторович, Крашенинников Виктор Ростиславович

В работе анализируется информативность нескольких признаков текстуры рентгеновских изображений костной ткани для компьютерной диагностики остеопороза. Описываются четыре эвристических признака, также рассматривается тринадцать согласованных квадратичных признаков, описанных ранее. Решается задача выбора минимального набора из этих признаков, достаточного для линейной разделимости векторов признаков из обучающей выборки в соответствующем признаковом пространстве. В ходе вычислительных экспериментов установлено, что этому условию удовлетворяет набор из четырёх эвристических признаков, а также набор из трёх квадратичных признаков и одного из эвристических признаков.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Гайдель Андрей Викторович, Крашенинников Виктор Ростиславович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Feature selection for diagnosing the osteoporosis by femoral neck X-ray images

We analyzed the quality of a number of features describing the texture of digital X-ray images of the bone tissue for the computer-aided diagnosis of the osteoporosis. We introduced four heuristic features, also considering thirteen adjusted quadratic features described in a previous paper. We solved a problem of selecting the smallest feature subset in order to provide the linear separability We analyzed the quality of a number of features describing the texture of digital X-ray images of the bone tissue for the computer-aided diagnosis of the osteoporosis. We introduced four heuristic features, also considering thirteen adjusted quadratic features described in a previous paper. We solved a problem of selecting the smallest feature subset in order to provide the linear separability

Текст научной работы на тему «Отбор признаков для задачи диагностики остеопороза по рентгеновским изображениям шейки бедра»

ОТБОР ПРИЗНАКОВ ДЛЯ ЗАДАЧИ ДИАГНОСТИКИ ОСТЕОПОРОЗА ПО РЕНТГЕНОВСКИМ ИЗОБРАЖЕНИЯМ ШЕЙКИ БЕДРА

А.В. Гайдель1,2, В.Р. Крашенинников3

1 Самарский национальный исследовательский университет имени академика С.П. Королева, Самара, Россия, 2 Институт систем обработки изображений РАН - филиал ФНИЦ «Кристаллография и фотоника» РАН, Самара, Россия, 3 Ульяновский государственный технический университет, Ульяновск, Россия

Аннотация

В работе анализируется информативность нескольких признаков текстуры рентгеновских изображений костной ткани для компьютерной диагностики остеопороза. Описываются четыре эвристических признака, также рассматривается тринадцать согласованных квадратичных признаков, описанных ранее. Решается задача выбора минимального набора из этих признаков, достаточного для линейной разделимости векторов признаков из обучающей выборки в соответствующем признаковом пространстве. В ходе вычислительных экспериментов установлено, что этому условию удовлетворяет набор из четырёх эвристических признаков, а также набор из трёх квадратичных признаков и одного из эвристических признаков.

Ключевые слова: текстурный анализ, отбор признаков, компьютерная диагностика, осте-опороз, линейный классификатор, полиномиальные признаки.

Цитирование: Гайдель, А.В. Отбор признаков для задачи диагностики остеопороза по рентгеновским изображениям шейки бедра / А.В. Гайдель, В.Р. Крашенинников // Компьютерная оптика. - 2016. - Т. 40, № 6. - С. 939-946. - Б01: 10.18287/2412-6179-2016-40-6-939-946.

Введение

Остеопороз - системное заболевание костной ткани, ранняя диагностика которого позволяет предотвратить переломы костей, ведущие к инвалидности. Традиционно для диагностики используются устройства, измеряющие минеральную плотность костной ткани, однако из-за их редкости предлагаются альтернативные методы диагностики. Один из них состоит в автоматизированном распознавании остеопо-роза на обычных рентгеновских снимках костной ткани, например, шейки бедра [1]. Поэтому актуальной является рассматриваемая в настоящей работе задача разработки алгоритмов такого распознавания.

Кости, поражённые остеопорозом, имеют меньшую минеральную плотность по сравнению со здоровыми костями, они более проницаемы для рентгеновских лучей. Поэтому рентгеновское изображение поражённой кости (рис. 1б) выглядит темнее, а трабекулы на нём более редкие и нитевидные по сравнению с изображением костной ткани здорового человека (рис. 1 а).

Особенности задачи анализа цифровых рентгеновских изображений костной ткани подробно описаны в работе [2]. Основным результатом работы [2] является достижение вероятности ошибочной классификации 0,20 при использовании корреляционных признаков совместно с признаками Харалика. Эти результаты были улучшены за счёт использования согласованных полиномиальных признаков [3]. Оценка вероятности ошибочной классификации при таком подходе составила 0,06.

В обеих указанных выше работах производился отбор из достаточно большого количества признаков: в [2] для этого использовался алгоритм жадного добавления признаков в порядке возрастания индивидуальных значений функционала качества, а в [3] - подбор параметров у параметрического семейства признаков. Нужно отметить, что в случае небольшого конечного числа признаков можно использовать обычный перебор всех подмножеств признаков, как это сделано в [4].

Рис. 1. Рентгеновские изображения шейки бедра: здорового человека (а), поражённой остеопорозом (б)

Некоторые морфометрические параметры изображений компьютерной томографии позвонков изучались в [5]. Полученные в этой работе коэффициенты корреляции между параметрами, оцененными по

изображениям, и параметрами гистоморфометрии трабекулярной части костной ткани составили от 0,71 до 0,76. В [6] рентгеновские изображения костной ткани анализируются с помощью фрактального параметра. Коэффициент корреляции этого параметра с радиальным количеством трабекул составил 0,47.

Существует множество известных признаков различного рода, подходящих для описания широкого класса изображений. Многие из них можно найти, например, в таких изданиях, как [7] и [8]. Однако часто для конкретных задач специально подобранные эвристические признаки могут оказаться более эффективными, чем широко распространённые универсальные признаки.

Например, в работе [9] эвристический признак, называемый анизотропией, был использован для обнаружения маркёров на изображениях фаций сыворотки крови. Другой признак, основанный на операторе Лапласа, был использован в работе [10] для совмещения изображений методом неподвижной точки. Имеются основания использовать эти признаки также и для анализа цифровых изображений костной ткани.

Таким образом, основная цель настоящей работы состоит в выборе набора из множества рассматриваемых признаков, обеспечивающего линейную разделимость выборки в соответствующем признаковом пространстве. Выбор производится из полиномиальных признаков работы [3] и четырёх эвристических признаков, описанных ниже.

1. Постановка задачи

Можно считать, что двумерные рентгеновские изображения представляют собой функции

ю (х, у): ® Я+, отображающие координату (х, у )е с Я2 на значение интенсивности рентгеновского излучения в этой точке. Здесь под Я понимается множество вещественных чисел, а под Я+ = (хеЯ | х > 0} - множество неотрицательных вещественных чисел. Однако в процессе оцифровки эти функции подвергаются процедурам дискретизации и квантования [11], так что компьютерной обработке подвергаются дискретные изображения

ю (тИх, пку

w( m, n) =

hw

I 1

- + —

2

где кх и ку - шаги дискретизации по соответствующим координатам, а кш - шаг квантования.

Дискретные изображения ю(т, п) : Бю ® О отображают некоторую область интереса Бю с Z2, включающую шейку бедра, на множество из Q уровней яркости О = [0; Q - 1] п Z. Здесь под Z понимается множество целых чисел. Обозначим всё множество возможных изображений О.

Эти изображения разбиты на два класса: изображения здоровой костной ткани О0 и изображения костной ткани, поражённой остеопорозом, Оь Подразумевается, что О0 п О: = 0 и О0 и О1 = О. Для опре-

делённости можно обозначить идеальный оператор распознавания Ф(ю) : Q ® { Qo, Qi}. Этот оператор переводит изображение в его класс.

Решить задачу распознавания означает построить оператор Ф(ю): П ®{П0,Ц} , который также переводит изображение в его класс, но при этом не владеет информацией обо всех возможных изображениях. На практике обычно для построения этого оператора можно использовать лишь конечную обучающую выборку U с Q, для каждого изображения из которой известен его класс.

В действительности оператор Ф (ю) обычно строится как суперпозиция

Ф (ю) = C (Y(w)),

где Y(w) : Q ® х - оператор вычисления признаков, который переводит изображение ю(т, n) в вектор признаков х е х, а C(x) : х ® { Qo, Qi} - классификатор, переводящий вектор признаков в его класс. Множество всех возможных векторов признаков х называется признаковым пространством. На практике признаки обычно числовые, так что х с R^, где K -количество признаков.

Правильный выбор оператора вычисления признаков Y(w), а значит, и признакового пространства х может существенно повысить качество распознавания. В настоящей работе критерием качества признакового пространства считается линейная разделимость векторов признаков Y(w) для изображений из обучающей выборки. Множество векторов Y(w) для ю е U называется линейно разделимым в пространстве х с R^, если в этом пространстве существует гиперплоскость, такая что векторы признаков из разных классов лежат по разные стороны от неё, то есть

$wе RK 3w0 е R"ю1,ю2 е U : Ф(ю1) = Ф(ю2) ^

wT Y(wi) + w0)(wT Y(w2) + w0 )> 0.

В случае линейной разделимости вообще всех возможных векторов признаков даже простейшие линейные классификаторы могут безошибочно выполнять распознавание всех возможных изображений.

В настоящей работе рассматривается множество из нескольких признаков. Задачей является определение небольшого набора из них, достаточного для эффективной классификации имеющихся рентгеновских изображений.

2. Эвристические признаки

Анизотропия

На изображении поражённой кости трабекулы располагаются реже, чем на изображении здоровой кости (рис. i). Около них окружающий фон темнее. Поэтому изображение больной кости более анизотропно: яркость в перпендикулярном к трабекуле направлении изменяется значительно быстрее, чем у здоровой кости.

В качестве показателя анизотропии по направлению орта ei = (cos a, sin a) принимается максимальное из от-

ношений средних модулей производных по этому орту и перпендикулярному ему орту в2=(- sin a, cos a):

A (a) = max (G (a) / G2 (a), G2 (a) / Gl (a)), (1)

где

Gk (a) = (1/|Da\) X Nm,n)/=

(m,n)EDw

= (1/|Dm|) X |V®(m,«)'e*| .

(m,«)eDw

Здесь jDwj - количество элементов в конечном множестве Dw, «•» - знак скалярного произведения. Заменяя производные по направлениям конечными разностями и вводя угол a между ортом e1 и осью абсцисс, получаем

G1 (a) = n~| X |(®(m +1,n) —w(m,n))cosa +

ш | (m.n)eDw

+ (w( m, и +1) — w( m, и)) sin a|, G2 (a) = j~[ X |—(w(m +1,n) — w(m,n))sina +

(m,n)e Dw

+ (w(m, n +1) —w(m, n)) cos a .

Анизотропия (1) зависит от угла а, поэтому показателем анизотропии изображения выбирается наибольшее её значение

A = sup A (a).

ae[0;p]

(2)

Можно ожидать, что у больных костей анизотропия (2) больше, чем у здоровых костей. В работе [9] этот признак был использован для обнаружения маркёров на изображениях фаций сыворотки крови.

Области постоянной яркости

На больной кости имеется много поражённых участков, поэтому яркость изображения быстро изменяется, а области постоянства яркости значительно мельче, чем на изображении здоровой кости (рис. 1). В качестве характеристики этой особенности изображений принимается средняя площадь (количество отсчётов) кластеров постоянной яркости:

Р = |Ят|/к(ш), (3)

где к(ш) - количество связанных областей постоянной яркости на изображении ш(т, п). Можно предположить, что значение признака (3) у поражённых остеопорозом костей меньше.

Вариация

Визуально заметно, что яркость на изображении поражённой остеопорозом кости варьируется в целом сильнее, чем на изображении здоровой кости (рис. 1). Это качество можно численно оценить средней вариацией

V = (1/|Dw)) X Мm,n)| =

(rn,n)eDw

= (1/1Dw|) X VVw(m,n)• Vw(m,n),

(rn,n)e Dw

(4)

где

Уш( т, п) • Уш( т, п) = (ш( т +1, п ) —ш( т, п ))2 + + (ш( т, п +1) — ш( т, п ))2.

Величина (4) пропорциональна средней яркости изображения, что нежелательно, так как эта средняя яркость зависит от длительности экспозиции и других условий получения рентгенограмм. Поэтому предлагается нормировать (4) величиной средней яркости:

(5)

V = VT /w,

где

ш = (1/|£>ш |) X ш(т, п) - средняя яркость.

(т,и)ЕВш

Следует ожидать, что на изображениях поражённых остеопорозом костей значение признака (5) больше, чем на изображениях здоровых костей. Лапласиан

Оператор Лапласа

N N д2ш (X, у) Э2ш (х, у)

Дш(х, у) = У2ш (х, у) = —+ - У '

Эх2

Эу2

равен нулю для гармонических функций, то есть он отражает меру отличия свойств функции от свойств гармонических функций. Уравнению Лапласа Дш (х, у ) = 0 соответствует, например, стационарное

распределение температур пластины. Отличие лапласиана от нуля отражает наличие динамики. Можно предположить, что развитие патологического процесса в костях приводит к отличию лапласиана рентгенограммы от нуля.

Рассмотрим характеристику изображения

L = (1/w|Dw|) X |А®(m,n)| =

(rn,n)eDffl

= 1/W|Dwl) X

К")6-0«

(m,n

(m,n) +w^' (m,n)

(6)

то есть средний модуль значений оператора Лапласа, нормированный на среднюю яркость, где вторые производные заменены конечными разностями:

w

w

(m, n) = w( m — 1, n) — 2w( m, n) +w( m +1, n), (m, n) = w( m, n — 1) — 2w( m, n) + w( m, n +1).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Можно предположить, что значение признака (6) выше для изображений поражённых остеопорозом костей, чем для изображений здоровых костей. Подробное описание результатов использования похожего признака для совмещения изображений методом неподвижной точки можно найти в работах [10, 12].

3. Экспериментальные исследования

Материалы исследования

Материалом для исследования послужила выборка из 30 реальных рентгеновских изображений шейки бедра, полученных в ходе клинического обследова-

ния пациентов в клиниках Самарского государственного медицинского университета. Из них на 19 изображениях представлены кости, поражённые остеопо-розом. Изображения были оцифрованы с помощью транспарентного сканера в разрешении 400 точек на дюйм, то есть примерно 16 линий на миллиметр. Количество уровней яркости Q = 256. Для каждого изображения из выборки квалифицированными медицинскими работниками на основании множества факторов было принято решение о наличии либо отсутствии остеопороза. Средний размер изображений -1040 х 860 отсчётов.

На каждом изображении вручную была выделена область интереса, включающая только шейку бедра. Для каждого изображения были вычислены значения четырёх признаков, описанных в предыдущем разделе, а также тринадцати квадратичных признаков, описанных в работе [3]. Квадратичные признаки были согласованы с обучающей выборкой из работы [3], а не с выборкой, на которой проводится исследование в этой работе. В дальнейшем для различных подмножеств признаков определялось, существует ли в соответствующем признаковом пространстве гиперплоскость, безошибочно разделяющая векторы признаков из различных классов. Наличие такой гиперплоскости само по себе свидетельствует о качестве соответствующего признакового пространства.

Индивидуальная разделяющая способность признаков

В первую очередь была изучена индивидуальная разделяющая способность каждого эвристического признака. Линейный классификатор в одномерном случае представляет собой обычный порог, такой что решения об отнесении объекта к тому или иному классу принимаются в зависимости от того, по какую сторону от этого порога находится значение признака. Значение порога для каждого признака было определено простым подбором с целью минимизировать количество ошибок при классификации исходной выборки соответствующим пороговым классификатором.

В табл. 1 приведены средние значения и средне-квадратические отклонения четырёх приведённых в настоящей статье признаков для каждого класса изображений из исходной выборки. Видно, что соображения о связи между классами и значениями этих признаков подтверждаются.

Табл. 1. Средние значения и среднеквадратичные отклонения признаков для каждого класса

Признак Без патологий Остеопороз

Среднее СКО Среднее СКО

А 1,06 0,06 1,15 0,09

Р 6,59 1,23 4,63 1,23

V 0,04 0,01 0,06 0,04

Ь 0,06 0,01 0,11 0,06

В табл. 2 приведены результаты исследования индивидуальной разделяющей способности четырёх описанных во втором параграфе эвристических признаков. Для каждого признака приведено значение порога, обеспечивающего наилучшую разделимость векторов из обучающей выборки, наименьшее число

объектов, оказавшихся не по ту сторону от порога, а также доля от общего числа объектов обучающей выборки, классифицированных правильно. Видно, что наилучшие индивидуальные результаты показывает признак, основанный на операторе Лапласа, но ни один из признаков сам по себе не обеспечивает линейную разделимость обучающей выборки в соответствующем одномерном признаковом пространстве. Этого и следовало ожидать, учитывая соотношения между средними значениями и СКО из табл. 1.

Табл. 2. Индивидуальная разделяющая способность

эвристических признаков

Признак Порог Число ошибок Достоверность

А 1,100 7 0,77

Р 6,000 5 0,83

V 0,034 6 0,80

Ь 0,064 4 0,87

Исследование пар признаков

Далее исследовались признаковые пространства, образованные различными парами из этих четырёх эвристических признаков. Например, интерес представляет распределение векторов признаков из обучающей выборки в двумерном признаковом пространстве, образованном признаками А и Р. Как можно судить из рис. 2, в таком пространстве существует прямая, разделяющая векторы признаков из обучающей выборки, так что векторы из разных классов лежат по разные стороны от этой прямой, и при этом совершается лишь 4 ошибки: по две в каждую сторону. Эта прямая имеет уравнение Р = 10Г - 4,5 и была выбрана Ь 0,100,090,080,070,060,050,040,01 0,02 0,03 0,04 0,05 0,06 V Рис. 2. Выборка в пространстве признаков, основанных на анизотропии и областях постоянной яркости

На рис. 3 показано распределение векторов признаков из обучающей выборки в двумерном признаковом пространстве, образованном признаками V и Ь. Как видно, в этом пространстве можно провести прямую Ь = 1,027А + 0,293, отличающуюся тем, что она разделяет векторы признаков из разных классов так, что всего четыре изображения здоровой костной ткани оказываются по ту же сторону от этой прямой, что и изображения костной ткани, поражённой остеопо-розом. Нужно отметить, что с таким же успехом можно использовать один только признак Ь (это видно и из рис. 3, и из табл. 2).

эвристически.

Рис. 3. Выборка в пространстве признаков, основанных на вариации и операторе Лапласа

Линейный классификатор по комбинациям признаков с обучающей выборкой

Не слишком корректно оценивать количество ошибок классификации на той же выборке, по которой строилась разделяющая поверхность, поэтому для дальнейшего исследования было решено разбить исходную выборку на обучающую и контрольную. В обучающую выборку были случайным образом включены шесть изображений здоровых костей и девять изображений костей, поражённых остеопорозом, остальные изображения составили контрольную выборку.

Для диагностики был использован линейный классификатор, построенный следующим образом. По обучающей выборке определялись выборочные средние значения векторов каждого класса, а гиперплоскость проводилась перпендикулярно прямой, соединяющей эти средние, через точку на этой линии, обеспечивающую классификацию с наименьшим количеством ошибок на обучающей выборке. Далее обученный классификатор применялся к контрольной выборке. Перебирались все 15 непустых комбинаций из четырёх эвристических признаков.

В табл. 3 приведены результаты исследования эффективности всех различных непустых комбинаций эвристических признаков с использованием обучающей и контрольной выборок. Наилучшей комбинацией признаков при таком подходе можно считать пару признаков А и V, которые обеспечивают наименьшее количество ошибок на контрольной выборке. Однако оценивать вероятность ошибочной классификации по такой небольшой выборке было бы не вполне корректно. Кроме того, изменение состава обучающей выборки и контрольной выборки существенно влияло на построенный классификатор и на количество ошибок. Так или иначе, средняя доля неверно распознанных изображений по всем комбинациям признаков составила 0,15.

Исследование признакового пространства, включающего все четыре признака

Далее в ходе исследования предпринимались попытки выяснить, существует ли в четырёхмерном пространстве из четырёх эвристических признаков, описанных во втором параграфе, гиперплоскость, безошибочно разделяющая векторы признаков из разных классов для всей исходной выборки.

Табл. 3. Результаты исследования эффективности комбинаций эвристических признаков

Признаки Число ошибок Число ошибок

на обучающей выборке на контрольной выборке

A 2 3

P 2 2

V 4 2

L 2 3

A, P 0 2

A, V 1 1

A, L 2 3

P, V 3 2

P, L 2 3

V, L 2 2

A, P, V 0 2

A, P, L 1 3

A, V, L 2 3

P, V, L 2 2

A, P, V, L 2 2

В среднем 1,8 2,3

Искомая гиперплоскость имеет вид T = CjA + с2Р + c3V+ c4 L = c • x, (7)

где T e R - искомое пороговое значение, c e R4 - вектор искомых коэффициентов перед соответствующими значениями признаков, x e х - вектор признаков. В качестве векторов весов c предлагается перебирать орты

c = cos a, c2 = sin a cos b, c3 = sin a sin b cos g, c4 = sin a sin b sin g.

Углы a, в и у определяют направление орта, который является нормалью к разделяющей гиперплоскости в пространстве признаков. В этом случае значение T из формулы (7) является проекцией вектора признаков x на нормаль c.

Углы a, в и у перебирались с шагом h = p / 20, причём для a перебирались значения от - 10h до 9h, а b и g - от 0h до 39h. Таким образом, общее количество комбинаций составило 3200. Для каждого вектора из обучающей выборки вычислялось значение T по формуле (7) и перебиралось значение порога, находящегося между очередными значениями T, как в одномерном случае.

Оптимальным оказался весовой вектор

c = (0,309; —0,149; —0,760;0,552),

который обеспечивает безошибочное разделение всех векторов признаков из исходной выборки, такое что векторы признаков из разных классов находятся по разные стороны от соответствующей гиперплоскости.

Исследование эвристических признаков совместно с согласованными квадратичными признаками

Наконец, была исследована эффективность совместного использования четырёх эвристических признаков и 13 квадратичных признаков, согласованных

с обучающей выборкой из работы [3], то есть всего 17 признаков. В процессе исследования перебирались все (217 - 1) непустых комбинаций из этих признаков, и для каждого признакового пространства определялось, существует ли в нём гиперплоскость, безошибочно разделяющая векторы признаков из исходной выборки, состоящей из всех 30 изображений. Для построения разделяющей гиперплоскости использовался классический метод опорных векторов, описанный ещё в [13].

На рис. 4 для примера показано распределение векторов признаков из обучающей выборки в двумерном признаковом пространстве, образованном согласованным квадратичным признаком, обозначенным Я, и признаком Р, основанным на областях постоянной яркости. Видно, что в этом пространстве можно провести прямую, разделяющую векторы признаков из исходной выборки, так что только четыре из них оказываются не по ту сторону от этой прямой: по два вектора из каждого класса. По качеству это пространство похоже на пространство из признаков А и Р, для которого распределение исходной выборки показано на рис. 2. Конечно, в этом пространстве исходная выборка не является линейно разделимой, но при использовании ещё двух других согласованных квадратичных признаков совместно с этими двумя можно получить четырёхмерное признаковое пространство, в котором векторы признаков из исходной выборки являются линейно разделимыми.

В результате исследования были установлены следующие факты.

1. Существуют четырёхмерные признаковые пространства, в которых векторы признаков из исходной выборки являются линейно разделимыми.

Рис. 4. Выборка в пространстве из согласованного квадратичного признака и признака, основанного на областях постоянной яркости

2. Не существует никаких признаковых пространств меньшей размерности, составленных из рассмотренных признаков, в которых векторы признаков из исходной выборки являются линейно разделимыми.

3. Векторы признаков из исходной выборки являются линейно разделимыми в пространстве из четырёх эвристических признаков, описанных в первом параграфе настоящей работы.

4. Векторы признаков из исходной выборки являются линейно разделимыми в пространстве из трёх согласованных квадратичных признаков и признака Р, основанного на областях постоянной яркости.

5. Ни в каком признаковом пространстве, состоящем только из рассмотренных согласованных квадратичных признаков, векторы признаков из обучающей выборки не являются линейно разделимыми.

Заключение

В работе исследовались эвристические признаки, из которых два уже использовались ранее для других задач, а два других предложены впервые. Рассматривались различные признаковые пространства, образованные предложенными эвристическими признаками совместно с согласованными квадратичными признаками, и для каждого признакового пространства выяснялось, существует ли гиперплоскость, разделяющая векторы из обучающей выборки. Для построения гиперплоскости использовались как эвристические приёмы в простых случаях, так и метод опорных векторов в более общих случаях.

В результате было установлено, что в признаковом пространстве из четырёх эвристических признаков исходная выборка является линейно разделимой, то есть векторы признаков разных классов из исходной выборки находятся по разные стороны от разделяющей гиперплоскости. Этим же свойством отличается признаковое пространство, состоящее из трёх согласованных квадратичных признаков и эвристического признака, основанного на доле областей постоянной яркости. При этом ни в каком пространстве из трёх рассмотренных признаков исходная выборка уже не является линейно разделимой. То же относится и к любому пространству, образованному только согласованными квадратичными признаками. Если считать разделяющую гиперплоскость линейным классификатором и предположить, что безошибочная разделимость масштабируется на выборки больших объёмов, то можно заключить, что полученные результаты качества классификации превосходят соответствующие результаты, полученные в работах [2] и [3].

В целом проведённое исследование показывает, что рассмотренные признаки являются достаточно информативными, и из них можно выбрать небольшой набор, обеспечивающий достаточно эффективную диагностику остеопороза по рентгеновским изображениям костных тканей.

Благодарности

Работа выполнена при поддержке грантов РФФИ 14-07-97040-р_поволжье_а, 16-41-630761 р_а и 16-41732041, а также Министерства образования и науки РФ в рамках мероприятий Программы повышения конкурентоспособности Самарского университета среди ведущих мировых научно-образовательных центров на 2013-2020 годы и Программы фундаментальных исследований ОНИТ РАН «Биоинформатика, современные информационные технологии и математические методы в медицине».

Литература

1. Рейнберг, С.А. Рентгенодиагностика заболеваний костей и суставов / С.А. Рейнберг. - М.: Медицина, 1964. - Т. 1. - 530 с.

2. Гайдель, А.В. Исследование текстурных признаков для диагностики заболеваний костной ткани по рентгеновским изображениям / А.В. Гайдель, С.С. Первушкин // Компьютерная оптика. - 2013. - Т. 37, № 1. - С. 113-119.

3. Гайдель, А.В. Согласованные полиномиальные признаки для анализа полутоновых биомедицинских изображений / А.В. Гайдель // Компьютерная оптика. - 2016. -Т. 40, № 2. - С. 232-240. - DOI: 10.18287/2412-61792016-40-2-232-239.

4. Ильясова, Н.Ю. Формирование признаков для повышения качества медицинской диагностики на основе методов дискриминантного анализа / Н.Ю. Ильясова,

A.В. Куприянов, Р.А. Парингер // Компьютерная оптика. - 2014. - Т. 38, № 4. - С. 851-855.

5. Килина, О.Ю. Оценка микроархитектоники костной ткани путем цифрового анализа компьютерных томограмм для диагностики остеопороза / О.Ю. Килина,

B.Д. Завадовская, Р.В. Данильчук, Е.М. Третьяков, О.В. Родионова, О.В. Баранова // Бюллетень сибирской медицины. - 2003. - № 2. - С. 94-100.

6. Bacchetta, J. Assessment of bone microarchitecture in chronic kidney disease: A comparison of 2D bone texture analysis and high-resolution peripheral quantitative computed tomography at the radius and tibia / J. Bacchetta, S. Boutroy, N. Vilayphiou, A. Fouque-Aubert, P.D. Delmas, E. Lespessailles, D. Fouque, R. Chapurlat // Calcified Tissue International. - 2010. - Vol. 87(5). - P. 385-391. -DOI: 10.1007/s00223-010-9402-z.

Сведения об авторах

Гайдель Андрей Викторович, 1989 года рождения, кандидат технических наук, в 2012 году окончил Самарский государственный аэрокосмический университет имени академика С.П. Королёва по направлению «Прикладная математика и информатика», в 2015 году защитил кандидатскую диссертацию. Работает ассистентом кафедры технической кибернетики Самарского университета и стажёром-исследователем в Институте систем обработки изображений РАН - филиале ФНИЦ «Кристаллография и фотоника» РАН. Область научных интересов: компьютерная обработка изображений, теория распознавания образов, интеллектуальный анализ данных, теория алгоритмов. E-mail: [email protected] .

Крашенинников Виктор Ростиславович, 1945 года рождения, в 1967 году окончил Казанский государственный университет по специальности «Вычислительная математика», доктор технических наук (1996), профессор, заведующий кафедрой прикладной математики и информатики Ульяновского государственного технического университета, имеет более 300 научных публикаций по анализу случайных процессов и изображений. E-mail: kvrulstu@,mail. ru.

ГРНТИ 28.23.15

Поступила в редакцию 29 августа 2016 г. Окончательный вариант - 1 ноября 2016 г.

FEATURE SELECTION FOR DIAGNOZING THE OSTEOPOROSIS BY FEMORAL NECK X-RAY IMAGES

A.V. Gaidel12, V.R. Krasheninnikov 3 1 Samara National Research University, Samara, Russia, 2 Image Processing Systems Institute of RAS, - Branch of the FSRC "Crystallography and Photonics " RAS, Samara, Russia,

3 Ulyanovsk State Technical University, Ulyanovsk, Russia

Abstract

We analyzed the quality of a number of features describing the texture of digital X-ray images of the bone tissue for the computer-aided diagnosis of the osteoporosis. We introduced four heuristic features, also considering thirteen adjusted quadratic features described in a previous paper. We solved a problem of selecting the smallest feature subset in order to provide the linear separability

7. Визильтер, Ю.В. Обработка и анализ изображений в задачах машинного зрения / Ю.В. Визильтер, С.Ю. Желтов, А.В. Бондаренко, М.В. Ососков, А.В. Моржин. - М.: Физматкнига, 2010. - 672 с. - ISBN: 978-5-89155-201-2.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8. Ильясова, Н.Ю. Информационные технологии анализа изображений в задачах медицинской диагностики / Н.Ю. Ильясова, А.В. Куприянов, А.Г. Храмов. - М.: Радио и связь, 2012. - 424 с. - ISBN: 5-89776-014-4.

9. Krasheninnikov, V.R. Identification of pectinate structures in images of blood serum facia / V.R. Krasheninnikov, A.S. Kopylova // Pattern Recognition and Image Analysis. -2011. - Vol. 21(3). - P. 508-510. - DOI: 10.1134/S1054661811020623.

10. Krasheninnikov, V.R. Estimating parameters of interframe geometric transformation of an image sequence by the fixed point method / V.R. Krasheninnikov, M.A. Potapov // Pattern Recognition and Image Analysis. - 2010. - Vol. 20(3). - P. 316-323. - DOI: 10.1134/S1054661810030077.

11. Методы компьютерной обработки изображений / М.В. Гашников, Н.И. Глумов, Н.Ю. Ильясова, В.В. Мясников, С.Б. Попов, В.В. Сергеев, В.А. Сойфер, А.Г. Храмов, А.В. Чернов, В.М. Чернов, М.А. Чичёва, В.А. Фурсов; под ред. В.А. Сойфера. - 2-е изд., испр. - М.: Физ-матлит, 2003. - 784 с. - ISBN: 5-9221-0270-2.

12. Васильев, К.К. Статистический анализ изображений / К.К. Васильев, В.Р. Крашенинников. - Ульяновск: Ул-ГТУ, 2014. - 214 с. - ISBN: 5-8946-234-6.

13. Вапник, В.Н. Теория распознавания образов (статистические проблемы обучения) / В.Н. Вапник, А.Я. Черво-ненкис. - М.: Наука, 1974. - 416 с.

of the feature vectors from the learning sample in the corresponding feature space. During the experimental studies we found that the subset of four heuristic features fulfils the separability condition as well as the subset including three quadratic features and one heuristic feature does.

Keywords: texture analysis, feature selection, computer-aided diagnosis, osteoporosis, linear classifier, polynomial features.

Citation: Gaidel AV, Krasheninnikov VR. Feature selection for diagnosing the osteoporosis by femoral neck X-ray images. Computer Optics 2016; 40(6): 939-946. DOI: 10.18287/2412-61792016-40-6-939-946.

Acknowledgements: The work was partially funded by the Russian Foundation of Basic Research (grants 14-07-97040-p_noBO^®be_a, 16-41 -630761 p_a and 16-41-732041), the Russian Federation Ministry of Education and Science as part of Samara University's com-petitiveness enhancement program in 2013-2020 and the RAS basic research program "Bio-informatics, modern information technologies and mathematical methods in medicine".

References

[1] Reinberg SA. X-ray diagnosis of diseases of bones and joints [In Russian]. Moscow: "Medicine" Publisher; 1964.

[2] Gaidel AV, Pervushkin SS. Research of the textural features for the bony tissue diseases diagnostics using the roentgenograms. Computer Optics 2013; 37(1): 113-119.

[3] Gaidel AV. Matched polynomial features for the analysis of grayscale biomedical images. Computer Optics 2016; 40(2): 232-240. DOI: 10.18287/2412-6179-2016-40-2-232-239.

[4] Ilyasova NYu, Kupriyanov AV, Paringer RA. Formation of features for improving the quality of medical diagnosis based on discriminant analysis methods. Computer Optics 2014; 38(4): 851-855.

[5] Kilina OYu, Zavadovskaya VD, Danilchuk RV, Tretyakov YeM, Rodionova OV, Baranova OV. Assessment of bone tissue architectonics with digital analysis of computed tomograms for osteoporosis diagnostics [In Russian]. Bulletin of Siberian Medicine 2003; 2: 94-100.

[6] Bacchetta J, Boutroy S, Vilayphiou N, Fouque-Aubert A, Delmas PD, Lespessailles E, Fouque D, Chapurlat K. Assessment of bone microarchitecture in chronic kidney disease: A comparison of 2D bone texture analysis and highresolution peripheral quantitative computed tomography at the radius and tibia. Calcif Tissue Int 2010; 87(5): 385391. - DOI: 10.1007/s00223-010-9402-z.

[7] Vizilter YuV, Zheltov SYu, Bondarenko AV, Ososkov MV, Morzhin AV. Image processing and analysis in ma-

chine vision problems [In Russian]. Moscow: "Fizmatkni-ga" Publisher; 2010. ISBN: 978-5-89155-201-2.

[8] Ilyasova NYu, Kupriyanov AV, Khramov AG. Information technologies of the image analysis in the medical diagnosis problems [In Russian]. Moscow: "Radio and Svyaz" Publisher; 2012. ISBN: 5-89776-014-4.

[9] Krasheninnikov VR, Kopylova AS. Identification of pectinate structures in images of blood serum facia. Pattern Recognition and Image Analysis 2011; 21(3): 508-510. DOI: 10.1134/S1054661811020623.

[10] Krasheninnikov VR, Potapov MA. Estimating parameters of interframe geometric transformation of an image sequence by the fixed point method. Pattern Recognition and Image Analysis 2010; 20(3): 316-23. DOI: 10.1134/S1054661810030077.

[11] Soifer VA, ed, Gashnikov MV, Glumov NI, Ilyasova NYu, Myasnikov VV, Popov SB, Sergeev VV, Khramov AG, Chernov AV, Chernov VM, Chicheva MA, Fursov VA. Methods for computer image processing [In Russian]. Moscow: "Fizmatlit"; 2003. ISBN: 5-9221-0270-2.

[12] Vassiliev KK, Krasheninnikov VR. Statistical analysis of images [In Russian]. Ulyanovsk: "UlSTU" Publisher; 2014. ISBN: 5-8946-234-6.

[13] Vapnik VN, Chervonenkis AYa. Pattern recognition theory (statistical problems of learning) [In Russian]. Moscow: "Nauka" Publisher; 1974.

Authors' information

Andrey Viktorovich Gaidel (b. 1989) graduated from Samara State Aerospace University in 2012, majoring in Applied Mathematics and Informatics. He received his Candidate of Science degree in Physics and Math in 2015 from the SSAU. Currently he is a teaching assistant of the Technical Cybernetics sub-department and Engineer at SSAU's laboratory SRL-35 of Samara State Aerospace University, also working as an intern researcher of the Image Processing Systems Institute of the Russian Academy of Sciences, - Branch of the FSRC "Crystallography and Photonics" RAS, Samara, Russia. His research interests currently focus on computer image processing, pattern recognition, data mining and theory of computation. E-mail: [email protected] .

Victor Rostislavovich Krasheninnikov (b. 1945), graduated from Kazan State University in 1967, Doctor of Technical Sciences (1996), Professor, the Head of Applied Mathematics and Informatics department of Ulyanovsk State Technical University (Russia). He has over 300 scientific papers on random process and image analysis. E-mail: [email protected].

Received August 29, 2016. The final version - November 1, 2016.

i Надоели баннеры? Вы всегда можете отключить рекламу.