УДК 004.891.3+615.84
ИССЛЕДОВАНИЕ ТЕКСТУРНЫХ ПРИЗНАКОВ ДЛЯ ДИАГНОСТИКИ НЕФРОЛОГИЧЕСКИХ ЗАБОЛЕВАНИЙ ПО УЛЬТРАЗВУКОВЫМ ИЗОБРАЖЕНИЯМ
© 2014 А. В. Гайдель1, С. Н. Ларионова2, А. Г. Храмов1
Самарский государственный аэрокосмический университет имени академика С. П. Королёва (национальный исследовательский университет), 2Самарский государственный медицинский университет
Предложен метод автоматизированной диагностики заболеваний почек по ультразвуковым изображениям. Исследована эффективность различных групп информационных признаков таких изображений для задачи распознавания. По данным ряда экспериментов на натурных данных наилучшие результаты показала группа из двух признаков Харалика. Оценка вероятности ошибочного распознавания для этой группы составила 0,06. Также хорошую эффективность продемонстрировали спектрально-корреляционные признаки, для которых эта оценка составила 0,10.
Обработка изображений, текстурный анализ, распознавание образов, диагностика, признаки Харалика, регрессия, отбор признаков, дисперсионный анализ.
Введение
Методы ультразвуковой диагностики являются одним из наиболее распространённых инструментов в клинической медицине. Это обеспечивается прежде всего доступностью устройств для диагностики, простотой и высокой скоростью процесса, а также безвредностью для пациента. Ультразвуковые исследования позволяют получить изображения большинства внутренних органов и эффективно диагностировать многие заболевания на ранней стадии развития.
Анализ полученных изображений зачастую выполняется специалистами визуально без использования автоматических компьютерных методов. Однако применение таких методов может значительно ускорить процедуру, уменьшить необходимость подготовки квалифицированных специалистов и в результате снизить её стоимость.
Для описания ультразвуковых изображений предлагается использовать текстурные признаки, представляющие изображение как множество наложенных друг на друга схожих по восприятию мелких элементов. Такой подход характерен для анализа биомедицинских изображений из-
за повторяемости структуры различных тканей [1]. Кроме того, он использовался многими авторами для решения похожих задач.
В [2] авторы используют фрактальные признаки для анализа ультразвуковых изображений молочных желез. В [3] изучается применимость спектральных признаков и вейвлет-анализа для описания допплеровских изображений сонной артерии. В [4] исследуется эффективность различных текстурных признаков для задачи диагностики ряда заболеваний по ультразвуковым изображениям печени. В [5] авторы используют множество различных текстурных признаков для диагностики атеросклеротических бляшек в сонной артерии по ультразвуковым изображениям, проводя сравнение как признаков, так и классификаторов.
На рис. 1, а и 1, б можно наблюдать структурные изменения почечных тканей в результате заболевания. Видно, что изображение становится более светлым (говорят, что у него повышена эхоген-ность), менее однородным и исчезают характерные пирамидообразные тёмные участки мозгового вещества (говорят, что сглаживается дифференцировка).
б
Рис. 1. Ультразвуковые изображения почек: здорового человека (а), страдающего пиелонефритом (б)
1. Регистрация изображений и предварительная обработка
В общей сложности для исследования использовалась выборка из 112 ультразвуковых изображений почек пациентов различного пола и возраста. Все изображения были зарегистрированы с помощью цифрового устройства GE Logiq 5 Pro и имели пространственное разрешение 96 точек на дюйм, то есть примерно 2 пары линий на 1 мм.
Относительно каждого изображения был известен диагноз, поставленный медицинским работником. Наборы изображений нормы и патологии также были случайно разделены на обучающую и контрольную выборки.
Все изображения были одинаково ориентированы, имели одинаковый масштаб, один канал яркости и размер 532x434 отсчёта. От фильтрации спекл-шума и других способов повышения качества изображения было решено отказаться
во избежание потерь информации, полезной для распознавания.
Исследованию подвергалось не всё изображение целиком, а только область интереса, охватывающая верхнюю часть почечной паренхимы и капсулу (рис. 2). Области интереса были вручную выделены на каждом изображении медицинским специалистом и представляли собой многоугольные участки различного размера и формы.
Рис. 2. Пример ультразвукового изображения почки с выделенной областью интереса
2. Информационные признаки
Пусть изображение задано дискретной функцией яркости х(т, п), отображающей из конечного набора узлов В = {0,1,...,М - 1}х{0,1,...,N -1} в конечный набор уровней яркости {0,1,...,Ь -1}. Для каждого изображения задана область интереса Бх е В. Тогда для каждого
изображения признаки формируются как функции от этого изображения.
2.1. Моменты функции яркости
В предположении о том, что изображения одного класса являются реализациями некоторого стационарного эргоди-ческого случайного поля, можно вычислить состоятельные оценки начальных и центральных моментов этого поля по его отсчётам [6]. При этом начальные моменты определяются как
Vk = Zfcj)'
\Dx\ (>',j
а центральные - как
щ=D j)-vi)k •
lDx| fc, j
Здесь и далее оператор |X| обозначает количество элементов в непустом конечном множестве X.
В качестве информационных признаков использовались:
- средняя яркость v1,
- среднеквадратическое отклонение
а =
- коэффициент асимметрии = Щ-,
а
- коэффициент эксцесса у2 = Щ - 3 .
а
2.2. Спектрально-корреляционные характеристики
Текстура на изображении хорошо описывается отсчётами нормированной корреляционной функции, которая оценивается как
Zx j)x + m j + n)
R(m, n )=<")eDx )-, (1)
D К n)
где x (m, n) = x(m, n)-v1 — центрированное изображение,
Dx(m, n) = {(, j) g Dx | (z + m, j + n g Dx)} [7].
В качестве признака использовалось среднее значение следующих отсчётов нормированной корреляционной функции (1):
1 = 4 (R(°,-i)+R(°,I)+
+R (-1,°)+R (1,°)) • (2)
Положим mt = min m, mr = max m,
(m,n )gDx (m, n )gDx
n, = min n, nr = max n —
(m, n )gDx (m,n )eDx
границы множества Dx. Обозначим
М = даг - да, +1 и N = пг - п1 +1 —
размеры этой области. Рассмотрим обрезанное и дополненное нулями изображение
х(да, п) =
Г х(да + да,, п + п), (да +да,, п + щ )е Бх;
I0, (да +да1, п + п, А.
Далее пусть X(да, п) — дискретный Фурье-образ изображения х(да, п), определённый на участке
Dx = i-
xi-
NN 2
M M -1
2 ? ? 2
NN - 1 1
. . . , 2 Г
Тогда спектральная плотность мощности может быть оценена следующим образом [8]:
s(да, п) = |Х(да, п) .
Рассмотрим радиальное распределение мощности 1
Zfck ) =
Dx (k )
Z i(m, n), k >
n )gDx (k)
(3)
°,
k =
Здесь DX (k) = {(m, n) g Dx |
| k2 < m2 + n2 <(k +1)2 л mn Ф °}.
В качестве признака использовалась основная частота, то есть номер отсчёта, в котором функция (3) достигала максимума:
k = arg max Z (k) •
kei °,1,...,
22
2.3. Признаки Харалика
Оценим вероятность Р^ а (г, у) того, что два отсчёта изображения, находящиеся на расстоянии по первой оси и ё2 по второй оси, имеют уровни яркости г и у . Если ввести множество ^ 2 (, у ) = {(да, п) Д („ й2 )|
X
M N
| {х(т,п),х(т + ^,п + йг)} = {,7}}, то можно использовать следующие оценки:
Рь
,(, 7 ) =
В! й2 7)
У(1 )= Е^т п)|Пт,п = 2 \ ,
(4)
где 2 - заданная окрестность, а Е[\ -оператор математического ожидания.
Будем искать функцию (4) в виде
Ь-1
у(2 ЬЕ акёк (2)+аь,
к=0
где gk (2) - некоторые базисные функции
Вх ( )
В данном исследовании использовались 4 фиксированные пары ((1, ё2): (0,1), (1,0), (1,1) и (1,-1). Для каждой из них рассчитывалось по 13 признаков Харалика [9]:
- второй угловой момент,
- контраст Харалика, -корреляция Харалика, -дисперсия Харалика, -обратный разностный момент, -суммарное среднее, -суммарная дисперсия, -суммарная энтропия, -энтропия,
-разностная дисперсия, -разностная энтропия, -первая информационная мера корреляции,
-вторая информационная мера корреляции.
2.4. Признаки на основе простой регрессии
В предположении о том, что случайное поле, реализациями которого являются рассматриваемые изображения, является Марковским, можно заключить наличие стохастической зависимости между яркостью некоторого отсчёта х(т, п) и яркостями отсчётов в некоторой его окрестности
Лт,п ( 7)= Х(т + К П + 7X определённой для г,7 е {-К,...,+К}, таких, что (т + г, п + 7)е Вх и (, 7)^(0,0).
Здесь К > 0 - размер окрестности.
Рассмотрим функцию регрессии
вида gk (2) = е
■7к\\2-С к
а ак - коэффици-
енты регрессии.
Параметры ук и Ск предлагается выбирать, опираясь на обучающую выборку, а коэффициенты ак использовать в качестве информационных признаков [10].
Для выбора Ск используется кластеризация всех значений птп в окрестностях, встречающихся в обучающей выборке, методом Ь внутригрупповых средних [11] с использованием функции расстояния между ними р(А, В) = |\Л - В||.
То есть значения в окрестностях рассматриваются как матрицы, и вычисляется матричная норма. Сами параметры Ск выбираются как центры соответствующих кластеров. Параметры ук имеют смысл среднеквадратических отклонений и вычисляются как
Г к =
1
+К + К
Е Е Ск (, 7).
Ц2К + 1)2 г=-К 7 =-К
Для определения коэффициентов ак на этапе вычисления признаков используется процедура восстановления регрессии, основанная на минимизации функции
0(а)= Е I x(m, п)-Е1 ^к (г1т,п Л ,
(т,п)еВх V к=0 )
где gь (2 1.
Занумеровав все отсчёты из Вх и
обозначив Оу. = g1 (Пт.,„. ) и X = х(т , пг ),
имеем следующее условие минимума:
ООТа = Ох.
(5)
Таким образом, процедура вычисления признаков на основе простой регрессии сводится к решению СЛАУ (5).
3. Экспериментальные исследования
3.1. Критерии оценки эффективности
Пусть имеется признаковое пространство О ^ К1, и для каждого вектора признаков V еО определён класс соответствующего объекта Ф^). Рассмотрим
обучающую выборку и е ~ЯЬ"У, где и, -значение г -го признака для у -го вектора из обучающей выборки.
Значения внутриклассовых дисперсий можно оценить как
Я|Ч(() = 1 Т( - )(()),
Ук ]:Фр, )= к
где Б(к^(() - оценка дисперсии /-го признака внутри к -го класса, Гк ={ е{,2,...,У}|ф(и;)= к} - количество векторов класса к в обучающей выборке,
М(к)(/) = — Ти, - среднее значение /Ук У:Ф(й"У)= к
го признака внутри к -го класса.
Аналогично оценивается дисперсия смеси распределений:
1 V ( 1 V Л2
бм(()=V т (и, - V ти.).
У , =1 ( У к=1 у Чем меньше средняя внутриклассовая дисперсия по сравнению с дисперсией смеси распределений, тем лучше векторы разделены в пространстве признаков. Так что вне зависимости от построенного классификатора и его качества признаки сами по себе могут быть оценены по критерию дисперсионного анализа [12]:
, (()=^
К
Т Б(к
(6)
к=1
где К — количество классов.
Между тем, если имеется классификатор, ставящий в соответствие каждому вектору признаков Vе О определённый класс Ф^), то вероятность ошибочной
классификации может быть оценена по контрольной выборке и е ЯЬуГ как
е = V{{ е{.../}|ф((,М(,)}.(7)
Следует отметить, что это справедливо, только если априорные вероятности появления объектов из различных классов равны либо неизвестны.
Для отбора наилучших групп признаков использовалась процедура, подобная описанной в [13], за тем отличием, что наилучшие группы выбирались отдельно среди признаков Харалика, а отбор в классе признаков, основанных на простой регрессии, вообще не имеет смысла.
3.2. Результаты экспериментов
Классификация осуществлялась в один из двух классов: норма или патология. Для классификации во всех экспериментах использовался метод ближайшего соседа, потому что он допускает обучение на этапе распознавания и его вероятность ошибки не более чем в два раза хуже, чем у байесовского классификатора [12].
Таблица 1. Качество отдельных яркостных моментов и спектрально-корреляционных характеристик
№ Признак е J (()
1 Средняя корреляция Г1 0,13 2,38
2 Коэффициент эксцесса у2 0,25 1,88
3 Среднеквадратическое отклонение О 0,35 2,20
4 Средняя яркость У1 0,35 1,49
5 Основная частота к 0,41 1,47
6 Коэффициент асимметрии 71 0,45 1,35
Изначально ошибка классификации (7) и критерий дисперсионного анализа (6) рассчитывались отдельно для каждого признака. Результаты этих расчётов показаны в табл. 1. Видно, что наиболее информативным признаком среди момент-ных и спектрально-корреляционных характеристик является средняя корреляция (2).
Таблица 2. Качество групп яркостных моментов и спектрально-корреляционных характеристик
№ Группа признаков £
1 Г1 0,13
2 ^ 72 0,12
3 ^ 72 , 0 0,12
4 ^ 72, 0, Vi 0,10
5 ^ 72, 0, V к 0,22
6 ^ 72, 0, V к, 71 0,25
Таблица 3. Качество наиболее эффективных признаков Харалика
Исходя из полученных данных, принималось решение о формировании групп признаков, результаты исследования эффективности которых приведены в табл. 2. Выделена строка таблицы с наиболее эффективной группой признаков в этом классе, которая включает четыре признака и обеспечивает верную классификацию в 90% случаев.
В табл. 3 приведены результаты анализа эффективности десяти лучших по критерию дисперсионного анализа (6) признаков Харалика. В табл. 4 показаны результаты экспериментов по объединению этих признаков в группы. Наименьшая ошибка распознавания в 0,06 получена при использовании группы из двух
признаков Харалика: однородности и контрастности по вертикали.
Результаты исследования качества признаков на основе простой регрессии представлены в табл. 5. Наилучшая оценка для вероятности ошибочной классификации (7) в данном случае равна 0,21, что хуже, чем у двух предыдущих групп признаков.
Таблица 4. Качество групп признаков Харалика
Группа признаков £
1 0,15
1,2 0,06
1,2,3 0,08
1,2,3,4 0,10
1,2,3,4,5 0,10
1,2,3,4,5,6 0,06
1,2,3,4,5,6,7 0,06
1,2,3,4, 5,6,7,8 0,06
1,2,3,4,5,6,7,8,9 0,06
1,2,3,4,5,6,7,8, 9, 10 0,06
Таблица 5. Вероятность ошибочной классификации при использовании признаков на основе простой регрессии
Размер окна Количество признаков
6 9 12 15
3 0,35 0,31 0,21 0,35
5 0,39 0,33 0,25 0,33
7 0,37 0,37 0,35 0,46
Заключение
В работе предложен метод автоматизированной диагностики нефрологиче-ских заболеваний путём анализа ультразвуковых изображений почек. Проведён ряд экспериментов по выявлению наиболее информативных признаков, наилуч-
№ Признак £ J (()
1 Однородность по вертикали 0,15 118,3
2 Контрастность по вертикали 0,31 36,0
3 Однородность по горизонтали 0,10 30,7
4 Однородность по главной диагонали 0,15 29,7
5 Однородность по побочной диагонали 0,15 28,6
6 Разностная дисперсия по горизонтали 0,21 21,1
7 Разностная дисперсия по вертикали 0,19 18,9
8 Контрастность по горизонтали 0,19 17,3
9 Разностная дисперсия по главной диагонали 0,25 16,5
10 Контрастность по главной диагонали 0,31 15,6
шим образом описывающих диагностические изображения. В ходе экспериментов была достигнута наилучшая оценка вероятности ошибочного распознавания в 0,06, то есть 94% изображений из контрольной выборки были распознаны правильно, что говорит о принципиальной возможности применять описанную методику для клинической диагностики.
Из четырёх рассмотренных классов признаков наиболее эффективными для
данной задачи оказались признаки Хара-лика. Всего двух таких признаков достаточно для достижения указанной вероятности ошибки в 0,06. Также неплохую эффективность показала группа признаков из моментов функции яркости и спектрально-корреляционных характеристик, обеспечив вероятность ошибки в 0,10. Признаки на основе простой регрессии не показали достаточной эффективности для данной задачи.
Библиографический список
1. Rangayyan R.M. Biomedical Image Analysis. CRC Press, 2004. 1312 p.
2. Chen D.-R., Chang R.-F., Chen Ch.-J., Ho M.-F., Kuo Sh.-J., Chen Sh.-T., Hung Sh.-J., Moon W.K. Classification of breast ultrasound images using fractal feature // Journal of Clinical Imaging. 2005. V. 29. P. 235-245.
3. Ubeyli E.D., Guler I. Feature extraction from Doppler ultrasound signals for automated diagnostic systems // Computers in Biology and Medicine. 2005. V. 35, is. 9. P. 735-764.
4. Wu Ch.-M., Chen Y.-Ch., Hsieh K.-Sh. Texture features for classification of ultrasonic liver images // IEEE Transactions on medical imaging. 1992. V. 11, is. 2. P. 141-152.
5. Christodoulou C.I., Pattichis C.S., Pantziaris M., Nicolaides A. Texture-based classification of atherosclerotic carotid plaques // IEEE Transactions on medical imaging. 2003. V. 22, is. 7. P. 902-912.
6. Волков И.К., Зуев С М., Цветко-ва Г.М. Случайные процессы. М.: Изд-во МГТУ им. Н.Э. Баумана, 1999. 448 с.
7. Petrou M., Garcia Sevilla P. Image processing: dealing with texture. Chichester, UK: John Wiley & Sons, Ltd. 2006. 618 p.
8. Marple S.L., Jr. Digital spectral analysis with applications. Englewood Cliffs, New Jersey: Prentice-Hall, Inc. 1987. 492 p.
9. Haralick R.M., Shanmugam K., Dinstein Its'Hak. Textural features for image classification // IEEE Transactions on Systems, Man, and Cybernetics. November 1973. V. SMC-3. P. 610-621.
10. Plastinin A. Regression models for texture image analysis // Pattern Recognition and Machine Intelligence. - 4th International Conference, PReMI 2011, Moscow, Russia, June 27 -July 1, 2011. P. 136-141.
11. Tou J.T., González R.C. Pattern recognition principles. Addison-Wesley Publishing Company, 1974. 377 p.
12. Fukunaga K. Introduction to statistical pattern recognition. Academic Press, 1972. 592 p.
13. Гайдель А.В., Первушкин С.С. Исследование текстурных признаков для диагностики заболеваний костной ткани по рентгеновским изображениям // Компьютерная оптика. 2013. Т. 37, № 1. C. 113-119.
Информация об авторах
Гайдель Андрей Викторович, аспирант кафедры технической кибернетики, Самарский государственный аэрокосмический университет имени академика С. П. Королёва (национальный исследовательский университет). E-mail: an-
[email protected]. Область научных интересов: компьютерная обработка изображений, теория распознавания образов, математическое моделирование, теория алгоритмов.
Ларионова Светлана Николаевна,
старший лаборант кафедры оперативной хирургии и клинической анатомии с курсом инновационных технологий, Самарский государственный медицинский университет. E-mail: [email protected]. Область научных интересов: ультразвуковые исследования, нефрология, компьютерная диагностика.
Храмов Александр Григорьевич,
доктор технических наук, профессор кафедры технической кибернетики, Самарский государственный аэрокосмический университет имени академика С. П. Королёва (национальный исследовательский университет). E-mail: [email protected]. Область научных интересов: обработка и анализ биомедицинских изображений, анализ интерферограмм, математическое моделирование, теория случайных процессов.
RESEARCH OF TEXTURAL FEATURES FOR THE DIAGNOSTICS OF NEPHROLOGICAL DISEASES USING ULTRASOUND IMAGES
© 2014 A. V. Gaidel1, S. N. Larionova2, A. G. Khramov1
Samara State Aerospace University, Samara, Russian Federation 2Samara State Medical University, Samara, Russian Federation
A method of automated diagnostics of kidney diseases using ultrasound images is proposed. The efficiency of different groups of information features of such images for the task of recognition is analyzed. According to the data of a number of experiments on real data the group of two Haralick's features showed the best result. The estimation of probability of wrong recognition for that group was 0.06. Spectral correlation features also demonstated high efficiency, the estimation of the latter for them being 0.10.
Image processing, texture analysis, pattern recognition, diagnostics, Haralick's features, regression toward the mean, feature selection, dispersion analysis.
References
1. Rangayyan R.M. Biomedical Image Analysis. CRC Press, 2004. 1312 p.
2. Chen D.-R., Chang R.-F., Chen Ch.-J., Ho M.-F., Kuo Sh.-J., Chen Sh.-T., Hung Sh.-J., Moon W.K. Classification of breast ultrasound images using fractal feature // Journal of Clinical Imaging. 2005. V. 29. P. 235-245.
3. Ubeyli E.D., Guler I. Feature extraction from Doppler ultrasound signals for automated diagnostic systems // Computers in Biology and Medicine. 2005. V. 35, is. 9. P. 735-764.
4. Wu Ch.-M., Chen Y.-Ch., Hsieh K-Sh. Texture features for classification of ultrasonic liver images // IEEE Transactions on medical imaging. 1992. V. 11, is. 2. P. 141152.
5. Christodoulou C.I., Pattichis C.S., Pantziaris M., Nicolaides A. Texture-based classification of atherosclerotic carotid plaques // IEEE Transactions on medical imaging. 2003. V. 22, is. 7. P. 902-912.
6. Volkov I.K., Zuyev S.M., Tsvetkova G.M. Sluchaynye protsessy [Stochastic processes]. Moskow: Bauman Moscow State Technical University Publishers, 1999. 448 p.
7. Petrou M., Garcia Sevilla P. Image processing: dealing with texture. Chichester, UK: John Wiley & Sons, Ltd. 2006. 618 p.
8. Marple S.L., Jr. Digital spectral analysis with applications. Englewood Cliffs, New Jersey: Prentice-Hall, Inc. 1987. 492 p.
9. Haralick R.M., Shanmugam K., Dinstein Its'Hak. Textural features for image
classification // IEEE Transactions on Systems, Man, and Cybernetics. November 1973. V. SMC-3. P. 610-621.
10. Plastinin A. Regression models for texture image analysis // Pattern Recognition and Machine Intelligence. - 4th International Conference, PReMI 2011, Moscow, Russia, June 27 -July 1, 2011. P. 136-141.
11. Tou J.T., González R.C. Pattern recognition principles. Addison-Wesley Publishing Company, 1974. 377 p.
12. FukunagaK. Introduction to statistical pattern recognition. Academic Press, 1972. 592 p.
13. Gaidel A.V., Pervushkin S.S. Research of the textural features for the bony tissue diseases diagnostics using the roent-genograms // Computer Optics. 2013. V. 37, no. 1. P.113-119. (inRuss.).
About the authors
Gaidel Andrey Viktorovich, postgraduate student, Technical Cybernetics Department, Samara State Aerospace University. E-mail: [email protected]. Area of research: digital image processing, pattern recognition theory, mathematical modeling, theory of algorithms.
Larionova Svetlana Nikolaevna, Senior Laboratory Assistant, Department of Operative Surgery and Clinical Anatomy with a Course on Innovation Technologies, Samara State Medical University. E-mail: lariono-
[email protected]. Area of research: ultraso-nography, nephrology, computer-aided diagnostics.
Khramov Alexander Grigorievich,
Doctor of Science (Engineering), Professor, Technical Cybernetics Department, Samara State Aerospace University. E-mail: [email protected]. Area of research: biomedical image processing, analysis of interfero-grams, mathematical modeling, theory of random processes.