СИСТЕМНЫЙ АНАЛИЗ, УПРАВЛЕНИЕ И ОБРАБОТКА ИНФОРМАЦИИ
DOI 10.21672/2074-1707.2019.48.4.010-024 УДК 004.032.26; 615.4
АВТОМАТИЗИРОВАННАЯ СИСТЕМА ДЛЯ КЛАССИФИКАЦИИ ЗАБОЛЕВАНИЙ МОЛОЧНОЙ ЖЕЛЕЗЫ ПО РЕНТГЕНОВСКИМ МАММОГРАФИЧЕСКИМ СНИМКАМ
Статья поступила в редакцию 19.10.2019, в окончательном варианте — 29.10.2019.
Дабагов Анатолий Рудольфович, АО «Медицинские технологии Лтд», 105318, Российская Федерация, г. Москва, ул. Ибрагимова, 31,
кандидат технических наук, президент АО «Медицинские технологии Лтд», e-mail: [email protected]
Малютина Ирина Алексеевна, Юго-Западный государственный университет, 305040, Российская Федерация, г. Курск, ул. 50 лет Октября, 94, аспирант, e-mail: [email protected]
Кондратов Дмитрий Сергеевич, Юго-Западный государственный университет, 305040, Российская Федерация, г. Курск, ул. 50 лет Октября, 94, аспирант, e-mail:kondrashov012 @mail.ru
Серебровский Вадим Владимирович, Юго-Западный государственный университет, 305040, Российская Федерация, г. Курск, ул. 50 лет Октября, 94,
доктор технических наук, профессор, e-mail: [email protected]
Шехине Мохамед Туфик, Курский государственный медицинский университет, 305041, Российская Федерация, г. Курск, ул. К. Маркса, 3,
кандидат технических наук, доцент, e-mail:[email protected]
Цель исследования заключается в разработке классификаторов для автоматизированной системы скринин-говой классификации маммограмм молочной железы. Исследована трехэтапная классификация рентгеновских снимков молочной железы. На первом этапе осуществляется семантическая сегментация изображения. На втором этапе из выделенных сегментов формируется область интереса, а на третьем этапе принимается решение о принадлежности области интереса к известному морфологическому образованию. ЛПР может вмешаться в процесс классификации как на втором, так и на третьем этапах. В автоматизированной системе применяется двухальтернативный классификатор, основанный на методе максимального правдоподобия. Классификатор включает алфавит из двух классов C1 и C2. Класс C1 соответствует блокам в состоянии нормы, а класс C2 - это блоки, у которых имеются морфологические образования, вызванные патологическими процессами. В качестве входных данных для расчета информативных показателей использовались тестовые маммографические изображения молочной железы из базы данных MIAS с подтвержденными диагнозами. Проведена экспериментальная апробация программного обеспечения автоматизированной системы по классификации рентгенограмм молочной железы по классам «нет области интереса» или «есть область интереса». В качестве текстурных характеристик классифицируемых сегментов предложено использовать статистические характеристики яркости пикселей сегмента: моду, математическое ожидание, среднеквадратическое отклонение. Проведен разведочный анализ текстурных характеристик выборок двух классов: С1 - норма и С2 - новообразование. Получен критерий оценки результатов классификации маммографических изображений. Эксперименты на контрольных выборках показали диагностическую эффективность по классам рентгенограмм «нет области интереса» - «есть область интереса» не ниже 90 %, а по классам сегментов «норма» - «патология» не ниже 91 %.
Ключевые слова: онкологические заболевания, рентгенограммы молочной железы, сегментация, морфологические образования, область интереса, классификатор, метод максимального правдоподобия, показатели качества классификации
AUTOMATED SYSTEM FOR CLASSIFYING BREAST DISEASES BY X-RAY MAMMOGRAPHY
The article was received by the editorial board on 19.10.2019, in the final version — 29.10.2019.
Dabagov Anatoly R., JSC "Medical Technologies Ltd", 31 Ibragimov St., Moscow, 105318, Russian Federation,
Cand. Sci. (Engineering), President of JSC "Medical Technologies Ltd", e-mail: [email protected] Malyutina Irina A., Southwest State University, 94 50 let Oktyabrya St., Kursk, 305040, Russian Federation,
post-graduate student, e-mail: [email protected]
Kondrashov Dmitry S., Southwest State University, 94 Russian Federation,
post-graduate student, e-mail: kondrashov012 @ mail.ru Serebrovsky Vadim V., Southwest State University, 94 Russian Federation,
Doct. Sci. (Engineering), Professor, e-mail: [email protected]
Chahine Mohamad T., Kursk State Medical University, 3 Karl Marks St., Kursk, 305041, Russian Federation
Cand. Sci. (Engineering), Associate Professor, e-mail: [email protected]
50 let Oktyabrya St., Kursk, 305040, 50 let Oktyabrya St., Kursk, 305040,
The aim of the study is to develop classifiers for an automated system of screening classification of mammograms of the breast .A three-stage classification of breast x-rays was investigated. At the first stage, semantic segmentation of the image is carried out. At the second stage, an area of interest is formed from the selected segments, and at the third stage, a decision is made on whether the area of interest belongs to a known morphological formation. The LPR can intervene in the classification process, both in the second and third stages. The automated system uses a two-alternative classifier based on the maximum likelihood method. The classifier includes an alphabet of two classes C1 and C2. Class C1 corresponds to blocks in the normal state, and class C2-these are blocks that have morphological formations caused by pathological processes. Test mammographic images of the breast from the MIAS database with confirmed diagnoses were used as input data for the calculation of informative indicators. Experimental approbation of the software of the automated system on classification of radiographs of a mammary gland on classes "there is no area of interest" or "there is an area of interest"is carried out. As textural characteristics of the classified segments, it is proposed to use statistical characteristics of the brightness of the pixels of the segment: mode, expectation, standard deviation. The exploratory analysis of textural characteristics of samples of two classes: C1 - norm, and C2 - neoplasm is carried out. A criterion for evaluating the results of classification of mammographic images was obtained. Experiments on control samples showed diagnostic efficiency for classes of radiographs "there is no area of interest" - "there is an area of interest" not lower than 90 %, and for classes of segments "norm" - "pathology" not lower than 91 %.
Key words: cancers, breast X-rays, segmentation, morphological formations, area of interest, classifier, method of maximum plausibility, classification quality indicators
Graphical annotation (Графическая аннотация)
Семантическая сегментация изображения
Введение. Рак молочной железы (МЖ) является самым распространенным онкологическим заболеванием среди женщин [2, 5]. Основным методом диагностики данного заболевания, имеющим высокую точность и позволяющим выявить его на ранних стадиях развития, когда его невозможно детектировать тактильно и он не вызывает дискомфорта у пациента, является маммография - процедура рентгенографии МЖ. Именно использование снимков маммографии в большинстве случаев является основным для разработки компьютерных систем медицинской диагностики этого вида заболеваний.
Компьютерная скрининговая диагностика патологий по маммографическим снимкам позволяет обнаружить области интереса с помощью методов пороговой фильтрации, дискретного вейвлет-преобразования, морфологических операторов [1, 10, 11]. Области интереса, которые могут принадлежать патологиям, выделяются с помощью методов разрастания областей, выделения контуров областей патологии, выделения и анализа текстурных признаков [4, 6, 12]. Для классификации патологий в последних исследованиях используют искусственные нейронные сети, имеющие либо классическую архитектуру, описанную в [13, 14, 15], либо архитектуру, подобранную для конкретной задачи. Последнее позволило получить значение истинно положительных результатов (TPR) классификации патологий рака МЖ 92 % при ложно положительных решениях (FPR) 0,2 на одном снимке маммографии. Такие результаты являются одними из самых лучших среди существующих на сегодняшний день систем медицинской диагностики рака МЖ.
Однако маммограммы относятся к сложноструктурируемым изображениям, что вызывает ряд трудностей при их классификации известными методами, в том числе и с использованием нейронных сетей [8, 16, 17]. С целью преодоления этих трудностей используют интерактивный режим классификации, который включает три этапа. На первом этапе выполняется сегментация маммо-граммы, на втором этапе из выделенных сегментов формируется область интереса, а на третьем этапе принимается решение о принадлежности области интереса к известному морфологическому образованию. Лицо, принимающее решение (ЛИР), может вмешаться в процесс классификации, как на втором, так и на третьем этапах.
Первый этап классификации был подробно рассмотрен в [3]. Для реализации второго и/или третьего этапов необходимо формирование дескрипторов, которые адекватно бы описывали выделенные сегменты. Такие дескрипторы очень часто формируют на основе статистических характеристик пикселей в сегментах.
Статистические характеристики могут быть сформированы посредством двух подходов. Первый подход основан на глобальном анализе маммограмм, который не учитывает дислокацию мор-фологичекого образования на маммографическом снимке. Второй подход основан на локальном анализе, который учитывает координаты выделяемого морфологического образования на рентгеновском снимке. Последний вариант анализа требует разметки маммограммы и привязки морфологического образования к разметочной сетке. Учитывая, что сам процесс автоматической обработки рентгенограммы МЖ требует больших вычислительных ресурсов, а использование второго подхода к получению дескрипторов увеличивает на порядок необходимые вычислительные ресурсы, в данной работе будем рассматривать первый подход.
Материалы и методы. В автоматизированной системе применяется двухальтернативный классификатор, основанный на методе максимального правдоподобия. Классификатор включает алфавит из двух классов C¡ и C2. Класс C¡ соответствует блокам в состоянии нормы, а класс C2 - это блоки, у которых имеются морфологические образования, вызванные патологическими процессами.
В качестве входных данных для расчета информативных показателей использовались тестовые маммографические изображения молочной железы из базы данных MIAS с подтвержденными диагнозами [19, 20]. Для обучения классификатора были отобраны 120 изображений из базы данных MIAS с выявленными морфологическими новообразованиями, по которым была сформирована обучающая выборка, обеспечивающая выявление показателей, характеризующих состояние обследуемого. Она представляет собой 250 сегментов, находящихся в состоянии нормы, и 120 сегментов, у которых имеются морфологические новообразования, вызванные патологическими процессами. Вследствие этого вводятся два критерия: «нет области интереса», «есть область интереса». Фрагменты тестовых снимков эталонных образцов для класса C и C2 представлены на рисунке 1.
I ГТТ-3
□ ЕН
Рисунок 1 - Фрагменты тестовых снимков эталонных образцов в состоянии нормы
Каждому блоку соответствует предиктор Р2, описываемый вектором в трехмерном пространстве. В качестве первого показателя, оценивающего сегмент на предмет морфологического образования, была выбрана статистическая характеристика - мода (Х1), представляющая из себя значение яркости пикселя, которое встречается наиболее часто в выбранном сегменте. В качестве второго показателя используется математическое ожидание (Х2). В качестве третьего показателя выступает среднеквадратическое отклонение (Х3).
Значения математических ожиданий рассчитываются по формуле [18]:
X = (1/ ri)YdXi, (1)
I=1
где X. - значения яркостей пикселей в выборке.
Расчет среднеквадратического отклонения осуществляется, согласно [18], по формуле:
а(Х) = (1^X^X7 . (2)
Vп .=1
В таблице 1 представлен фрагмент рассчитанных значений моды, математического ожидания и среднеквадратического отклонения для блоков, в которые не попали морфологические образования.
Таблица 1 - Фрагмент рассчитанных характеристик для сегментов класса С1
№ XI X2 X3
1 107 106 16,67
2 99 88 29,35
3 107 99 19,75
4 117 93 25,69
5 60 52 25,87
6 99 93 22,02
7 94 96 20,06
8 89 96 17,01
9 89 95 19,23
10 94 100 19,53
11 40 46 31,73
12 54 45 29,27
13 77 79 16,37
14 89 79 29,22
15 99 77 30,58
Из обучающей выборки следует вывод о том, что для блоков в состоянии нормы значения моды не превышают показатель 143, для математического ожидания - 153, а для среднеквадратического отклонения - 36,71. Усредненные значения моды, математического ожидания и среднеквадратического отклонения равны, соответственно, 93,50; 88,47; 25,12.
В таблице 2 представлен фрагмент рассчитанных значений моды, математического ожидания и среднеквадратического отклонения для блоков, у которых имеются морфологические новообразования, вызванные патологическими процессами.
Из обучающей выборки следует вывод о том, что для блоков, в которых имеются морфологические новообразования, вызванные патологическими процессами значения моды, не превышают показатель 250, математического ожидания - 227, а для среднеквадратического отклонения -67,11. Усредненные значения моды, математического ожидания и среднеквадратического отклонения равны, соответственно, 176,40; 183,10; 32,15.
Таблица 2 - Фрагмент рассчитанных характеристик для сегментов класса С2
№ X1 X2 X3
1 174 186 39,9
2 170 184 67,11
3 177 208 64,01
4 198 168 43,01
5 188 201 53,73
6 170 156 43,83
7 146 160 40,94
8 170 205 44,33
9 185 182 48,16
10 158 150 40,03
11 153 173 42,74
12 151 145 41,41
13 159 187 42,81
14 174 212 31,83
15 169 182 37,49
На рисунке 2 представлен фрагмент блока в состоянии нормы, а также его гистограмма, а на рисунке 3 - фрагмент блока, в который попали морфологические новообразования и его гистограмма
Мо = 109 СКО = 39,35 М = 94
И 75 100 125 1» 175 Градация яркостей. [0,255]
Рисунок 2 - Фрагмент блока в состоянии нормы и его гистограмма
32500 [ 30000 \
1 ib
Мо = 170 СКО = 64,05 М= 136
Е
75 100 125 150 175 i Градация яркостей, 1[0.255]
б)
Рисунок 3 - Фрагмент блока, в который попали морфологические новообразования и его гистограмма
Полагаем, что каждый класс задается трехмерным нормальным распределением совместной плотности вероятностей компонентов вектора Р2. Нормальный характер такого распределения подтверждается проверкой отдельных его компонент и следствием центральной предельной теоремы.
Для проверки выборки на соответствие нормальному закону распределения была использована программа STATISTICA. Для предварительного анализа были построены гистограммы и квантиль-квантиль графики.
На рисунках 4а, 5а, 6а представлены графики гистограмм для трех показателей класса С: мода, математическое ожидание, среднеквадратическое отклонение, а для класса С2 - на рисунках 4б, 5б, 6б.
Histogram of Мода1 spreadsheets 7v*250c Мода1 = 250*10*normal(x; 93,504; 26,8529)
10 20 30 40 50 60 70 80 90 100 110 1 20 1 30 140 1 50 160 Мода1
Histogram of Мода2 spreadsheets 7v*250c Мода2 = 120*2Q*normal(x; 176,4083; 25,3906)
100 120 140 160
30 200 220 240 260 280 Мода2
а) б)
Рисунок 4 - Гистограмма нормального распределения для моды: а) для класса Сь б) для класса С
Histogram of M1 spreadsheets 7v*250c M1 = 250*20*normal(x; 88,476; 25,3477)
i
¡11
Histogram of M2 spreadsheets 7v"250c M2= 120*10*normal(x; 183,1; 17,9993)
20 40 60
100 120 140 160 180
а) б)
Рисунок 5 - Гистограмма нормального распределения для математического ожидания: а) для класса Сь б) для класса С2
Histogram of СКСИ Spreadsheet3 7v*250c СК01 = 250*2*normal(x; 25,1182; 5,6745)
i
■
IL
Histogram of CK02 spreadsheets 7v*250c CK02 = 120*5*normal(x; 32,1486; 10,7995)
12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 5 ю 15 20 25 30 35 40 45 50 55 60 65 70 75
СК01 СК02
а) б)
Рисунок 6 - Гистограмма нормального распределения для среднеквадратического отклонения: а) для класса Сь б) для класса С2
В целом распределение значений анализируемых признаков на рисунках 4, 5 и 6 совпадает с нормальным (столбики гистограмм примерно выстраиваются в колоколообразную фигуру). Однако это заключение основано только на визуальном анализе распределения, потому ему необходимо более строгое подтверждение. Так, на рисунке 4а и 6а на гистограммах имеются ярко выраженные «выбросы», а на гистограммах рисунков 4б и 6б присутствуют аномальные значения по краям распределения, поэтому воспользуемся еще одним методом визуального анализа - диаграммой рассеяния (квантиль-квантиль графиками) наблюдаемых значений относительно (нормированных) ожидаемых значений при заданном распределении.
На рисунках 7а, 8а, 9а изображены квантиль-квантиль графики для трех показателей класса Сь а для класса С2 - на рисунках 7б, 8б, 9б. Из графиков квантиль-квантиль следует вывод о том, что все точки лежат вдоль линии, что не противоречит нормальному закону распределения. Однако проведенная проверка, результаты которой показаны выше, является недостаточно строгой. Поэтому целесообразно провести дополнительную проверку по критерию Колмогорова - Смирнова [18] с уровнем доверительной вероятности 0,95. В программе STATISTICA был произведен расчет критерия Колмогорова - Смирнова, результаты которого представлены на рисунке 10. В третьем столбце таблицы на этом рисунке показаны рассчитанные выборочные значения D, а в четвертом столбце показано, что все критерии нормально распределены, так как значение вероятности «р» меньше 0,1, что соответствует уровню доверительной вероятности 0,95.
Quantile-Quantile Plot of Модэ1 spreadsheets 7u*250c Distribution: Normal МОДЭ1 = 03 504+26 4613*x 0 01 0 05 0 25 0 50 0 75 0.00 0.09
Quantile-Quantile Plot of мода2 spreadsheets 7v*250c Distribution: Г.: j r 111 --: I Мода2 = 176 4063+25.3974"x 0,01 0 05 0 25 0 50 0 75 0,9{
Theoretical Quantile
Theoretical Quaritile
а)
б)
Рисунок 7 - Квантиль-квантиль график для моды: а) для класса Сь б) для класса С2
Quantile-Quantile Plot of M1 spreadsheets 7v*250c
Distribution: Normal M1 = 88,476+25,3335*x 0,01 0,05 0,25 0,50 0,75 0,90 0,99
Theoretical Quantile
а)
0,01 0,05
Quantile-Quantile Plot of M2 Spreadsheet3 7v*250c Distribution: Normal M2= 183,1+18,0288*X 0,25 0,50 0,75 0,90
Theoretical Quantile
6)
Рисунок 8 - Квантиль-квантиль график для математического ожидания: а) для класса Сь б) для класса С2
Quantile-Quantile Plot of СК01 spreadsheets 7v*250c
Distribution: Normal CK01 = 25,1182+5,593*x 0,05 0,25 0,50 0,75 0,90
Quantile-Quantile Plot of CK02 spreadsheets 7v*250c Distribution: Normal CK02 = 32,1486+10,6521 *x 0,25 0,50 0,75
Theoretical Quantile
Theoretical Quantile
а) б)
Рисунок 9 - Квантиль-квантиль график для среднеквадратического отклонения: а) для класса Сь б) для класса С2
Для того чтобы убедиться в правильности расчета по программе, необходимо сверить полученные выборочные значения D с критическим значением критерия Колмогорова - Смирнова для уровня доверительной вероятности 0,95. Расчёт критического значения проводится по формуле из [7]:
d =
1
_а___
2п 6п
где а - уровень значимости распределения; п - объём выборки.
(3)
Tests of Normality (Spreadsheet3)
N max D Kolmogorova-Smirnova
Variable P
Мода1 250 0,081543 P<,10
М1 250 0,081093 p<,10
СК01 250 0,078354 p< JO
Мода2 120 0,117683 p<,10
М2 120 0,111799 p<,10
СК02 120 0,116742 p<,10
Рисунок 10 - Таблица нормального распределения, полученная в программе БТАТВТГСА, по критерию Колмогорова - Смирнова
Для выборки объёмом 250 сегментов, соответствующей классу Сь критическое значение равно d = 0,081921, а для выборки объёмом 120 сегментов, относящихся к классу С2, d = 0,118243. Если D < d, то гипотеза принимается, если D > d , то гипотеза отвергается [9]. Поскольку все рассчитанные выборочные значения D меньше критических значений, то гипотеза принимается, следовательно, выборки распределены нормально.
На рисунке 11 изображена структурная схема классификатора сегмента.
Изображение сегмента и
г- 1
г 3-
Мо^о
J.
MU)
Ü Р-,
Класс С1
Класс С2
4
2
Рисунок 11 - Структурная схема классификатора сегмента
В верхнем канале (блок 1) вычисляется значение LD (и) правдоподобия классифицируемого сегмента и математической модели класса С1, а в нижнем канале (блок 2) - величина LG (и) правдоподобия этого сегмента математической модели класса С2. Далее формируется отношение правдоподобия ЛD G (и) (блок 3), которое сравнивается с пороговым уровнем (блок 4). Если этот уровень не превышен, то принимается решение о соответствии сегмента и к классу С2. В противном случае классифицируемый блок не выделяется.
Для блоков в состоянии нормы формируется обучающая выборка класса С1, которая обозначается через D :
D¡ = ^ у},I = 1,2,...,k; у = 1,2,...,X,, (4)
где I - номер выборки; X, - её объём; у - номер блока в этой выборке, компоненты которого в пространстве признаков задаются вектором d у = ^ у , d¡jx , d у ).
Аналогично, через G обозначается обучающая выборка, в которую вошли блоки, у которых имеются морфологические образования, связанные с онкологическим заболеванием, т.е. выборки класса С2:
G¡ = },, = 1,2,...,п; у = 1,2,...,г,, (5)
где ¡' - номер выборки; г, - её объём; у - номер блока в этой выборке; gу = {g¡jx1, g¡jx2, g¡jx3} - вектор, задающий его компоненты в пространстве признаков; п - количество обучающих выборок.
Величины п и k выбираются исходя из требования необходимой репрезентативности выборки. Количество объектов в каждой выборке должно находиться в пределах 100...300 при величине k в диапазоне 1.5.
Математические модели обучающих выборок формируются в виде плотности распределений вероятностей случайных векторов, подчиняющихся нормальному закону.
Модель выборки D i вычисляется по формуле:
Ln (dj) =
г exp
{- 0.5( dj - MDt )T .SD1 • (dj - MDi)}
(6)
i = 1,2,..., к; j = 1,2,..., X
где М D. и 2 D - средний вектор и ковариационная матрица выборки Di соответственно. Аналогично, модель выборки G i вычисляется по формуле:
La,( g„) =
1
л/с2^
-exp
{- 0.5( gj - MGi)T -S G1 • (gj - MGi)}
(7)
i = 1,2,..., п; у = 1,2,..., Г
где g у - конкретный блок из обучающей выборки G1; MG и 2 - средний вектор и ковариационная матрица выборки Gi; п - количество выборок класса С2; г - объём выборки.
Классификатор обеспечивает обоснованное принятие решения о том, к какому из классов С1 или С2 следует отнести конкретный сегмент и. В нашем распоряжении находится функция правдоподобия ц^^у), ¡= 1,2,...,k; у = 1,2,...,X (формула (6), построенная по объединенной обучающей
выборке Di), а также функции правдоподобия = 1,2,..., п; у = 1,2,..., г , построенные по обу-
чающим выборкам Gi, полученным на блоках с патологией.
По обучающим выборкам были получены параметры моделей: средний вектор М, ковариационная матрица 2 и определитель ковариационной матрицы |2 | для двух математических моделей класса С1 и С2.
Подставляя рассчитанные значения в формулы (6) и (7), получаем:
LD (dij) =
1
2,21-104
• exp
- 0.5(dj -и
93,50"
88,47^)
25,11
T
721,078 463,168 19,272" 463,168 642,507 9,572 19,272 9,572 32,200
-1
j
93,50"
88,47)
25,11
(8)
1
S
D
G
i= 1,2,...,k; j = 1,2,...,f
LG (%)=-Чл
G J 3,85-1СТ
•exp
~СЩ -
176,4С
183,1(0)
32,14
T
644,680 6С,849 5,429" 6С,849 323,973 4,758 5,429 4,758 116,62
-1
% -
176,4С
183,1(0)
32,14
(9)
i=\х...к ] =1,2,...,/
В соответствии с критерием максимального отношения правдоподобия решение о принадлежности к одному из классов С1 и С2 принимается при условии:
Ld (U) p Л, (U) = ц >
La,(U) Р2
> ^ i = 1,2,...,n,
(1С)
где р1 и р2 - априорные вероятности принадлежности примера и к первому или второму классу. Обычно полагают, что р1 = р2 и пороговое значение (10) равно единице. По обучающей выборке было установлено, что оптимальное пороговое значение равно 1,5.
В качестве примера рассмотрим классификацию неизвестного образца, представленного на рисунке 12. При помощи классификатора проведем оценку его принадлежности к классу С1 или С2.
Параметры сегмента: мода - 188, математическое ожидание - 159, среднеквадратическое отклонение - 30,65.
Рисунок 12 - Выборочный сегмент
Далее эти три параметра подставляются в формулы (8) и (9), которые соответствуют функциям правдоподобия для класса С и С2. Полученные значения подставляем в формулу (1С) для максимального отношения правдоподобия. Полученное значение p = С,СС81 соответствует классу С2, следовательно, в данном сегменте есть морфологическое образование.
Результаты и их обсуждение. В качестве показателей качества, характеризующих статистическую достоверность полученных критериев оценки, были выбраны следующие показатели: диагностическая чувствительность (ДЧ), диагностическая специфичность (ДС), диагностическая эффективность (ДЭ), прогностическая значимость положительных результатов (ПЗ) и прогностическая значимость отрицательных результатов (ПЗ-) [9].
Для расчета оценки показателей качества была взята выборка объёмом 1СС сегментов. Все показатели рассчитывались для каждого из установленных классов состояний, где X1 - «нет области интереса», X2 - «есть область интереса».
Для проверки работоспособности автоматизированной системы, было использовано 5С изображений маммограмм МЖ из базы данных MIAS (фрагменты показаны на рисунках 13 и 14): из них 25 изображений в состоянии нормы и 25 изображений с морфологическими новообразованиями. В данной базе данных изображения уже классифицированы врачом-маммологом. Поэтому задача автоматизированной системы - выполнить обработку загруженного изображения и осуществить функцию классификации по одному из критериев:
• «нет области интереса» - соответствует блокам, в которые не попали морфологические образования, связанные с онкологическими заболеваниями;
• «есть область интереса» - соответствует блокам, у которых имеются морфологические образования, вызванные патологическими процессами.
Автоматизированная система должна подтвердить области с морфологическими образованиями.
Рисунок 13 - Изображения рентгенограмм молочной железы в состоянии нормы
Рисунок 14 - Изображения рентгенограмм молочной железы с морфологическими новообразованиями
На рисунках 15 и 16 представлены результаты сегментирования двух маммографических изображений, которые были классифицированы по критерию «нет области интереса» и «есть область интереса».
а) б)
Рисунок 15 - Результат сегментирования изображения по критерию «нет области интереса»: а) исходное изображение; б) обработанное изображение первого этапа
а) б)
Рисунок 16 - Результат сегментирования изображения по критерию «есть область интереса»: а) исходное изображение; б) обработанное изображение первого этапа
Далее просчитаем эффективность работы автоматизированной системы. В таблице 2 указано количество отнесений положительных и отрицательных результатов классификации к одному из критериев.
Таблица 2 - Результаты контрольных испытаний автоматизированной системы
Состояние Результат наблюдений Всего
Положительный Отрицательный
есть область интереса 21 4 25
нет области интереса 1 24 25
Всего 22 28 50
ДЧ = 84%, ДС = 96%, ПЗ+ = 95% , ПЗ~ = 85% , ДЭ = 90%.
Таким образом, результирующая диагностическая эффективность автоматизированной системы для сформированных контрольных изображений маммограм молочной железы составила 90 %.
Выводы. Сформированы обучающие и контрольные выборки для автоматизированной системы обработки и анализа рентгенограмм молочной железы.
В качестве текстурных характеристик классифицируемых сегментов (компонент вектора Р2) предложено использовать статистические характеристики яркости пикселей сегмента: моду (Х1),
математическое ожидание (Х2), среднеквадратическое отклонение (Х3). Проведен разведочный анализ текстурных характеристик выборок двух классов: С1 - норма и С2- новообразование.
Для проверки выборок на соответствие нормальному закону распределения были использованы программные модули пакета STATISTICA. Нормальный характер распределения подтверждался проверкой отдельных его компонент и следствием центральной предельной теоремы. Дополнительная проверка на нормальность распределения осуществлялась по критерию Колмогорова - Смирнова.
Предложена структура двухальтернативного классификатора сегментов рентгенограмм, содержащая два параллельных канала, на входы которых подается классифицируемый пример и. В верхнем канале вычисляется значение правдоподобия примера и математической модели класса С1, а в нижнем канале - величина правдоподобия этого примера математической модели класса С2. Далее формируется отношение правдоподобия, которое сравнивается с пороговым уровнем, равным единице. Если этот уровень не превышен, то принимается решение о соответствии примера и классу С2. В противном случае пример относят к классу С1.
Проведена экспериментальная апробация программного обеспечения автоматизированной системы классификации рентгенограмм МЖ по классам «нет области интереса» или «есть область интереса». Проведена экспериментальная проверка автоматизированной системы по классификации сегментов рентгенограмм молочной железы по классам «норма» и «патология». Выработан критерий оценки результатов классификации маммографических изображений. Эксперименты на контрольных выборках показали диагностическую эффективность по классам рентгенограмм «нет области интереса» - «есть область интереса» не ниже 90 %, а по классам сегментов «норма» - «патология» не ниже 91 %.
Библиографический список
1. Белых В. С. Разработка и исследование метода и алгоритмов для интеллектуальных систем классификации сложноструктурируемых изображений / В. С. Белых, М. А. Ефремов, С. А. Филист // Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. - 2016. - № 2 (19). - С. 12-24.
2. Дабагов А. Р. Метод и алгоритмы сегментации рентгенограмм молочной железы / А. Р. Дабагов, С. А. Филист, И. А. Малютина и др. // Искусственный интеллект в решении актуальных социальных и экономических проблем XXI века : сб. статей по материалам Четвертой всерос. науч.-практ. конф. - Пермь : Перм. гос. нац. исслед. ун-т, 2019. - Ч. 1. - С. 174-180.
3. Дабагов А. Р. Метод каскадной сегментации рентгенограмм молочной железы / А. Р. Дабагов, Д. С. Кондрашов, И. А. Малютина, Р. А. Томакова, С. А. Филист // Известия ЮЗГУ. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. - 2019. - Т. 9, № 1 (30). - С. 49-61.
4. Дюдин М. В. Способ выделения и классификации контуров легких на изображениях флюорограмм грудной клетки / М. В. Дюдин, С. А. Филист, П. С. Кудрявцев // Наукоемкие технологии. - 2014. - Т. 15, № 12. - С. 25-30.
5. Женщины и рак: скрининг и лечение спасают жизни. - Режим доступа: http://www.euro.who.int/ru/health-topics/noncommunicable-diseases/cancer/news/news/2011/11/women-and-cancer-screening-and-treatment-save-lives, свободный. - Заглавие с экрана. - Яз. рус. (дата обращения: 16.04.2019).
6. Жук С. В. Обзор современных методов сегментации растровых изображений / С. В. Жук // Известия Волгоградского государственного технического университета. - 2009. - № 6. - С. 115-118.
7. Корниенко В. С. Математическая статистика. Решение задач по теме: «Проверка статистических гипотез»: методическая разработка / В. С. Корниенко. - Волгоград : Волгогр. гос. с.-х. акад., 2010. - 68 с.
8. Малютина И. А. Методы и алгоритмы анализа рентгенограмм грудной клетки, использующие локальные окна в задачах обнаружения патологий / И. А. Малютина, А. А. Кузьмин, О. В. Шаталова // Прикаспийский журнал: управление и высокие технологии. - 2017. - № 3 (39). - С. 131-138.
9. Садыков С. С. Алгоритм текстурной сегментации для выявления областей кисты на маммограммах / С. С. Садыков, Ю. А. Буланова, А. Г. Романов // Алгоритмы, методы и системы обработки данных. - 2013. -№ 19. - С. 50-55.
10. Томакова Р. А. Интеллектуальные технологии сегментации и классификации биомедицинских изображений/ Р. А. Томакова, С. Г. Емельянов, С. А. Филист. - Курск : Юго-Зап. гос. ун-т, 2012. - 202 с.
11. Филист С. А. Анализ гистологических изображений посредством морфологических операторов, синтезированных на основе преобразования Фурье и нейросетевого моделирования / С. А. Филист, Р. А. То-макова, С. А. Горбатенко // Биотехносфера. - 2010. - № 3 (9). - С. 54-60.
12. Филист С. А. Гибридные интеллектуальные модели для сегментации изображений рентгенограмм грудной клетки/ С. А. Филист, Р. А. Томакова, С. В. Дегтярев, А. Ф. Рыбочкин // Медицинская техника. -2017. - № 5. - С. 41-45.
13. Филист С. А. Метод классификации сложноструктурируемых изображений на основе самоорганизующихся нейросетевых структур / С. А. Филист, Р. А. Томакова, О.В. Шаталова, А. А. Кузьмин, К. Д. А. Кассим // Радиопромышленность. - 2016. - № 4. - С. 57-65.
14. Филист С. А. Нечеткая сетевая модель морфологического оператора для формирования границ сегментов /С. А.Филист, Р. А.Томакова, В. В. Руденко // Научные ведомости БелГУ. Сер. История. Политология. Экономика. Информатика. - 2011. - № 1 (96). - С. 188-195.
15. Филист С. А. Программное обеспечение автоматической классификации рентгенограмм грудной клетки на основе гибридных классификаторов / С. А. Филист, Р. А. Томакова, И. В. Дураков // Экология человека. - 2018. - № 36. - С. 59-66.
16. Филист С. А. Развитие методологии бустинга для классификации флюорограмм грудной клетки / С. А. Филист, П. С. Кудрявцев, А. А. Кузьмин // Биомедицинская радиоэлектроника. - 2016. - № 9. - С. 10-15.
17. Филист С. А. Клеточные процессоры в классификаторах многоканальных изображений / С. А. Филист, Р. А. Томакова, А. Н. Брежнева, И. А. Малютина, В. А. Алексеев // Радиопромышленность. - 2019. -Т. 29, № 1. - С. 45-52.
18. Чернова Н. И. Математическая статистика : учебное пособие / Н. И. Чернова. - Новосибирск : Но-восиб. гос. ун-т, 2007. - 148 с.
19. Mammographic Image Analysis Society (MIAS). - Режим доступа: https://www.repository. cam.ac.uk/handle/1810/250394, свободный. - Заглавие с экрана. - Яз. англ. (дата обращения: 16.04.2019).
20. The mini-MLAS database of mammograms. - Режим доступа: http://peipa.essex.ac.uk/info/mias.html, свободный. - Заглавие с экрана. - Яз. англ. (дата обращения: 16.04.2019).
References
1. Belykh V. S., Efremov M. A., Filist S. A. Razrabotka i issledovanie metoda i algoritmov dlya intellektual-nykh sistem klassifikatsii slozhnostrukturiruemykh izobrazheniy [Development and research of a method and algorithms for intelligent classification systems for complexly structured images]. Izvestiya Yugo-Zapadnogo gosudar-stvennogo universiteta. Seriya: Upravlenie, vychislitelnaya tekhnika, informatika. Meditsinskoe priborostroenie [Proceedings of the Southwest State University. Series: Control, Computer Engineering, Information Science. Medical Instruments Engineering], 2016, no. 2 (19), pp. 12-24.
2. Dabagov A. R., Filist S. A., Malyutina I. A. et al. Metod i algoritmy segmentatsii rentgenogramm mo-lochnoy zhelezy [Method and algorithms for segmentation of breast radiographs]. Iskusstvennyy intellekt v reshenii aktualnykh socialnykh i ekonomicheskikh problem XXI veka : sbornik statey po materialam Chetvertoy vserossiyskoy nauchno-prakticheskoy konferentsii [Artificial Intelligence in Solving Actual Social and Economic Problems of the 21st Century : Proceedings of the Fourth All-Russian Scientific-Practical Conference]. Perm, Perm State National Research University, 2019, Part 1, pp. 174-180.
3. Dabagov A. R., Kondrashov D. S., Malyutina I. A., Tomakova R. A., Filist S. A. Metod kaskadnoy seg-mentatsii rentgenogramm molochnoy zhelezy [The method of cascading segmentation of x-rays of the mammary gland]. Izvestiya Yugo-Zapadnogo gosudarstvennogo universiteta. Seriya: Upravlenie, vychislitelnaya tekhnika, informatika. Meditsinskoe priborostroenie [Proceedings of the Southwest State University. Series: Control, Computer Engineering, Information Science. Medical Instruments Engineering], 2019, vol. 9, no. 1 (30), pp. 49-61.
4. Dyudin M. V., Filist S. A., Kudryavtsev P. S. Sposob vydeleniya i klassifikatsii konturov legkikh na izobra-zheniyakh flyuorogramm grudnoy kletki [The method of isolation and classification of the contours of the lungs on the images of chest X-ray]. Naukoemkie tekhnologii [High Technologies], 2014, vol. 15, no. 12, pp. 25-30.
5. Zhenshchiny i rak: skrining i lechenie spasayut zhizni [Women and cancer: screening and treatment save lives]. Available at: http://www.euro.who.int/ru/health-topics/noncommunicable diseases /cancer/ news/news/2011/11/women-and-cancer-screening-and-treatment-save-lives (accessed 16.04.2019).
6. Zhuk S. V Obzor sovremennykh metodov segmentatsii rastrovykh izobrazheniy [Overview of modern raster image segmentation techniques]. Izvestiya Volgogradskogo gosudarstvennogo tekhnicheskogo universiteta [News of Volgograd State Technical University], 2009, no. 6, pp. 115-118.
7. Kornienko V. S. Matematicheskaya statistika. Reshenie zadachpo teme: «Proverka statisticheskikh gipotez» [Math statistics. Problem solving on the topic: «Testing statistical hypotheses»]. Volgograd, 2010. 68 p.
8. Malyutina I. A., Kuzmin A. A., Shatalova O. V Metody i algoritmy analiza rentgenogramm grudnoy kletki, ispolzuyushchie lokalnye okna v zadachah obnaruzheniya patologiy [Methods and algorithms for the analysis of chest radiographs using local windows in the detection of pathologies]. Prikaspiyskiy zhurnal: upravlenie i vysokie tekhnologii [Caspian Journal: Control and High Technologies], 2017, no. 3 (39), pp. 131-138.
9. Sadykov S. S., Bulanova Yu. A., Romanov A. G. Algoritm teksturnoy segmentatsii dlya vyyavleniya oblastey kisty na mammogrammakh [Texture segmentation algorithm for detecting cyst areas in mammograms]. Algoritmy, metody i sistemy obrabotki dannykh [Algorithms, methods and data processing systems], 2013, no. 19, pp. 50-55.
10. Tomakova R. A., Emelyanov S. G., Filist S. A. Intellektualnye tekhnologii segmentatsii i klassifikatsii bi-omeditsinskikh izobrazheniy [Intelligent technologies for segmentation and classification of biomedical images]. Kursk, 2012. 202 p.
11. Filist S. A., Tomakova R. A., Gorbatenko S. A. Analiz gistologicheskikh izobrazheniy posredstvom mor-fologicheskikh operatorov, sintezirovannykh na osnove preobrazovaniya Fure i neyrosetevogo modelirovaniya [Analysis of histological images using morphological operators synthesized based on Fourier transform and neural network modeling]. Biotekhnosfera [Biotechnosphere], 2010, no. 3 (9), pp. 54-60.
12. Filist S. A., Tomakova R. A., Degtyarev S. V, Rybochkin A. F. Gibridnye intellektualnye modeli dlya seg-mentatsii izobrazheniy rentgenogramm grudnoy kletki [Hybrid intelligent models for segmentation of chest radiographs]. Medicinskaya tekhnika [Biomedical Engineering], 2017, no. 5, pp. 41-45.
13. Filist S. A., Tomakova R. A., Shatalova O. V., Kuzmin A. A., Kassim K. D. A. Metod klassifikatsii slozhnostrukturiruemykh izobrazheniy na osnove samoorganizuyushchikhsya neyrosetevykh struktur [Classification method for complexly structured images based on self-organizing neural network structures]. Radiopromyshlennost [Radio Industry], 2016, no. 4, pp. 57-65.
14. Filist S. A., Tomakova R. A., Rudenko V V Nechetkaya setevaya model morfologicheskogo operatora dlya formirovaniya granits segmentov [Fuzzy network model of a morphological operator for forming segment boundaries]. Nauchnye vedomosti BelGU. Seriya. Istoriya. Politologiya. Ekonomika. Informatika [Scientific Sheets of BelSU. Series. History. Political Science. Economy. Informatics], 2011, no. 1 (96), pp. 188-195.
15. Filist S. A., Tomakova R. A., Durakov I. V. Programmnoe obespechenie avtomaticheskoy klassifikatsii rentgenogramm grudnoy kletki na osnove gibridnykh klassifikatorov [Hybrid Classification Chest Radiography Software]. Ekologiya cheloveka [Human Ecology], 2018, no. 36, pp. 59-66.
16. Filist S. A., Kudryavtsev P. S., Kuzmin A. A. Razvitie metodologii bustinga dlya klassifikatsii flyuoro-gramm grudnoy kletki [Development of a boosting methodology for the classification of chest fluorograms]. Bio-medicinskaya radioelektronika [Biomedical Radioelectronics], 2016, no. 9, pp. 10-15.
17. Filist S. A., Tomakova R. A., Brezhneva A. N., Malyutina I. A., Alekseev V. A. Kletochnye protsessory v klassifikatorakh mnogokanalnykh izobrazheniy [Cellular Processors in Multichannel Image Classifiers]. Radi-opromyshlennost [Radio Industry], 2019, vol. 29, no. 1, pp. 45-52.
18. Chernova N. I. Matematicheskaya statistika [Math statistics]. Novosibirsk, 2007. 148 p.
19. Mammographic Image Analysis Society (MIAS). - Available at: https://www.repository. cam.ac.uk/handle/1810/250394 (accessed 16.04.2019).
20. The mini-MIAS database of mammograms. - Available at: http://peipa.essex.ac.uk/info/mias.html (accessed 16.04.2019).
УДК 621.391 + 004.021
СИСТЕМНЫЙ АНАЛИЗ МЕТОДОВ СИНХРОННОЙ ОБРАБОТКИ ИНФОРМАЦИИ В МАС-ПРОТОКОЛАХ МНОЖЕСТВЕННОГО ДОСТУПА С ИСПОЛЬЗОВАНИЕМ ПСЕВДОСЛУЧАЙНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
Статья поступила в редакцию 27.10.2019, в окончательном варианте — 12.11.2019.
Подольцев Виктор Владимирович, Астраханский государственный технический университет, 414056, Российская Федерация, г. Астрахань, ул. Татищева, 16,
аспирант, e-mail: [email protected]
В статье рассмотрены основные области применения псевдослучайных последовательностей (ПСП), сформулированы основные критерии оценки методов синхронной обработки информации в ПСП-ориентированных МАС (media access соПго1)-протоколах множественного доступа, проведен системный анализ известных методов синхронизации ПСП. Целью данной работы является обоснование необходимости повышения точности обработки синхронизирующей информации в ПСП-ориентированных МАС-протоколах систем управления и обработки информации, использующих на подуровне доступа ПСП. Показано, что рассмотренные методы, как правило, разрабатываются для реализации на физическом уровне и фактически сложны или нереализуемы на подуровне доступа к среде передачи МАС, где протоколы множественного доступа оперируют с уже принятыми и декодированными битовыми последовательностями. Рассмотрена синхронизация ПСП по методу Уорда и его модификациям, которые можно реализовать на подуровне доступа к среде передачи МАС. При синхронизации ПСП предложен метод мажоритарного декодирования га-последовательности. Его использование повышает вероятность синхронизации ПСП и требует меньших аппаратных затрат. Данный метод может быть легко реализован в системах обработки информации с ПСП-ориентированными протоколами множественного доступа.
Ключевые слова: синфазная обработка информации, среднее время поиска, вероятность правильной синхронизации, вероятность ложной синхронизации, методы синхронизации ПСП, метод мажоритарной обработки информации, метод Уорда
SYSTEM ANALYSIS OF METHODS OF SYNCHRONOUS PROCESSING OF INFORMATION IN MAC PROTOCOLS OF MULTIPLE ACCESS USING PSEUDORANDOM SEQUENCES
The article was received by the editorial board 27.10.2019, in the final version — 12.11.2019.
Podoltsev Viktor V., Astrakhan State Technical University, 16 Tatishchev St., Astrakhan, 414056, Russian Federation,
post-graduate student, e-mail: [email protected]
The article considers the main areas of application of pseudorandom sequences (PSP), formulates the main criteria for evaluating methods of synchronous information processing in PSP-oriented MAC (media access control) multiple access protocols, and carries out a system analysis of known methods for synchronizing PSP. The aim of this