Научная статья на тему 'Алгоритмы формирования двумерных признаков диагностики заболеваний молочных желез методами комбинированной радиотермометрии'

Алгоритмы формирования двумерных признаков диагностики заболеваний молочных желез методами комбинированной радиотермометрии Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
101
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МИКРОВОЛНОВАЯ РАДИОТЕРМОМЕТРИЯ / ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ / СКРИНИНГ МОЛОЧНОЙ ЖЕЛЕЗЫ / ЭКСПРЕСС-ДИАГНОСТИКА ЗЛОКАЧЕСТВЕННЫХ ОПУХОЛЕЙ / МАММОЛОГИЯ / MICROWAVE RADIOTHERMOMETRY / DATA MINING / BREAST SCREENING / EXPRESS DIAGNOSTICS OF MALIGNANT BREAST TUMORS / MAMMOLOGY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Зенович Андрей Васильевич, Батурин Николай Александрович, Медведев Денис Андреевич, Петренко Александр Юрьевич

Работа является частью группового проекта по созданию консультативной информационной системы, помогающей врачу диагностировать онкологические заболевания молочных желез методом комбинированной термометрии. Для использования в алгоритмах диагностики необходимо сформировать пространство характеристических и высокоинформативных признаков диагностики. В данной работе излагаются три алгоритма построения двумерных признаков и приводятся результаты вычислительных экспериментов, позволяющих оценить чувствительность и специфичность таких признаков. Комбинируя лучшие пары одномерных признаков, удается получить специфичность и чувствительность 70-80 %.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Зенович Андрей Васильевич, Батурин Николай Александрович, Медведев Денис Андреевич, Петренко Александр Юрьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ALGORITHMS FOR THE FORMATION OF TWO-DIMENSIONAL CHARACTERISTIC AND INFORMATIVE SIGNS OF DIAGNOSIS OF DISEASES OF THE MAMMARY GLANDS BY THE METHODS OF COMBINED RADIO THERMOMETRY

Current paper is a part of group project to create a consultative information system that helps doctors to diagnose breast cancer with combined thermometry. For use in diagnostic algorithms, it is necessary to form a space of characteristic and highly informative diagnostic features. This paper outlines three algorithms for constructing two-dimensional features and presents the results of computational experiments that allow one to estimate the sensitivity and specificity of such features. Combining the best pairs of one-dimensional signs, it is possible to obtain the specificity and sensitivity of 70-80 %.

Текст научной работы на тему «Алгоритмы формирования двумерных признаков диагностики заболеваний молочных желез методами комбинированной радиотермометрии»

www.volsu.ru

МОДЕЛИРОВАНИЕ, ИНФОРМАТИКА И УПРАВЛЕНИЕ

DOI: https://doi.org/10.15688/mpcm.jvolsu.2018.4.4

УДК 004.89 ББК 55.6

о

см

АЛГОРИТМЫ ФОРМИРОВАНИЯ ДВУМЕРНЫХ ПРИЗНАКОВ ДИАГНОСТИКИ ЗАБОЛЕВАНИЙ МОЛОЧНЫХ ЖЕЛЕЗ МЕТОДАМИ

о __________л

КОМБИНИРОВАННОЙ РАДИОТЕРМОМЕТРИИ1

Андрей Васильевич Зенович

Доцент кафедры фундаментальной информатики и оптимального управления,

Волгоградский государственный университет

fiou@volsu.ru

просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация Николай Александрович Батурин

® Студент кафедры фундаментальной информатики и оптимального управления,

Волгоградский государственный университет fiou@volsu.ru

просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация

< Ч

т

со

9 Денис Андреевич Медведев

ч

^ Студент кафедры фундаментальной информатики и оптимального управления,

., Волгоградский государственный университет

fiou@volsu.ru

^ просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация

к

а ^

Е-

^ Александр Юрьевич Петренко

ш <

к

со

©

Студент кафедры фундаментальной информатики и оптимального управления,

Волгоградский государственный университет

fiou@volsu.ru

просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация

Аннотация. Работа является частью группового проекта по созданию консультативной информационной системы, помогающей врачу диагностировать онкологические заболевания молочных желез методом комбинированной термометрии. Для использования в алгоритмах диагностики необходимо сформировать пространство характеристических и высокоинформативных признаков диагностики. В данной работе излагаются три алгоритма построения двумерных признаков и приводятся результаты вычислительных экспериментов, позволяющих оценить чувствительность и специфичность таких признаков. Комбинируя лучшие пары одномерных признаков, удается получить специфичность и чувствительность 70-80 %.

Ключевые слова: микроволновая радиотермометрия, интеллектуальный анализ данных, скрининг молочной железы, экспресс-диагностика злокачественных опухолей, маммология.

Введение

В данное время интенсивно развивается диагностика различных заболеваний на базе комбинированной (радио- и инфракрасной) термометрии [3]. Используемый для этих целей диагностический комплекс РТМ-01-РЭС позволяет проводить диагностику на основе измерения температур кожных покровов в ИК-диапазоне и внутренних температур на глубине до 5 см в РТМ-диапазоне. Детальное исследование температурных полей пациента позволяет врачу зафиксировать температурные аномалии, которые зачастую являются признаками серьезных, в том числе онкологических заболеваний. Создателями комплекса разработана методика диагностики заболеваний молочных желез при помощи измерения набора температур в РТМ- и ИК-диапазонах. Достоинствами данной методики является неинвазивный характер обследования, полная безвредность для пациентки и возможность обнаруживать температурные аномалии, порожденные опухолями малых размеров (несколько миллиметров).

Обследование пациентки начинается с измерения температур в опорных точках Т1 и Т2, расположенных в центре грудной клетки, а также в 9 точках каждой молочной железы и в аксиллярной области (см. рис. 1). Измерение проводится в РТМ- и ИК-диапазонах, так что каждому пациенту соответствует набор из 44 температур. По данным температурам строится тепловая карта молочных желез пациентки, по которой специалист выявляет температурные аномалии, соответствующие предполагаемым опухолям.

Так как метод выявляет опухоли на ранней стадии и безвреден для организма пациентки, логично использовать его при профилактических медицинских осмотрах сотрудников, которые проводятся ежегодно в большинстве государственных учреждений и частных организаций. К сожалению, для постановки диагноза необходим специалист-маммолог высокой квалификации, знакомый с методом комбинированной радиотермометрии. Для массового применения метода необходимо создание электронной консультативной системы с элементами искусственного интеллекта, которая помогала бы врачу общей практики поставить предварительный диагноз. Такая система последние несколько лет разрабатывается в ВолГУ научным коллективом под руководством доктора физико-математических наук А.Г. Лосева (см., например, [2; 6]). На данный момент в системе реализованы три различных алгоритма диагностики, принятие решений

в системе производится методом взвешенного голосования, реализована возможность встраивания в систему других алгоритмов диагностики.

Рис. 1. Схема обследования молочной железы

Как было показано многочисленными вычислительными экспериментами, диагностика непосредственно по набору температур не позволяет достичь удовлетворительной чувствительности и специфичности алгоритма, поэтому для адекватной диагностики необходимо использовать высокоинформативные признаки.

1. Понятие о многомерных признаках

Высокоинформативные признаки строятся путем количественного моделирования качественных признаков заболевания, выявленных специалистами-маммологами [3]. К ним относятся повышенная разница температур сосков, повышенная величина термоасимметрии между одинаковыми областями правой и левой молочной железы, повышенный разброс температур между отдельными точками молочной железы, повышенная температура соска по сравнению со средней температурой молочной железы, повышенная разница кожной и глубинной температуры и некоторые другие.

Для адекватной диагностики представляется логичным изучать области изменения вектор-функций, каждая компонента которых моделирует один из указанных медицинских признаков. В простейшем случае можно изучать одну моделирующую функцию, вычисляя ее значения для каждого пациента из обучающей выборки и находя интервал, принадлежность которому дает высокую вероятность того, что пациент здоров.

Таким образом мы приходим к идее многомерного высокоинформативного признака заболевания.

Обозначим ¿о-^э внутренние температуры (РТМ) левой молочной железы, ¿ю—аэ — внешние температуры (ИК) левой молочной железы, ¿20-£29 — внутренние температуры правой молочной железы, ¿30-£3д — внешние температуры правой. Вторая цифра номера очередной температуры равна номеру области на рисунке 1, в которой измеряется данная температура. Пусть ¿40, ¿41 — значение РТМ температур в опорных точках Т1 и Т2, а Ь42, ¿43 — значение ИК-температур в этих точках. Таким образом, ^'-му пациенту

соответствует вектор из 44-х температур ^¿0,^1,...,^). Пусть обучающая выборка

состоит из п пациентов, первые к из которых являются здоровыми.

Пусть — q-я исследуемая вектор-функция, рассматриваемая на множестве век-

торов ttq = К tJQ,t{, . . . 3 )}. Здесь j = l, 2,...,п. Обозначим // значение q-ik моделирующей вектор-функции на температурных данных j-го пациента.

Назовем высокоинформативным признаком тройку (fq,V,X), где X — «информативная» область множества значений функции fq, V = I(fq,Х) — информативность признака. Под информативностью понимается числовая функция, которая показывает, насколько хорошо указанный признак отделяет класс «больных» от класса «здоровых». При построении признаков использовались статистическая, эвристическая, энтропийная информативность, их различные комбинации, а также некоторые другие функции (см. [6]).

Будем говорить, что признак выполнен для j-го пациента, если /J принадлежит X. Выполнение каждого признака повышает вероятность того, что пациент болен.

В одномерном случае, когда X является подмножеством R, а моделирующая функция fq является обычной одномерной функцией, технология получения и применения соответствующих признаков детально разработана (см. [6]), реализован соответствующий модуль, который встроен в консультативную информационную систему. С геометрической точки зрения задача заключается в том, чтобы найти отрезок действительной оси, на котором расположены значения функции fq подавляющего большинства «здоровых» пациентов из обучающей выборки и небольшого количества «больных». Для размерности 2 и выше задача становится нетривиальной.

Детальнее рассмотрим задачу построения двумерных высокоинформативных признаков. В этом случае значение вектор-функции fq для каждого пациента представляется точкой координатной плоскости. Фактически можно предположить, что координатная плоскость изначально раскрашена в два цвета (синий соответствует значениям fq для «здоровых» пациентов, красный — для «больных», причем логично предполагать, что множество синих точек образует выпуклую область V). Нам известен цвет конечного множества точек плоскости, соответствующих пациентам из обучающей выборки. Требуется найти алгоритм определения цвета каждой точки плоскости, при котором множество синих точек с хорошей точностью приближает область V.

В работе предложено три алгоритма решения данной задачи. Первый подход заключается в использовании кластеризации с помощью нейронных сетей. Второй делит точки обучающей выборки на кластеры с помощью известного алгоритма DBSCAN (Density-based spatial clustering of applications with noise) [1]. Третий подход заключается в построении семейства сужающихся эллипсов.

2. Моделирующие функции одномерных признаков, использующиеся для построения двумерных

На данный момент моделирующие функции одномерных признаков исследованы достаточно хорошо [6], получено около полутора тысяч моделирующих функций. Функции разделены на несколько групп. Помимо групп, моделирующих известные качественные медицинские признаки, получена группа функций, базирующихся на физико-математических моделях поведения температурных полей. Реализованы алгоритмы минимизации наборов одномерных признаков. В качестве моделирующих функций для построения двумерных признаков целесообразно взять небольшое количество функций, каждая из которых адекватно описывает всю группу, моделирующую соответствующий медицинский признак.

В качестве примера рассмотрим функции, моделирующие термоасимметрию. Повышенное значение разности температур между одноименными точками правой и левой молочных желез могут быть описаны функциями вида — где ] = 0,..., 18.

Повышенное значение моделирующей функции при конкретном ] сигнализирует о температурной аномалии в отдельной точке сооответствующей молочной железы. Из этих функций сформируем две укрупненные моделирующие функции. ИК-термоасимметрию будет описывать РгЪ = тах(\Ъ^—tj+201), где ] = 10,..., 18, а РТМ-термоасимметрию будет описывать функция Ргв = тах(\Ъ^ — ¿,+20|), где ] = 0,..., 8. Аналогичным образом были сформированы 6 укрупненных моделирующих функций, описывающих медицинские признаки (табл. 1).

Таблица 1

Моделирующие функции, использующиеся для построения двумерных признаков

Имя функции Признак

Pr1 Повышенная (пониженная) ИК-температура соска

Pr2 Повышенная (пониженная) РТМ-температура соска

Pr3 Внутренний градиент

Pr4 Разностный аналог второй производной

Pr5 ИК-термоасимметрия

Pr6 РТМ-термоасимметрия

Выбирая пары из полученных шести функций, получаем 15 двумерных признаков. Обучающая выборка состояла из 73 «здоровых» и 56 «больных» пациентов. Эффективность проверялась на тестовой выборке из 36 «здоровых» и 27 «больных» пациентов. Для каждого двумерного признака вычислялась чувствительность Sens (доля верно диагностированных больных) и специфичность Spec (доля верно диагностированных здоровых). Мерой эффективности признака G считали среднее геометрическое чувствительности и специфичности.

3. Алгоритм кластеризации с помощью нейросетей

Рассматриваются два варианта алгоритма кластеризации. В первом варианте кластеризация проводится с помощью нейронной сети Кохонена с обучением без учителя [5]. Сеть состоит из слоя из N нейронов, каждый из которых соединен с входным вектором. Веса каждого г-го нейрона представляют собой вектор Wi = [wn,Wi2], размерность которого совпадает с размерностью входного вектора Xj = [xj1,xj2]. Количество нейронов равно числу кластеров. В нашем случае производится деление на «больных» и «здоровых», поэтому N = 2.

Обозначим W* — вектор весов на t-й итерации, Wt+1 — вектор весов на следующей (t + 1)-й итерации, n(i) = — функция скорости обучения. Легко видеть, что n(i) уменьшается с увеличением t.

Алгоритм обучения нейронной сети Кохонена без учителя ([5]) состоит в повторении последовательности из трех описанных ниже шагов до тех пор, пока веса нейронов не стабилизируются.

• Шаг 1: Выбрать Xj из выборки.

Рис. 2. Нейронная сеть Кохонена

• Шаг 2: Вычислить расстояние , Ж/) между входным вектором Х^ и вектором веса Ж/ каждого нейрона. Нейрон с наименьшим расстоянием до Х^ назовем победителем, его номер обозначим за р.

• Шаг 3: Изменить веса нейронов по формуле: Wti^x = Ж/ + К{г,р)п{^){Х^ — Ж/).

В результате обучения векторы веса всех нейронов будут центрами различных кластеров. На рисунке 3 приведен пример работы данного алгоритма для одного из двумерных признаков. Крестиками обозначены «здоровые» пациенты, галочками — «больные». Два вида значков для «здоровых» и для «больных» соответствуют пациентам обучающей и тестовой выборки. Признак демонстрирует чувствительность и специфичность выше 80 %, что является хорошим показателем.

<

+ -1

I—I +

< +

< "2 I

- Sens=0.89

Spec=0.82

- G=0.85 +Y ^ Y \ V Y

yi

+++

x * ^ЛААЛд Л x U A л A А

-10 12

ti.PTM - £/, i/iKi i = 0,...

Рис. 3. Пример работы алгоритма обучения без учителя

В качестве второй версии алгоритма рассмотрим нейронную сеть Кохонена с обучением с учителем [5; 7]. Каждому нейрону добавим метку класса. Структура сети и

алгоритм обучения останутся такими же, как и в первом алгоритме, за исключением шага 3. На шаге 3 применяем следующие правила:

• если метка У^ вектора Х^ совпала с меткой нейрона, то нейрон двигается в сторону входного вектора, = + - Ж/);

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

• иначе = Щ - ц(г)(Хз - Щ).

В результате обучения векторы веса всех нейронов будут центрами скопления векторов соответствующих классов. На рисунке 4 показан пример работы второй версии алгоритма.

100

-10 12 3 4

£/, ртм ~ £/, ик, i — 0,... ,8

Рис. 4. Пример работы алгоритма обучения с учителем

4. Кластеризация DBSCAN

Алгоритм DBSCAN (см. [1]) решает задачу разбиения данных на кластеры произвольной формы. Идея алгоритма состоит в том, что плотность точек внутри кластера намного выше, чем в областях между кластерами. Обозначим MP — минимальное количество соседних точек, необходимое для создания кластера. Соседними точками для X являются точки, расстояние от которых до точки X меньше некоторого заранее заданного радиуса £,.

Кластером А будем называть максимальный набор точек, в котором количество элементов больше MP и для каждой пары точек х,у из А существует цепочка {х, г1,..., гп,у} такая, что расстояние между любыми двумя подряд идущими членами этой цепочки меньше £,.

При данном подходе автоматически выявляются потенциальные выбросы. Ими становятся точки, не попавшие ни в один из кластеров, а, следовательно, находящиеся далеко от основных скоплений точек.

Алгоритм поиска кластеров состоит из следующих шагов:

• Шаг 1: Взять любую точку из выборки. Если она посещена или принадлежит

какому-либо кластеру, повторить Шаг 1, иначе перейти на Шаг 2.

• Шаг 2: Отметить текущую точку как посещенную. Если количество соседей текущей точки меньше MP, вернуться на Шаг 1, иначе объявить эту точку началом нового кластера и перейти на Шаг 3.

• Шаг 3: Если нет не посещенных соседей для этой точки, перейти на Шаг 4, иначе отметить всех соседей как принадлежащих текущему кластеру. Взять не посещенную точку, принадлежащую к группе «соседние», отметить ее как посещенную и найти всех ее соседей. Если количество соседей не меньше, чем MP, то перейти на Шаг 3 с этими точками, иначе отметить их как принадлежащие текущему кластеру и вернуться на один уровень рекурсии назад.

• Шаг 4: Если в выборке остались не посещенные точки, перейти на Шаг 1, иначе отметить все точки вне кластеров как выбросы и закончить работу алгоритма.

После кластеризации пациент из тестовой выборки считался «больным», если он попадал в кластер с преобладающим числом «больных». В противном случае он считался «здоровым». На рисунке 5 показан пример работы алгоритма. Разными значками обозначены элементы различных кластеров.

X X Xх

щ \щ

Щ Vs

+ т*

Х X

-1 0 1 2 3 4 5

Рис. 5. Результат кластеризации методом DBSCAN В таблице 2 приведены результаты проверки алгоритма на тестовой выборке.

Рис. 6. Изменение эффективности при уменьшении количества «здоровых» пациентов ISSN 2587-6325. Математ. физика и компьютер. моделирование. 2018. T. 21. № 4 51

Таблица 2

Результаты работы алгоритма кластеризации методом DBSCAN

Признаки Брес Ргес С Кол-во кластеров MP Кол-во выбросов

Pг1 и Pг3 0,68 0,79 0,73 0,29 6 3 50

Pг1 и Pг4 0,51 0,75 0,62 0,59 3 3 11

Pг2 и Pг1 0,86 0,71 0,79 0,37 6 3 19

Pг2 и Pг3 0,51 0,82 0,65 0,54 2 4 10

Pг2 и Pг4 0,68 0,93 0,79 0,38 6 3 17

Pг3 и Pг4 0,81 0,86 0,83 0,24 6 3 28

Pг5 и Pг1 0,81 0,32 0,51 1,15 3 20 20

Pг5 и Pг2 0,81 0,39 0,56 0,81 2 13 16

Pг5 и Pг3 0,70 0,93 0,81 0,32 5 3 34

Pг5 и Pг4 0,95 0,46 0,66 0,37 8 3 25

Pг6 и Pг1 0,89 0,46 0,64 0,65 3 3 13

Pг6 и Pг2 0,57 0,93 0,73 0,31 7 3 35

Pг6 и Pг3 0,89 0,57 0,71 0,50 3 3 16

Pг6 и Pг4 0,41 1,00 0,64 0,64 2 12 17

Pг6 и Pг5 0,68 0,71 0,69 0,21 9 3 52

5. Построение областей для двумерных признаков методом

сужающихся эллипсов

Некоторые алгоритмы построения областей для двумерных признаков реализованы в [4]. Алгоритм, предложенный в данной работе, базируется на аналогичных идеях и является улучшением алгоритмов из [4].

Алгоритм начинается с построения основного эллипса, внутри которого лежат все «здоровые» пациенты из обучающей выборки. Далее необходимо сужать данный эллипс с целью достижения максимальной эффективности. Очевидная идея заключается в том, чтобы последовательно выбрасывать самые удаленные «здоровые» точки, проводить эллипс, включающий все оставшиеся, а потом варьировать (уменьшать) полуоси. На рисунке 6 приведен график зависимости эффективности от количества выброшенных точек. Монотонной зависимости не наблюдается, поэтому необходимо сохранять эллипс с максимальной эффективностью для каждого количества выброшенных точек, и из них выбирать наилучший.

Окончательная версия алгоритма состоит из следующих шагов:

• Шаг 1: Строим эллипс минимальной площади, внутри которого лежат точки всех «здоровых» пациентов из обучающей выборки, с помощью известного алгоритма Хачияна [8].

• Шаг 2: Считаем для каждой точки сумму расстояний от нее до всех остальных.

• Шаг 3: Исключаем точку с наибольшей суммой.

• Шаг 4: Перестраиваем эллипс по оставшимся точкам.

• Шаг 5: Сужаем построенный эллипс. Оставляя неизменным центр эллипса и направление его главных осей, варьируем его полуоси. Получаем двупараметрическое семейство эллипсов, среди которых выбираем эллипс с наибольшей эффективностью. Сохраняем его.

Таблица 3

Результаты работы алгоритма сужающихся эллипсов

Названия пары признаков Sens Spec G

Рг6-Рг5 0,85 0,81 0,83

Рг6-Рг2 0,78 0,78 0,78

Рг6-Рг1 0,56 0,89 0,70

Рг6-Рг3 0,85 0,69 0,77

Рг6-Рг4 0,74 0,94 0,84

Рг5-Рг2 0,59 0,89 0,73

Рг5-Рг1 0,59 0,94 0,75

Рг5-Рг3 0,44 0,92 0,64

Рг5-Рг4 0,78 0,94 0,86

Рг2-Рг1 0,85 0,83 0,84

Рг2-Рг3 0,78 0,72 0,75

Рг2-Рг4 0,81 0,83 0,82

Рг1-Рг3 0,78 0,72 0,75

Рг1-Рг4 0,52 0,89 0,68

Рг3-Рг4 0,63 0,89 0,75

Рис. 7. Пример работы алгоритма

• Шаг 6: Если не достигнуто минимальное число точек, по которому можно построить эллипс, из оставшихся точек исключаем точку с наибольшей суммой расстояний и переходим к Шагу 4.

Из сохраненных на шаге 5 эллипсов выбираем эллипс с наибольшей эффективностью.

На рисунке 7 приведен пример работы алгоритма. Два типа крестиков соответствуют «здоровым» пациентам обучающей и тестовой выборки, квадраты и круги — «больным» пациентам обучающей и тестовой выборки. Большой эллипс охватывает всех «здоровых» пациентов из обучающей выборки, малый эллипс — область, на которой до-

стигается максимальная эффективность.

В таблице 3 приведены результаты работы данного алгоритма. Лучшие признаки дают эффективность порядка 80-85 %.

ПРИМЕЧАНИЕ

1 Исследование выполнено при финансовой поддержке РФФИ и Администрации Волгоградской области, проект № 18-47-340004 р_а «Управление качеством классификации в диагностике рака молочной железы по многомерным данным микроволновой радиотермометрии».

СПИСОК ЛИТЕРАТУРЫ

1. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика / Е. И. Большакова, Э. С. Клышинский, Д. В. Ландэ, А. А. Носков, О. В. Пескова, Е. В. Ягунова. - М. : МИЭМ, 2011. - 272 с.

2. Алгоритмы принятия решений в консультативной интеллектуальной системе диагностики молочных желез / А. В. Зенович, В. А. Глазунов, А. С. Опарин, Ф. Г. Примаченко // Вестник Волгоградского государственного университета. Серия 1, Математика. Физика. - 2016. - № 6 (37). - C. 141-154. - DOI: 10.15688/jvolsu1.2016.6.13.

3. Веснин, С. Г. Современная микроволновая радиотермометрия молочных желез / С. Г. Веснин, М. А. Каплан, Р. С. Авакян // Опухоли женской репродуктивной системы. - 2008. - № 3. - C. 28-33.

4. Интеллектуальный анализ многомерных термометрических данных в медицинской диагностике / А. Г. Лосев, А. В. Зенович, О. А. Бочкарев, В. В. Левшинский // Вестник Волгоградского государственного университета. Серия 1, Математика. Физика. - 2016. -№ 5 (36). - C. 150-161. - DOI: 10.15688/jvolsu1.2016.5.13.

5. Кохонен, Т. Самоорганизующиеся карты / Т. Кохонен. - М. : БИНОМ. Лаборатория знаний, 2008. - 655 с.

6. Лосев, А. Г. Интеллектуальный анализ данных микроволновой радиотермометрии в диагностике рака молочной железы / А. Г. Лосев, В. В. Левшинский // Математическая физика и компьютерное моделирование. - 2017. - Т. 20, № 5. -C. 49-62. - DOI: 10.15688/mpcm.jvolsu.2017.5.6.

7. Ясницкий, Л. Н. Интеллектуальные системы / Л. Н. Ясницкий. - М. : Лаборатория знаний, 2016. - 221 с.

8. Khachiyan, L. G. Rounding of Polytopes in the Real Number Model of Computation / L. G. Khachiyan // Mathematics of Operations Research. - 1996. - Vol. 21, № 2. -P. 307-320.

REFERENCES

1. Bolshakova E.I., Klyshinskiy E.S., Lande D.V., Noskov A.A., Peskova O.V., Yagunova E.V. Avtomaticheskaya obrabotka tekstov na estestvennom yazyke i kompyuternaya lingvistika [Automatic Processing of Texts in Natural Language and Computational Linguistics]. Moscow, MIEM Publ., 2011. 272 p.

2. Zenovich A.V., Glazunov V.A., Oparin A.S., Primachenko F.G. Algoritmy prinyatiya resheniy v konsultativnoy intellektualnoy sisteme diagnostiki molochnykh zhelez [Algorithms of Decision-Making in Intelligent Advisory System for Diagnostics of the Mammary Glands]. Vestnik Volgogradskogo gosudarstvennogo universiteta. Seriya 1, Matematika. Fizika [Science Journal of Volgograd State University. Mathematics. Physics], 2016, no. 6 (37), pp. 141-154. DOI: 10.15688/jvolsu1.2016.6.13.

3. Vesnin S.G., Kaplan M.A., Avakyan R.S. Sovremennaya mikrovolnovaya radiotermometriya molochnykh zhelez [Modern Microwave Radiometry of the Mammary Glands]. Opukholi zhenskoy reproduktivnoy sistemy, 2008, no. 3, pp. 28-33.

4. Losev A.G., Zenovich A.V., Bochkarev O.A., Levshinskiy V.V. Intellektualnyy analiz mnogomernykh termometricheskikh dannykh v meditsinskoy diagnostike [Multidimentional Thermometric Data Mining in Medical Diagnostics]. Vestnik Volgogradskogo gosudarstvennogo universiteta. Seriya 1, Matematika. Fizika [Science Journal of Volgograd State University. Mathematics. Physics], 2016, no. 5 (36), pp. 150-161. DOI: 10.15688/jvolsu1.2016.5.13.

5. Kokhonen T. Samoorganizuyushchiesya karty [Self-Organizing Maps]. Moscow, BINOM. Laboratoriya znaniy Publ., 2008. 655 p.

6. Losev A.G., Levshinskiy V.V. Intellektualnyy analiz dannykh mikrovolnovoy radiotermometrii v diagnostike raka molochnoy zhelezy [Data Mining of Microwave Radiometry Data in the Diagnosis of Breast Cancer]. Matematicheskaya fizika i kompyuternoe modelirovanie [Mathematical Physics and Computer Simulation], 2017, vol. 20, no. 5, pp. 49-62. DOI: 10.15688/mpcm.jvolsu.2017.5.6.

7. Yasnitskiy L.N. Intellektualnye sistemy [Intellectual Systems]. Moscow, Laboratoriya znaniy Publ., 2016. 221 p.

8. Khachiyan L.G. Rounding of Polytopes in the Real Number Model of Computation. Mathematics of Operations Research, 1996, vol. 21, no. 2, pp. 307-320.

ALGORITHMS FOR THE FORMATION OF TWO-DIMENSIONAL CHARACTERISTIC AND INFORMATIVE SIGNS OF DIAGNOSIS OF DISEASES OF THE MAMMARY GLANDS BY THE METHODS OF COMBINED RADIO THERMOMETRY

Andrey Vasilyevich Zenovich

Associate Professor, Department of Fundamental Computer Science and the Optimal Control, Volgograd State University fiou@volsu.ru

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Prosp. Universitetsky, 100, 400062 Volgograd, Russian Federation

Nikolay Aleksandrovich Baturin

Student, Department of Fundamental Computer Science and the Optimal Control, Volgograd State University fiou@volsu.ru

Prosp. Universitetsky, 100, 400062 Volgograd, Russian Federation

Denis Andreevich Medvedev

Student, Department of Fundamental Computer Science and the Optimal Control, Volgograd State University fiou@volsu.ru

Prosp. Universitetsky, 100, 400062 Volgograd, Russian Federation

Alexander Yuryevich Petrenko

Student, Department of Fundamental Computer Science and the Optimal Control, Volgograd State University fiou@volsu.ru

Prosp. Universitetsky, 100, 400062 Volgograd, Russian Federation

Abstract. Current paper is a part of group project to create a consultative information system that helps doctors to diagnose breast cancer with combined thermometry. For use in diagnostic algorithms, it is necessary to form a space of characteristic and highly informative diagnostic features. This paper outlines three algorithms for constructing two-dimensional features and presents the results of computational experiments that allow one to estimate the sensitivity and specificity of such features. Combining the best pairs of one-dimensional signs, it is possible to obtain the specificity and sensitivity of 70-80 %.

Key words: microwave radiothermometry, data mining, breast screening, express diagnostics of malignant breast tumors, mammology.

i Надоели баннеры? Вы всегда можете отключить рекламу.