Научная статья на тему 'Алгоритм восстановления пробелов в массиве медицинских данных больных бронхолегочной недостаточностью'

Алгоритм восстановления пробелов в массиве медицинских данных больных бронхолегочной недостаточностью Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
129
30
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Алгоритм восстановления пробелов в массиве медицинских данных больных бронхолегочной недостаточностью»

Краткое сообщение

где

Gd (г,а) =

f (xу)=У У Рь(г,о)-ЖАr=V(x-02 +(y-if,

i j

- функция отклика фильтра Гаусса, а -

1

2 пег2

его среднеквадратическое отклонение. Для цифровых изображений с размерами МхК точек процесс фильтрации представляется в виде свертки функции яркости изображения с маской Оп, которая является дискретной аппроксимацией фильтра Гаусса с о=1,4:

Г(х,У) = 755ЕЕ Г(х + } - 3у +' - 3)' £ои, х = 1М, У = 1^

1551

Gd = [ £%] =

4

9

12

9

4

На втором этапе ведется пространственное дифференцирование отфильтрованного изображения / (х,у) для выделения перепадов яркости, соответствующих границам объектов на изображении. Для дифференцирования используется масочный оператор Собела, имеющий наилучшую реакцию на ступенчатый перепад [2]. Оператор Собела имеет две маски И] и И, реагирующие на горизонтальный и вертикальный перепады яркости. В итоге формируются два поля: поле величин g(x,y), содержащее модули перепадов яркости, и поле направлений \{х,у) , содержащие для каждой точки исходного изображения угол наклона прямой, соответствующий направлению перепада яркости, к оси абсцисс. Формирование полей g (х,у) и V (х,у) выполняется как

g( х, у) = д/ ¿!2( х, у)+ ^( х, у),

у(х, у) = ага^ ±

4(х,у)=/(ху)• Иі =ЕЕ/’(х+і-2 у+к-2)'і’'=1,2, і=1 к=1

h ii 11' '1 0 -1 А і2 h3' ' 1 2 1 ]

H= А, 4 14 = 20 -2 ’ H = ii A2 h3 = 000

Az Ü3 1 0 -1 hL h2 -1 -2 -1

На 3-м этапе ведут полутоновую скелетизацию поля g (x,y), называемого градиентным изображением, для формирования скелетного градиентного изображения, где контурные линии объектов удовлетворяют условию односвязности [2]. На изображении g (x,y) удаляются точки, яркости которых <яркостей двух соседних точек в направлении антиградиента контурной линии

,, , ¡g&y), (gxy)>gx+jl,y+i))^(g(x,y)>gx+j2,y+i2))

g (x, y) = ,

[QCgCx y) <g(x+j1,y+i))^(g(x,y)<g(x+j2, y+hl)

где приращения координат ii, i2J1J2 определяются как І = int(sin(v(x,y))), i2 = -ij,

ji = int(cos(v(xy»), j2 = -jj.

Заключительным этапом является бинаризация скелетного градиентного изображения g'(x,y) с помощью глобального порогового оператора с гистерезисом. Оператор использует 2 пороговых величины Ti и Т2 (Т2 >Ті), пороговое значение Т2 применяется при переходе от однородной области к контуру, а значение Т1

- при обратном. Если в 8-связной окрестности рассматриваемой точки найдется хотя бы одна точка контура, то использу.п значение порога Ti, иначе - Т2. Бинарное изображение b(x,y):

b( ) IX g'O, y1 >TО, y,b) — —

b(x, y) H , x = 1, M, y = 1, N,

[0, g’ (x, y) < T (x, y, b)

T( b( )) |T1, 3i,j(b(x +h,y + j) =j) . —TT . -n

Tix, y,b(x, y)) = << , 1 = -1,1, j = -1,1,

[T2, Vі; j(b(x + Uy + j) = 0)

Пороговая величина T2 определяется с помощью метода От-су [3], величина Ti - с помощью а-метода с коэффициентом детализации к = 1 [4]. Пример выделения контура голени на изображении см. на рис. 2, где на 2,а - исходное полутоновое изображение голени, на 2,б - бинарное контурное изображение.

а) б)

Рис. 2. Выделение контуров голени

По окончании процедуры выделения контуров на трех изображениях голени, полученных от ДИ1 - ДИ3, выполняется определение 3-мерных координат опорных точек, формирование 3-мерной поверхности голени и вычисление ее объема как суммы объемов элементарных тетраэдров, составляющих голень.

Затем в области подколенной ямки накладывается компрессионная манжета с давлением 40 мм рт. ст. до полного прекращения кровотока по поверхностным венам. Через 5 минут производится повторное измерение объема голени с выводом разности объемов до и после пережатия поверхностных вен на блок индикации. Если увеличение объема после пережатия поверхностных вен >15%, то диагностируется тромбоз глубоких вен голени.

Устройство позволяет проводить в течение 15 мин. неива-зивную диагностику тромбоза глубоких вен голени, имеет высокую мобильность (масса 0,5 кг) и низкую стоимость (5 тыс. руб.) по сравнению с аналогами на базе ПК или ноутбука.

Литература

1. Canny J.F. // IEEE Trans. Pattern Recognition and Machine Intelligence.- 1986.- Vol. 8, №6.- P. 679-698.

2. Методы цифровой обработки изображений / С.В. Дегтярев и др..- Курск: КурскГТУ, 2001.- 167с.

3. Otsu N. // IEEE Trans. Syst . Man Cybern.- 1979.- Vol. 9, №1.- P. 62-66.

4. Miroshnichenko S.Yu.et al. // Pattern Recognition and Image Analysis.- 2005.- Vol. 15, №1.- P. 249-251.

УДК 681.3

АЛГОРИТМ ВОССТАНОВЛЕНИЯ ПРОБЕЛОВ В МАССИВЕ

МЕДИЦИНСКИХ ДАННЫХ БОЛЬНЫХ БРОНХОЛЕГОЧНОЙ НЕДОСТАТОЧНОСТЬЮ

Е.В. АНДРЮНЬКИНА, В.И.ФЕДЯНИН*

Специфика медицинских данных такова, что далеко не всегда удается собрать по каждому больному все параметры, необходимые для работы. Это вызвано множеством факторов, к которым можно отнести человеческий фактор (например, очевидность для опытного врача результатов некоторого теста на основании известных результатов остальных тестов и анализов), экономический фактор (например, нехватка или нецелесообразность использования средств на проведение дорогостоящих анализов и проб для каждого больного) и другие. В результате при сборе исходной информации для построения модели исследователь часто сталкиваются с ситуацией, когда в данных возникают «пробелы». В то же время медицинские данные характеризуются избыточностью. Опытный врач в ряде случаев может на основе интуиции предсказать результаты того или иного исследования на основе анализа предыдущих. Аналогичную задачу можно решить и с помощью нейросетей-аппроксиматоров.

В ходе сбора исходной информации имело место большое количество пробелов в данных, в связи с чем требуется определить оптимальную очередность восстановления полей с пробелами для обеспечения наибольшей достоверности восстановления таблицы в целом. Общая доля пробелов по параметрам больного составляет 8,175%, а по некоторым полям доля пробелов достигает 40-46%. В то же время 10 полей вообще не имеют пробелов и 12 полей содержат не более 10 пробелов (то есть <2% от общего количества записей содержат пробелы по этим полям). По теории нейросетей достоверность предсказания в общем случае

394026, г. Воронеж, Московский проспект 14, Воронежский государственный технический университет

Статья

увеличивается с ростом объема обучающей выборки и расширением номенклатуры входных параметров из области постановки задачи. Пусть в массиве данных имеется N полей, содержащих

пробелы, и число пробелов в каждом таком поле равно 5], г = 1N.

Сами поля с пробелами обозначим вектором X=(х^.х^х). Пусть в массиве данных имеется также М полей, не содержащих

пробелов. Обозначим их вектором У=(у1,..у,..ум). Не располагая информацией о степенях взаимного влияния х, будем полагать, что каждое поле одинаково значимо для восстановления пробелов во всех остальных полях. Чем больше полей используем для восстановления поля тем больше, при прочих равных условиях, будет и достоверность восстановления. Но если поле хт содержит пробелы в тех записях, которые до его добавления в список входных полей мы могли использовать для обучения нейросети-аппроксиматора, то после добавления этого поля в список входных полей мы потеряем эти записи, что вызовет снижение достоверности восстановления пробелов в поле XI. Поэтому предлагаем начать восстановление с восстановления тех полей, которые содержат максимальное число пробелов, то есть выбирать номер поля для восстановления надо исходя из условия

5* = тах(£,), г = 1, N . (1)

Количество записей, имеющихся для обучения нейросети, восстанавливающей к-е поле, при использовании q полей в качестве исходных данных для восстановления, обозначим как ЯкЛ. Восстановление к-поля следует начинать с использования только

М известных полей У=(у1,..у,..Ум), т.е. на первой итерации q=M. Если достоверность предсказания (определяемая по тестовой выборке) не достигает требуемого уровня, следует постепенно добавлять дополнительные поля. При этом порядок добавления полей в список исходных для восстановления к-го поля определяется исходя из условия —Ц ^тт. Если по достижении

величиной q значения M+N все еще не достигнута требуемая степень достоверности предсказаний а, надо инициировать запрос к пользователю: восстановить следующее по критерию (1) поле, оставив текущее поле для следующих итераций, либо снижать требуемый уровень достоверности предсказаний.

Обученная нейросеть восстановления пробелов характеризуется достоверностью восстановления а, определяемой по тестовой выборке (часть полного набора входных данных, исключенная из обучения). Достоверность данных, использованных для обучения, обозначим как т. Достоверность у данных, восстановленных нейросетью, характеризующейся достоверностью восстановления а и обученной на данных с достоверностью т, определяется соответственно по формуле у = а * т .

Во время сеанса восстановления данных восстанавливается некоторое количество пробелов в восстанавливаемом (к-м) поле и им присваивается достоверность у. Среднюю достоверность данных, использованных для обучения, можно оценить

П q 1 ~ fr •

] 4

где к - номер восстанавливаемого поля; q - число полей, используемых для обучения нейросети, восстанавливающей это поле; ЯкЛ - число записей в обучающей выборке; ту - достоверность элемента данных (значения ьго поля ]-й записи).

Перед началом восстановления пробелов всем известным значениям присваивается значение достоверности, равное 1. Для восстановления некоторых полей удается уже на исходной выборке построить нейросеть, которая дает достоверность восстановления 100% (с учетом целочисленности данных). Целесообразно на первом этапе восстановления попытаться построить восстанавливающие сети для всех полей с пробелами, и при достижении 100% сразу же восстановить такие поля.

С учетом вышеизложенного был разработан алгоритм восстановления пробелов в массиве данных. Значительно (по грубым оценкам - на один-два порядка) уступая известным алгоритмам по скорости, данный алгоритм, как показали эксперименты, несколько превосходит их по достоверности. Это объясняется сложностью зависимостей, которые приходится аппроксимировать. Целесообразность применения медленного алгоритма основывается на том, что он применяется однократно, до построения

модели, и не влияет на быстродействие системы интеллектуальной поддержки деятельности врача в процессе дальнейшего функционирования, обеспечивая в то же время повышение достоверности прогнозов, выдаваемых всей системой в целом.

УДК 681.3; 616-089.48

БЫСТРЫЕ СИМВОЛЬНЫЕ ВЫЧИСЛЕНИЯ ДЛЯ МЕДИЦИНСКИХ СИСТЕМ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ

С.Г. ЕМЕЛЬЯНОВ, Л.А. ЛИСИЦИН, Е.А. ТИТЕНКО*

Возникнув в 70-ых годах XX века, медицинские экспертные системы (ЭС) стали исторически первыми удачными программными системами, в которых технологии искусственного интеллекта (ИИ) принципиально улучшили уровень принятия решений для практически значимых задач диагностики и прогнозирования заболеваний [1]. Медицинские ЭС заложили основы теоретического проектирования и практической разработки данного класса интеллектуальных систем. Современный этап развития интеллектуальных систем характеризуется расширительным уточнением систем поддержки принятия решений (СППР) как распределенной совокупности взаимосвязанных подсистем информационного, моделирующего и экспертного назначений. Под информационной подсистемой понимается совокупность баз данных, созданных на основе универсальной СУБД и содержащих числовую, символьную, координатно-привязанную и др. типы информации. Моделирующая подсистема включает множество математических моделей для описания закономерностей предметной области и поддержки решений. Экспертная подсистема - это программная система, ориентированная на реализацию недетерминированных поисково-переборных методов на основе заложенных в базу экспертных знаний о предметной области. Являясь самостоятельными сложно организованными системами, информационная, моделирующая и экспертные подсистемы должны быть соединены в единую гибридную СППР. Ядром СППР является экспертная подсистема, ведущая обработку знаний в символьном виде. Особенностью процессов символьной обработки в ЭС является организация полного или эвристического поиска, базирующегося на недетерминированной трактовке правил обработки знаний.

Актуальное направление в области разработки медицинских СППР связано с проблемой создания адекватных моделей представления знаний и соответствующих им методов обработки знания. Среди существующих моделей представления знаний (продукционные системы, семантические сети, фреймы, логические модели) наибольшее распространение получили продукционная модель представления знания или комбинации с ней (продукционно-семантическая и др.). Целесообразность использования продукционных систем и методов быстрых символьных вычислений для таких систем определяется следующими причинами: естественность формы представления человеческих знаний в продукционном виде; высокий уровень модульности системы продукций; универсальность в реализации любых алгоритмов, т.е. способность отражать любое процедурное знание; легкая расширяемость при объединении систем продукций и сетевых представлений, а также легкость динамического разбиения системы на части; естественный параллелизм и асинхронность реализации. Анализ известных продукционных систем для обработки знаний, показывает, что их недостатком, ограничивающим область применения в задачах реального времени, является метрическая проблема генерации полного множества решений. Суть проблемы - в непродуктивных затратах времени принятия решения из-за последовательного генерирования путей в пространстве возможных решений. Формирование полного множества решений и обход всего пространства вывода основаны на процессах полного перебора путей с возвратами в точки ветвления. При этом возвратный механизм является основным источником временных затрат. Функционирование гибридных СППР требует разработки методов быстрых символьных вычислений, обеспечивающих динамически параллельную генерацию вариантов решений и без возвратов в пространстве состояний. ЭС с точки зрения теоретического проектирования [1] описывается множеством

305040 г. Курск, ул. 50 лет Октября, 94, КГТУ, кафедра Программного обеспечения вычислительной техники

Т =

i Надоели баннеры? Вы всегда можете отключить рекламу.