Научная статья на тему 'Нечеткое принятие решений в задачах прогнозирования и диагностики заболеваний, вызываемых экологическими факторами риска'

Нечеткое принятие решений в задачах прогнозирования и диагностики заболеваний, вызываемых экологическими факторами риска Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
152
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОГНОЗИРОВАНИЕ / ДИАГНОСТИКА / ЭКОЛОГИЯ / НЕЧЕТКИЕ РЕШАЮЩИЕ ПРАВИЛА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Крупчатников Роман Анатольевич

В статье рассматриваются вопросы получения нечетких решающих правил для решения задач прогнозирования и ранней диагностики заболеваний, которые вызываются вредными факторами различной природы, порождаемыми окружающей средой, включая техногенные факторы. Показывается, что использование нечеткой логики принятия решений в сочетании с информацией об энергетической реакции биологически активных точек позволяет получать уверенность в принимаемых решениях на уровне 0,92, что вполне приемлемо для практического использования

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Крупчатников Роман Анатольевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Нечеткое принятие решений в задачах прогнозирования и диагностики заболеваний, вызываемых экологическими факторами риска»

НЕЧЕТКОЕ ПРИНЯТИЕ РЕШЕНИЙ В ЗАДАЧАХ ПРОГНОЗИРОВАНИЯ И ДИАГНОСТИКИ ЗАБОЛЕВАНИЙ, ВЫЗЫВАЕМЫХ ЭКОЛОГИЧЕСКИМИ

ФАКТОРАМИ РИСКА

Р.А. Крупчатников

Аннотация. В статье рассматриваются вопросы получения нечетких решающих правил для решения задач прогнозирования и ранней диагностики заболеваний, которые вызываются вредными факторами различной природы, порождаемыми окружающей средой, включая техногенные факторы. Показывается, что использование нечеткой логики принятия решений в сочетании с информацией об энергетической реакции биологически активных точек позволяет получать уверенность в принимаемых решениях на уровне 0,92, что вполне приемлемо для практического использования.

Ключевые слова-, прогнозирование, диагностика, экология, нечеткие решающие правила.

В качестве исходных данных для построения решающих правил прогнозирования и диагностики заболеваний, вызываемых экологическими факторами, могут служить региональные документы о санитарно-эпидемиологической обстановке и о состоянии окружающей среды, а также, по возможности, карты загрязнений, геофизических полей и заболеваемости, полученные с помощью технологий ГИС.

В частности для Курской области характерными являются такие внешние факторы риска как:

- напряженность постоянного магнитного поля;

- напряженность и частотные диапазоны переменных электромагнитных полей искусственного происхождения;

- пятна радиационного заражения;

- концентрация вредных веществ в атмосфере (пыль, сернистый газ, окись углерода, окислы азота, фенол и его производные, формальдегид);

- концентрация вредных веществ в поверхностных водах (соединения меди, органические вещества, азот нитратный, азот аммонийный, нефтепродукты, железо, фосфаты);

- концентрация вредных веществ в питьевой воде (физико-химические и бактериологические показатели);

- характеристика состояния почвы (пестициды, ядохимикаты, соли тяжёлых металлов).

С приведёнными факторами риска для Курского региона связывают такие основные нозологические формы заболеваний, как :

- болезни органов пищеварения;

- болезни органов дыхания;

- заболевания сердечно-сосудистой системы;

- болезни мочеполовой системы;

- болезни костно-мышечной системы и соединительных тканей;

- болезни эндокринной системы;

- болезни нервной системы;

- психические расстройства;

- инфекционные заболевания;

- новообразования.

В общей постановке задача синтеза правил прогнозирования и ранней диагностики заболеваний, вызываемых экологическими факторами, сводится к поиску взаимосвязей между перечнем нозологических форм и (или) конкретными заболеваниями, например из классификатора ВОЗ и между всеми существенными факторами риска (информативными признаками) с учётом временных параметров (динамики поведения объекта исследования).

Для повышения точности классификации в состав решающих правил следует включить признаки, характеризующие адаптационный и энергетический потенциал организма, а также дополнительные факторы риска, характерные для конкретного индивидуума (наследственность, перенесённые заболевания, употребление алкоголя, табакокурение, иммунный статус и т.д.).

Как правило, для перечисленных типов заболеваний такие списки факторов риска известны, по крайней мере, на понятийном уровне с проверкой статистических взаимосвязей.

Проведённый разведочный анализ показал, что каждый из измеряемых факторов риска

Информация об авторе

Крупчатников Роман Анатольевич, кандидат сельскохозяйственных наук, доцент кафедры электротехники и механизации животноводства Курской государственной сельскохозяйственной академии имени профессора П.П. Иванова (4712)531370. Е-та11:готап0406@уапс1ех.га.

(признаков) по отношению к задачам прогноза и диагностики носит неполный и нечёткий характер, а структура классов, относительно которых принимается решение, имеет нечёткие границы с зонами пересечения, переходящими из класса в класс. В таких условиях для синтеза соответствующих решающих правил целесообразно использовать теорию нечёткой логики принятия решений, в рамках которой информативные признаки X; и (или) комплексные показатели, получаемые на их основе представляются функциям принадлежности ц {7.к) к

рассматриваемым классам со£, а синтез промежуточных и финальных решающих правил осуществляется через формулы расчёта соответствующих коэффициентов уверенности КУЩ [3,6,7].

В рамках нечёткой логики принятия решений задачу ранней (донозологической) диагностики будем рассматривать как задачу нечёткой классификации практически здоровых людей (класс &>0) и людей с донозологической формой заболеваний, вызванной воздействием окружающей среды в сочетании с индивидуальными факторами риска, присущими конкретному человеку (класс со£).

Задачу прогнозирования заболеваний, вызываемых экологическими факторами, будем рассматривать в двух её вариантах.

В первом варианте, описанном в работе [3], будем определять, перейдёт ли относительно здоровый человек (класс о)0) в класс заболевания с

именем £ (класс со£) через определённый промежуток времени Т0 с уверенностью, определяемой агрегирующим нечётким решающим правилом.

Во втором варианте уверенность в прогнозе определяется по шкале времён, на которой экспертами определяется верхняя граница времени прогнозирования Тв, когда ещё можно делать приемлемые для практики классификационные выводы. Выбранная временная шкала разбивается экспертами на интервалы времени наблюдения Тф которые могут быть «привязаны» к приемлемой частоте повторяемости обследований. По интервалам наблюдений синтезируются нечёткие решающие правила прогнозирования, которые в общем случае могут быть различны вплоть до использования различных информативных признаков (факторов риска).

Характерной особенностью задач прогнозирования и диагностики заболеваний, вызываемых экологическими факторами, является то, что собираемая экологическими службами и службами здравоохранения информация в основном характеризует общие тенденции заболеваемости без учёта индивидуальных особенностей каждого из обследуемых, находящихся в зоне исследования. Поэтому получаемые на основе этих данных выражения для определения КУ по известным статистическим от-

чётным данным определяют некоторую усредненную уверенность в прогнозе (донозологиче-ском диагнозе) 0)£ по всей группе людей, находящейся под воздействием наблюдаемых экологических факторов.

Относительно конкретного человека риск появления заболевания 0)£ зависит не только от

времени его нахождения под воздействием экологических факторов, но и от индивидуальных особенностей организма (адаптационный потенциал, энергетический потенциал, иммунный статус, наследственность и т.д.) и дополнительных факторов риска, сопровождающих обследуемых (табакокурение, употребление алкоголя, качество питания, психологическая обстановка и др.).

С учётом сказанного увеличение точности в определении прогноза (диагноза) по классу б0£ может быть достигнуто путём агрегации дополняющих друг друга составляющих (уверенность в со£ от действия экологических факторов) и КУИ (уверенность от факторов, характеризующих индивидуальный риск человека по диагнозу со£) в финальное решающее правило вида:

КУШ1 =КУЭ,Ш1+КУ^1{1-КУ^1)(1)

Другой особенностью влияния экологических факторов на организм человека является то, что большинство из них начинает своё вредное воздействие при условии, что человек находится в зоне воздействия достаточно долгое время.

Интенсивность действия экологического фактора У) совместно с временем воздействия в частном решающем правиле по фактору с номером | могут быть учтены при использовании правила вида

Г 0, если 1<Тп

ку» ; = (2)

где (Л (¥j ) - функция принадлежности к классу со£ по шкале интенсивности действия

" функция принадлежности к классу со£ от действия фактора у) с носителем по шкале времени воздействия; Тп - некоторая пороговая величина времени, меньше которой влиянием любой практически существующей интенсивности на возникновения заболевания со£

можно пренебречь.

Если выбрать форму и параметры функции принадлежности, возрастающие с ростом величин их носителей, то при I > Тп КУ ] растёт

по мере роста интенсивности и времени воздействия по закону, определяемому формой и параметрами соответствующих функций принадлежностей.

Известно, что вредному воздействию экологических факторов препятствуют защитные механизмы человеческого организма, снижая риск возникновения и развития соответствующих заболеваний. Учесть влияние защитных механизмов в классификационных решающих правилах можно, синтезировав решающие правила определения уверенности в уровне защитных свойств по диагнозу со£ - КУ 3 .

Как показали результаты исследований хорошей информативностью с точки зрения защитных свойств организма обладают адаптационный потенциал (АП), определяемый через индекс функциональных изменений (ИФИ) [1] и энергетическая сбалансированность (ЭС) меридианных структур организма, которая может быть определена по электрическим характеристикам БАТ «связанных» с общесистемной реакцией организма (Е23, Е36, КР6, У40, У60 и УВ20).

Учитывая, что уровни АП и ЭС отражают различные механизмы деятельности человека и каждый из них вносит свой вклад в защитные функции, удобно в качестве меры доверия к защите от фактора У) для заболевания со£ выбрать параметр

Щ.щ,! =Мщ,](АЛ)+Мщ,](ЗС)[1-^щя(АП)] (3) где ца (АП) - функция принадлежностей к уровню защитных свойств по фактору | для класса а>£ по значению адаптационного и потенциала; // (ЭС ) - функция принад-

лежности к уровню защитных свойств по фак-

тору J для класса со£ по значению энергетической сбалансированности.

С учётом того, что КУ 3 , уменьшает

общую уверенность в прогнозе (диагнозе) со£

можно записать

Г 0, если КУШ ,<КУ^Ш . ,А .

ТГЛ'У'О _ ] 3(4)

^ ~\КУа1-КУзв)), если КУФ . > КУз а .

С учётом множества экологических факторов, каждый из которых в той или иной степени приводит к появлению и развитию заболеваний со£, уверенность КУ э ] в соответствии с

общими рекомендациями по синтезу нечётких решающих правил разработанными на кафедре биомедицинской инженерии КурскГТУ [3] может быть определена по формуле:

щща+1)=щ,що)+к-%ща+щ-щ,от о

Рассматривая информативные признаки X; , характеризующие индивидуальные риски человека по заболеваниям а>£ и соответствующие комплексные показатели как носители

функций принадлежностей к классам со£ можно синтезировать правила определения КУ и аналогично (5), заменяя КУ ^а>г(]+1) на Ц (] + 1) и /г (к + 1) . Тогда финальное

решающее правило принимает вид (1).

В описанном механизме синтеза нечётких решающих правил качество классификации определяется такими субъективными факторами как компетенция экспертов, их понимаем существа используемых формул, эффективностью взаимодействия экспертов с инженером по знаниям и т.д.

Снизить величину субъективизма можно, если на этапе синтеза или практического использования нечётких прогностических правил удаётся получить контрольные выборки, которые формируются следующим образом. Набираются группы обследуемых, среди которых есть люди с различными факторами риска, характеризующими возможность появления патологии 0)£ .

Объём контрольной выборки определяется известными в статистике требованиями.

Для каждого из обследуемых для времени Ь = 0 определяется и запоминается его коэффициент уверенности. Далее в таблице экспериментальных данных (ТЭД) их удобно пересортировать, расставив в порядке увеличения уверенности в прогнозе со£. Учитывая непрерыв-

ность шкалы КУ Ю} для анализа качества работы синтезированных решающих правил ТЭД ее удобно разбить на слои с выбранным интервалом изменения КУ „ — А КУ „ .

со, со,

Пример такой таблицы представлен в таблице 1.

В приведенном примере первая строка соответствует номеру обследуемого. Вторая строка определяет величины интервалов выбранных экспертами для анализа качества прогнозирования. В третьей строке записаны средние значения КУ в выбранном интервале,

а в четвертой строке при наступлении времени Т0 записывается оценка вероятности попадания обследуемых в класс со£ определяемая как количество людей попадающих в класс со£ из

конкретного интервала ДКУ к общему количеству людей из этого интервала.

Таблица 1 - Распределение обследуемых по уверенности в со£

После заполнения таблицы типа 1 легко определить качество построенных прогностических моделей.

Можно считать, что если по каждому из интервалов КУср и Р (Т0) близки друг к другу в смысле заданной пороговой разности между

7""}*

ними (|КУср- Рщ (То) I < £д), то получены удачные прогностические модели.

Если нет, то эксперты получают эту таблицу для анализа и вместе с инженером по знанию производят корректировку функций принадлежностей, частных и общего прогностического решающего правила таким образом, чтобы при известных начальных факторах риска разность

\КУср -Р'щ (Г„)|-> пип (6)

После чего набирается новая контрольная группа, для которой проверяется совпадение

кУф с р; (т„).

Анализ таблицы типа 1 позволяет экспертам легко выбрать пороговую величину

КУ а}( (Т0) , превышение которой говорит о

Г)*

высоком риске (большом значении Г (То)) появления у обследуемых класса а>£ с тем,

чтобы своевременно организовать серию ле-чебно-профилактических мероприятий.

Если наблюдение за обследуемыми проводить в нескольких временных интервалах Т0ч, то, включив в таблицу типа 1 несколько строк с расчётом КУ ( Т0д ) по критерию

I КУ ср - Р*щ (Т0д ) гшп (7)

можно определить, на какой интервал времени можно распространить надёжное прогнозирование по полученному решающему правилу.

Такая модифицированная таблица может быть использована и для контроля качества временных прогностических правил (таблица 2), если наблюдаемый временной интервал разбить на разумно выбранные временные интервалы.

Анализ этой таблицы по величине КУФ и Р (Т0Ч) позволяет оценить качество прогностических правил по выполнению критериев типа (7) и при необходимости вносить коррективы во временные прогностические правила аналогично рассмотренному выше варианту.

Таблица 2 - Распределение обследуемых по уверенности в со£ в зависимости от временного ___________________фактора ___________________

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

№ обследуемого \ 1,2,3... .л

ДКУ ДКУ! ДКУ2 ДКУ;

КУШ КУ1СВ КУ2СВ КУ1С0

К, сад

К, сад

Рщ (Тот)

Если в распоряжении экспертов и инженеров по знаниям имеются средства разведочного анализа, позволяющие изучать структуру многомерных данных в пространствах информативных признаков, то, имея возможность набора обучающих выборок, можно реализовать синтез наиболее подходящих (по сложности и точности) типов частных и общих прогностических правил соответствующих структуре исследуемых классов 0)£ .

№ обследуемого (1) 1,2... ..3

ДКУ 0-0,2 0,2- 0,4 0,4-0,6 0,6- 0,8 >0,8

КУср 0-0,2 0,3 0,5 0,7 0,9

т—ч Рц (То)

Если задача прогнозирования решается как задача разделения на классы не заболеет со0 и заболеет каким-либо из заболеваний со1 обучающие выборки строятся по набору информативных признаков Х=(хь х2..., хь... хп ), то в ходе разведочного анализа, можно определить взаиморасположение и разделимость исследуемых классов (линейная, кусочно-линейная и нелинейная разделимость; наличие и характер зон пересечения классов, характер признаковых и дистальных гистограмм и т.д.).

Исходя из анализа структуры признакового пространства согласно рекомендациям [3] с использованием объектов обучающей выборки могут быть выбраны носители У = Б(х) для функций принадлежностей , (л таким образом, чтобы обеспечить их минимальное пересечение при возможно меньшем числе информативных признаков. В практических приложениях пользователей больше интересует значение функции /л (У). Тогда задача поиска

формы и параметров функции принадлежностей может заключаться в поиске такого носителя, при котором /л (У) достигает своего

максимального значения при меньшем числе информативных признаков с учетом дополнительных требований на временные и техникоэкономические ограничения на получение значений информативных признаков.

Предложенный метод синтеза апробирован на решении задачи оценки риска заболеваний желудочно-кишечного тракта (ЖКТ) и нервной системы при воздействии постоянного магнитного поля Курской магнитной аномалии и гор-но-обогатительного комбината на жителей Железногорского района Курской области и промышленных предприятий на жителей г.Курска. В ходе проведённых исследований были получены системы функций принадлежностей и синтезированы соответствующие нечеткие прогностические и диагностические правила. Уровень адаптационного потенциала определяется по параметру ИФИ, а энергетическая сбаланси-

рованность согласно рекомендациям [4] по электрическому сопротивлению Б AT Е23, Е36, RP40, V40, V60 и VB20. Общая уверенность в классе риск заболевания ЖКТ рассчитывается в соответствии с выражением (1), достигает величины 0,92, а по заболеваниям нервной системы 0,89, что вполне приемлемо для практического использования.

Список использованных источников

1 Баевский, P.M. Оценка адаптационных возможностей организма и риск развития заболеваний / P.M. Баевский, А.П. Берсенева. - М.: Медицина, 1997. - 235 с.

2 Гаваа Лувсан Очерки методов восточной терапии / Гаваа Лувсан.- 3-е изд., перераб. и доп. - Новосибирск: Наука. Сиб. от-ние, 1991.

- 432с.

3 Кореневский, НА. Проектирование нечетких решающих сетей настраиваемых по структуре данных для задач медицинской диагностики / Н.А. Кореневский // Системный анализ и управление в биомедицинских системах.

- 2005. - Т.4.- № 1,-С. 12-20.

4 Кореневский, НА. Синтез моделей взаимодействия внутренних органов с проекционными зонами и их использование в рефлексодиагностике и рефлексотерапии: монография / Н.А. Кореневский, В.В. Буняев, В.Н. Гадалов, Н.Д. Тутов; Курск, гос.техн.ун-т. -Курск, 2005. - 224с.

5 Кореневский, Н.А Энергоинформационные основы рефлексологии / Н.А. Кореневский, М.И. Рудник, Е.М. Рудник; Курск.гуманит.-техн. ин-т. - Курск,2001. -236с.

6 Круглов, В.В. Искусственные нейронные сети / В.В. Круглов, В.В. Борисов Теория и практика.- 2-е изд., стереотип.- М.: Горячая линия - телеком, 2002. - 382с.

7 Осовский, С. Нейронные сети для обработки информации / С. Осовский // пер. с польского И.Д. Рудинского. - М.: Финансы и статистика, 2002.- 344с.

i Надоели баннеры? Вы всегда можете отключить рекламу.