ТЕОРЕТИЧЕСКАЯ И МАТЕМАТИЧЕСКАЯ ФИЗИКА УДК 519.2:534
О ТЕОРЕТИКО-ВОЗМОЖНОСТНОЙ СИМПТОМАТИКЕ
ЗАБОЛЕВАНИЙ
В. А. Газарян, В. JI. Илюшин, Ю. П. Пытьев, А. К. Шаховская*'
(.кафедра компьютерных методов физики) E-mail: [email protected]
Создан алгоритм, ранжирующий возможности заболевания в зависимости от наблюдаемых симптомов. Дана теоретижо-возможностная симптоматижа заболевания желудочно-жишечного тражта (ЖЖТ), позволяющая проводить диагностижу фунжци-ональных нарушений ЖЖТ при неформализованном харажтере данных.
Введение
Среди страдающих заболеваниями желудочно-кишечного тракта (ЖКТ) особое место занимают больные с функциональными расстройствами, характеризующимися нарушениями моторики и тонуса толстой кишки [1]. Одним из таких заболеваний является синдром раздраженной толстой кишки (СРТК) [2]. Из-за отсутствия органических патологий, выявление четких диагностических критериев заболевания затруднено, и диагноз зачастую ставят методом исключения. Целью настоящей работы является уточнение диагностических критериев СРТК, описание и анализ его симптоматики.
В работе [3] показано, что алгоритм типа КОРА [4], основанный на алгебраическом и статистическом методах распознавания образов, позволяет охарактеризовать симптоматику СРТК в общем виде на основе опросников пациентов клиники НИИ питания РАМН [2]. В частности, в [3] были выделены признаки (симптомы) и их значения, являющиеся характерными для данного заболевания, а также подтверждено предположение врачей о том, что психосоматические изменения являются важной составной частью заболевания и проявляются у пациентов наряду с функциональными нарушениями ЖКТ.
Однако разработанные в [3] методы недостаточно эффективны при нечетких данных, с которыми приходится иметь дело ввиду отсутствия конкретных органических патологий при СРТК. При неформализованном характере данных и ограниченном размере обучающей выборки (числе больных с верифицированным диагнозом) более естественны теоретико-возможноетные методы обучения и распознавания [5]. Возможность события, в отличие от его вероятности, оценивающей частоту его появления, дает относительную оценку истинности события, его предпочтительности по сравнению с други-
ми событиями в ранговой шкале [6]. В рассматриваемой задаче важна не только и не столько частота встречаемости симптомов заболевания, сколько их условная возможность при данном заболевании по сравнению с другими недомоганиями. Зная ее, мы сможем сделать вывод о возможности пары (симптом-заболевание), а также найти условную возможность заболевания при обнаружении у пациента определенных симптомов, которая характеризует существенность данных симптомов при данном заболевании (по сравнению с другими симптомами). Что касается связи возможности с вероятностью [7], то естественно считать, что рг- ^ , если ргг- ^ рг;-, где ргг- - вероятность симптома (или группы симптомов) шг-, а р^ — соответственно возможность. Для построения возможностной модели необязательно знать значения вероятностей рГ], рг2,..., достаточно лишь знать, как они упорядочены [6].
1. Стохастический метод построения теоретико-возможностной модели
Рассмотрим метод построения теоретико-возмож-ностной модели на основе экспериментальных данных [7]. Построение стохастической модели возможности симптомов СРТК у пациентов позволит установить приоритеты симптомов и их сочетаний в ранговой шкале.
Исходные данные — сведения о больных, содержащиеся в ответах на вопросы анкеты. Вопросы составлены таким образом, чтобы ответы наиболее полно охарактеризовали состояние больного. Анкета содержит 26 вопросов по гастроэнтерологии и психосоматике. Возможны от 2 до 4 вариантов ответов в зависимости от постановки вопроса. На каждый вопрос пациент дает ответ в ранговой шкале, отражающей степень тяжести соответствующего симптома.
ГУ НИИ питания РАМН.
Сопоставим каждому субъекту (пациенту) п-мерный нечеткий вектор ш = (ш1 ,ш2,... ,шп), где из1 — ответ на г-й вопрос анкеты, рассматриваемый как г-й признак (симптом) заболевания, г = 1,...,«. Будем называть из вектором признаков субъекта. Пусть r(w) — вероятность того, что субъекту свойственен вектор значений симптомов w = (wl, w2,..., wn), p(w) = р{и)Х = wx, oß = w2, ..., uin = wn) — значение возможности равенств из1 = wl, i = 1,..., п.
Экспериментальной оценкой рг(да), согласно закону больших чисел, является частота встречаемости вектора признаков w. Далее мы не будем делать различий между конкретным субъектом и набором его признаков.
Для уточнения диагностических критериев заболевания необходимо найти группы признаков, ранжированные по значениям их возможностей. Больные были разделены на две группы: с замедленной моторикой (J\T° 1) и ускоренной моторикой (J\T° 2) [3]. Эти группы были выделены для выявления значимых различий в описании симптоматики. При построении возможностного пространства, максимально согласованного с вероятностным [7], рассматривается условная возможность pf = P(wJ\ k) наборов симптомов, определенных разбиением Т, при условии принадлежности больного к каждой из выделенных групп*). Здесь i — номер набора симптомов, ¿=1,2,..., k — номер группы СРТК, k = 1,2. При этом по определению условной возможности [6] происходит упорядочение возможностей Р (wj,k) = min(Р (wf | k) ,P(k)), что в предположении равенства априорных возможностей P(k), k= 1,2, дает основание так же ранжировать условные возможности P(k\wf) заболевания k при наличии симптомов (wf) у больного. Симптомы (wf), имеющие максимальную возможность P(k\wJ), являются наиболее существенными при заболевании группы k.
Для решения задачи упорядочения возможностей симптомов требуется найти все наборы Т = (Тх,..., Тп), Т' eW', i = 1,..., п, для которых возможности элементарных событий в пространстве (üT,ÄT,PT) удовлетворяют строгим неравенствам p j > р'<2 > ... > р'[ > ... Таким образом будут выделены группы симптомов (значений признаков) wj, где i — номер группы, i = 1,2,..., ранжированные по значимости при СРТК. Это условие будем обозначать в дальнейшем (;g>) и называть условием максимальной разделенности.
Лемма. Пусть (0,'Р(0),Рг) — дискретное вероятностное пространство, ü = {w\,w2,... ... ,wn,...}, T(fl) — а-алгебра всех подмножеств Ü, Рг({шг}) = ргг-, причем вероятности ргг- элементарных событий wi, i= 1,...
Обозначения см. в конце статьи.
...,«,..., удовлетворяют условию рГ] ^ рг2 ^ • • • ^ ргга ^ ... и (П,Т(П),Р) — максимально согласованное с (0,"Р(0),Рг) возможностное пространство, являющееся (31>). Рассмотрим разбиение множества натуральных чисел Ы: I = {¡¡,¡2, ■ ■ • ,4, • • •},
с»
/г П/; = 0 при }ф1, и 1п = Ы,
п= 1
тт&>гпт& V />г (1)
и соответствующее ему вероятностное пространство (П,Т(П), Рг), где П = {Ш\ ,1>2> • • • >яйп,...}, _ щ _ _
= и • Тогда вероятности ргг- = Рг(шг) = ^ >
Шг Шг
I = 1,2,..., удовлетворяют условию упорядоченности: рТ] ^ рг2 ^ • • • ^ ^ • • • > а максимально согласованное с ним возможностное пространство (П,Т(Щ,Р) снова (;») [6].
В силу леммы, если Т > Т и (Пт,Т(Пт),Рт) — С»), ТО и (ПТ,Г(ПТ),РТ) - (3§>). Если же
не является (;»), то
V Т <Т (Пт ,Т(Пт),Рт) также не является (з§>).
Смысл алгоритма заключается в последовательном отыскании всех потомков максимального Т, являющегося (31>), также удовлетворяющих условию (31>). Каждое разбиение дает наборы симптомов, характеризующиеся убывающими значениями возможностей.
2. Вычислительный эксперимент.
Обсуждение результатов
Как уже было замечено, для описания заболевания необходимо конкретизировать его симптоматику в условиях небольшого числа объектов (пациентов, заполнивших опросники) относительно количества признаков (вопросов). Алгоритм был применен к 53 объектам, каждый из которых содержал 15 признаков. В результате были выделены те признаки, которые удовлетворяют условию максимальной согласованности и возможности их значений строго упорядочены. Во всех получившихся соотношениях вида
1=р(т\)>р(т2)> ...,
где I?/ € Иг. Т — наиболее значимыми
для данного заболевания будем считать сочетания значений признаков Ш\, имеющие возможность р(Ш\)= 1.
Результатом работы явилось уточнение диагностических критериев СРТК на основании построенной стохастической модели возможности проявления у пациентов различных сочетаний симптомов заболевания.
В таблице представлены некоторые характерные комбинации психосоматических признаков двух групп СРТК, ранжированные по возможностям их значений, причем наборы симптомов расположены
Группа №1
Номер разбиения Номер набора Симптомы
Тревога Напряжение Нарушение сна Вегетативные нарушения Утомляемость Беспокойство за здоровье Депрессия
0 1 2 3 0 1 2 3 0 1 2 3 0 1 2 3 0 1 2 3 0 12 3 0 1 2 3
1 1 щ и 1
2
3 1
4
5 }
2 1 Я щ 1
2 1
3 1
4 Л 1 1 1
5 81 \
Группа 1 №2
1 1 I 1 Ш
2 1 1 □
3
4 Я ■
2 1
2
3
4
3 1 1 1
2 1
3
4
Сочетания признаков пронумерованы по порядку убывания возможности их появления при СРТК: 1 = р\ > р2 > ..., где р-ь — возможность набора из[. Степени тяжести симптомов: 0 — отсутствие симптома; 1 — слабое проявление; 2 — средняя степень тяжести; 3 — сильное проявление симптома
в порядке убывания возможностей. Рассмотрены не только некоторые наиболее значимые комбинации, имеющие возможность, равную единице, но и такие, которые могут встретиться при <нетипичном> протекании заболевания, характеризующемся несколько иной симптоматикой. Такие симптомы имеют возможность 0 < р < 1 и не должны игнорироваться при диагностике и лечении. Например, для больных группы № 1 типичны сочетания вегетативных нарушений различной степени с повышенным ощущением тревоги (р\ = 1). Вегетативным нарушениям при отсутствии тревоги соответствует возможность р2 < р\. На практике приходится встречаться и с такими проявлениями заболевания. А вот встретить больного СРТК, страдающего тревогой, но не имеющего при этом вегетативных нарушений (ра) , практически невозможно, так как р4 < Рз < Р2, гДе
Рз соответствует только сильной степени тревоги (в комплексе с вегетативными нарушениями), что также редко имеет место при СРТК. Все выявленные психосоматические нарушения и их связи в обеих группах отражены в таблице. В группе № 2 выявлено больше психосоматических нарушений, чем в группе № 1, а их взаимозависимость выражена полнее.
Проанализировано влияние на состояние больного различных факторов, предшествующих заболеванию: бытовые проблемы, конфликты на работе, эмоциональное напряжение, малоподвижный образ жизни и т. д. Оказалось, что у больных группы № 1 с возможностью, равной единице, заболеванию предшествовало от 2 до 5 неблагоприятных факторов. Обнаружено также, что наличие даже одного такого фактора может привести к заболе-
ванию с возможностью, отличной от нуля. Следовательно, перечисленные факторы представляют реальную угрозу заболевания. Если же СРТК предшествовало большее число факторов (4-7), то максимальной становится возможность <попадания> больного в группу № 2. Значит, большее число проблем скорее приведет к ускоренной моторике, чем к замедленной.
Ранжированы условные возможности возникновения болей в двух группах при различных предпосылках, связанных со стулом, характером и частотой питания, физической нагрузкой, эмоциональным возбуждением и т. д. У больных группы № 1 возможность возникновения болей даже при небольшом числе предпосылок (1-3) равна единице, а возможность отсутствия болей равна нулю, т.е. боли <неизбежны> — необходимость болей, определенная в теории возможности, равна единице [6]. У больных группы № 2 боли возникают значительно чаще: возможность их появления при наличии 4-7 предпосылок равна единице. Возможность обойтись без болей также нулевая. Степень тяжести болей также выше в группе № 2, в то время как в группе № 1 возможность наличия сильных болей минимальна.
Обозначения
Г = |иУ|,иУг,,... — множество значений ¿-го признака, щ — количество значений ¿-го признака, 1= I,... ,п, га — число признаков.
Т1 = {£],... ,Е'п} — разбиение /г, т.е. система попарно непересекающихся непустых множеств Е'к,
Г;
для которых Г = и Е'к.
к= 1
\Х': — класс разбиений Т1 множества /г. Т = (Тх,..., Тп) , V ¿ = 1,...,«.
Ц7 = {Т=(Р,...,Тп) ,Р eWi} ,
г=1
класс разбиений пространства значений всех признаков.
(0,"Р(0),Рг) — вероятностное пространство:
п
П = 1\11. Элементарные события этого проетран-
г = 1
ства — векторы, содержащие все возможные комбинации значений признаков шг, I = I,... ,п.
,Т(Пт), Рг7"^ — вероятностное пространство, построенное на основе Т (см. ниже).
(Пт ,Т(Пт),Рт) — возможностное пространство, максимально согласованное с (Ъг,Р(Ог),Ргг) [7]. Пт — множество элементарных событий вида
п
шт = П £]., Е\.еТ1, Т' € Т. 1 «С и ^ п. В I(ростран-
г = 1 '
стве Пт элементарные события будем обозначать
ш[,ш2Г,...,ш[,..., где ш\ = (е!:.Е1.....£,") .
1 ^ и ^ П> г = 1,..., га, Е\. — ti-й набор значений ¿-го признака, соответствующий разбиению Т1.
Пронумеруем элементарные события в порядке убывания их вероятностей: рг|" ^ рг| ^ • • • ^ рг^ ^ ..., Рг {wJ) = рг[". Тогда р\ ^ рI ^ ■■■ ^ р1 ^ ..., где Р (?£)1) = рТ — возможности элементарных событий в пространстве (IПТ,АТ,РТ).
Введем на №*'' отношение порядка: Р У Т1, если
V € Р 3 % € Т1': Е1к С но Т ф Р. Аналогично можно ввести отношение порядка на №*:
Т >Т, если V / = 1,..., га, V 4 € Г 3 % € Т': I С- ^ у но Т фТ. Будем считать, что разбиение Т1 = {£] =Р} € . Тогда оно является наибольшим элементом \Х'!. Будем называть Т потомком Т, если Т > Т и не существует Т такого, что Ту Ту Т.
Литература
1. Шаховская А.К., Есаулов В.И. Новое в гастроэнтерологии: Сб. трудов. Т. 2. М., 1996. С. 18.
2. Шаховская А.К., Есаулов В.И., Лоранская Т.И. // Матер. III Российской гастроэнтрологической недели. М., 1997. С. 65.
3. Газарян В.А., Иваницкая Н.В., Пытьев Ю.П., Шаховская А.К. // Вестн. Моск. ун-та. Физ. Астрон. 2003. № 2. С. 12.
4. Бонгард М.М. Проблемы узнавания. М., 1967.
5. Пытьев Ю.П., Животников Г.С. // Интеллектуальные системы. 2001. 6, № 1-4. С. 63.
6. Пытьев Ю.П. Возможность. Элементы теории и применения. М., 2000.
7. Пытьев Ю.П. // Интеллектуальные системы. 2001. 6, № 1-4. С. 25.
Поступила в редакцию 26.03.04