Научная статья на тему 'Method of selection of essential attributes classes for the medical diagnosis'

Method of selection of essential attributes classes for the medical diagnosis Текст научной статьи по специальности «Математика»

CC BY
71
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИФіКАЦіЯ / МЕДИЧНЕ ДіАГНОСТУВАННЯ / ОНТОЛОГіЯ / ОЗНАКИ КЛАСіВ

Аннотация научной статьи по математике, автор научной работы — Комлевая Наталия Олеговна, Комлевой Александр Николаевич

The article deals with the problem of solving medical diagnosis using an automated approach. The knowledge base metadata on the human respiratory system diseases is formed with the use of the ontological approach. The technique that allows to allocate significant for the classification of signs in the diagnosis of the state of bronchopulmonary system is considered in detail. The classification tree containing 39 non-overlapping classes, characterizing the state of the respiratory system in patients and healthy humans is constructed. The practical results of classification using specialized applications for statistical analysis STATISTICA are shown.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Method of selection of essential attributes classes for the medical diagnosis»

Комлева Наталiя Олегiвна

кандидат техтчних наук, доцент кафедри системного программного забезпечення, Одеський нацгональний полтехнгчний утверситет Комлевой Олександр Миколайович старший викладач кафедри клтчног ¡мунологп, генетики та медично'1 бюлоги, Одеський нацгональний медичний унгверситет

МЕТОДИКА ВИД1ЛЕННЯ 1СТОТНИХ ОЗНАК КЛАС1В У ЗАДАЧАХ МЕДИЧНОГО

Д1АГНОСТУВАННЯ

METHOD OF SELECTION OF ESSENTIAL A TTRIB UTES CLASSES FOR THE MEDICAL DIA GNOSIS Комлевая Наталия Олеговна кандидат технических наук,

доцент кафедры системного программного обеспечения Комлевой Александр Николаевич

старший преподаватель кафедры клинической иммунологии, генетики и медицинской биологии, Одесский национальный медицинский университет Komleva N. O.

Doctor of Philosophy (PhD), Odessa National Polytechnic University Komlevoy O.M.

PhD student, the First Medical Faculty, Odessa National Medical University

Анотацгя: У статт1 розглянутг проблеми виргшення завдань медичного дгагностування з використанням автоматизованого пгдходу. З використанням онтолог1чного пгдходу сформована база знань з метаданими про захворювання дихально'г' системи людини. Докладно розглянута методика, що дозволяе видшяти суттевi для класифжаци ознаки при дiагностуваннi стану бронхо-легенево'г' системи. Побудовано дерево класифiкацii] що мiстить 39 непереачних класiв, що характеризують стан дихально'г' системи у хворих i здорових обстежуваних. Наведено практичш результати класифкаци з використанням спецiалiзованоi програми для статистичного анализу STATISTICA.

Ключовi слова: класифiкацiя, медичне дiагностування, онтологiя, ознаки класiв.

Summary: The article deals with the problem of solving medical diagnosis using an automated approach. The knowledge base metadata on the human respiratory system diseases is formed with the use of the ontological approach. The technique that allows to allocate significant for the classification of signs in the diagnosis of the state of broncho-pulmonary system is considered in detail. The classification tree containing 39 non-overlapping classes, characterizing the state of the respiratory system in patients and healthy humans is constructed. The practical results of classification using specialized applications for statistical analysis STATISTICA are shown.

Key words: classification, medical diagnostics, ontology, features classes.

Вступ

Щд класифшащею в найбшьш загальному сенс розум1еться однор1вневий або багатор1вневий лопчний подш обсягу поняття. Зпдно шшому формулюванню, класифшащя е розподшом дослщжуваних об'екпв за класами (групами), що задовольнить двом умовам: 1) перетин будь-яких двох клаав класифжаци або порожшм, або дор1внюе одному з цих клаав; 2) об'еднання уах видшених клаав дор1внюе множит, що класиф1куеться. Клас тут розум1еться традицшно, в теоретико-множинному сена як сукупнють об'екпв, що вид1ляються серед множини шших за под1бнютю (зб1гом) в якихось ознаках. Друге визначення не накладае особливих обмежень на споаб побудови класифшацш. Вони можуть будуватися як зверху, через операцш лопчного подшу, так i знизу, шляхом об'еднання об'екпв класифжацп в класи послiдовно зростаючого обсягу.

Виршення багатьох завдань медичного дiагностування прямо пов'язане з класифжащею станiв дослвджуваних об'eктiв. При цьому розробка ефективно! технологи обробки медичних даних, що дозволяе виконувати автоматизоване дiагностування стану пащента, залишаеться актуальним завданням.

Метою даноТ роботи е формування методики видшення iстотних ознак непересiчних клаав, що дозволяють вирiшувaти задачу класифжаци стану дихально! системи людини з використанням статистичних методiв. Проведений анал1з базуеться на дослвджент нaборiв медичних даних, одержуваних у результaтi спещал1зованих обстежень пaцiентiв, як1 входять в комплекс зaходiв для проведення нешвазивного пульмонологiчного дiaгностувaння. Отримaнi результати використовуються для ощнки стану дихально! системи обстеженого пащента [1].

Основна частина

е стан дихально1 аналiз ввдповщно! що оц1нку стану людини доцiльно конденсату вологи

Об'ектом дiагностування системи людини; при цьому медично! лiтератури показав, гомеостазу дихально1 системи проводити на пiдставi аналiзу видихуваного 1м повiтря. Даний метод зарекомендував себе як перспективний i нешвазивний; вiн легко пiддаеться формалiзацil та автоматизаци [2].

З використанням онтолопчного подходу сформована i формалiзована база знань, в яшй використанi метадаш про клiнiчний перебiг та дiагностику захворювань дихально! системи. Знання щодо опису захворювань, як1 шдлягають формалiзацi!, витягали з рiзних лiтературних джерел, потiм вони формувалися на основi принципiв синтезу - таких як об'еднання i доповнення, i були формалiзованi [3]. Згiдно онтологiчно1 модел^ формальнi описи були представленi сукупшстю як1сних i к1льк1сних характеристик, отриманих в результатi використання лабораторних та шструментальних методiв дiагностики; для кожно! характеристики були визначенi дiапазон значень i варiант норми.

Як матерiал для дослiджень взято данi по рiзним групам пацiентiв, кожен з яких пройшов пульмонологiчне обстеження. Пром1жш результати обстеження кожного пацiента представлеш вектором з 32 ознак, як характеризують стан дихально! системи. Значення ознак е кшьшсними величинами, вимiряними на безперервнiй шкалi. Угруповання пащенпв проведена апрiорно на пiдставi медичних рекомендацiй, заснованих на стандартних

дiагностичних методах [4]; число пацiентiв в обстежуваних групах (ОГ) рiзне.

Класифшатор ОГ К мiстить повною мiрою умови проведення експерименту i п данi про обстежуваного, як1 дозволяють ввднести його до пе! чи шшо! класифшацшно! групи. Шаблон класифшатора мае наступний вигляд:

К = <к1 к2 к3 к4 к5 к6 к7 к8>, де к1 - код апрiорно ведомого захворювання або групи захворювань (к1=0 - здоровий);

к2 - стать (0 - чоловiча, 1 - жшоча); к3 - наявнiсть спортивного способу життя (0 -не займаеться спортом, 1 - займаеться);

к4 - вш (0 - до 14 рошв, 1 - с 14 до 25 рошв, 2 -с 25 до 40 рошв, 3 - с 40 до 65 рошв, 4 - старше 65 рошв);

к5 - куршня (0 - не курить, 1 - курить); к6 - сезон (0 - лгго, 1 - осшь, 2 - зима, 3 - весна); к7 - час доби (0 - ранок, 1 - день, 2 - вечiр); к8 - наявнють фiзичного навантаження (0 - до навантаження, 1 - тсля навантаження).

При проведенш рiзних дослвджень деяк1 поля класифшатора К можуть не враховуватися. Наприклад, при обстеженнi групи студентiв, що не палять, в ранковий час взимку необхвдно встановити так1 значення полiв класифiкатора: к4 = 1, к5 = 0, к6 = 2, к7 = 0. Значеннями iнших полiв класифiкатора можна знехтувати.

Використання можливих значень полiв шаблону класифшатора К дозволило побудувати дерево класифкацп (табл. 1).

Таблиця 1

Вузол Предиктор Тип предиктора Поту Категори Пiдлеглi вузл

(незалежна жнiст

змшна) ь

К Вiк Альтернативний 2 Доросл1 К1

Ддти К2

К1 Заняття спортом Альтернативний 2 Нi К11

Так К12

К11 Стан здоров'я Альтернативний 2 Здоровий К111

Хворий К112

К111 Палiння Альтернативний 2 Палить К1111

Не палить К1112

К1111 Фiзичне Альтернативний 2 Перед К11111

навантаження Шсля К11112

К11111 Стать Альтернативний 2 Чоловiчий К111111

Жiночий К111112

К111111 Сезон Номшальний 3 Осiнь К1111111*

Зима К1111112*

Весна К1111113*

К111112 Сезон Номiнальний 3 Осiнь К1111121*

Зима К1111122*

Весна К1111123*

К11112 Стать Альтернативний 2 Чоловiчий К111121

Жiночий К111122

К111121 Сезон Номiнальний 3 Осiнь К1111211*

Зима К1111212*

Весна К1111213*

К111122 Сезон Номiнальний 3 Осiнь К1111221*

Зима К1111222*

Весна К1111223*

К1112 Фiзичне Порядковий 2 Перед К11121

навантаження Шсля К11122

К11121 Стать Альтернативний 2 Чоловiчий К111211

Жшочий К111212

К111211 Сезон Номшальний 3 Осшь К1112111*

Зима К1112112*

Весна К1112113*

К111212 Сезон Номшальний 3 Осшь К1112121*

Зима К1112122*

Весна К1112123*

К11122 Стать Альтернативний 2 Чоловiчий К111221

Жшочий К111222

К111221 Сезон Номшальний 3 Осшь К1112211*

Зима К1112212*

Весна К1112213*

К111222 Сезон Номшальний 3 Осшь К1112221*

Зима К1112222*

Весна К1112223*

К112 Захворювання Номшальний 2 ХОЗЛ К1121

Туберкульоз перед К1122*

початком л^вання

К1121 Час обстеження Порядковий 3 Перед початком К11211*

лшування

Шд час лжування К11212*

Пiсля лiкувания К11213*

К12 Вид спорту Номшальний 3 Самбо К121

Баскетбол К122

Волейбол К123

К121 Навантаження на Порядковий 2 Перед К1211*

тренуванш Пiсля К1212*

К122 Навантаження на Порядковий 2 Перед К1221*

тренуванш Шсля К1222*

К123 Навантаження на Порядковий 2 Перед К1231*

тренуванш Шсля К1232*

К2 Стан здоров'я Альтернативний 2 Здоровий К21*

Хворий К22

К22 Захворювання Номшальний 3 Бронхи К221

Пневмонiя перед К222*

початком л^вання

Вегето-судинна К223*

дистошя перед

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

початком л^вання

К221 Час обстеження Порядковий 2 Перед початком К2211*

лiкування

Примггка. Символом «*» позначенi дiагностичнi класи - кiнцевi листовi вузли дерева класифкацп.

Для проведения статистичного анатзу даних використаний дискримiнантний аналiз, що дозволяе виршувати завдання вдентифжацп та класифжаци об'ектiв по заданому набору характерних ознак [5].

Наведемо основш положення для вирiшення задачi класифжаци, для цього введемо так1 позначення: g - к1льк1сть груп, р - к1льк1сть змiнних, q - шльшсть обраних змiнних, Xi j к - значення змшно! i у спостереженнi к в груш j, | - вага спостереження к в групi j (для незважено! ситуаци |=1), т| - шльшсть спостережень в груш j, п| - сума ваг спостережень в групi j (для незважено! ситуаци п| - к1льк1сть спостережень в груш |), п - загальна сума ваг (для

незважено! ситуаци п - загальна шльшсть спостережень). Середне значення для змшно! i в групi | визначаеться за формулою:

т у

Ху = (X /Xук ) / Пу . Для внутрiшньогрупово!

к=1

матриц розсiювання спостережуваних змшних вiд середнiх значення елемента матрищ W в i-тому рядку i ]-том стовпцi визначаеться за формулою:

Ш ту Ш т ту

= X X ^укХЦкХ Цк ~Х (Х ^кХук )(Х ^кХ1ук ) / Пу

}=1 к=1 у=1 к=1 к=1

, де i, 1 = 1, .., р. При виборi змшних для аналiзу вони включаються в аналiз в тому порядку, в якому записанi. Змшна додаеться в аналiз, якщо при цьому жодна шша змiнна не мае допуск (TOL) менше

встановлено! межi (за замовчуванням - 0.001). Шд час вибору змшних на кожному крощ (при кожному додаванш ново! змшно! в анал1з) розраховуеться матриця W*. Якщо перш1 q змшних були обраш для анал1зу, матрицю W можна роздшити наступним

чином:

W

W W

12

WW

V 21

де W11 мае розм1ршсть

22 у

qxq. Тод1 матрицю W* можна визначити як

W * =

(- W-1

W W4

21 11

W-W12

А (

W22 W21W11W12)

W, W*

W*, W,

22 у

TOL

Допуск i-тш змшно! визначаеться за формулою:

0, якщо wü = 0

* / • wu / w,.,

якщо змтна i не включена в анал1з та wt

ф 0

-1/(w,lwll), якщо змтна i включена в анатз та wü ф 0

Коли обраний наб1р з q змшних, класифжацшш

функцй' можна формули: для

bj = (n - g)¿

i=1

обчислити, використовуючи так!

w

* У

11л ll.

i = 1, 2,

q

коефщенпв: j = 1, 2,

для

a

= ln p

i q

-11 b

2

j Xj

, j = 1 2, -, q >

i=1

апрюрна HMOBipHiCTb групи j, яку можна визначити за

формулою: pj ——.

n

Таким чином, з yciei множини ознак були обранi Ti, яш е iстотними для проведения класифжацп. Для розрiзнення рiзних класiв використовуються рiзнi ознаки. К1льк1сть iстотних ознак коливаеться вщ 8 до 17 у порiвняннi з первинною ix к1льк1стю - 32.

Однак дисперсшний аналiз дозволив перевiрити лише гшотезу про вiдсyтнiсть вiдмiнностей м1ж порiвнюваними групами по дослщжуваним ознаками; з його допомогою неможливо дiзнатися, як саме групи розрiзняються мiж собою. Для з'ясування цього були використаш методи множинних порiвнянь, що е частиною, так званого, апостерюрного аиалiзy (Post-hoc analysis). Механiзм ix роботи полягае в проведеннi попарних порiвнянь середнix значень всix груп, включених до дисперсiйного аналiзy [6].

З набору теспв post-hoc аналiзy обранi LSD (перевiрка критерш найменшо! значущо! рiзницi) i Newman-Keuls test (критерiй Ньюмана-Кеулса). Зпдно тесту LSD, на першому етапi методу за допомогою критерш Фшера була перевiрена гiпотеза про рiвнiсть математичних очiкyваиь розподiлiв, з яких отримано вибiрки значень ознак. Попередньо перевiрено, що цi вибiрки е нормально розподшеними i однойменнi вибiрки мають однаковi дисперсп. Якщо гiпотеза приймалася, то метод зупинявся, шакше переходили до наступного етапу. На другому етат методу вибiрки були впорядковаш за зростанням вибiрковиx середнix i далi поетапно перевiренi г1потези рiвностi середнix сyсiднix вибiрок за допомогою критерш Стьюдента. В якосп ощнки дисперси використовувалося внyтрiшньогрyпове середне. Якщо гшотеза про рiвнiсть математичних очшувань приймалася, то вiдповiднi вибiрки об'еднувалися у одну групу.

Щоб визначити, чи е суттева р1зниця м1ж двома виб1рками з р1вними обсягами, метод Ньюмана-Кеулса використовуе насту пну формулу:

Хл — Хв

Я =

g

константи:

де PJ -

/

Л/Se

де q представляе значення стьюдентiЗiрованого дiапазону, ХАи Хв е вiдповiдно найбiльшим i найменшим середнiм значенням двох вибiрок, MSe -дисперсiя помилки, яка береться з таблищ ANO VA, а n - обсяг вибiрок.

Обчислення значення q потiм порiвнювали з критичним значенням q, узятим з таблищ розподшу q. Якщо обчислене значення q дорiвнюе або бiльше, шж критичне значення q, то нульова гiпотеза (про рiвнiсть середнiх двох вибiрок) може бути вiдхилена.

При рiзних обсягах вибiрок використана наступна формула для методу Ньюмана-Кеулса:

_ хл — Хв У ~ ¡MSE( 1 V г ^ пА

де Na та NB - обсяги виб1рок.

Обробка даних була проведена з використанням двох методiв дискримiнантного аналiзу з пакету STATISTICA: стандартного i покрокового (включення i виключення). В якостi змшно!, що групуе, вибирався дiагноз пацiента, в якостi незалежних змiнних -значення 32 ознак. Були побудоваш функцй класифжащ! - лiнiйнi функцй', яш обчислювалися для кожного дiагностичного класу i були використанi для класифжащ! станiв дихально! системи. На пiдставi функцiй будувалася матриця класифжацп, що мiстила iнформацiю про шльшсть та вiдсоток коректно класифiкованих пащенпв у кожнiй групi. Для бшьшо! зручностi користувалися квадратами вiдстанi Махаланобюа, що показували, на яку величину стан кожного пащента вщсто!ть вщ центро!да групи. При дiагностуваннi стану дихально! системи нового пащента його вщносили до пе! дiагностично! груш, до яко! вiн найближче розташований.

Висновки

Таким чином, у статп була представлена методика, що дозволяе з множини ознак дiагностичних клаав вибрати тi, як1 дозволяють проводити як1сну дiагностику стану дихально! системи людини. Використання методики дало можливють зменшити к1льк1сть аналiзованих дiагностичних параметрiв бiльш нiж вдвiчi. За результатами класифшацп 278

об'ектш, для яких був anpiopHO ввдомий дiагноз, з використанням описано! вище методики, в 266 випадках було отримано iстинний результат, що показуе високу ступiнь кореляцi! апрiорно! i апостерiорно! класифiкацiйно! iнформацi!.

Список лггератури:

1. Yu. I. Bazhora, A. N. Komlevoy, M. M. Chesnokova, A. Nalazek, W. Zukow. Respiratory system estimation at the healthy children and children with bronchitis with the use of laser correlative spectroscopy // Journal of Health Sciences. - 2013. - Vol. 3. No. 7. - P. 135-150.

2. Комлевая Н.О., Комлевой А.Н., Чернега К.С. Проектирование специализированной компьютерной системы для проведения пульмонологического диагностирования. - Науковий журнал "Проблеми програмування". - Киев, 2014. - № 2 - 3. - С. 253 - 262.

3. Кавицкая В.С., Любченко В.В., Лысюк А.В. Модель представления знаний для систем

управления знаниями. - Пращ Одеського полтгехшчного ушверситету - Одеса, 2013. - Вип. 3. -С. 167 - 172.

4. Комлевая Н.О., Комлевой А.Н. Разработка информационной модели диагностирования состояния дыхательной системы. -Холодильна техшка i технология. - Одесса, 2011. -Вып. 2(130). - С. 75 - 79.

5. Комлевая Н.О. Построение системы диагностических признаков с использованием метода дискриминантного анализа в офтальмологических исследованиях. - Радюелектронш i комп'ютерш системи. - Харшв «ХА1», 2010. - Вип. 6 (47). - С. 250 - 253.

6. Комлевая Н.О., Комлевой А.Н., Тимченко Б.И. Сравнительный анализ двух подходов при решении задачи классификации. - Науко-техшчний журнал "Радюелектронш i комп'ютерш системи". - Харьков, 2014. - № 6(70). - С. 115 - 119.

Пизинцали Людмила Викторовна

Кандидат технических наук, доцент кафедры судоремонта, Одесский национальный морской университет

ПОДГОТОВКА ПРОЕКТА УТИЛИЗАЦИОННОГО ПРЕДПРИЯТИЯ П1ДГОТОВКА ПРОЕКТУ

УТИЛ1ЗАЦ1ЙНОГО П1Д

приемствА

PREPARATION OF A DRAFT RECYCLING FACILITY W^mi Людмила Вiкmорiвна Кандидат технiчних наук, доцент кафедри судноремонту, Одеський нацiональний морський утверситет Pizintsali L. V.

Ph.D., assistant professor of ship repair, Odessa National Maritime University

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Аннотация. В статье рассмотрены вопросы экологии и утилизации - основного принципа устойчивого развития государства. Рассмотрены этапы проекта утилизации судна, приведены обязательные требования к «утилизатору». Сделан акцент на то, что при разборке судна, основным критерием должно быть применение энергосберегающих, безотходных и малоотходных технологических решений; на каждое конкретное судно должна бать разработана программа утилизации, удовлетворяющая всем требованиям экологического и природоохранного законодательства. Поднимается вопрос о возможности введения утилизационного сбора или предоставления украинским судовладельцам утилизационного гранта

Ключевые слова: утилизация, судно, отходы, утилизационное предприятие, окружающая среда, Украина, проекутилизации, стандарты ISO 30 000

Анотацiя. У статтi розглянутi питання екологН та утил1зацИ - основного принципу сталого розвитку держави. Розглянутi етапи проекту утилгзаци судна, наведено обов'язковi вимоги до «утилiзатору». Зроблено акцент на те, що при розбирант судна, основним критерieм мае бути застосування енергозберiгаючих, безвiдходних та маловiдходних технологiчнихршень; на кожне конкретне судно мае бути розроблена програма утилгзаци, що задовольняе всiм вимогам екологiчного та природоохоронного законодавства. Шдтмаеться питання про можливiсть введення утил1зацшного збору або надання укратським судновласникам утилгзацтного гранту

Ключовi слова: утилiзацiя, судно, вiдходи, утил1зацшного тдприемство, навколишне середовище, Укра'та, проек утил1зацИ, стандарти ISO 30000

Summary: The article deals with environmental issues and waste - the basic principle of sustainable development of the state. IThe stages of the draft ship recycling, given the mandatory requirements to "the exchanger." It emphasizes the fact that the dismantling of the vessel, the main criterion should be the use of energy-saving, low-waste and non-waste technology solutions; for each particular vessel should be designed Bat recycling program that meets all the requirements of the environmental and nature protection legislation. It raises questions about the possibility of the recycling or collection of Ukrainian shipowners scrappage grant

Key words: recycling, ship waste recycling facility, the environment, Ukraine, recycling projects, the ISO standards 30000

i Надоели баннеры? Вы всегда можете отключить рекламу.