Научная статья на тему 'ПРИМЕНЕНИЕ АССОЦИАТИВНЫХ ПРАВИЛ В МЕДИЦИНЕ'

ПРИМЕНЕНИЕ АССОЦИАТИВНЫХ ПРАВИЛ В МЕДИЦИНЕ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
11
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ассоциативные правила(ARL) / базы данных / алгоритмы в медицине / association rules (ARL) / database / algorithms in medicine

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Е.А. Бежитская, А.О. Торопынина, В.Л. Сычугова

В данной статье описана суть ассоциативных правил, рассмотрены критерии их оценки, показаны примеры применения ассоциативных правил в медицине.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLYING OF ASSOCIATION RULES IN MEDICINE

This article describes the essence of association rules, criteria of association rules estimation are considered, examples of association rules using in medicine are presented.

Текст научной работы на тему «ПРИМЕНЕНИЕ АССОЦИАТИВНЫХ ПРАВИЛ В МЕДИЦИНЕ»

УДК 004

ПРИМЕНЕНИЕ АССОЦИАТИВНЫХ ПРАВИЛ В МЕДИЦИНЕ

Е. А. Бежитская, А.О. Торопынина, В.Л. Сычугова

Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: aotorop@gmail.com

В данной статье описана суть ассоциативных правил, рассмотрены критерии их оценки, показаны примеры применения ассоциативных правил в медицине.

Ключевые слава: ассоциативные правила(ARL), базы данных, алгоритмы в медицине.

APPLYING OF ASSOCIATION RULES IN MEDICINE E.A. Bezhitskaya, A.O. Toropynina, V.L. Sychugova

Reshetnev Siberian State University of Science and Technology 31, Krasnoyarskii rabochii prospekt, Krasnoyarsk, 660037, Russian Federation

E-mail: aotorop@gmail.com

This article describes the essence of association rules, criteria of association rules estimation are considered, examples of association rules using in medicine are presented.

Keywords: association rules (ARL), database, algorithms in medicine.

Информацию можно не только хранить, но и эффективно использовать. В связи с этим вырос спрос на новые алгоритмы для анализа данных. Именно с этой целью и были созданы методы поиска ассоциативных правил (ARL) [3].

ARL - это метод машинного обучения, позволяющий находить закономерности между связанными событиями в больших БД. Говоря другими словами: «Если произошло событие A, то произойдет событие Б». По мере добавление новых данных ARL может генерировать новые правила.

Наиболее популярный и часто используемый ARL - это алгоритм Apriori, но помимо него существуют и другие.

Для того чтобы данный алгоритм был осуществим, в первую очередь необходимо произвести предобработку данных, а именно:

1. Привести все данные к бинарному виду

2.Изменить структуру заданных данных, т.е. упорядочить их, привести их к матричному виду.

После данных изменений можно переходить к поиску правил. Для этого существует ряд критериев оценки правил.

Критерии оценки правил, помогающие в разработке ARL

1.Support(частота) - сообщает, в каком количестве событий встречаются действия А и В в общем наборе событий.

supp( + Х2 ) = ^В ) (1.1)

Секция «Информационно-экономические системы»

где а - это количество транзакций, содержащих А и В, а Т - общее количество всех транзакций

2. Сопйёепсе(качество)- отражает, насколько часто встречается правило «Взаимосвязь А и В» в общем наборе событий

conf (A u ß)= SUP p( (1.2)

sup p(A)

Где частота «одновременно происходят события A и B» делятся на «происходит событие A».

3. Lift (зависимость) - показывает, насколько событие А зависит от событие В.

lift (A u B)= SUp P((A U B) , (1.3)

sup p(A) *sup p(B)

Где частота «произошло событие A» делится на произведение частоты «произошло событие A» и частоты «Произошло событие B)

4. Conviction (убедительность) - выражает частоту ошибок данной взаимосвязи, т.е. как часто событие А происходило без события В и наоборот.

conv(A u b)= 1 - Sup(p(B)) (1.4)

V У 1 - conf (A u B)

Где разность единицы и частоты «Произошло событие А» делится на разность единицы и качества «Произошло событие A и B». Чем данный результат выше единицы, тем достовернее общее правило.

Цель данного метода - поиск ассоциативных правил, у которых частота и качество выше заданных минимальных значений. Это показывает, насколько это правило достоверно и обоснованно. При слишком больших значениях данных параметров алгоритм будет находить наиболее популярные, и тем самым очевидные и легко объясняемые правила. При слишком низком значении ARL будет находить слишком большой набор взаимосвязанных событий, не имеющих обоснования. Таким образом, следует найти такой интервал, при которых алгоритм сможет находить новые, неочевидные правила, и с другой стороны, правила, имеющие под собой обоснования.

Реализовать ARL можно в множестве различных программ. Например, при помощи инструментариев фирмы Microsoft(Exel + SQL Server) и arules, встроенного в RStudio. Помимо этого используются языки программирования, такие как Java Sdipt, Python и С++. Многие программисты создают свои собственные программы и алгоритмы, основываясь на ключевых правилах и используют доступные языки программирования.

Широкое применение ARL получил в сфере торговли. Впервые он был предложен именно для нахождения типичных шаблонов покупок, но польза данного метода выходит далеко за рамки сферы продаж. Своё применение ARL может найти и в медицине. Методы ARL помогают решить широкий спектр медицинских задач [1,2], такие как:

• Консолидация данных

При помощи БД, входящих в методы ARL, можно консолидировать всю информацию, имеющие отношения к решаемым медицинским задачам: данные медицинских карт, результаты анализов проб, выходные показатели диагностирующих тест-систем. Механизмы интеграции помогают получить данные из практически из любого источника.

• Диагностика заболеваний

В данной медицинской сфере ARL имеет особое значения, значительно упрощает ее функционирование. На базе различных моделей ARL создаются соответствующие системы

диагностики заболеваний, которые используют накопленные данные клинических исследований, автоматически выявляют значимые признаки и моделируют сложные зависимости между симптомами и заболеваниями.

Объектами данной задачи - пациенты. БД содержит сведения о пациентах и их заболеваниях. Среди всех данных о пациентах медики выделяют те симптомы и свойства, по их мнению, влияющие на возникновения того или иного заболевания у пациентов. Медиков интересует ассоциативное правило A=>B, где A - совокупность измеряемых факторов, с высокой достоверностью приводящая к появлению заболевания B. Крайне важно определить, является ли A классифицирующей (т.е. свидетельствует ли A о высокой вероятности появления заболевания B), тогда как достоверность правила A => С низкая, где C - другое заболевании, отличное от B. Рассматривая конкретную ситуацию из области педиатрии, можно привести в пример БД, содержащую данные о детях с ожирением и метаболическим синдромом. Эти заболевания объединены наличием общего признака -ожирения. Однако, согласно современным представлениям, метаболический синдром диагностируется у детей, имеющих помимо ожирения, еще целый ряд дополнительных признаков. При помощи методов ARL можно выяснить, является ли этот признак классифицирующим, что поможет определить, является ли этот метаболический синдром самостоятельным заболеванием, или же это осложнение ожирения ( т.к. единого мнения по этому вопросу среди медиков на данный момент не существует). Приведем другой пример. Запах ацетона изо рта всегда относят к признакам диабета и это может быть признаком наступления гипергликемической комы. Но не всегда это является таковым.

Есть детская болезнь под названием «ацетон», она связана с появлением запаха ацетона изо рта, но не является болезнью и не является сахарным диабетом. У детей это признак нарушения обмена веществ и начало истощения запасов гликогенов. В данном случае методы ARL также могут помочь определить, является ли этот признак классифицирующим при диагностики данного заболевания.

• Оценка диагностических тестов.

В медицинском скрининге необходимо оценивать эффективность диагностических тестов и сравнивать их с традиционными методиками. При помощи ассоциативных правил можно подобрать оптимальные пороги диагностических показателей, оценить чувствительность и специфичность модели.

• Выявление побочных эффектов

Методы ARL успешно применяются при выявлении связей между приемами препаратов и побочными эффектами.

Информационные технологии уже плотно входят в медицинскую сферу. На графике можно увидеть, какие области подвергаются наибольшей цифровизации. Автоматизация облегчает жизнь не только пациентам, но и медицинским работникам. На графике видно, что наибольшему влиянию подверглись медицинские карты. И это имеет смысл, ведь бумажный вариант давно устарел и неудобен в использовании. Вывод карт в общую БД существенно облегчает ее использование не только для медицинских работников и пациентов, но и для аналитиков. Обширная БД с множеством новой информации позволит им выводить новые правила при помощи методов ARL.

Также активно водится WEB регистратура, позволяющая пациентам записываться к нужному врачу в режиме онлайн, что позволит не стоять в долгих очередях в ожидании приёма.

Как мы видим, информационная поддержка диагностической деятельности и обработка диагностических исследований занимает лишь 10% от общей части графика, а ведь это часть медицины не менее важна, чем и все остальные. Именно в ней ARL будут незаменимы, существенно облегающие деятельность данной отрасли, позволяющая совершать новые открытия.

Секция «<Информациошю-экономические системы»

Исходя из этого анализа, по нашему мнению, стоит продолжать цифровизацию медицинской сферы, наращивать ее масштаб.

Современная медицина использует различные модели для нахождения ассоциативных правил, такие как: Apriori, Apriori Scale, OLAP-системы. Наиболее распространена модель Apriori и ее разновидности , так как эта масштабная модель позволяет обрабатывать больше объемы БД, что незаменимо в сфере медицине.

Внутри данных моделей применяется множество методов, помогающих выделять ассоциативные правила . К примеру, метод деревьев решений, метод машинного обучения, разнообразные регрессионные модели, нейронные сети, карты Кохонена.

Библиографические ссылки

1. Биллиг, В. А. Построение ассоциативных правил в задаче медицинской диагностики / В.А. Биллиг, О.В. Иванова, Н.А. Царегородцев // Программные продукты и системы. — 2016. — № 2. — С. 146-157. — ISSN 2311-2735. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/journal/issue/298708 (дата обращения: 23.11.2021). — Режим доступа: для авториз. пользователей.

2. Анализ данных медико-социологического мониторинга на основе методов машинного обучения / Г. Г. Рапаков, Г. Т. Банщиков, В. А. Горбунов [и др.] // Вестник Череповецкого государственного университета. — 2019. — № 1. — С. 27-38. — ISSN 1994-0637. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://elanbook.com/journal/issue/312641 (дата обращения: 23.11.2021). — Режим доступа: для авториз. пользователей.

3. Седова, Е. Н. Ассоциативные правила в социально-экономических и экологических исследованиях : учебное пособие / Е. Н. Седова, А. В. Раменская, Р. М. Безбородникова. — Оренбург : ОГУ, 2015. — 170 с. — ISBN 978-5-7410-1221-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/98105 (дата обращения: 28.11.2021). — Режим доступа: для авториз. пользователей.

© Бежитская Е.А., Торопынина А.О, Сычугова В. Л., 2022

i Надоели баннеры? Вы всегда можете отключить рекламу.