Научная статья на тему 'ПЕРВОЕ ИССЛЕДОВАНИЕ МЕДИЦИНСКОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ RUPATIENT ПО АВТОМАТИЧЕСКОМУ РАСПОЗНАВАНИЮ МЕДИЦИНСКОЙ ДОКУМЕНТАЦИИ НА ОСНОВЕ “МАШИННОГО ОБУЧЕНИЯ”'

ПЕРВОЕ ИССЛЕДОВАНИЕ МЕДИЦИНСКОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ RUPATIENT ПО АВТОМАТИЧЕСКОМУ РАСПОЗНАВАНИЮ МЕДИЦИНСКОЙ ДОКУМЕНТАЦИИ НА ОСНОВЕ “МАШИННОГО ОБУЧЕНИЯ” Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
155
45
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ / МАШИННОЕ ОБУЧЕНИЕ / ГЛУБОКОЕ ОБУЧЕНИЕ / ОБРАБОТКА ДАННЫХ / АВТОМАТИЗАЦИЯ / ЗДРАВООХРАНЕНИЕ / МЕДИЦИНА / RUPATIENT / МЕДИЦИНСКАЯ ИНФОРМАЦИОННАЯ СИСТЕМА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Комков А. А., Мазаев В. П., Рязанова С. В., Самочатов Д. Н., Кошкина Е. В.

Медицинская информационная система (МИС) RuPatient представляет собой компьютерную программу, состоящую из веб-интерфейса пользователя “врач-пациент”, который включает алгоритмы распознавания текста медицинской документации и занесения распознанного текста в соответствующие поля системы. Цель. Оценить эффективность МИС RuPatient в реальной клинической практике. Материал и методы. В исследовании участвовало 10 врачей-кардиологов и анестезиологов-реаниматологов отделения кардиологии и кардиореанимации ГКБ 67 им. Л. А. Ворохобова ДЗМ. Были проанализированы изображения (скан-копии, фотографии) выписных эпикризов от пациентов, поступивших в соответствующие отделения в 2021г. Выполнялось распознавание следующих полей медицинской документации: Фамилия Имя Отчество, Жалобы, Анамнез жизни, Анамнез заболевания, Осмотр, Назначения и Рекомендации. Анализировались правильность и точность распознавания занесенной информации. Проводилось сравнение качества распознавания нейросетевых алгоритмов МИС RuPatient на основе “машинного обучения” и популярной программы для распознавания текстов для персонального компьютера (FineReader для Mac) в нахождении (не)критических ошибок в словах для последующего программного анализа текста. Результаты. В исследование было включено: 77 страниц выписных эпикризов пациентов из различных стационаров России от 50 пациентов (52% мужчин). Средний возраст пациентов составил 57,7±7,9 лет. Количество выписок с правильно распознанными полями по различным категориям с помощью алгоритмов программы распределились следующим образом: Фамилия Имя Отчество 14 (28%), Диагноз 13 (26%), Жалобы 40 (80%), Анамнез 14 (28%), Общее состояние (осмотр) 24 (48%), Назначения и Рекомендации 46 (92%). Данные, не входившие в рубрику категории, также были распознаны и заносились в поле как комментарии. Количество распознанных слов 549±174,9 и 522,4±215,6 (p=0,5), критические ошибки в словах 2,1±1,6 и 4,4±2,8 (p<0,001), некритические ошибки в словах 10,3±4,3 и 5,6±3,3 (p<0,001) для МИС RuPatient и программы для распознавания текстов для персонального компьютера, соответственно. Заключение. Разработанная МИС RuPatient, включающая модуль распознавания медицинской документации и внесения данных в соответствующие поля МИС, в значительной степени повышает эффективность документооборота за счет качества распознавания алгоритмов на основе нейросетевых технологий и автоматизации процесса заполнения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Комков А. А., Мазаев В. П., Рязанова С. В., Самочатов Д. Н., Кошкина Е. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FIRST STUDY OF THE RUPATIENT HEALTH INFORMATION SYSTEM WITH OPTICAL CHARACTER RECOGNITION OF MEDICAL RECORDS BASED ON MACHINE LEARNING

RuPatient health information system (HIS) is a computer program consisting of a doctor-patient web user interface, which includes algorithms for recognizing medical record text and entering it into the corresponding fields of the system. Aim. To evaluate the effectiveness of RuPatient HIS in actual clinical practice. Material and methods. The study involved 10 cardiologists and intensivists of the department of cardiology and сardiovascular intensive care unit of the L. A. Vorokhobov City Clinical Hospital 67. We analyzed images (scanned copies, photos) of discharge reports from patients admitted to the relevant departments in 2021. The following fields of medical documentation was recognized: Name, Complaints, Anamnesis of life and illness, Examination, Recommendations. The correctness and accuracy of recognition of entered information were analyzed. We compared the recognition quality of RuPatient HIS and a popular optical character recognition application (FineReader for Mac). Results. The study included 77 pages of discharge reports of patients from various hospitals in Russia from 50 patients (men, 52%). The mean age of patients was 57,7±7,9 years. The number of reports with correctly recognized fields in various categories using the program algorithms was distributed as follows: Name - 14 (28%), Diagnosis - 13 (26%), Complaints - 40 (80%), Anamnesis - 14 (28%), Examination - 24 (48%), Recommendations - 46 (92%). Data that was not included in the category was also recognized and entered in the comments field. The number of recognized words was 549±174,9 vs 522,4±215,6 (p=0,5), critical errors in words - 2,1±1,6 vs 4,4±2,8 (p<0,001), non-critical errors - 10,3±4,3 vs 5,6±3,3 (p<0,001) for RuPatient HIS and optical character recognition application for a personal computer, respectively. Conclusion. The developed RuPatient HIS, which includes a module for recognizing medical records and entering data into the corresponding fields, significantly increases the document management efficiency with high quality of optical character recognition based on neural network technologies and the automation of filling process.

Текст научной работы на тему «ПЕРВОЕ ИССЛЕДОВАНИЕ МЕДИЦИНСКОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ RUPATIENT ПО АВТОМАТИЧЕСКОМУ РАСПОЗНАВАНИЮ МЕДИЦИНСКОЙ ДОКУМЕНТАЦИИ НА ОСНОВЕ “МАШИННОГО ОБУЧЕНИЯ”»

Кардиоваскулярная терапия и профилактика. 2021;20(8):3080. doi:10.15829/1728-8800-2021-3080 ISSN 1728-8800 (Print) ISSN 2619-0125 (Online)

Ш

РОПНИЗ

%0j

Hl ,

«MHÜ

V9

РОССИЙСКОЕ

КАРДИОЛОГИЧЕСКОЕ

ОБЩЕСТВО

Первое исследование медицинской информационной системы ЯиРаИеМ по автоматическому распознаванию медицинской документации на основе "машинного обучения"

Комков А. А.1'2, Мазаев В. П.1, Рязанова С. В.1, Самочатов Д. Н.2, Кошкина Е. В.2, Бушуева Е. В.2, Драпкина О. М.1

:ФГБУ "Национальный медицинский исследовательский центр терапии и профилактической медицины" Минздрава России. Москва; 2ГБУЗ "ГКБ № 67 им. Л. А. Ворохобова ДЗМ". Москва, Россия

Медицинская информационная система (МИС) RuPatient представляет собой компьютерную программу, состоящую из веб-интерфейса пользователя "врач-пациент", который включает алгоритмы распознавания текста медицинской документации и занесения распознанного текста в соответствующие поля системы. Цель. Оценить эффективность МИС RuPatient в реальной клинической практике.

Материал и методы. В исследовании участвовало 10 врачей-кардиологов и анестезиологов-реаниматологов отделения кардиологии и кардиореанимации ГКБ 67 им. Л. А. Ворохобова ДЗМ. Были проанализированы изображения (скан-копии, фотографии) выписных эпикризов от пациентов, поступивших в соответствующие отделения в 2021г. Выполнялось распознавание следующих полей медицинской документации: Фамилия Имя Отчество, Жалобы, Анамнез жизни, Анамнез заболевания, Осмотр, Назначения и Рекомендации. Анализировались правильность и точность распознавания занесенной информации. Проводилось сравнение качества распознавания нейро-сетевых алгоритмов МИС RuPatient на основе "машинного обучения" и популярной программы для распознавания текстов для персонального компьютера (FineReader для Mac) в нахождении (не)критических ошибок в словах для последующего программного анализа текста. Результаты. В исследование было включено: 77 страниц выписных эпикризов пациентов из различных стационаров России от 50 пациентов (52% мужчин). Средний возраст пациентов составил 57,7±7,9 лет. Количество выписок с правильно распознанными полями по различным категориям с помощью алгоритмов программы распределились следующим образом: Фамилия Имя Отчество 14 (28%), Диагноз 13 (26%), Жалобы 40 (80%), Анамнез 14 (28%), Общее состояние (осмотр) 24 (48%), Назначения и Рекомендации 46 (92%).

Данные, не входившие в рубрику категории, также были распознаны и заносились в поле как комментарии. Количество распознанных слов 549+174,9 и 522,4+215,6 (р=0,5), критические ошибки в словах 2,1+1,6 и 4,4+2,8 (р<0,001), некритические ошибки в словах 10,3+4,3 и 5,6+3,3 (р<0,001) для МИС РиРаНеП и программы для распознавания текстов для персонального компьютера, соответственно. Заключение. Разработанная МИС РиРаНет, включающая модуль распознавания медицинской документации и внесения данных в соответствующие поля МИС, в значительной степени повышает эффективность документооборота за счет качества распознавания алгоритмов на основе нейросетевых технологий и автоматизации процесса заполнения.

Ключевые слова: искусственный интеллект, машинное обучение, глубокое обучение, обработка данных, автоматизация, здравоохранение, медицина, РиРайегЛ, медицинская информационная система.

Отношения и деятельность. Источник финансирования — федеральный бюджет (госзадание АААА-А20-120013090084-6).

Поступила 07/10-2021

Рецензия получена 26/11-2021 г л ——

Принята к публикации 08/12-2021

Для цитирования: Комков А. А., Мазаев В. П., Рязанова С. В., Самочатов Д. Н., Кошкина Е. В., Бушуева Е. В., Драпкина О. М. Первое исследование медицинской информационной системы РиРаНеП по автоматическому распознаванию медицинской документации на основе "машинного обучения". Кардиоваскулярная терапия и профилактика. 2021;20(8):3080. 1^:10.15829/1728-8800-2021-3080

First study of the RuPatient health information system with optical character recognition of medical records based on machine learning

Komkov A. A.1,2, Mazaev V. P.1, Ryazanova S.V.1, Samochatov D. N.2, Koshkina E. V.2, Bushueva E. V.2, Drapkina O. M.1

1National Medical Research Center for Therapy and Preventive Medicine. Moscow; 2L. A. Vorokhobov City Clinical Hospital № 67. Moscow, Russia

RuPatient health information system (HIS) is a computer program algorithms for recognizing medical record text and entering it into the consisting of a doctor-patient web user interface, which includes corresponding fields of the system.

*Автор, ответственный за переписку (Corresponding author): e-mail: [email protected] Тел.: +7 (905) 509-85-00

[Комков А. А.* — к.м.н., с.н.с. лаборатории рентгенэндоваскулярных методов диагностики и лечения, врач по РЭВДиЛ, врач-кардиолог, ORCID: 0000-0001-7159-1790, Мазаев В. П. — д.м.н., профессор, руководитель лаборатории рентгенэндоваскулярных методов диагностики и лечения, ORCID: 0000-0002-9782-0296, Рязанова С. В. — к.м.н., с.н.с. лаборатории рентгенэндоваскулярных методов диагностики и лечения, врач-кардиолог: ORCID: 0000-0001-6776-0694, Самочатов Д. Н. — к.м.н., зав. отделением рентгенохирургических методов диагностики и лечения, врач по РЭВДиЛ, ORCID: 0000-0002-5230-2006, Кошкина Е. В. — к.м.н., зав. 3 отделением анестезиологии-реанимации, врач-кардиолог, ORCID: 0000-0001-9040-6757, Бушуева Е. В. — зав. отделением кардиологии № 3, врач-кардиолог, ORCID: 0000-0001-6628-0138, Драпкина О. М. — д.м.н., профессор, член-корр. РАН, директор, ORCID: 0000-0002-4453-8430].

Aim. To evaluate the effectiveness of RuPatient HIS in actual clinical practice.

Material and methods. The study involved 10 cardiologists and intensivists of the department of cardiology and сardiovascular intensive care unit of the L. A. Vorokhobov City Clinical Hospital 67. We analyzed images (scanned copies, photos) of discharge reports from patients admitted to the relevant departments in 2021. The following fields of medical documentation was recognized: Name, Complaints, Anamnesis of life and illness, Examination, Recommendations. The correctness and accuracy of recognition of entered information were analyzed. We compared the recognition quality of RuPatient HIS and a popular optical character recognition application (FineReader for Mac). Results. The study included 77 pages of discharge reports of patients from various hospitals in Russia from 50 patients (men, 52%). The mean age of patients was 57,7±7,9 years. The number of reports with correctly recognized fields in various categories using the program algorithms was distributed as follows: Name — 14 (28%), Diagnosis — 13 (26%), Complaints — 40 (80%), Anamnesis — 14 (28%), Examination — 24 (48%), Recommendations — 46 (92%). Data that was not included in the category was also recognized and entered in the comments field. The number of recognized words was 549±174,9 vs 522,4±215,6 (p=0,5), critical errors in words — 2,1±1,6 vs 4,4±2,8 (p<0,001), non-critical errors — 10,3±4,3 vs 5,6±3,3 (p<0,001) for RuPatient HIS and optical character recognition application for a personal computer, respectively. Conclusion. The developed RuPatient HIS, which includes a module for recognizing medical records and entering data into the corresponding fields, significantly increases the document management efficiency with

high quality of optical character recognition based on neural network technologies and the automation of filling process. Keywords: artificial intelligence, machine learning, deep learning, data processing, automation, healthcare, medicine, RuPatient, health information system.

Relationships and Activities. The source of funding is the federal budget (state task AAAA-A20-120013090084-6).

Komkov A. A.* ORCID: 0000-0001-7159-1790, Mazaev V. P. ORCID: 0000-0002-9782-0296, Ryazanova S. V. ORCID: 0000-0001-67760694, Samochatov D. N. ORCID: 0000-0002-5230-2006, Koshkina E. V. ORCID: 0000-0001-9040-6757, Bushueva E. V. ORCID: 0000-00016628-0138, Drapkina O. M. ORCID: 0000-0002-4453-8430.

*Corresponding author: [email protected]

Received: 07/10-2021 Revision Received: 26/11-2021 Accepted: 08/12-2021

For citation: Komkov A. A., Mazaev V. P., Ryazanova S. V., Samochatov D. N., Koshkina E. V., Bushueva E. V., Drapkina O. M. First study of the RuPatient health information system with optical character recognition of medical records based on machine learning. Cardiovascular Therapy and Prevention. 2021;20(8):3080. (In Russ.) doi:10.15829/1728-8800-2021-3080

ИИ — искусственный интеллект, МИС — медицинская информационная система, ФИО — Фамилия Имя Отчество.

Прогрессивное развитие медицинской науки и решение частных прикладных задач выдвигают новые требования к методам извлечения информации из накопленных (и вновь получаемых) медицинских данных с целью последующего практического и научного использования. Существующие источники и алгоритмы получения первичных медицинских данных, их цифровая обработка и поиск оптимальных технологических решений рассматриваются как основа научного прогресса в диагностике и лечении заболеваний. Новые решения с использованием различных алгоритмов обработки данных, включая открывающиеся возможности с применением элементов искусственного интеллекта (ИИ), имеют значимую актуальность среди различных подходов в решении задач здравоохранения [1].

В медицинских информационных системах (МИС) ожидаются прогрессивные изменения на основе внедрения новых подходов к анализу существующих и накопленных баз данных и формированию их в единое ядро. Это ядро рассматривается как организованный программный комплекс (веб-сервис), являющийся электронной историей болезни, которая включает объединенную характеристику единого процесса регистрации и анализа данных, а также интеллектуальный "машинный" ответ на вопросы практической медицины [2].

Одной из нерешенных задач является отсутствие системы программной среды для ускорения

взаимодействия различных медицинских служб при контакте с пациентами. Назрела серьезная проблема в создании "интерфейса пациента" для сбора необходимой информации без непосредственного обращения пациента в лечебное учреждение с возможностью удаленного консультирования и выдачей рекомендаций на основе полученных данных [3]. Использование аналитического подхода при рассмотрении документации позволит быстро и с большой точностью выявлять положи -тельные стороны и недостатки в системах лечения и диагностики.

Применение новых организационных решений в сочетании с технологическими возможностями приведет к созданию эффективной базы для выполнения следующего этапа: использования разработанных и апробированных медицинских рекомендаций. Ожидается, что разработка программного комплекса, включающего веб-интерфейс и аналитические модули, повысит эффективность работы медицинских учреждений.

В ряде исследований показано, что ИИ может выполнять так же хорошо, а в некоторых случаях лучше, чем люди, ключевые задачи здравоохранения, такие как профилактика и диагностика заболеваний [4]. В частности, результаты применения систем ИИ в выявлении злокачественных опухолей превзошли возможности традиционной диагностики рентгенологами [5].

Рис. 1 Внешний вид карточки нового пациента в МИС RuPatient. Большинство полей можно заполнять в ручном режиме и с помощью алгоритмов распознавания существующей медицинской документации (скан-копий, фотографий медицинских заключений).

Применение технологий распознавания текстов медицинской документации не ново, однако научные публикации по данной тематике носят единичный характер. Интернет-публикация по ди-гитализации здравоохранения отмечает компанию Apixio, занимающуюся сбором, распознаванием и анализом медицинских данных с помощью ИИ. Несмотря на длительное существование, подобные технологии все еще находятся в зачаточном состоянии [6]. Попытки анализа данных в текстах медицинских выписок проводились в России с показателями извлечения различных данных 54-100%

[7], а также с применением технологий интеллектуального анализа неструктурированного текста

[8]. Недостаток научных данных в этой области послужил мотивацией для публикации настоящей статьи. В намечаемом исследовании будут разработаны и применены современные методики ИИ на основании машинной обработки больших данных с использованием скоростных компьютеров.

Настоящая работа является первым этапом создания модульной МИС по автоматизации рутинных действий медицинского персонала при помощи инструментов на основе ИИ. Применение модульной МИС RuPatient по автоматизации ру-

тинных действий медицинского персонала с использованием технологий "машинного обучения" для анализа печатной медицинской документации и рассматривается в данной статье.

Материал и методы

В исследовании участвовало 10 врачей-кардиологов и анестезиологов-реаниматологов отделения кардиологии и кардиореанимации ГКБ №67 им. Л. А. Ворохо-бова ДЗМ Москва. Были проанализированы выписные эпикризы (скан-копии, фотографии) от пациентов, поступавших в соответствующие отделения в 2021г. Все пациенты подписали согласие на обработку персональных данных, и были анонимизированы перед сохранением в системе. Выполнялось распознавание следующих полей медицинской документации госпитализированных пациентов: Фамилия Имя Отчество (ФИО), Жалобы, Анамнез жизни и заболевания, Осмотр, Назначения и Рекомендации. Поля для занесения информации, соответствующие стандартным полям типичных медицинских эпикризов, уже имеются в системе RuPatient (рисунок 1). Анализировались правильность и точность распознавания занесенной информации в соответствующие поля. Для распознавания включались страницы медицинских заключений с соответствующими заголовками. Анализ таблиц был исключен из исследования — в настоящее время данная функция находится

в разработке. Проводилось сравнение качества распознавания нейросетевых алгоритмов МИС RuPatient (на основе Tesseract — OCR) и популярной программы для распознавания текстов для персонального компьютера ABBYY FineReader PDF для Mac версия 15.0.3 в нахождении критических и некритических ошибок в словах для последующего программного анализа текста. Одно и то же изображение, полученное с помощь сканера (МФУ Samsung SCX-5637FR) и смартфонов (Huawei P30, iPhone 6, 6s, XS, 11, 12, 13, Xiaomi Poco F3, X3, Redmi 9, Samsung A12, S8, S10, анализировалось в МИС RuPatient и FineReader. Изображение в формате JPEG загружалось в соответствующую программу. Обе системы: и FineReader, и МИС RuPatient предобрабатывали изображения. В FineReader функция улучшения изображения была включена по умолчанию перед распознаванием всех изображений. К критическим ошибкам относили элементы диагноза, лабораторно-инструментальных исследований, которые могли в последующем определяться неверно программой для обработки данных (например, слово "Тропонин" распознавалось алгоритмом RuPatient как "ТГропонин", а название стента "Flexinnium" определялось в FineReader как "Р1_ЕХ11\11\11иМ"). К некритическим ошибкам относили некорректно распознанные слова, не имеющие принципиального значения для дальнейшего программного анализа текста (например, слово "Продолжить" распознавалось алгоритмом RuPatient как "Tiponrsac ть", а предлог "При" определялось в FineReader как "Пои"). Анализ критических и некритических ошибок в словах, а также качества изображений (наличие артефактов, достаточное разрешение, размытость и т.п.) осуществлялся двумя независимыми специалистами, регулярно работающими с медицинской документацией. Ошибками в словах считались случаи, когда оба специалиста подтверждали их наличие в одном и том же слове. Качество документа специалистами оценивалось субъективно на основе разрешения изображения, угла наклона, освещенности, наличия артефактов.

Точность выявления вышеуказанных полей и отсутствие значимого количества ошибок по сравнению с популярной программой для распознавания текстов

Таблица 1

Исходные данные пациентов и распознаваемые данные (n=50)

Характеристики Значение

Возраст, лет_57,7+7,9_

Пол, n (%)_26 (52%)_

Устройства получения изображения

Сканер, n (%)_31 (62%)_

Смартфон, n (%)_19 (38%)_

Время распознавания, сек 23,8+2,8

Правильность занесения распознанных данных в поля интерфейса МИС RuPatient

ФИО, n (%)_14 (28%)_

Диагноз, n (%)_13 (26%)_

Жалобы, n (%)_40 (80%)_

Анамнез, n (%)_14 (28%)_

Общее состояние (осмотр), n (%) 24 (48%) Рекомендации, n (%)_46 (92%)_

являлись основными критериями эффективности МИС RuPatient в данном исследовании.

О МИС RuPatient

В настоящее время МИС RuPatient представляет собой прототип веб-сервиса для медицинских учреждений с модулем аналитики на базе ИИ и продвинутым современным интерфейсом. Техническая часть разработки представляет собой набор программного обеспечения, состоящего из серверной и клиентской части. Доступ к сервису предоставляется из браузера, установленного на устройстве клиента через веб-интерфейс и личный кабинет пользователя. Возможен доступ к МИС как с компьютера, так и с мобильных устройств, включая удобную подгрузку фотографий документации через телефон и последующую доработку через браузер компьютера. Фотографирование документов должно производиться на камеру разрешением не <10 MPix, при этом документ должен быть расположен вертикально и ровно относительно кадра с поворотом не >5O при достаточной освещенности и отсутствии артефактов.

Разработан аналитический модуль печатной медицинской документации с использованием нейросетевых технологий. Данный модуль автоматизирует процесс работы врача с документами, распознавая текст и вставляя различные поля заключений в соответствующие поля веб-сервиса. Техническая часть разработки представлена следующими алгоритмами. В первую очередь происходит предобработка изображений при помощи классических алгоритмов: устранение шума, увеличение контрастности, устранение перекоса. Отсканированные документы распознаются при помощи семантической сегментации, для которой используется архитектура типа encoderdecoder сверточной нейронной сети. Для непосредственного распознавания текста в приложении используется Tesseract, свободная библиотека на основе предобучен-ной нейронной сети, как элемента "машинного обучения", с рекуррентной архитектурой "долгая краткосрочная память" (long short-term memory; LSTM). Данная нейронная сеть в дальнейшем до обучается на собственном датасете.

В настоящей статье применяются следующие термины с соответствующими определениями:

ИИ — свойство системы выполнять творческие функции, которые традиционно считаются прерогативой человека (распознавание текста и заполнение соответствующих полей).

Машинное обучение — это изучение компьютерных алгоритмов, которые улучшаются автоматически через опыт (OCR — optical character recognition, оптическое распознавание символов на основе нейросетевых алгоритмов).

МИС — информационная система, предназначенная для ведения, хранения на электронных носителях, поиска и выдачи по информационным запросам (в т.ч. и по электронным каналам связи) персональных медицинских записей.

Нейронная сеть — математическая модель, а также ее программное или аппаратное воплощение, построенная по принципу организации и функционирования биологических нейронных сетей — сетей нервных клеток живого организма (для распознавания текста используется рекуррентная сеть, где связи между элементами образуют направленную последовательность, а именно: длинная цепь элементов краткосрочной памяти).

Таблица 2

Сравнение точности распознавания алгоритмов МИС RuPatient с FineReader (n=50)

RuPatient FineReader p

Количество проанализированных изображений на пациента 1,5±0,5 1,5±0,5

Среднее качество изображений, % 86,7±0,3 86,7±0,3

Количество распознанных слов 549±174,9 522,4±215,6 0,5

Критические ошибки в словах 2,1±1,6 4,4±2,8 <0,001

Некритические ошибки в словах 10,3±4,3 5,6±3,3 <0,001

Статистическая обработка выполнялась в SPSS 23 (IBM) и Excel (Microsoft). Переменные представлялись как среднее (M) ± стандартное отклонение (SD), для проверки гипотез о средних в двух группах применялся t-критерий Стьюдента.

Результаты

77 страниц выписных эпикризов из различных стационаров России от 50 пациентов было включено в исследование. Мужчин было 26 (52%). Средний возраст пациентов составил 57,7±7,9 лет. Среднее время распознавания каждой страницы составило 23,8±2,8 сек. Количество выписок с правильно распознанными полями по различным категориям с помощью алгоритмов программы распределилось следующим образом: ФИО 14 (28%), Диагноз 13 (26%), Жалобы 40 (80%), Анамнез 14 (28%), Общее состояние (осмотр) 24 (48%), Рекомендации 46 (92%) (таблица 1). Неопределенные в категории данные, также были распознаны и заносились в поле "комментарии", после чего распознанный текст мог переноситься в другие поля по желанию врачей.

Количество распознанных слов 549± 174,9 и 522,4±215,6 (p=0,5), Критические ошибки в словах 2,1±1,6 и 4,4±2,8 (p<0,001), Некритические ошибки в словах 10,3±4,3 и 5,6±3,3 (p<0,001) для МИС RuPatient и программы для распознавания текстов FineReader соответственно (таблица 2). Худшее качество изображений, оцениваемое специалистами, принималось за 0%, лучшее — 100%.

Процент как критических, так и некритических ошибок в обеих программах был достаточно низок 0,4/0,8% и 1,9/1,1% для МИС RuPatient/ FineReader, соответственно.

Обсуждение

Использованный подход, основанный на применении элементов ИИ для развития и совершенствования нового направления в получении и обработке реальных традиционных медицинских данных с переводом в формат "электронная медицинская карта" с последующим созданием алгоритмов решения практических и научных задач в реальной практике клинической медицины, имеет ясную научную направленность и новизну [9].

Научно-технический задел представленной работы имеет значительный потенциал не только для России, но и для мирового опыта в разработке ме-

дицинских программ ИИ. Полученные результаты, несмотря на малый объем выборки, показали достаточную эффективность относительно другой программы для распознавания текстов, однако методология распределения текстов по полям требует доработки в плане включения новых ключевых слов и выражений для поиска, что будет сделано в следующих версиях веб-сервиса.

Ядро системы закладывает возможность "машинных" ответов на вопросы практической медицины. Результаты аспектов внедрения и интеграции элементов ИИ в реальную клиническую практику отражают приоритет стратегии научно-технологического развития РФ "переход к передовым цифровым, интеллектуальным производственным технологиям, роботизированным системам, новым материалам и способам конструирования, создание систем обработки больших объемов данных, машинного обучения и ИИ".

Основным направлением исследования являются автоматизированные системы и медицинская информатика, что, в свою очередь, имеет тесное соприкосновение со всеми другими областями медицины в данной работе. Помимо написания программ наибольшую значимость имеет организация процесса при обязательной научной составляющей получаемых результатов — вот почему подобной работой не могут заниматься обычные программисты, а должны заниматься специалисты в области медицины с достаточной квалифицированной поддержкой всех этапов процесса разработки [10]. Широкое внедрение разрабатываемой системы повлияет на взаимодействие специалистов в области медицины в целом и может стать частью федерального проекта по разработке единого цифрового контура в здравоохранении. Наряду с изобретением программ немаловажным этапом является необходимость разработки правовых вопросов применения данной системы вне эксперимента в реальной клинической практике. Анализ работы с несколькими видами историй болезни и амбулаторных карт, включающий рутинное внесение всей информации в печатном виде, электронные истории болезни (Димол, Медиалог), изучение других систем электронной документации (Единая медицинская информационно-аналитическая система — ЕМИАС) и оценка современных представлений, данных в шведском регистре, позво-

лил сформировать абсолютно новый подход к созданию историй болезни, отличающийся постоянным развитием и удобным интерфейсом, не требующим значительного улучшения аппаратно-технической составляющей, который может быть запущен даже со смартфона.

Разработанный прототип веб-сервиса положит основу дальнейшего внедрения и тестирования программ автоматизации процессов заполнения медицинской документации. Структура построения веб-сервиса станет основой для дальнейшего создания инноваций в области нейросетей как часть ИИ. Веб-сервис при широком применении будет иметь высокий потенциал для относительно нересурсоемкого внедрения в любые медицинские учреждения с высоким потенциалом производительности относительно существующих МИС. Близкие по функционалу системы имеют достаточно высокую стоимость, что делает разрабатываемую нами систему конкурентноспособной на рынке информационных систем. Модули распознавания/аналитики текста и другие элементы МИС RuPatient могут быть внедрены в сторонние МИС через пользовательский интерфейс либо использованы как самостоятельный продукт совместно с имеющимися в учреждениях сторонними МИС.

Преимущество МИС RuPatient заключается в автоматизации заполнения электронных форм историй болезни на основе предоставленных пациентом медицинских заключений и выписных эпикризов с помощью распознавания бумажных носителей. Больницы, поликлиники и другие учреждения здравоохранения, применяющие технологию

Литература/References

1. Halamka J. The Digital Reconstruction of Health Care. NEJM Catal. 2020;1(6):1-12. doi:10.1056/cat.20.0082.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Liu Y, Chen PHC, Krause J, et al. How to Read Articles That Use Machine Learning: Users' Guides to the Medical Literature. JAMA. 2019;322(18):1806-16. doi:10.1001/jama.2019.16489.

3. Burnham JP, Lu C, Yaeger LH, et al. Using wearable technology to predict health outcomes: A literature review. J Am Med Inform Assoc. 2018;25(9):1221-7. doi:10.1093/jamia/ocy082.

4. Komkov AA, Mazaev VP, Ryazanova SV, et al. The main directions of the development of artificial intelligence in medicine. Scientific review. Medical sciences. 2020;5:33-40. (In Russ.) Комков А.А., Мазаев В. П., Рязанова С. В. и др. Основные направления развития искусственного интеллекта в медицине. Научное обозрение. Медицинские науки. 2020;5:33-40. doi:10:l7513/srms1l141.

5. Hosny A, Parmar C, Quackenbush J, et al. Artificial intelligence in radiology. Nat Rev Cancer. 2018;18(8):500-10. doi:10.1038/ s41568-018-0016-5.

6. AI-Based Document Digitization in Healthcare — What's Possible [Electronic resource]. Emerj. 2019. URL: https://emerj.com/ai-sector-overviews/document-digitization-healthcare. (01 Dec 2021).

7. Dudchenko PV. Recognition of required data in the text of medical statements. Breakthrough scientific research problems, patterns, prospects. Collection of articles of the XI International Scientific

МИС ЯиРаНеШ, получат экономическое преимущество за счет сокращения времени, потраченного на работу с многочисленной документацией.

Целесообразно рассматривать ИИ на основе "машинного обучения" как сложный инструмент, который, используя наборы "больших данных", превосходит возможности статистических методов и позволяет достичь новых результатов в теоретической и клинической практике [1].

Дальнейшие исследования с включением большего количества участников могут иметь более значимую научную ценность.

Заключение

Разработанная МИС ЯиРаНеШ включает в себя модуль распознавания медицинской документации и внесения данных в соответствующие поля МИС. Данный модуль представляет собой нейросетевой алгоритм ИИ, и является частью большой программы по автоматизации рутинных действий медицинского персонала. Показана эффективность представленного фрагмента МИС за счет качества распознавания имеющейся бумажной медицинской документации, повышения эффективности документооборота и автоматизации процесса заполнения. МИС ЯиРаНеШ с алгоритмами "машинного обучения" позволит собирать и обрабатывать "большие мультимодальные данные" для повышения эффективности лечебного и организационного процесса в целом.

Отношения и деятельность. Источник финансирования — федеральный бюджет (госзадание АААА-А20-120013090084-6).

and practical Conference. Penza, October 27, 2018. 2018:49-51. (In Russ.) Дудченко П. В. Распознавание требуемых данных в тексте медицинских выписок. Прорывные научные исследования проблемы, закономерности, перспективы. Сборник статей XI международной научно-практической конференции. Пенза, 27 октября 2018 года. 2018:49-51. ISBN: 978-5-907135-19-2.

8. Moskalev IV, Krotova OS, Khvorova LA. Automation of the process of extracting structured data from unstructured medical statements using text mining technologies. High-performance computing systems and technologies. 2020;4(1):163-7. (In Russ.) Москалев И. В., Кротова О. С., Хворова Л. А. Автоматизация процесса извлечения структурированных данных из неструктурированных медицинских выписок c применением технологий интеллектуального анализа текстов. Высокопроизводительные вычислительные системы и технологии. 2020;4(1):163-7.

9. Rudin RS, Friedberg MW, Shekelle P, et al. Getting Value From Electronic Health Records: Research Needed to Improve Practice. Ann Intern Med. 2020;172(11):S130-6. doi:10.7326/ M19-0878.

10. Evans RS. Electronic Health Records: Then, Now, and in the Future. Yearb Med Inform. 2016):S48-61. doi: 10.15265/IYS-2016-s006.

i Надоели баннеры? Вы всегда можете отключить рекламу.