Научная статья на тему 'Внедрение искусственного интеллекта в речи (голосового ввода) в условиях высокопотокового эндоскопического центра'

Внедрение искусственного интеллекта в речи (голосового ввода) в условиях высокопотокового эндоскопического центра Текст научной статьи по специальности «Медицинские технологии»

CC BY
4
2
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
технологии распознавания речи / распознавание речи / автоматическое распознавание речи / клиническая документация / speech recognition software / voice recognition / automatic speech recognition / clinical documentation

Аннотация научной статьи по медицинским технологиям, автор научной работы — Шабунин Алексей Васильевич, Бедин Владимир Владимирович, Коржева Ирина Юрьевна, Орлов Станислав Юрьевич, Осьмак Екатерина Константиновна

Искусственный интеллект (ИИ) и цифровизация используются во всех сферах жизни, в том числе и в медицине: при постановке диагнозов, в работе с пациентами, в создании и использовании Электронной Медицинской Карты (ЭМК) для быстрого и доступного документооборота. Неоднократно предпринимались попытки облегчить работу и с медицинскими протоколами. Перспективным направлением в этой сфере являются технологии, связанные с распознаванием речи. Целью научно-исследовательской работы стала оптимизация времени написания протокола при помощи голосового ввода. Объектом исследования явился шаблонный протокол эндоскопического исследования. Данная работа проводилась на базе 2х крупных эндоскопических центров г. Москвы, созданных в рамках пилотного проекта ДЗМ в рамках программы скрининга колоректального рака (КРР) в РФ в 2021 г. Для заполнения протокола исследования использовалось программное обеспечение (ПО) Центра речевых технологий (ЦРТ) Voice2Med. При помощи математических расчетов были созданы 4 метрики для оценки работы ПО: время формирования протокола; доля времени формирования протокола от проведения исследования; уровень точности распознавания речи; удовлетворенность врачей при работе с технологией. Разработаны стандартизированные шаблоны протоколов для различных нозологий, связанные с голосовыми командами; медицинский тезаурус. В ходе работы исследовалась и усовершенствовалась точность распознавания речи. Были проведены контрольные замеры времени написания протокола. Получены результаты оценки использования технологии врачамиэндоскопистами — время формирования протокола уменьшилось на 29%, оценка работы ПО врачамиэндоскопистами была положительной. Таким образом, применение речевых технологий, связанных с формированием протокола врача «с голоса» является перспективным направлением дальнейшего развития IT-сферы в практической медицине.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по медицинским технологиям , автор научной работы — Шабунин Алексей Васильевич, Бедин Владимир Владимирович, Коржева Ирина Юрьевна, Орлов Станислав Юрьевич, Осьмак Екатерина Константиновна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Implementation of artificial intelligence in speech (voice input) in the conditions of a high-flow endoscopy

Artificial intelligence (AI) and digitalization are used in all spheres of life, including medicine: in making diagnoses, in working with patients, in creating and using an Electronic Medical Record (EMC) for fast and accessible document management. Attempts have been made repeatedly to facilitate work with medical protocols. Technologies related to speech recognition are a promising direction in this area. The purpose of the research work was to optimize the time of writing the protocol using voice input. The object of the study was a template protocol of endoscopic examination. This work was carried out on the basis of 2 large endoscopic centers in Moscow, created as part of the pilot project of the DM within the framework of the colorectal cancer screening program in the Russian Federation in 2021. The software of the Voice2Med Speech Technology Center (MDG) was used to fill out the research protocol. Using mathematical calculations, 4 metrics were created to evaluate the work of the software: the time of protocol formation; the proportion of protocol formation time from the study; the level of speech recognition accuracy; satisfaction of doctors when working with technology. Standardized protocol templates for various nosologies related to voice commands have been developed; medical thesaurus. In the course of the work, the accuracy of speech recognition was investigated and improved. Control measurements of the time of writing the protocol were carried out. The results of the evaluation of the use of the technology by endoscopists were obtained — the time of protocol formation decreased by 29%, the evaluation of the work by endoscopists was positive. Thus, the use of speech technologies related to the formation of a doctor's protocol "from the voice" is a promising direction for the further development of the IT sphere in practical medicine.

Текст научной работы на тему «Внедрение искусственного интеллекта в речи (голосового ввода) в условиях высокопотокового эндоскопического центра»

я

(~)h'di'U--MI https://d0i.0rg/l 0.31146/1682-8658-ecg-213-5-5-12

Внедрение искусственного интеллекта в речи (голосового ввода) в условиях высокопотокового эндоскопического центра

Шабунин А.В.12-3, Бедин В.В.12, Коржева И.Юи'3, Осьмак Е.К.^ОрловС.Ю.5, Васильев И.В.4, НестеровД.В.4, Алепко А.А.3

1 Государственное бюджетное учреждение здравоохранения Городская клиническая больница имени С. П. Боткина Департамента здравоохранения города Москвы, (ул. 2-й Боткинский проезд, д. 5, г. Москва, 125284, Россия)

2 Федеральное государственное бюджетное образовательное учреждение дополнительного профессионального образования «Российская медицинская академия непрерывного профессионального образования» МЗ РФ, (ул. Баррикадная.2, стр.1, Москва, 123995, Россия)

3 Государственное бюджетное учреждение «Научно-исследовательский институт организации здравоохранения и медицинского менеджмента Департамента здравоохранения города Москвы», (ул. Шарикоподшипниковская, д. 9, г. Москва, 115088, Россия)

4 Общество с ограниченной ответственностью «Центр Речевых Технологий» (ул. Земляной Вал, 59, стр. 2, г. Москва, 109004, Россия)

5 Государственное бюджетное учреждение здравоохранения «Городская клиническая больница им. В. М. Буянова» Департамента здравоохранения города Москвы, (ул. Бакинская, 26, Москва, 115516, Россия)

Для цитирования: Шабунин А. В., Бедин В. В., Коржева И. Ю., Осьмак Е. К., Орлов С. Ю., Васильев И. В., Нестеров Д. В., Алепко А. А. Внедрение искусственного интеллекта в речи (голосового ввода) в условиях высокопотокового эндоскопического центра. Экспериментальная и клиническая гастроэнтерология. 2023;213(5): 5-12. DOI: Ш1146/1682-8658-есд-213-5-5-12

Шабунин Алексей Васильевич, академик РАН, д.м.н, главный врач; главный хирург; заведующий кафедрой хирургии Бедин Владимир Владимирович, д.м.н, заместитель главного врача по хирургии; профессор кафедры хирургии Коржева Ирина Юрьевна, д.м.н, заведующий эндоскопическим центром; ведущий специалист по эндоскопии ОМО по хирургии; заведующий кафедрой эндоскопии

Орлов Станислав Юрьевич, к.м.н, заведующий эндоскопическим центром; доцент кафедры хирургии и эндоскопии

Осьмак Екатерина Константиновна, врач-эндоскопист эндоскопического центра

Васильев Илья Владимирович, 1Т-специалист, руководитель НИР, старший руководитель проектов

Нестеров Дмитрий Викторович, 1Т-специалист, врач-терапевт, ответственный исполнитель НИР, менеджер

по обучению клиентов

Алепко Алексей Александрович, главный специалист по информационным технологиям ДЗМ, начальник отдела планирования цифровизации здравоохранения и управления развития цифровых технологий

Резюме

Искусственный интеллект (ИИ) и цифровизация используются во всех сферах жизни, в том числе и в медицине: при постановке диагнозов, в работе с пациентами, в создании и использовании Электронной Медицинской Карты (ЭМК) для быстрого и доступного документооборота. Неоднократно предпринимались попытки облегчить работу и с медицинскими протоколами. Перспективным направлением в этой сфере являются технологии, связанные с распознаванием речи.

Целью научно-исследовательской работы стала оптимизация времени написания протокола при помощи голосового ввода. Объектом исследования явился шаблонный протокол эндоскопического исследования.

Данная работа проводилась на базе 2х крупных эндоскопических центров г. Москвы, созданных в рамках пилотного проекта ДЗМ в рамках программы скрининга колоректального рака (КРР) в РФ в 2021 г.

Для заполнения протокола исследования использовалось программное обеспечение (ПО) Центра речевых технологий (ЦРТ) Уо1се2МеС. При помощи математических расчетов были созданы 4 метрики для оценки работы ПО: время формирования протокола; доля времени формирования протокола от проведения исследования; уровень точности распознавания речи; удовлетворенность врачей при работе с технологией.

И Для переписки: Коржева Ирина Юрьевна

[email protected]

EDN: GOGKBO

ЕМВ

Разработаны стандартизированные шаблоны протоколов для различных нозологий, связанные с голосовыми командами; медицинский тезаурус. В ходе работы исследовалась и усовершенствовалась точность распознавания речи. Были проведены контрольные замеры времени написания протокола.

Получены результаты оценки использования технологии врачами-эндоскопистами — время формирования протокола уменьшилось на 29%, оценка работы ПО врачами-эндоскопистами была положительной.

Таким образом, применение речевых технологий, связанных с формированием протокола врача «с голоса» является перспективным направлением дальнейшего развития 1Т- сферы в практической медицине.

Ключевые слова: технологии распознавания речи, распознавание речи, автоматическое распознавание речи, клиническая документация

Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.

ГФМШИ https://doi.org/! 0.31146/1682-8658-ecg-213-5-5-12

Implementation of artificial intelligence in speech (voice input) in the conditions of a high-flow endoscopy

A.V. Shabunin1-2-3, V.V. Bedin1-2, I.Yu. Korzheva1-2-3, E.K. Osmak1, S.Yu. Orlov5, I.V. Vasiliev4, D.V. Nesterov4, A.A. Alepko3

1 S. P. Botkin Municipal Clinical Hospital, (5, 2nd Botkinsky Prospect, Moscow, 125284, Russia)

2 Russian Medical Academy of Continuing Professional Education of the Ministry of Health of the Russian Federation, (2/1, Barricadnaya Street, Moscow, 125993, Russia)

3 Scientific Research Institute of Health Organization and Medical Management of the Department of Health of the City of Moscow, (9, Sharikopodshipnikovskaya st., Moscow, 115088, Russia)

4 Speech Technology Center Limited Liability Company, (59, build. 2, Zemlyanoi Val st., Moscow, 109004, Россия)

5 City Clinical Hospital named after V. M. Buyanova, (26, St. Bakinskaya, Moscow, 115516, Russia)

For citation: Shabunin A. V., Bedin V. V., Korzheva I. Yu., Osmak E. K., Orlov S. Yu., Vasiliev I. V., Nesterov D. V., Alepko A. A. Implementation of artificial intelligence in speech (voice input) in the conditions of a high-flow endoscopy. Experimental and Clinical Gastroenterology. 2023;213(5): 5-12. (In Russ.) DOI: 10.31146/1682-8658-ecg-213-5-5-12

H Corresponding Alexei V. Shabunin, Academician of the Russian Academy of Sciences, MD, Chief Physician; Chief Surgeon;

author: Head of the Department of Surgery; ORCID: 0000-0002-4230-8033

Irina Yu. Korzheva Vladimir V. Bedin, MD, Deputy Chief Physician for Surgery; Professor of the Department of Surgery; ORCID: 0000-0001-8441-6561 [email protected] Irina Yu. Korzheva, MD, Head of the Endoscopic center; a leading specialist in endoscopy of the OMO in surgery;

Head of the Department of Endoscopy; ORCID: 0000-0002-5984-5660 Ekaterina K. Osmak, endoscopist of the endoscopic center; ORCID: 0000-0003-2283-1182 Ilya V. Vasiliev, IT specialist, head of research, Senior Project Manager

Dmitri V. Nesterov, IT specialist, therapist, responsible executor of research, manager for training clients

Alexey A. Alepko, Chief Information Technology Specialist of Department of Health of Moscow, Head of the Department

of Healthcare Digitalization Planning and Digital Technology Development Department

Summary

Artificial intelligence (AI) and digitalization are used in all spheres of life, including medicine: in making diagnoses, in working with patients, in creating and using an Electronic Medical Record (EMC) for fast and accessible document management. Attempts have been made repeatedly to facilitate work with medical protocols. Technologies related to speech recognition are a promising direction in this area.

The purpose of the research work was to optimize the time of writing the protocol using voice input. The object of the study was a template protocol of endoscopic examination.

This work was carried out on the basis of 2 large endoscopic centers in Moscow, created as part of the pilot project of the DM within the framework of the colorectal cancer screening program in the Russian Federation in 2021.

The software of the Voice2Med Speech Technology Center (MDG) was used to fill out the research protocol. Using mathematical calculations, 4 metrics were created to evaluate the work of the software: the time of protocol formation; the proportion of protocol formation time from the study; the level of speech recognition accuracy; satisfaction of doctors when working with technology. Standardized protocol templates for various nosologies related to voice commands have been developed; medical thesaurus. In the course of the work, the accuracy of speech recognition was investigated and improved. Control measurements of the time of writing the protocol were carried out.

The results of the evaluation of the use of the technology by endoscopists were obtained — the time of protocol formation decreased by 29%, the evaluation of the work by endoscopists was positive.

Thus, the use of speech technologies related to the formation of a doctor's protocol "from the voice" is a promising direction for the further development of the IT sphere in practical medicine.

Keywords: speech recognition software; voice recognition, automatic speech recognition, clinical documentation Conflict of interest. The Authors declare no conflict of interest.

Перечень сокращений и обозначений

ГВ - голосовой ввод

ИИ - искусственный интеллект

ПО - программное обеспечение

НИР - научно-исследовательская работа

ЭМК - электронная медицинская карта ЕМИАС - единая медицинская информационная система

Введение

В XXI веке компьютеризация и использование автоматизированных электронных систем, в том числе различных видов ИИ, используется повсеместно практически во всех сферах деятельности, от производства и науки до сферы услуг. Научное сообщество отмечает дальнейшую цифровиза-цию жизни человека, результатом которой становится создание рабочего альянса между искусственным интеллектом и человеческим разумом [25, 28]. Современный ИИ можно разделить на слабый (англ. "narrow") и сильный (англ. "general", "strong"), то есть способные отождествлять себя как отдельный субъект и системы, предназначенные для решения конкретных поставленных задач [25].

Российская Федерация, являясь частью мирового научного и экономического сообщества, учитывает глобальные тенденции и нацелена на успешную и эффективную интеграцию достижений научно-технического прогресса во все сферы социума. В соответствии с Указом Президента РФ «О развитии искусственного интеллекта в Российской Федерации» в октябре 2019 г. вступила в силу «Национальная стратегия развития искусственного интеллекта до 2030 года», а также вместе с этим была разработана дорожная карта по развитию искусственного интеллекта в регионах России [25], естественным образом затрагивающая и такую социально значимую область, как медицина. «...Цифровизация медицины должна способствовать повышению эффективности деятельности специалистов практического здравоохранения через создание комфортных условий работы. Для реализации данной цели необходимо внедрение в рутинную практику передовых технологий и развитие информационно-технологически компетенций у работников» [29].

По мнению отечественных авторов, внедрение ИИ может способствовать усовершенствованию управленческих процессов в ЛПУ, экономя до 90% времени по сравнению с неавтоматизированными решениями, что ведет к снижению временных и материальных расходов [23]. Петрушиным А. В., Коваленко А. В. и соавторами в 2022 был проведен обзор применения ИИ в диагностике заболеваний в пульмонологии, гастроэнтерологии, кардиологии и неврологии; для каждой группы приведенных подходов были определены преимущества и недостатки [22].

Одним из фундаментальных технологических достижений в медицине стало общемировое внедрение электронных медицинских карт (ЭМК) [1]. В РФ такой системой является КИС ЕМИАС. Использование ЭМК в медицине позволяет создать единую систему, позволяющую интегрировать данные о пациенте, способствовать полноценному анализу его состояния, эффективному межведомственному взаимодействию, составлению адекватного плана лечения, профилактики и реабилитации заболеваний.

Однако, новые решения порождают и новые перспективы. Научным профессиональным сообществом отмечается рост количества документооборота, связанный с экономическими и юридическими издержками оказания высококвалифицированной медицинской помощи населению. Эти тенденции высвечивают две существенные проблемы: уменьшение количества времени, уделяемого медицинским персоналом на непосредственное взаимодействие с пациентом, что ведет к падению уровня удовлетворения от оказания медицинской помощи, и, сопутствующему этому,

профессиональное выгорание медработников [9, 16]. После внедрения ЭМК был выполнен сравнительный анализ времени, потраченного на мед. документацию, различных категорий медицинских работников (врач, медицинские сестры, врач-стажеры). При анализе результатов было отмечено увеличение временных затрат с 16% до 28% у врачей, с 9% до 23% у медицинских сестер и от 20% до 26% у стажеров [14].

За рубежом существует практика найма работников для расшифровки данных, полученных на приеме и заполнения части ЭМК [18], однако такое решение связано с привлечением дополнительных человеческих и экономических ресурсов. Также при работе с медицинской документацией используется уже традиционный рукописный ввод с использованием функций Copy/Past. Однако, данный метод не исключает возникновение неточностей и ошибок, влияющих на безопасность пациента. В тоже время копирование и вставка могут привести к увеличению времени ввода информации, способствовать ее неструктурированности и мало-информативности из-за избыточных, устаревших или противоречивых данных [11]. При анализе докладов, ревью и мета-анализов, посвященных этой проблеме, фактору удобства использования ЭМК, доступному интерфейсу программы в процессе повседневной деятельности уделяется особенное внимание [6, 10].

Техническим средством, работающим с вариациями распознавания речи, уделяется особое внимание как на Западе, так и на постсоветском пространстве. Голосовой ввод (ГВ) используют в трех различных направлениях [15]:

• для облегчения ведения мед. документации;

• голосовое управление (использование команд);

• интерактивное взаимодействие с пациентом.

В Казахстане были произведены испытания системы распознавания речи Trasformer, которая показала хорошие результаты (коэффициент ошибок 3.7%) [3]. Автоматическое распознавание речи широко используется на английском, китайском, японском и французском языках. Отмечается, что реорганизация процессов заполнения медицинской документации положительно влияет на оптимизацию процессов взаимодействия медработник-пациент [21].

В Китае технологии распознавания речи показали высокую эффективность и потенциал в сфере дальнейшего углубления взаимодействия человек-ИИ [12].

Одним из эффективных способов достижения и обеспечения эффективного и безопасного лечения является автоматизация логистических и рутинных задач. В смоделированной системе с использованием интеллектуального помощника с голосовым управлением удалось сократить время проведения медицинского вмешательства и оптимизировать ресурсы хирургического персонала [20]. В еще одном эксперименте по введению ЭМК с функцией голосового ввода в условиях хирургического отделения отметили, что записи, сгенерированные таким образом, имели более высокую точность, полноту и доступность в ЭМК [13].

На сегодняшний день написано множество успешных попыток внедрения программ, использующих преобразование речи в медицинскую сферу: в неотложной медицинской помощи, хирургических отделениях. Оценки внедрения технологии колеблются от нейтральных до положительных [4, 8]. Интеллектуальные речевые технологии показали высокую эффективность и пользу во время пандемии СОУГО-19.

В настоящее время исследователи отмечают ряд проблем, возникающих при внедрении технологий ГВ: стоимость на этапе первоначального внедрения; затраты времени, связанных с обучением персонала, стоимость оборудования [7]. Положительными аспектами внедрения ГВ в рутинной практике являются: положительная оценка медицинских работников и рост их удовлетворенности при работе с ЭМК; уменьшение времени, затрачиваемого на заполнение медицинской документации. Опубликованы работы, направленные на реализацию частичной автоматизации диагностического процесса в режиме реального времени во время проведения эндоскопических исследований на основе нейронной сети с глубоким машинным обучением и использованием эволюционных алгоритмов. Точность анализа изображения, используя эндоскопическую базу данных, составила 96,9% и 86,8% [24, 27, 26]. Данные работы подтвердили реализуемость и актуальность использования ИИ в эндоскопии.

Цель НИР: ввести в рутинную работу высокопотоковых эндоскопических центров технологию ГВ, оценить влияние ГВ на хронометраж, затрачиваемый врачом на заполнение медицинской документации (протокола эндоскопического исследования) и доказать перспективы использования данной технологии в сфере здравоохранения (эндоскопии).

Материалы и методы

НИР проводилась в г. Москве на базе двух эндоскопических центров: ГБУЗ ГКБ им. С. П. Боткина ДЗМ и ГБУЗ ГКБ им. В. М. Буянова ДЗМ с июня по декабрь 2022 г. В работе было задействовано 16 врачей-эндоскопистов в равном количестве из обеих МО, на серверах ЛПУ было выполнены все необходимые манипуляции для совместной работы МО и ЦРТ (Центр Речевых Технологий).

Голосовой ввод (ГВ) осуществлялся при помощи ПО Уо1се2Ме^ В функционале программы возможно два режима ввода расшифрованного голосового

сообщения в любое окно, где установлен курсор: с использованием «команд» - специально названных файлов, содержащих в себе определенный текст и слитное распознавание (свободная речь). Для записи речи использовались беспроводные гарнитуры с направленным микрофоном. Запись протокола во время исследования активировалась при помощи гарнитуры

На начальном этапе выполнялись контрольные замеры времени, потраченного врачом-эндоскопистом на написание протокола. (табл. 1).

Таблица 1.

Результаты измерения времени проведения исследований с использованием клавиатуры и мыши.

Процесс исследования ГБУЗ ГКБ им. С. П. Боткина ГБУЗ ГКБ им. В. М. Буянова

Среднее общее время проведения исследования 0:17:32 0:10:43

Среднее время формирования протокола до проведения эндоскопического исследования 0:01:49 0:01:30

Среднее время формирования (в том числе корректировки) протокола после проведения эндоскопического исследования 0:03:47 0:02:24

Среднее общее время формирования протокола 0:05:36 0:05:26

Таблица 2.

Результаты измерения времени проведения исследований с использованием клавиатуры, мыши и голосового ввода

Процесс исследования

ГБУЗГКБ им. С. П. Боткина

ГБУЗ ГКБ им. В. М. Буянова

Среднее общее время проведения исследования 0:20:05 0:16:30

Среднее время формирования протокола до проведения эндоскопического исследования 0:01:02 0:01:52

Среднее время формирования (в том числе корректировки) протокола после проведения эндоскопического исследования 0:02:34 0:03:34

Среднее общее время формирования протокола 0:03:36 0:05:26

Таблица 3 Среднее время формирования протоколов до и после усовершенствования Этапы С использованием только клавиатуры, мин: сек С использованием клавиатуры и ГВ, мин: сек Экономия времени заполнения протоколом голосом ко времени заполнения протоколов клавиатурой,%

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

До дообучения технологии 04:45 04:31 4,9

технологии ввода После дообучения технологии 06:42 04:54 26,9

После на основании математических расчетов были созданы 4 метрики для оценки эффективности технологии:

1. время формирования протокола (Ш);

2. доля времени формирования протокола от времени проведения исследования (ДШ);

3. уровень точности распознавания речи (Ут);

4. удовлетворенность врачей-эндоскопистов внедряемой технологией (У).

Данные метрики характеризовали следующие показатели:

• время, затрачиваемое на фиксацию результатов исследования с использованием клавиатуры и мыши;

• время, затрачиваемое на фиксацию результатов исследования с использованием клавиатуры и мыши и ГВ (до доработки);

• уровень точности распознавания речи при использовании ГВ;

• оценку удовлетворённости врачей при использовании ГВ.

Результаты измерения времени проведения исследований с использованием клавиатуры, мыши и голосового ввода представлены в табл. 2.

По итогам первого этапа было определено, что время, затрачиваемое на фиксацию результатов исследования, при использовании ГВ сократилось, но незначительно. Необходимо было устранить ошибки при распознавании речи: в согласовании падежей, написании сложносочиненных слов без дефиса, отсутствие предлогов. Кроме того, пользователи ПО отмечали неудобство использования автозамен и скоростью распознавания речи. Затруднения в работе вызывало отсутствие

синхронизации работы с системой ЕМИАС и невозможность фоновой записи исследования при работе другого врача (анестезиолога) в ЭМК.

Второй этап работы был направлен на доработку ПО Уоке2МеА

• расширение языковых моделей на основе протоколов эндоскопических исследований ГБУЗ ГКБ им. С. П. Боткина;

• расшифровка специальных медицинских терминов и внесение их в тезаурус;

• создание единых структурированных шаблонов тела документа с указанием параметризирован-ных значений, позволяющих быстро создавать детальный протокол исследования, не тратя время на их поиск;

• устранение ошибок с открытием дополнительных окон в КИС ЕМИАС при начале ГВ.

Результаты работы по второму этапу внедрения ИИ (технология речи) представлены в табл. 3.

Таким образом, итоги работы по второму этапу заключались в следующем:

• для работы создан тезаурус, включающий в себя список терминов, аббревиатур, список общепринятых сокращений, эпонимов, используемых в эндоскопии;

• загружены в систему более 200 шаблонов для автозамены и соответствующие им голосовые команды;

• выполнены контрольные замеры до и после корректировки технологии ГВ, показавшие снижение количества времени, затрачиваемого на протоколирование исследования (с 4.9% до 26,9%);

• выполнена оценка точности заполнения протокола после доработки технологии ГВ. Качество

Таблица 4

Результаты оценки точности распознавания речи

ГБУЗ ГКБ им.С.П. Боткина ГБУЗ ГКБ им. В. М. Буянова

Оцениваемые параметры До доработки После доработки До доработки После доработки

алгоритмов алгоритмов алгоритмов алгоритмов

Среднее количество слов в протоколе, используемым для ГВ 112,14 163,71 118,86 178,71

Среднее количество слов, распознанных ошибочно 6,43 2,71 7,86 3,00

Среднее количество слов, добавленных технологией 1,43 0,14 0,14 0,57

Среднее количество слов,

которые были произнесены, 2.71 0,71 1,00 0,71

но отсутствуют при ГВ

Точность распознавания (%) 90,57 97,82 92,43 97,60

распознавания увеличилось с 5% до 7%. Уровень ошибочного распознавания менее 3%;

• проведена повторная оценка удовлетворенности врачей-эндоскопистов.

Результаты оценки выполненных работ представлены в табл. 4.

Итоги проведение НИР заключаются в следующем:

• в процессе реализации проекта был проанализирован процесс формирования протокола эндоскопического исследования и выявлены процессы, нуждающиеся в оптимизации;

• разработана методика ввода протокола и заключения с использование ПО ГВ и техническое задание по доработке ИИ до необходимого уровня точности;

Обсуждение

В исследовании Hodgson T и соавт. [2] тридцать пять клиницистов отделения неотложной помощи прошли анкетирование, заполнив шкалу удобства использования системы ГВ. Исследование проводилось после того, как участники случайным образом заполняли клиническую документацию с использованием клавиатуры и мыши (KBM) или SR (speech recognition - устройство распознавания речи). Баллы, полученные в результате анкетирования, были проанализированы, и результаты с KBM были сопоставлены с результатами SR.

Наблюдалась значительная разница в баллах между использованием системы ЭМК (электронная медицинская карта) с и без SR (KBM 67, SR 61; P = 0,045; CI от 0,1 до 12,0). Девятнадцать из 35 участников набрали более высокие баллы по ЭМК с КБМ, 11 - по ЭМК с СР и 5 - по обоим показателям. Факторный анализ не показал существенной разницы в баллах по подэлементу удобства использования (ЭМК с KBM 65, ЭМК с SR 62; P = 0,255; ДИ от -2,6 до 9,5). Баллы по подэлементу обучаемости значительно отличались (KBM 72, SR 55; P <0,001; CI от 9,8 до 23,5). Была обнаружена значительная корреляция между воспринимаемым удобством использования двух системных конфигураций (ЭМК с KBM или SR) и эффективностью документирования (время документирования) (P = 0,002; CI от 10,5 до -0,1), но не с безопасностью (количество ошибки) (P = 0,90; ДИ от -2,3 до 2,6). SR был связан со значительным снижением

• разработана единая база шаблонов, соответствующих различным нозологиям, и тезаурус;

• выполнены хронометрические исследования и произведена оценка технологии практикующими врачами. В результате установлено, что использование ПО позволяют снизить время написания протокола исследования на 26.9% при погрешности распознавания речи менее 3%. При этом результат удовлетворенности конечных пользователей ПО положительный [100%].

Таким образом можно сделать выводы, что внедрение голосового ввода в повседневную практику врача-эндоскописта способно сократить время фиксации результатов эндоскопического исследования.

общей оценки возможности использования, хотя его часто позиционируют как простую в использовании технологию. Считалось, что SR налагает большие затраты с точки зрения обучаемости за счет обучения и требований поддержки для ЭМК на основе документации по сравнению с использованием KBM. Более низкие показатели возможности использования были значительно связаны с более длительным временем документирования. При проведении данной НИР не было отмечено значительного дискомфорта при обучении работе с технологией. Замеры хронометража показали уменьшение времени формирования протокола, что, по-видимому, связано с удобным пользовательским интерфейсом и постоянной технической поддержкой специалистов.

Payne TH и соавт. тестировали приложение для мобильного телефона Voice Generated Enhanced Electronic Notes (VGEENS) (финансировано Agency for Healthcare Research and Quality) [5]. Приложение способно преобразовывать голосовые записи в текст и интегрировать их в коммерческую ЭМК. Приложение было разработано и протестировано в течение 8 месяцев. Клинические испытания проводились в течение 268 дней (6430 часов). Из 709 записей 452 (64%) были созданы до форматирования и 497 (70%) были созданы перед автоматической вставкой данных. В ходе рандомизированного контролируемого исследования VGEENS приложение и серверная система использовались

13 испытуемыми для создания 721 записей. Из них 709 записей в ЭМК и 12 заметок имели сбои при обработке. Среднее время от нажатия кнопки «Отправить» до появления отформатированной заметки в папке «Входящие» составило 8,8 мин. Как правило, персонал был удовлетворен результатом работы с приложением.

McAmis NE и соавт. стремились определить врачей, специальность и практические факторы, влияющие на выбор метода для документация электронной медицинской карты (ЭМК): прямое печатание (DT), голосовое распознавание речи (ET), ассистент по расшифровке аудио (транскрибация-HT) и стенографисты (сотрудники, выполняющие функцию расшифровки или заполнения медицинской документации) [17]. Врачи скорой помощи чаще использовали стенографистов (p<0,0001). Печать была признана менее эффективной, чем все остальные методы (p<0,0001). Голосовой ввод имел меньшую точность, чем прямая печать (p<0,001) и HT (p<0,001). ЕТ был менее прост в навигации, чем DT (p = 0,002) и стенографист (p <0,001), а ET менее прост, чем стенографист (p = 0,002). Двести сорок три респондента предоставили комментарии в произвольной форме, в которых более подробно излагались мнения. DT был наиболее часто используемым методом работы в ЭМК, но был признан наименее эффективным. Писцы были оценены как наиболее эффективные, но редко используемые вне чрезвычайных ситуаций. Стало очевидным, что необходимы дальнейшие инновации для проектирования системы, реагирующие на все потребности врачей в электронных медицинских картах.

Литература | References

1. Roman LC, Ancker JS, Johnson SB, Senathirajah Y. Navigation in the electronic health record: A review of the safety and usability literature. J Biomed Inform. 2017 Mar;67:69-79. doi: 10.1016/j.jbi.2017.01.005.

2. Hodgson T, Magrabi F, Coiera E. Evaluating the usability of speech recognition to create clinical documentation using a commercial electronic health record. Int J Med Inform. 2018 May;113:38-42. doi: 10.1016/j. ijmedinf.2018.02.011.

3. Orken M, Dina O, Keylan A, Tolganay T, Mohamed O. A study of transformer-based end-to-end speech recognition system for Kazakh language. Sci Rep. 2022 May 18;12(1):8337. doi: 10.1038/s41598-022-12260-y.

4. Kim KH, Hong KJ, Shin SD, Ro YS, Song KJ, Kim TH, Park JH, Jeong J. How do people think about the implementation of speech and video recognition technology in emergency medical practice? PLoS One. 2022 Sep 23;17(9): e0275280. doi: 10.1371/journal.pone.0275280.

5. Payne TH, Alonso WD, Markiel JA, Lybarger K, White AA. Using voice to create hospital progress notes: Description of a mobile application and supporting system integrated with a commercial electronic health record. J Biomed Inform. 2018 Jan;77:91-96. doi: 10.1016/j. jbi.2017.12.004.

6. Ratwani R, Fairbanks T, Savage E, Adams K, Wittie M, Boone E, Hayden A, Barnes J, Hettinger Z, Gettinger A. Mind the Gap. A systematic review to identify usability and safety challenges and practices during electronic health record implementation. Appl Clin Inform.

Регуап^ S. и соавт. при исследовании различных методов ведения медицинской документации (используя рукописный метод или два типа программного обеспечения для распознавания речи) выявили самую низкую точность распознавания у онлайн-программного обеспечения (96,4%) [19]. В среднем на отчет онлайн-метод 6,76 и офлайн-метод 4,56 генерировали больше ошибок, чем бумажный метод. После исправления ошибок участниками количество ошибок в онлайн-отчетах уменьшилось на 94,75%, а количество ошибок в офлайн-отчетах уменьшилось на 97,20%. Исследователями были сделаны следующие выводы: хотя два программного обеспечения имели относительно высокую точность, они создавали больше ошибок, чем бумажный метод, который можно снизить за счет оптимизации и обновления этих программ. Результаты их работ показали, что исправление ошибок пользователями значительно уменьшило количество ошибок документации, вызванных программным обеспечением. При проведении НИР также было отмечено, что существенное количество ошибок при вводе удается избежать после доработки софта.

Таким образом, анализируя мировой опыт применения ИИ (технологии речевого ввода) в медицинских протоколах, а также результаты, полученные в ходе проведения НИР, выполненной на базе двух высокопотоковых ЭЦ ДЗМ при поддержке ЦРТ и ДИТ ДЗМ, в очередной раз доказали, что использование специализированного ПО способно сократить время формирования протокола для оптимизации рабочего времени медицинских работников.

2016 Nov 16;7(4): 1069-1087. doi: 10.4338/ACI-2016-06-R-0105.

7. Zhang J, Wu J, Qiu Y, Song A, Li W, Li X, Liu Y. Intelligent speech technologies for transcription, disease diagnosis, and medical equipment interactive control in smart hospitals: A review. Comput Biol Med. 2023 Feb;153:106517. doi: 10.1016/j .compbiomed. 2022.106517.

8. Duncan BJ, Zheng L, Furniss SK, Solomon AJ, Doebbeling BN, Grando G, Burton MM, Poterack KA, Miksch TA, Helmers RA, Kaufman DR. In Search ofVital Signs: A Comparative Study of EHR Documentation. AMIA Annu Symp Proc. 2018 Dec 5;2018:1233-1242.

9. Ghatnekar S, Faletsky A, Nambudiri VE. Digital scribe utility and barriers to implementation in clinical practice: a scoping review. Health Technol (Berl). 2021;11(4):803-809. doi: 10.1007/s12553 -021-00568-0.

10. Hultman G, Marquard J, Arsoniadis E, Mink P, Rizvi R, Ramer T, Khairat S, Fickau K, Melton GB. Usability Testing ofTwo Ambulatory EHR Navigators. Appl Clin Inform. 2016 Jun 15;7(2):502-15. doi: 10.4338/ACI-2015-10-RA-0129.

11. Tsou AY, Lehmann CU, Michel J, Solomon R, Possanza L, Gandhi T. Safe Practices for Copy and Paste in the EHR. Systematic Review, Recommendations, and Novel Model for Health IT Collaboration. Appl Clin Inform. 2017 Jan 11;8(1):12-34. doi: 10.4338/ACI-2016-09-R-0150.

12. Sang Y, Chen X. Human-computer interactive physical education teaching method based on speech recognition engine technology. Front Public Health. 2022 Jul 18;10:941083. doi: 10.3389/fpubh.2022.941083.

13. Robinson JR, Huth H, Jackson GP. Review of information technology for surgical patient care. J Surg Res. 2016 Jun 1;203(1):121-39. doi: 10.1016/j.jss.2016.03.053.

14. Baumann LA, Baker J, Elshaug AG. The impact of electronic health record systems on clinical documentation times: A systematic review. Health Policy. 2018 Aug;122(8):827-836. doi: 10.1016/j.healthpol.2018.05.014.

15. Kumah-Crystal YA, Pirtle CJ, Whyte HM, Goode ES, Anders SH, Lehmann CU. Electronic Health Record Interactions through Voice: A Review. Appl Clin Inform. 2018 Jul;9(3):541-552. doi: 10.1055/s-0038-1666844.

16. Lorkowski J, Maciejowska-Wilcock I, Pokorski M. Overload of Medical Documentation: A Disincentive for Healthcare Professionals. Adv Exp Med Biol. 2021; 1324:1-10. doi: 10.1007/5584_2020_587.

17. McAmis NE, Dunn AS, Feinn RS, Bernard AW, Trost MJ. Physician perceptions of documentation methods in electronic health records. Health Informatics J. 2021 Jan-Mar;27(1):1460458221989399. doi: 10.1177/ 1460458221989399.

18. Tran BD, Chen Y, Liu S, Zheng K. How does medical scribes' work inform development of speech-based clinical documentation technologies? A systematic review. J Am Med Inform Assoc. 2020 May 1;27(5):808-817. doi: 10.1093/jamia/ocaa020.

19. Peivandi S, Ahmadian L, Farokhzadian J, Jahani Y. Evaluation and comparison of errors on nursing notes created by online and offline speech recognition technology and handwritten: an interventional study. BMC MedInform Decis Mak. 2022 Apr 8;22(1):96. doi: 10.1186/ s12911-022-01835-4.

20. Kim JH, Um R, Liu J, Patel J, Curry E, Aghabaglou F, Mahapatra S, Ainechi A, Tsehay Y, Ehresman J, Hwang B, Tyler B, Iyer R, Theodore N, Manbachi A. Development of a Smart Hospital Assistant: Integrating Artificial Intelligence and a Voice-User Interface for Improved Surgical Outcomes. Proc SPIE Int Soc Opt Eng. 2021 Feb;11601:116010U. doi: 10.1117/12.2580995.

21. Latif S, Qadir J, Qayyum A, Usama M, Younis S. Speech Technology for Healthcare: Opportunities, Challenges, and State of the Art. IEEE Rev Biomed Eng. 2021;14:342-356. doi: 10.1109/RBME.2020.3006860.

22. Petrushin A.V., Kovalenko A. V., Ovsyannikova A. V. Actual solutions in the diagnosis of diseases using artificial intelligence and machine learning methods. Natural and Technical Sciences. 2022;6(169): 296-305. (in Russ.) doi: 10.25633/ETN.2022.06.02. EDN: KNYGWW. Петрушин А. В., Коваленко А. В., Овсянникова А. В. Актуальные решения при диагностике заболеваний с использованием методов искусственного интеллекта и машинного обучения. Естественные и технические науки. Номер: 6 (169) Год: 2022 Страницы: 296305. doi: 10.25633/ETN.2022.06.02 EDN: KNYGWW

23. Alekseeva, M.G., Zubov, A.I., Novikov, M. Yu. Artificial intelligence in medicine. International Research Journal. 2022;7(121):10-13. (in Russ.) doi: 10.23670/ IRJ.2022.121.7.038.

Алексеева М. Г., Зубов А. И., Новиков М. Ю. Искусственный интеллект в медицине. Международный научно-исследовательский журнал. 2022. № 7-2 (121). С. 10-13. doi: 10.23670/IRJ.2022.121.7.038.

24. Lebedev А.А., Khryashchev V. V., Kashin S. V. et al. Application of deep learning methods to support medical decision in endoscopic examination of the stomach. Modeli, sistemy, seti v ekonomike, tekhnike, prirode i obshchestve = Models, systems, networks in economics, technology, nature and society. 2021;2(38):95-106. (In Russ.) doi:10.21685/2227-8486-2021-2-6

Лебедев А. А., Хрящев В. В., Кашин С. В., Сред-някова А. С., Казина Е. М. Применение методов глубокого обучения для поддержки врачебного решения при эндоскопическом исследовании желудка. Модели, системы, сети в экономике, технике, природе и обществе. 2021. № 2 (38). С. 95-106. DOI: 10.21685/2227-8486-2021-2-6

25. Georgiou TS. Philosophical issues of artificial intelligence and "smart" algorithms' trust in medicine. Medical Ethics. 2021; 9(3): 40-42. (in Russ.) doi: 10.24075/me-det.2021.019.

Георгиу Т. С. Философские вопросы искусственного интеллекта и доверия «умным» алгоритмам в медицине. Медицинская этика. 2021. Т. 9. № 3. С. 40-42. doi: 10.24075/medet.2021.019.

26. Ganin A.N., Khryaschev V. V., Kashin S. V., Zavyalov D. V. Development and testing of a medical decision support system in endoscopy. Digital Diagnostics. 2021;2(1S):5-5. (in Russ.) doi: 10.17816/DD20211s5.

Ганин А. Н., Хрящев В. В., Кашин С. В., Завьялов Д. В. Разработка и апробация системы поддержки принятия врачебного решения в эндоскопии. Digital Diagnostics. 2021. Т. 2. № S1. С. 5. doi: 10.17816/ DD20211s5.

27. Kobrinskii B.A., Khavkin A. I., Volynets G. V. Prospects for the use of artificial intelligence systems in gastroenterology. Experimental and Clinical Gastroenterology. 2020;(7):109-117. (In Russ.) doi: 10.31146/1682-8658-ecg-179-7-109-117.

Кобринский Б. А., Хавкин А. И., Волынец Г. В. Перспективы применения систем искусственного интеллекта в гастроэнтерологии. Экспериментальная и клиническая гастроэнтерология. 2020. № 7 (179). С. 109-117. doi: 10.31146/1682-8658-ecg-179-7-109-117.

28. Kuznetsov P., Kakorina P., Almazov A., Medical decision support systems on the basis of artificial intelligence -strategy for the development of personalized medicine of the next stage. Therapist. 2020;(1): 48-53. (in Russ.) doi:10.33920/MED-12-2001-06.

Кузнецов П. П., Какорина Е. П., Алмазов А. А. Системы поддержки принятия врачебных решений на основе искусственного интеллекта - стратегия развития персонализированной медицины следующего этапа. Терапевт. 2020. № 1. С. 48-53. doi:10.33920/ MED-12-2001-06.

29. Abduganieva Sh. Kh., Nikonorova M. L. Digital solutions in medicine. Crimean Journal of Experimental and Clinical Medicine. 2022, No. 2, pp.73-85. (in Russ.) doi: 10.2903912224-6444-2022-12-2-73-85. Абдуганиева Ш. Х., Никонорова М. Л. Цифровые решения в медицине. // Крымский журнал экспериментальной и клинической медицины. 2022. № 2. doi: 10.2903912224-6444-2022-12-2-73-85.

i Надоели баннеры? Вы всегда можете отключить рекламу.