Научная статья на тему 'Современный передовой уровень искусственного интеллекта для умной медицины'

Современный передовой уровень искусственного интеллекта для умной медицины Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
705
116
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ / ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ / БОЛЬШИЕ ДАННЫЕ / ARTIFICIAL INTELLIGENCE / ARTIFICIAL NEURAL NETWORKS / BIG DATA

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Колесниченко О. Ю., Мартынов А. В., Пулит В. В., Колесниченко Ю. Ю., Шакиров В. В.

На данном этапе искусственный интеллект уже не является только обсуждаемой темой. Это вполне реальные технологии, основанные преимущественно на искусственных нейронных сетях. Для их обучения используется принцип Павлова, сформулированный В. Л. Дуниным-Барковским. Математики павловское учение с подкреплением называют Deep Reinforcement Learning. ИИ разделяют на компьютерное зрение (Computer Vision), т е. распознавание и генерацию изображений; распознавание и синтез речи (Speech Recognition and Synthesis); обработку естественного языка (Natural Language Processing, NLP); графовый логический ИИ, миварную логическую технологию. Все это по отдельности узконаправленный ИИ. А общий интеллект, равный человеку, пока не создан. Такой ИИ должен включать в себя все технологии. С учетом социальной и лингвистической природы появления интеллекта разработчики очень много внимания уделяют отшлифовке алгоритмов NLP и мультиагентной среды. К сожалению, параллельно с прогрессом в развитии нейросетей возникло такое явление, как состязательные атаки, которые, используя тот же механизм обучения, заставляют натренированную нейросеть делать ошибки. Этот факт подвергает сомнению будущее нейросетей в повседневной медицине. Среда для ИИ это большие данные и датасеты. Европейские эксперты уже озадачились регулированием больших данных с точки зрения безопасного развития как медицины, так и фармацевтической сферы. Несмотря на сложности и отсутствие четких правил, ИИ активно внедряется в частный сектор медицины, создав уже три новые бизнес-модели.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Колесниченко О. Ю., Мартынов А. В., Пулит В. В., Колесниченко Ю. Ю., Шакиров В. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Modern advanced artificial intelligence for smart medicine

Artificial Intelligence is no longer just the topic of discussion. Today this technology is mostly based on Artificial Neural Networks. Pavlov Principle formulated by W.L. Dunin-Barkowski is used for their training. Mathematics compared Pavlov's doctrine with Deep Reinforcement Learning. AI technologies are divided into Computer Vision, images recognition and generation; Speech Recognition and Synthesis; Natural Language Processing; Graph Logic AI, MIVAR logic technology. All of this separately is Narrow AI. Artificial General Intelligence, equal to human, hasn’t been created yet. AGI should include all mentioned technologies. Given social and linguistic nature of the intelligence emergence, developers are paying attention to NLP algorithms and multi-agent environment. Simultaneously with the development of neural networks, adversary attacks emerged, which using the same learning mechanism force a trained neural network to make mistakes. This fact calls in question the future of neural networks in medicine. Big Data and data sets are the environment for AI. European experts have already begun to regulate Big Data for safe Health Care and drugs creation. Despite the difficulties and lack of clear rules, AI is actively being introduced into the private medicine. Due to AI the three new business models have already been created.

Текст научной работы на тему «Современный передовой уровень искусственного интеллекта для умной медицины»

О.Ю. КОЛЕСНИЧЕНКО1, А.В. МАРТЫНОВ2, В.В. ПУЛИТ2, Ю.Ю. КОЛЕСНИЧЕНКО3, В.В. ШАКИРОВ4, Л.С. МАЗЕЛИС5, О.О. ВАРЛАМОВ6, Л.О. МИНУШКИНА7, А.Ю. СОТНИК8, Т.Н. ЖИЛИНА1, В.П. ДОРОФЕЕВ9, Г.Н. СМОРОДИН10, М.К. ЖАПАРОВ11

' Институт социальных наук, ФГЛОУ ВО«Первый МГМУ им. И.М. Сеченова»Минздрава России, Москва

2 СП.ЛРМ, Санкт-Петербург

3 Uzgraph.ru, Москва

4 ФНЦ НИИ системных исследований РАН, отдел нейроинформатики, Москва

5 ФГБОУ ВО «Владивостокский государственный университет экономики и сервиса», Владивосток

6 ФГБОУ ВО «Московский государственный технический университет им. Н.Э. Баумана», Москва

7 ФГБУ ДПО «Центральная государственная медицинская академия УД ПРФ», Москва

8 ЗЛО Фирма ЦВ «ПРОТЕК», Москва

9Московский физико-технический институт, Долгопрудный

" ФГБОУ ВО «Санкт-Петербургский государственный университет телекоммуникаций им. М.А Бонч-Бруевича», Санкт-Петербург "Университет имени Сулеймана Демиреля, Каскелен, Казахстан

001: https://doi.org/l0.21518 / 1561-5936-2019-04-36-43

Современный передовой уровень искусственного интеллекта для умной медицины

ршшиим

ТРЕНДЫ И БРЕНДЫ

На данном этапе искусственный интеллект уже не является только обсуждаемой темой. Это вполне реальные технологии, основанные преимущественно на искусственных нейронных сетях. Для их обучения используется принцип Павлова, сформулированный В. Л. Дуниным-Барковским. Математики павловское учение с подкреплением называют Deep Reinforcement Learning. ИИ разделяют на компьютерное зрение (Computer Vision), т е. распознавание и генерацию изображений; распознавание и синтез речи (Speech Recognition and Synthesis); обработку естественного языка (Natural Language Processing, NLP); графовый логический ИИ, миварную логическую технологию. Все это по отдельности - узконаправленный ИИ. А общий интеллект, равный человеку, пока не создан. Такой ИИ должен включать в себя все технологии. С учетом социальной и лингвистической природы появления интеллекта разработчики очень много внимания уделяют отшлифовке алгоритмов NLP и мультиагентной среды. К сожалению, параллельно с прогрессом в развитии нейросетей возникло такое явление, как состязательные атаки, которые, используя тот же механизм обучения, заставляют натренированную нейросеть делать ошибки. Этот факт подвергает сомнению будущее нейросетей в повседневной медицине. Среда для ИИ - это большие данные и датасеты. Европейские эксперты уже озадачились регулированием больших данных с точки зрения безопасного развития как медицины, так и фармацевтической сферы. Несмотря на сложности и отсутствие четких правил, ИИ активно внедряется в частный сектор медицины, создав уже три новые бизнес-модели.

Ключевые слова:

искусственный интеллект, искусственные нейронные сети, большие данные

36

4-2019

ОТ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

К ИСКУССТВЕННОЙ ЖИЗНИ

Технологии искусственного интеллекта (ИИ) в настоящее время достаточно хорошо развиты на так называемом рефлексном уровне (в западном варианте - Narrow Artificial Intelligence (NAI), то есть узконаправленный ИИ).

Этот уровень включает все алгоритмы обработки данных, в том числе больших данных. Наиболее распространены и популярны в использовании такие алгоритмы (компьютерные программы), как искусственные нейронные сети (ИНС). Желание делать алгоритмы все более сложными, приближая их к уровню

человеческого интеллекта, заставляют исследователей разбираться, как живой мозг решает задачи и хранит много информации. Пока что, несмотря на появление достаточно сложных компьютерных технологий, приблизиться к производительности мозга человека не удалось. Память в живом мозге заключена в сформировавшихся связях между нейронами. Американские нейробиологи Томас Бартол и Терренс Сейновски в своих исследованиях обнаружили, что синапс нейрона может трансформироваться в 26 различных состояний, меняя свой размер от меньшего к большему и наоборот, что назвали «синаптической пластичностью» [1]. На один нейрон может приходиться до 104 синапсов. А количество нейронов в мозге исчисляется примерно в 1010. Получается очень объемная и пластичная природная нейронная сеть, не лимитированная по возможностям запоминать информацию в течение всей жизни человека.

ИНС «тренируют» с применением метода машинного обучения (Machine Learning, если сеть содержит более 3 слоев - Deep Learning). Самое популярное понятие в обучении - Deep Reinforcement Learning, обучение с подкреплением, что приближает все технологии машинного обучения нейросетей к учению русского физиолога Ивана Петровича Павлова. Например, нейромедиатор дофамин, служащий фактором подкрепления в природных мозговых процессах, взят компанией Google в качестве названия для среды Deep Reinforcement Learning (Google Open Source, Dopamine 2.0). Понимание процесса обучения (когда обучающаяся система должна усвоить правила получения вознаграждения) заботит в равной степени как ней-робиологов, так и разработчиков ИИ. Для ИНС биологические правила пластичности мозговых процессов описываются математическими формулами, используется

упрощенный метод обратной связи «Backpropagation» (the backward propagation of errors). Если процесс обучения ИНС корректируется человеком, то такой метод называется «обучение с учителем» (Superrised Learning).

Внедряясь в биологические процессы, математики создали концепцию эволюции искусственной жизни [2]. В алгоритмы мультиэволюционной архитектуры (Multi-Level Evolution /MLE/ Architecture) закладываются многоуровневые процессы -от выбора материалов, из которых будет изготавливаться роботизированная система, до подбора ее конфигурации под конкретные задачи. По сути это систематизация в единой базе данных всех видов робототехники. Работать с такими базами будут универсальные дизайнеры роботов, а инструментом их работы станут ИНС. Примечательно, что появляется термин «генотип робота». В медицине такой подход

может способствовать формированию гибкого производства роботов по требованию и персональному дизайну для конкретного отделения больницы, вида операции или узкой задачи. Перспективы подобной архитектуры видятся следующими: доступ человека к процессу дизайна онлайн через облачные технологии, а затем автоматизация дизайна ней-росетями без участия человека.

ПАВЛОВ КАК ОН ЕСТЬ

Основоположник российской школы ИИ, научный руководитель проекта iPavlov.AI (http://ipavlov.ai) В. Л. Дунин-Барковский сформулировал универсальный «принцип Павлова» для создания ИИ [3, 4]. Принцип Павлова звучит так: «Сеть нейронов, каждая из связей между которыми постепенно изменяется как функция локально доступных компонент-сигналов ошибки и активности, соединяемых связью нейронов, приходит в процессе функционирования сети к безошибочной работе». Под «нейронами» понимается математическая функция (нейрон - функциональный математический элемент). В.Л. Дунин-Барковский сформулировал этот принцип исходя из учения физиолога И.П. Павлова об условных рефлексах (в процессе жизни у организма с нервной системой появляются новые рефлексы) и новых данных по глубокому обучению ИНС (эффективность схем с использованием «мелкозернистых» вычислительных устройств типа GPU и др.). Нейросети в процессе обучения могут менять связи внутри себя, что обусловливает приобретение нейросетями способности реагировать на вход информации правильным выводом. Работая с нейросетя-ми, В.Л. Дунин-Барковский с соавторами заключили, что представления И.П. Павлова нашли воплощение в создании современных нейропо-добных когнитивных искусственных систем. Понимание работы ИНС возвращает ученых к тем выводам о работе мозга, которые в свое время делал физиолог И.П. Павлов.

SUMMARY

Keywords: Artificial Intelligence, Artificial Neural Networks, Big Data

Artificial Intelligence is no longer just the topic of discussion. Today this technology is mostly based on Artificial Neural Networks. Pavlov Principle formulated by W.L. Dunin-Barkowski is used for their training. Mathematics compared Pavlov's doctrine with Deep Reinforcement Learning. AI technologies are divided into Computer Vision, images recognition and generation; Speech Recognition and Synthesis; Natural Language Processing; Graph Logic AI, MIVAR logic technology. All of this separately is Narrow AI. Artificial General Intelligence, equal to human, hasn't been created yet. AGI should include all mentioned technologies. Given social and linguistic nature of the intelligence emergence, developers are paying attention to NLP algorithms and multi-agent environment. Simultaneously with the development of neural networks, adversary attacks emerged, which using the same learning mechanism force a trained neural network to make mistakes. This fact calls in question the future of neural networks in medicine. Big Data and data sets are the environment for AI. European experts have already begun to regulate Big Data for safe Health Care and drugs creation. Despite the difficulties and lack of clear rules, AI is actively being introduced into the private medicine. Due to AI the three new business models have already been created.

O.Yu. Kolesnichenko1, A.V. Martynov2, V.V. Pulit2, Yu.Yu. Kolesnichenko3, V.V. Shakirov4, L.S. Mazelis5, O.O. Varlamov6, L.O. Minushkina7, A.Yu. Sotnik8, T.N. Zhilina1, V.P. Dorofeev9, G.N. Smorodin10, M.K. Zhaparov11

1 Institute of Social Sciences, Sechenov First Moscow State Medical University, Moscow;

2 SP.ARM, St. Petersburg;

3 Uzgraph.ru, Moscow;

4Scientific Research Institute of System Studies of RAS, Department of Neuroinformatics, Moscow;

5 Vladivostok State University of Economics and Service, Vladivostok;

6 Bauman Moscow State Technical University, Moscow;

7Central State Medical Academy at the Department of Presidential Affairs, Moscow;

8 ZAO (CJSC) Firm CV PROTEK;

9 Moscow Institute of Physics and Technology, Dolgoprudny;

10 Bonch-Bruevich St. Petersburg State University of Telecommunications, St. Petersburg;

11 Suleyman Demirel University, Kaskelen, Kazakhstan

MODERN ADVANCED ARTIFICIAL INTELLIGENCE FOR SMART MEDICINE

Общий ИИ (Artificial General Intelligence, AGI), то есть ИИ, равный человеку, пока еще умозрителен. Ключевым условием возникновения AGI является обучение машины языку, рассматривая язык как интерфейс для общения на социальном уровне [5, 6]. Для формирования реакций на окружающую среду ИИ должен иметь разные сенсорные и моторные функции. В.Л. Дунин-Барков-ский называет такую конфигурацию «Адаптивный интегратор ИИ компетенций», где через адаптацию происходит интеграция всех возможных блоков машины. Блоки эти могут быть разными. Сегодня существуют следующие: компьютерное зрение (Computer Vision): распознавание образов (например, медицинских изображений), генерация изображений; распознавание и синтез речи (Speech Recognition and Synthesis): распознавание по губам (элементы компьютерного зрения), Visual Speech Recognition;

обработка естественного языка (Natural Language Processing, NLP); графовый логический ИИ (Logical type of AI), включает мивар-ную логическую технологию ИИ (МИВАР - многомерная информационная варьирующаяся адаптивная реальность, Multidimensional Informational Variable Adaptive Reality), «Мивар-Сеченов».

Принципиальной концептуальной разницы между миварными графами и ИНС нет, так как оба подхода отражают связь двух точек между собой и далее образование сложных сетей из простых связей. Мозг человека можно условно назвать сложным динамическим графом. На рисунке 1 изображены граф миварной сети [7], ИНС с Backpropagation и схема натуральных нейронов. Миварная сеть подразумевает создание правил и ограничений, что близко к нейро-медиаторной регуляции, где одни медиаторы задают правила через активацию, а другие устанавливают ограничения через торможение. В настоящее время наравне с рядом российских проектов по созданию

ИИ (iPavlov, Botkin.AI) в Первом МГМУ им. И.М. Сеченова начата разработка миварных сетей для ИИ «Мивар-Сеченов» [8].

ИИ ХОДИТ, ВИДИТ, ПИШЕТ, ЧИТАЕТ И ГОВОРИТ, НО ПОКА НЕ ЧЕЛОВЕК

Выпущенная в Гарвардском университете книга Майкла Томаселло (директора Института эволюционной антропологии им. Макса План-ка/Max Planck Institute for Evolutionary Anthropology) «Натуральная история человеческого мышления»

(A Natural History of Human Thinking, Michael Tomasello, 2014 г.) привлекла внимание разработчиков ИИ. В книге обсуждаются эволюционные причины появления интеллекта и языка и их связь - человеческое мышление берет начало от появления языка. В написанных впоследствии профессором Квиннипэкского университета Адамом Катцом (Adam Katz, Quinnipiac University) комментариях к этой книге подчеркивается, что язык, способность говорить друг с другом, конечно, определяет уровень интеллекта. Но не менее важны

рисунок ^^ Изображение миварной графовой сети - A [7], искусственной нейросети с обратной связью Васкргораяа^оп - Б [3], схематическое изображение натуральных нейронов и их связи - В [цит. по РгопеигоБаепсе. ги, Droualb.faculty.mjc.edu]

Выход

Цепь

А

Вход

Б

В

такие социальные поведенческие явления, как совместные коллективные действия, совместное внимание к какому-то предмету, возможность что-то делать вместе, видеть вещи одинаково при взаимодействии, иметь какие-то коллективные намерения, обучаться через подражание. Это социальное взаимодействие предшествует развитию языка. В связи с пониманием социальной, а не лингвистической первопричин-ности появления интеллекта разработчики очень много внимания уделяют отшлифовке алгоритмов мультиагентной среды [9-15]. Агентов (объектов виртуальной среды) методом Deep Reinforcement Learning обучают ходить, бегать, прыгать, делать сложные движения, ориентироваться на местности, подражать движениям и предсказывать траекторию начатого движения. Агент взаимодействует со средой, получая от нее подкрепление. С помощью нейросетей удалось добиться семантического эффекта, то есть понимания алгоритмом смысла текста и эмоций [16]. Однако глубокие способности нейросети понимать текст имеют «обратную сторону медали» -зависимость от особенности тренировочного датасета. Например, если датасет был с торгового портала Amazon, то обзор книг и отзывы - это не тот датасет, который поможет понять, например, общение врача и пациента. Для достижения понимания медицинских текстов необходимо специально создавать тренировочные датасеты из записей врачей.

Обработка естественного языка (Natural Language Processing) включает в себя широкий спектр разнообразных задач: понимание и генерацию текста, перевод, ответы на вопросы, создание кратких обзоров (обобщение), оценку семантического сходства текстов, понимание эмоций (sentiment analysis), классификацию документов. Особое место занимают задачи моделирования языка (прогнозирование следующего слова в контексте), моделирования маскированного языка (прогнозирование

пропущенного слова в предложении) и прогнозирования следующего предложения. Моделирование языка выполняет, например, модель BERT (Bidirectional Encoder Representations from Transformers, нейросетевой трансформер с последовательным кодированием).

Для тренировки и проверки качества нейросетей класса NLP созданы разные англоязычные эталонные датасеты-шаблоны (бенчмарки) [17, 18], например RACE, Story Cloze, CoQA, LAMBADA, GLUE (список датасетов: http://nlpprogress.com). Тест для оценки общего понимания языка «The General Language Understanding Evaluation» (GLUE; https:// gluebenchmark.com) является одним из лучших и помогает избежать тренировки моделей на размеченном вручную тексте, что требовало бы много времени и ресурсов. Исчерпывающе многозадачных (все задачи NLP сразу) вариантов тренировки (как последовательно, так и одновременно) нейросе-тей пока нет. Современный подход позволяет делать первичную тренировку на шаблоне без человека (Unsupervised pre-training), а затем быстро проводить тонкую ручную подстройку (Supervised fine-tuning). К сожалению, списка русскоязычных шаблонов текстов для тренировки нейросетей в открытом доступе для исследователей нет. Такие компании, как «Яндекс», Сбербанк и т. д., тренируют нейросети на своих закрытых датасетах. Особенно следует отметить отсутствие медицинских текстовых датасе-тов-шаблонов, что критически тормозит разработку ИИ для «умных» больниц.

Команда Google работает над созданием общего лингвистического интеллекта (General Linguistic Intelligence, GLI) [19]. GLI определяют как способность нейросети быть мультизадачной и комплексно использовать натренированные навыки для новых задач без потерь в семантике (понимание смысла), лексике (знание слов языка), синтаксисе (распознавание структуры

предложения). Усложнение задач для ИНС сопровождается так называемым «катастрофическим забвением» прежних навыков во время дообучения на новых датасетах, что является существенным препятствием на пути создания общего ИИ (AGI). Ведь для AGI требуется, чтобы агенты обладали GLI на уровне рассуждений и самостоятельно взаимодействовали со средой с помощью лингвистического интеллекта. Машинный перевод в условиях глобализации стал критическим навыком для ИНС. На московском конгрессе «ИТ в медицине -2018» (ITMCongress.ru) эксперт Европейской федерации медицинской информатики, генеральный секретарь Международного фонда HL7 Катерин Хронаки (Catherine Chronaki, The European Federation for Medical Informatics, HL7 International Foundation) выступила с докладом, в котором озвучила два новых тренда в медицине: международное резюме пациента (International Patient Summary), оно будет содержать унифицированную информацию о человеке и храниться в глобальной базе данных, и API (программный интерфейс приложения, Application Programming Interface), технология доступа к любым открытым базам данных в мире, включая стандарт обмена медицинской информацией Fast Healthcare Interoperability Resources (FHIR-API) для массовых трансграничных медицинских консультаций. И если первый тренд касается создания англоязычной унифицированной базы данных для удобства путешествующих по миру людей, то второй тренд связан со сложностью прочтения данных о пациенте, записанных не на английском языке. В переводе с языка на язык помогут нейросети. В настоящее время существуют ИНС, способные в рамках единой модели транслировать на английский со 102 языков и обратно с английского на 102 языка мира [20]. Для таких ИНС используют кросс-лингвистический универсальный кодировщик, который

предложения на разных языках кодирует в общую базу независимо от принадлежности к языку [21]. Генерация речи - следующий шаг после понимания текста. Для медицины данный раздел нейросетей относится к социальной робототехнике - роботам, которые ухаживают за больными, служат им компаньонами. В компании Facebook AI Research создали ИНС Neural Text To Speech (TTS), которая сохраняет персональные характеристики голоса, делая при этом перевод с языка на язык [22]. Когда человек слушает речь, его мозг обрабатывает звуковые сигналы целыми предложениями. Отсутствие контекста в виде завершенного предложения затрудняет понимание речи и ее эмоционального окраса. С учетом этого разрабатывается сверточная ИНС (Temporal Convolutional Network), которая обучается на встраиваемых звуковых целых предложениях, а не на коротких словах и отдельных звуках [23]. Такой подход позволяет распознать эмоции.

Распознавание образов (Computer Vision) является неотъемлемой частью ИИ. Эту технологию применяют и для понимания текстов без предварительного обучения с разметкой текста [24]. Сверточ-ная нейросеть (Fully-Convolutional Network) узнает написанные буквы (Visual Text Recognition); для такого метода подходят сканированные страницы текста, что представляет интерес в аспекте чтения рукописных медицинских документов. Существует американская база данных MNIST (сокращение от Modified National Institute of Standards and Technology), которая содержит более 70 тыс. образцов рукописного написания цифр и используется как стандарт для калибровки и обучения нейросетей, выполняющих задачу распознавания изображений. Эти большие данные получены из Бюро переписи населения США и студенческих работ американских университетов. Для постановки задачи распознавания рукописных медицинских документов в России

необходимо создать подобную базу данных из образцов написания букв на русском языке и цифр. По мере развития технологий распознавания и генерации изображений появились и хакерские технологии. Об этом написали специалисты Массачусетского технологического института (Massachusetts Institute of Technology) и Гарвардской медицинской школы (Harvard Medical School) в журнале Science [25, 26]. Технология состязательных атак на нейросе-ти (Adversarial Attacks) подрывает уже почти сложившуюся нейросе-тевую медицинскую визуализацию в радиологии, патологии, дерматологии и офтальмологии. В модель нейросети могут намеренно вводиться вирусные состязательные изображения или мелкий цифровой пиксельный шум, что заставит модель учесть эти данные и сделать ошибку в отношении уже полученного на тренировочном датасете опыта. Это можно образно сравнить с выражением «ложка дегтя в бочке меда». При этом часть изображения может стать невидимой, либо на картинке добавится новый объект, либо внешне не измененная картинка не будет читаться машиной, так как на уровне цифрового кода она содержит вирус (рис. 2). Насколько сеть зависит от своего первичного датасета, показано на рисунке 3. После обработки Deep Dream Generator ультразвукового изображения нейросеть увидела на нем мартышку, так как эта ней-росеть обучена на изображениях с включением животных. Алгоритмы машинного нейросе-тевого распознавания изображений с применением Deep Learning широко используются на практике для рентгеновских снимков, изображений магнитно-резонансной томографии и ультразвуковых изображений: BayLabs (https://baylabs. io), Arterys (https://arterys.com), Enlitic (https: //www.enlitic.com), Zebra Medical Image (https:/www. zebra-med.com), Butterfly Network, Inc. (https://www.butterflynetwork.

рисунок £ Пример состязательных атак на нейросети (Adversarial Attacks)

Левый столбец - изображение нормальной рентгенограммы грудной клетки; правый столбец -пневмоторакс; первый верхний ряд - нейросеть правильно (зеленая маркировка) показывает нулевую вероятность не нормы и 99%-ную вероятность пневмоторакса; второй ряд - нейросеть заражена и ее выводы диаметрально противоположны при неизмененной рентгенограмме на выходе; третий ряд - нейросеть заражена встроенными подобными изображениями, но сохраняет правильность трактовки основных изображений; четвертый нижний ряд - нейросеть заражена изображениями иного рода, вывод нейросети противоположен правильному ответу [26]

com), CureMetrix (http://curemetrix. com) и др. (CBInsights, 2017), а в России успешные примеры - CoBrain (http://cobrain.io) и «Третье мнение» (https://3opinion.ru). Распознавать изображения машина может и без нейросетей. Например, алгоритм Uzgraph базируется на представлении изображения как комбинации точек и векторов (трехмерный векторный анализ) и выдерживает даже такие искажения, как поворот анализируемого снимка на 45, 90 и 180° [27].

рисунок ^^ Серошкальное ультразвуковое изображение подпеченочной кишечной инвагинации (слева); то же изображение после обработки ИНС Deep Dream Generator (справа) [27]

-

Я ш.

МЕДИЦИНСКАЯ СРЕДА ДЛЯ РАБОТЫ ИИ: БОЛЬШИЕ ДАННЫЕ И БИЗНЕС-МОДЕЛИ

Внедрение ИИ в медицину затрагивает все ее сферы, поэтому спектр обсуждаемых проблем может быть бесконечным. Главная среда для работы ИИ - это большие данные. В 2019 г. Европейское агентство лекарственных средств совместно с главами национальных агентств по лекарственным средствам стран Евросоюза (European Medicines Agency, Heads of Medicines Agencies) опубликовало доклад по большим данным в отрасли «HMA-EMA Joint Big Data Taskforce Summary Report» [28]. Европейские эксперты выражают опасение в отношении влияния больших данных на разработку лекарств и ведение пациентов с разными болезнями. Пока нет ни четкого определения, ни понимания больших данных при одновременном критическом росте записываемых в информационные системы медицинских сведений, и не только в рамках медицинских организаций, а вплоть до трансграничных потоков (например, сервисы Apple). HMA-EMA дали определение большим данным - это чрезвычайно большие наборы данных, сложные, многомерные, неструктурированные и неоднородные, быстро накапливающиеся, которые могут быть проанализированы с помощью

специальных компьютерных технологий (включая ИИ) для выявления закономерностей, тенденций и ассоциаций. Большие данные в медицине разделили на шесть областей: геномика; протеомика; клинические исследования; данные по потокам пациентов и лекарств (электронные медицинские карты, учет лекарственных средств); данные о побочных эффектах лекарств (spontaneous adverse drug reports, ADRs); социальные сети; данные с мобильных приложений (m-Health). Существующие нормативы в регулировании разработки, испытаний и оборота лекарств связаны с данными, полученными на рандомизированных выборках с обязательным присутствием контрольной группы. В клинических исследованиях сравниваются группы пациентов, оцениваются статистические различия и формируются клинические подходы, основанные на доказательствах. Большие данные вносят полный беспорядок в эту отлаженную систему контроля и регулирования. Нет чистоты данных, нет контрольной группы, нет четких условий при сравнении; работают уже не статистические закономерности, а кибернетические модели. Однако именно постоянно генерируемые большие данные и диктуют свою политику. Вопрос не стоит так, чтобы отказаться от больших

данных. Напротив, проблема заключена в том, что нужно вырабатывать новые регламенты и правила для работы с накапливающимися датасетами с целью безопасности пациентов.

Среди основных рекомендаций HMA-EMA необходимо выделить следующие:

• использовать технологии и данные, соответствующие глобальным стандартам, для облегчения взаимодействия, а также общеизвестные форматы файлов и открытые исходные коды; минимизировать разработку новых стандартов, при этом создать стандарты качества данных;

• сформулировать стратегии управления данными (Data Governance) и создать структуры, платформы и сети для обмена данными и доступа к ним, развивать культуру обмена данными;

• разработать единые принципы обезличивания данных;

• установить правила проверки аналитических подходов при внедрении результатов в жизнь, создать рекомендации по приемлемости доказательств, полученных на больших данных, обеспечив гибкость в их пересмотре с учетом быстрого обновления технологий;

• поддерживать продвижение новых аналитических подходов, таких как ИИ, машинное обучение нейросетей, обработка естественного языка;

• обеспечить учебные программы и подготовку кадров, имеющих соответствующие новые навыки для работы с большими данными и в области науки о данных (Data Science); разработать стратегию найма новых специалистов.

Несмотря на начальную фазу внедрения правил и регулирования в область ИИ и больших данных, эти новые технологии уже изменили медицину. Частный медицинский сектор, как более гибкий в отношении внедрения нового, разделился на три инновационные бизнес-модели, которые представлены в таблице. Помимо изменений в ведении пациентов, большие

PEMEOüüM

РОCCИИCKИИ РЫНОК

42

4^2019

таблица 0 Классификация бизнес-моделей в мировой практике электронного/мобильного здравоохранения (еНеа№/ тНеаН:11), разработанная Т.Н. Жилиной

Uber medicine Retail clinics Network clinics

Бизнес-модель: напрямую соединяет с помощью логистики передвижения транспорта нуждающихся в медицинских услугах и врачей, готовых оказать медицинские услуги именно там и тогда, где и когда они востребованы Бизнес-модель: возвращает средневековую практику медицинского консультирования в местах большого скопления людей (на рынках); посетитель в крупных сетевых аптеках и супермаркетах, не отрываясь от повседневных дел, может получить очную медицинскую услугу Бизнес-модель: стремится к повсеместному территориально-географическому присутствию, чтобы для жителя каждого района, города или области высококвалифицированная медицинская помощь была территориально доступна

Ориентирована на повышение доступности медицинской помощи на основе интернет-технологий Ориентирована на расширение охвата населения медицинскими услугами Ориентирована на пожизненное ведение пациентов с разными заболеваниями

Сегмент первичной медико-санитарной и неотложной медицинской помощи Сегмент первичной консультативной медицинской помощи и профилактики заболеваний Сегмент амбулаторной и стационарной медицинской помощи

Ключевая технология: мобильные приложения с ИИ Ключевая технология: дисконтные карты с аналитикой больших данных Ключевая технология: телемедицинские облачные центры

Вектор воздействия: сокращение времени ожидания прибытия врача, особенно в неотложных ситуациях Вектор воздействия: повышение ответственности людей за свое здоровье через стимулирование к прохождению обследования и лечения Вектор воздействия: повышение качества оказания всех видов медицинской помощи, особенно стационарной

данные в совокупности с ИИ выводят на новый уровень фармакологию. Это и возможности по созданию новых лекарств, и фармакоге-нетика, а также фармакоэкономика. Несомненно, есть много проблем, связанных с новыми технологиями. В первую очередь, это критическая зависимость от электричества, а также зависимость непосредственно от производителей той или иной технологии, как и несовершенство этих технологий.

Целесообразное направление развития ИИ связано с поиском оптимальных вариантов решения конкретных задач, когда нужны превосходящие человека вычислительные возможности, учет множества факторов влияния и состояния

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ресурсной базы, выбор последовательности шагов, обеспечивающих достижение оптимального результата. Для медицины ИИ будет ценен в диагностике, выборе лечебного стандарта и лечебного учреждения, подборе схемы приема лекарственных препаратов, мониторировании состояния пациента, планировании закупок препаратов. Можно определить три наиболее интересных практических направления в области машинного обучения нейросетей и больших данных для «умной» медицины и предложить их для разработчиков и исследователей в качестве приоритетных тем:

• Создание ИИ-системы по принципу интернета вещей для контроля

внутрибольничной инфекции, с использованием электрохимических датчиков и беспроводной связи.

• Сбор банка фотографий пациентов с эндокринологическими заболеваниями, чтобы обучить на таком датасете нейросеть, которая сможет генерировать по заданным условиям (повышенному или пониженному уровню гормона) лицо пациента с клиническими признаками заболевания и будет полезна как для подготовки врачей, так и в клинической практике.

• Формирование текстовых массивных медицинских датасетов на русском языке, включая рукописные тексты, в открытом доступе для обучения алгоритмов по обработке m естественного языка.

ИСТОЧНИКИ

1. Bartol T.M., Bromer C., Kinney J., Chirillo M.A., Bourne J.N., Sejnowski T.J. et al. Nanoconnectomic upper bound on the variability of synaptic plasticity. eLife J. 2015;4:e10778. DOI: 10.7554/eLife.10778.

2. Howard D., Eiben A.E., Kennedy D.F., Mouret J.-B., Valencia P., Winkler D. Evolving embodied intelligence from materials to machines. Nature Machine Intelligence. 2019;1:12-19. DOI. org/10.1038/s42256-018-0009-9.

3. Дунин-Барковский В.Л., Соловьева К.П. Принцип Павлова в проблеме обратного конструирования мозга. XVIII Международная конференция «Нейроинформатика-2016». Сборник научных трудов, ч. 1. М.: Национальный исследовательский ядерный университет «МИФИ», 2016:11-23.

4. Dunin-Barkowski W., Solovyeva K. Pavlov Principle and Brain Reverse Engineering. IEEE Conference on Computational Intelligence in Bioinformatics and Computational Biology, CIBCB-2018. Saint Louis, Missouri, USA. 2018; Paper #37: 1-5. DOI: 10.1109/

CIBCB.2018.8404975.

5. Shakirov VV., Solovyeva K.P., Dunin-Barkowski W.L. Review of State-of-the-Art in Deep Learning Artificial Intelligence. Optical Memory and Neural Networks. 2018;27(2):65-80. DOI: 10.3103/ S1060992X18020066.

6. Dunin-Barkowski W.L., Shakirov V.V. A Way toward Human Level Artificial Intelligence. Optical Memory and Neural Networks. 2019;28(1):21-26. DOI: 10.3103/S1060992X19010041.

7. Varlamov O.O. Wi!Mi Expert System Shell as the Novel Tool for Building Knowledge-Based Systems with Linear Computational Complexity. The International Review of Automatic Control (IREACO). 2018;11(6):314-325. DOI.org/10.15866/ireaco.v11i6.15855.

8. Varlamov O.O., Chuvikov D.A., Adamova L.E., Kolesnichenko O.Yu., Petrov M.A., Zabolotskaya I.K., Zhilina T.N. Logical, Philosophical and Ethical Aspects of AI in Medicine. International Conference

on Computer Science and Information Technology (ICCSIT-2018), International Journal of Machine Learning and Computing. 2019. В печати.

9. Booth Jo., Booth Ja. Marathon Environments: Multi-Agent Continuous Control Benchmarks in a Modern Video Game Engine. arXiv:1902.09097v1 [cs.AI] 25 Feb 2019.

10. Pathak D., Lu C., Darrell T., Isola P., Efros A.A. Learning to Control Self-Assembling Morphologies: A Study of Generalization via Modularity. arXiv:1902.05546v1 [cs.LG] 14 Feb 2019.

11. Tassa Y., Doron Y., Muldal A., Erez T., Li Y., Lillicrap T. et al. Deepmind control suite. arXiv:1801.00690v1 [cs.AI] 2 Jan 2018.

12. Wang R., Lehman J., Clune J., Stanley K.O. Paired Open-Ended Trailblazer (POET): Endlessly Generating Increasingly Complex and Diverse Learning Environments and Their Solutions. arXiv:1901.01753v3 [cs.NE] 21 Feb 2019.

13. Gopalakrishnan A., Mali A., Kifer D., Lee Giles C., Ororbia A.G. A Neural Temporal Model for Human Motion Prediction. arXiv:1809.03036v4 [cs.CV] 6 Dec 2018.

14. Hernandez-Ruiz A., Gall J., Moreno-Noguer F. Human Motion Prediction via Spatio-Temporal Inpainting. arXiv:1812.05478v1 [cs.CV] 13 Dec 2018.

15. Qiu J., Huang G., Lee T.S. A Neurally-Inspired Hierarchical Prediction Network for Spatiotemporal Sequence Learning and Prediction. arXiv:1901.09002v1 [cs.NE] 25 Jan 2019.

16. Radford A., Jozefowicz R., Sutskever I. Learning to Generate Reviews and Discovering Sentiment. arXiv:1704.01444v2 [cs.LG] 6 Apr 2017.

17. Radford A., Narasimhan K., Salimans T., Sutskever I. Improving Language Understanding by Generative Pre-Training, 2018. URL: https://s3-us-west-2.amazonaws.com/openai-assets/research-cov-ers/language-unsupervised/language_understanding_paper.pdf.

18. Radford A., Wu J., Child R., Luan D., Amodei D., Sutskever I. Language Models are Unsupervised Multitask Learners, 2019. https://github.com/openai/gpt-2.

19. Yogatama D., De Masson d'Autume C., Connor J., Kocisky T., Chrzanowski M., Kong L. et al. Learning and Evaluating General Linguistic Intelligence. arXiv:1901.11373v1 [cs.LG] 31 Jan 2019.

20. Aharoni R., Johnson M., Firat O. Massively Multilingual Neural Machine Translation. arXiv:1903.00089v1 [cs.CL] 28 Feb 2019.

21. Lample G., Conneau A. Cross-lingual Language Model Pretraining. arXiv:1901.07291v1 [cs.CL] 22 Jan 2019.

22. Nachmani E., Wolf L. Unsupervised Polyglot Text To Speech. arXiv:1902.02263v1 [cs.LG] 6 Feb 2019.

23. Haque A, Guo M, Verma P, Fei-Fei L. Audio-Linguistic Embeddings for Spoken Sentences. arXiv:1902.07817v1 [cs.SD] 20 Feb 2019.

24. Gupta A., Vedaldi A., Zisserman A. Learning to Read by Spelling: Towards Unsupervised Text Recognition. arXiv:1809.08675v2 [cs.CV] 9 Dec 2018.

25. Finlayson S.G., Bowers J.D., Ito J., Zittrain J.L., Beam A.L., Kohane I.S. Adversarial attacks on medical machine learning. Science, 2019;363(6433):1287-1289. DOI: 10.1126/science.aaw4399.

26. Finlayson S.G., Chung H.W., Kohane I.S., Beam A.L. Adversarial Attacks Against Medical Deep Learning Systems. arXiv:1804.05296v3 [cs.CR] 4 Feb 2019.

27. Kolesnichenko Yu., Kolesnichenko O., Smorodin G. 3-Dimensional Vector Analysis of 2-Dimensional Ultrasound Diagnostic Images. 21st Conference of Open Innovations Association FRUCT, University of Helsinki, Finland, 2017:428-434.

28. HMA-EMA Joint Big Data Taskforce, Summary report. Heads of Medicines Agencies EU, European Medicines Agency. EMA/105321/2019.13 February 2019, 48.

Полная версия статьи доступна по ссылке: http://remedium.ru/health/Isk_Int_dlya_medicini/

кроме того...

В Госдуме подготовили проект реформы розничного фармрынка

Межфракционная рабочая группа депутатов Государственной думы подготовила техническое задание с предложениями по совершенствованию законодательства в сфере лекарственного обеспечения граждан. Работа над документом была

инициирована спикером нижней палаты парламента Вячеславом Володиным после обращения ряда российских фармпроизводителей, указавших на случаи дискриминации отечественных ЛС в аптечных сетях. По словам главы межфракционной группы Андрея Исаева, целью законодателей является введение дополнительных антимонопольных ограничений на аптечном рынке. Депутаты предлагают запретить аптеч-

ным ассоциациям выполнять коммерческие функции и обязать аптечные сети создавать точки в «коммерчески непривлекательных населенных пунктах». В техзадании также оговаривается возможность введения запрета на создание дискриминационных условий для доступа ЛС в аптечную сеть по аналогии с торговыми сетями. Ограничения могут коснуться маркетинговых сборов с производителей. Основная цель авторов пред-

ложений - довести к 2021 г. долю российских ЛС в общем объеме продаж до 50 % в денежном выражении, к 2030-му - до 65 %. Для этого законодатели предлагают сформировать перечни ЛС отечественного производства, наличие которых для аптек обязательно, а также законодательно закрепить за отечественной фармпродукцией и лекарствами низкого ценового сегмента не менее 50% площади аптечных витрин.

i Надоели баннеры? Вы всегда можете отключить рекламу.