1ЫХ ИССЛЕДОВАНИЙ: 1ФРОВАЯ ЭПИДЕМИОЛОГИЯ (ОБЗОР)
С Денисов, ассистент научно-образовательной лаборатории «Живая лаборатория популяционных исследований»; Е.М. Каменских, руководитель научно-образовательной лаборатории «Живая лаборатория популяционных исследований»; О.С. Федорова, д.м.н., профессор, зав. кафедрой факультетской педиатрии с курсом детских болезней лечебного факультета
Сибирский государственный медицинский университет, Московский тракт, 2, Томск, 634050
В последнее десятилетие развитие высокопроизводительных технологий привело к резкому увеличению возможностей изучения организма на молекулярном, клеточном и организменном уровнях. Быстрый прогресс биотехнологий стал причиной смены парадигмы в популяционных исследованиях. Достижения современных биомедицинских наук, включая геномные, полногеномные, постгеномные исследования и биоинформатику, способствовали появлению молекулярной эпидемиологии, принцип которой заключается в изучении персонализированного молекулярного механизма развития заболеваний и его экстраполяции на уровень популяции. Работа научных групп на стыке информационных технологий и медицины стала основанием для выделения цифровой эпидемиологии, важными инструментами которой являются машинное обучение, возможность работы с реальными данными (real world data, RWD) и накопленные большие данные.
Разрабатываемые подходы позволяют ускорить процесс сбора и обработки биомедицинских данных, проверку новых научных гипотез. Однако новые методы находятся пока на стадии становления, требуют проверки применения в различных условиях, а также стандартизации. Данный обзор освещает роль омиксных и цифровых технологий в проведении популяционных исследований.
Ключевые слова: популяционные исследования в медицине; цифровая эпидемиология; молекулярная эпидемиология; омикс-ные технологии; информационные технологии.
Как цитировать: Denisov N.S., Kamenskikh E.M., Fedorova O.S. Trends in population-based studies: molecular and digital epidemiology (review). Sovremennye tehnologii v medicine 2022; 14(4): 60, https://doi.org/10.17691/stm2022.14.4.07
English
Trends in Population-Based Studies: Molecular and Digital Epidemiology (Review)
N.S. Denisov, Assistant, Research and Educational Laboratory "Live Laboratory of Population-Based Studies";
E.M. Kamenskikh, Head of the Research and Educational Laboratory "Live Laboratory of Population-Based Studies";
O.S. Fedorova, MD, DSc, Professor, Head of Department of Faculty Pediatrics with the Course of Childhood Diseases, Faculty of General Medicine
Siberian State Medical University, 2 Moskovsky Trakt, Tomsk, 634050, Russia
Для контактов: Денисов Никита Сергеевич, e-mail: denisov.ssmu@gmail.com
The development of high-throughput technologies has sharply increased the opportunities to research the human body at the molecular, cellular, and organismal levels in the last decade. Rapid progress in biotechnology has caused a paradigm shift in population-based studies. Advances in modern biomedical sciences, including genomic, genome-wide, post-genomic research and bioinformatics, have contributed to the emergence of molecular epidemiology focused on the study of the personalized molecular mechanism of disease development and its extrapolation to the population level. The work of research teams at the intersection of information technology and medicine has become the basis for highlighting digital epidemiology, the important tools of which are machine learning, the ability to work with real world data, and accumulated big data.
The developed approaches accelerate the process of collecting and processing biomedical data, testing new scientific hypotheses. However, new methods are still in their infancy, they require testing of application under various conditions, as well as standardization. This review highlights the role of omics and digital technologies in population-based studies.
Key words: population-based studies in medicine; digital epidemiology; molecular epidemiology; omics technologies; information technologies.
Введение
Глобальные медико-демографические проблемы: старение населения, увеличение распространенности хронических неинфекционных заболеваний, пандемия новой коронавирусной инфекции — ставят перед здравоохранением новые масштабные задачи, одним из инструментов решения которых является прецизионная (персонализированная, персонифицированная) медицина. Первоначально востребованная преимущественно в диагностике и лечении онкологических заболеваний, сейчас она внедряется во все области медицины.
В мире инициируются крупные исследовательские проекты и кампании, нацеленные на разработку и внедрение стратегий прецизионной медицины. По оценкам экспертов, глобальный рынок прецизионной медицины к 2023 г достигнет 87,7 млрд. долларов. Научные организации-лидеры располагаются в США, Великобритании, Франции и Китае. С 2018 г количество публикаций в мире по направлению «прецизионная медицина» составило около 16 тыс.
Одним из основных инструментов прецизионной медицины выступают молекулярная и цифровая эпидемиология.
Молекулярная эпидемиология Геномные исследования
Биологические исследования традиционно проводились с помощью редукционистских подходов отчасти из-за ограничений как в экспериментальных мощностях приборов, так и в связи со сложностью процесса аналитической оценки данных. В последнее десятилетие развитие высокопроизводительных технологий привело к резкому увеличению возможностей изучения организма на молекулярном, клеточном и организменном уровнях [1]. Быстрый прогресс биотехнологий привел к изменению парадигмы в геномной эпидемиологии: от исследований сцепления до полногеномного поиска ассоциаций (genome-wide association studies, GWAS) и широкого применения
секвенирования нового поколения (next generation sequencing, NGS). Технологические разработки улучшили дизайн исследований, углубили наше понимание этиологии заболеваний и привели к многочисленным научным открытиям [2].
В геномике методы секвенирования первого поколения позволяли секвенировать геном человека за 300 000 долларов, а два десятилетия спустя методы следующего поколения позволяют секвенировать геном человека за несколько часов при стоимости в 1000 долларов. Измерения таких характеристик, как эпигеном, транскриптом, протеом и др., претерпели сходные изменения, что позволило исследователям начать изучение патологий, используя их характеристики на молекулярном, а не на тканевом уровне [3]. Следовательно, как при изучении отдельных организмов, так и при изучении популяций требуются вычислительные и статистические подходы к данным различных «омик», которые рассматривают метаболизм в клетках, тканях и органах как единое целое, интегрированную систему, а не изолированные отдельные процессы.
Снижение стоимости геномного секвенирования в сочетании с увеличением вычислительной мощности привело к резкому росту интереса к применению полногеномного секвенирования в общественном здравоохранении [4]. На сегодняшний день геномная эпидемиология позволяет исследовать геномы патогенов для изучения распространения инфекционных заболеваний среди популяций и оперативно реагировать на вспышки таких заболеваний [5]. Вместе с филодина-микой (сочетание эпидемиологии, эволюции и иммуно-динамики) геномная эпидемиология — это быстро развивающаяся область науки, которая решает ключевые вопросы, касающиеся готовности к эпидемии и борьбы с ней, в режиме реального времени [6].
Первое время геномные данные использовались для изучения разнообразия вирусов, особенно вируса гриппа А и вируса иммунодефицита человека. Эпидемия, вызванная вирусом Эбола в Западной Африке (2013-2016 гг.), стала первым крупным и широкомасштабным вызовом для изучения геномов вирусов. В результате были раскрыты их происхождение
и причины столь быстрого распространения эпидемии, а также выявлены последующие источники локальных вспышек [7].
Геномная эпидемиология сыграла важную роль в информировании ученых о характере таких угроз для здравоохранения, как вспышки вирусов Зика, ближневосточного респираторного синдрома (MERS), Эболы и новой коронавирусной инфекции SARS-CoV-2 [8]. Эти угрозы потребовали применения различных подходов, включая интенсивное секвенирование генома для понимания динамики передачи во время острой фазы эпидемий (вирус Эбола в Демократической Республике Конго) и более широкий геномный «надзор» для выявления скрытого увеличения случаев заболевания (полиомиелит) [9]. Во время пандемии SARS-CoV-2 многие страны, которые ранее не использовали геномные данные, начали активно проводить такие исследования и полагаться на их результаты. Благодаря геномным технологиям стало известно более 2,5 млн. последовательностей SARS-CoV-2 из более чем 185 стран [10], а последующий интерес к геномной эпидемиологии со стороны общества привел к быстрой разработке новых методологий для полноценного использования этого набора данных для борьбы с пандемией.
Передача всех инфекций происходит в разных пространственных масштабах, которые зависят от патогена, характера передвижения хозяина, иммунитета и других факторов [11].
Влияние получения геномных данных на формирование здоровья общества представлено на рис. 1.
Геномные данные могут помочь определять характеристики клинических случаев инфекции в зависимости от локализации и времени и отслеживать вспышки во всех пространственных масштабах: от внутриболь-
ничных до пандемий [12]. Анализируя геномы патогенов в контексте других последовательностей, полученных в результате той же вспышки, а также сравнивая их с ранее охарактеризованными вариантами, исследователи могут разрабатывать стратегии вмешательства на индивидуальном и популяционном уровнях, чтобы минимизировать бремя инфекционных заболеваний для индивидуума и общества [13]. Такой комплексный подход, как определение последовательности патогенов, их анализ и ответные меры, называют молекулярной эпидемиологией. В отличие от разработки стратегий лечения на индивидуальном уровне, в которых внимание направлено на функциональные роли мутаций хозяина и/или патогена, геномный анализ в масштабе вспышки использует мутации патогена в качестве маркеров событий передачи [14].
Геномная эпидемиология изучает динамику возникновения вспышек и быструю эволюцию патогенов, которые часто накапливают мутации в том же масштабе, что и распространение этих патогенов.
С помощью ЫОБ можно с высокой точностью выявлять различные типы геномных и эпигенетических вариаций. Такое секвенирование позволяет исследователям напрямую изучать все эти вариации персонально, увеличивая шанс выявления мутаций [15]. Хотя масштабы использования ЫОБ все еще ограничены из-за высокой стоимости, успех нескольких недавних проектов свидетельствует о большом потенциале применения этого метода в геномной эпидемиологии, особенно с учетом того, что стоимость сек-венирования продолжает снижаться.
При достаточном объеме выборок, соответствующих метаданных (таких как местоположение и дата) и соответствующей статистической основы геномы
Персонализированная медицина
Исход для общественного здоровья
Х4 -Й
■>'j ■■ • жШШГ
Секвенирование, биоинформатика
Разработка вакцин, лекарственных препаратов,
ранняя диагностика
Рис. 1. Секвенирование патогенов во время вспышек инфекционных заболеваний
Схематично представлена связь получения геномных данных и создания здоровьесберега-ющих технологий
патогенов могут помочь выявить закономерности распространения эпидемии при малом количестве исследуемых пациентов, что позволяет разработать точные таргетные вмешательства по сравнению с традиционными методами и использованием демографических данных [16]. В ближайшее время мы также будем способны оценить распространение хронических неинфекционных заболеваний с применением данных родословной пациента.
В 2011 г. Национальный исследовательский институт генома человека (США) опубликовал обзор о генетической медицине, отметив, что «самый эффективный способ улучшить здоровье человека — понять нормальную биологию (в данном случае биологию генома) как основу для изучения биологии болезней, которая затем становится основой для укрепления здоровья». На сегодняшний день все еще трудно полностью определить будущие перспективы генетической эпидемиологии для улучшения общественного здравоохранения [17].
Не менее важным при оценке вклада генетической эпидемиологии в общественное здравоохранение является понимание того, что этиология заболеваний сложна, а генетический риск развития патологии не приравнивается к генетическому детерминизму [18]. Сложная взаимосвязь между генетикой и заболеванием ставит перед практикующими врачами этическую дилемму в отношении грамотной интерпретации результатов генетических тестов. При проведении генетических тестов можно косвенным путем узнать о нарушениях, которые не станут причиной развития клинической картины заболевания [19]. Возникает этический вопрос, следует ли пациентам знать об этих случайных находках, которые могут иметь медицинскую ценность?
Биомаркеры
При эпидемиологическом изучении заболеваний все чаще используют концентрации метаболитов в качестве биомаркеров, которые служат косвенными показателями скорости метаболических реакций. Однако оценка скорости отдельных реакций может предоставить больше точной информации о протекающих изменениях непосредственно в органе [20].
Прямое измерение скорости метаболических реакций in situ в настоящее время нецелесообразно в больших популяционных исследованиях — они имеют высокую стоимость, технически сложны и требуют высокопроизводительного оборудования. Успешней этот метод применяют в меньших масштабах, в первую очередь за счет использования неинвазивной спектроскопии ядерного магнитного резонанса (ЯМР-спектроскопии) [21]. Методы визуализации метаболических путей с использованием гиперполяризованных метаболитов показали многообещающие результаты в диагностике и локализации опухолей у пациентов с раком предстательной железы [22].
В проспективном клиническом исследовании с участием 58 пациентов с хронической сердечной недостаточностью была измерена скорость синтеза аде-нозинтрифосфата (АТФ) путем изучения активности сердечной креатинкиназы in situ с помощью метода 31P ЯМР-спектроскопии [23].
Концентрации АТФ и креатинфосфата, а также общие клинические показатели использовались в качестве предикторов хронической сердечной недостаточности в течение 8-летнего периода наблюдения. Избыточная активность креатинкиназы значительно превосходила такие параметры, как возраст пациента, пол и концентрация других метаболитов, по ценности в прогнозировании событий сердечной недостаточности и смерти, включая госпитализацию по поводу сердечной недостаточности и установки вспомогательного желудочкового устройства [24].
Эти результаты относятся к относительно небольшой группе пациентов, но они добавляют вес аргументам в пользу разработки биомаркеров, основанных на скорости протекания метаболических путей и реакций, при изучении болезни.
Метаболизм работает как непрерывно действующая система движения и преобразования молекул посредством реакций. Поскольку поток метаболитов регулярно перенаправляется, метаболиты накапливаются в различных точках или истощаются, что приводит к изменению их концентрации. Концентрации метаболитов отражают эффекты комбинированных изменений скорости реакции, но не дают прямого представления о дисфункциях самих процессов, например при патологии, влияющей на ферменты, гены и другие молекулярные продукты, полученные из генома организма [24]. В связи с этим систематическая оценка скорости реакции в масштабах, необходимых для эпидемиологии, может происходить путем интеграции метаболомных данных с геномной, транскрип-томной и/или протеомной информацией для определения ферментативной функции.
Благодаря способности характеризовать разнообразные варианты эндогенных и экзогенных метаболитов в биологических образцах метаболомные подходы быстро получили признание в качестве важного инструмента в исследованиях здоровья населения [25]. Результаты показывают, что применение для измерения метаболома небольших объемов крови, мочи, кала, слюны, конденсата выдыхаемого воздуха, спинномозговой жидкости, биопсии может дать информацию о возможных механизмах, лежащих в основе заболевания [26-30]. Тем не менее большинство существующих доказанных фактов получены из исследований случай-контроль или перекрестных, которые не позволяют установить четкую временную связь между воздействием, биомаркерами и заболеванием.
В последнее время метаболическая характеристика амниотической жидкости, пуповинной крови и образцов мочи или сыворотки матери/ребенка
использовалась для оценки комплексного воздействия на плод и мать и потенциально может быть связана с проблемами развития. В качестве многообещающего образца для метаболомического профилирования были предложены высушенные пятна крови новорожденных, использующиеся для идентификации метаболических биомаркеров будущего риска рака и остальных заболеваний [31-34].
Применение метаболомики для изучения риска заболеваний, скрининга и эффективности лечения позволило получить многообещающие начальные результаты, хотя эта область все еще находится на стадии разработки. Такие результаты были получены в исследованиях нейродегенеративных заболеваний [35], диабета 2-го типа [36], рака [37], ВИЧ, туберкулеза [38], малярии [39] и сердечно-сосудистых заболеваний [40]. Следующим важным шагом в применении метаболомики для изучения этиологии заболеваний и раннего выявления патологий будет использование лонгитюдных исследований, которые уже показали свою эффективность в создании биологических моделей влияния окружающей среды на человека [41, 42].
Цифровая эпидемиология
Для проведения крупных многоцентровых эпидемиологических исследований активно используются цифровые технологии, позволяющие облегчить процессы планирования работы, удаленного сбора и контроля ввода данных, а также последующего представления результатов и повторного использования [43-46].
Несмотря на то, что в России эпидемиология хронических неинфекционных заболеваний пока отстает от достижений эпидемиологии инфекционных заболеваний [47], необходимость создания и внедрения цифровых сервисов для этого направления бесспорна [48]. Это связано с повышением доступности омиксных технологий, накоплением результатов многолетних исследований, необходимостью сравнения выводов аналогичных работ, повышением требований к практическому применению и внедрению результатов [47, 49].
Цифровые системы для проведения клинических исследований
Основой для проведения исследований в области прецизионной медицины является формирование баз данных клинической информации, аннотированных с учетом собранных биоматериалов по каждому клиническому случаю [50, 51]. Это существенно расширяет ресурсные возможности для проведения исследований на стыке клинических направлений, при подключении новых членов исследовательской команды или в случае долгого временного периода работы [52].
В работе L. Coppola и соавт. [50] сделан акцент на важности комбинации в цифровой системе первичных данных с параклинической информацией, включающей в себя данные визуализационных исследований.
По мнению авторов, сервис по работе с визуальными данными должен обладать возможностью не только отображения, но также и анализа, для чего требуется предварительная обработка и разметка данных. Например, выделение участков с предполагаемой инфильтрацией легких по данным компьютерной томографии (КТ) или с очагами патологического сигнала на снимках магнитно-резонансной томографии (МРТ). Интеграция в систему данных геномного анализа способствует развитию геномики и радиомики (радиоми-ка направлена на создание математических моделей и компьютерных алгоритмов, которые за счет анализа медицинских изображений, например МРТ- или КТ-снимки, представляют заключение о патофизиологических особенностях тканей) [50, 53]. Научные коллективы, накапливающие биомедицинские данные, отмечают, что пока не разработаны отдельные стандарты, работа с визуализационными биобанками должна вестись в соответствии с уже известными стандартами [50, 54]. Гармонизация процессов сделает возможным объединение данных мультиомиксных исследований и визуальных материалов для интеграции фенотипических и генотипических данных [50, 55].
Во многих медицинских учреждениях за последние 10 лет появились интегрированные базы данных (Integrated data repositories, IDRs) [56], которые накапливаются из электронных медицинских карт [57]. На основе накопленных данных не только проверяются научные гипотезы, но также строится клиническая система поддержки принятия решений [56]. K.K. Gagalova и соавт. [56] выделили четыре модели архитектуры сбора и хранения данных медицинских организаций, в которых варьируют источники данных, цель использования, наличие хранилища и т.д. Целью данной работы было положить начало формирования рекомендаций по составлению IDRs в больницах.
Онлайн-базы
Широкую популярность получили интерактивные системы мониторинга [58]. За последние 20 лет появилось много сервисов мониторинга инфекционных заболеваний [59, 60]. Для мониторинга ситуации с ан-тибиотикорезистентностью создано много сервисов, имеющих ограничение по географической территории, описываемым микроорганизмам и оцениваемым показателям:
EARS-Net (https://atlas.ecdc.europa.eu/public/index. aspx);
CDDEP Resistance Map (https://resistancemap.cddep. org/index.php);
SGSS (https://sgss.phe.org.uk/Security/Register);
ATLAS (https://atlas-surveillance.c0m/#/l0gin);
SMART (https://globalsmartsite.eom/#/auth/login).
Российской разработкой является веб-приложение со свободным доступом AMRmap (https://amrmap.ru/) [61], отображающее данные об антибиотикорезистент-ности, полученные в многоцентровых клинических ис-
следованиях. В системе имеется раздел генетических маркеров. Информация в базе хранится с 1997 г, доступ предоставляется бесплатно.
С 2018 г. развивается проект Бристольского университета EpiGraphDB [62] — аналитическая платформа на основе базы данных, предназначена для интеллектуального анализа эпидемиологических показателей. В проекте разрабатываются подходы для интерпретации причинно-следственных связей при систематическом автоматизированном анализе многих фенотипов с использованием данных из массива биоинформати-ческих ресурсов. Также университет разрабатывает программное обеспечение для проведения статистической обработки омиксных исследований, например MR-Base [63].
Большая система построения последовательностей биологических реакций в организме представлена в системе WikiPathways [64]. В настоящий момент активно ведется наполнение этой системы данными омиксных исследований. В базе STRING собраны известные и прогнозируемые белок-белковые взаимодействия [65].
В работе K. Toom и соавт. [66] сравнивались результаты эпидемиологического исследования головной боли в Эстонии с применением онлайн-опросника с результатами исследования данных, полученных при очных визитах пациентов. Применение онлайн-опрос-ников позволяет значительно ускорить процесс сбора данных, увеличить охват популяции, снизить количество ошибок при заполнении. Однако авторы отметили, что в онлайн-опроснике большинство людей не имело головной боли, что сильно отличало выборку людей, заполняющих онлайн-опросники, от выборки пациентов, пришедших на очные визиты. Это снижало показатель заболеваемости головной болью в популяции. Также в онлайн-опроснике участвовало больше женщин, людей молодого возраста, женатых людей, жителей городов и людей с высоким уровнем образования. Эти характеристики выборки являются типичными и должны учитываться как ограничивающие в случае проведения исследований с применением он-лайн-опросников [67-69].
Интересным решением является интегрированная (онлайн-доступ, телефонная связь и бумажная почта) Национальная австралийская система StepUp для исследований в области деменции [70]. В этой системе пациенты с деменцией и исследователи спектра заболеваний, сопровождающихся когнитивным дефицитом, регистрируются одним из трех удобных способов [70]. Это позволяет ускорить процесс сбора данных под исследовательские гипотезы и разработать новые подходы для борьбы с деменцией [71, 72]. Авторы отмечают, что бесперебойная работа системы продолжилась и после момента начала пандемии новой коронавирусной инфекции [70]. За два года функционирования платформы было зарегистрировано более 1000 пациентов, 120 исследователей и инициировано более 40 работ [70].
Для проведения клинических исследований существует ряд бесплатных сервисов, позволяющих создавать электронные индивидуальные регистрационные карты, например REDCap [73] или Ark [74]. Использование специализированных сервисов может быть ограничено, так как доступ предоставляется организации после заключения договора с правообладателями, а не напрямую исследователю. Однако сервис позволяет надежно хранить персональные данные без доступа третьих лиц в отличие от многих открытых ресурсов, в том числе Google Forms [75]. Исследовательские сервисы в дальнейшем смогут послужить созданию крупных баз данных по определенным нозологиям, методам диагностики или лечения. Сервисы постоянно развиваются, появляются дополнительные модули, необходимые для специализированного анализа, например построение родословной [74].
Пандемия новой коронавирусной инфекции привела к ускоренному и вынужденному внедрению цифровых технологий во все сферы жизни, в том числе и на всех этапах проведения исследований [76, 77]. С начала пандемии в 2019 г. разработано много национальных и международных онлайн-систем мониторинга [78]. Проблемами быстроразвивающихся сервисов становятся их слабая интеграция между собой и отсутствие централизованного управления, затруднение в интерпретации и практическом применении данных [79]. С другой стороны, ограничивающим фактором выступает нежелание пациентов использовать цифровые опросники или удаленные способы коммуникации из-за неуверенности в конфиденциальности при их применении или нежелания становиться зависимыми от гаджетов [80], что особенно распространено среди пациентов старшей возрастной группы.
Открытые данные
Ежегодное увеличение накапливаемых данных требует введения новых стандартов работы с полученной информацией. Одним из наиболее распространенных стандартов такой работы с данными является FAIR (findability, accessibility, interoperability and reusability — обнаруживаемость, доступность, совместимость и повторное использование) [81], ставший основополагающим требованием к открытой науке [82, 83]. В работе K. Suhre и соавт. [84] подчеркивается важность обмена данными для омиксных исследований на примере комбинации полногеномного поиска ассоциаций GWAS и протеомного анализа. В перспективе авторы считают, что возможно создание базы данных, в которой будут аккумулированы сведения о генетической колокализации геномной информации и характеристики молекулярного фенотипа заболевания (например, экспрессия генов и метаболомная характеристика) с конечными точками клинических исследований.
Real world data (RWD)
Реальными данными (RWD) в биомедицинских исследованиях называют данные, собранные из электронных историй болезней, медицинских регистров, страховых медицинских организаций, неинтервенционных клинических исследований и других источников, в которых информация была получена не в экспериментальных условиях [85].
С 2006 г. работает онлайн-система HealthMap (https://www.healthmap.org/ru/), в которой аккумулируются данные о вспышках заболеваний из открытых веб-ресурсов [86]. В 2008 г стартовал проект веб-системы эпиднадзора за гриппом Influenzanet [87, 88]. Ограничениями в использовании этих данных выступают их избыточность (повторы), неоднородность (разные форматы введения), несогласованность (нарушение хронологии событий). A. Chatzidimitriou и со-авт. [89] создали базу данных (n=20 463) по клиническим случаям хронического лимфолейкоза (The eric CLL database), в наполнении которой участвуют более 90 центров и 31 страна. Для успешного функционирования распределенной базы данных авторы считают необходимым обеспечить стандартизацию, интеграцию ретроспективных данных и оценку качества вводимых данных [89].
Цифровая эпидемиология как отдельная область знания
По мнению M. Salathe [90], цифровая эпидемиология выделилась в отдельную область научного знания. Цель ее заключается в том, чтобы понять закономерности развития заболеваний и динамики состояния здоровья населения, а также установить причины существования этих закономерностей для поиска способов предотвращения развития заболеваний и укрепления здоровья. Самое широкое определение цифровой эпидемиологии — это эпидемиология, использующая цифровые данные. Однако автор затем дает уточнение, что цифровая эпидемиология работает с данными, которые не были получены с основной целью проведения эпидемиологических исследований. К таким данным могут быть отнесены как электронные медицинские карты, информация страховых
фондов, городских, региональных и федеральных ведомств здравоохранения, так и данные поисковых систем, социальных сетей и мобильных телефонов [90].
Google Flu Trends (GFT) стал одним из первых известных примеров сервисов для цифровой эпидемиологии, в котором использовались поисковые запросы по симптомам острых респираторных заболеваний для эпидемиологического анализа [91, 92]. Серьезной проблемой стало то, что собранными данными владела частная компания, и используемые алгоритмы анализа оказались закрыты даже для национальных систем здравоохранения [90], а независимое тестирование возможностей этого сервиса для эпидемиологических исследований показало низкую эффективность оценки заболеваемости инфекционными заболеваниями [93]. Неофициальные интернет-источники могут быть ценным ресурсом для эпидемиологических исследований, однако современный тренд, направленный на защиту персональных данных и поддержание конфиденциальности, является важным ограничивающим фактором. M. Salathe выделяет два пути решения этой проблемы [90]:
создание систем мониторинга группами ученых или профессиональными сообществами, которые будут более понятны и прозрачны для национальных систем здравоохранения, что увеличит вероятность их внедрения в реальную практику;
повышение вовлеченности населения в эпидемиологические исследования. Права на данные, генерируемые отдельными лицами, принадлежат лицам, которые создали ресурс. Репрезентативную часть населения следует убедить поделиться с органами общественного здравоохранения персональными данными, связанными с их здоровьем, для проведения научных исследований, результаты которых смогут принести пользу обществу.
Формирование цифровой эпидемиологии показано на схеме J.A. Roth и соавт. [94] (рис. 2).
По данным автора, уже к 2018 г. были разработаны методы машинного обучения, основанные на данных систем здравоохранения или социальных сетей (Twitter), которые помогают определить прогноз в отношении выживаемости, развития осложнений.
Важно отметить, что трансформация эпидемиологии ведет к изменению принципов ее преподавания
Классическая эпидемиология
Цифровая эпидемиология
Методы анализа
Источники данных
Тип данных
Классический подход Машинное обучение
Данные исследований Накапливаемые ежедневно данные
Небольшие структурированные датасеты
Применение
Выживание/мониторинг (пространственный/ временной тренд)
Идентификация факторов риска
Прогноз
Рис. 2. Переход от классической к цифровой эпидемиологии [94]
Показано формирование области знания «Цифровая эпидемиология»
[95]. M.M. Werler и соавт. [96] отмечают, что для новых учебных программ по эпидемиологии важным является формирование причинно-следственного мышления и последующее формирование научной гипотезы. К распространенным ошибкам молодых эпидемиологов относятся оценка одного фактора риска для одного исхода, неточность формулирования исследовательских вопросов и более высокая значимость в исследовании эпидемиологических и статистических подходов по сравнению с общественной значимостью.
Этические проблемы
Развитие технологий высокоточной медицины влечет за собой необходимость формирования новых этических норм [97]. Классически важными этическими принципами являются уважение автономии пациента и соблюдение конфиденциальности [98]. В данном случае этические требования должны обеспечивать невозможность идентификации отдельных людей в открытых порталах для обмена научными данными. Этика прецизионного общественного здравоохранения регулирует взаимодействие между пациентами, давшими добровольное информированное согласие лечащему врачу на использование их клинических образцов для исследований в прецизионной геномной медицине, и общественным процессом принятия решений, который стимулирует действия органов общественного здравоохранения. Развитие новой гибридной этической парадигмы возможно только при отлаженном взаимодействии этих участников процесса. Проведение омиксных исследований позволяет получить подробную информацию о любом субъекте. Однако для планирования мер по борьбе с заболеваниями на конкретной территории или в конкретной популяции важны данные с указанием демографических характеристик отдельной личности: например, географического положения, истории миграции, пребывания в местах лишения свободы, особенностей быта и профессии и т.д. Все эти данные являются персональными, они не должны подвергаться широкому распространению и повышать риски идентификации личности субъекта исследования.
В этой связи отдельное место отводится способу представления полученной информации. Этика прецизионной медицины включает в себя приверженность этики общественного здравоохранения социальной справедливости и делает упор на профессиональную прозрачность и вызываемое ею доверие. Собранные данные должны быть прозрачными и направленными на улучшение имеющейся системы, улучшение жизни людей, а не стигматизацию тех слоев общества или общественных групп, где выявлены высокие факторы риска или относительно высокая заболеваемость [97].
Развитие электронных систем сбора и хранения данных требует тщательной проработки рисков сохранения безопасности полученной информации [99].
Появляются новые требования к управлению данными и соблюдению профессиональной конфиденциальности [98]. Скорость, точность и эффективность обработки больших данных, присущих цифровым технологиям, открывают большие возможности для общественного здравоохранения, но влекут за собой ответственность за адаптацию в обществе, которое привержено конфиденциальности, уважению прав человека в вопросах здравоохранения и социальной справедливости.
A. Sharma и соавт. [100] выступают за развитие законодательной базы в области сохранения конфиденциальности персональных данных, собранных в рамках научных и клинических исследований, за проведение аудита и внедрение независимого надзора, позволяющего оценить управление рисками повторного использования данных о субъектах исследований. Решение этой проблемы требует новых подходов к работе с данными пациентов с учетом повышения активности научной коммуникации, создания открытых репозиториев, обмена первичными данными исследований, что является неотъемлемой частью крупных эпидемиологических исследований. Однако людей побуждает участвовать в исследованиях знание их конкретной цели, а также репутация той организации, с которой они взаимодействуют Повторное использование данных другими организациями несет определенные риски, о которых пациенты должны быть проинформированы перед предоставлением добровольного информированного согласия на участие в отдельном исследовании.
В связи с особенностями биомедицинских исследований была разработана новая парадигма открытой науки FAIR-Health [101]. Данная парадигма направлена на то, что информацию и биоматериалы, собранные в исследованиях, следует рассматривать как единый ресурс. Именно этот принцип, согласно данным R Holub и соавт. [101], поможет обеспечить воспроизводимость исследований и последующую интеграцию результатов.
Заключение
Современные методы проведения популяцион-ных исследований, включая как данные омиксных технологий, так и результаты мониторинга состояний и поведения пациентов на протяжении длительного времени, позволяют получить подробные данные о субъектах. В настоящий момент ведется поиск методов стандартизации собранной информации, ее анализа и синтеза для дальнейшего использования. Одним из серьезных вызовов науке является интеграция результатов исследований не только для рационального хранения, но и для создания динамических цифровых моделей субъектов и процессов.
Развитие технологий прецизионной медицины лежит в основе повышения качества и продолжительности жизни населения.
Вклад авторов: Н.С. Денисов — анализ литературы, написание текста статьи; Е.М. Каменских — разработка концепции, написание текста; О.С. Федорова — формулировка темы научной статьи, критический анализ литературы.
Финансирование исследования. Работа не получала финансовой поддержки.
Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов при подготовке публикации.
Литература/References
1. Diaz-Beltran L., Cano C., Wall D.P., Esteban F.J. Systems biology as a comparative approach to understand complex gene expression in neurological diseases. Behav Sci (Basel) 2013; 3(2): 253-272, https://doi.org/10.3390/bs3020253.
2. Wang Q., Lu Q., Zhao H. A review of study designs and statistical methods for genomic epidemiology studies using next generation sequencing. Front Genet 2015; 6: 149, https:// doi.org/10.3389/fgene.2015.00149.
3. Pareek C.S., Smoczynski R., Tretyn A. Sequencing technologies and genome sequencing. J Appl Genet 2011; 52(4): 413-435, https://doi.org/10.1007/s13353-011-0057-x.
4. Hill V., Ruis C., Bajaj S., Pybus O.G., Kraemer M.U.G. Progress and challenges in virus genomic epidemiology. Trends Parasitol 2021; 37(12): 1038-1049, https://doi. org/10.1016/j.pt.2021.08.007.
5. Armstrong G.L., MacCannell D.R., Taylor J., Carleton H.A., Neuhaus E.B., Bradbury R.S., Posey J.E., Gwinn M. Pathogen genomics in public health. N Engl J Med 2019; 381(26): 2569-2580, https://doi.org/10.1056/ nejmsr1813907.
6. Ladner J.T., Grubaugh N.D., Pybus O.G., Andersen K.G. Precision epidemiology for infectious disease control. Nat Med 2019; 25(2): 206-211, https://doi.org/10.1038/ s41591-019-0345-2.
7. Holmes E.C., Dudas G., Rambaut A., Andersen K.G. The evolution of Ebola virus: insights from the 2013-2016 epidemic. Nature 2016; 538(7624): 193-200, https://doi. org/10.1038/nature19790.
8. Kulikowski C.A. Pandemics: historically slow "learning curve" leading to biomedical informatics and vaccine breakthroughs. Yearb Med Inform 2021; 30(1): 290-301, https://doi.org/10.1055/s-0041-1726482.
9. National Academies of Sciences, Engineering, and Medicine; Division on Earth and Life Studies; Board on Life Sciences; Health and Medicine Division; Board on Health Sciences Policy; Committee on Data Needs to Monitor the Evolution of SARS-CoV-2. Genomic epidemiology data infrastructure needs for SARS-CoV-2: modernizing pandemic response strategies. Washington (DC): National Academies Press (US); 2020. URL: https://www.ncbi.nlm.nih.gov/books/ NBK562776/.
10. Liu T., Chen Z., Chen W., Chen X., Hosseini M., Yang Z., Li J., Ho D., Turay D., Gheorghe C.P., Jones W., Wang C. A benchmarking study of SARS-CoV-2 whole-genome sequencing protocols using COVID-19 patient samples. iScience 2021; 24(8): 102892, https://doi.org/10.10167j.isci. 2021.102892.
11. Richard M., Knauf S., Lawrence P., Mather A.E., Munster V.J., Müller M.A., Smith D., Kuiken T. Factors determining human-to-human transmissibility of zoonotic
pathogens via contact. Curr Opin Virol 2017; 22: 7-12, https:// doi.org/10.1016/j.covira.2016.11.004.
12. Gilchrist C.A., Turner S.D., Riley M.F., Petri W.A., Hewlett E.L. Whole-genome sequencing in outbreak analysis. Clin Microbiol Rev 2015; 28(3): 541-563, https://doi. org/10.1128/cmr.00075-13.
13. Grad Y.H., Lipsitch M. Epidemiologic data and pathogen genome sequences: a powerful synergy for public health. Genome Biol2014; 15(11): 538, https://doi.org/10.1186/s13059-014-0538-4.
14. Wohl S., Schaffner S.F., Sabeti PC. Genomic analysis of viral outbreaks. Annu Rev Virol 2016; 3(1): 173-195, https:// doi.org/10.1146/annurev-virology-110615-035747.
15. Maljkovic Berry I., Melendrez M.C., Bishop-Lilly K.A., Rutvisuttinunt W., Pollett S., Talundzic E., Morton L., Jarman R.G. Next generation sequencing and bioinformatics methodologies for infectious disease research and public health: approaches, applications, and considerations for development of laboratory capacity. J Infect Dis 2020; 221(Suppl 3): S292-S307, https://doi.org/10.1093/infdis/jiz286.
16. Bandoy D.J.D.R., Weimer B.C. Analysis of SARS-CoV-2 genomic epidemiology reveals disease transmission coupled to variant emergence and allelic variation. Sci Rep 2021; 11(1): 7380, https://doi.org/10.1038/s41598-021-86265-4.
17. Gonzaga-Jauregui C., Lupski J.R., Gibbs R.A. Human genome sequencing in health and disease. Annu Rev Med 2012; 63: 35-61, https://doi.org/10.1146/annurev-med-051010-162644.
18. Cleeren E., Van der Heyden J., Brand A., Van Oyen H. Public health in the genomic era: will Public Health Genomics contribute to major changes in the prevention of common diseases? Arch Public Health 2011; 69(1): 8, https://doi. org/10.1186/0778-7367-69-8.
19. McGuire A.L., Beskow L.M. Informed consent in genomics and genetic research. Annu Rev Genomics Hum Genet 2010; 11: 361-381, https://doi.org/10.1146/annurev-genom-082509-141711.
20. Picó C., Serra F., Rodríguez A.M., Keijer J., Palou A. Biomarkers of nutrition and health: new tools for new approaches. Nutrients 2019; 11(5): 1092, https://doi. org/10.3390/nu11051092.
21. Fearnley L.G., Inouye M. Metabolomics in epidemiology: from metabolite concentrations to integrative reaction networks. Int J Epidemiol 2016; 45(5): 1319-1328, https://doi.org/10.1093/ije/dyw046.
22. Testa C., Pultrone C., Manners D.N., Schiavina R., Lodi R. Metabolic imaging in prostate cancer: where we are. Front Oncol 2016; 6: 225, https://doi.org/10.3389/fonc. 2016.00225.
23. Luptak I., Sverdlov A.L., Panagia M., Qin F., Pimentel D.R., Croteau D., Siwik D.A., Ingwall J.S., Bachschmid M.M., Balschi J.A., Colucci W.S. Decreased ATP production and myocardial contractile reserve in metabolic heart disease. J Mol Cell Cardiol 2018; 116: 106-114, https:// doi.org/10.1016/j.yjmcc.2018.01.017.
24. Metallo C.M., Heiden M.G.V. Understanding metabolic regulation and its influence on cell physiology. Mol Cell 2013; 49(3): 388-398, https://doi.org/10.1016/j.molcel.2013.01.018.
25. Johnson C.H., Ivanisevic J., Siuzdak G. Metabolomics: beyond biomarkers and towards mechanisms. Nat Rev Mol Cell Biol 2016; 17(7): 451-459, https://doi.org/10.1038/ nrm.2016.25.
26. Bouatra S., Aziat F., Mandal R., Guo A.C., Wilson M.R.,
Knox C., Bjorndahl T.C., Krishnamurthy R., Saleem F., Liu P., Dame Z.T., Poelzer J., Huynh J., Yallou F.S., Psychogios N., Dong E., Bogumil R., Roehring C., Wishart D.S. The human urine metabolome. PLoS One 2013; 8(9): e73076, https://doi. org/10.1371/journal.pone.0073076.
27. Psychogios N., Hau D.D., Peng J., Guo A.C., Mandal R., Bouatra S., Sinelnikov I., Krishnamurthy R., Eisner R., Gautam B., Young N., Xia J., Knox C., Dong E., Huang P., Hollander Z., Pedersen T.L., Smith S.R., Bamforth F., Greiner R., McManus B., Newman J.W., Goodfriend T., Wishart D.S. The human serum metabolome. PLoS One 2011; 6(2): e16957, https://doi.org/10.1371/journal.pone.0016957.
28. Karu N., Deng L., Slae M., Guo A.C., Sajed T., Huynh H., Wine E., Wishart D.S. A review on human fecal metabolomics: methods, applications and the human fecal metabolome database. Anal Chim Acta 2018; 1030: 1-24, https://doi.org/10.1016/j.aca.2018.05.031.
29. Wishart D.S., Lewis M.J., Morrissey J.A., Flegel M.D., Jeroncic K., Xiong Y., Cheng D., Eisner R., Gautam B., Tzur D., Sawhney S., Bamforth F., Greiner R., Li L. The human cerebrospinal fluid metabolome. J Chromatogr B 2008; 871(2): 164-173, https://doi.org/10.1016/jjchromb.2008.05.001.
30. Brown M.V., McDunn J.E., Gunst P.R., Smith E.M., Milburn M.V., Troyer D.A., Lawton K.A. Cancer detection and biopsy classification using concurrent histopathological and metabolomic analysis of core biopsies. Genome Med 2012; 4(4): 33, https://doi.org/10.1186/gm332.
31. Robinson O., Keski-Rahkonen P., Chatzi L., Kogevinas M., Nawrot T., Pizzi C., Plusquin M., Richiardi L., Robinot N., Sunyer J., Vermeulen R., Vrijheid M., Vineis P., Scalbert A., Chadeau-Hyam M. Cord blood metabolic signatures of birth weight: a population-based study. J Proteome Res 2018; 17(3): 1235-1247, https://doi. org/10.1021/acs.jproteome.7b00846.
32. Perng W., Rifas-Shiman S.L., McCulloch S., Chatzi L., Mantzoros C., Hivert M.F., Oken E. Associations of cord blood metabolites with perinatal characteristics, newborn anthropometry, and cord blood hormones in project viva. Metabolism 2017; 76: 11-22, https://doi.org/10.1016/j. metabol.2017.07.001.
33. Lau C.E., Siskos A.P., Maitre L., Robinson O., Athersuch T.J., Want E.J., Urquiza J., Casas M., Vafeiadi M., Roumeliotaki T., McEachan R.R.C., Azad R., Haug L.S., Meltzer H.M., Andrusaityte S., Petraviciene I., Grazuleviciene R., Thomsen C., Wright J., Slama R., Chatzi L., Vrijheid M., Keun H.C., Coen M. Determinants of the urinary and serum metabolome in children from six European populations. BMC Med 2018; 16(1): 202, https://doi. org/10.1186/s12916-018-1190-8.
34. Petrick L., Edmands W., Schiffman C., Grigoryan H., Perttula K., Yano Y., Dudoit S., Whitehead T., Metayer C., Rappaport S. An untargeted metabolomics method for archived newborn dried blood spots in epidemiologic studies. Metabolomics 2017; 13(3): 27, https://doi.org/10.1007/s11306-016-1153-z.
35. Roede J.R., Uppal K., Park Y., Lee K., Tran V., Walker D., Strobel F.H., Rhodes S.L., Ritz B., Jones D.P. Serum metabolomics of slow vs. rapid motor progression Parkinson's disease: a pilot study. PLoS One 2013; 8(10): e77629, https://doi.org/10.1371/journal.pone.0077629.
36. Guasch-Ferré M., Hruby A., Toledo E., Clish C.B., Martínez-González M.A., Salas-Salvadó J., Hu F.B. Metabolomics in prediabetes and diabetes: a systematic
review and meta-analysis. Diabetes Care 2016; 39(5): 833846, https://doi.org/10.2337/dc15-2251.
37. Wishart D.S., Mandal R., Stanislaus A., Ramirez-Gaona M. Cancer metabolomics and the human metabolome database. Metabolites 2016; 6(1): 10, https://doi.org/10.3390/ metabo6010010.
38. Frediani J.K., Jones D.P., Tukvadze N., Uppal K., Sanikidze E., Kipiani M., Tran V.T., Hebbar G., Walker D.I., Kempker R.R., Kurani S.S., Colas R.A., Dalli J., Tangpricha V., Serhan C.N., Blumberg H.M., Ziegler T.R. Plasma metabolomics in human pulmonary tuberculosis disease: a pilot study. PLoS One 2014; 9(10): e108854, https://doi. org/10.1371/journal.pone.0108854.
39. Würtz P., Havulinna A.S., Soininen P., Tynkkynen T., Prieto-Merino D., Tillin T., Ghorbani A., Artati A., Wang Q., Tiainen M., Kangas A.J., Kettunen J., Kaikkonen J., Mikkilä V., Jula A., Kähönen M., Lehtimäki T., Lawlor D.A., Gaunt T.R., Hughes A.D., Sattar N., Illig T., Adamski J., Wang T.J., Perola M., Ripatti S., Vasan R.S., Raitakari O.T., Gerszten R.E., Casas J.P., Chaturvedi N., Ala-Korpela M., Salomaa V. Metabolite profiling and cardiovascular event risk. Circulation 2015; 131(9): 774-785, https://doi.org/10.1161/ circulationaha.114.013116.
40. Ganna A., Salihovic S., Sundström J., Broeckling C.D., Hedman A.K., Magnusson P.K.E., Pedersen N.L., Larsson A., Siegbahn A., Zilmer M., Prenni J., Arnlöv J., Lind L., Fall T., Ingelsson E. Large-scale metabolomic profiling identifies novel biomarkers for incident coronary heart disease. PLoS Genet 2014; 10(12): e1004801, https://doi.org/10.1371/journal. pgen.1004801.
41. Rogers A.J., McGeachie M., Baron R.M., Gazourian L., Haspel J.A., Nakahira K., Fredenburgh L.E., Hunninghake G.M., Raby B.A., Matthay M.A., Otero R.M., Fowler V.G., Rivers E.P., Woods C.W., Kingsmore S., Langley R.J., Choi A.M. Metabolomic derangements are associated with mortality in critically ill adult patients. PLoS One 2014; 9(1): e87538, https:// doi.org/10.1371/journal.pone.0087538.
42. Playdon M.C., Ziegler R.G., Sampson J.N., StolzenbergSolomon R., Thompson H.J., Irwin M.L., Mayne S.T., Hoover R.N., Moore S.C. Nutritional metabolomics and breast cancer risk in a prospective study. Am J Clin Nutr 2017; 106(2): 637-649, https://doi.org/10.3945/ajcn.116.150912.
43. Анфиногенова Я.Д., Трубачева И.А., Серебрякова В.Н., Попов С.В. Новые тренды и вызовы популяци-онной кардиологии. Сибирский журнал клинической и экспериментальной медицины 2020; 34(4): 24-38, https://doi. org/10.29001/2073-8552-2019-34-4-24-38.
Anfinogenova Y.J., Trubacheva I.A., Serebryakova V.N., Popov S.V. Emerging trends and challenges of population-based cardiology. Sibirskij zhurnal klinicheskoj i jeksperimental'noj mediciny 2020; 34(4): 24-38, https://doi. org/10.29001/2073-8552-2019-34-4-24-38.
44. Garg S., Williams N.L., Ip A., Dicker A.P. Clinical integration of digital solutions in health care: an overview of the current landscape of digital technologies in cancer care. JCO Clin Cancer Inform 2018; 2: 1-9, https://doi.org/10.1200/ cci.17.00159.
45. Thyagarajan B., Nelson H.H., Poynter J.N., Prizment A.E., Roesler M.A., Cassidy E., Putnam S., Amos L., Hickle A., Reilly C., Spector L.G., Lazovich D. Field application of digital technologies for health assessment in the 10,000 families study. Cancer Epidemiol Biomarkers Prev 2020; 29(4): 744-751, https://doi.org/10.1158/1055-9965.epi-19-0858.
46. Coathup V., Teare H.J., Minari J., Yoshizawa G., Kaye J., Takahashi M.P., Kato K. Using digital technologies to engage with medical research: views of myotonic dystrophy patients in Japan. BMC Med Ethics 2016; 17(1): 51, https://doi. org/10.1186/s12910-016-0132-2.
47. Брико Н.И. Теоретические обобщения в эпидемиологии: от истории к современности. Эпидемиология и вакцинопрофилактика 2018; 17(5): 5-16, https://doi. org/10.31631/2073-3046-2018-17-5-5-16.
Briko N.I. Theoretical generalizations in epidemiology: from history to the present. Epidemiología i vakcinoprofilaktika 2018; 17(5): 5-16, https://doi.org/10.31631/2073-3046-2018-17-5-5-16.
48. Jagodzinski A., Johansen C., Koch-Gromus U., Aarabi G., Adam G., Anders S., Augustin M., der Kellen R.B., Beikler T., Behrendt C.A., Betz C.S., Bokemeyer C., Borof K., Briken P., Busch C.J., Büchel C., Brassen S., Debus E.S., Eggers L., Fiehler J., Gallinat J., Gellißen S., Gerloff C., Girdauskas E., Gosau M., Graefen M., Härter M., Harth V., Heidemann C., Heydecke G., Huber T.B., Hussein Y., Kampf M.O., von dem Knesebeck O., Konnopka A., König H.H., Kromer R., Kubisch C., Kühn S., Loges S., Löwe B., Lund G., Meyer C., Nagel L., Nienhaus A., Pantel K., Petersen E., Püschel K., Reichenspurner H., Sauter G., Scherer M., Scherschel K., Schiffner U., Schnabel R.B., Schulz H., Smeets R., Sokalskis V., Spitzer M.S., Terschüren C., Thederan I., Thoma T., Thomalla G., Waschki B., Wegscheider K., Wenzel J.P., Wiese S., Zyriax B.C., Zeller T., Blankenberg S. Rationale and design of the Hamburg city health study. Eur J Epidemiol 2020; 35(2): 169-181, https://doi. org/10.1007/s10654-019-00577-4.
49. Shin Y.K., Koskinen V., Kouvonen A., Kemppainen T., Olakivi A., Wrede S., Kemppainen L. Digital information technology use and transnational healthcare: a population-based study on older Russian-speaking migrants in Finland. J Immigr Minor Health 2022; 24(1): 125-135, https://doi. org/10.1007/s10903-021-01301-9.
50. Coppola L., Cianflone A., Grimaldi A.M., Incoronato M., Bevilacqua P., Messina F., Baselice S., Soricelli A., Mirabelli P., Salvatore M. Biobanking in health care: evolution and future directions. J Transl Med 2019; 17(1): 172, https://doi. org/10.1186/s12967-019-1922-3.
51. Griffon N., Pereira H., Djadi-Prat J., García M.T., Testoni S., Cariou M., Hilbey J., N'Dja A., Navarro G., Gentili N., Nanni O., Raineri M., Chatellier G., Gómez De La Camara A., Lewi M., Sundgren M., Daniel C., Garvey A., Todorovic M., Ammour N. Performances of a solution to semi-automatically All eCRF with data from the electronic health record: protocol for a prospective individual participant data meta-analysis. Stud Health Technol Inform 2020; 270: 367371, https://doi.org/10.3233/shti200184.
52. Rorie D.A., Flynn R.W.V., Grieve K., Doney A., Mackenzie I., MacDonald T.M., Rogers A. Electronic case report forms and electronic data capture within clinical trials and pharmacoepidemiology. Br J Clin Pharmacol 2017; 83(9): 1880-1895, https://doi.org/10.1111/bcp.13285.
53. Mayerhoefer M.E., Materka A., Langs G., Häggström I., Szczypinski P., Gibbs P., Cook G. Introduction to radiomics. J Nucl Med 2020; 61(4): 488-495, https://doi.org/10.2967/ jnumed.118.222893.
54. Benelli M., Barucci A., Zoppetti N., Calusi S., Redapi L., Della Gala G., Piffer S., Bernardi L., Fusi F., Pallotta S. Comprehensive analysis of radiomic datasets by
RadAR. Cancer Res 2020; 80(15): 3170-3174, https://doi. org/10.1158/0008-5472.can-20-0332.
55. Scapicchio C., Gabelloni M., Barucci A., Cioni D., Saba L., Neri E. A deep look into radiomics. Radiol Med 2021; 126(10): 1296-1311, https://doi.org/10.1007/s11547-021-01389-x.
56. Gagalova K.K., Leon Elizalde M.A., Portales-Casamar E., Görges M. What you need to know before implementing a clinical research data warehouse: comparative review of integrated data repositories in health care institutions. JMIR Form Res 2020; 4(8): e17687, https://doi. org/10.2196/17687.
57. Huser V., Kahn M.G., Brown J.S., Gouripeddi R. Methods for examining data quality in healthcare integrated data repositories. Pac Symp Biocomput 2018; 23: 628-633.
58. Ku W.Y., Nfor O.N., Liu W.H., Tantoh D.M., Hsu S.Y., Wang L., Chou T.Y., Liaw Y.P. Online community collaborative map: a geospatial and data visualization tool for cancer data. Medicine (Baltimore) 2019; 98(20): e15521, https://doi. org/10.1097/md.0000000000015521.
59. Commons R.J., Thriemer K., Humphreys G., Suay I., Sibley C.H., Guerin P.J., Price R.N. The Vivax Surveyor: online mapping database for Plasmodium vivax clinical trials. Int J Parasitol Drugs Drug Resist 2017; 7(2): 181-190, https://doi. org/10.1016/j.ijpddr.2017.03.003.
60. Dong E., Du H., Gardner L. An interactive web-based dashboard to track COVID-19 in real time. Lancet Infect Dis 2020; 20(5): 533-534, https://doi.org/10.1016/s1473-3099(20)30120-1.
61. Kuzmenkov A.Y., Trushin I.V., Vinogradova A.G., Avramenko A.A., Sukhorukova M.V., Malhotra-Kumar S., Dekhnich A.V., Edelstein M.V., Kozlov R.S. AMRmap: an interactive web platform for analysis of antimicrobial resistance surveillance data in Russia. Front Microbiol 2021; 12: 620002, https://doi.org/10.3389/fmicb.2021.620002.
62. Liu Y., Elsworth B., Erola P., Haberland V., Hemani G., Lyon M., Zheng J., Lloyd O., Vabistsevits M., Gaunt T.R. EpiGraphDB: a database and data mining platform for health data science. Bioinformatics 2021; 37(9): 1304-1311, https:// doi.org/10.1093/bioinformatics/btaa961.
63. Hemani G., Zheng J., Elsworth B., Wade K.H., Haberland V., Baird D., Laurin C., Burgess S., Bowden J., Langdon R., Tan V.Y., Yarmolinsky J., Shihab H.A., Timpson N.J., Evans D.M., Relton C., Martin R.M., Davey Smith G., Gaunt T.R., Haycock P.C. The MR-Base platform supports systematic causal inference across the human phenome. eLife 2018; 7: e34408, https://doi. org/10.7554/eLife.34408.
64. Slenter D.N., Kutmon M., Hanspers K., Riutta A., Windsor J., Nunes N., Melius J., Cirillo E., Coort S.L., Digles D., Ehrhart F., Giesbertz P., Kalafati M., Martens M., Miller R., Nishida K., Rieswijk L., Waagmeester A., Eijssen L.M.T., Evelo C.T., Pico A.R., Willighagen E.L. WikiPathways: a multifaceted pathway database bridging metabolomics to other omics research. Nucleic Acids Res 2018; 46(D1): D661-D667, https://doi.org/10.1093/nar/gkx1064.
65. Szklarczyk D., Morris J.H., Cook H., Kuhn M., Wyder S., Simonovic M., Santos A., Doncheva N.T., Roth A., Bork P., Jensen L.J., von Mering C. The STRING database in 2017: quality-controlled protein-protein association networks, made broadly accessible. Nucleic Acids Res 2017; 45(D1): D362-D368, https://doi.org/10.1093/nar/gkw937.
66. Toom K., Raidvee A., Braschinsky M. The applicability
of web-based solutions in headache epidemiology research. J Headache Pain 2020; 21(1): 60, https://doi.org/10.1186/ s10194-020-01141-2.
67. Egger M.J., Lukacz E.S., Newhouse M., Wang J., Nygaard I. Web versus paper-based completion of the epidemiology of prolapse and incontinence questionnaire. Female Pelvic Med Reconstr Surg 2013; 19(1): 17-22, https:// doi.org/10.1097/spv.0b013e31827bfd93.
68. Tassiopoulos K., Roberts-Toler C., Fichtenbaum C.J., Koletar S.L. Web-based data collection for older adults living with HIV in a clinical research setting: pilot observational study. J Med Internet Res 2020; 22(11): e18588, https://doi. org/10.2196/18588.
69. Braekman E., Charafeddine R., Demarest S., Drieskens S., Berete F., Gisle L., Van der Heyden J., Van Hal G. Comparing web-based versus face-to-face and paper-and-pencil questionnaire data collected through two Belgian health surveys. Int J Public Health 2020; 65(1): 5-16, https://doi.org/10.1007/s00038-019-01327-9.
70. Jeon Y.H., Shin M., Smith A., Beattie E., Brodaty H., Frost D., Hobbs A., Kotting P., Petrie G., Rossor M., Thompson J., Vickers J., Waters D. Early implementation and evaluation of StepUp for Dementia Research: an Australia-wide dementia research participation and public engagement platform. Int J Environ Res Public Health 2021; 18(21): 11353, https://doi.org/10.3390/ijerph182111353.
71. Langbaum J.B., Karlawish J., Roberts J.S., Wood E.M., Bradbury A., High N., Walsh T.L., Gordon D., Aggarwal R., Davis P., Stowell C., Trisko L., Langlois C.M., Reiman E.M., Tariot P.N. GeneMatch: a novel recruitment registry using at-home APOE genotyping to enhance referrals to Alzheimer's prevention studies. Alzheimers Dement J Alzheimers Assoc 2019; 15(4): 515-524, https://doi.org/10.1016/jjalz.2018.12.007.
72. Weiner M.W., Nosheny R., Camacho M., Truran-Sacrey D., Mackin R.S., Flenniken D., Ulbricht A., Insel P., Finley S., Fockler J., Veitch D. The Brain Health Registry: an internet-based platform for recruitment, assessment, and longitudinal monitoring of participants for neuroscience studies. Alzheimers Dement J Alzheimers Assoc 2018; 14(8): 10631076, https://doi.org/10.1016/jjalz.2018.02.021.
73. Harris P.A., Taylor R., Minor B.L., Elliott V., Fernandez M., O'Neal L., McLeod L., Delacqua G., Delacqua F., Kirby J., Duda S.N.; REDCap Consortium. The REDCap consortium: building an international community of software platform partners. J Biomed Inform 2019; 95: 103208, https://doi.org/10.1016/jjbi.2019.103208.
74. Ranaweera T., Makalic E., Hopper J.L., Bickerstaffe A. An open-source, integrated pedigree data management and visualization tool for genetic epidemiology. Int J Epidemiol 2018; 47(4): 1034-1039, https://doi.org/10.1093/ije/dyy049.
75. Djenno M., Insua G.M., Pho A. From paper to pixels: using Google Forms for collaboration and assessment. Libr Hi Tech News 2015; 32(4): 9-13, https://doi.org/10.1108/lhtn-12-2014-0105.
76. Wang X. Establishment of an internet-based epidemiological survey data collection customized system model. Front Public Health 2021; 9: 761031, https://doi. org/10.3389/fpubh.2021.761031.
77. Golinelli D., Boetto E., Carullo G., Nuzzolese A.G., Landini M.P., Fantini M.P. Adoption of digital technologies in health care during the COVID-19 pandemic: systematic review of early scientific literature. J Med Internet Res 2020; 22(11): e22280, https://doi.org/10.2196/22280.
78. Budd J., Miller B.S., Manning E.M., Lampos V., Zhuang M., Edelstein M., Rees G., Emery V.C., Stevens M.M., Keegan N., Short M.J., Pillay D., Manley E., Cox I.J., Heymann D., Johnson A.M., McKendry R.A. Digital technologies in the public-health response to COVID-19. Nat Med 2020; 26(8): 1183-1192, https://doi.org/10.1038/s41591-020-1011-4.
79. He Z., Zhang C.J.P., Huang J., Zhai J., Zhou S., Chiu J.W., Sheng J., Tsang W., Akinwunmi B.O., Ming W.K. A new era of epidemiology: digital epidemiology for investigating the COVID-19 outbreak in China. J Med Internet Res 2020; 22(9): e21685, https://doi.org/10.2196/21685.
80. Horst B.R., Sixsmith A., Simeonov D., Mihailidis A. Demographic and psychographic factors of social isolation during the COVID-19 pandemic: the importance of technology confidence. Front Public Health 2021; 9: 749515, https://doi. org/10.3389/fpubh.2021.749515.
81. Wilkinson M.D., Dumontier M., Jan Aalbersberg I., Appleton G., Axton M., Baak A., Blomberg N., Boiten J.W., da Silva Santos L.B., Bourne P.E., Bouwman J., Brookes A.J., Clark T., Crosas M., Dillo I., Dumon O., Edmunds S., Evelo C.T., Finkers R., Gonzalez-Beltran A., Gray A.J.G., Groth P., Goble C., Grethe J.S., Heringa J., 't Hoen P.A.C., Hooft R., Kuhn T., Kok R., Kok J., Lusher S.J., Martone M.E., Mons A., Packer A.L., Persson B., Rocca-Serra P., Roos M., van Schaik R., Sansone S.A., Schultes E., Sengstag T., Slater T., Strawn G., Swertz M.A., Thompson M., van der Lei J., van Mulligen E., Velterop J., Waagmeester A., Wittenburg P., Wolstencroft K., Zhao J., Mons B. Addendum: the FAIR Guiding Principles for scientific data management and stewardship. Sci Data 2019; 6(1): 6, https://doi. org/10.1038/s41597-019-0009-6.
82. Munafo M.R., Hollands G.J., Marteau T.M. Open science prevents mindless science. BMJ 2018; 363: k4309, https://doi.org/10.1136/bmj.k4309.
83. Sanjana N.E. Voices of the new generation: open science is good for science (and for you). Nat Rev Mol Cell Biol 2021; 22(11): 709, https://doi.org/10.1038/s41580-021-00414-1.
84. Suhre K., McCarthy M.I., Schwenk J.M. Genetics meets proteomics: perspectives for large population-based studies. Nat Rev Genet 2021; 22(1): 19-37, https://doi.org/10.1038/ s41576-020-0268-2.
85. Bian J., Lyu T., Loiacono A., Viramontes T.M., Lipori G., Guo Y., Wu Y., Prosperi M., George T.J., Harle C.A., Shenkman E.A., Hogan W. Assessing the practice of data quality evaluation in a national clinical data research network through a systematic scoping review in the era of real-world data. J Am Med Inform Assoc 2020; 27(12): 1999-2010, https://doi.org/10.1093/jamia/ocaa245.
86. Brownstein J.S., Freifeld C.C., Reis B.Y., Mandl K.D. Surveillance Sans Frontières: internet-based emerging infectious disease intelligence and the HealthMap project. PLoS Med 2008; 5(7): e151, https://doi.org/10.1371/journal. pmed.0050151.
87. Land-Zandstra A.M., van Beusekom M., Koppeschaar C., van den Broek J. Motivation and learning impact of Dutch flu-trackers. J Sci Commun 2016; 15(1): A04, https://doi. org/10.22323/2.15010204.
88. Paolotti D., Carnahan A., Colizza V., Eames K., Edmunds J., Gomes G., Koppeschaar C., Rehn M., Smallenburg R., Turbelin C., Van Noort S., Vespignani A. Web-based participatory surveillance of infectious diseases:
the Influenzanet participatory surveillance experience. Clin Microbiol Infect 2014; 20(1): 17-21, https://doi.org/ 10.1111/1469-0691.12477.
89. Chatzidimitriou A., Minga E., Chatzikonstantinou T., Moreno C., Stamatopoulos K., Ghia P. Challenges and solutions for collecting and analyzing real world data: the Eric CLL database as an illustrative example. Hemasphere 2020; 4(5): e425, https://doi.org/10.1097/hs9.0000000000000425.
90. Salathé M. Digital epidemiology: what is it, and where is it going? Life Sci Soc Policy 2018; 14(1): 1, https://doi. org/10.1186/s40504-017-0065-7.
91. Ginsberg J., Mohebbi M.H., Patel R.S., Brammer L., Smolinski M.S., Brilliant L. Detecting influenza epidemics using search engine query data. Nature 2009; 457(7232): 10121014, https://doi.org/10.1038/nature07634.
92. Lippi G., Mattiuzzi C., Cervellin G. Is digital epidemiology the future of clinical epidemiology? J Epidemiol Glob Health 2019; 9(2): 146, https://doi.org/10.2991/ jegh.k.190314.003.
93. Cervellin G., Comelli I., Lippi G. Is Google Trends a reliable tool for digital epidemiology? Insights from different clinical settings. J Epidemiol Glob Health 2017; 7(3): 185-189, https://doi.org/10.1016/jjegh.2017.06.001.
94. Roth J.A., Battegay M., Juchler F., Vogt J.E., Widmer A.F. Introduction to machine learning in digital healthcare epidemiology. Infect Control Hosp Epidemiol 2018; 39(12): 1457-1462, https://doi.org/10.1017/ice.2018.265.
95. Frérot M., Lefebvre A., Aho S., Callier P., Astruc K., Aho Glélé L.S. What is epidemiology? Changing definitions of
epidemiology 1978-2017. PLoS One 2018; 13(12): e0208442, https://doi.org/10.1371/journal.pone.0208442.
96. Werler M.M., Stuver S.O., Healey M.A., LaMorte W.W. The future of teaching epidemiology. Am J Epidemiol 2019; 188(5): 825-829, https://doi.org/10.1093/aje/kwz039.
97. Vallury K.D., Baird B., Miller E., Ward P. Going viral: researching safely on social media. J Med Internet Res 2021; 23(12): e29737, https://doi.org/10.2196/29737.
98. Juengst E.T., Van Rie A. Transparency, trust, and community welfare: towards a precision public health ethics framework for the genomics era. Genome Med 2020; 12(1): 98, https://doi.org/10.1186/s13073-020-00800-y.
99. Solomon D.H., Rudin R.S. Digital health technologies: opportunities and challenges in rheumatology. Nat Rev Rheumatol 2020; 16(9): 525-535, https://doi.org/10.1038/ s41584-020-0461-x.
100. Sharma A., Nilsen T.B., Czerwinska K.P., Onitiu D., Brenna L., Johansen D., Johansen H.D. Up-to-the-minute privacy policies via gossips in participatory epidemiological studies. Front Big Data 2021; 4: 624424, https://doi. org/10.3389/fdata.2021.624424.
101. Holub P., Kohlmayer F., Prasser F., Mayrhofer M.T., Schlünder I., Martin G.M., Casati S., Koumakis L., Wutte A., Kozera L, Strapagiel D., Anton G., Zanetti G., Sezerman O.U., Mendy M., Valik D., Lavitrano M., Dagher G., Zatloukal K., van Ommen G.B., Litton J.E. Enhancing reuse of data and biological material in medical research: from FAIR to FAIR-Health. Biopreserv Biobank 2018; 16(2): 97-105, https://doi. org/10.1089/bio.2017.0110.