ГЕНЕТИКА GENETICS
DOI: 10.18413/2658-6533-2023-9-2-0-1
УДК 616-056.7:575
Менделевская рандомизация: применение генетической информации в эпидемиологических исследованиях
(обзор)
Д.Ю. Плотников
Федеральное государственное бюджетное образовательное учреждение высшего образования «Казанский государственный медицинский университет», ул. Бутлерова, д.49, г. Казань, 420012, Российская Федерация Автор для переписки: Д.Ю. Плотников ([email protected])
Резюме
Актуальность: Менделевская рандомизация - способ тестирования причинно-следственных связей между модифицируемыми факторами риска и показателями здоровья (или социально-экономическими признаками), основанный на использовании генетической информации в рамках метода инструментальных переменных. За последние 5 лет, согласно Scopus было опубликовано более 4,6 тысяч работ, связанных с применением Менделевской рандомизации. Цель исследования: Изучить статистические методы, используемые при проведении Менде-левской рандомизации и оценить возможности применения данного способа в генетической эпидемиологии. Материалы и методы: Проведен анализ зарубежной научной литературы по теории и практическому применению Менделевской рандомизации в установлении и оценке причинно-следственного влияния модифицируемых факторов риска на исходы. Результаты: В настоящей статье дается краткое ознакомление с теоретическими основами Менделевской рандомизации, охватывая основные концепции, критерии и методы оценки. В данной работе приводится пример исследования, в котором применялась Менделевская рандомизации, также описаны основные направления применения этого способа в эпидемиологии и перспективы применения метода в будущем. Заключение: Оценка эффекта, полученная в Менделевской рандомизации менее подвержена смещению по сравнению с обсервационными исследованиями, поскольку генетические варианты случайным образом передаются от родителей к потомству и, как следствие, не должны быть связаны с потенциальными вмешивающимися факторами, влияющими на ассоциацию фактора риска с исходом. Менделевская рандомизация позволяет в короткие сроки установить и оценить причинно-следственную связь, и определить значимые факторы риска развития того или иного заболевания. Появление большого количества информации о генетических вариантах в эру полногеномных ассоциативных исследований значительно упрощает проведение МР анализа.
Ключевые слова: Менделевская рандомизация; эпидемиология; причинность; генетика
Для цитирования: Плотников ДЮ. Менделевская рандомизация: применение генетической информации в эпидемиологических исследованиях (обзор). Научные результаты биомедицинских исследований. 2023;9(2):158-172. DOI: 10.18413/2658-6533-2023-9-2-0-1
Mendelian randomization: using genetic information in epidemiological
studies (review)
Denis Y. Plotnikov
Kazan State Medical University, 49 Butlerov St., Kazan, 420012, Russia Corresponding author: Denis Yu. Plotnikov ([email protected])
Abstract
Background: Mendelian randomization is a research method that exploits the instrumental variable framework using genetic information to assess the causality of the relationship between modifiable risk factors and health indicators (or socioeconomic traits). Over the past 5 years, according to Scopus, more than 4.6 thousand papers related to the use of Mendelian randomization have been published. The aim of the study: To study the statistical approaches used in the Mendelian randomization and evaluate the possibilities of using this method in genetic epidemiology. Materials and methods: The analysis of international scientific literature on the theory and practical application of Men-delian randomization in establishing and evaluating the causal effect of modifiable risk factors on outcomes was carried out. Results: This article provides a brief introduction to the theoretical foundations of Mendelian randomization, covering the main concepts, criteria, and evaluation methods. This paper provides an example of a study in which Mendelian randomization was used, it also describes the main areas of application of this method in epidemiology and the prospects for using the method in the future. Conclusion: The effect estimate obtained in Mendelian randomization is less prone to bias compared to one obtained in observational studies, since genetic variants are randomly assigned from parents to offspring and, as a result, should not be associated with potential confounding factors affecting the association of a risk factor with an outcome. Mendelian randomization allows one to assess and evaluate a causal relationship, and to determine causal risk factors for the development of a particular disease. A huge amount of genetic information is available in the genome-wide association studies era; that makes it easier to conduct the MR analysis. Keywords: Mendelian randomization; epidemiology; causality; genetics
For citation: Plotnikov DY. Mendelian randomization: using genetic information in epidemiological studies (review). Research Results in Biomedicine. 2023;9(2):158-172. Russian. DOI: 10.18413/2658-6533-2023-9-2-0-1
Введение. Тема причинности является одной из важнейших и дискуссионных в эпидемиологии; однако, до сих пор не существует единого определения причинности,
принятого научным сообществом [1, 2]. В исследовании Parascandola and Weed [3], опубликованном в 2001 году был проведен анализ 148 публикаций с целью выявить,
как эпидемиологи трактуют понятие причинность. Авторы показали, что в эпидемиологической литературе используется пять основных категорий определений причинности, каждая из которых имеет свои достоинства и недостатки. В результате, была предложена классификация определений причинности, согласно которой, результат не может произойти без Необходимой Причины (necessary cause) и наличия этой причины достаточно для наступления эффекта. Развитием предыдущего определения может выступать Достаточное количество компонентов (sufficient-component cause), ситуация, при которой каждый из компонентов причины по отдельности не является достаточным для наступления эффекта, но их комбинация приводит к результату. Определение Действие (production) описывает ситуацию, когда причина - это то, что производит эффект (следствие). Причина увеличивает вероятность возникновения результата в соответствии с определением вероятностной причинности (probabilistic cause). Согласно контрфактическому определению
(counterfactuals), наблюдаемый эффект при наличии причины отличается от эффекта, который имел бы место, если бы причина была бы другой или даже отсутствовала.
Чтобы различать причинную и непричинную связь, Austin B. Hill [4] предложил следующие критерии: 1) сила связи, 2) постоянство ассоциации, 3) специфичность, 4) временной характер, 5) биологический градиент, 6) правдоподобие (биологическое правдоподобие), 7) согласованность, 8) эксперимент и 9)аналогия.
Знание того, является ли тот или иной фактор риска причинно-значимым занимает центральное место в разработке лекарственных препаратов, своевременной профилактике и терапии в доказательной медицине; источниками этих знаний служат результаты эпидемиологических исследований. При этом, стандартные наблюдательные исследования имеют ограниченные возможности оценки причинно-следственной связи между воздействием (фактором
риска) и исходом (клиническим состоянием), поскольку смещение оценки [5] и обратная причинно-следственная связь [6] могут привести к систематической ошибке. Это отражено в высказывании: «ассоциация не означает каузации или причинно-следственной связи».
Рандомизированные контролируемые исследования (РКИ) считаются золотым стандартом при проведении медицинских исследований и важны для определения наличия причинно-следственной связи между фактором риска и исходом [7, 8]. Однако иногда проведение РКИ связано с рядом сложностей или просто невыполнимо (например, невозможно провести РКИ для оценки причинно-следственного влияния массы тела при рождении на развитие катаракты, неэтично проводить исследование какого-либо вмешательства с высоким риском развития осложнений). Поэтому, в ряде случаев имеется необходимость в применении других методов установления причинно-следственной связи.
Теоретические основы метода Менделевской рандомизации
Менделевская рандомизация (МР) -это способ исследования, в котором генетический вариант (полиморфизм, SNP) используются в качестве инструментальной переменной для установления и количественной оценки причинно-следственной связи между модифицируемым фактором риска и интересующим исследователя фе-нотипическим признаком (чаще всего, заболеванием). Возможность оценки влияния уровня холестерина крови на риск развития онкологической патологии с помощью генетической информации (носитель-ство «холестерин-снижающего» аллеля гена Аполипротеина Е [APOE\) была предложена Катаном в 1986 году [9]. Автор сделал заключение, что вследствие независимого распределения генов, группа лиц со «снижающим холестерин» аллелем и группа носителей другого аллеля будут однородными, то есть между группами не будет никаких систематических различий, обусловленных вмешивающимися факторами. Сравнение распределения аллелей
APOE у лиц с онкологическими заболеваниями с таковым у здоровых людей позволяет, в таком случае сделать вывод о наличии или об отсутствии причинно-следственной связи между низким уровнем холестерина и риском развития рака. Впервые термин «Менделевская рандомизация» был использован Греем и Уитли [10] и стал известен широкому кругу эпидемиологов после выхода публикации Дж. Дейви Смита и Эбрахима [11].
Метод инструментальных переменных (instrumental variables) как научный подход нашел широкое применение в экономических науках, применяется для решения проблемы эндогенности, в том числе из-за обратной причинно-следственной
связи и корреляции регрессоров со случайной составляющей. Инструментальная переменная или инструмент - это переменная, которая коррелирует c воздействием (предиктором), но не коррелирует с исходом (переменной отклика, рис. 1). Для того, чтобы переменная Z была валидным (допустимым) инструментом, она должна соответствовать следующим критериям:
1) Коррелировать с воздействием X (релевантность, relevance)
2) Влиять на результат только через воздействие (исключающее ограничение, exclusion restriction)
3) Не иметь общей причины с исходом Y (независимость, independence или exchangeability assumption)
Рис. 1. Графическая модель метода инструментальных переменных Fig. 1. Graphical model of the instrumental variable approach
Критерии валидности инструментальной переменной применимые к генетическому варианту в Менделевской рандомизации выглядят следующим образом (рис. 2):
1) К1 на рисунке 2. Значимая корреляция генетического варианта с фактором риска развития исследуемого признака. Благодаря тому, что результаты большинства полногеномных исследований ассоциаций (GWAS) находятся в свободном доступе, поиск таких вариантов не является сложной задачей. Принято использовать генетические варианты, связанные с фактором риска с «полногеномным» уровнем значимости (р <5 x 10 -8).
2) К2 на рисунке 2. Отсутствие корреляции с вмешивающимися факторами ассоциации фактором риска с исследуемым
признаком (рси должна быть = 0, важно отметить, что в данном случае не корреляция, а регрессионный коэффициент, который совпадает с корреляцией только в одномерном случае.
3) КЗ на рисунке 2. Генетический вариант должен оказывать воздействие на исследуемый признак только через фактор риска. Это означает, что частная корреляция между G и Y при фиксированном X равна 0. В этом случае rGY = rGXx rYX, что и отражено в формуле 1.
Проверка соответствия генетического варианта второму и третьему критерию практически невозможна; исследователи вынуждены действовать методом «от обратного», т.е. опровергать несоответствие [12]. Для получения достоверной оценки
причинности ассоциации в случае, если некоторые из генетических вариантов не являются валидным инструментальными пе-
ременными используется ряд анализов чувствительности, разработанных в последнее время [13, 15].
КЗ pGY
Рис. 2. Графическая модель Менделевской рандомизации Fig. 2. Graphical model of Mendelian randomization
Среди основных причин несоответствия генетических инструментов критериям валидности стоит отметить плейотро-пию. Генетические варианты, связанные с развитием нескольких признаков, называются плейотропными и их применение в МР анализе нежелательно из-за несоответствия второму или третьему критерию. Если плейотропия возникает в результате корреляции варианта с каким-либо промежуточным фенотипом, который, в свою очередь влияет на исследуемый признак, то такое явление называется вертикальной плейотропией [16]. В случае вертикальной плейотропии генетический вариант может использоваться как инструментальная переменная. Если влияние полиморфизма на исследуемый признак осуществляется через два или более независимых механизма, то речь идет о горизонтальной плейотропии и такой полиморфизм не соответствует критериям валидности и не может быть использован в качестве инструментальной переменной. Направленная плейотропия возникает в случае смещения оценки эффекта в одном направлении, если же средний плейотропный эффект равен нулю, то такая плейотропия называется сбалансирован-
ной. В последнее время разработан ряд статистических методов, позволяющих провести тест на наличие плейотропии, которые широко используются в качестве анализов чувствительности при проведении Менде-левской рандомизации [17].
Менделевская рандомизация и рандомизированные контролируемые исследования
В МР анализе исследователи делают допущение что распределение аллелей независимо от различных вмешивающихся факторов, т.е. является случайным. Действительно, трудно представить, что уровень дохода или образования человека во взрослом возрасте могут оказывать влияние на то, носителем какого аллеля этот индивид является. Важным исключением является этническая принадлежность: частоты аллелей могут значительно различаться в разных популяциях, приводя к тому, что аллели, ассоциированные с фактором риска, могут быть связаны с различными уровнями вмешивающихся факторов.
При проведении рандомизированных контролируемых исследований, баланс прогностических факторов (известных и неизвестных) при назначении лечения
обеспечивается благодаря независимому распределению пациентов в основную и контрольную группы. Независимое распределение аллелей во время мейоза позволяет
провести аналогию межу рандомизированными контролируемыми исследованиями и МР (рис. з).
Рис. 3. Сравнение Менделевской рандомизации и рандомизированного контролируемого исследования Fig. 3. Mendelian randomization in comparison with randomized controlled study
Количество инструментальных переменных
В ряде ранних публикаций МР анализов исследователи использовали один генетический вариант с изученным биологическим механизмом, объясняющим изменения в факторе риска. Примером может послужить работа научного коллектива, под руководством ИшрБОп [18], в которой исследовалась роль избыточной массы тела в развитии артериальной гипертензии. Авторы использовали единственный полиморфизм ге9939609 гена БТО, ассоциированный с ожирением у детей и взрослых. Действительно, значение этого генетического варианта в развитии ожирения было показано в ранее проведенных исследованиях, кроме того, доля дисперсии индекса массы тела, объясненная этим полиморфизмом, составила по оценкам разных авторов от 0,24 до 1%, что подтверждает правильность выбора инструментальной переменной.
В случае с одной инструментальной переменной, эффект фактора риска на исследуемый признак может быть представлен, как частное эффекта инструмента на исследуемый признак и эффекта инструмента на фактор риска (формула 1).
fe = % (1)
В ряде случаев, исследователи применяют в качестве единственного инструмента индекс полигенного риска (Polygenic risk score; PRS), суммируя количество аллелей, связанных с фактором риска в каждом из генетических вариантов для каждого участника выборки (невзвешенный индекс) или используя степень ассоциации риск-ал-леля как взвешивающий коэффициент (взвешенный индекс риска, формула 2)
[19].
= 2 В/ X Лрау (2) где Bj - это коэффициент регрессии фактора риска на генетический вариант j,
Npa - количество риск-аллелей у варианта ] у участника ь
Другим статистическим методом, используемым при работе с единственным генетическим инструментом, является двух-шаговый метод наименьших квадратов (двухшаговый МНК). На первом шаге оценивается регрессия фактора риска (переменной Х) по инструменту (переменная G, формула 3). В результате получаем предсказанные значения Х.
X = а0 + агС + а2Сорг + ... + а1+1СоР1 + ш (3) На втором шаге оценивается регрессия исследуемого признака (переменная Y, формула 4) по предсказанным значениям Х.
У = е0 + ггХ + £2СОР1 + ... + £(+1С0Р( +( (4) Оценка е± будет состоятельной вследствие экзогенности Х.
Однако, в большинстве случаев, доля дисперсии фенотипа, объясненная одним полиморфизмом мала, приводя к смещению оценки из-за наличия «слабых» инструментов [20]. Тест на слабые инструменты соответствует значению F-статистики первого шага 2МНК, так при значении F-статистики больше 10 делается вывод о релевантности инструмента. Чтобы избежать смещения оценки при слабости инструмента были разработаны статистические методы, позволяющие использовать несколько (или много) полиморфизмов, увеличивая как долю дисперсии фактора риска, объясненного генетическими вариантами, так и мощность исследования. При использовании множества инструментов, сначала оценивается индивидуальный эффект каждого из них, затем проводится ме-таанализ этих оценок эффекта (Р%у , формула 1) с использованием метода взвешенных значений обратной дисперсии. Взвешивающим коэффициентом служит обратная дисперсия ассоциации SNP - исход В настоящее время насчитывается не
менее 47 статистических методов, используемых при проведении МР анализа, каждый из которых имеет свои особенности и области применения [21].
МР на одной или на двух выборках
Менделевскую рандомизацию может быть проведена с использованием одной или двух выборок. В первом случае, инструменты выбираются на основании ранее проведенных полногеномных анализов ассоциации, а степень корреляции этих полиморфизмов с фактором риска и ассоциация фактора риска с исходом определяется на одной выборке. Для этого типа исследования необходим доступ к индивидуальной гено- и фенотипической информации каждого участника выборки, кроме этого, для достижения необходимой статистической мощности исследования необходимо проводить МР анализ на достаточно большой выборке. Если для оценки корреляции инструмента с фактором риска используется одна выборка, а для оценки корреляции с исследуемым признаком другая, то речь идет о МР на двух выборках. Сначала отбираются полиморфизмы, значимо ассоциированные с фактором риска по результатам полногеномного исследования ассоциаций, когда в качестве источника данных служит сводная статистика GWAS или метаанали-зов полногеномных исследований, проведенных на больших выборках. Критериями отбора обычно служат уровень значимости ассоциации не выше 5 х 10-8, частота минорного аллеля не ниже 5%, значения коэффициента корреляции г2 Пирсона для неравновесия по сцеплению не выше 0,05. Далее, необходимо получить регрессионные коэффициенты, полученные для отобранных SNP в сводной статистике полногеномного исследования ассоциаций исхода (рис. 4). В этом случае уровень значимости ассоциации полиморфизма с исследуемым признаком не является критерием, влияющим на проведение анализа.
Менделевская рандомизация
Выборка 1 ßXY = ßGY/ßGX
SNP - фактор риска
Регрессионные коэффициенты
ßGX
Выборка 2 SNP - исследуемый признак Регрессионные коэффициенты ßGY
Рис. 4. Менделевская рандомизация на двух выборках Fig. 4. Two-sample Mendelian randomization
Проведение МР на двух выборках позволяет проверять значительно большее количество гипотез, чем одновыборочная МР. Среди источников сводных данных полногеномных исследований, пожалуй, основным является GWAS Catalog [22] (https://www.ebi.ac.uk/gwas/summary-statistics), содержащий по состоянию на 30 сентября 2022 года информацию о 6004 публикациях и 423182 ассоциациях. Другим важным ресурсом является проект Университета Бристоля IEU open GWAS project (https://gwas-api.mrcieu.ac.uk/), с интегрированной возможностью провести МР анализ в онлайн-режиме [23,24].
Однако, следует помнить, что обе выборки должны быть схожими по этнической принадлежности вследствие наличия этнических особенностей в распределении частот аллелей полиморфных маркеров.
Среди основных программных средств для проведения Менделевской рандомизации на двух выборках стоит отметить библиотеки TwoSampleMR и Mendeli-anRandomization в среде R. Данные библиотеки также позволяют пользователю провести ряд анализов чувствительности и визуализировать полученные результаты. В среде Stata используются библиотеки ivo-nesamplemr, ivreg2. Для МР анализа на одной выборке применяются библиотеки ivmodel, ivtools и AER в среде R и mrrobust в среде Stata
Нелинейная Менделевская рандомизация
Оценка эффекта при проведении Мен-делевской рандомизации может быть мало-
информативной в случае нелинейной модели взаимосвязи между исходом и фактором риска. С помощью данного метода можно оценить варьируется ли эффект воздействия на оцениваемый признак в зависимости от уровней воздействия, т.е. является ли эффект дозозависимым. Для проведения нелинейной МР был предложен ряд методов, включая полиномиальный (fractional polynomial) и кусочно-линейный (peacewise linear) регрессионный анализ [25].
Нелинейная МР применялась для исследования линейности взаимосвязи антропометрических признаков и ряда заболеваний на выборке Британского биобанка [26]. Результаты этого интересной работы свидетельствуют, что в подавляющем большинстве (84%) случаев, оцениваемая корреляция была нелинейной. Aravantis и соавторы [27] провели оценку ассоциации диастоли-ческого артериального давления с сердечно-сосудистыми заболеваниями. В отличие от результатов обсервационных исследований, свидетельствующих о наличии J- образной ассоциации, данный МР анализ не подтвердил гипотезу о наличии нелинейной ассоциации. Среди других примеров применения нелинейной МР стоит отметить два исследования, проведенных в Британском биобанке. Это изучение причинно-значимой ассоциации индекса массы тела со смертностью [28], а также оценка роли дефицита витамина Д в развитии сердечнососудистых заболеваний [29]. Результаты этих работ позволяют сделать вывод о нелинейном характере ассоциации фактора риска с исходом в обоих случаях.
Многофакторная Менделевская рандомизация
Это вид МР анализа, в котором оценивается влияние нескольких факторов риска на исход, и в качестве инструментов используются генетические варианты, ассоциированные с этими факторами риска. Критерии валидности инструментальной переменной в таком случае выглядят, как: корреляция инструмента с каждым из воздействий, влияние на исход только через воздействия и отсутствие общей причины с исходом. Многофакторная МР может быть проведена на одной или на двух выборках [30] и особенно актуальна в случаях наличия двух или более коррелированных факторов риска для установления причинно-значимой роли каждого из этих факторов. Примером подобных факторов риска являются липиды плазмы крови, с ярко выраженной плейотропией генетических вариантов, ассоциированных сразу с несколькими фракциями липидов. В работе Richardson и соавторов [31] оценивалось влияние липидов плазмы крови на ишемиче-скую болезнь сердца. Исследователи получили доказательства того, аполипопротеин В является ведущим фактором ассоциации липидов с ИБС. В другом исследовании изучалась связь липидов с повышенным риском развития рака молочной железы [32]. Было показано, что генетически детерминированные повышенные уровни ЛПВП и ЛПНП связаны с более высоким риском заболевания.
Двунаправленная Менделевская рандомизация
При проведении двунаправленного (bidirectional) МР анализа исследование проходит в два этапа. На первом этапе оценивается эффект фактора риска на исход, на втором этапе они «меняются местами», т.е. фактор риска становится исследуемым признаком, позволяя установить направление причинно-следственной связи с использованием генетических вариантов, значимо связанных с каждым признаком по результатам полногеномных исследований ассоциаций. Например, при объяснении наблюдаемой взаимосвязи между образованием и
близорукостью может быть неясно, является ли более высокий уровень образования причиной или же нарушение зрения оказывает влияние на получаемое образование. Двунаправленная МР, проведенная в 2018 году, помогла ответить на этот вопрос, установив причинно-значимую роль образования на развитие миопической рефракции [33]. В другом исследовании изучалось что является причиной, а что следствием в ассоциации нарушений сна с психиатрическими заболеваниями [34]. Полученные результаты свидетельствуют о повышенном риске развития психических расстройств при серьезных нарушениях сна и о возможности использовать маркеры сна в диагностике синдрома дефицита внимания с гиперактивностью и депрессии.
МР «свободная от гипотез»
Чаще всего МР применяется для тестирования гипотез о наличии причинно-следственной связи, однако, в ряде случаев интерес исследователя лежит в плоскости идентификации новых ассоциаций. Существуют примеры, когда эта стратегия показала многообещающие результаты в обнаружении предполагаемых причинно-следственных связей между фенотипами. В недавней работе Zheng и соавторов [35] изучалось влияние человеческого протеома на риск развития различных заболеваний. В результате было идентифицировано 111 причинно-значимых ассоциации между 62 протеинами и 52 фенотипами. Это исследование подчеркнуло возможности применения МР «свободной от гипотез» в получении более широкой картины взаимодействия фенотипов в отличие от традиционного подхода МР, когда оценивается эффект одного фактора риска на один исход. В другом исследовании, проведённом в 2022 году [36] было установлено, что более ранний возраст наступления менопаузы связан с рядом заболеваний. Среди основных недостатков данного метода можно отметить необходимость поправки на множественную проверку гипотез и сложность в интерпретации результатов вследствие наличия плейотропии [37].
Когда можно провести Менделев-скую рандомизацию
МР анализ рекомендуется применять в случаях, когда проведение клинических исследований затруднено или невозможно по разным причинам. Например, проведение рандомизированного исследования, оценивающего эффект приема алкоголя на риск развития того-или иного заболевания. Прием алкоголя связан со значительным числом негативных последствий для организма от заболеваний печени до развития онкопатологии, поэтому невозможно преднамеренно подвергать подобному риску людей в экспериментальной группе.
Также, МР анализ применяется в случае исследования заболеваний, возникающих во взрослом возрасте с точки зрения оценки влияния факторов риска, оказавших воздействие на индивида в детстве. В работе, опубликованной в 2020 году, Richardson и соавторы [38] использовали полиморфизмы генов, ассоциированные с избыточной массой тела детей чтобы оценить зависимость риска развития ряда заболеваний (ишемическая болезнь сердца, диабет 2 типа, рак молочной железы и рак предстательной железы) от антропометрических показателей в детском возрасте. В исследовании показано, что повышенный риск развития ишемической болезни сердца и диабета 2 типа у лиц, страдавших ожирением в детстве, значимо снижается при снижении массы тела во взрослом возрасте.
МР анализ может применяться для оценки экономического эффекта профилактики модифицируемых факторов риска на здравоохранение. Интересное примером было служит исследование, проведённое коллективом под руководством Dixon [25, 39], в котором авторы показали перспективы применения МР для оценки влияния избыточной массы тела на госпитальные расходы.
Перспективным является применение МР для валидации мишеней лекарственных препаратов (цис-Менделевская рандомизация) [40, 41], когда в качестве инструментальных переменных используются поли-
морфизмы генов, кодирующих белки-мишени того или иного лекарственного средства.
Пример применения и интерпретации результатов МР анализа
В работе Han и соавторов [42] метод Менделевской рандомизации на двух выборках применялся для оценки влияние С-реактивного белка на риск развития возрастной макулярной дегенерации (ВМД). Исследователи провели полногеномное исследование ассоциаций концентрации С-реактивного белка в плазме крови на выборке из 418642 участников Британского биобанка. В результате было идентифицировано 526 полиморфных вариантов, которые объясняли 13% дисперсии С-реактивного белка, и эти варианты были далее использованы в качестве генетических инструментов. Следующим этапом было проведение полногеномного исследования ассоциаций возрастной макулярной дегенерации на выборке из 27301 участников международного консорциума по изучению генетики ВМД. Полученные результаты анализа ассоциации (регрессионные коэффициенты) 526 вышеупомянутых полиморфных вариантов с риском развития различных форм ВМД использовались для проведения МР анализа. Было показано наличие значимой связи уровня С-реактивного белка с повышенным риском развития различных форм ВМД (ОШ от 1,15 до 1,52, p <0,05). Данное исследование, проведённое с применением генетической информации, предоставило убедительные доказательства того, что более высокие уровни циркулирующего СРБ ассоциированы к повышенным риском развития всех форм ВМД, что может говорить о причинно-значимой роли воспалительных процессов в патогенезе ВМД.
Заключение. В заключение, следует отметить, что Менделевская рандомизация является удобным инструментом в руках эпидемиолога, позволяющим в короткие сроки определить наличие причинно-следственной связи. Появление большого количества информации о генетических вариантах в эру полногеномных ассоциативных
исследований значительно упрощает проведение МР анализа. Важно помнить, что в данном анализе оценивается влияние фактора риска «на протяжении всей жизни», а не срезовый, «одномоментный» эффект. Также, получение достоверных результатов МР-исследования зависит от выполнения ряда условий, таких как выбор валидных инструментальных переменных, проведение анализов чувствительности, оценки статистической мощности теста.
Информация о финансировании
Финансирование данной работы не проводилось.
Financial support
No financial support has been providedfor this work.
Конфликт интересов
Авторы заявляют об отсутствии конфликта интересов. Conflict of interests
The author has no conflict of interest to declare.
Список литературы
1. Котеров АН. Критерии причинности в медико-биологических дисциплинах: история, сущность и радиационный аспект. Сообщение 1. Постановка проблемы, понятие о причинах и причинности, ложные ассоциации. Радиационная биология Радиоэкология. 2019;59(1):5-36. DOI: https://doi.org/10.1134/S0869803119010065
2. Rothman KJ, Greenland S. Causation and Causal Inference in Epidemiology. American Journal of Public Health. 2005;95(S1):S144-S150. DOI: https://doi.org/ 10.2105/AJPH.2004.059204
3. Parascandola M. Causation in epidemiology. Journal of Epidemiology and Community Health. 2001;55(12):905-912. DOI: https://doi.org/ 10.1136/jech.55.12.905
4. Fedak KM, Bernal A, Capshaw ZA, et al. Applying the Bradford Hill criteria in the 21st century: how data integration has changed causal inference in molecular epidemiology. Emerging Themes in Epidemiology. 2015;12(1): 14. DOI: https://doi.org/10.1186/s12982-015-0037-4
5. Grimes DA, Schulz KF. Bias and causal associations in observational research. The Lancet. 2002;359(9302):248-252. DOI: https://doi.org/10.1016/S0140-6736(02)07451-2
6. Hammerton G, Munafo MR. Causal inference with observational data: the need for triangulation of evidence. Psychological Medicine. 2021;51(4):563-578. DOI: https://doi.org/10.1017/S0033291720005127
7. Evans DM, Davey Smith G. Mendelian Randomization: New Applications in the Coming Age of Hypothesis-Free Causality. Annual Review of Genomics and Human Genetics. 2015;16(1):327-350. DOI: https://doi.org/10.1146/annurev-genom-090314-050016
8. Klungel OH, Martens EP, Psaty BM, et al. Methods to assess intended effects of drug treatment in observational studies are reviewed. Journal of Clinical Epidemiology. 2004;57(12):1223-1231. DOI:
https://doi.org/10.1016/jjclinepi.2004.03.011
9. Katan MB. Apoupoprotein e isoforms, serum cholesterol, and cancer. The Lancet. 1986;327(8479):507-508. DOI: https://doi.org/10.1016/S0140-6736(86)92972-7
10. Gray R Wheatley K. How to avoid bias when comparing bone marrow transplantation with chemotherapy. Bone Marrow Transplantation. 1991;7(3):9-12.
11. Davey Smith G, Ebrahim S. 'Mendelian randomization': can genetic epidemiology contribute to understanding environmental determinants of disease? International Journal of Epidemiology. 2003;32(1): 1-22. DOI: https://doi.org/10.1093/ije/dyg070
12. Sanderson E, Glymour MM, Holmes MV, et al. Mendelian randomization. Nature Reviews Methods Primers. 2022;2(1):6. DOI: https://doi.org/10.1038/s43586-021-00092-5
13. Bowden J, Davey Smith G, Burgess S. Mendelian randomization with invalid instruments: effect estimation and bias detection through Egger regression. International Journal of Epidemiology. 2015;44(2):512-525. DOI: https://doi.org/ 10.1093/ij e/dyv080
14. Hartwig FP, Davey Smith G, Bowden J. Robust inference in summary data Mendelian randomization via the zero modal pleiotropy assumption. International Journal of Epidemiology. 2017;46(6): 1985-1998. DOI: https://doi.org/ 10.1093/ij e/dyx102
15. Verbanck M, Chen CY, Neale B, et al. Detection of widespread horizontal pleiotropy in causal relationships inferred from Mendelian randomization between complex traits and diseases. Nature Genetics. 2018;50(5):693-698. DOI: https://doi.org/10.1038/s41588-018-0099-7
16. Tyler AL, Asselbergs FW, Williams SM, et al. Shadows of complexity: what biological networks reveal about epistasis and pleiotropy. BioEssays. 2009;31(2):220-227. DOI: https://doi.org/10.1002/bies.200800022
17. Hemani G, Bowden J, Davey Smith G. Evaluating the potential role of pleiotropy in Mendelian randomization studies. Human Molecular Genetics. 2018;27(R2):R195-R208. DOI: https://doi.org/ 10.1093/hmg/ddy 163
18. Timpson NJ, Harbord R, Davey Smith G, et al. Does Greater Adiposity Increase Blood Pressure and Hypertension Risk?: Mendelian Randomization Using the FTO/MC4R Genotype. Hypertension. 2009;54(1):84-90. DOI: https://doi.org/10.1161/HYPERTEN-SI0NAHA.109.130005
19. The International Schizophrenia Consortium. Common polygenic variation contributes to risk of schizophrenia and bipolar disorder. Nature. 2009;460(7256):748-752. DOI: https://doi.org/10.1038/nature08185
20. Bound J, Jaeger DA, Baker RM. Problems with Instrumental Variables Estimation When the Correlation Between the Instruments and the Endogeneous Explanatory Variable is Weak. Journal of the American Statistical Association. 1995;90(430):443. DOI: https://doi.org/10.2307/2291055
21. Boehm FJ, Zhou X. Statistical methods for Mendelian randomization in genome-wide association studies: A review. Computational and Structural Biotechnology Journal. 2022;20:2338-2351. DOI: https://doi.org/10.1016/j.csbj.2022.05.015
22. Buniello A, MacArthur JAL, Cerezo M, et al. The NHGRI-EBI GWAS Catalog of published genome-wide association studies, targeted arrays and summary statistics 2019. Nucleic Acids Research. 2019;47(D1):D1005-D1012. DOI: https://doi.org/10.1093/nar/gky1120
23. Hemani G, Zheng J, Elsworth B, et al. The MR-Base platform supports systematic causal inference across the human phenome. eLife. 2018;7:e34408. DOI: https://doi.org/10.7554/eLife.34408
24. Elsworth B, Lyon M, Alexander T, et al. The MRC IEU OpenGWAS Data Infrastructure. BioRxiv. 2020. DOI: https://doi.org/10.1101/2020.08.10.244293
25. Staley JR, Burgess S. Semiparametric methods for estimation of a nonlinear exposure-outcome relationship using instrumental variables
with application to Mendelian randomization. Genetic Epidemiology. 2017;41(4):341-352. DOI: https://doi.org/10.1002/gepi.22041
26. Sulc J, Sjaarda J, Kutalik Z. Polynomial Mendelian randomization reveals non-linear causal effects for obesity-related traits. Human Genetics and Genomics Advances. 2022;3(3): 100124. DOI: https://doi.org/10.1016/jxhgg.2022.100124
27. Arvanitis M, Qi G, Bhatt DL, et al. Linear and Nonlinear Mendelian Randomization Analyses of the Association Between Diastolic Blood Pressure and Cardiovascular Events: The J-Curve Revisited. Circulation. 2021;143(9):895-906. DOI: https://doi.org/10.1161/CIRCULA-TI0NAHA.120.049819
28. Sun YQ, Burgess S, Staley JR, et al. Body mass index and all cause mortality in HUNT and UK Biobank studies: linear and non-linear mendelian randomisation analyses. BMJ. 2019;364. DOI: https://doi.org/10.1136/bmj.l1042
29. Zhou A, Selvanayagam JB, Hyppönen E. Non-linear Mendelian randomization analyses support a role for vitamin D deficiency in cardiovascular disease risk. European Heart Journal. 2022;43(18): 1731-1739. DOI: https://doi.org/ 10.1093/eurheartj/ehab809
30. Sanderson E, Davey Smith G, Wind-meijer F, et al. An examination of multivariable Mendelian randomization in the single-sample and two-sample summary data settings. International Journal of Epidemiology. 2019;48(3):713-727. DOI: https://doi.org/10.1093/ije/dyy262
31. Richardson TG, Sanderson E, Palmer TM, et al. Evaluating the relationship between circulating lipoprotein lipids and apolipoproteins with risk of coronary heart disease: A multivariable Mendelian randomisation analysis. PLoS Medicine. 2020;17(3):e1003062. DOI: https://doi.org/10.1371/journal.pmed.1003062
32. Johnson KE, Siewert KM, Klarin D, et al. The relationship between circulating lipids and breast cancer risk: A Mendelian randomization study. PLoS Medicine. 2020;17(9):e1003302. DOI: https://doi.org/10.1371/jour-nal.pmed.1003302
33. Mountjoy E, Davies NM, Plotnikov D, et al. Education and myopia: assessing the direction of causality by mendelian randomisation. BMJ. 2018;361:k2022. DOI: https://doi.org/10.1136/bmj.k2022
34. Sun X, Liu B, Liu S, et al. Sleep disturbance and psychiatric disorders: a bidirectional Mendelian randomisation study. Epidemiology and
Psychiatric Sciences. 2022;31:e26. DOI: https://doi.org/10.1017/S2045796021000810
35. Zheng J, Haberland V, Baird D, et al. Phenome-wide Mendelian randomization mapping the influence of the plasma proteome on complex diseases. Nature Genetics. 2020;52(10):1122-1131. DOI: https://doi.org/10.1038/s41588-020-0682-6
36. Magnus MC, Borges MC, Fraser A, et al. Identifying potential causal effects of age at menopause: a Mendelian randomization phenome-wide association study. European Journal of Epidemiology. 2022;37(9):971-982. DOI: https://doi.org/10.1007/s10654-022-00903-3
37. Zheng J, Baird D, Borges MC, et al. Recent Developments in Mendelian Randomization Studies. Current Epidemiology Reports. 2017;4(4):330-345. DOI: https://doi.org/10.1007/s40471-017-0128-6
38. Richardson TG, Sanderson E, Els-worth B, et al. Use of genetic variation to separate the effects of early and later life adiposity on disease risk: mendelian randomisation study. BMJ. 2020;369:m1203. DOI: https://doi.org/ 10.1136/bmj.m1203
39. Dixon P, Davey Smith G, von Hinke S, et al. Estimating Marginal Healthcare Costs Using Genetic Variants as Instrumental Variables: Mendelian Randomization in Economic Evaluation. PharmacoEconomics. 2016;34(11): 10751086. DOI: https://doi.org/10.1007/s40273-016-0432-x
40. Sonehara K, Okada Y. Genomics-driven drug discovery based on disease-susceptibility genes. Inflammation and Regeneration. 2021;41(1):8. DOI: https://doi.org/10.1186/s41232-021-00158-7
41. Schmidt AF, Finan C, Gordillo-Mara-non M, et al. Genetic drug target validation using Mendelian randomisation. Nature Communications. 2020;11(1):3255. DOI: https://doi.org/10.1038/s41467-020-16969-0
42. Han X, Ong JS, An J, et al. Using Mendelian randomization to evaluate the causal relationship between serum C-reactive protein levels and age-related macular degeneration. European Journal of Epidemiology. 2020;35(2):139-146. DOI: https://doi.org/10.1007/s10654-019-00598-z
References
1. Koterov AN. Causal Criteria in Medical and Biological Disciplines: History, Essenceand Radiation Aspect. Report 1. Problem Statement,
Conceptionof Causes and Causation, False Associations. Radiation biology. Radioecology. 2019;59(1):5-36. DOI:
https://doi.org/10.1134/S0869803119010065
2. Rothman KJ, Greenland S. Causation and Causal Inference in Epidemiology. American Journal of Public Health. 2005;95(S1):S144-S150. DOI: https://doi.org/ 10.2105/AJPH.2004.059204
3. Parascandola M. Causation in epidemiology. Journal of Epidemiology and Community Health. 2001;55(12):905-912. DOI: https://doi.org/ 10.1136/jech.55.12.905
4. Fedak KM, Bernal A, Capshaw ZA, et al. Applying the Bradford Hill criteria in the 21st century: how data integration has changed causal inference in molecular epidemiology. Emerging Themes in Epidemiology. 2015;12(1): 14. DOI: https://doi.org/10.1186/s12982-015-0037-4
5. Grimes DA, Schulz KF. Bias and causal associations in observational research. The Lancet. 2002;359(9302):248-252. DOI: https://doi.org/10.1016/S0140-6736(02)07451-2
6. Hammerton G, Munafo MR. Causal inference with observational data: the need for triangulation of evidence. Psychological Medicine. 2021;51(4):563-578. DOI: https://doi.org/10.1017/S0033291720005127
7. Evans DM, Davey Smith G. Mendelian Randomization: New Applications in the Coming Age of Hypothesis-Free Causality. Annual Review of Genomics and Human Genetics. 2015;16(1):327-350. DOI: https://doi.org/10.1146/annurev-genom-090314-050016
8. Klungel OH, Martens EP, Psaty BM, et al. Methods to assess intended effects of drug treatment in observational studies are reviewed. Journal of Clinical Epidemiology. 2004;57(12):1223-1231. DOI:
https://doi.org/10.1016/jjclinepi.2004.03.011
9. Katan MB. Apoupoprotein e isoforms, serum cholesterol, and cancer. The Lancet. 1986;327(8479):507-508. DOI: https://doi.org/10.1016/S0140-6736(86)92972-7
10. Gray R Wheatley K. How to avoid bias when comparing bone marrow transplantation with chemotherapy. Bone Marrow Transplantation. 1991;7(3):9-12.
11. Davey Smith G, Ebrahim S. 'Mendelian randomization': can genetic epidemiology contribute to understanding environmental determinants of disease? International Journal of Epidemiology. 2003;32(1): 1-22. DOI: https://doi.org/10.1093/ije/dyg070
12. Sanderson E, Glymour MM, Holmes MV, et al. Mendelian randomization. Nature Reviews Methods Primers. 2022;2(1):6. DOI: https://doi.org/10.1038/s43586-021-00092-5
13. Bowden J, Davey Smith G, Burgess S. Mendelian randomization with invalid instruments: effect estimation and bias detection through Egger regression. International Journal of Epidemiology. 2015;44(2):512-525. DOI: https://doi.org/10.1093/ije/dyv080
14. Hartwig FP, Davey Smith G, Bowden J. Robust inference in summary data Mendelian randomization via the zero modal pleiotropy assumption. International Journal of Epidemiology. 2017;46(6): 1985-1998. DOI: https: //doi .org/10.1093/ij e/dyx102
15. Verbanck M, Chen CY, Neale B, et al. Detection of widespread horizontal pleiotropy in causal relationships inferred from Mendelian randomization between complex traits and diseases. Nature Genetics. 2018;50(5):693-698. DOI: https://doi.org/10.1038/s41588-018-0099-7
16. Tyler AL, Asselbergs FW, Williams SM, et al. Shadows of complexity: what biological networks reveal about epistasis and pleiotropy. BioEssays. 2009;31(2):220-227. DOI: https://doi.org/10.1002/bies.200800022
17. Hemani G, Bowden J, Davey Smith G. Evaluating the potential role of pleiotropy in Men-delian randomization studies. Human Molecular Genetics. 2018;27(R2):R195-R208. DOI: https ://doi.org/ 10.1093/hmg/ddy 163
18. Timpson NJ, Harbord R, Davey Smith G, et al. Does Greater Adiposity Increase Blood Pressure and Hypertension Risk?: Mendelian Randomization Using the FTO/MC4R Genotype. Hypertension. 2009;54(1):84-90. DOI: https://doi.org/10.1161/HYPERTEN-SIONAHA.109.130005
19. The International Schizophrenia Consortium. Common polygenic variation contributes to risk of schizophrenia and bipolar disorder. Nature. 2009;460(7256):748-752. DOI: https://doi.org/10.1038/nature08185
20. Bound J, Jaeger DA, Baker RM. Problems with Instrumental Variables Estimation When the Correlation Between the Instruments and the Endogeneous Explanatory Variable is Weak. Journal of the American Statistical Association. 1995;90(430):443. DOI: https://doi.org/10.2307/2291055
21. Boehm FJ, Zhou X. Statistical methods for Mendelian randomization in genome-wide association studies: A review. Computational and
Structural Biotechnology Journal. 2022;20:2338-2351. DOI:
https://doi.org/10.1016/j.csbj.2022.05.015
22. Buniello A, MacArthur JAL, Cerezo M, et al. The NHGRI-EBI GWAS Catalog of published genome-wide association studies, targeted arrays and summary statistics 2019. Nucleic Acids Research. 2019;47(D1):D1005-D1012. DOI: https://doi.org/ 10.1093/nar/gky 1120
23. Hemani G, Zheng J, Elsworth B, et al. The MR-Base platform supports systematic causal inference across the human phenome. eLife. 2018;7:e34408. DOI: https://doi.org/10.7554/eLife.34408
24. Elsworth B, Lyon M, Alexander T, et al. The MRCIEU OpenGWAS Data Infrastructure. BioRxiv. 2020. DOI: https://doi.org/10.1101/2020.08.10.244293
25. Staley JR, Burgess S. Semiparametric methods for estimation of a nonlinear exposure-outcome relationship using instrumental variables with application to Mendelian randomization. Genetic Epidemiology. 2017;41(4):341-352. DOI: https://doi.org/10.1002/gepi.22041
26. Sulc J, Sjaarda J, Kutalik Z. Polynomial Mendelian randomization reveals non-linear causal effects for obesity-related traits. Human Genetics and Genomics Advances. 2022;3(3):100124. DOI: https://doi.org/10.1016/j.xhgg.2022.100124
27. Arvanitis M, Qi G, Bhatt DL, et al. Linear and Nonlinear Mendelian Randomization Analyses of the Association Between Diastolic Blood Pressure and Cardiovascular Events: The J-Curve Revisited. Circulation. 2021;143(9):895-906. DOI: https://doi.org/10.1161/CIRCULA-TIONAHA.120.049819
28. Sun YQ, Burgess S, Staley JR, et al. Body mass index and all cause mortality in HUNT and UK Biobank studies: linear and non-linear mendelian randomisation analyses. BMJ. 2019;364. DOI: https://doi.org/10.1136/bmj.l1042
29. Zhou A, Selvanayagam JB, Hyppönen E. Non-linear Mendelian randomization analyses support a role for vitamin D deficiency in cardiovascular disease risk. European Heart Journal. 2022;43(18): 1731-1739. DOI: https://doi.org/10.1093/eurheartj/ehab809
30. Sanderson E, Davey Smith G, Wind-meijer F, et al. An examination of multivariable Mendelian randomization in the single-sample and two-sample summary data settings. International Journal of Epidemiology. 2019;48(3):713-727. DOI: https://doi.org/10.1093/ije/dyy262
31. Richardson TG, Sanderson E, Palmer TM, et al. Evaluating the relationship between circulating lipoprotein lipids and apolipoproteins with risk of coronary heart disease: A multivariable Mendelian randomisation analysis. PLoS Medicine. 2020;17(3):e1003062. DOI: https://doi.org/10.1371/j ournal.pmed.1003062
32. Johnson KE, Siewert KM, Klarin D, et al. The relationship between circulating lipids and breast cancer risk: A Mendelian randomization study. PLoS Medicine. 2020;17(9):e1003302. DOI: https://doi.org/10.1371/jour-nal.pmed.1003302
33. Mountjoy E, Davies NM, Plotnikov D, et al. Education and myopia: assessing the direction of causality by mendelian randomisation. BMJ. 2018;361:k2022. DOI: https://doi.org/10.1136/bmj.k2022
34. Sun X, Liu B, Liu S, et al. Sleep disturbance and psychiatric disorders: a bidirectional Mendelian randomisation study. Epidemiology and Psychiatric Sciences. 2022;31:e26. DOI: https://doi.org/10.1017/S2045796021000810
35. Zheng J, Haberland V, Baird D, et al. Phenome-wide Mendelian randomization mapping the influence of the plasma proteome on complex diseases. Nature Genetics. 2020;52(10):1122-1131. DOI: https://doi.org/10.1038/s41588-020-0682-6
36. Magnus MC, Borges MC, Fraser A, et al. Identifying potential causal effects of age at menopause: a Mendelian randomization phenome-wide association study. European Journal of Epidemiology. 2022;37(9):971-982. DOI: https://doi.org/10.1007/s10654-022-00903-3
37. Zheng J, Baird D, Borges MC, et al. Recent Developments in Mendelian Randomization Studies. Current Epidemiology Reports. 2017;4(4):330-345. DOI: https://doi.org/10.1007/s40471-017-0128-6
38. Richardson TG, Sanderson E, Elsworth B, et al. Use of genetic variation to separate the effects of early and later life adiposity on disease risk: mendelian randomisation study. BMJ. 2020;369:m1203. DOI: https://doi.org/ 10.1136/bmj.m1203
39. Dixon P, Davey Smith G, von Hinke S, et al. Estimating Marginal Healthcare Costs Using Genetic Variants as Instrumental Variables: Mendelian Randomization in Economic Evaluation. PharmacoEconomics. 2016;34(11): 10751086. DOI: https://doi.org/10.1007/s40273-016-0432-x
40. Sonehara K, Okada Y. Genomics-driven drug discovery based on disease-susceptibility genes. Inflammation and Regeneration. 2021;41(1):8. DOI: https://doi.org/10.1186/s41232-021-00158-7
41. Schmidt AF, Finan C, Gordillo-Mara-non M, et al. Genetic drug target validation using Mendelian randomisation. Nature Communications. 2020; 11(1):3255. DOI: https://doi.org/10.1038/s41467-020-16969-0
42. Han X, Ong JS, An J, et al. Using Mendelian randomization to evaluate the causal relationship between serum C-reactive protein levels and age-related macular degeneration. European Journal of Epidemiology. 2020;35(2):139-146. DOI: https://doi.org/10.1007/s10654-019-00598-z
Статья поступила в редакцию 28 ноября 2022 г. Поступила после доработки 3 января 2023 г. Принята к печати 30 января 2023 г.
Received 28 November 2022 Revised 3 January 2023 Accepted 30 January 2023
Информация об авторе
Денис Юрьевич Плотников, PhD, заведующий лабораторией интегративной эпидемиологии ФГБОУ ВО «Казанский государственный медицинский университет», г. Казань, Российская Федерация, E-mail: [email protected], ORCID: https://orcid.org/0000-0002-9950-8992.
Information about the author
Denis Y. Plotnikov, PhD, Head of Integrative Epidemiology Laboratory, Kazan State Medical University, Kazan, Russia, E-mail: [email protected], ORCID: https://or-cid.org/0000-0002-9950-8992.