Научная статья на тему 'Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях'

Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях Текст научной статьи по специальности «Фундаментальная медицина»

CC BY
595
118
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОЛИМОРФИЗМ / POLYMORPHISM / АССОЦИАЦИИ / ASSOCIATIONS / РЕГУЛЯТОРНЫЙ ПОТЕНЦИАЛ / REGULATORY POTENTIAL / ESNP / NSSNP / TAGSNP

Аннотация научной статьи по фундаментальной медицине, автор научной работы — Пономаренко Ирина Васильевна

Актуальность. Изучение роли наследственных факторов в формировании многофакторных признаков является актуальным, а применительно к мультифакториальным заболеваниям эти исследования имеют важное значение для медицины. При планировании генетико-эпидемиологических исследований мультифакториальных признаков (заболеваний) важное значение имеет отбор полиморфных локусов для поиска ассоциаций с исследуемым фенотипом (заболеванием). Цель исследования. Провести систематический анализ данных, имеющихся в современной литературе, о подходах к отбору полиморфных локусов при проведении ассоциативных исследований. Материалы и методы. В обзор включены современные данные зарубежных и отечественных статей, найденные в Pubmed по данной теме. Результаты. Согласно современным представлениям при отборе полиморфных локусов генов-кандидатов для изучения ассоциаций с мультифакториальным признаком (заболеванием) следует учитывать следующие критерии: 1) наличие ассоциации с исследуемым признаком по результатам ранее проведенных полногеномных (GWAS) и/или ассоциативных (в том числе репликативных) исследований; 2) наличие ассоциации с фенотипами, имеющими с исследуемым признаком, общие биологические пути; 3) регуляторный потенциал (regSNP); 4) влияние на экспрессию генов (eSNP); 5) связь с несинонимическими заменами (nsSNP); 6) tagger SNP (tagSNP) 7) частота полиморфизма не менее 5% 8) функциональные эффекты (regSNP, eSNP, nsSNP) SNPs, находящихся в неравновесии по сцеплению (r2>0.8) с отобранными для ассоциативного анализа полиморфизмами. В работе приведена характеристика современных мировых баз данных по функциональной геномике и биоинформатических методов анализа, используемых для in silico анализа регуляторного и eQTL значения SNPs, оценки их блочной структуры (SIFT, PolyPhen-2, HaploReg, rSNPs MAPPER, RegulomeDB, rSNPBase, SNP FuncPred, Blood eQTL browser, GTExportal, HaploView, LD TAG SNP Selection). Заключение. При отборе полиморфных локусов для ассоциативных исследований следует учитывать их ассоциации с исследуемым признаком по данным ранее проведенных исследований, регуляторный потенциал и влияние на экспрессию генов, nsSNP и tagSNP, популяционную частоту не менее 5%, функциональные эффекты сильно сцепленных с ними SNPs.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по фундаментальной медицине , автор научной работы — Пономаренко Ирина Васильевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SELECTION OF POLYMORPHIC LOCI FOR ASSOCIATION ANALYSIS IN GENETIC-EPIDEMIOLOGICAL STUDIES

Background. The study of the role of hereditary factors in the formation of multifactorial signs is relevant, and in relation to multifactorial diseases, these studies are important for medicine. When planning genetic and epidemiological studies of multifactorial signs (diseases), it is important to select polymorphic loci to find associations with the studied phenotype (disease). The aim of the study. To carry out a systematic analysis of the data available in the modern literature on the approaches to the selection of polymorphic loci in the course of associative studies. Materials and methods. The review includes the current data of foreign and domestic articles on this topic found in Pubmed. Results. According to modern concepts, the selection of polymorphic loci of candidate genes to explore associations with a multifactorial trait (disease) requires the following criteria: 1) the presence of the association with the studied trait on the results of previously conducted genome-wide association (GWAS) and/or associative (i.e. replication) of research; 2) the presence of associations with phenotypes possessing common biological pathways with the studied trait; 3) regulatory capacity (regSNP); 4) influence on gene expression (eSNP); 5) association with nonsynonymous substitutions (nsSNP); 6) tagger SNP (tagSNP) 7) polymorphism frequency no less than 5% 8) functional effects (regSNP, eSNP, nsSNP) of SNPs in non-equilibrium by coupling (r2>0.8) with polymorphisms selected for association analysis. The paper presents the characteristics of modern world databases on functional genomics and bioinformatics analysis methods used for in silico analysis of regulatory and eqtl SNPs values, evaluation of their block structure (SIFT, PolyPhen-2, HaploReg, rSNPs MAPPER, RegulomeDB, rSNPBase, SNP FuncPred, Blood eQTL browser, GTExportal, HaploView, LD TAG SNP Selection). Conclusion. The selection of polymorphic loci for associative studies should take into account their association with the studied feature according to the previous studies, the regulatory potential and the effect on gene expression, nsSNP and tagSNP, population frequency of at least 5%, and the functional effects of strongly coupled SNPs.

Текст научной работы на тему «Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях»

Пономаренко И.В. Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях// Научный результат.

Медицина и фармация. 2018. Т. 4, N 2. С. 40-54.

УДК 575

Пономаренко И.В.

Б01: 10.18413/2313-8955-2018-4-2-0-5

ОТБОР ПОЛИМОРФНЫХ ЛОКУСОВ ДЛЯ АНАЛИЗА АССОЦИАЦИЙ ПРИ ГЕНЕТИКО-ЭПИДЕМИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ_

Федеральное государственное бюджетное образовательное учреждение высшего образования «Курский государственный медицинский университет» 305041, Россия, г. Курск, ул. Карла Маркса, 3 E-mail: ponomarenko215@yandex.ru

Аннотация. Актуальность. Изучение роли наследственных факторов в формировании многофакторных признаков является актуальным, а применительно к мультифакториальным заболеваниям эти исследования имеют важное значение для медицины. При планировании генетико-эпидемиологических исследований мультифакториальных признаков (заболеваний) важное значение имеет отбор полиморфных локусов для поиска ассоциаций с исследуемым фенотипом (заболеванием). Цель исследования. Провести систематический анализ данных, имеющихся в современной литературе, о подходах к отбору полиморфных локусов при проведении ассоциативных исследований. Материалы и методы. В обзор включены современные данные зарубежных и отечественных статей, найденные в Pubmed по данной теме. Результаты. Согласно современным представлениям при отборе полиморфных локусов генов-кандидатов для изучения ассоциаций с мультифакториальным признаком (заболеванием) следует учитывать следующие критерии: 1) наличие ассоциации с исследуемым признаком по результатам ранее проведенных полногеномных (GWAS) и/или ассоциативных (в том числе репликативных) исследований; 2) наличие ассоциации с фенотипами, имеющими с исследуемым признаком, общие биологические пути; 3) регуляторный потенциал (regSNP); 4) влияние на экспрессию генов (eSNP); 5) связь с несинонимическими заменами (nsSNP); 6) tagger SNP (tagSNP) 7) частота полиморфизма не менее 5% 8) функциональные эффекты (regSNP, eSNP, nsSNP) SNPs, находящихся в неравновесии по сцеплению (r2>0.8) с отобранными для ассоциативного анализа полиморфизмами. В работе приведена характеристика современных мировых баз данных по функциональной геномике и биоинформатических методов анализа, используемых для in silico анализа регуляторного и eQTL значения SNPs, оценки их блочной структуры (SIFT, PolyPhen-2, HaploReg, rSNPs MAPPER, RegulomeDB, rSNPBase, SNP FuncPred, Blood eQTL browser, GTExportal, HaploView, LD TAG SNP Selection). Заключение. При отборе полиморфных ло-кусов для ассоциативных исследований следует учитывать их ассоциации с исследуемым признаком по данным ранее проведенных исследований, регулятор-ный потенциал и влияние на экспрессию генов, nsSNP и tagSNP, популяционную частоту не менее 5%, функциональные эффекты сильно сцепленных с ними SNPs.

Ключевые слова: полиморфизм; ассоциации; регуляторный потенциал; eSNP; nsSNP; tagSNP

Информация для цитирования: Пономаренко И.В. Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях //

RESEARCH RESULT

Пономаренко И.В. Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях// Научный результат.

Медицина и фармация. 2018. Т. 4, N 2. С. 40-54.

Научный результат. Медицина и фармация. 2018. Т. 4, N 2. С. 40-54. DOI:

10.18413/2313-8955-2018-4-2-0-5

I.V. Ponomarenko

SELECTION OF POLYMORPHIC LOCI FOR ASSOCIATION ANALYSIS IN GENETIC-EPIDEMIOLOGICAL STUDIES

Federal State Budgetary Educational Institution of Higher Education "Kursk State Medical University" of the Ministry of Health of the Russian Federation

3 K. Marx St., Kursk 305041, Russia E-mail: ponomarenko215@yandex.ru

Abstract. Background. The study of the role of hereditary factors in the formation of multifactorial signs is relevant, and in relation to multifactorial diseases, these studies are important for medicine. When planning genetic and epidemiological studies of multifactorial signs (diseases), it is important to select polymorphic loci to find associations with the studied phenotype (disease). The aim of the study. To carry out a systematic analysis of the data available in the modern literature on the approaches to the selection of polymorphic loci in the course of associative studies. Materials and methods. The review includes the current data of foreign and domestic articles on this topic found in Pubmed. Results. According to modern concepts, the selection of polymorphic loci of candidate genes to explore associations with a multifactorial trait (disease) requires the following criteria: 1) the presence of the association with the studied trait on the results of previously conducted genome-wide association (GWAS) and/or associative (i.e. replication) of research; 2) the presence of associations with phenotypes possessing common biological pathways with the studied trait; 3) regulatory capacity (regSNP); 4) influence on gene expression (eSNP); 5) association with nonsynony-mous substitutions (nsSNP); 6) tagger SNP (tagSNP) 7) polymorphism frequency no less than 5% 8) functional effects (regSNP, eSNP, nsSNP) of SNPs in non-equilibrium by coupling (r2>0.8) with polymorphisms selected for association analysis. The paper presents the characteristics of modern world databases on functional genomics and bi-oinformatics analysis methods used for in silico analysis of regulatory and eqtl SNPs values, evaluation of their block structure (SIFT, PolyPhen-2, HaploReg, rSNPs MAPPER, RegulomeDB, rSNPBase, SNP FuncPred, Blood eQTL browser, GTExpor-tal, HaploView, LD TAG SNP Selection). Conclusion. The selection of polymorphic loci for associative studies should take into account their association with the studied feature according to the previous studies, the regulatory potential and the effect on gene expression, nsSNP and tagSNP, population frequency of at least 5%, and the functional effects of strongly coupled SNPs.

Key words: polymorphism; associations; regulatory potential; eSNP; nsSNP; tagSNP. Information for citation: Ponomarenko IV. Otbor polimorfnykh lokusov dlya analiza assotsiatsiy pri genetiko-epidemiologicheskikh issledovaniyakh [Selection of polymorphic loci for association analysis in genetic-epidemiological studies]. Research Result. Medicine and Pharmacy. 2018;4(2):40-54. DOI: 10.18413/2313-8955-2018-42-0-5

Введение. Одним из ключевых момен- социаций полиморфных локусов генов-

тов любого генетико-эпидемиологического кандидатов с формированием многофактор-

исследования, направленного на поиск ас- ного признака (как нормального, например,

Пономаренко И.В. Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях// Научный результат.

Медицина и фармация. 2018. Т. 4, N 2. С. 40-54.

рост, вес, возраст менархе и др., так патологического, т.е. мультифакториального заболевания) является выбор полиморфных ло-кусов определенных генов-кандидатов для исследования. Именно от того насколько «качественно» исследователь, планирующий свою работу, отберет полиморфные ло-кусы для анализа ассоциаций будет напрямую зависеть «успех» его научного поиска. Если при отборе генов-кандидатов для исследования минимальным требованием для его включения в исследование является вовлеченность продукта данного гена в механизмы развития исследуемого многофакторного признака (этиопатогенез мультифакториального заболевания) (эту информацию можно получить в многочисленных руководствах по молекулярным механизмам развития различных заболеваний, а также в современных онлайн базах данных - KEGG PATHWAY

(www.genom e .jp/kegg/pathway. html), Reac-tome Pathway (www.reactome.org), Gene Ontology (http://geneontology.org), PharmGKB (www.pharmgkb.org), GeneMANIA

(http://genemania.org) и др.), то при отборе полиморфных локусов, планируемых для исследования в данных генах-кандидатах, следует учитывать не только локализацию данного полиморфизма в/около рассматриваемого гена-кандидата и его ассоциации с данным фенотипом (заболеванием), полученные в ранее проведенных исследованиях в различных популяциях, но и его потенциальные фенотипические эффекты, основанные на связи данного полиморфизма с эпигенетическими изменениями и экспрессией генов. Именно эти доказанные (а не гипотетические) фенотипические эффекты «значимых» полиморфных локусов могут являться медико-биологической основой выявленных ассоциаций и должны учитываться при планировании любого генетико-эпидемиологического исследования. К настоящему времени в современной литературе накоплен значительный фактический материал, являющийся результатом работы достаточно большого числа международных

консорциумов в области изучения эпигене-тики, экспрессии генов человека - ENCODE (The Encyclopedia of DNA Elements) Consortium (https://www.encodeproject.org/), NIH Roadmap Epigenomics Mapping Consortium (http://www.roadmapepigenomics.org/), Consortium Genotype-Tissue Expression (http://www.gtexportal.org/), что диктует необходимость некоторой систематизации этих данных и их использование при отборе полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях многофакторных признаков (в том числе мультифакториальных заболеваний).

Цель исследования. Провести систематический анализ данных, имеющихся в современной литературе о подходах к отбору полиморфных локусов при проведении ассоциативных исследований.

Материалы и методы. В обзор включены современные данные зарубежных и отечественных статей, найденные в Pubmed, о подходах к отбору полиморфных локусов при проведении ассоциативных исследований многофакторных признаков (заболеваний).

Результаты исследования и их обсуждение.

Одним из основных требований при отборе полиморфного локуса для генетико-эпидемиологического исследования многофакторных признаков (заболеваний) является наличие его ассоциации с данным признаком (заболеванием), установленное в ранее проведенных исследованиях [3, 8, 33]. Основным ориентиром здесь являются данные полногеномных исследований (GWAS), результаты которых представлены в открытом доступе в каталоге полногеномных исследований (GWAS) National Human Genome Research Institute

(http://www.genome.gov/gwastudies/). При этом в данном случае исследователь планирует проведение репликативного исследования в «своей» популяции [15], которая имеет своеобразие в генетических характеристиках («свою» историю формирования, миграционные потоки и т.д.), средовых

Пономаренко И.В. Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях// Научный результат.

Медицина и фармация. 2018. Т. 4, N 2. С. 40-54.

условиях существования (климато-географические факторы и др.), кофакторах, которые играют значимую роль в развитии исследуемого фенотипа (заболевания) в данной выборке (например, артифициаль-ные аборты являются фактором риска развития доброкачественных пролиферативных заболеваний матки у населения России, но не у населения Центральной Европы и Северной Америки и т.д.). Дополнительным аргументом для включения GWAS-значимого полиморфизма в исследование является подтверждение его значимой ассоциации в других GWAS исследованиях или независимых репликативных исследованиях. При отсутствии полногеномных исследований (например, GWAS исследования не проведены для гиперплазии эндометрия и ряда других заболеваний) или неоднозначности немногочисленных GWAS исследований отдельных многофакторных признаков (заболеваний) в исследование правомочно включать полиморфные локусы, которые, показали свою «значимость» в других, ранее проведенных ассоциативных исследованиях и в первую очередь «крупномасштабных» ассоциативных исследованиях (например, в работе He C. et al. [10], посвященной поиску ассоциаций генов-кандидатов с возрастом менархе для исследования были отобраны 18862 SNPs в 278 генах 9 различных функциональных групп. На выборке из 24341 женщин значимые ассоциации с возрастом менархе были установлены 42 SNPs 9 генов - FSHB, LHCGR, POMC, UGT2B4, GHRH, CD40LG, FGFR1, KISS1, NKX2-1. В работе Goddard K.A. et al. [14] при изучении ассоциации 775 SNP в 190 генах с развитием преэклампсии на выборке из 350 пар мать-ребенок с преэклампсией и 600 контрольных пар установлено 6 генов, ассоциированных с развитием ПЭ: IGF1, IL4R, IGF2R, GNB3, CSF1, THBS4).

При этом, следует отметить, что целый ряд многофакторных признаков и в т.ч. заболеваний характеризуются коморбидно-стью (достаточно часто встречается совместно) и синтропией (неслучайное сочета-

ние двух и более болезней у индивидуума и его ближайших родственников, имеющее эволюционно-генетическую основу [5]. Синтропия определяется общими механизмами развития данных заболеваний и вовлеченностью в их формирование общих (синтропных) генов (функционально взаимодействующие ко-регулируемые гены, локализованные во всем пространстве генома человека, вовлеченные в общие для данной синтропии биохимические и физиологические пути) [6]. В соответствии с этим, при отборе полиморфных локусов для исследования следует учитывать наличие ассоциации «кандидатного» полиморфизма с фенотипами, имеющими с исследуемым признаком, общие биологические пути и вследствие этого имеющего для организма (как в норме, так и при развитии заболевания) более значимую - «ключевую» роль. Так, например, согласно данным литературы, среди генов-кандидатов менархе особое место занимают гены, ассоциированные также с антропометрическими характеристиками (рост, индекс массы тела и др.) (LIN28B, FTO, MAP2K5, FANCL, STK33,

GPRC5B, POMC/RBJ и др.), в связи с тем, что они вовлечены в общие биологические пути формирования менархе, роста, распределения жировой ткани, развития ожирения и др. [13, 22, 28]. Поэтому при изучении мо-лекулярно-генетических факторов менархе для анализа ассоциаций предпочтительнее отбирать полиморфные локусы, которые так же показали в ранее проведенных исследованиях ассоциации с антропометрическими характеристиками.

При оценке функционального значения полиморфизма при его расположении в кодирующей части генома (экзонах) важно оценить является ли эта нуклеотидная замена несинонимической (т.е. приводит к замене аминокислоты в кодируемом полипептиде) и если это так, то необходимо понимать каков предикторный потенциал данной аминокислотной замены. Для выявления «миссенс-мутаций» (nsSNP) и оценке их предиктивного потенциала может использо-

Пономаренко И.В. Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях// Научный результат.

Медицина и фармация. 2018. Т. 4, N 2. С. 40-54.

ваться программное обеспечение SIFT (Sorting Tolerant From Intolerant) [18] (http://sift.jcvi.org/) и PolyPhen-2 (Polymorphism Phenotyping v2) (prediction of functional effects of human nsSNPs) [11] (http://genetics.bwh.harvard.edu/pph2/index.sht ml). В качестве примера использования этих он-лайн программ для оценки предикторно-го потенциала миссенс-замен приведем наши неопубликованные результаты изучения ассоциаций полиморфизма генов-кандидатов с развитием гиперплазии эндометрия. Нами установлено, rs4889 (1q32.1), сильно сцепленный с rs7538038 (r2=0.98), который ассоциирован с развитием гиперплазии эндометрия, обусловливает замену Pro81Arg в полипептиде KISS1. Согласно базы данных PolyPhen-2 (prediction of functional effects of human nsSNPs) аминокислотная замену Pro81Arg в полипептиде KISS1 имеет предикторный класс «POSSIBLY DAMAGING» с score=0.524 (чувствительность 0.88, специфичность -0.90). Так же, нами показано, что rs4633 (ассоциирован с гиперплазией эндометрия и приводит к синонимичной замене аминокислоты в белковом продукте гена COMT, 22q11.21) сильно сцеплен (r2=0.99) с rs4680, который определяет замену Val18Met в полипептиде COMT. Согласно данных базы SIFT (Sorting Tolerant From Intolerant) аминокислотная замена Val18Met в полипептиде COMT имеет SIFT Score=0.02, что характеризует ее предикторное значение как «DELETERIOUS» (SIFT Score <0.05). Следует отметить, что в ранее проведенной работе Chen J. et al. [17] показано, что замена Val/Met в полипептиде COMT обусловливает изменение стабильности и активности COMT: Met вариант приводит к 40% снижению уровня белка и уменьшению его ферментативной активности по сравнению с вариантом Val. Другой пример демонстрирующий важность оценки предикторного потенциала полиморфизма, несмотря на то, что он является несинонимическим - нами было установлено (неопубликованные данные) что с развитием генитального эндометриоза ас-

социирован полиморфизм rs713586 (2p23.3) с которым сильно сцеплен (r2=0.93) rs11676272, обусловливающий замену Ser107Pro в полипептиде ADCY3. Эта аминокислотная замена имеет предикторное значение «TOLERATED» по базе данных SIFT с SIFT Score=0.42, что не превышает порогового значения SIFT Score <0.05. Также, по базе данных PolyPhen-2 данная аминокислотная замена имеет предикторный класс «BENIGN» с score=0 (чувствительность 1.00, специфичность - 0). Таким образом, хотя полиморфный локус rs11676272 и обусловливает миссенс замену в полипептиде ADCY3, однако она не влияет на функциональное значение этого полипептида.

Важное значение при характеристике полиморфного локуса имеет его регулятор-ный потенциал и eQTL значение (связь с экспрессией генов). Регуляторный потенциал полиморфных локусов, а также их связь с экспрессией генов, все чаще исследователями оцениваются не только в post-hoc анализе результатов полногеномных исследований (пример такого post-hoc анализа функционального значения некодирующих GWAS-значимых полиморфных локусов представлен в виде блок-схемы на рис. 1) или ассоциативных исследований отдельных групп генов-кандидатов, а при планировании генетико-эпидемиологических исследований с целью отбора функционально значимых полиморфных локусов. В современной литературе представлено достаточно много мировых баз данных по функциональной геномике и биоинформатических методов анализа этих данных, позволяющих in silico оценить регуляторный потенциал и eQTL значение SNPs, планируемых для исследования. В таблицах 1 и 2 представлена в качестве примера информация о публично доступных информационных ресурсах для оценки регуляторного потенциала (табл. 1) и влияния на экспрессию генов (табл. 2) изучаемых (или планируемых для исследования) полиморфных локусов, взятая из работы Tak Y.G. и Farnham P.J. [26] «Making sense of GWAS: using epigenomics and ge-

Пономаренко И.В. Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях// Научный результат.

Медицина и фармация. 2018. Т. 4, N 2. С. 40-54.

nome engineering to understand the functional relevance of SNPs in non-coding regions of the human genome», опубликованной в журнале «Epigenetics&chromatin». Следует отметить, что в современные онлайн ресурсы по функциональной геномике достаточно хорошо интегрированы данные, полученные в ходе реализации крупных международных проектов в области эпигенетики - ENCODE (The Encyclopedia of DNA Elements) (https://www.encodeproject.org/) и консорциума NIH Roadmap Epigenomics Mapping

Consortium

(http://www.roadmapepigenomics.org/). С помощью этих данных оценивается расположение полиморфизма в регионе «открытого хроматина», регионах модифицированных гистонов, сайтах связывания с различными регуляторными белками (CTCF и др.), регионе мотивов ДНК, являющихся сайтами связывания с транскрипционными факторами (TFBs) и т.д. (рис. 2) [20], и результатом этого является приоритизация SNPs с позиций их регуляторных эффектов (рис. 3) [26].

Рис. 1. Блок-схема post-hoc анализа функционального значения некодирующих GWAS-значимых полиморфных локусов [26] Fig. 1. Block diagram of the post-hoc analysis of the functional significance of non-coding

GWAS-significant polymorphic loci [26]

Пономаренко И.В. Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях// Научный результат.

Медицина и фармация. 2018. Т. 4, N 2. С. 40-54.

Публично доступные базы данных по функциональной геномике [26] Publicly accessible databases on functional genomics [26]

Таблица 1 Table 1

Tool Type Minimum input Output Epigenetic annotation file used URL PMID

HaploReg Web server rsID Overlapping annotated features and IF motif disruption information for SNPs (input) and correlated SNPs with r? >0.8 ChromHMM, DNase-seq, a library of position weight matrices (PWMs) fromTRANSFAC, JASPAR, and protein binding array (PBM), and eQTL http;//www.broadinstitute.org/ mammal s/haploreg/haploreg_ v3.php 22064851

RegulomeDB Web server rsID Overlapping annotated features for SNPs (input) with scores which depend on the combination of overlapping annotated features and UCSC genome browser showing overlapping features TF binding, Dnase-seq, FAIRE, DNase footprinting, eQTL, dsQTL, ChlP-exo and DNA methylation httpyywww.regulomedb.org 22955989

FORGE Web server rsID Overlapping DNasel hotspots for SNP(input) DNasel hotspot http/Zbrowser. 1 OCOgenomes.org/ Homo_sapiens/UserData/Forge

rSNPßase Web server rsID or gene name Proximal or distal transcriptional regulation, mIRNA regulation, RNA binding protein mediated regulation, eQTL results for SNPs (input) arid correlated SNPs (rz>0.8) histone modification,TF bindings, CpG Islands, RBP, miRNA data http://rsnp.psych.ac.cn/ 24285297

FunciSNP R package GWAS index SNP information (chrom:position, rsID, population) in tab-delimited file, biofeature information in .bed format, user-defined r2 value Overlapping annotated features for index SNP(input) and correlated SNPs which r values are user-defined Any biofeature annotation information in bed format https://github.com/labrazil/Coet-zee_Seq_Ana lysis/tree/master/ Funci5NP 22684628

GREGOR A package run using perl code A file containing single column of index SNPs, biofeature information in .bed format, user-defined r3 value Prioritized variants based on overlap with selected regulatory regions, enrichment analysis with P-values showing how index SNPs or correlated SNPs are enriched in annotated feature compared to control SNPs Any biofeature annotation information in bed format http://csg.sph.umich.edu/GREGOR/ indexphp/site/index 25886982

Enlight Webserver rslD,P value Plots showing LD and overlapping annotated features for SNP (input) chromHMM, histone modification, DNA methylation,TF bindings, eQTL, Hi-C or customized BED file for biofeatures httpy/en light.usc.edu/irxJex.html 25262152

GWAS3D Web server rsID, P- value TF motif analysis and overlapping annotated features for SNPs (input) 5C, Hi-C, ChlA-PETr ChromeHMM, H3K27AC, p300, CTCF, DHS (Option for selecting cell lines relevant to disease) htcp//jjwanglab.org/gwas3d 23723249

motifbreakR R package SNP information in .bed or .vcf format Comprehensive TF binding sites disruption at SNPs (input) TF motif information from ScerTF, FlyFactorSurvey, hpDI, UniPROBE, JASPAR, ENCODE, Homer, Factor-book, HOCOMOCO https//git hub.com/Simon-Coet-zee/motifBreakR- 26272984

Публично доступные eQTL базы данных [26] Publicly Available eQTL Databases [26]

Таблица 2 Table 2

Tool

Features

URL

PMID

NCBI eQTL browser cis-eQTL from liver, lymphoblastoid, brain

seeQTL browser for cis-eQTL, and trans-eQTL from lymphoblastoid,

brain, monocyte

Chicago eQTL QTL (eQTL, dsQTL, trQTL, exonQTL) from lymphoblastoid,

brain, liver, fibroblast, T-cells GTEx Porta I > 6011 ss ues eQTL d ata a nd eQTL IGV browser

GeneVar >5tissueseQTL, meQTLdataandvisualization

Blood eQTL Blood els- and trans-eQTLs

Geuvadis QTL (eQTL.mirQTL, trQTL) from lymphoblastoid

cell lines

httpy/www.nсЫ л Im.nih.gov/projects/gap/eqtl/lndex.cgi

http://www.bio s.u nc.ed u/researc h/geno m ic_software/ 22171328 seeQTU

http^/eq 11. uchicago.edu/cgi—bln/gb rowse/eqtl/

http://www.gtex portal.org/home/ 25954001

https://www.sa nger.ac.uk/resources/software/genevar/ 20702402

http://genenetwork.nl/bloodeqtlbrowse г/ 24013639

http://www.eb i .ас u k/Tool s/g eu vadis—das/ 24037378

mlrOTL mi RNA QTL, trQTL transcript ratio QTL, dsQIL Driase I sensitivity QTL

Пономаренко И.В. Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях// Научный результат.

Медицина и фармация. 2018. Т. 4, N 2. С. 40-54.

Рис. 2. Оценка регуляторных эффектов полиморфных локусов [20] Fig. 2. Evaluation of regulatory effects of polymorphic loci [20]

Position on Chr6 (Mb)

Рис. 3. Приоритезация SNPs на основе данных о функциональной геномике [26] Fig. 3. Prioritization of SNPs based on data on functional genomics [26]

Пономаренко И.В. Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях// Научный результат.

Медицина и фармация. 2018. Т. 4, N 2. С. 40-54.

Онлайн ресурсы (RegulomeDB, SNP Function Prediction, rSNPBase и др.) широко используются при планировании генетико-эпидемиологических исследований в работах различных научных коллективов и в том числе отечественными учеными [1, 7, 9, 16, 19, 29].

Нашим научным коллективом, при планировании генетико-эпидемиологи-ческого исследования возраста менархе, для оценки регуляторного потенциала полиморфных локусов, отбираемых для ассоциативного анализа использовалось следующее онлайн программное обеспечение:

• HaploReg (v4.1) [30] (http://archive.broadinstitute.org/mammals/hapl oreg/haploreg.php) (Core 25-state model using 12 imputed marks) (рассматривается расположение SNPs в области гистонов, маркирующих промоторы и энхансеры, в регионе гиперчувствительности к ДНКазе, эволюци-онно консервативных регионах, регионе ре-гуляторных мотивов и регионе связывания с регуляторными белками);

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

• rSNPs MAPPER (Multi-genome Analysis of Positions and Patterns of Elements of Regulation) [23] (http://genome.ufl.edu/mapper/mapper-main) (оценивается локализация SNPs в регионе сайтов связывания с транскрипционными факторами на основе баз данных TRANSFAC, JASPAR, MAPPER);

• RegulomeDB (Version 1.1) [12] (http://regulome.stanford .edu/) (оценивается regulatory scores SNPs). В онлайн ресурсе RegulomeDB для SNP представлены регуля-торные коэффициенты - 1a (eQTL + TF binding + matched TF motif + matched DNase Footprint + DNase peak), 1b (eQTL + TF binding + any motif + DNase Footprint + DNase peak), 1c (eQTL + TF binding + matched TF motif + DNase peak), 1d (eQTL + TF binding + any motif + DNase peak), 1e (eQTL + TF binding + matched TF motif), 1f (eQTL + TF binding / DNase peak), 2a (TF binding + matched TF motif + matched DNase Footprint + DNase peak), 2b (TF binding + any motif + DNase Footprint + DNase peak), 2c (TF bind-

ing + matched TF motif + DNase peak), 3 a (TF binding + any motif + DNase peak), 3b (TF binding + matched TF motif), 4 (TF binding + DNase peak), 5 (TF binding or DNase peak), 6 (other). Следует отметить, что чем меньше коэффициент, тем выше регуляторный потенциал SNP и влияние на экспрессию генов оказывают только SNPs, имеющие коэффициент от 1а до 1 f;

• rSNPBase [24] (http ://rsnp .psych.ac.cn/index.do) (оценивается роль SNPs в проксимальной и дистальной транскрипционной регуляции, регуляции, опосредованной РНК-связываемыми белками);

• SNPinfo Web Server - SNP Function Prediction (FuncPred) [32] (https://snpinfo.niehs.nih.gov/snpinfo/snpfunc. html) (оценивается Regulatory Potential Score SNPs, а также связь полиморфизма с сайтами, связывающими факторы транскрипции (TFBs), микроРНК, консервативными последовательностями и др.).

С помощью современных баз данных по функциональной геномике можно оценить конкретную связь полиморфного локу-са (референсного и альтернативного аллелей) с изменением регуляторного мотива ДНК (афинность мотива к транскрипционным факторам). Одним из таких подходов является определение разницы между LOD scores альтернативного (alt) и референсного (ref) аллелей [22, 31]: LOD (alt) - LOD (ref). Отрицательное значение этого показателя свидетельствует о повышении афинности данного мотива референсным аллелем, наоборот, положительное значение демонстрирует связь альтернативного аллеля с повышением афинности анализируемого мотива ДНК.

При рассмотрении функционального значения полиморфного локуса, включаемого в исследование, наряду с его регулятор-ными эффектами следует оценивать и его связь с экспрессией генов (eQTL значение). В таблице 2 представлена информация о публично доступных eQTL базах данных, позволяющих оценить связь полиморфизма

Пономаренко И.В. Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях// Научный результат.

Медицина и фармация. 2018. Т. 4, N 2. С. 40-54.

с экспрессией генов [26]. В качестве примера остановимся на характеристиках некоторых из них. С помощью данных онлайн программы Blood eQTL browser [25] (http ://genenetwork.nl/bloodeqtlbrowser/), основанных на eQTL анализе нетрансформи-рованных образцов периферической крови 5311 индивидуумов, могут быть оценены ассоциации исследуемых SNPs с уровнем экспрессии генов в периферической крови (cis- и trans-eQTL). При локализации SNP от гена на расстоянии до 250 kb его эффекты оценивались как cis-eQTL, а при расположении полиморфизма от гена на дистанции более чем 5Mb - как trans-eQTL. Для оценки значимости полученных данных используется показатель False Discovery Rate (FDR). Статистически значимыми считаются данные с уровнем значимости p<5*10-5 , pfdr<0.05.

С использованием данных проекта Genotype-Tissue Expression (GTEx) [27], основанных на результатах анализа экспрессии генов (341316 eGenes - eQTL для 27159 уникальных генов) в 10294 образцах из 48 органов и тканей (не менее 70 образцов из каждого органа или ткани) 620 индивидуумов и представленных в онлайн программе GTExportal на 10.12.2017 (Release V7 updated on 09/05/2017) (dbGaP Accession phs000424.v7.p2) (http://www.gtexportal.org/), может быть изучен экспрессионный потенциал (cis-eQTL) исследуемых SNP в различных органах и тканях и в том числе патогенетически значимых для развития данного многофакторного признака (заболевания). Для идентификации значимых eQTL применяется показатель False Discovery Rate (FDR) (статистически значимыми считаются результаты с p<8*10-5, pfdr<0.05). С помощью данного онлайн сервиса можно оценить влияние аллельных вариантов рассматриваемого полиморфизма на уровень экспрессии определенного гена - на основе оценки коэффициента линейной регрессии ( ß ), характеризующего изменение нормализованного показателя генной экспрессии на

один полиморфный (альтернативный) генетический вариант.

Следует отметить, что при выборе полиморфных локусов для исследования особое внимание следует уделять рассмотрению вопроса о функциональной роли полиморфизма данного гена-кандидата в органе или ткани, вовлеченных в формирование исследуемого многофакторного признака (заболевания), т.е. рассматривать регуля-торный потенциал SNPs с учетом дифференциальной экспрессии генов-кандидатов в органах (тканях) - мишенях. Данный подход к отбору полиморфных локусов для ассоциативного анализа в РФ активно развивается научным коллективом из Томского НИИ медицинской генетики под руководством член-корр. РАН В.А. Степанова. Используя данный подход, ученые из этого научного коллектива отобрали для генетико-эпидемиологического исследования преэк-лампсии 46 регуляторных полиморфных вариантов 21 дифференциально экспрессиру-емых в плаценте генов-кандидатов [1, 7]. Как указывают авторы, примененный ими новый подход поиска генетических маркеров мультифакториальных заболеваний, основанный на комбинации геномных, тран-скриптомных и биоинформатических подходов (заключается в выборе дифференциально экспрессируемых генов на основании полногеномного анализа транскриптома плацентарной ткани по результатам собственного исследования и ранее опубликованных данных, биоинформатического поиска полиморфных маркеров в регулятор-ных участках этих дифференциально экс-прессируемых генов, анализе ассоциаций с преэклампсией методом случай-контроль) способен обнаружить новые потенциальные генетические маркеры в генах, предположительно вовлеченных в патогенез заболевания, которые, вероятно, входят в состав "упущенной наследуемости" при мульти-факториальных заболеваниях и не могут быть выявлены при геномном анализе [1].

Следует отметить, что при оценке функционального значения SNP важно так-

Пономаренко И.В. Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях// Научный результат.

Медицина и фармация. 2018. Т. 4, N 2. С. 40-54.

же учитывать не только его самостоятельные эффекты (эпигенетические эффекты данного полиморфизма и его связь с экспрессией генов) но и функциональное значение полиморфных локусов, находящихся с ним в неравновесии по сцеплению (при выделении определенного уровня силы сцепления r2>0.2-0.8) т.к. именно эти сильно сцепленные с рассматриваемым SNP полиморфные локусы, как правило, будут демонстрировать наиболее значимые регуля-торные эффекты в сравнении с функциональными эффектами этого одного SNP. Так, например, с отобранными нами для ге-нетико-эпидемиологического исследования возраста менархе у населения России 52 полиморфными локусами оказались сильно сцеплены (r2>0.8) около 1000 SNPs (n=980), при этом их регуляторные эффекты, влияние на экспрессию генов, связь с несинонимическими заменами были существенно выше нежели 52 SNPs, изначально включенных в ассоциативное исследование (наши неопубликованные данные).

В настоящее время одной из наиболее продуктивных стратегий создания панели генетических маркеров для анализа ассоциаций с мультифакториальными заболеваниями является выбор tagger SNP (tagSNP) с целью расширения «генетического охвата» [2]. Как указывается в работе Трифоновой Е.А. и др. [2], подход с использованием tagSNPs имеет преимущества в связи с известными на сегодняшний день знаниями о блочной структуре LD организации генома человека и существенно редуцирует силы и средства, необходимые для генотипирова-ния. В работе Хаджиевой М.Б. и др. [4] отмечается, что стратегия применения tagSNPs основана на блочной структуре генома, каждый такой блок включает в себя соседние или близко расположенные аллели, наследуемые совместно чаще, чем это можно ожидать при случайном распределении; данное явление известно как неравновесное сцепление (linkage disequilibrium, LD). SNP с частотой минорного аллеля (MAF) не менее 5% маркирует соответ-

ствующий гаплотипический блок при условии, что он находится в пороговой корреляции хотя бы с одним SNP из данного блока (D' > 0.8). Исследование tagSNPs из каждой группы сцепления обеспечивает покрытие всего гена.

Подбор tagSNPs может быть выполнен в программе HaploView (version 4.2) (https://www.broadinstitute.org/haploview/hapl oview), которая определяет гаплотипиче-скую структуру гена для конкретной популяции, основываясь на данных проекта HapMap (haplotype map)

(http://hapmap.ncbi.nlm.nih.gov/). Наряду с этим tagSNPs могут быть оценены с помощью программного обеспечения SNPinfo Web Server National Institute of Environmental Health Sciences (NIEHS) - LD TAG SNP Selection (TagSNP)

(https://snpinfo.niehs.nih.gov/snpinfo/snptag.ht ml) с использованием данных International HapMap (phase III) и базы dbSNP для различных популяций на основе оценки неравновесия по сцеплению (LD) между парами SNPs (при максимальной дистанции между SNP для определения LD 250kb) с заданным порогом r2 (например, r2>0.8). В настоящее время данная стратегия выбора полиморфных маркеров для анализа ассоциаций полиморфизма с развитием мультифактори-альных заболеваний активно используется различными коллективами ученых и в том числе отечественными генетиками [2, 4].

В исследовании Трифоновой Е.А. и др. [2] в качестве маркеров для изучения паттернов LD были выбраны 12 SNPs ген мети-лентетрагидрофолатредуктазы (MTHFR), относительно равномерно охватывающие все участки гена (экзоны, интроны, 3'-нетранслируемые участки) при частоте минорного аллеля в большинстве локусов не менее 5% (по данным базы NCBI). Для выделения tagSNPs авторы использовали два метода - «STAMPA» и «Tagger». Согласно полученным авторами результатам, при заданном пороге прогностической ценности в различных популяциях наблюдаются неодинаковые наборы tagSNPs, что, по мне-

Пономаренко И.В. Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях// Научный результат.

Медицина и фармация. 2018. Т. 4, N 2. С. 40-54.

нию авторов, вероятно, обусловлено варьированием структуры LD и гаплотипического разнообразия гена MTHFR в выборках. Вопрос о возможности «переноса» tagSNPs с одной популяции на другую довольно важен, так как анализ ассоциаций с использованием tagSNPs, идентифицированных на основании данных проекта HapMap, весьма актуален. Авторы отмечают, что качество выбранных tagSNPs зависит от исходного массива, в котором они охарактеризованы. Если изначально плотность маркеров слишком редкая, то выбранный tagSNP «захватит» меньше информации, чем требуется для анализа. Необходимая плотность маркеров в исходном массиве данных варьирует в различных участках генома в зависимости от ряда показателей, таких, например, как уровень рекомбинации, структура LD, частоты SNP, характер мутации и демографическая история населения [2]. Следует отметить, что на выбор tagSNP наряду с количеством анализируемых SNP (плотность маркеров) значимое влияние оказывают используемый при этом алгоритм выделения гап-лоблоков («Confidence intervals», «Solid spine of LD» и др.) и выбранный порог оценки неравновесия по сцеплению (D > 0.75, D > 0.80 и др.)

В работе Хаджиевой М.Б. и др. [4], посвященной изучению полиморфизма генов, контролирующих процессы эластогенеза, и риска развития пролапса тазовых органов у женщин, в связи с отсутствием для генов FBLN3 и LOXL1 известных функциональных полиморных вариантов, был использован подход, заключающийся в подборе тар-гетных (tagger) SNPs. Авторы с помощью программы HaploView (version 4.2) используя данные для популяций CEU + TSI (CEU - американцы европейского происхождения, TSI - жители Тосканы) из проекта "HapMap" отобрали для исследования 3 tagSNPs гена LOXL1 (rs2165241, rs2304719, rs893821) и 4 SNPs гена FBLN3 (rs3791679, rs1367228, rs3791660 и rs2033316), из которых все, кроме rs1367228, являются таргетными.

Таким образом, согласно современным представлениям при отборе полиморфных локусов генов-кандидатов для изучения ассоциаций с мультифакториальным признаком (заболеванием) следует учитывать следующие критерии: 1) наличие ассоциации с исследуемым признаком по результатам ранее проведенных полногеномных (GWAS) и/или ассоциативных (в том числе реплика-тивных) исследований; 2) наличие ассоциации с фенотипами, имеющими с исследуемым признаком, общие биологические пути;

3) регуляторный потенциал (regSNP);

4) влияние на экспрессию генов (eSNP);

5) связь с несинонимическими заменами (nsSNP); 6) tagger SNP (tagSNP) 7) частота полиморфизма не менее 5% 8) функциональные эффекты (regSNP, eSNP, nsSNP) SNPs, находящихся в неравновесии по сцеплению (r2>0.8) с отобранными для ассоциативного анализа полиморфизмами.

В отношении данной статьи не было зарегистрировано конфликта интересов.

Список литературы

1. Выявление новых маркеров предрасположенности к преэклампсии путем анализа ре-гуляторных участков генов, дифференциально экспрессирующихся в плацентарной ткани /

B.Н. Сереброва [и др.] // Молекулярная биология. 2016. Т. 50, N 5. С. 870-879.

2. Генетическое разнообразие и структура неравновесия по сцеплению гена MTHFR в популяциях Северной Евразии / Е.А. Трифонова [и др.] // Acta naturae. 2012. Т.4, N 1(12). С. 55-71.

3. Исследование молекулярно-генети-ческих маркеров роста человека / А.С. Глотов [и др.] // Экологическая генетика. 2012. Т. X, N 4.

C. 77-84.

4. Полиморфизм генов, контролирующих процессы эластогенеза, и риск развития пролапса тазовых органов у женщин / М.Б. Хаджиева [и др.] // Генетика. 2015. Т. 51, N 10. С. 1191.

5. Пузырев В.П. Генетические основы коморбидности у человека // Генетика. 2015. Т. 51, N 4. С. 491.

6. Пузырев В.П., Кучер А.Н. Эволюцион-но-онтогенетические аспекты патогенетики хронических болезней человека // Генетика. 2011. Т. 47, N 12. С. 1573-1585.

Пономаренко И.В. Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях// Научный результат.

Медицина и фармация. 2018. Т. 4, N 2. С. 40-54.

7. Характеристика транскриптома плацентарной ткани у женщин с физиологической беременностью и преэклампсией / Е.А. Трифонова [и др.] // Acta naturae. 2014. Т.6, N 2(21). С. 77-90.

8. Хусаинова Р.И. Молекулярно-генети-ческие основы метаболических остеопатий: ав-тореф. дис. ... д-ра. биол. наук. Уфа, 2015. 48 с.

9. A comprehensive contribution of genes for aryl hydrocarbon receptor signaling pathway to hypertension susceptibility / A.V. Polonikov [et al.] // Pharmacogenet Genomics. 2017. Vol. 27(2). P. 57-69. DOI: 10.1097/FPC.0000000000000261.

10. A large-scale candidate-gene association study of age at menarche and age at natural menopause / C. He [et al.] // Hum. Genet. 2010. N 128. P. 515-527.

11. A method and server for predicting damaging missense mutations / I.A. Adzhubei [et al.] // Nature methods. 2010. Vol. 7(4). P. 248-249. DOI: 10.1038/nmeth0410-248.

12. Annotation of functional variation in personal genomes using RegulomeDB / A.P. Boyle [et al.] // Genome Research. 2012. Vol. 22(9). P. 17901797. PMID: 22955989.

13. Association of adiposity genetic variants with menarche timing in 92,105 women of European descent / L. Fernandez-Rhodes [et al.] // Am. J. Epidemiol. 2013. N 178. P. 451-460.

14. Candidate-gene association study of mothers with pre-eclampsia, and their infants, analyzing 775 SNPs in 190 genes / K.A. Goddard [et al.] // Hum. Hered. 2007. Vol. 63(1). P. 1-16.

15. Evaluation of GWAS-identified genetic variants for age at menarche among Chinese women / R.J. [et al.] // Hum Reprod. 2013. N 4. P. 1135-43.

16.Fibulin-5 (FBLN5) gene polymorphism is associated with pelvic organ prolapse / M.B. Kha-dzhieva [et al.] // Maturitas. 2014. Vol. 78(4). P. 287-92. DOI: 10.1016/j.maturitas.2014.05.003. Epub 2014 May 13.

17. Functional analysis of genetic variation in catechol-o-methyltransferase (COMT): effects on mRNA, protein enzyme activity in postmortem human brain / J. Chen [et al.] // Am J Hum Genet. 2004. N 75. Р. 807-821.

18.Kumar P., Henikoff S., Ng P.C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm // Nat Protoc. 2009. Vol. 4(7). P. 1073-81.

19. Novel Polymorphism in the Promoter of the CYP4A11 Gene Is Associated with Susceptibil-

ity to Coronary Artery Disease / S. Sirotina [et al.] // Dis Markers. 2018. N. 2018. P. 5812802. DOI: 10.1155/2018/5812802. eCollection 2018.

20. On the identification of potential regulatory variants within genome wide association candidate SNP sets / C. Chen [et al.] // BMC Medical Genomics. 2014. N 7. P. 34. DOI: 10.1186/17558794-7-34.

21. Parent-of-origin-specific allelic associations among 106 genomic loci for age at menarche / J.R. Perry [et al.] // Nature. 2014. N 514. P. 92-97.

22. Polymorphism rs3828903 within MICB Is Associated with Susceptibility to Systemic Lupus Erythematosus in a Northern Han Chinese Population / Y. Zhang [et al.] // Journal of Immunology Research. 2016. N 2016. P. 1343760.

23. Riva A. Large-scale computational identification of regulatory SNPs with rSNP-MAPPER // BMC Genomics. 2012. Vol. 13(4). P. S7.

24. rSNPBase: a database for curated regulatory SNPs / L. Guo [et al.] // Nucleic Acids Res. 2014. Vol. 42(D1). P. D1033-D1039. DOI: 10.1093/nar/gkt 1167.

25. Systematic identification of trans eqtls as putative drivers of known disease associations / H.J. Westra [et al.] // Nat Genet. 2013. N 45. P. 1238-1243.

26. Tak Y.G., Farnham P.J. Making sense of GWAS: using epigenomics and genome engineering to understand the functional relevance of SNPs in non-coding regions of the human genome // Epi-genetics & Chromatin. 2015. N 8. P. 57. DOI: 10.1186/s13072-015-0050-4.

27. The GTEx Consortium. Genetic effects on gene expression across human tissues // Nature. 2017. N 550. P. 204-213. DOI: 10.1038/nature24277.

28. Thirty new loci for age at menarche identified by a meta-analysis of genome-wide association studies / C.E. Elks [et al.] // Nat. Genet. 2010. N 42. P. 1077-1085.

29. Verification of the Chromosome Region 9q21 Association with Pelvic Organ Prolapse Using RegulomeDB Annotations / M.B. Khadzhieva [et al.] // BioMed Research International. 2015. N 2015. P. 837904. DOI: 10.1155/2015/837904.

30.Ward L.D., Kellis M. HaploReg v4: systematic mining of putative causal variants, cell types, regulators and target genes for human complex traits and disease // Nucleic Acids Res. 2016. N 44. P. D877-D881.

31.Ward L.D., Kellis M. HaploReg: a resource for exploring chromatin states, conservation,

Пономаренко И.В. Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях// Научный результат.

Медицина и фармация. 2018. Т. 4, N 2. С. 40-54.

and regulatory motif alterations within sets of genetically linked variants // Nucleic Acids Res. 2012. N 40. P. D930-D934.

32. Xu Z., Taylor J.A. SNPinfo: integrating GWAS and candidate gene information into functional SNP selection for genetic association studies // Nucleic Acids Res. 2009. N 37. P. W600-5.

33.Yermachenko A., Dvornyk V. UGT2B4 previously implicated in the risk of breast cancer is associated with menarche timing in Ukrainian females // Gene. 2014. Vol. 590(1). P. 85-89.

References

1. Serebrova VN, Trifonova EA, Gabidulina TV, et al. Vyyavleniye novykh markerov pre-draspolozhennosti k preeklampsii putem analiza regulyatornykh uchastkov genov, differentsial'no ekspressiruyushchikhsya v platsentarnoy tkani [Identification of new markers of predisposition to pre-eclampsia by analyzing regulatory regions of genes differentially expressed in placental tissue]. Molekulyarnaya biologiya. 2016;50(5):870-879. Russian.

2. Trifonova EA, Eremina ER, Urnov FD, Stepanov VA. Geneticheskoye raznoobraziye i struktura neravnovesiya po stsepleniyu gena MTHFR v populyatsiyakh Severnoy Yevrazii [Genetic diversity and structure of disequilibrium in the MTHFR gene linkage in populations of Northern Eurasia]. Acta naturae. 2012;4(1(12)):55-71. Russian.

3. Glotov AS, Vashukova ES, Glotov OS, et al. Issledovaniye molekulyarno-geneticheskikh mark-erov rosta cheloveka [Investigation of molecular-genetic markers of human height]. Ekologicheskaya genetika. 2012;X(4):77-84. Russian.

4. Khadzhieva MB, Kamoeva SV, Ivanova AV, et al. Polimorfizm genov, kontroliruyushchikh protsessy elastogeneza, i risk razvitiya prolapsa ta-zovykh organov u zhenshchin [Polymorphism of genes controlling the processes of elastogenesis, and the risk of pelvic prolapse in women]. Geneti-ka. 2015;51(10):1191. Russian.

5. Puzyrev VP. Geneticheskiye osnovy ko-morbidnosti u cheloveka [Genetic basis of comor-bidity in humans]. Genetika. 2015;51(4):491. Russian.

6. Puzyrev VP, Kucher AN. Evolyutsionno-ontogeneticheskiye aspekty patogenetiki khronich-eskikh bolezney cheloveka [Evolutionary-ontogenetic aspects of the pathogenetics of chronic human diseases]. Genetika. 2011;47(12): 15731585. Russian.

7. Trifonova EA, Gabidulina TV, Ershov NI, et al. Kharakteristika transkriptoma platsentarnoy tkani u zhenshchin s fiziologicheskoy beremen-nost'yu i preeklampsiyey [Characteristics of the transcriptum of placental tissue in women with physiological pregnancy and preeclampsia]. Acta naturae. 2014;6(2(21)):77-90. Russian.

8. Khusainova RI. Molekulyarno-geneticheskiye osnovy metabolicheskikh osteopatiy [Molecular-genetic bases of metabolic osteopathies] [dissertation]. Ufa: Institute of Biochemistry and Genetics Ufa. sci. center of RAS; 2015. Russian.

9. Polonikov AV, Bushueva OY, Bulgakova IV, Freidin MB, Churnosov MI, Solodilova MA, Shvetsov YD, Ivanov VP. A comprehensive contribution of genes for aryl hydrocarbon receptor signaling pathway to hypertension susceptibility. Pharmacogenet Genomics. 2017 Feb;27(2):57-69. DOI: 10.1097/FPC.0000000000000261.

10.He C, Kraft P, Buring JE, et al. A large-scale candidate-gene association study of age at menarche and age at natural menopause. Hum. Genet. 2010;128:515-527.

11.Adzhubei IA, Schmidt S, Peshkin L, et al. A method and server for predicting damaging missense mutations. Nature methods. 2010;7(4):248-249. DOI:10.1038/nmeth0410-248.

12. Boyle AP, Hong EL, Hariharan M, Cheng Y, Schaub MA, Kasowski M, Karczewski KJ, Park J, Hitz BC, Weng S, Cherry JM, Snyder M. Annotation of functional variation in personal genomes using RegulomeDB. Genome Research. 2012;22(9): 1790-1797. PMID: 22955989.

13. Fernandez-Rhodes L, Demerath EW, Cousminer DL, et al. Association of adiposity genetic variants with menarche timing in 92,105 women of European descent. Am. J. Epidemiol. 2013;178:451-460.

14. Goddard KA, Tromp G, Romero R, et al. Candidate-gene association study of mothers with pre-eclampsia, and their infants, analyzing 775 SNPs in 190 genes. Hum. Hered. 2007;63(1):1-16.

15. Delahanty RJ, Beeghly-Fadiel A, Long JR, et al. Evaluation of GWAS-identified genetic variants for age at menarche among Chinese women. Hum Reprod. 2013;4:1135-43.

16. Khadzhieva MB, Kamoeva SV, Chu-machenko AG, Ivanova AV, Volodin IV, Vladimirov IS, Abilev SK, Salnikova LE. Fibulin-5 (FBLN5) gene polymorphism is associated with pelvic organ prolapse. Maturitas. 2014 Aug;78(4):287-92. DOI: 10.1016/j.maturitas.2014.05.003. Epub 2014 May 13.

Пономаренко И.В. Отбор полиморфных локусов для анализа ассоциаций при генетико-эпидемиологических исследованиях// Научный результат.

Медицина и фармация. 2018. Т. 4, N 2. С. 40-54.

17. Chen J, Lipska BK, Halim N, et al. Functional analysis of genetic variation in catechol-o-methyltransferase (COMT): effects on mRNA, protein enzyme activity in postmortem human brain. Am J Hum Genet. 2004;75:807-821.

18.Kumar P, Henikoff S, Ng PC. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nat Pro-toc. 2009;4(7): 1073-81.

19. Sirotina S, Ponomarenko I, Kharchenko A, Bykanova M, Bocharova A, Vagaytseva K, Ste-panov V, Churnosov M, Solodilova M, Polonikov A. A Novel Polymorphism in the Promoter of the CYP4A11 Gene Is Associated with Susceptibility to Coronary Artery Disease. Dis Markers. 2018 Feb 1;2018:5812802. DOI: 10.1155/2018/5812802. eCollection 2018.

20. Chen C, Chang I-S, Hsiung CA, Wasser-man WW. On the identification of potential regulatory variants within genome wide association candidate SNP sets. BMC Medical Genomics. 2014;7:34. DOI: 10.1186/1755-8794-7-34.

21. Perry JRB, Day F, Elks CE, et al. Parent-of-origin-specific allelic associations among 106 genomic loci for age at menarche. Nature. 2014;514:92-97.

22. Zhang Y, Zhou X, Cheng F, et al. Polymorphism rs3828903 within MICB Is Associated with Susceptibility to Systemic Lupus Erythemato-sus in a Northern Han Chinese Population. Journal of Immunology Research. 2016;2016:1343760.

23. Riva A. Large-scale computational identification of regulatory SNPs with rSNP-MAPPER. BMC Genomics. 2012;13(4):S7.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

24.Guo L, Du Y, Chang S, Zhang K, Wang J. rSNPBase: a database for curated regulatory SNPs. Nucleic Acids Res. 2014;42(D1):D1033-D1039. DOI: 10.1093/nar/gkt 1167.

25.Westra HJ, Peters MJ, Esko T, et al. Systematic identification of trans eqtls as putative drivers of known disease associations. Nat Genet. 2013;45:1238-1243.

26.Tak YG, Farnham PJ. Making sense of GWAS: using epigenomics and genome engineering to understand the functional relevance of SNPs in non-coding regions of the human

genome. Epigenetics & Chromatin. 2015;8:57. DOI: 10.1186/s13072-015-0050-4.

27. The GTEx Consortium. Genetic effects on gene expression across human tissues. Nature. 2017 Oct;550:204-213. Epub 11 Oct 2017. DOI: 10.1038/nature24277.

28. Elks CE, Perry JRB, Sulem P, et al. Thirty new loci for age at menarche identified by a meta-analysis of genome-wide association studies. Nat. Genet. 2010;42:1077-1085.

29. Khadzhieva MB, Kolobkov DS, Kamoeva SV, Ivanova AV, Abilev SK, Salnikova LE. Verification of the Chromosome Region 9q21 Association with Pelvic Organ Prolapse Using Regu-lomeDB Annotations. BioMed Research International. 2015;2015:837904. DOI: 10.1155/2015/837904.

30.Ward LD, Kellis M. HaploReg v4: systematic mining of putative causal variants, cell types, regulators and target genes for human complex traits and disease. Nucleic Acids Res. 2016;44:D877-D881.

31. Ward LD, Kellis M. HaploReg: a resource for exploring chromatin states, conservation, and regulatory motif alterations within sets of genetically linked variants. Nucleic Acids Res. 2012;40:D930-D934.

32.Xu Z, Taylor JA. SNPinfo: integrating GWAS and candidate gene information into functional SNP selection for genetic association studies. Nucleic Acids Res. 2009;37:W600-5.

33.Yermachenko A, Dvornyk V. UGT2B4 previously implicated in the risk of breast cancer is associated with menarche timing in Ukrainian females. Gene. 2014;590(1):85-89.

Пономаренко Ирина Васильевна, кандидат медицинских наук, научный сотрудник кафедры биологии, медицинской генетики и экологии.

Ponomarenko Irina Vasilievna, Candidate of Medical Sciences, Research Associate, Department of Biology, Medical Genetics and Ecology.

Статья поступила в редакцию 10 октября 2017 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.