Научная статья на тему 'Уточнение статуса некоторых мутаций, считающихся патогенными, с помощью признаков безвредных мутаций'

Уточнение статуса некоторых мутаций, считающихся патогенными, с помощью признаков безвредных мутаций Текст научной статьи по специальности «Биологические науки»

CC BY
2781
209
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
генетика человека / высокопроизводительное секвенирование / патогенность / популяционный анализ / поиск мутаций / human genetics / high-throughput sequencing / pathogenicity / population analysis / search for mutations

Аннотация научной статьи по биологическим наукам, автор научной работы — Д. И. Борисевич, Л. В. Шаталова, Дмитрий Олегович Коростин, В. В. Ильинский

Важной задачей современной биоинформатики является предсказание патогенности мутации и ее влияния на фенотип. Она особенно трудна для однонуклеотидных полиморфизмов, чей эффект сложнее всего предсказать. Патогенные мутации берут из курируемых баз данных, таких как Online Mendelian Inheritance in Man (OMIM) и The Human Gene Mutation Database (HGMD), куда включают данные из экспериментальных статей. Однако поскольку различные авторы вкладывают разный смысл в понятие «патогенность мутации», необходимо контролировать данные баз перед их использованием. Мы проанализировали качество данных базы HGMD с помощью наиболее часто используемых биоинформатических инструментов: snpEff, polyphen2 и SIFT. В исследовании мы опирались на признаки, характерные для безвредных мутаций: высокую частоту в популяции, слабое влияние на аминокислотную последовательность белка, низкую патогенность по оценке вычислительных методов. В результате среди мутаций базы нами выявлены однозначно безвредные варианты, а также варианты со спорным значением, для которых тип мутации зависит от используемых для анализа признаков и инструментов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по биологическим наукам , автор научной работы — Д. И. Борисевич, Л. В. Шаталова, Дмитрий Олегович Коростин, В. В. Ильинский

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Clarification of the status of some mutations considered pathogenic, by harmless mutations attributes

Prediction of mutation pathogenicity and its effect on the phenotype is an important task of modern bioinformatics. This task is particularly difficult in regard to single nucleotide polymorphisms, as their effect is very hard to predict. Information on pathogenic mutations is provided by curated databases such as Online Mendelian Inheritance in Man (OMIM) and The Human Gene Mutation Database (HGMD) which include data from experimental works. However, as different authors interpret the term “mutation pathogenicity” differently, it is necessary to double-check data before using them. We have assessed HGMD database quality using the most common bioinformatic tools, namely, snpEff, polyphen2 and SIFT. Our study relied on the characteristics specific for harmless mutations: high frequency in a population, weak effect on amino acid sequence of a protein, low pathogenicity as computed by the utilities used in the study. As a result, we have identified clearly harmless variants among those in the mutation database, as well as ambiguous ones in which a mutation type depends on characteristics and tools used for the analysis.

Текст научной работы на тему «Уточнение статуса некоторых мутаций, считающихся патогенными, с помощью признаков безвредных мутаций»

статья i молекулярная генетика

уточнение статуса некоторых мутаций, считающихся патогенными, с помощью признаков безвредных мутаций

Д. И. Борисевич1,2, Л. В. Шаталова1, Д. О. Коростин1,3 В. В. Ильинский1,3

1 Отдел биоинформатической обработки данных, ООО «Генотек», Москва

2 Московский государственный университет имени М. В. Ломоносова, Москва

3 Центр коллективного пользования отдела биологических наук РАН «Генетический полиморфизм», Институт общей генетики имени Н. И. Вавилова РАН, Москва

Важной задачей современной биоинформатики является предсказание патогенности мутации и ее влияния на фенотип. Она особенно трудна для однонуклеотидных полиморфизмов, чей эффект сложнее всего предсказать. Патогенные мутации берут из курируемых баз данных, таких как Online Mendelian Inheritance in Man (OMIM) и The Human Gene Mutation Database (HGMD), куда включают данные из экспериментальных статей. Однако поскольку различные авторы вкладывают разный смысл в понятие «патогенность мутации», необходимо контролировать данные баз перед их использованием. Мы проанализировали качество данных базы HGMD с помощью наиболее часто используемых биоинформатических инструментов: snpEff, polyphen2 и SIFT. В исследовании мы опирались на признаки, характерные для безвредных мутаций: высокую частоту в популяции, слабое влияние на аминокислотную последовательность белка, низкую патогенность по оценке вычислительных методов. В результате среди мутаций базы нами выявлены однозначно безвредные варианты, а также варианты со спорным значением, для которых тип мутации зависит от используемых для анализа признаков и инструментов.

Ключевые слова: генетика человека, высокопроизводительное секвенирование, патогенность, популяционный анализ, поиск мутаций

[><] Для корреспонденции: Дмитрий Олегович Коростин 119991, г Москва, ул. Губкина, д. 3; d.korostin@gmail.com

Статья получена: 10.02.2016 Статья принята в печать: 19.02.2016

clarification of the status of some mutations considered pathogenic, by harmless mutations attributes

Borisevich DI1'2, Shatalova LV1, Korostin DO1,3 Ea, Ilinsky W1*3

1 Bioinformatics Data Processing Department, Genotek Ltd., Moscow, Russia

2 Lomonosov Moscow State University, Moscow, Russia

3 The Core Facilities Center "Genetic Polymorphism"

Vavilov Institute of General Genetics, Russian Academy of Sciences, Moscow, Russia

Prediction of mutation pathogenicity and its effect on the phenotype is an important task of modern bioinformatics. This task is particularly difficult in regard to single nucleotide polymorphisms, as their effect is very hard to predict. Information on pathogenic mutations is provided by curated databases such as Online Mendelian Inheritance in Man (OMIM) and The Human Gene Mutation Database (HGMD) which include data from experimental works. However, as different authors interpret the term "mutation pathogenicity" differently, it is necessary to double-check data before using them. We have assessed HGMD database quality using the most common bioinformatic tools, namely, snpEff, polyphen2 and SIFT. Our study relied on the characteristics specific for harmless mutations: high frequency in a population, weak effect on amino acid sequence of a protein, low pathogenicity as computed by the utilities used in the study. As a result, we have identified clearly harmless variants among those in the mutation database, as well as ambiguous ones in which a mutation type depends on characteristics and tools used for the analysis.

Keywords: human genetics, high-throughput sequencing, pathogenicity, population analysis, search for mutations

[X] Correspondence should be addressed: Dmitriy Korostin

ul. Gubkina, d. 3, Moscow, Russia, 119991; d.korostin@gmail.com

Recieved: 10.02.2016 Accepted: 19.02.2016

Влияние однонулеотидных полиморфизмов (SNP) на фенотип труднопредсказуемо. Существующие программы,

предсказывающие патогенность мутации, имеют ряд недостатков, например низкую чувствительность и специфич-

article i molecular genetics

ность, не превышающую для SNP 75-80 %. Кроме того, стоит отметить, что зачастую инсерции и делеции не аннотируются ими вовсе [1-3].

Патогенные мутации собирают в базы данных из экспериментальных статей. Примерами таких баз могут быть база Online Mendelian Inheritance in Man (OMIM [4]) и The Human Gene Mutation Database (HGMD [5]). Однако термин «патогенность» имеет широкую интерпретацию, однозначного мнения по поводу его значения не существует. Это приводит к тому, что базы данных применяют разные подходы к выбору мутации для включения, и, следовательно, данные в разных базах неодинаковы и нуждаются в уточнении.

Непатогенные мутации чаще всего идентифицируют по косвенным признакам: частоте аллелей в популяции и влиянию на аминокислотную последовательность белка. По мере появления новых данных эти признаки могут помочь понять, как можно усовершенствовать существующие базы. Знание того, что мутации, описанные как патогенные, подпадают под критерии непатогенных вариантов, важно для практического использования данных из этих баз. Это знание может помочь в понимании и того, почему одни генетические варианты влияют на фенотип, а другие — нет.

Для специалистов, опирающихся в своих исследованиях на базу данных HGMD может быть неочевидно, что в настоящее время она несет помимо однозначно патогенных мутаций также безвредные, оцененные как патогенные. В рамках данной работы была проведена биоинформатичес-кая оценка патогенности мутаций, включенных в HGMD. Мы сравнивали частоты аллелей, аннотированных в HGMD, с таковыми в Exome Aggregation Consortium 0.3 [6], а также анализировали влияние мутаций из HGMD на аминокислотную последовательность белка и предсказывали их патогенность с помощью наиболее часто используемых био-информатических инструментов: snpEff, polyphen2 и SIFT.

МАТЕРИАЛЫ И МЕТОДЫ

В качестве списка патогенных мутаций использовали публичную версию базы HGMD за IV квартал 2014 года, содер-

жащую 73 208 мутаций. Частоты аллелей для них вычислили с помощью snpEff 4.0. Полученные данные сопоставили с частотами аллелей в Exome Aggregation Consortium 0.3, которая содержит полноэкзомные и полногеномные данные секвенирования образцов 60 706 не связанных между собой пациентов. Частота аллелей в ExAC установлена для шести популяций: африканской, латиноамериканской, восточноазиатской, южноазиатской, финской и европейской (не включающей финскую). Все неустановленные образцы сгруппированы в популяцию, названную «Другие». Число генотипированных образцов индивидуумов для каждой аннотируемой мутации на момент обращения к базе варьировалось в различных популяциях: от порядка 500 для «Других» до 30 000 для европейцев. Сопоставление частот аллелей двух баз произвели с помощью bcftools [7].

Мутации из базы HGMD, влияющие на аминокислотную последовательность белка, были установлены с snpEff 4.0 [8]. Возможный уровень патогенности был предсказан с использованием утилит polyphen2 и SIFT. Эти утилиты являются стандартными для предсказания патоген-ности мутаций, и ни одна из них не использовала данные из базы HGMD как обучающую выборку.

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ Аннотация snpEff

Мутации из базы HGMD были проаннотированы snpEff, в результате были получены частоты каждого типа мутаций (в соответствии с классификацией snpEff). Мы обнаружили, что во многих случаях мутации имеют более чем одно предсказание, т. е. относятся к нескольким типам мутаций одновременно. Обычно это происходит из-за того, что мутация локализована внутри гена и для аннотации мутации использовались соседние гены. Мы отфильтровали типы мутаций для каждого варианта, имеющего больше чем один тип, оставляя только тот тип, который имел наибольшее влияние в соответствии с предложенным создателями утилиты snpEff алгоритмом (таблица) [8].

Количество мутаций наиболее важных классов из базы HGMD, предсказанные snpEff

Тип мутации Количество мутаций Тип мутации Количество мутаций

missense_variant 56136 sequence_feature 66

stop_gained 13513 initiator_codon_variant 61

synonymous_variant 1793 intron_variant 54

start_lost 465 non_coding_exon_variant 44

3_prime_UTR_variant 363 splice_donor_variant 39

downstream_gene_variant 245 splice_acceptor_variant 23

upstream_gene_variant 162 stop_retained_variant 4

stop_lost 136 5_prime_UTR_variant 3

splice_region_variant 99 intergenic_region 2

Примечание: названия классов приведены так, как указаны в snpEff. missense_variant — миссенс-мутации; stop_gained — нонсенс-мутации; synonymous_ variant — синонимические мутации; start_lost — замена, приводящая к изменению по крайней мере одного основания канонического кодона; 3_prime_ UTR_variant — замена в 3'-UTR; downstream_gene_variant — замена в последовательности, находящейся на 3'-конце гена; upstream_gene_variant — замена в последовательности, находящейся на 5'-конце гена; stop_lost — замена, при которой по крайней мере одно основание терминаторного кодона (стоп-ко-дона) изменено, что приводит к элонгации транскрипции; splice_region_variant — замена внутри области сайта сплайсинга, либо 1-3 основания экзона, либо 3-8 основания интрона; sequence_feature — замена на любом участке последовательности; initiator_codon_variant — замена, при которой изменяется хотя бы одно основание первого кодона транскрипта; intron_variant — замена внутри интрона; non_coding_exon_variant - замена, которая изменяет неко-дирующую последовательность экзона в некодирующем транскрипте; splice_donor_variant — сплайсинг, который изменяет 2 пар оснований области на 5'-конце интрона; splice_acceptor_variant — сплайсинг, который изменяет 2 п. о. области на 3'-конце интрона; stop_retained_variant — замена, при которой по крайней мере одно основание в терминаторном кодоне изменено, но при этом терминатор не теряет своей функции; 5_prime_UTR_variant — замена в 5'-UTR; intergenic_region — область, не содержащая ген, или область, в которой нет перекрывания генов, ограниченная с обеих сторон генами либо геном и концом хромосомы.

статья i молекулярная генетика

Аннотация с ExAC

18 159 (25 %) мутаций из базы HGMD описаны в ExAC.

Результаты, полученные с помощью polyphen2 и SIFT

Мы предсказали вес мутаций используя утилиты polyphen2 и SIFT. Polyphen2 имеет два вида моделей для предсказания патогенности: HumDiv и HumVar. Согласно описанию разработчиков, HumVar лучше предсказывает менделиру-ющие заболевания, в то время как HumDiv лучше подходит для комплексных фенотипов и аллелей из категории условно патогенных [9]. Мы выбрали модель HumDiv чтобы использовать более широкое определение патогенности. Пороги отсечения патогенных и вероятно патогенных вариантов были установлены по умолчанию.

Polyphen2 проаннотировал 52 248 мутаций, из которых 39 032 (72 %) были определены как патогенные и 6 220 (11 %) — как вероятно патогенные. Утилита SIFT проаннотировала 53 097 мутаций, из которых 34 638 (65 %) были определены как патогенные и 4 358 (8 %) — как вероятно патогенные (с низкой вероятностью). Обе утилиты смогли распознать введенные в базу варианты как патогенные в 70-80 % случаев, что соотносится с их ожидаемой эффективностью [2, 3].

ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Использование базы ExAC в качестве ресурса, содержащего информацию о частотах аллелей

Техническое описание ресурса ExAC пока не выпущено, но известно, что база включает данные не только попу-ляционно-генетических исследований, но также проектов секвенирования образцов пациентов с различными заболеваниями. Мы полагаем, что в таких проектах используют меньшее число образцов, чем в популяционно-генетичес-ких исследованиях, и их влияние на результирующую частоту должно быть несущественным, особенно если были проанализированы образцы большого числа индивидуумов в популяционно-генетических исследованиях. Поэтому из анализа мы исключили мутации, которые были генотипиро-ваны только у нескольких индивидуумов. За исключением этого мы считаем, что ExAC можно уверенно использовать для оценки частот в таких исследованиях, как наше. Авторы этой базы данных утверждают, что она может использоваться в качестве эталонного набора частот аллелей для изучения заболеваний.

Наличие синонимичных мутаций в базе HGMD

95 % всех мутаций из базы HGMD распределялись snpEff на две группы: миссенс-мутации и нонсенс-мутации. Однако приблизительно 2,5 % мутаций определялись как синонимические (таблица). Хотя патогенность синонимичных вариантов описана в литературе, в большинстве случаев синонимичные мутации считаются безвредными. Мы сфокусировались на этой группе как на группе вариантов с наиболее спорной патогенностью. Утилита polyphen2 вообще не выполняет оценку патогенности синонимичных мутаций, поскольку опирается в первую очередь на влияние мутации на аминокислотную последовательность белка. Утилита SIFT позволяет выполнять оценку синонимичных мутаций на патогенность, и она определила лишь 4 из 1793 синони-

мичных мутаций как патогенные. Высока вероятность того, что остальные 1789 мутаций (~2,5 % всех мутаций в HGMD) на самом деле не являются патогенными, поскольку не имеют никаких других признаков патогенности.

Анализ синонимичных патогенных мутаций в базе HGMD

Только одна из четырех синонимичных мутаций HGMD, которые были оценены как патогенные инструментом SIFT, описана в dbSNP [10]. Это мутация NM_005228.3:a2361G>A (NP_005219.2:p.Gln787=) c rsid rs1050171. Согласно данным Zhang и соавт. [11], эта мутация связана с раком легких, молекулярный механизм ее действия не определен. Альтернативный (мутантный) аллель А присутствует с частотой около 43 %, согласно данным проекта «1000 геномов», представленным в dbSNP. База ClinVar [12] определяет этот SNP как непатогенный [13]. Причины определения данной мутации как патогенной инструментом SIFT, видимо, связаны с консервативностью позиции, где произошла мутация. Она располагается в 3-м положении кодона, которое обычно менее консервативно, чем 1-е и 2-е положения и получает меньшую оценку. Однако для этой мутации оценка эволюционной консервативности PhyloP Vertebrate, полученная из UCSC Genome Browser [14], с оценкой 1-го и 2-го положения в близлежащих кодонах гораздо выше, чем оценка других нуклеотидов, располагающихся в 3-м положении кодона, что говорит о высокой консервативности данного нуклеотида.

В конце концов, истинную природу этой мутации определить очень сложно. С одной стороны, существуют доказательства в пользу того, что эта мутация непатогенная: данные базы ClinVar, синонимический тип, высокая частота аллельных вариантов в популяции. С другой стороны, результаты предсказывания с помощью утилиты SIFT данных базы HGMD и высокая эволюционная консервативность — доказательства в пользу патогенности этого варианта. Это пример иллюстрирует сложность предсказания патогенности мутации: даже ручной анализ не может обеспечить однозначного толкования результатов, поскольку тип мутации зависит от выбора инструмента анализа.

Варианты, в которых мутация присутствует только в гетерозиготе

Для анализа мутаций, отсутствующих в образцах в гомозиготном состоянии, мы выделили четыре мутации, каждая из которых присутствовала в гетерозиготе на уровне более 75 % и в гомозиготе на уровне менее 5 % (по крайней мере в базе ExAC):

1. chr1:1650845G>A (rs1059831, ген CDK11A, HGMD фенотип: связана с диабетом 2-го типа) [15],

2. chr2:112614429G>A(rs72936240, генANAPC1, HGMD фенотип: дефицит белка, связанный с риском возникновения рака) [16],

3. chr7:142458451A>T (rs111033566, ген PRSS1, HGMD фенотип: наследственный панкреатит) [17],

4. chr17:7197581G>T (rs189257850, ген YBX2, HGMD фенотип: связана с мужским бесплодием) [18].

Мутации 2 и 3 никогда не были представлены в гомозиготе ни для одной популяции, мутация 1 была представлена в гомозиготе только в одном из 8 209 образцов в южноазиатской популяции. Для мутации 4 по непонятным причинам было генотипировано всего 203 образца, тогда как,

article i molecular genetics

например, для мутаций 1-3 — приблизительно 60 000. Для мутации 4 как гомозиготы были описаны 1 человек из 52 в восточноазиатской популяции и 13 из 62 — в латиноамериканской.

Объяснение существования этих мутаций в основном в гетерозиготе, возможно, связано с тем, что данные мутации в гомозиготе приводят к летальному исходу или, по крайней мере, не могут быть унаследованы. На основе анализа фенотипов мутации 2 и 4 могут быть исключены как гомозиготы вследствие ранней смерти или бесплодия носителей. Мутация 4 является самой интересной, однако, это единственный вариант который не был широко гено-типирован. Трудно понять, почему данная мутация имеет высокую частоту в одной из популяций и почему количество проанализированных индивидуумов в популяции настолько мало. Поскольку количество проанализированных лиц невелико, то, возможно, что эти данные о частоте были получены из анализа пациентов с заболеванием (см. выше описание особенностей базы ExAC), поэтому никаких предсказаний для этого варианта нельзя сделать. Мутация 2 может быть описана как летальная в состоянии

гомозиготы. Мы предполагаем, что хотя мутации 1 и 3 неочевидно приводят к смерти, имеющиеся данные свидетельствуют, что эти мутации в гомозиготе приводят к смертельному исходу или к бесплодию.

ВЫВОДЫ

Определение патогенности мутации является сложной задачей. Иногда ни автоматизированный, ни ручной анализ не дают возможности отнести ее к числу однозначно патогенных или безвредных. Однако в отсутствие экспериментальных данных по изучению трансгенных организмов с изучаемой мутацией существующие базы данных все же могут быть полезны для анализа патогенности, но необходимо пользоваться ими с осторожностью. Автоматическое использование этих баз ограничено качеством данных, представленных в них. Важно вручную проверять утверждения о патогенности мутации, сделанные в экспериментальных статьях, особенно если они не согласуются с предсказанием, сделанным базой.

Литература

1. Choi Y, Sims GE, Murphy S, Miller JR, Chan AP. Predicting the functional effect of amino acid substitutions and indels. PLoS One. 2012; 7 (10): e46688.

2. Kumar P, Henikoff S, Ng PC. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nat. Protoc. 2009; 4 (7): 1073-81.

3. Adzhubei IA, Schmidt S, Peshkin L, Ramensky VE, Gerasimova A, Bork P, et al. A method and server for predicting damaging missense mutations. Nat. Methods. 2010; 7 (4): 248-9.

4. Online Mendelian Inheritance in Man, OMIM [Интернет]. Baltimore (MD): McKusick-Nathans Institute of Genetic Medicine, Johns Hopkins University. c1996-2016. [процитировано в феврале 2016 г]. Доступно по ссылке: http://omim.org/.

5. The Human Gene Mutation Database, HGMD [Интернет]. Cardiff (UK): Cardiff University. c2015 - [дата обращения: февраль 2016 г.]. Доступно по ссылке: http://www.hgmd.cf.ac.uk/ac/ index.php.

6. Exome Aggregation Consortium (ExAC) [Интернет]. Cambridge (MA). [обновлено 17 января 2016 г., процитировано в феврале 2016 г.]. Доступно по ссылке: http://exac.broadinstitute.org/.

7. Bcftools. Доступно по ссылке: http://samtools.github.io/ bcftools/.

8. Cingolani P, Platts A, Wang LL, Coon M, Nguyen T, Wang L, et al. A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff: SNPs in the genome of Drosophila melanogaster strain w1118; iso-2; iso-3. Fly (Austin). 2012; 6 (2): 80-92.

9. Adzhubei I, Jordan DM, Sunyaev SR. Predicting functional effect of human missense mutations using PolyPhen-2. Curr. Protoc. Hum. Genet. 2013; Chapter 7: Unit 7.20.

10. dbSNP Short Genetic Variants [Интернет]. Доступно поссылке: http://www.ncbi.nlm.nih.gov/projects/SNP/snp_ref.cgi?rs= 1050171.

11. Zhang W, Stabile LP, Keohavong P, Romkes M, Grandis JR, Traynor AM, et al. Mutation and polymorphism in the EGFR-TK domain associated with lung cancer. J. Thorac. Oncol. 2006; 1 (7): 635-47.

12. ClinVar [Интернет]. Доступно по ссылке: http://www.ncbi.nlm. nih.gov/clinvar/variation/45271/.

13. NM_005228.3(EGFR):c.2361G>A (p.Gln787=) Simple - Variation Report - ClinVar - NCBI. Доступно по ссылке: http://www.ncbi. nlm.nih.gov/clinvar/variation/45271/.

14. Pollard KS, Hubisz MJ, Rosenbloom KR, Siepel A. Detection of nonneutral substitution rates on mammalian phylogenies. Genome Res. 2010; 20 (1): 110-21.

15. Li Y, Wu G, Zuo J, Gao J, Chang Y, Fang F. Genetic variations of the CDC2L2 gene are associated with type 2 diabetes in a Han Chinese cohort. Diabetes. Metab. Res. Rev. 2007; 23 (6): 455-61.

16. He M-L, Chen Y, Chen Q, He Y, Zhao J, Wang J, et al. Multiple gene dysfunctions lead to high cancer-susceptibility: evidences from a whole-exome sequencing study. Am. J. Cancer Res. 2011; 1 (4): 562-73.

17. Pfotzer R, Myers E, Applebaum-Shapiro S, Finch R, Ellis I, Neoptolemos J, et al. Novel cationic trypsinogen (PRSS1) N29T and R122C mutations cause autosomal dominant hereditary pancreatitis. Gut. 2002; 50 (2): 271-2.

18. Hammoud S, Emery BR, Dunn D, Weiss RB, Carrell DT. Sequence alterations in the YBX2 gene are associated with male factor infertility. Fertil. Steril. 2009; 91 (4): 1090-5.

References

1. Choi Y, Sims GE, Murphy S, Miller JR, Chan AP. Predicting the functional effect of amino acid substitutions and indels. PLoS One. 2012; 7 (10): e46688.

2. Kumar P, Henikoff S, Ng PC. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nat. Protoc. 2009; 4 (7): 1073-81.

3. Adzhubei IA, Schmidt S, Peshkin L, Ramensky VE, Gerasimova A, Bork P, et al. A method and server for predicting damaging missense mutations. Nat. Methods. 2010; 7 (4): 248-9.

4. Online Mendelian Inheritance in Man, OMIM [Internet]. Baltimore

(MD): McKusick-Nathans Institute of Genetic Medicine, Johns Hopkins University. c1996-2016. [cited 2016 Feb]. Available from: http://omim.org/.

5. The Human Gene Mutation Database, HGMD [Internet]. Cardiff (UK): Cardiff University. c2015 - [cited 2016 Feb]. Available from: http://www.hgmd.cf.ac.uk/ac/index.php.

6. Exome Aggregation Consortium (ExAC) [Internet]. Cambridge (MA). [updated 2016 Jan 17, cited 2016 Feb]. Available from: http://exac.broadinstitute.org/.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7. Bcftools. Available from: http://samtools.github.io/bcftools/.

статья i молекулярная генетика

8. Cingolani P, Platts A, Wang LL, Coon M, Nguyen T, Wang L, et al. A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff: SNPs in the genome of Drosophila melanogaster strain w1118; iso-2; iso-3. Fly (Austin). 2012; 6 (2): 80-92.

9. Adzhubei I, Jordan DM, Sunyaev SR. Predicting functional effect of human missense mutations using PolyPhen-2. Curr. Protoc. Hum. Genet. 2013; Chapter 7: Unit 7.20.

10. dbSNP Short Genetic Variants [Internet]. Available from: http://www.ncbi.nlm.nih.gov/projects/SNP/snp_ref.cgi?rs= 1050171.

11. Zhang W, Stabile LP, Keohavong P, Romkes M, Grandis JR, Traynor AM, et al. Mutation and polymorphism in the EGFR-TK domain associated with lung cancer. J. Thorac. Oncol. 2006; 1 (7): 635-47.

12. ClinVar [Internet]. Available from: http://www.ncbi.nlm.nih.gov/ clinvar/variation/45271/.

NM_005228.3(EGFR):c.2361G>A (p.Gln787=) Simple - Variation

13. Report - ClinVar - NCBI. Available from: http://www.ncbi.nlm.nih. gov/clinvar/variation/45271/.

14. Pollard KS, Hubisz MJ, Rosenbloom KR, Siepel A. Detection of nonneutral substitution rates on mammalian phylogenies. Genome Res. 2010; 20 (1): 110-21.

15. Li Y, Wu G, Zuo J, Gao J, Chang Y, Fang F. Genetic variations of the CDC2L2 gene are associated with type 2 diabetes in a Han Chinese cohort. Diabetes. Metab. Res. Rev. 2007; 23 (6): 455-61.

16. He M-L, Chen Y, Chen Q, He Y, Zhao J, Wang J, et al. Multiple gene dysfunctions lead to high cancer-susceptibility: evidences from a whole-exome sequencing study. Am. J. Cancer Res. 2011; 1 (4): 562-73.

17. PfQtzer R, Myers E, Applebaum-Shapiro S, Finch R, Ellis I, Neoptolemos J, et al. Novel cationic trypsinogen (PRSS1) N29T and R122C mutations cause autosomal dominant hereditary pancreatitis. Gut. 2002; 50 (2): 271-2.

18. Hammoud S, Emery BR, Dunn D, Weiss RB, Carrell DT. Sequence alterations in the YBX2 gene are associated with male factor infertility. Fertil. Steril. 2009; 91 (4): 1090-5.

i Надоели баннеры? Вы всегда можете отключить рекламу.