СЕЛЬСКОХОЗЯЙСТВЕННАЯ БИОЛОГИЯ, 2015, том 51, № 2, с. 182-193
Геномная селекция
УДК 636.2:636.082.12:577.21 doi: 10.15389/agrobiology.2016.2.182rus
ПОЛНОГЕНОМНЫЙ АНАЛИЗ АССОЦИАЦИЙ С ПРОДУКТИВНЫМИ И РЕПРОДУКТИВНЫМИ ПРИЗНАКАМИ У МОЛОЧНОГО СКОТА В РОССИЙСКОЙ ПОПУЛЯЦИИ ГОЛШТИНСКОЙ ПОРОДЫ*
А.А. СЕРМЯГИН1, Е.А. ГЛАДЫРЬ1, С.Н. ХАРИТОНОВ1, А.Н. ЕРМИЛОВ1, Н.И. СТРЕКОЗОВ1, Г. БРЕМ1- 2, Н.А. ЗИНОВЬЕВА1
Полногеномный анализ ассоциаций (whole-genome associated study, GWAS) создавался как мощный инструмент для идентификации геномных вариаций, связанных с экономически важными признаками у различных видов сельскохозяйственных животных. Развитие методов геномной селекции открывает новые возможности для улучшения продуктивных и воспроизводительных качеств домашнего скота. Целью настоящих исследований было изучение полногеномных ассоциаций полиморфизмов единичных нуклеотидов (SNP) с племенной ценностью голштинских быков-производителей по признакам молочной продуктивности и воспроизводства. Скрининг SNP проводили с помощью Illumina BovineSNP50K v2 BeadChip у 195 быков-производителей, проверенных по качеству потомства, и 61 молодых быков, оцененных по родословной. Сбор и анализ информации по хозяйственно полезным качествам дочерей быков осуществляли на основе баз данных племенного учета в 77 хозяйствах Московской области. Племенную ценность (EBV) определяли по показателям молочной продуктивности и воспроизводительным качествам: удой за 305 сут лактации (MY), массовая доля жира (FC) и белка (PC), количество молочного жира (FY) и белка (PY), возраст первого отела (CA), трудность отела (CD), кратность осеменений (CR), продолжительность сервис-периода (DO) и стельности (GL), межотельный период (CI). Расчет EBV по каждому из признаков проводили по методологии BLUP Sire Model. Общее число SNP, отобранных по результатам контроля качества, составило 41370. Для расчета прямой геномной племенной ценности (DGV) по методу GBLUP выполняли построение геномной матрицы родства (G). Показатели комбинированной геномной племенной ценности (GEBV) получали на основе значений DGV и EBV. Для повышения достоверности данных GWAS и мощности поиска ассоциаций в целом в анализе использовали геномные оценки племенной ценности как для проверенных ранее, так и для молодых быков-производителей. Тестирование нулевых гипотез значимости ассоциаций осуществляли по критериям Бонферрони и ожидаемой доле ложных отклонений (LocFdr). Значения коэффициентов наследуемости для признаков воспроизводства колебались от 0,035 для CR до 0,221 для CA, тогда как для показателей молочной продуктивности они достигали более высоких значений — от 0,250 для FC до 0,401 для PC. На основании результатов тестов по Бонферрони и LocFdr было обнаружено несколько высокозначимых SNP для признаков молочной продуктивности и воспроизводства. Для MY установлены достоверные ассоциации ARS-BFGL-NGS-50172 на BTA17 и Hapmap54246-rs29017970 на BTA13. Для FC были картированы консервативные локусы на BTA-104917-no-rs и BTB-01604502 (58 Mb, BTA9), ARS-BFGL-NGS-107379 и ARS-BFGL-NGS-4939 (1,8-2,0 Mb, BTA14), для PC — Hapmap 43278-BTA-50082 (BTA20). Полиморфизмы ARS-BFGL-BAC-7205 (BTA1) и Hapmap48395-BTA-58382 (BTA5) оказались ассоциированы с PY. Получены данные по точной локализации мутаций для признаков репродукции: BTB-01622929 на BTA1 для CA, ARS-BFGL-NGS-89711 на BTA27 для CR, ARS-BFGL-NGS-117881 на BTA5 для DO, BTA-31636-no-rs на BTA1 и Hapmap26774-BTA-163037 на BTA27 для CI. Аддитивный эффект по ряду показателей превышал 9,0 %. В геноме отмечали референтные мутации с высокой степенью значимости в генах TRAFD1, LOC786966, DGAT1, SLC16A7, DUSP26 и CCDC58. Показано, что использование полногеномного анализа позволяет с высокой степенью точности картировать QTL признаков продуктивности и воспроизводства с низкой и умеренной наследуемостью.
Ключевые слова: полногеномный анализ, наследуемость, молочная продуктивность, воспроизводительные качества.
В традиционных программах селекции изучение продуктивных качеств у сельскохозяйственных животных ведется без идентификации влияния каких-либо функциональных генов. При этом в последнюю четверть
* Исследования выполнены при поддержке государства в лице Минобрнауки России (уникальный идентификационный номер проекта RFMEFI60414X0062).
века развитие молекулярно-генетических методов идет опережающими темпами: от определения отдельных генов, контролирующих единичные физиологические процессы, до локусов количественных признаков (quantitative trait loci, QTL) и мононуклеотидных замен (single nucleotide polymorphism, SNP), маркирующих комплекс продуктивных качеств животного (1-3). Установлено, что величина влияния единичного гена, отвечающего за количественные и качественные признаки у животного или группы крови, имеет невысокую долю генетической изменчивости, обусловливающую фенотипическое проявление признака (4, 5). В связи с этим отбор животных не гарантирует точного наследования продуктивного показателя в поколениях. Использование высокополиморфных маркеров — микросателлитов (short tandem repeats, STR) также не дает желаемого эффекта картирования QTL, поскольку, даже несмотря на возможное наличие у животного групп сибсов и полусибсов, анализ сцепления QTL и STR на хромосомах проводится в интервале 20 cM или выше, что делает сложным определение основных мутаций (6).
Полногеномный анализ ассоциаций (genome-wide association study, GWAS) представляет собой развитие метода маркер-зависимой селекции (marker-assisted selection, MAS), когда используемые генетические маркеры распределены по всему геному так, что все QTL находятся в неравновесном сцеплении (linkage disequilibrium, LD) по меньшей мере с одним из них. Исследования MAS сфокусированы на точном картировании некоторых QTL при условии, что ген, входящий в QTL, может быть идентифицирован. В свою очередь, эффективность GWAS зависит от числа SNP. Если SNP расположены на хромосоме слишком далеко друг от друга, то QTL не может быть в достаточном неравновесном сцеплении хотя бы с одним из маркеров и, как следствие, локус не будет найден. Увеличение плотности покрытия генома по SNP позволяет повысить вероятность определения QTL и в значительной степени — точность картирования (7, 8).
Так, у крупного рогатого скота на уровне пород найдены достоверные ассоциации с хозяйственными признаками при использовании 10000 SNP, но по оценке M.E. Goddard (6), для межпородного анализа у вида Bos taurus необходимы 300000 SNP. Число SNP около 50000 может быть вполне достаточным для работы с одной породой, например голштинской, однако для более точного картирования QTL и повышения достоверности геномных оценок племенной ценности преимущество отдается выборкам по нескольким породам и SNP-панелям высокой плотности (9-11).
Число животных, необходимое для изучения ассоциаций, зависит от степени влияния, которая выражается в доле изменчивости признака, раскрываемой точечными мутациями. Этот параметр сочетает в себе частоту аллеля и среднюю разность между SNP генотипами по количественному признаку. На практике некоторые SNP составляют более 4 % генетической дисперсии и выше, что на малой выборке служит достаточной величиной прогноза даже для низконаследуемых признаков (12-14).
Использование метода GWAS позволяет эффективно вести поиск значимых полиморфизмов как среди пород скота, так и внутри разных популяций животных голштинского происхождения (15-17). При этом для хозяйственно ценных признаков проводится картирование и для бычьего, и для маточного поголовья, связанное в первую очередь с поиском достоверных связей по продукции молочного жира и белка (18, 19).
Установлены консервативные регионы генома скота, имеющие значимые ассоциации с признаками молочной продуктивности: казеиновый кластер (CSN), диацилглицерол-О-ацилтрансфераза (DGAT1), рецеп-
тор гормона роста (GHR) и другие, а также ряд общепопуляционных мутаций, не описанных ранее (20-22). Изучение сопряженности по признакам с низкой наследуемостью позволяет повысить результативность селекции за счет детекции или элиминации генов, отвечающих за здоровье и воспроизводство животных, и закреплять ценные генотипы в популяции (23-27). Также представляют интерес исследования по поиску локусов, отвечающих за качественные признаки животных (28).
Необходимо отметить, что оценка влияния каждого маркера при расчете прогноза геномной племенной ценности или при ассоциативном анализе происходит одновременно с другими маркерами. Каждая мутация несет определенную долю компоненты генетической изменчивости, при этом допускается, что при влиянии множества SNP сумма всех эффектов в среднем должна быть мала. Это обстоятельство, однако, не препятствует получению ясной картины ассоциаций по изучаемым показателям (29-32).
Поиск и изучение ассоциаций по точечным генетическим мутациям с хозяйственно полезными признаками на голштинской популяции молочного скота в России ранее не проводили. Выполняя GWAS анализ, мы сочетали выборки по ранее проверенным и молодым быкам, чтобы подтвердить эффективность и возможность применения моделей прогноза геномной племенной ценности для селекции молочного скота голштин-ского происхождения. Эти первые результаты, полученные по полногеномному анализу, станут основой для картирования локусов количественных признаков, ответственных за формирование продуктивных и воспроизводительных качеств животных.
Целью нашей работы было исследование полногеномных ассоциаций единичных нуклеотидов с показателями оценки племенной ценности быков-производителей голштинской породы по признакам молочной продуктивности и воспроизводства.
Методика. Сбор и анализ информации по хозяйственно полезным качествам дочерей быков голштинской породы осуществлялся на основе баз данных племенного учета в 77 хозяйствах Московской области (первичные базы данных были предоставлены Региональным информационно-селекционным центром «Мосплеминформ»). С помощью биочипа Bovine SNP50K v2 BeadChip («Illumina Inc.», США) с плотностью 54609 SNP про-генотипировали 256 быков-производителей, принадлежащих ОАО «Головной центр по воспроизводству сельскохозяйственных животных» (пос. Быково, Московская обл.) и ОАО «Московское» по племенной работе (г. Ногинск, Московская обл.). Выборка включала 195 быков-производителей, проверенных по качеству потомства (n = 47998), со средним числом дочерей-первотелок от каждого, равным 246 гол., и 61 молодого быка, оцененных по родословной (Parent Average, PA). У дочерей быков были изучены следующие фенотипические признаки: удой за 305 сут лактации (milk yield, MY), массовая доля жира (fat content, FC) и белка (protein content, PC), количество молочного жира (fat yield, FY) и белка (protein yield, PY), возраст первого отела (calving age, CA), легкость отела (calving easy, CE), кратность осеменений (conception rate, CR), продолжительность сервис-периода (days open, DO) и стельности (gestation length, GL), межотельный период (calving interval, CI).
Значения племенной ценности (Estimated Breeding Value, EBV) быков-производителей рассчитывались по методологии BLUP Sire Model, после чего полученные оценки дерегрессировались, то есть были скорректированы на влияние систематических средовых эффектов (drpEBV) (33).
Уравнение модели смешанного типа для оценки племенной ценно-
сти быков было реализовано в среде языка программирования статистического пакета SAS IML (SAS University Edition) (34):
yljk = д + HYS, + b1Ak + b2DOk + sirej + eijk, [1]
где yijk — показатель признака k-й первотелки; д — популяционная константа; HYSj — фиксированный эффект i-го «стада-года-сезона» отела; bi и b2 — коэффициенты линейной регрессии; Ak — возраст первого отела k-й первотелки; DOk — продолжительность сервис-периода k-й первотелки; sirej — рандомизированный эффект j-го быка-производителя, имеющий нормальное распределение со средней, равной 0, и вариансой, равной Aca2, где A — аддитивная матрица родства; ер — эффект неучтенных факторов.
Контроль качества генотипирования и регрессионный анализ по ассоциациям проводили с помощью программы Plink v. 1.07 (35). По его результатам было отобрано 41370 SNP. Ранее мы установили, что точность геномной оценки племенной ценности для молодых быков (Genomic Enhanced Breeding Value, GEBV) на 9-45 % выше по сравнению с оценкой по предкам (36). В связи с этим в анализе ассоциаций использовали значения GEBV как для молодых, так и прошедших проверку быков.
Расчет геномной матрицы родства (G) проводили по алгоритму, разработанному P.M. VanRaden (37), в среде языка программирования R (38). Матрица состояла из элементов — оценок гомозиготных и гетерозиготных локусов: AA = 1, AB = 0, BB = -1. Коэффициенты наследуемости, генетические и паратипические вариансы были получены на основе двух-факторного иерархического дисперсионного комплекса. Оценки GEBV рассчитывались как комбинация прямого эффекта SNP-маркеров (Direct Genomic Value, DGV) и EBV (PA) согласно подходу GBLUP по следующей линейной модели (37):
DRP = Xb + Zu + e, [2]
где DRP — известный вектор псевдофенотипических данных drpEBV, расположенных на диагональной матрице W, с весовыми коэффициентами эффективного вклада информации по дочерям (effective daughter contribution): EDC = k x r2/(1 - r2) при вариационном отношении k = (4 - h2)/h2 (здесь r2 — достоверность оценки по признаку, h2 — наследуемость показателя); Xb — матрица, содержащая одну общую константу в модели; u — известный вектор прогнозов для DGV (G — геномная матрица родства), причем Z представляет собой единичную диагональную матрицу.
Система нормальных уравнений имеет следующий вид:
X'WX X'WZ Z'WX Z'WX + kG"1
X'WDRP Z'WDRP
[3]
Для подтверждения достоверного влияния SNP и определения значимых регионов в геноме скота были использованы несколько тестов для проверки нулевых гипотез: по Бонферрони (пороговое значение P < 1,2*10-6, 0'05/4137о), по ожидаемой доле ложных отклонений в модификации B. Efron (Local False discovery rate, LocFdr), оценка которой была проведена методом максимального правдоподобия, реализованного в пакете locfdr на языке R (39), и по показателю Fdr согласно подходу Y. Benjamini и Y. Hochberg (40) с пороговым значением эмпирических оценок P < 0,05.
Для поиска генов, тесно ассоциированных с хозяйственными признаками, использовали базу данных National Center for Biotechnology Information (NCBI). Функциональную идентификацию генов проводили по базе данных Discover EggNOG 4.1 (http://eggnogdb.embl.de/#/app/home). Визуализацию данных осуществляли в пакете qqman с помощью языка программирования R (41).
Результаты. Полученные коэффициенты наследуемости (h2) по
признакам молочной продуктивности и воспроизводства свидетельствовали о возможности проводить селекцию молочного скота в популяции в разных направлениях. Так, для улучшения признаков воспроизводства и фертильности, имеющих низкие h2 в пределах от 0,035±0,005 до 0,068±0,007, требуется сокращение генерационного интервала или(и) повышение интенсивности отбора животных. В тоже время по признакам молочной продуктивности, отличающимся умеренной наследуемостью, возможно прогнозировать более высокий селекционный ответ (табл. 1).
Коэффициенты генетической изменчивости отличались константностью для признаков FC, PC, CA, GL и CI. Вне зависимости от характера наследования хозяйственных качеств, по признакам FY, PY, DO, CR и CE наблюдалось повышение коэффициента вариации, что было связано со значимой долей влияния паратипических факторов.
По результатам анализа признаков молочной продуктивности установлены значимые ассоциативные связи с EBV быков-производителей. Согласно критерию Fdr с пороговым значением P < 0,05, для MY обнаружено 124 SNP, тогда как тесты по LocFdr и Бонферрони показали всего 2 SNP с высокими значениями достоверности (P < 1,2*10-6) — ARS-BFGL-NGS-50172 (Bos taurus autosome, BTA17) и Hapmap54246-rs29017970 (BTA13) (рис. 1). По FC и PC установлены консервативные локусы (P = 1,2х10-6-4,1х10-8) BTA-104917-no-rs и BTB-01604502 (58 Mb, BTA9), ARS-BFGL-NGS-107379 и ARS-BFGL-NGS-4939 (1,8-2,0 Mb, BTA14), Hapmap 43278-BTA-50082 (BTA20), при этом максимально возможное число значимых точечных мутаций, согласно критерию Fdr, составляло от 3 до 13.
1. Показатели наследуемости и изменчивости по признакам молочной продуктивности и воспроизводства в популяции скота голштинской породы
(Московская обл.)
Показатель h2±mh2 ар CvP ад CVa аи Cvu
Удой за 305 сут лактации, кг 0,281±0,014 1317 21 697 11 986 16
Массовая доля жира, % 0,250±0,013 0,37 9 0,19 5 0,27 7
Молочный жир, кг 0,328±0,015 57,8 23 33,1 13 39,6 16
Массовая доля белка, % 0,401±0,016 0,19 6 0,12 4 0,13 4
Молочный белок, кг 0,370±0,016 43,8 22 26,6 13 29,6 15
Возраст первого отела, мес 0,221±0,012 3,8 14 1,8 6 2,9 11
Трудность отела, балл 0,068±0,007 1,03 242 0,27 63 0,89 210
Кратность осеменений, ед. 0,035±0,005 1,27 63 0,24 12 1,23 61
Сервис-период, сут 0,059±0,006 86,5 56 20,9 14 83,4 54
Продолжительность стельности, сут 0,036±0,005 12,7 5 2,4 1 12,5 5
Межотельный период, сут 0,063±0,007 82,4 19 20,6 5 79,2 19
Примечание. h2 — коэффициент наследуемости, mh2 — ошибка коэффициента наследуемости, ар, ад и аи — соответственно оценки фенотипического, генетического и паратипического стандартных отклоне-
ний; ^ — коэффициент изменчивости, %.
По БУ не выявлено каких-либо ассоциаций, тогда как для РУ получены 48 SNP, расположенных преимущественно на 5-й и 13-й аутосомах (Fdr, Р < 0,05). Однако, согласно критериям, рассчитанным по Бонферрони и LocFdr, число высокозначимых полиморфизмов снизилось до 4: ARS-BFGL-BAC-7205 (119 МЬ, ВТА1), Hapmap48395-BTA-58382 (54 МЬ, ВТА5), Hapmap54246-rs29017970 (30 МЬ, ВТА13) и ARS-BFGL-NGS-50172 (64 МЬ, ВТА17). По двум последним SNP имелись характерные ассоциации с удоем за стандартную лактацию, что свидетельствует о тесной генетической взаимосвязи и эффективности селекции по количеству молочного белка.
GWAS по воспроизводительным качествам и фертильности дочерей быков выявил регионы в геноме крупного рогатого скота с локализацией от 9 (по GL) до 66 (по DO) SNP со значением ожидаемой доли
ложных отклонений Р < 0,05 (рис. 2). Использование более мощных критериев оценки нулевой гипотезы позволило точно локализовать мутации для СА (BTB-01622929, 117 МЬ, ВТА1), СЯ (ARS-BFGL-NGS-89711, 29 МЬ ВТА27), DO (ARS-BFGL-NGS-117881, 82 МЬ, ВТА5) и С1 (ВТЛ-31636-по-л5, 67 МЬ, ВТА1; Hapmap26774-BTA-163037, 42 МЬ, ВТА27). По признаку GL была определена значимая нуклеотидная замена (ВТЛ-31636-по-г5), аналогичная выявленной для С1. По показателю СЕ не удалось обнаружить достоверных ассоциаций, что, по нашему мнению, связано с высоким влиянием паратипических факторов на признак.
Достоверность оценок ассоциаций по хозяйственно полезным признакам приближалась к нормальному распределению и имела слабое отклонение от теоретически ожидаемого, как показано на графиках квантиль-квантиль ^^ график, см. рис. 1, 2).
А
1 2 3 4 5 6 7 8 9 10 12 14 16 18 20 22 24 26 28 X 0 1 2 3 4 5 6 7
Хромосома Ожидаемая вероятность
распределения
Рис. 1. Результаты GWAS (genome-wide association study, слева) и соответствующие вероятности распределения достоверности оценок (q-q график, справа) по удою (А), массовой доле жира (Б), массовой доле белка (В) и количеству молочного белка (Г) в популяции скота голштинской породы (Московская обл.): 1 и 2 — порог соответственно по Бонферрони и Fdr. Квадраты означают соответствие по достоверности критерию проверки нулевой гипотезы по Бонферрони (высокодостоверные результаты по ассоциациям).
Значимые однонуклеотидные полиморфизмы были локализованы как внутри отдельных генов, так и в ближайших к ним регионах. Аддитивная доля влияния каждого маркера составила от 8,9 до 11,3 % общей изменчивости признаков. Значения регрессионного эффекта маркера для оценок племенной ценности имели как положительную, так и отрицательную величину, что указывает на возможность использования в отборе лучших животных, а также поиска и элиминации вредных мутаций. Достоверность ассоциаций колебалась в пределах от 1,2*10-6 до 7,6*10-8. Частоты минорных аллелей по локусам составляли 0,053-0,445 (табл. 2).
2. Достоверные ассоциации полиморфизмов единичных нуклеотидов ^Р^, сопряженных с оценкой количественных признаков, по точечным мутациям и их геномная локализация (популяция скота голштинской породы!, Московская обл.)
SNP BTA Позиция Аллель Частота ал-леля, Х±ш Эффект, Жш P R2, % Ближайший ген Расстояние до гена, п.н.
Удой за 3 0 5 сут лактации, кг
ARS-BFGL-
NGS-50172 17 64342186 C 0,275±0,020 -132,6±23,9 7,6х10-8 10,9 TRAFD1 10778
Hapmap54246-
rs29017970 13 30878341 G 0,126±0,015 +172,3±32,0 1,7х10-7 10,4 L0C104973750 Внутри гена
Массовая доля жира, %
BTA-104917-
no-rs 9 58113021 A 0,304±0,020 +0,036±0,006 4,1х10-8 11,3 EPHA7 279992
ARS-BFGL-
NGS-107379 14 2054457 G 0,387±0,022 +0,030±0,006 5,9х10-7 9,5 LOC786966 298
BTB-01604502 9 58145538 A 0,368±0,021 +0,033±0,007 1,1х10-6 9,0 EPHA7 312509
ARS-BFGL-
NGS-4939 14 1801116 G 0,347±0,021 +0,029±0,006 1,2х10-6 8,9 DGAT1 Внутри гена
М а с с о в а я д о л я б е л к а, %
Hapmap43278-
BTA-50082 20 25185940 A 0,053±0,010 +0,033±0,007 8,0х10-7 9,3 ARL15 Внутри гена
Количество молочного белка, кг
Hapmap48395-
BTA-58382 5 54120342 G 0,382±0,022 -3,7±0,7 4,6х10-7 9,7 SLC16A7 Внутри гена
ARS-BFGL-
NGS-50172 17 64342186 С 0,275±0,020 -3,9±0,8 6,4х10-7 9,5 TRAFD1 10778
Hapmap54246-
rs29017970 13 30878341 G 0,127±0,015 +5,1±1,0 8,4х 10-7 9,3 L0C104973750 Внутри гена
ARS-BFGL-
BAC-7205 1 119976661 С 0,416±0,022 +3,5±0,7 1,2х10-6 9,1 HPS3 Внутри гена
Возраст первого отела, мес
BTB-01622929 1 117345968 A 0,445±0,022 -0,49±0,09 3,7х10-7 9,8 L0C104970999 56
Кратность осеменений, ед.
ARS-BFGL-
NGS-89711 27 29231663 G 0,376±0,022 +0,041±0,008 2,1х10-7 10,2 DUSP26 261502
Продолжительность сервис-периода , сут
ARS-BFGL-
NGS-117881 5 82631679 A 0,302±0,020 +2,1±0,4 1,7х10-7 10,4 PPFIBP1 Внутри гена
Продолжительность межотельного периода, сут
Hapmap26774-
BTA-163037 27 42578430 A 0,136±0,015 +0,7±0,1 1,1х 10-6 9,0 L0C101905415 6930
BTA-31636-no-
rs 1 67399528 С 0,380±0,022 -0,5±0,1 1,2х10-6 9,0 CCDC58 Внутри гена
Продолжительность стельности, сут
ВТА-31636-по-
к_ 1 67399528 С 0,380±0,022 -0,4±0,1 1,3х10-6 9,0 CCDC58 Внутри гена
Примечание. ВТА — хромосома крупного рогатого скота, Р — вероятность ошибки теста по нулевой гипотезе, R2 — коэффициент детерминации (доля влияния маркера). Для обозначения генов использованы официально принятые аббревиатуры.
Анализ SNP, сопряженных с оценкой количественных признаков скота голштинской популяции, выявил ряд генов, участвующих в различных биологических процессах (табл. 2): TRAF отвечает за иммунный ответ, биорегуляцию и синтез белков; EPHA7 контролирует механизм передачи клеточных сигналов и регуляцию метаболических процессов; LOC786966 связан с цитоскелетом и белковыми структурами эпителиальных клеток; DGAT1 контролирует транспорт липидов и их метаболизм;
ARL15 отвечает за внутриклеточный обмен, секрецию и везикулярный аппарат; SLC16A7 влияет на метаболизм и транспорт углеводов; HPS3 связан с клеточными процессами и пигментацией; DUSP26 отвечает за защитные механизмы на молекулярном уровне, а также за метаболические процессы фосфат содержащих соединений; CCDC58 контролирует клеточный цикл, деление клеток, фазу мейоза, связанную с разделением хромосом. Из вышеперечисленных генов три (LOC786966, DGAT1, SLC16A7) были референтными для скота голштинской породы, что показано в аналогичных исследованиях J.B. Cole (20), проведенных на североамериканской популяции животных. В целом следует отметить, что по большинству признаков ассоциации могут быть коррелированными, т.е. являться частью общей системы взаимосвязи биологических процессов в организме животного.
Рис. 2. Результаты GWAS (genome-wide association study, слева) и соответствующие вероятности распределения достоверности оценок (q-q график, справа) по возрасту первого отела (А), числу осеменений (Б), продолжительности сервис- (В) и межотельного (Г) периодов в популяции скота голштинской породы (Московская обл.): 1 и 2 — порог соответственно по Бонферрони и Fdr. Квадраты означают соответствие по достоверности критерию проверки нулевой гипотезы по Бонферрони (высокодостоверные результаты по ассоциациям).
Таким образом, нами получены данные по картированию локусов количественных признаков (молочная продуктивность и воспроизводство) у крупного рогатого скота голштинской породы. Установлены высокодостоверные ассоциации по 14 SNP на хромосомах 1-й, 5-й, 9-й, 13-й, 14-й, 17-й, 20-й и 27-й с аддитивным эффектом более 9 % по ряду показателей. Наибольшей консервативностью в геноме по референтным мутациям обладали гены TRAFD1, LOC786966, DGAT1, SLC16A7, DUSP26 и CCDC58. Полногеномные исследования, выполненные для признаков с разной степенью наследуемости, позволяют достаточно точно определять ассоциации по генетическим мутациям. Использование критерия оценки нулевых гипотез по ожидаемой доле ложных отклонений согласно функции максимального правдоподобия позволяет расширить детекцию по SNP. Тест по Бонферрони обладает более высокой мощностью проверки статистических гипотез.
ЛИТЕРАТУРА
1. Марзанов Н.С., Девришов Д.А., Марзанова С.Н., Комкова Е.А., Озеров М.Ю., Кантанен Ю. Генетическое маркирование, сохранение разнообразия и проблемы разведения животных. Сельскохозяйственная биология, 2011, 2: 3-14.
2. С т о л п о в с к и й Ю.А. Концепция и принципы генетического мониторинга для сохранения in situ пород доместицированных животных. Сельскохозяйственная биология, 2010, 6: 3-8.
3. Зиновьева Н.А., Стрекозов Н.И., Янчуков И.Н., Ермилов А.Н., Ес-кин Г.В. Система геномной оценки скота: первые результаты. Животноводство России, 2015, 3: 27-29.
4. Кузнецов В.М. Племенная оценки животных: прошлое, настоящее, будущее (обзор). Проблемы биологии продуктивных животных, 2012, 4: 18-57.
5. Sermyagin A.A., Seltsov V.I., Kostyunina O.V., Gladyr E.A., Kharzino-v a V.R., Zinovieva N.A. Effect of LALBA polymorphism on the milk production traits of Russian cattle population. Book of Abstract «International scientific genetic conference «XXVI. GENETIC DAYS». Prague, Czech Republic, 2014: 135-138.
6. Goddard M.E., Hayes B.J. Mapping genes for complex traits in domestic animals and their use in breeding programmes. Nature Reviews Genetics, 2009, 10: 381-391 (doi: 10.1038/nrg2575).
7. W e 11 e r J.I. Quantitative trait loci analysis in animals. 2nd ed. CABI, UK, 2009.
8. Hayes B.J., Bowman P.J., Chamberlain A.J., Goddard M.E. Invited review: Genomic selection in dairy cattle: Progress and challenges. J. Dairy Sci., 2009, 92: 433-443 (doi: 10.3168/jds.2008-1646).
9. Pryce J.E., Gredler B., Bolormaa S., Bowman P.J., Egger-Danner C., Fuerst C., Emmerling R., S оlkner J., Goddard M.E., Hayes B.J. Short communication: Genomic selection using a multi-breed, across-country reference population. J. Dairy Sci., 2011, 94: 2625-2630 (doi: 10.3168/jds.2010-3719).
10. P é rez O'Brien A.M., Utsunomiya Y.T., M é sz a ros G., Bickhart D.M., Liu G.E., Van Tassell C.P., Tad S., Sonstegard T.S., da Silva M.V.B., Gar-c i a J.F., S о l k n e r J. Assessing signatures of selection through variation in linkage disequilibrium between taurine and indicine cattle. Genetics Selection Evolution, 2014, 46: 19 (doi: 10.1186/1297-9686-46-19).
11. Boison S.A., Santos D.J.A., Utsunomiya A.H.T., Carvalheiro R., Neves H.H.R., Perez O'Brien A.M., Garcia J.F., S о lkner J., da Silva M.V.G.B. Strategies for single nucleotide polymorphism (SNP) genotyping to enhance genotype imputation in Gyr (Bos indicus) dairy cattle: Comparison of commercially available SNP chips. J. Dairy Sci., 2015, 98: 4969-4989 (doi: 10.3168/jds.2014-9213).
12. Pryce J.E., Bolormaa S., Chamberlain A.J., Bowman P.J., Savin K., God-d a r d M.E., H a y e s B.J. A validated genome-wide association study in 2 dairy cattle breeds for milk production and fertility traits using variable length haplotypes. J. Dairy Sci., 2010, 93: 3331-3345 (doi: 10.3168/jds.2009-2893).
13. Bolormaa S., Pryce J.E., Hayes B.J., Goddard M.E. Multivariate analysis of a genome-wide association study in dairy cattle. J. Dairy Sci., 2010, 93: 3818-3833 (doi: 10.3168/jds.2009-2980).
14. Chamberlain A.J., Hayes B.J., Savin K., Bolormaa S., McPartlan H.C., Bowman P.J., Van Der Jagt C., MacEachern S., Goddard M.E. Validation of
single nucleotide polymorphisms associated with milk production traits in dairy cattle. J. Dairy Sci., 2012, 95: 864-875 (doi: 10.3168/jds.2010-3786).
15. Qanbari S., Pimentel E.C.G., Tetens J., Thaller G., Lichtner P., Shari-fi A.R., Simianer H. A genome-wide scan for signatures of recent selection in Holstein cattle. Animal Genetics, 2010, 41(4): 377-389 (doi: 10.1111/j.1365-2052.2009.02016.x).
16. Maxa J., Neuditschko M., Russ I., F ö rster M., Medugorac I. Genome-wide association mapping of milk production traits in Braunvieh cattle. J. Dairy Sci., 2012, 95: 53575364 (doi: 10.3168/jds.2011-4673).
17. Fang M., Fu W., Jiang D., Zhang Q., Sun D., Ding X., Liu J. A multiple-SNP approach for genome-wide association study of milk production traits in Chinese Holstein cattle. PLoS ONE, 2014, 9(8): e99544 (doi: 10.1371/journal.pone.0099544).
18. Schopen G.C.B., Visker M.H.P.W., Koks P.D., Mullaart E., van Arend-o n k J.A.M., B o v e n h u i s H. Whole-genome association study for milk protein composition in dairy cattle. J. Dairy Sci., 2011, 94: 3148-3158 (doi: 10.3168/jds.2010-4030).
19. Maurice-Van Eijndhoven M.H.T., Bovenhuis H., Veerkamp R.F., Cal u s M.P.L. Overlap in genomic variation associated with milk fat composition in Holstein Friesian and Dutch native dual-purpose breeds. J. Dairy Sci., 2015, 98: 6510-6521 (doi: 10.3168/jds.2014-9196).
20. Cole J.B., Wiggans G.R., Ma L., Sonstegard T.S., Lawlor T.J. Jr., Cro-oker B.A., Van Tassell C.P., Yang J., Wang S., Matukumalli L.K., Da Y. Genome-wide association analysis of thirty one production, health, reproduction and body conformation traits in contemporary U.S. Holstein cows. BMC Genomics, 2011, 12: 408 (doi: 10.1186/1471-2164-12-408).
21. Wang X., Wurmser C., Pausch H., Jung S., Reinhardt F., Tetens J., Thaller G., Fries R. Identification and dissection of four major QTL affecting milk fat content in the German Holstein-Friesian population. PLoS ONE, 2012, 7(7): e40711 (doi: 10.1371/journal.pone.0040711).
22. Cole J.B., Waurich B., We ns ch - D o re ndo rf M., Bickhart D.M., Swal-v e H.H. A genome-wide association study of calf birth weight in Holstein cattle using single nucleotide polymorphisms and phenotypes predicted from auxiliary trait. J. Dairy Sci., 2014, 97: 3156-3172 (doi: 10.3168/jds.2013-7409).
23. Sahana G., G u l db r a nd t s e n B., Lund M.S. Genome-wide association study for calving traits in Danish and Swedish Holstein cattle. J. Dairy Sci., 2011, 94: 479-486 (doi: 10.3168/jds.2010-3381).
24. Fritz S., Cap it an A., Djari A., Rodriguez S.C., Barb at A., Baur A., Grohs C., Weiss B., Boussaha M., Esquerre D., Klopp C., Rocha D., B o i c h a r d D. Detection of haplotypes associated with prenatal death in dairy cattle and identification of deleterious mutations in GART, SHBG and SLC37A2. PLoS ONE, 2013, 8(6): e65550 (doi: 10.1371/journal.pone.0065550).
25. M e sz a ros G., Eaglen S., Waldmann P., S ö lkner J. A genome wide association study for longevity in cattle. Open Journal of Genetics, 2014, 4: 46-55 (doi: 10.4236/ojgen.2014.41007).
26. Sahana G., G u l db r a n d t s e n B., Thomsen B., Holm L-E., Panitz F., Br 0 n d u m R.F., Bendixen C., Lund M.S. Genome-wide association study using high-density single nucleotide polymorphism arrays and whole-genome sequences for clinical mastitis traits in dairy cattle. J. Dairy Sci., 2014, 97: 7258-7275 (doi: 10.3168/jds.2014-8141).
27. Suchocki T., Szyda J. Genome-wide association study for semen production traits in Holstein-Friesian bulls. J. Dairy Sci., 2015, 98: 5774-5780 (doi: 10.3168/jds.2014-8951).
28. M e sz a ros G., Petautschnig E., S c h w a rz e nb a c h e r H., S ö lkner, J. Ge-nomic regions influencing coat color saturation and facial markings in Fleckvieh cattle. Animal Genetics, 2015, 46(1): 65-68 (doi: 10.1111/age.12249).
29. Misztal I., Legarra A., Aguilar I. Computing procedures for genetic evaluation including phenotypic, full pedigree, and genomic information. J. Dairy Sci., 2009, 92: 4648-4655 (doi: 10.3168/jds.2009-2064).
30. Aguilar I., Misztal I., Johnson D.L., Legarra A., Tsuruta S., Lawlor T.J. Hot topic: A unified approach to utilize phenotypic, full pedigree, and genomic information for genetic evaluation of Holstein final score. J. Dairy Sci., 2010, 93: 743-752 (doi: 10.3168/jds.2009-2730).
31. Legarra A., Ducrocq V. Computational strategies for national integration of phenotypic, genomic, and pedigree data in a single-step best linear unbiased prediction. J. Dairy Sci., 2012, 95: 4629-4645 (doi: 10.3168/jds.2011-4982).
32. P r ibyl J., Madsen P., Bauer J., P r ibylov a J., S ime c kov a M., Vostr y L., Zavadilov a L. Contribution of domestic production records, Interbull estimated breeding values, And single nucleotide polymorphism genetic markers to the single-step genomic evaluation of milk production. J. Dairy Sci., 2013, 96: 1865-1873 (doi: 10.3168/jds.2012-6157).
33. Garrick D.J., Taylor J.F., Fernando R.L. Deregressing estimated breeding values
and weighting information for genomic regression analyses. Genetics Selection Evolution, 2009, 41: 55 (doi: 10.1186/1297-9686-41-55).
34. SAS/STAT 9.1 User's Guide. SAS Institute Inc., Cary, NC, 2005.
35. Purcell S., Neale B., Todd-Brown K., Thomas L., Ferreira M., Bender D., Maller J., Sklar P., de Bakker P., Daly M.J., Sham P.C. PLINK: a toolset for whole-genome association and population-based linkage analysis. American Journal of Human Genetics, 2007, 81(3): 559-575 (doi: 10.1086/519795).
36. Сермягин А.А., Гладырь Е.А., Харитонов С.Н., Ермилов А.Н., Янчу-к о в И.Н., Стрекозов Н.И., Зиновьева Н.А. Использование геномной оценки для совершенствования племенных качеств скота голштинской и черно-пестрой пород России. Мат. Межд. науч.-практ. конф. «Пути продления продуктивной жизни коров на основе оптимизации разведения, технологий содержания и кормления животных». Дуб-ровицы, 2015: 115-120.
37. VanRaden P.M. Efficient methods to compute genomic predictions. J. Dairy Sci., 2008, 91: 4414-4423 (doi: 10.3168/jds.2007-0980).
38. The R Project for Statistical Computing: Free software environment for statistical computing and graphics (http://www.r-project.org).
39. Efron B., Turnbull B.B., Narasimhan B. Locfdr: Computes local false discovery rates. R package version 1.1-7. 201 (http://CRAN.R-project.org/package=locfdr).
40. Benjamini Y., Hochberg Y. Controlling the false discovery rate: a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society, Series B, 1995, 57: 289-300.
41. Turner S.D. qqman: an R package for visualizing GWAS results using Q-Q and Manhattan plots. bioRxiv, 2014. Preprint first posted online May 14, 2014 (doi: 10.1101/005165).
ФГБНУ Всероссийский НИИ животноводства Поступила в редакцию
им. академика Л. К. Эрнста, 7 сентября 2015 года
142132 Россия, Московская обл., Подольский р-н,
пос. Дубровицы,
e-mail: alex_sermyagin85@mail.ru;
2Institut für Tierzucht und Genetik, Veterinärmedizinische Universität Wien (VMU), Veterinärplatz, A-1210, Wien, Österreich
Sel'skokhozyaistvennaya biologiya [Agricultural Biology], 2016, V. 51, № 2, pp. 182-193
GENOME-WIDE ASSOCIATION STUDY FOR MILK PRODUCTION AND REPRODUCTION TRAITS IN RUSSIAN HOLSTEIN CATTLE
POPULATION
A.A. Sermyagin1, E.A. Gladyr'1, S.N. Kharitonov1, A.N. Ermilov1, N.I. Strekozov1,
G. Brem1 2, N.A. Zinovieva1
1L.K. Ernst All-Russian Research Institute of Animal Husbandry, Federal Agency of Scientific Organizations, pos.
Dubrovitsy, Podolsk Region, Moscow Province, 142132 Russia, e-mail alex_sermyagin85@mail.ru
2Institute of Animal breeding and Genetics, University of Veterinary Medicine, Veterinärplatz, A-1210, Vienna,
Austria
Acknowledgements:
Supported by the Russian Ministry of Education and Science, project number RFMEFI60414X0062.
Received September 7, 2015 doi: 10.15389/agrobiology.2016.2.182eng
Abstract
Genome-wide association study (GWAS) has been proven as a powerful tool for identifying genomic variants associated with economically important traits in domestic animal species. Development of the methods for genomic evaluation opens the new opportunities in improvement of milk production and fertility traits of livestock. The objective of our study was to evaluate the whole-genome associations between single nucleotide polymorphisms (SNPs) and estimated breeding values (EBVs) for milk production and reproduction traits in Russian Holsteins. SNPs screening was performed in 195 progeny-tested and 61 young bulls using Illumina Bovine SNP50 v2 BeadChip. EBVs were calculated for milk production traits (305-d milk yield (MY), milk fat content (FC), milk protein content (PC), milk fat yield (FY) and milk protein yield (PY)) and reproduction performances (age at fist calving (CA), calving difficulty (CD), conception rate (CR), days open (DO), gestation length (GL) and interval between calving (CI)) using BLUP Sire Model approach. In total, 41370 SNPs were selected for the association analysis based on the quality control results. Direct genomic values (DGV) were calculated by GBLUP approach using genomic relationship matrix (G). Ge-nomic EBVs (GEBVs) were calculated as combination of residual polygenic effects (EBV) with the
DGV. To increase the probabilities of GWAS values we used the GEBV values for young bulls, whereas deregressed DGV values were used for progeny-tested bulls. The Bonferroni correction test for detection of significant associations and local false discovery rate (LocFdr) were used to check a type I errors in null-cases hypothesis. Heritability coefficient values for reproduction traits ranged from 0.035 for CR to 0.221 CA, whereas for milk production traits they were higher, i.e. from 0.250 for MY to 0.401 for PC. According to the Bonferroni and LocFdr tests, we have identified several high-significant SNPs, which were associated both with milk production and with fertility traits. Two SNPs with the most significant effect on MY were located on BTA17 (ARS-BFGLNGS-50172) and BTA13 (Hapmap54246-rs29017970). The association analysis for milk components revealed four SNPs at conservative regions, which were significantly associated with FC, i.e. BTA-104917-no-rs and BTB-01604502 (58 Mb, BTA9), ARS-BFGL-NGS-107379 and ARS-BFGL-NGS-4939 (1.8-2.0 Mb, BTA14), and one SNP, which was significantly associated with PC — Hapmap 43278-BTA-50082 (BTA20). Polymorphisms ARS-BFGL-BAC-7205 (BTA1) and Hapmap48395-BTA-58382 (BTA5) were associated with PY. Several SNPs were found to be associated with reproduction traits, i.e. BTB-01622929 on BTA1 for CA, ARS-BFGL-NGS-89711 on BTA27 for CR, ARS-BFGL-NGS-117881 on BTA5 for DO, BTA-31636-no-rs on BTA1 and Hapmap26774-BTA-163037 on BTA27 for CI. The significant effects of SNPs explained up to more than 9.0 % of additive genetic variances. Some of the referent mutations with most significant effect were located within or close to the genes TRAFD1, DGAT1, SLC16A7, DUSP26 and CCDC58. Thus, application of a genome-wide analysis allows with high accuracy to detect the QTL for medium and low heritable productive and reproductive traits in Russian Holsteins.
Keywords: genome-wide association analysis, heritability, milk production, fertility traits.
АГРОБИОТЕХ-2015 (БИОМЕДИЦИНСКИЙ КЛАСТЕР СКОЛКОВО): ИТОГИ
Конкурсный отбор — это совместная инициатива фонда и профессионального сообщества для выбора наиболее привлекательных проектов в области агробиотехнологий с целью последующей поддержки их развития.
Жюри:
Дмитрий Иванович Поверин (заведующий лабораторией ГНУ ВНИИЭСХ РАН, профессор РЭУ им. Г.В. Плеханова), Александр Васильевич Кураков (заведующий кафедрой микологии и альгологии МГУ им. М.В. Ломоносова), Сергей Анатольевич Кукушкин (руководитель технического отдела продуктов для свиноводства в странах СНГ ООО «Берингер Ингельхайм»), Вячеслав Станиславович Косоруков (руководитель подразделения токсикологических и биологических испытаний Центра контроля качества ООО «БИОЛАИФ»), Михаил Михайлович Харченко (старший инвестиционный менеджер Фонда «ВЭБ Инновации»), Михаил Викторович Приданников (заместитель директора по научной работе ВНИИ фитопатологии), Дмитрий Юрьевич Рязанцев (научный сотрудник ИБХ им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН), Сергей Александрович Барталев (заведующий Лабораторией спутникового мониторинга наземных экосистем Института космических исследований РАН), Александр Иванович Нетрусов (заведующий кафедрой микробиологии МГУ им. М.В. Ломоносова).
Подано заявок — 103
(http://sk.rU/foundation/events/october2015/agrobiotech2015/m/documents/14630.aspx ) Подлежащих передаче на заочный отбор — 91
(http://sk.rU/foundation/events/october2015/agrobiotech2015/m/documents/14629.aspx Подлежащих передаче в финал — 90 заявок
(http://sk.ru/foundation/events/october2015/agrobiotech2015/m/documents/14662.aspx) Победители:
■ ООО «АгроБиоТех-2020» (технологическая платформа по созданию удвоенных гаплоидов для ускоренной селекции сельскохозяйственных культур) в номинации «Технологии выведения и селекции новых сортов сельскохозяйственных растений, пород животных и штаммов микроорганизмов»;
■ ООО «Соликс БиоСистемз Восток» (комплексные кормовые добавки на основе микроводорослей) в номинации «Технологии улучшения почв, защиты, питания и полива сельскохозяйственных растений; кормления, диагностики, и лечения сельскохозяйственных животных и аквакультуры»;
■ ООО «БиоЭнергия» (WiseSoil) в номинации «Технологии переработки сельскохозяйственного сырья и промышленной биотехнологии»;
■ Трубников Алексей Владимирович (создание информационной системы для техно-логизации управления растениеводством на агропредприятиях (Agronote)) в номинации «Цифровые сельскохозяйственные технологии: точное земледелие, системы геотаргетинга, обработки данных и управления процессами пищевого и сельскохозяйственного производства; мониторинг лесоразработок».