https://doi.org/10.30766/2072-9081.2021.22.2.167-187 УДК 636.082:575.174.015.3
Оценка генетической дифференциации популяций молекулярным дисперсионным анализом (аналитический обзор) О 2021. В. М. Кузнецови
ФГБНУ «Федеральный аграрный научный центр Северо-Востока имени Н. В. Рудницкого», г. Киров, Российская Федерация
В этом исследовании мы сравнили разные подходы к использованию анализа молекулярной дисперсии (Analysis of Molecular Variance, AMOVA) для оценки генетической дифференциации популяций. Были использованы данные по 11 микросателлитным локусам 84 быков семи пород. Сравнивали результаты по трём опциям модуля AMOVA программы GenAlEx 6.502: по матрице дистанций между аллелями (рассчитывалась Fst(w&q (=6) статистика - вариант AMOVA1); по матрице дистанций между генотипами (Фрт - AMOVA2); по матрице различий в размерах аллелей (Rst - AMOVA3). Получены сходные сводные оценки генетической дифференциации пород: Fst(iv&c) = 0,108, Фрт = 0,115, Rst = 0,110 (все срреГт < 0,001). Между полокусными оценками Fst(w&q и Фрт коэффициент корреляции был 0,99 (praiue < 0,0001); статистически значимых корреляций с Rst не установлено. Обнаружена высокая корреляция Fst(w&q и Фрт с полокусными оценками дифференциации по Нею (0,96). Иные, чем GenAlEx программы (4rlequin v.3.5, GenePop v.4.7.3, RST22), давали схожих AMOVA-оценки. Установлена негативная линейная зависимость Fst(w&q и Фрт оценок от уровня средней гетерозиготности породных выборок (R2 = 0,6, rs = -0,75 приpraiue < 0,02) и отсутствие таковой для Rs-r-оценок (R2 = 0,04, rs = -0,23 приpraiue = 0,47). Стандартизация оценок Fst(iv&c) и Фрт по Хедрику устранила эту зависимость и повысила первоначальные оценки до 0,35 и 0,37 соответственно. Последние были сопоставимы с оценками, полученными мепюдами Нея-Хедрика (0,364-0,375), Джоста (0,292) и Морисита-Хорна (0,308). Корреляции Мантеля между матрицами парных по породам генетических дистанций (GD), рассчитанными разными мерами, в большинстве случаев были >0,9. Проекции матриц GD в анализе главных координат (РСоА) на 2D плоскости были в общем сходными. РСоА выделил кластер голштинских «экотипов», кластер «красных» пород и ветку джерсейской породы. В двухфакторном AMOVA данных по кластерам (как двух «регионов») межрегиональная GD составила 0,357; дифференциация пород в пределах «регионов» не превышала 0,027. Моделирование объединения пород с близкими к нулю GD привело к увеличению числа аллелей на локус в «новых» породах на 29 % и повышению сводной оценки генепшческой дифференциации на 29-46 %. Полученные результаты могут быть использованы при разработке мероприяпшй по сохранению вытесняемых пород.
Ключевые слова: разведение животных, микросателлиты, разнообразие, генетическая дифференциация, генетическая дистанция, AK-10VA, анализ гпавных координат, сохранение генофонда
Благодарности работа выполнена при поддержке Минобрнауки РФ в рамках Государственного задания ФГБНУ «Федеральный аграрный научный центр Северо-Востока имени Н. В. Рудницкого» (тема № 0767-2019-0089).
Автор благодарит рецензентов за вклад в экспертную оценку работы.
Конфликт интересов: автор заявил об отсутствии конфликта интересов.
Для цитирования: Кузнецов В. М. Оценка генетической дифференциации популяций молекулярным дисперсионным анализом (аналитический обзор). Аграрная наука Евро-Северо-Востока. 2021;22(2): 167-187. DOI: https://doi.Org/10.30766/2072-9081.2020.21.2.167-187
Поступила: 16.02.2021 Принята к публикации: 02.04.2021 Опубликована онлайн: 19.04.2021
Assessment of genetic differentiation of populations by analysis of molecular variance (analytical review) © 2021. Vasiliy M. Kuznetsov и
Federal Agricultural Research Center of the North-East named N. V. Rudnitsky, Kirov, Russian Federation
Different approaches to using the analysis of molecular variance (AMOVA) to assess the genetic differentiation of populations have been compared in the research. Data on 11 microsatellite loci of 84 bulls of seven breeds were used The results were compared for three options of the AMOVA module of the GenAlEx 6.502 program the allele distance matrix (calculated Fst(w&q (= 0) statistics - variant AMOVA1); the genotype distance matrix (Фрт - AMOVA2); and the allele size difference matrix (Rst - AMOVA3). Similar summary estimates_of the genetic differentiation of breeds were obtained: Fst(iv&c) = 0.108, Фрт = 0.115, Rst = 0.110 (all with pperm < 0.001). Between the estimates of Fst(w&q and Фрт for each locus, the correlation coefficient was 0.99 (ртше<0.0001); no statistically significant correlations with Rst were found A high correlation of Fst(iv&c) and Фрт with the estimates of differentiation according to Nei's (0.96) ии found Programs other than GenAlEx (Arlequin v.3.5, GenePop v.4.7.3, RST22) gave similar AMOVA estimates. The negative linear dependence of Fst(iv&c) and Фрт on the level of the average heterozygosity of the breed samples ии established (R2 = 0.6, rs = -0. 75 for praiue < 0.02) and the absence of such dependence for Rst (R2 = 0.04, rs = -0.23 for praiue = 0.47). The standardization of the
(°0
Fst(w&q and 4>pt estimates according to Hedrick's eliminated this dependence and raised the initial estimates to 0.35 and 0.37, respectively. The latter were comparable to the estimates obtained by the Nei-Hedrick's (0.364-0.375), Jost's (0.292), and Morisit-Horn's (0.308) methods. The Mantel correlations behveen the matrices ofpaired genetic distances (GD) calculated by different measures were >0.9 in most cases. The projections of the GD matrices in the principal coordinate analysis (PCoA) on the 2D plane were generally similar. The PCoA identified a cluster of Holstein «ecotypes», a cluster of «Red» breeds, and a branch of the Jersey breed In the two-factor AMOVA of data on clusters (as two «regions»), the interregional GD was 0.357; the differentiation of breeds within the «regions» did not exceed 0.027. Modeling the association of breeds with close to zero GD resulted in an increase in the number of alleles per locus in the «new» breeds by 29 "<>, and an increase in the combined estimate of genetic differentiation by 29-46 "<>. The results obtained can be used in the development of measures for the conservation of endangered breeds.
Keywords: animal breeding, microsatellites, diversity, genetic differentiation, genetic distance, Ah-IOVA, principal coordinate analysis, gene pool conservation
Acknowledgement: The research was carried out under the support of the Ministry of Science and Higher Education of the Russian Federation within the state assignment of the Federal Agricultural Research Center of the North-East named N. V. Rudnitsky (theme No. 0767-2019-0089).
The author thank the reviewers for their contribution to the peer review of this work.
Conflict of interest: the author declare no conflict of interest.
For citation. Kuznetsov V. M. Assessment of genetic differentiation of populations by analysis of molecular variance (analytical review). Agramava nauka Evro-Severo-Vostolia = Agricultural Science Euro-North-East. 2020;22(2):167-187. (In Russ.). DOI: https://doi.Org/10.30766/2072-9081.2020.21.2.167-187
Received: 16.02.2021 Accepted for publication: 02.04.2021 Published online: 19.04.2021
Каждый вид сельскохозяйственных животных подразделяется на породы. Породы, в свою очередь, подразделяются на стада, линии, семейства. С развитием молекулярно-генетических методов и ДНК-технологий стало возможным оценивать не только стенотипические различия между породами и их структурными элементами, но и непосредственно генетические различия (дифференциацию). Последнее важно и необходимо знать для эффективного планирования разведения и селекции коммерческих, сохранения исчезающих пород.
Почти 80 лет назад Wright [1] определил генетическую дифференциацию как различия частот аллелей между субпопуляциями, отражающие значительные отклонения генотипи-ческих частот от равновесия Харди-Вайнберга (Hardy-Weinberg Equilibrium, HWE) в общей популяции. Для характеристики распределения генетической изменчивости (гетерозиготно-сти) внутри и между популяциями Райт ввёл индексы фиксации [2, 3]. Допускалась бесконечная островная модель (Infinite Island Model) структуры популяции, в которой диаллельные однолокусные субпопуляции равного размера обмениваются мигрантами в равных пропорциях. Индексы фиксации Райта оценивали размеры эффектов, подобных инбридингу, в пределах субпопуляций (Fis), во всей популяции (Fit) и между субпопуляциями (Fst). Индексы не независимы и связаны отношением (1 - Fit) = (1 - Fis)(l - Fst), из которого следует: Fst = (Fit - Fis)/(1 - Fïs), что адекватно Fst = o2q(st/[qi(l - qi)], где qT - частота аллеля A
в диаллельном локусе общей популяции, о^т) - дисперсия частот аллели по субпопуляциям. Рэт есть мера степени завершения процесса фиксации аллелей в субпопуляциях («демографическая дифференциация» [4]). Если во всех субпопуляциях аллели имеют равные частоты, то о2д(зт) = 0 и Рэт = 0. Если дисперсия равна биномиальному максимуму, о^т) = qт(l - qт), то Рэт = 1, т. е. разные аллели фиксированы по субпопуляциям (в смысле фиксации одного аллеля в локусе для формирования гомозиготы). Значения Рэт между этими двумя крайностями интерпретируют как «отображающие различные уровни структурирования» [5]: 0-0,05 - незначительная, 0,05-0,15 - умеренная, 0,15-0,25 - большая и >0,25 - очень большая дифференциация субпопуляций [6].
№1 [7, 8, 9] представил «коэффициент генной дифференциации» Смт как адаптированный для использования в мультиаллельных мультилокусных популяциях аналог Ь-п Райта: вэт = (Нт - Н:;)/Н [ . где Нт - генное разнообразие в общей популяции, Ш - усреднённая гетерозиготность по субпопуляциям при Н\¥Е («генное разнообразие»). Статистика вэт выведена из аддитивного разложения гетеро-зиготности. вэт измеряет уровень вариации между субпопуляциями по отношению к общей вариации в популяции (не устанавливая идентичность участвующих аллелей). В отличие от Рэт для диаллельного локуса, величина Смт зависит от уровня вариации полиморфных генов. Так, при анализе микросателлитов Ш и Нт могут приближаться к 1, а оценки Смт ограничиваться диапазоном от 0 до (1 - Н:;).
т. е. усреднённым уровнем гомозиготности субпопуляций.
Hedrick [10] предложил стандартизовать Gst на её максимальное значение: G'st = Gst/GsT(max) = Gsx(k - 1 + Hs)/[(k - 1)(1 - Hü)], где k - число субпопуляций. G'st - это мера дифференциации субпопуляций относительно максимально возможной и, следовательно, она позволяет сравнивать результаты по локусам с разными уровнями вариации, типам маркеров, видам животных и исследованиям. Модификация G'st при небольшом числе анализируемых субпопуляций была предложена в [11]: G"st = k(HT - Hs)/[(k х Нт- Hs)(l - Hs)]. Оценки G'st и G"st имеют диапазон от 0 до 1; их особо рекомендуют для расчёта парных генетических дистанций.
Альтернативный метод предложил Джост (Jost) [12]. Его статистика, Dest - «истинная дифференциация», является мультипликативной и базируется на изменчивости эффективного числа аллелей. В терминах гетерозигот-ности Dest = [(Нт - Hs)/(1 - Hs)] * [k/(k - 1)]. Уровень гетерозиготности в субпопуляциях не влияет на значения Dest; их диапазон от 0 до 1. Как отмечал Уилток (Whitlock) [13], «Fst измеряет отклонения от панмиксии, в то время как Dest измеряет отклонения от полной аллельной дифференциации» (цит. по [14]).
Cockerham [15, 16], Weir и Cockerham [17] для анализа генетической структуры популяции представили метод моментов (для нужных параметров находят несмещённые статистики, которые используют в качестве оценок). Были предложены: линейная модель для генов разных подразделений популяции, набор параметров для описания корреляций частот аллелей (£, F и 9), процедура их оценивания по дисперсиям между субпопуляциями, между индивидами в субпопуляции и между гаметами индивида. Weir [18] дал формулы декомпозиции молекулярной дисперсии в терминах и виде, обычных для классического дисперсионного анализа (Analyses of Variance, ANOVA). Принцип ANOVA: если дисперсия (варианса) между субпопуляциями такая же, как и дисперсия во всей популяции, то популя-ционной структуры нет. Оценки компонентов дисперсии внутри и между субпопуляциями используют для расчёта £, F и 0 (тета) статистик, аналогичных индексам фиксации Райта, именно: f (Fis) - отклонение от HWE в пределах субпопуляций или корреляция между аллелями индивида относительно собственной
субпопуляции (инбридинг в субпопуляциях); F (Fit) - отклонение от HWE в популяции или корреляция между аллелями индивида относительно всей популяции (инбридинг в общей популяции); 0 (Fst) - доля генетического разнообразия, обусловленная различиями в частотах аллелей среди субпопуляций или корреляция между аллелями индивидов субпопуляции по отношению ко всей популяции (дифференциация субпопуляций). Оценка 0 является количественной мерой дивергенции в группе из к субпопуляций; для двух субпопуляций - мерой расстояния или дистанции. 0 характеризует не только степень дифференциации, но и представляет «коэффициент взаимного родства» (co-ancestry) индивидов [18]. Если 0 используют в качестве описательной статистики для характеристики распределения генетического разнообразия среди субпопуляций (дифференциации), то нет необходимости в предположениях о дискретности анализируемых субпопуляций и об эволюционных процессах (мутации, миграции, отборе), которые могли бы привести к различиям между ними.
Excoffier с соавторами [19] трансформировали ANOVA Кокерхэма и Вейра в анализ молекулярной дисперсии (Analysis of Molecular Variance, AMOVA) для исследования изменчивости гаплотипов. Средние квадраты рассчитывают из матрицы квадратов евклидова расстояния между парами индивидов по гаплотипам ДНК. На выходе AMOVA дает оценки вари-ансных компонентов и статистику Фрт - аналог Fst Райта. Если используют бинарные расстояния между гаплотипами, 1 - для идентичных и 0 - для разных гаплотипов, то оценки Фрт совпадает с 0. Метод достаточно гибок, чтобы приспособить несколько альтернативных входных матриц дистанций, соответствующих различным типам молекулярных данных, включая микросателлиты [20].
Slatkin [21] предложил RsT-статистику (также подобную Fst Райта), которая особенно подходит для маркеров с пошаговой моделью мутации (Stepwise Mutation Model, SMM). По SMM каждая мутация создает новый аллель, добавляя или удаляя повторный мотив с равной вероятностью. Иногда допускают, что нет никаких ограничений на число повторов, возможных в локусе. Аллели разного размера будут менее связаны, чем аллели аналогичного размера. Считают, что SMM имеет «память» размера аллели и более точно отражает
процесс мутации микросателлитов. Эту дополнительную «филогенетическую» информацию используют в ANOVA для оценки компонентов дисперсии размера аллелей или числа повторов пар оснований в каждом локусе с последующим расчётом RsT-статистики: Rst = (S - Sw)/S, где S - средняя сумма квадратов различий в размере аллелей между всеми парами аллелей; Sw - то же в пределах каждой субпопуляции.
Нами в предыдущей работе [22] были представлены результаты сравнительного анализа изменчивости аллелей 11 микросателлит-ных локусов семи породных выборок быков-производителей. Генетическую дифференциацию выборок оценивали статистиками Fst, Gst, G'st, G"st и Dest. Также были использованы статистики GDN и uGDN (генетическая дистанция Нея и её несмещённая оценка [23, 24].
Цель аналитического обзора - сравнить разные подходы к использованию анализа молекулярной дисперсии (AMOVA) для оценки генетической дифференциации популяций; на микросателлитных данных по семи породным выборкам рассчитать сводные 0, Фрт и Rst статистики, сопоставить полученные оценки, сравнить с результатами предыдущего исследования [22], рассчитать матрицы парных генетических дистанций и соотнести их 2-мерные проекции, двухфакторным AMOVA оценить «региональную» компоненту и рассмотреть последствия объединения породных выборок с малыми генетическими дистанциями (сходными аллельными профилями) на внутрипопу-ляционное разнообразие набора «новых» пород и их генетическую дифференциацию.
Материал и методы. Использованы те же данные, что и в предыдущем исследовании [22]. В частности, 84 быка ( =N), каждый генотипирован по 11 STR-локусам (Simple Tandem Repeats - простые тандемные последовательности, также Short Tandem Repeats -короткие тандемные повторы)*, именно: 10 быков джерсейской породы (JER), 10 быков айрширской породы (AYR), 10 - красной датской (RDAT), 9 - красной шведской (RSH) и 45 быков голштинской породы трёх «экотипов»** (отродий): 13 быков из Германии (H-DEU), 17 - из Нидерландов (H-NLD), 15-из США (H-USA).
Основные расчёты проводили с помощью компьютерной программы GenAlEx 6.502 [25, 26]. В модуле AMOVA для обработки кодоминантных данных использовали опции: Codom-Allelic - генерирует матрицу парных дистанций между аллелями размером 2NX2N с последующим расчётом FsT-статистики ( = 8) - в данной работе обозначается Fst(w&c) (Fst по методу Weir & Cockerham), чтобы не путать с Fst Райта и Нея (вариант AMOVA1); Codom-Genotypic - генерирует матрицу парных дистанций между генотипами размером NxN с последующим расчётом Фрт-статистики с подавлением внут-рииндивидуальнои изменчивости (вариант AMOVA2); Codom-Microsat - генерирует матрицу дистанций, как и при опции Codom-Allelic, но на основе размеров аллелей с последующим расчётом RsT-статистики (вариант AMOVA3).
Все три статистики оценивают долю STR-изменчивости между субпопуляциями относительно общей изменчивости во всей популяции:
lst(w&c)
'АР
2 2 2 gap + gai +gwi
фрх =
'АР
RST -
'АР
JAP
jwp
'АР
'ai
'WI
где о2 - варианса (дисперсия); субиндексы: АР - между субпопуляциями, А1 - между индивидами, WI - внутри индивидов, WP - внутри популяции.
Статистическая значимость отклонения оценок от нуля в программе ОепАШх проверяется пермутационным тестом: нулевая гипотеза (Но) - нет генетических различий между субпопуляциями (Рэтсш&с) = 0, или Фрт = 0, или Rsт = 0); альтернатива (Н1) - есть генетические различия между субпопуляциями (Рэтсш&с) > 0 или Фрт > о, или Rsт > 0). В общем, Но в AMOVA заключается в том, что анализируемые субпопуляции допускаются частями одной большой случайно спариваемой генетической популяции. Если это истинно, то любая подразделён-ность случайна, и субпопуляции являются лишь выборками из единого генофонда.
* База генетических данных по быкам на сайте ВНИИплем. [Электронный ресурс]. URL: http://www.vniiplem.ru/rus/files/Database/DNK/mikrosatellitv.pdf (дата обращения: 09.12.2018).
** Экотии - субпопуляция внутри породы, адаптированная к определённой среде обитания.
*** Используют для сравнения с оценками дифференциации по иным, чем STR, типам маркеров.
Было показано [12, 21], что с увеличением уровня генетического разнообразия в пределах субпопуляций статистики дифференциации изменяются не линейно. Другими словами, чем больше внутрисубпопуляцион-ная гетерозиготность, тем меньше их приращение. Программа GenAlEx выполняет линеаризацию оценок, например Рзт(ш&с)-оценки:
HnFsT(w&c) = Fst(w&c) / (1 - Fst(w&c)).
Уровень гетерозиготности в (суб-)по-пуляции не полностью зависит от числа аллелей (по нашим данным г = 0,68, г2 = 0,46), т. к. верхний предел, равный 1, одинаков для любого числа аллелей. Для STR-маркеров, внутри-субпопуляционная дисперсия часто почти столь же большая, как общая дисперсия. Это приводит к низким оценкам дифференциации, даже если анализируемые субпопуляции общих аллелей не имели [10, 27, 22]. В GenAlEx эта проблема решается стандартизацией статистик дифференциации посредством деления первоначальной оценки на её максимально возможное значение при фактической внут-рисубпопуляционной гетерозиготности [27]. Например, стандартизированная Fst(w&c) есть
F'sT(W&c) = FsT(W&c) / FsT(W&c)max.
Результаты AMOVA по GenAlEx сравнивались с таковыми по программам Arlequin v.3.5 [28], GenePop v.4.7.3 [29, 30], RST22 [31], SpaideR [32]. Для регрессионно-корреляционного анализа использовалась программа STATGRAPHICS® Centurion XVI [33].
Для сравнения подходов к использованию анализа молекулярной дисперсии (AMOVA) проведен отбор научных статей на английском языке в библиографических базах «Google Scholar» и «Scopus», статей на русском языке — в библиографической базе «Google Scholar» и «Научной электронной библиотеке eLIBRARY.RU». Также были изучены пристатейные списки литературы отобранных публикаций для выявления дополнительных релевантных статей. Поиск публикаций осуществляли по следующим ключевым словам: molecular markers, population genetics, population structure, biodiversity, diversity indices, analysis of molecular variance (AMOVA), genetic resources, conservation genetics, dairy cow, data analysis, multivariate statistical analyses. Также в комбинации с предыдущими терминами для поиска были использованы следующие ключевые слова: microsatellite, heterozygosity, Wright's F-statistics, Nei's
G-statistics, Jost's D-statistic, genetic differentiation among populations, distance matrix, ordination, PCoA, Mantel-test.
Результаты и обсуждения. Декомпозиция общей STR-ducnepcuu. В таблице 1 представлены результаты разложения STR-дис-персии. В рамках фиксированной статистической модели (до оценки варианс) наибольший интерес представляет отношение г|2 = SSap / SStoi (г| - эта), которое в определённой степени характеризует размер эффекта -относительную долю (или процент) генетических различий между породными выборками. По AMOVA 1 это отношение составило 12,4 %, в AMOVA2 - 16,6% и 12,4% по AMOVA3. Нулевая гипотеза, г|2 = 0, проверялась F-кри-терием Фишера через отношение MSap к MSwi (для AMOVA2 - F = MSap / MSwp). F-критерии Фишера составили 3,45, 2,6 и 3,45 для AMOVA 1, AMOVA2 и AMOVA3, что, учитывая соответствующие степени свободы (df), говорит о статистически значимых на уровне а < 0,05 межпородных различиях. Следует, однако, отметить, что этот тест в строгом смысле не является корректным для данных анализов. Распределение индикаторных переменных (аллелей), Хщ, не является нормальным. Поэтому отношение MSap / MSwp не подчиняется F-распределению и не может служить статистикой критерия [18], но г|2 может быть предварительной оценкой и/или дополнением к анализу результатов по модели случайного типа.
Когда используется статистическая модель с рандомизированными (случайными) эффектами, то конечным продуктом процедуры AMOVA являются вариансные компоненты - Est.Var. или о2. Их оценки представлены в последнем столбце таблицы 1.
Для трёх вариантов AMOVA матрицы дистанций имели разные основы. Поэтому абсолютные значения варианс для одних и тех же уровней структуры данных значительно различались. Чтобы сопоставить величины варианс из разных анализов, использовали соотношение c^j/одр , которое для AMOVA 1 и
AMOVA3 было равно 9. В AMOVA2 изменчивость между аллелями внутри индивидов игнорируется, но рассчитывается внутрипопу-ляционная варианса. Её отношение к межсуб-популяционной вариансе составило около 8 (достаточно близко к 9).
Таблица 1 - AMOVA-результаты по программе GenAlEx / Table 1 - AMOVA-results of the program GenAlEx
Вариант / Variant Источник / Source df SS MS Est. Var.
AMOVA1 AP 6 86,9 14,5 0,46
AI 77 266,7 3,5 0,0*
WI 84 349,5 4,2 4,16
Tot 167 703,1 - 4,62
AMOVA2 AP 6 28,1 4,6 0,24
WP 77 141,7 1,8 1,84
Tot 83 169,8 - 2,08
AMOVA3 AP 6 9199,9 1533,3 49,40
AI 77 27604,1 358,5 0,0*
WI 84 37308,5 444,1 444,15
Tot 167 74112,5 - 493,56
Примечания: АР - между субпопуляциями, AI - между индивидами, WI - внутри индивидов, WP - внутри популяции, Tot - общая; df - степень свободы; SS - сумма квадратов отклонений; MS - средний квадрат; Est. Var. - оценка вариансного компонента. * - отрицательное значение вариансы приравнено нулю /
Notes: АР - between populations, AI - between individuals, WI - within individuals, WP - within population, Tot - total; df - degree of freedom; SS-sum of squared deviations; MS-mean square; Est. Var. - estimation of the variance component. * - the negative value of the option is equal to zero.
Оценки коэффициентов инбридинга и дифференциации. По вариансным компонентам таблицы 1 получены сводные коэффициенты инбридинга и генетической дифференциации породных выборок (табл. 2).
По AMOVA1 усреднённый внутривыбо-рочный коэффициент инбридинга (точнее -индекс фиксации, Fis) составил -9,1 %, что могло бы указывать на некоторый избыток гетерозигот. Но оценка была статистически незначимой (рреГт >0,05). С другой стороны, индекс фиксации в обобщенной выборке (Fit) был +2,7 %, что могло свидетельствовать
о некотором преобладании родственного разведения, если бы оценка была статистически значимой. В AMOVA3 расчёты основывались не на анализе частот аллелей, как в AMOVA1, а на размере аллелей. Несмотря на это, две оценки, характеризующие систему спаривания, Ris и Ru, оказались относительно близкими к таковым по AMOVA1, соответственно, -10,7, +1,5 % и также были статистически незначимыми (ррегт >0,05). В общем, по имеющимся данным в породных выборках статистически значимых отклонений от HWE не было установлено.
Таблица 2 - Оценки коэффициентов инбридинга и статистик генетической дифференциации выборок по программе GenAlEx /
Table 2 - Estimates of inbreeding coefficients and statistics of genetic differentiation of samples according to the GenAlEx program
AMOVA1 AMOVA2 AMOVA3
Stat. Est. Pperm Stat. Est. Pperm Stat. Est. Pperm
Fis (f) -0,091 1,000 - - - Ris -0,107 0,985
Fit (F) 0,027 0,081 - - - Rit 0,015 0,375
Fst(w&c) (9) 0,108 0,001 Фрт 0,115 0,001 Rst 0,110 0,001
Примечания: Stat. - статистика; Est. — ОЦеНКа, Pperm — достигнутый уровень статистической значимости (пермута-ционный тест с 999 перестановками); Fis (Ris) - коэффициент инбридинга в пределах выборок (= а2м / ); Fit (Rit) - коэффициент инбридинга в объединённой выборке (= (одр + <з2м )/ ); Fst(w&c) (9), Фрт, Rst - статистики
генетической дифференциации породных выборок /
Notes: Stat. - statistic; Est. - estimation; p-perm - achieved level of statistical significance (permutation test with 999 permutations); Fis (Ris) - inbreeding coefficient within the samples (= / ); Fit (Rit) - inbreeding coefficient in the combined
sample (= ( о
У a.
tot ); Fst(w&c) (9), Фрт, Rst - statistics of genetic differentiation of breed samples.
Главный интерес представляли статистики, характеризующие уровень STR-диффе-ренциации породных выборок. Рассчитанная по AMO VA 1 статистика Fst(w&c) составила 0,108 или 10,8% при рРегт<0,001. В варианте AMOVA2, в котором внутрииндивидуальная STR-изменчивость игнорировалась, Фрт-оценка незначительно превышала таковую варианта AMO VA 1 и составила 11,5 % при ррет, <0,001. В AMOVA3, где расчёты базировались на размерах аллелей, RsT-оценка составила 11 % при Ррегт <0,001, что практически эквивалентно значению по AMOVA1. Полученные величины интерпретируют как «представляющие довольно слабую (rather weak) популяционную структуру» [11]. Отметим, рассчитанные выше оценки размера эффекта (г|2) были лишь на 1-5 процентных пункта выше.
Полокусные оценки дифференциации. Для исследования степени связности разных мер STR-дифференциации имеющийся набор данных был разделён на 11 псевдонаборов каждый с разным локусом. Все псевдонаборы были обработаны тремя вариантами AMOVA для получения соответствующих полокусных оценок дифференциаций и внутривыборочной гетерозиготности (cHs). В результате сформировалась выборка с четырьмя переменными (три оценки AMO VA + cHs) и 11 записями (локусы). Взаимосвязь между переменными оценивалась непараметрическим коэффициентом корреляции Спирмена (rs) и тестировалась достигнутым уровнем статистической значимости (pVai,ie).
Между полокусными оценками Fst(w&c) и Фрт корреляция Спирмена была 0,99 при /WMe<0,0001. В то же время между указанными статистиками и Rst значимой взаимосвязи не было установлено (rs для Fst(w&c) х Rst была 0,28, для ФРТ х Rst - 0,32 обе с pvai«e = 0,31). При практически равных сводных оценках, отсутствие взаимосвязи между полокусными оценками было неожиданным.
-Fst(w&c)
Рис. 1. Логарифмы Fst(w&c)-, Фрт- и RsT-статистик по 11 STR-локусам/
Fig. 1. Logarithms of Fst<w&c)-, Фрт- and RsT-statistics for 11 STR loci
Графики рисунка 1 прояснили причину получения таких результатов, именно: логарифмы (login) оценок Rst по шестому, восьмому и девятому локусам очень сильно отклонялись от таковых по Fst(w&c) и Фрт мерам, изменение которых по локусам было практически синхронным. Отметим также, коэффициенты вариации полокусных Fst(w&c) и Фрт оценок были соответственно 37,8 и 36,6 %, в то время как Rst оценок - 91 %! RsT-оценки по локусам имели очень большой разброс, что может характеризовать вариант AMOVA3 не с лучшей стороны (ненадёжный при оценке по ограниченному числу локусов). Кроме того, имеется мнение, что, если даже мутации строго пошаговые, Rst не всегда является лучше оценкой, чем Fst(w&c) [34]. Это может быть в случае, когда интересующий временной период короткий, а влияние мутаций сравнительно невелико [21]. Также полагают, что микросателлиты почти никогда строго не следуют пошаговой мутационной модели. Поэтому советуют избегать использования RsT-статистики [35].
AMOVA-оценкн по иным, чем GenAlEx программам. Была проведена проверка степени подобия статистик дифференциации, полученных по программе GenAlEx, с таковыми при использовании (на тех же самых данных) модуля AMOVA в других компьютерных программах. Результаты представлены в таблице 3.
Оценки STR-дифференциации породных выборок, Fst(w&c) (Rst), имели высокий уровень статистической значимости (ррегт <0,001). Все оценки по программе Arlequin были идентичны таковым по программе GenAlEx. Поэтому, как представляется, 95 % доверительные интервалы (confidence interval, CI) оценок по Fst и Rst мерам, рассчитанные в программе Arlequin, можно приложить и к оценкам по программе GenAlEx.
По программе GenePop оценка была идентичной [GenAlEx] только в варианте AMOVA 1; по варианту AMOVA3 RsT-оценка была на 22 % ниже, но не выходила за границы 95 % CI, рассчитанного в программе Arlequin.
По программе RST22 были получены две оценки Rst: усреднённая по локусам, равная 0,115, и средневзвешенная (по средним квадратам отклонений) - 0,122. Последняя была на 6,1 % выше, но 95 % CI двух оценок перекрывались, следовательно различие между ними было статистически незначимым. Оценки по RST22 были на 4,5-10,9 % выше, чем в программе GenAlEx, но в пределах 95 % CI, рассчитанного в программе Arlequin.
Таблица 3 - AMOVA по программам Arlequin v.3.5, GenePop v.4.7.3 и RST22 / Table 3 - AMOVA for Arlequin v.3.5, GenePop v.4.7.3 and RST22 programs
AMOVA1
AMOVA 3
Arlequin v.3.5
Stat. Est. 95% CIl 95% CI и Stat. Est. 95% CIl 95% CIu
Fis (f) -0,091 -0,142 -0,046 Ris -0,107 -0,175 0,008
Fit (F) 0,027 0,011 0,064 Rit 0,015 -0,030 0,129
Fst (0) 0,108 0,086 0,133 Rst 0,110 0,036 0,174
GenePop v.4.7.3
Fis (f) -0,091 - - Ris -0,123 - -
Fit (F) 0,026 - - Rit -0,025 - -
Fst (0) 0,108 - - Rst 0,086 - -
RST22
AMOVA3 Est.av. AMOVA3 Est.w.
Rst 0,115 0,109 0,180 Rst 0,122 0,110 0,218
Примечания: Est.av. - усреднённая по локусам; Est.w. - взвешенная по локусам; 95% CI - 95% доверительный интервал; субиндексы L и U - нижняя и верхняя границы CI /
Notes: Est.av. - averaged by loci; Est.w. - weighted by loci; 95 % CI - 95 % confidence interval; subindexes L and U - lower and upper bounds of CI.
Таким образом, все используемые компьютерные программы обеспечивали получение эквивалентных или близких (в пределах 95 % CI) оценок уровня STR-дифферен-циации породных выборок.
Сравнение с оценками по Нею (Nei). Ранее [22] на этих же STR-данных в программе GenAlEx были получены оценки генетической дифференциации на основе анализа внутри- и межвыборочной ожидаемой гетерози-готности. В частности, были рассчитаны оценки Fst - адаптированного Неем индекса фиксации Райта [23], Gst - коэффициента генной дифференциации Нея [8] и Gst(nei) - модифицированной Неем GsT-меры, учитывающей число анализируемых выборок [36]. Эти оценки приведены в таблице 4.
Таблица 4 - Сводные оценки статистик дифференциации по Нею [22] /
Table 4 - Summary estimates of the differentiation statistics for Nei's [22]
Fst Gst Gst(NEI)
Est. 0,134 0,103 0,118
Error 0,013 0,014 0,015
95% CIL 0,111 0,080 0,093
95% CIu 0,159 0,130 0,148
Pperm 0,001 0,001 0,001
Если исключить Бэт-оценку, при расчёте которой не учитывается ни число выборок,
ни их размеры, то оценки С-статистик были достаточно близки к АМС^А-оценкам. При расчёте Оэт учитывались численности выборок через их среднегармонический размер, при расчёте Обтсые^ также число выборок. Поэтому оценка Озт(ке1) = 0,118 представляется более корректной. Её величина особенно хорошо соотносится с оценкой Фрт = 0,115, полученной в программе СспА1Ех. и с оценками Rsт, рассчитанными в программе RST22 - 0,115 и 0,122.
В общем можно полагать, что все используемые методы и компьютерные программы производили вполне сопоставимые оценки статистик генетической дифференциаций. Коэффициенты ранговой корреляции между ПОЛОКуСНЫМИ РмТ". СмТ" и ОзТ(ке1)"ОЦеНОК с
Рзт(ш&с)- и Фрт-оценками были равны 0,96 при руа1ие = 0,0023, с Rsт-oцeнкaми - 0,29 при РуаЫе = 0,3576. Эти соотношения были близки к таковым, полученными выше между оценками по Рэт-, Фрт- и Rsт-мepaм.
Стандартизация АМОУА-оценок. На гипотетических примерах было показано, что при анализе мультиполиморфных маркеров уровень гетерозиготности в субпопуляциях (сШ) оказывает негативное влияние на статистики дифференциации, занижая их оценки [10, 37]. Это нашло подтверждение при расчёте С-статистик [22]. Полокусные наборы данных были использованы для изучения влияния внутривыборочной гетерозиготности (сНэ) на АМС^А-оценки (рис. 2).
Рис. 2. Зависимость Fstcw&q- и RsT-оценок от внутривыборочной гетерозиготности (cHs) (оценки по каждому локусу; г - корреляция по Спирмену, R2 - коэффициент детерминации линейной модели) /
Fig. 2. Dependence of Fst<w&o- and RsT-estimates on intrasamplc heterozygosity (cHs) (estimates for each locus; r - Spearman correlation, R2 - coefficient of determination of the linear model)
С повышением с№ оценки Рэкш&с) снижались, их диапазон сужался. Подобная закономерность имела место для полокусных Фрт-оценок (у = -0,602х + 0,628, R2 = 0,565; на рисунке нет), но отсутствовала для Rsт-oцeнoк (рисунок 2 справа). Негативная зависимость и Фрт оценок от внутривыборочной гетерозиготности была достаточно высокой и статистически значимой. В случае с Rsт такой зависимости не наблюдалось.
Для устранения занижения оценок дифференциации при высокой внутрисубпопуля-ционной гетерозиготности НесЫск ввёл стандартизацию С:;т-статистики на её возможное максимальное значение - Сектах) [Ю]. Следуя за подходом НесЫск, Мстпапэ [27] предложил вычислять стандартизированную Фрт-статис-ТИКу: Ф'рт = Фрт/Фрт(тах). Оценку ФрТ(тах) ПОЛучают путём максимизации межпопуляционной вариансы, Од,,, через межпопуляционную сумму квадратов отклонений 88(АР) при фактической внутрисубпопуляционной вариансе, о^-,,:
Ф
PT(max) _GAP(max)/(GAP(max) +GWp) '
Этот подход заложен в программе GenAlEx. В нашем случае оценка Фрг(тах) составила 0,308, а стандартизированное значение Фрт:
Ф'рт = 0,115/0,308 = 0,373 или -37 %.
Стандартизированная оценка Fskw&c), F'skw&c), была 0,351 или «35 % от максимального значения. Обе стандартизированные оценки более чем в три раза превышали исходные. Сводная FsT-оценка по программе Arlequin v.3.5 была 10,8 % (как и Fskw&cj) с 95 % CI 8,6...13,3 % (табл. 3). Если стандартизировать значения доверительного интервала, то можно полагать, что с вероятностью 95 %
истинная Р'экш&с) находится в диапазоне от 28 до 43 %. Эта интервальная оценка указывает на очень выраженную популяционную структуру анализируемых данных (в противоположность заключению по первичным оценкам).
На рисунке 3 показано распределение полокусных оценок Б^к^ш:) в зависимости от внутривыборочной гетерозиготности. Коэффициент детерминации ^2) линейной модели был 0,002, а коэффициент корреляции Спир-мена —0,05 при руаые = 0,875. Стандартизация устранила влияние внутривыборочной гетерозиготности на оценки дифференциации.
Рис. 3. Зависимость F'skwäc i-ohciiok от внутри-выборочной гетерошготностью (cHs) /
Fig. 3. Dependence of F'stiw&c) estimates on intrasample heterozygosity (cHs)
Аналогичные результаты были получены в наших предыдущих исследованиях [22]. Так, сводные оценки генетической дифференциации методами Нея (Gst и Gst(nei)) были 10,3-11,8 %. После стандартизации по Hedrick [10] они составили 36,4-37,5 %. При использовании метода Джоста (Jost) на базе эффективного числа аллелей [12], результаты которого
не зависят от внутрисубпопуляционной гетеро-зиготности, сводная оценка (Dest) была 29,2 %.
Расчёты в рамках данной работы методом Морисита-Хорна (Morisita-Horn) по программе SpadeR (при «number Hill» q = 2; [32] показали STR-дифференциацию породных выборок на уровне 30,8 % с 95 % CI 27,5...34,2 % (в среднем около 1/3 аллелей одной выборки не являлись общими для других породных выборок). Однако заметим, оценка по этой же программе региональной дифференциации (Regional diff.) была на уровне 5 % с 95 % CI 4...6 %, т.е. 5 % аллелей в совокупной выборке не являлись общими для той или иной породной выборки.
Генетические дистанции. Сводные оценки характеризовали обобщённую дифференциацию породных выборок, нивелируя двухсторонние генетические отношения. Попарные
генетические дистанции (Genetic Distance, GD) позволяют выявить наличие или отсутствие пространственной структуры среди породных выборок. Упрощенно, GD между двумя животными (породами) можно представить, как долю или процент аллелей локуса(-ов), которые не являются общими; при GD равной нулю оба животных (породы) имеют одни и те же (общие) аллели с одинаковыми частотами.
В таблице 5 даны треугольные матрицы парных GD, которые были получены по разным вариантам AMOVA. В большей степени оценки GD варьировали в пределах матриц, указывая на неоднородность генетических отношений между породными выборками. Между матрицами оценки GD варьировали в меньшей степени, свидетельствуя о незначительном влиянии вида STR-данных, вводимых в модуль AMOVA программы GenAlEx.
Таблица 5 - Треугольные матрицы парных генетических дистанций (под диагональю - AMOVA-оценки, над диагональю -ррегт; GiBonf = 0,05/21 = 0,0024) /
Table 5 - Triangular matrices of paired genetic distances (under the diagonal - AMOVA-estimates, above the diagonal -ррегт; ctBonf = 0.05/21 = 0.0024)
Порода / Breed AYR JER RDAT RSH \ H-DEU H-NLD H-USA
AMOVA 1 (Fst(w&c))
AYR JER RDAT RSH 0,001 0,429 0,251 1 0,001 0,001 0,001 0,217 - 0,001 0,001 ! 0,001 0,001 0,001 0,001 0,250 - 0,330 ! 0,001 0,001 0,001 0,008 0,275 0,005 - ! 0,001 0,001 0,001 ' ' '
H-DEU H-NLD H-USA 0,112 0,181 0,120 0,119 i - 0,171 0,241 0,089 0,163 0,100 0,105 ! 0,008 - 0,008 0,124 0,216 0,123 0,121 ! 0,006 0,030
AMOVA2 (ФрТ)
AYR JER RDAT RSH 0,001 0,291 0,248 1 0,001 0,001 0,001 0,210 - 0,001 0,001 ! 0,001 0,001 0,001 0,007 0,246 - 0,281 ! 0,001 0,001 0,001 0,011 0,266 0,010 - ! 0,001 0,001 0,001
H-DEU H-NLD H-USA 0,111 0,178 0,123 0,120 i - 0,065 0,186 0,105 0,186 0,120 0,124 ! 0,013 - 0,001 0,125 0,213 0,128 0,125 j 0,007 0,038
AMOVA3 (Rst)
AYR JER RDAT RSH 0,001 0,109 0,101 1 0,001 0,001 0,001 0,175 - 0,001 0,003 ! 0,004 0,001 0,001 0,030 0,180 - 0,342 ! 0,002 0,002 0,002 0,043 0,185 0,006 - ! 0,011 0,004 0,010 ' ' '
H-DEU H-NLD H-USA 0,203 0,142 0,152 0,113 i - 0,376 0,386 0,209 0,161 0,189 0,139 ! 0,000 - 0,372 0,169 0,132 0,145 0,090 ! 0,000 0,000 ' ' ' ' i ' '
Наибольшие GD имели место между JER-выборкой и остальными породными выборками (0,14-0,27). Заметные GD (0,1-0,2) были между группой «красных» пород (AYR, RDAT, RSH) и группой голштинских «экоти-пов». В то же время в пределах этих двух групп GD между породными выборками были нулевые или близкие к нулю. С вероятностью ошибки oiBonf = 0,0024 (множественный тест Бонферрони) из 21 парных сравнение 15 оценок GD были статистически значимыми. GD между породными выборками AYR с RDAT, AYR с RSH, RDAT с RSH и между голштин-скими выборками (кроме H-NLD с H-USA по Фрт) были статистически незначимыми по всем трём мерам {ррегт> oiBonf = 0,0024).
В таблице 6 даны четыре треугольные матрицы парных GD: две по AMOVA1 с линеаризированными (HnFsT(w&c)) и стандартизированными (F'stcw&c)) элементами, по Нею со стандартизацией Хедрика (G"st(hed)) и по Джосту (Dest); две последние из работы [22]. Диапазон 1 inFsTm&i ¡-дистанций был от 0,001
(AYR с RDAT) до 0,380 (JER с RSH) со средней 0,137. Диапазон не представленных в таблице 6 HnRsT-дистанций был от 0 (между всеми голштинскими выборками) до 0,265 (AYR с H-NLD) со средней 0,140; ИпФрт-дис-танции - от 0,007 до 0,363 со средней 0,142.
Стандартизированные оценки GD (F'stcw&c)) были существенно выше первоначальных (Fst(w&c)). Например, если Fst(w&c)-дистанция между JER и AYR выборками была 0,217 (табл. 5), а её линеаризированная оценка, HnFsT(w&c), - 0,277 (табл. 6), то стандартизированная F' sT. w&i ,-дистанция составила 0,590. Последняя была эквивалентна дистанции по Нею-Хедрику (G"st(hed) = 0,590), и на 19 % превышала оценку по Джосту (Dest = 0,477). Расчёты по программе SpadeR методом Мори-сита-Хорна (Morisita-Horn), который приравнивается к методу Джоста [32], показали дистанцию, усреднённую по локусам, равную 0,447, а взвешенную на инверсию квадратичной ошибки - 0,516 с 95 % CI 0,441...0,590.
Таблица 6 - Треугольные матрицы парных генетических дистанций по linFsT(w&c) и F'stcw&c), G"st<hed) и Dest мерам /
Table 6 - Triangular matrices of paired genetic distances by linFsT(w&c) and F'st(w&c>, G"st<hed) and Dest measures
Порода/Breed
AYR
JER
RDAT
RSH ! H-DEU H-NLD
H-USA
Под диагональю linFsT(w&c), над диагональю F'st(w&c) /
AYR - 0,590 0,005 0,026 j 0,401 0,337 0,389
JER 0,277 - 0,663 0,729 j 0,522 0,498 0,563
RDAT 0,001 0,333 - 0,017 j 0,416 0,371 0,377
RSH 0,008 0,380 0,006 - 1 0,414 0,388 0,372
H-DEU 0,127 0,222 0,137 0,135 1 1 j 0,034 0,020
H-NLD 0,097 0,194 0,111 0,117 j 0,009 - 0,107
H-USA 0,141 0,276 0,140 0,138 1 0,006 0,031 -
AYR
JER
RDAT
RSH
H-DEU
H-NLD
H-USA
Под диагональю G"st(hed), над диагональю Dest / Under the diagonal G"st(hed), above the diagonal Dest
0,477 0,003 '
0,590 - 0,551
0,005 0,663
0,026 0,728 0,017
0,401 0,524 0,417
0,335 0,501 0,371
0,387 0,565 0,377
0,019 j 0,325 0,270 0,302
0,626 j 0,417 0,401 0,443
0,012 j 0,337 0,300 0,289
- 0,336 0,316 0,285
0,416 j - 0,024 0,014
0,388 j 0,032 - 0,079
0,372 j 0,019 0,107_-
Примечание: Матрицы с G"st(hed) и Dest дистанциями из публикации [22] / Note: Matrices with G"st(hed) and Dest distances from the publication [22]
Между JER и H-USA выборками Fst(w&c)-, HnFsTfw&c)-, F'st(w&c)-, G"st(hed)- и DEsi-дистанции были, соответственно, 0,216, 0,276, 0,563, 0,565 и 0,443. По программе SpadeR усреднённая по локусам GD была 0,472, средневзвешенная - 0,373 с 95 % CI 0,304...0,443. Если предпочтение отдать последней оценке (0,373), как, на наш взгляд, наиболее обоснованной, и принять её за 100 %, то оценки Fskw&c) и HnFsT(w&c) были занижены, примерно, в 1,5 раза, F'stcw&c) и G"st(hed) -завышены в 1,5 раза, а оценка по Джосту была ниже на 20 %.
Тест Мантеля. Чтобы оценить степень сходства/подобия матриц парных GD, использовали тест Мантеля (корреляцию Мантеля, Rm) с рандомизированной пермутационной (random permutation) проверкой статистической значимости. Величина Rm = 1 указывает на то, что увеличение GD между субпопуляциями i и j в матрице X связано с увеличением GD между этими субпопуляциями в матрице Y, т. е. на сходство матриц. В нашем случае -два типа представления данных для AMOVA обеспечивают получение подобных структур генетических взаимоотношений выборок. Rm= -1 указывает на противоположный результат. Величина Rm, близкая к нулю, свидетельствует о некоррелированности матриц, т. е. разные типы -данных приводят к независимым оценкам парных GD.
Между Fskw&c) и Фрт матрицами корреляция Мантеля была 0,99 при ррегт 0,010. Тесты Мантеля этих двух матриц с RsT-мат-рицей показали более низкие значения Rm, соответственно, 0,75 прирреГт = 0,05 и 0,80 при Ррегт = 0,02. Rm есть мера линейной зависимо-
сти; квадрат Rm (R2m) - это коэффициент детерминации, представляющий долю или процент общей для двух матриц вариации. R2m более точно характеризует сопряжённость матриц, a (1-R2m) - долю «необъяснённой» вариации или коэффициент неопределённости. Для рассматриваемых матриц R2m составили, соответственно, 98, 56 и 64 %. Если в первом случае коэффициент неопределённости был всего 2 %, то в двух других - 44 и 36 %. Следовательно, по вариантам AMOVA1 и AMOVA2 были получены очень близкие структуры генетических отношений между породными выборками, тогда как по AMOVАЗ породные выборки имели иную структуру генетических взаимоотношений. В частности, по Fst(w&c) и Фрт мерам наибольшие парные GD имели место между выборкой джерсейских быков и всеми остальными; по Rst - между выборкой айршир-ских быков и прочими породными выборками.
Первоначальные матрицы GD имели очень тесную взаимосвязь с линеаризированными: RM > 0,995 (R2M > 99 %) при р,кгт < 0,001. Это указывало на незначительное воздействие линеаризации на отображение структуры генетических отношений между породными выборками. Также высокой была сопряжённость HnFsT(w&c) и НпФрт матриц - 0,994 при Ррегт = 0,001 (рис. 4). Вместе с тем, тесты Мантеля этих матриц с HnRsT-матрицей показали более низкие, чем по первоначальным, оценки Rm, соответственно, 0,696 и 0,729 при Ррет, = 0,005. Заметное несходство парных HnFsT(w&c)- и HnRsT-дистанций можно видеть по разбросу точек на рисунке 4 (справа) при коэффициенте неопределённости 52 %.
linFst(w&c)
Рис. 4. Тест Мантеля (Rm) для GD-матриц linFsT(w&c), НпФрт и linRsT / Fig. 4. Mantel test (Rm) for GD-matrices linFsT(w&o, НпФрт, and linRsT
Корреляция Мантеля матрицы стандартизированных Р' [г\у&г ';,-д истан ци й с матрицей первоначальной Рмт.-л.&г ,-дистанций была 0,981
При Ррегт 0,001. Стандартизация увеличила в разы оценки парных ОБ, но незначительно повлияла на структуру генетических взаимо-
отношений породных выборок (R2m = 96,2 %; 1 - R2m = 3,8 %). С матрицей линеаризированных дистанций коэффициент неопределённости был в 2 раза выше - 7,6 %.
Особый интерес представляла сопряжённость F's iiw &f ,-матрицы с матрицами GD из работы [22]. Rm с матрицей по Райту-Нею (Fst) была 0,966, с gsti-.i ii-viaTpHucii - 0,982, с матрицей несмещенных оценок генетических дистанций Нея (uGDN) — 0,977 (все с рреГт = 0,001). Соответствующие R2m были 93,3, 96,4, 95,5 %. Предельно большие Rm были получены с матрицей коэффициентов «генной дифференциации» Нея-Хедрика (G"st(hed)) - 1,0 и с матрицей коэффициентов «истинной аллельной дифференциации» Джоста (Dest) - 0,999 (обе с Ррегт < 0,001. Три меры с разными концепциями и алгоритмами расчётов: по гетерозиготно-сти (G"st(hed)), по эффективному числу аллелей (Dest) и по amova (F'st(w&c)) выявили структуры генетических отношений между породными выборками со 100 % схожестью (заметим, корреляция Мантеля между G"st(hed) и Dest матрицами была также очень высокой -0,998 При ррегт 0,002). В целом, тесты Мантеля показали достаточно высокую сопряжённость матриц парных GD, полученных разными методами и вариантами amova (кроме Rst).
В работе [38] исследовали GD среди 9 линий балканского низинного скота (Balkan Busa / Busha) и 12 европейских коммерческих пород. Были использованы 105 STR-локусов и две меры дифференциации: Fst и Dest. Усреднённые по всем популяциям оценки составили 0,06 и 0,093 соответственно, по балканским Буша - 0,016 и 0,021, по северо-западным европейским породам - 0,085 и 0,124. Dest-оценки были выше FsT-оценок в 1,3-1,6 раза. Между представленными в статье матрицами попарных GD корреляция Мантеля (рассчитанная нами) составила 0,984 прирреГт = 0,01.
Иные результаты были получены в работе [39]. Авторы изучали 5 исторических и 3 современных российских популяций крупного рогатого скота по девяти локусам STR-мар-керов с оценкой парных GD мерами Fst и Dest. Было сделано заключение, что «...both pairwise
Jost's d and Fst values in most cases were similar (Table 3)». Но данные в статье матрицы парных GD свидетельствовали об обратном. В частности, из 28 сравнений в 15 случаях оценки Fst превышали Dest; из них в 10 случаях - более чем в 2 раза (имелись различия в 8, 11, 34 и более раз). Рассчитанная нами корреляция Мантеля составила 0,508, R2m = 0,26, а коэффициент неопределённости - 0,74, что свидетельствовало о малом соответствии Fst- и dest-магриц (следовательно, и структур генетических взаимоотношений между породами). Особенно настораживает то, что FsT-оценки превышали dest-оценки. По данным литературы в большинстве случаев ситуация, как правило, обратная (см., например, [38]). При небольших значениях внутрипопуляционной гетерозиготно-сти (<0,5) иногда Fst может быть больше Dest [11]. Но анализируемые «популяции» имели несмещённые оценки гетерозиготности в диапазоне 0,644...0,852. Также озадачивают фактически нулевые GD между великорусским* и голландским скотом** (Fst = 0,006, Dest = -0,008), историческим и современным холмогорским скотом (Fst = 0,018, Dest = 0,016). Между великорусским и современным голш-тинским скотом GD были меньше (Fst = 0,079, Dest = 0,016), чем между холмогорским и ярославским (Fst = 0,174, Dest = 0,071). Отметим, статистики разнообразия характеризуют не только уровень генетических различий [двух] популяций, но и степень генетического сходства животных этих популяций.
В другой российской работе [40] были даны матрицы парных GD между 11 породами свиней по 10 STR-локусам. В большинстве случаев (52 из 55) dest-дистанции превышали Fst (оценки Dest были выше в 1,3 раза). Рассчитанная нами корреляция Мантеля составила 0,83 (R2m = 0,69). Коэффициент неопределённости, равный 0,31, указывал на наличие заметных отличий в структурах генетических взаимоотношений между породами при использовании двух мер. Это можно видеть и при сравнении приводимых в [40] филогенетических дендрограмм (авторы, к сожалению, не указали «правильную» дендрограмму).
* В отчете академика А. Ф. Миддендорфа за 1884 год коровы великорусской породы характеризовалиь как «тасканки» и «горемычки» - мелкие, узкие, беднокостные, размножаемые, в основном, для производства навоза (Исследование современного состояния скотоводства в России. Рогатый скот. В. Отчет А. Миддендорфа. М., 1884. Вып. 1. С. 1-50).
** Корифей российской зоотехнической науки проф. П. Н. Кулешов относил голландскую породу к «древним породам, послужившим к улучшению животноводства до 1700-1750 гг.». В частности, он писал: «В отношении крупного рогатого скота можно сказать, что существовала одна единственная голландская порода, выделившаяся из общей массы скота и служившая к улучшению скотоводства во всей Европе; от ней же произошла и наша холмогорская порода» (Кулешов П. Н. Породы домашних животных в исторической последовательности их развития (1926 г.). В кн.: Теоретические работы по племенному животноводству. М.: ОГИЗ «СЕЛЬХОЗГИЗ», 1947. С. 209-221).
Ординсщия быков на 2D диаграмме. Ординация - это упорядочение объектов вдоль некоторых осей методами многомерной статистики (РСА, РСоА и т.п.) с целью установления связи, классификации и проекции взаиморасположения на плоскости или в пространстве. Диаграмма на рисунке 5 представляет собой результат применения анализа главных координат (Principal Coordinate Analysis, РСоА) к STR-данным. В процессе РСоА исходная матрица размером 84x84 трансформировалась в более простую матрицу 84x2 (где 2 - число размерностей), содержащую координаты точек для изображения (смысл каждой из координат не имеет значения; главным является взаимное расположение точек-быков). Диаграмма визуализирует STR-вариацию среди быков в общей выборке и существующие в ней структуры. Взаимоотношения 84 быков отображены таким образом,
что чем больше GD между животными в исходной матрице, тем дальше они находятся друг от друга на диаграмме. Числа при Coord. 1 и Coord.2 указывают на проценты общей дисперсии, которые приходятся на каждую координату. Так, первая главная координата описывала 13,4 % общей дисперсии в структуре данных. Вторая - 10,2 % (третья координата - 6 %, не рассматривается). Суммарный процент дисперсии - это показатель того, насколько полно главные координаты представляют генетическую изменчивость среди быков-произ-водителей (информативность РСоА). Отметим, РСоА считается успешным, если первые 2-3 координаты выделяют (учитывают, объясняют) не менее 80 % общей дисперсии. В нашем случае на две первые координаты суммарно приходилось 23,6 % общей дисперсии (около 30 % натри координаты).
ч? -
(N
-d i—
о о
U
+ + + ХХ X Ж * ' V _i_ + + А у + у т + - X X
X ♦ * V Q о о □ □ □
□ AYR
♦ JER
ORDAT
ARSH
XH-DEU
ЖН-NLD
+ H-USA
Рис. 5. Ординация быков породных выборок на плоскости первой и второй главных координат/
Fig. 5. Ordination of the bulls of the breed samples on the plane of the first and second principal coordinates
Coord. 1:13,4%
Несмотря на 100-23,6~16 % потерю информации, в исследуемых данных выделились три относительно компактные структуры (кластера), что указывает на наличие генетически отличающихся групп животных. Координата 1 отделила голштинские «экотипы» от выборок «красных» пород; координата 2 -джерсейских быков от прочих. В верхнем левом углу расположились производители голштинских «экотипов», справа - быки «красных» пород, в нижнем левом углу -более сегрегированная (отличающаяся по генотипам) группа животных джерсейской породы.
Первые две группы (кластера) перекрывались незначительно. Однако внутри этих групп имело место высокая 8ТЯ изменчивость и смешение животных разных породных выборок. Это характеризует слабую генетическую дифференциацию (большое генетическое сходство), которая, возможно, есть следствие
достаточно сильного потока генов между породами.
Если маркировать двух джерсейских быков как «выбросы», то разброс остальных животных этой группы указывал на их большую однородность. Гомогенность и отдалённость от двух кластеров, по всей вероятности, есть следствие продолжительной генетической изоляции породы на острове Джерси (с 1763 по 2008 гг., но с возможностью экспорта животных в разные страны [41]).
Ординсщия выборок на 2Б диаграмме. На рисунке 6 представлены проекции генетических отношений семи породных выборок на 20 плоскости, полученных по разным матрицам парных ОБ. Первые три проекции - на основе матриц Рзкш&сг, НпРзкш&с)- и Р'зкш&сгдис-танций из АМОУА1, четвертая — по -млт-рице из АМОУАЗ (результаты по АМОУА2 были сходны с таковыми по АМОУА1).
о-
Fst(w&c) ♦ H-USA ♦ H-DEU ♦ H-NLD
♦ JER Ф RSH ♦ * RDAT AYR
о-
и
linFst(w&c) ♦ H-USA ♦ H-DEU ♦ H-NLD
♦ JER RSH ♦ ♦ RDAT ♦ AYR
Coord. 1: 76,1%
Coord. 1: 82,8%
F4t(w&c) H-DEU" ♦ H-USA ♦ H-NLD
♦ JER RSH ♦ AYR*
Coord. 1: 65,8%
Fst (Wright+Nei) ♦ H-USA ♦ H-DEU ♦ H-NLD
♦ JER RSH ♦ ^ * RDAT AYR
о
О
linRst H-DEU ♦ ♦ ♦ H-NLD H-USA ♦ RSH ♦ RDAT
JER ♦ AYR
Coord. 1: 64,4%
о
и
Dest H-DEU ^ H-USA H-NLD
♦ JER ♦ RSH ♦ RDAT AYR
Coord. 1: 73,6%
Coord. 1: 69,0%
Рис. 6. РСоА по разным матрицам парных генетических дистанций / Fig. б. РСоА for different matrices of paired genetic distances
На первых трёх проекциях местоположение породных выборок относительно друг друга было очень схожим. Чётко выделялись кластер «красных» пород, кластер голштинских «экотипов» и ветка джерсейской породы. Две первые координаты суммарно объясняли 97,598,9 % общей дисперсии (максимальная потеря информации 2,5 %).
РсоА-проекция ПпЯмт-матрицы (четвёртая) отличалась от предыдущих, но сохранились как кластеры, так и их локализация относительно друг друга. Корреляция Прокруста* с проекцией ПпРмт.-л.&г ,-матрицы составила 0,846 - даже несколько выше, чем корреляция Ман-теля соответствующих матриц (Ям = 0,696).
Статистическая значимость корреляции Прокруста была ррегт = 0,01: две проекции показали относительно высокую неслучайную конкордантностъ (concordance), т.е. согласованность, соответствие. Суммарная по двум координатам дисперсия также была высокой -94,7 % (потеря информации 5,3 %).
На рисунке 6 для сравнения представлены также две диаграммы из работы [22], полученных на том же самом материале, но при использовании иных статистик. В частности, пятая диаграмма - это проекция матрицы парных GD по Райту-Нею (fst(wnght-nei) = Gst; на базе ожидаемой гетерозиготности).
* Использован Прокрустов анализ (Procrustes analysis) - статистический метод, который сравнивает наборы [многомерных] форм, пытаясь преобразовать их в состояние суперналожения. В программе PROTEST это достигается путем минимизации сумм квадратов расстояний между соответствующими точками в каждой форме посредством перемещения, отражения, вращения и масштабирования их координатных матриц [42, 43].
□ Fst(w&c)
□ linFst(w&c)
■ F'st(w&c)
■ linRst
Рис. 7. РСоА-декомпошция общей дисперсии по разным GD-матрицам (%): А - дисперсии по 1, 2 и (1+2) координатам; В - дисперсия по породам (общая); С - дисперсия по породам для 1-ой координаты; D - дисперсия по породам для 2-ой координаты. Цифры в легенде - % учтённой дисперсии в зависимости от метода / Fig. 7. PCoA-decomposition of the total variance for different GD matrices (%): A - variance for 1, 2 and (1+2) coordinates; В - variance for breeds (total); С - variance for breeds for the 1st coordinate; D - variance for breeds for the 2nd coordinate. Numbers in the legend - % of the calculated variance, depending on the method
Шестая диаграмма - это проекция матрицы GD по Джосту (Dest), в основе расчёта которой вариация эффективного числа аллелей. Как и в первых четырёх диаграммах, информативность (состоятельность) РСоА была высокой (96,8 и 97,7 %). Также имело место хорошее соответствие ординаций с таковыми в трёх первых диаграммах.
Рисунок 7 иллюстрирует информативность РСоА и вклады породных выборок в дисперсию 1 и 2 координат при использовании разных мер GD. Coord. 1 объясняла 64-83 % общей дисперсии данных (с max по метрике HnFsT(w&c); рис. 7А), Coord.2 - 16-32 % (с max по метрике F'skw&c)). Наибольший вклад в общую дисперсию F-матриц GD вносила JER-вы-борка - 37-44 % (рис. 7В). Затем следовали выборки RSH - 16-20 % и RDAT - 12-13 %. Вклад AYR-выборки и голштинских «экотипов» был на уровне 2-10 %. По HnRsT-матрице вклады породных выборок были более выравненными: AYR и JER - 21 и 20%, H-NLD, RDAT и H-DEU -11-16%, RSH и H-USA - 6 и 9 %. Вклады породных выборок в дисперсию Coord. 1 были, примерно, пропорциональны предыду-
щим (рис. 7С). В дисперсию Coord.2 (рис. 7D) по F-матрицам наибольшие вклады вносили голштинские «экотипы» (2-9 %), в то время как по HnRsT-матрице - JER-выборка (18 %).
Двухфакторный AMOVA. Ординация породных выборок по всем матрицам GD была в общем сходной: выделились кластер «красных» пород, кластер голштинских «экотипов» и ветка джерсейской породы. Кластеры (определим их как «регионы») включали по три породных выборки. Это позволило провести двухфакторный AMOVA с разложением STR-изменчивости на межрегиональный и межпородный в пределах регионов компоненты. Результаты обобщены в таблице 7.
Суммарные оценки дифференциации были на уровне полученных ранее величин: до стандартизации 0,108 при рреГт =0,001, после стандартизации - 0,384 (по 7 породным выборкам F'stcw&c) = 0,351). Доминировало региональное различие, которое составляло около 90 % от общей дифференциации. В пределах регионов дифференциация породных выборок была незначительной и статистически незначимой (ррегт = 0,063).
Таблица 7 - Результаты 2-х факторного AMOVA1 по 6 породным выборкам (без JER-выборки) / Table 7 - Results of 2-factor AMOVA1 for 6 breed samples (without JER-sample)
Статистика / Statistics Est. Pperm
До стандартизации / Prior to the standardization of
Frt 0,101 0,001
Fsr 0,008 0,063
Fst = Frt + Fsr 0,108 0,001
После стандартизации / After standardization
F'rt 0,357
F'sr 0,027
F'st = F'rt + F'sr 0,384
Примечания: Frt - дифференциация регионов; Fsr -дифференциация породных выборок внутри регионов /
Notes: Frt - differentiation of regions; Fsr - differentiation of breed samples within regions.
Также были проведены однофакторные анализы по каждому «региону». AMO VA 1 по RED-региону (AYR, RDAT, RSH) показал статистически незначимую оценку дифференциации породных выборок (Fst(w&c) = 0,005 при Ррегт = 0,289; F'st(w&c) = 0,016). При анализе выборок HOL-региона (H-DEU, H-NLD, H-USA) оценка дифференциации была хотя и статистически значимой, но небольшой (Fst(w&c) = 0,016 при Ррегт = 0,015; F'st(w&c) = 0,058).
Чем объясняются полученные результаты? На протяжении более 150 лет селекционеры США целенаправленно работали над молочным типом и молочностью голштино-фризского скота. В Северной Европе большее внимание уделялось жирномолочности коров и молочно-мясному типу скота. Разные цели селекции могли стать причиной «диверсифицированного отбора» - усиления различий в ал-лельных профилях европейских и голштинской популяциях. Подтверждение находим в полногеномных исследованиях (SNP-маркеры) американских учёных. Так, в работе [41] было показано, что между голштинской породой США (интенсивная система производства) и джер-сейской породой острова Джерси (экстенсивная система производства) GD была на уровне 0,15. Это достаточно высокое значение для SNP-маркеров. Например, между голштинской и якутской породами GD оценивалась в 0,19 [44]. В работе [45] одна группа животных голштинской породы 1964 года представляла образцы неотобранных геномов 1950-х годов (контроль). Другая группа состояла из современных голштинских коров, которая представляла
образцы геномов после 40 лет селекции. Анализ главных компонент выявил временные сдвиги «геномного ландшафта» породы. Было показано, что проводимая с 1964 года практическая селекция затронула около 40 % генома. В частности, привела к изменениям частот аллелей по всему геному и связанные с ними изменения гетерозиготности, частоты гаплотипов и локальные изменения частот, которые создавали «пики», «холмы» и «долины» частотных различий между отселектированной и контрольной группами.
С другой стороны, в Европе имели место процессы поглощения и конфлюэнции (слияния) генофондов разных пород. Во-первых, проводимая с 1970-х годов голштинизация немецкого и голландского чёрно-пёстрого скота привела к формированию относительно гомогенных «экотипов», высококровных по голштинской породе. Во-вторых, обмен генетическим материалом между айрширской, красной датской и красно-пёстрой шведской породами способствовал получению потомства различной кровности, смешиванию генофондов и, как следствие, объединению популяций с последующим разведением скота по единой программе селекции VikingRed (http://www. vikinggenetics.com/). Известно, что чем ближе в родословных общие предки разных пород, тем животные в большем родстве друг другу. В результате регулярного обмена генетическим материалом различия аллельных профилей между породами (популяциями) стираются и оценки генетической дифференциации (дистанции) приближаются к нулю. В качестве примера можно привести незначительную генетическую дифференциацию (0,006-0,016) популяций гернзейской породы США, Канады, Великобритании и острова Гернси (Guernsey) вследствие международного интенсивного обмена генетическим материалом [46].
Можно полагать, что рассмотренные процессы и явились причиной (или одной из причин) высокого вклада «региональной» компоненты (90 %) в суммарную STR-диффе-ренциацию исследуемых породных выборок быков-производителей.
Моделирование. При нулевой оценке генетической дифференциации субпопуляций или величине, не имеющей практического значения, эти субпопуляции можно считать частями одной популяции. Относительно сохранения генофонда местных пород, то, возможно, целесообразно не поддерживать
много разных малочисленных пород одного вида, а объединить породы со слабой генетической дифференциацией (высоким генетическим сходством). По двухфакторному AMOVA была получена статистически не значимая оценка STR-дифференциации породных выборок в пределах регионов, т.е. региональные выборки представляли генофонды двух популяций. Финская Ассоциация Племенного Скотоводства (Faba) уже в 2010 году де-факто объединила AYR, RDAT и RSH породы, присоединив их к международной племенной организации VikingGenetics. Также голштин-ская порода считается транснациональной, в которой немецкая и нидерландская субпопуляции являются её составными частями. Фиксация постфактум генетических взаимоотношений, сформировавшихся при практическом разведении и селекции рассматриваемых пород, - это сопутствующий результат наших исследований. Анализируемые породные выборки представляли интерес не только как объекты для сравнительных исследований методов оценки STR-дифференциации популяций. Они интересны и как модельные популяции для исследования разных сценариев сохранения генофонда исчезающих пород.
Допустим, что имеем не семь реальных породных выборок, а семь гипотетических местных малочисленных пород с полученной выше структурой генетических взаимоотношений. Так как генетическое сходство AYR, RDAT и RSH пород очень высокое, то их можно объединить и сформировать новую RED-породу. Аналогично и по H-DEU, H-NLD и H-USA породам - сформировать HOL-породу. Предположим, что мы решились на такой «породообразовательный процесс». Как он отразится на внутри- и межпородном генетическом разнообразии новой породной структуры (JER, RED, HOL)?
Усреднённое по AYR, RDAT и RSH породам число аллелей на локус (па) было 5,1, эффективных аллелей (пе) - 3,3, ожидаемая гетерозиготность (Не) - 65,8 %. В «новой»
RED-породе эти показатели составили, соответственно, 6,7, 3,5 и 68,3 %. Усреднённые по H-DEU, H-NLD и H-USA породам показатели были: па = 5,5, пе = 3,8, Не = 70,2 %. В «новой» HOL-породе они составили, соответственно, 7,0, 4,1 и 72,4 %. Показатели генетического разнообразия RED и HOL пород ожидаемо возрасли: по па в среднем на 29 %, пе - на 7 %, Не - на 3,5 % (заметим, объединение увеличило и численность «новых» популяций, что немаловажно).
Сводные оценки генетической дифференциации гипотетических местных пород (семи до объединения) были: по Fst(w&c) -0,108, F' st(w&c) - 0,351, Dest - 0,292 с 95% CI 0,244...0,339 (Dest из работы [22]). После объединения (3 породы) оценки составили, соответственно, 0,140, 0,453 и 0,427 с 95 % CI 0,348...0,493. Объединение пород с высоким генетическим сходством увеличило STR-диф-ференциацию новой породной структуры, именно: оценки Fst(w&c) и F'st(w&c) повысились на 29 %, Dest - на 46 %. Здесь следует отметить, что статистики Fst(w&c) и F'st(w&c) относятся к семейству «мер фиксации», т. к. они фактически измеряют близость аллелей к их фиксации в каждой субпопуляции или степень завершения процесса фиксации (аллель достиг частоты 1), а не абсолютную дифференциацию. dest-статистика относится ко второму семейству мер - «аллельной дифференциации», когда дифференциация - это отсутствие какой-либо общей аллели(-ей) в субпопуляциях. Эта статистика равна 1, когда аллелофонд каждой субпопуляции состоит полностью из приватных аллелей, и равна 0, когда все субпопуляции имеют одни и те же аллели с одинаковыми частотами [4]. Исходя из 95 % CI по Dest можно полагать, что общих аллелей в аллелофондах трёх «новых» пород 50-65 % (до объединения их было 66-76 %). Парные по породам GD были (в круглых скобках - усреднённые оценки из анализов по семи породным выборкам, в квадратных скобках - % снижения после объединения):
Fst(w&c) F'st(w&c) Dest
JER-RED JER-HOL RED - HOL 0,234 (0,247) [-5,3] 0,171 (0,187) [-8,6] 0,105 (0,113) [-7,1] 0,652 (0,661) [-1,4] 0,513 (0,528) [-2,8] 0,366 (0,385) [-4,9] 0,547 (0,551) [-0,7] 0,413 (0,420) [-1,7] 0,292 (0,307) [-4,9]
Наибольшие STR-дистанции были между JER и RED породами, в 2 раза короче (в среднем) - между породой RED и HOL. В противоположность сводным оценкам диф-
ференциации, имело место небольшое сокращение парных GD: в среднем на 7 % по Fst(w&c) оценщику, на 3 % - по F'st(w&c) и на 2,4 % - по Dest. Между JER и RED породами
STR-дистанции сократились в среднем на 2,5 %, между JER и HOL - на 4,4 %, RED и HOL - на 5,6 %.
Изменился и вклад пород в STR-раз-нообразие. Так, до объединения вклад JER породы (выборки) по РСоА оценивался в 38,1 %, суммарный вклад AYR, RDAT и RSH пород был 37,5%, a H-DEU, H-NLD и H-USA пород -24,4 %. После объединения вклад JER-породы составил 43,5 % (+5,4 процентных пункта, п.п.), вклад RED-породы - 36,3 % (-1,2 п.п.) и вклад HOL-породы 20,2 % (-4,2 п.п.).
Заключение. Три подхода к дисперсионному анализу микросателлитной изменчивости (AMOVA): по матрице дистанций между аллелями (расчёт F s • i г w ,-ст ат и ст и к и). по матрице дистанций между генотипами (Фрт) и матрице различий в размерах аллелей (Rst), по всей вероятности, приводят к достаточно близким сводным оценкам генетической дифференциации пород. При этом разные компьютерные программы обеспечивают получение схожих AMOVA-оценок. Оценки по AMOVA сопоставимы с G-оценками Нея (Nei) на базе ожидаемой гетерозиготности. Если число локусов для анализа небольшое, то RsT-оценки
могут быть смещёнными. Статистики Fst(w&c) и Фрт подвержены влиянию уровня внутрипо-родной гетерозиготности и нуждаются в стандартизации, которая может значительно повысить первоначальные оценки. Стандартизированные оценки хорошо согласуются с оценками, рассчитанными методами Джоста (Jost) и Морисита-Хорна (Morisita-Horn), на которые влияния уровня внутрипородной гетерозиготности нет. Сопряжённость матриц парных по породам генетических дистанций, рассчитанных с использованием разных мер, высокая. Их РСоА-проекции на 2D плоскости сопоставимы: разные подходы и методы приводят к сходным структурам пространственных взаимоотношений между породами. Двухфак-торный AMOVA позволяет количественно оценить как генетические различия между регионами с разными методами разведения и/или селекции пород, так и генетические различия между породами в пределах регионов. Объединение [вытесняемых] пород с большим генетическим сходством (малыми генетическими дистанциями) может способствовать увеличению аллельного разнообразия «новых» пород и усилению их дифференциации.
References
1. Wright S. Isolation by distance. Genetics. 1943;28(2):114-138. URL: https://www.genetics.Org/content/28/2/114
2. Wright S. The genetical structure of populations. Ann. Eugen. 1951;15(l):323-354. DOI: https://doi.org/10.1111/j. 1469-1809.1949.tb02451 ,x
3. Кузнецов В. M. F-статистики Райта: оценка и интерпретация. Проблемы биологии продуктивных животных. 2014;(4):80-104. Режим доступа: https://еlibrarv.ru/item.asp?id=22833217
Kuznetsov V. М. F-statistiki Ravta: otsenka i interpretatsiva. [Wright's F-statistics: estimation and interpretation], Problemv biologii produktivnvkh zhivotnvkh. 2014;(4):80-104. (InRuss.). URL: https ://elibrarv.ru/item.asp?id=22833217
4. Jost L., Archer F„ Flanagan S., Gaggiotti O., Hoban S., Latch E. Differentiation measures for conservation genetics. Evol. Appl. 2018;11(7):1139-1148. DOI: https://doi.org/10.1111/eva. 12590
5. BallouxF., Lugon-Moulin N. The estimation of population differentiation with micro satellite markers. Mol. Ecol. 2002;11(2):155-165. DOI: https://doi.Org/10.1046/i.0962-1083.2001.01436.x
6. Wright S. Evolution and the genetics of populations. Vol. 4. Variability within and among natural populations. Univ. Chicago, 1978. 590 p.
7. Nei M. Analysis of gene diversity in subdivided populations. Proc. Nat. Acad. Sci. USA. 1973;70(12/1):3321-3323. DOI: https://doi.org/l6.1073/pnas.7Q. 12.3321
8. Nei M„ Chesser R. K. Estimation of fixation indexes and gene diversities. Ann. Hum. Genet. 1983;47(3):253-259. DOI: https://doi.org/10.1111/j. 1469-1809.1983.tb00993.x
9. Кузнецов В. M. Методы Нея для анализа генетических различий между популяциями. Проблемы биологии продуктивных животных. 2020;(1):91-110. Режим доступа: https ://е lib rarv. ru/item. asp?id=43811467
Kuznetsov V. М. Metodv Neva diva analiza geneticheskikh razlichiy mezhdu populvatsivami. [Nei's methods for analyzing genetic differences between populations]. Problemv biologii produktivnvkh zhivotnvkh = Problems of Productive Animal Biology. 2020;(1):91-110. (InRuss.). URL: https://elibrarv.ru/item.asp?id=43811467
10. Hedrick P. W. A standardized genetic differentiation measure. Evolution. 2005;59(8): 1633-1638. URL: https://www.istor.org/stable/3449070
11. Meirmans P. G., Hedrick P. W. Assessing population structure: FST and related measures. Mol. Ecol. Res. 2011;11(1):5-18. DOI: https://doi.org/10.1111/j. 1755-0998.2010.02927.X
12. JostL. Gst and its relatives do not measure differentiation. Mol. Ecol. 2008;17(18):4015-4026. DOI: https://doi.Org/10.llll/j.1365-294X.2008.03887.x
13. Whitlock M. С. G'st and D do not replace FST. Mol. Ecol. 2011;20(6):1083-1091. DPI: https://doi.Org/10.llll/i.1365-294X.2010.04996.x
14. PutmanA. I., Carbonel. Challenges in analysis and interpretation of microsatellite data for population genetic studies. Ecol. Evol. 2014;4(22):4399-4428. DOI: https://doi.org/10.1002/есеЗ.1305
15. Cockerham С. C. Variance of gene frequencies. Evolution. 1969;23(l):72-84. DOI: https://doi.org/10.1111/j.1558-5646.1969.tb03496.x
16. Cockerham С. C. Analyses of gene frequencies. Genetics.1973;74(4):679-700. URL: https://www.genetics.Org/content/74/4/679
17. WeirB. S., Cockerham С. C. Estimating F-statistics for the analysis of population structure. Evolution. 1984:38(6): 1358-1310. DOI: https://doi.org/10.2307/2408641
18. Вейр Б. Анализ генетических данных. М.: Мир, 1995. 400 с.
Very В. Analizgeneticheskikh demnykh. [Genetic data analysis]. Moscow: Mir. 1995. 400 p.
19. ExcoffierL., Smouse P. E.. Quattro J. M. Analysis of molecular variance inferred from metric distances among DNA haplotypes: application to human mitochondrial DNA restriction data. Genetics. 1992;131(2):479-491. URL: https://www.genetics.Org/content/131/2/479
20. Michdakis Y., Excoffied L. A Generic estimation of population subdivision using distances between alleles with special reference for microsatellite loci. Genetics. 1996;142(3):1061-1064.
URL: https://www.genetics.Org/content/genetics/142/3/1061.full.pdf
21. Slatkin M. A. Measure of population subdivision based on microsatellite allele frequencies. Genetics. 1995;139(l):457-462. URL: https://www.genetics.Org/content/139/l/457
22. Кузнецов В. M. Сравнение методов оценки генетической дифференциации популяций по микросателлитным маркерам. Аграрная наука Евро-Северо-Востока. 2020;21(2):169-182.
DOI: https://doi.Org/10.30766/2072-9081.2020.21.2.169-182
Kuznetsov V. М. Sravnenie metodov otsenki geneticheskov differentsiatsii popu-lyatsiv po mikrosatellitnvm markeram. [Comparison of methods for evaluating genetic differentiation of populations by microsatellite markers]. Agramava nauka Evro-Severo-Vostoka = Agricultural Science Euro-North-East. 2020;21(2):169-182. (In Russ.). DOI: https://doi.Org/10.30766/2072-9081.2020.21.2.169-182
23. NeiM. Genetic distance between populations. Amer. Natur. 1972;106(949):283-292. DOI: https://doi.org/10.1086/282771
24. Nei M. Estimation of average heterozygosity and genetic distance from a small number of individuals. Genetics. 1978;89(3):583-590. URL: https://www.genetics.Org/content/89/3/583
25. PeakallR., Smouse P. GenAlEx Tutorial 1: Introduction to population genetic analysis. Australian National University. 2012. 57 p. URL: https://mafiadoc.com/genalex-tutorial-l-introduction-to-population-genetic-
597ef8441723dd6ae3e07272.html
26. Peakall R., Smouse P. E. GenAlEx 6.5: Genetic analysis in Excel. Population genetic software for teaching and research - an update. Bioinfonnatics. 2012;28(19):2537-2539.
DOI: https://doi.org/10.1093/bioinfonnatics/bts460
27. Meinnans P. G. Using the AMOVA framework to estimate a standardized genetic differentiation measure. Evolution. 2006:60(11):2399-2402. DOI: https://doi.Org/10.llll/j.0014-3820.2006.tb01874.x
28. Excoffier L., Laval G., Sclmeider S. Arlequin ver. 3.0: An integrated software package for population genetics data analysis. Evolutionary Bioinfonnatics Online. 2005;1:47-50.
URL: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2658868/
29. Raymond M„ RoussetF. GENEPOP (Version 1.2): Population genetics software for exact tests and ecumenicism. J. Hered. 1995;86(3):248-249. DOI: https://doi.org/10.1093/oxfordiournals.ihered.al 11573
30. Rousset F. Genepop'007: a complete reimplementation of the Genepop software for Windows and Linux. Mol. Ecol. Res. 2008;8(1): 103-106. DOI: https://doi.Org/10.llll/i.1471-8286.2007.01931.x
31. Goodman S. J. RST CALC: A collection of computer programs for calculating unbiased estimates of genetic differentiation and detennining their significance for microsatellite data. Mol. Ecol. 1997;6(9):881-885. DOI: https://doi.Org/10.1046/i.1365-294X.1997.00260.x
32. Chao A., MaK. H., HsiehT. C., CliiuC. H. Online program SpadeR (Species-richness Prediction And Diversity Estimations R). 2016. 88 p. DOI: https://doi.Org/10.13140/RG.2.2.20744.62722
33. STATGRAPHICS® Centurion XVI User Manual. By StatPoint Technologies, Inc. 2010. 297 p.
34. Balloux F., Goudet J. Statistical properties of population differentiation estimators under stepwise mutation in a finite island model. Mol. Ecol. 2002;11(4):771-783. DOI: https://doi.Org/10.1046/j.1365-294x.2002.01474.x
35. ExcoffierL., HamiltonG. Comment on «Genetic Structure of Human Populations». Science. 2003;300(5627): 1877. DOI: https://doi.org/10.1126/science. 1083411
36. NeiM. Definition and estimation of fixation indices. Evolution. 1986;40(3):643-645. DOI: https://doi.org/10.1111/i.1558-5646.1986.tb00516.x
37. HedrickP. W. Perspective: Highly variable loci and their interpretation in evolution and conservation. Evolution. 1999;53(2):313-318. DOI: https://doi.Org/10.llll/i.1558-5646.1999.tb03767.x
38. Medugorac I., Veit-Kensch С. E., Ramljak J., Brka M., Markovic В., Stojanovic S., Bytyqi H., KochoskiL., Kume K„ Griinenfelder H.-P., Bennewitz J., ForsterM. Conservation priorities of genetic diversity in domesticated metapopulations: a study in taurine cattle breeds. Ecol. Evol. 2011;l(3):408-420. DOI: https://doi.org/10.1002/ece3.39
39. Abdelmanova A. S., Kharzinova V. R., VolkovaV. V., Mishina A. I., Dotsev A. V., Sermyagin A. A., Boronetskaya О. I., Petrikeeva L. V., Cliinarov R. Yu, Brem G., Zinovieva N. A. Genetic Diversity of Historical and Modern Populations of Russian Cattle Breeds Revealed by Microsatellite Analysis. Genes. 2020;11(940): 1-15. DOI: https://doi.org/10.3390/genesllQ80940
40. Харзинова В. P., Зиновьева H. А. Паттерн генетического разнообразия у локальных и коммерческих пород свиней на основе анализа микросателлитов. Вавиловский журнал генетики и селекции. 2020;24(7):747-754. DOI: https://doi.org/10.18699/VJ20.669
Kharzinova V. R., Zinov'eva N. A. Pattern geneticheskogo raznoobraziya и lokal'nvkh i kommercheskikh porod s\>inev na osnove analiza mikrosatellitov. [The pattern of genetic diversity of different breeds of pigs based on microsatellite analysis]. Vavilovskiy zhurnal genetiki i selektsii = Vavilov Journal of Genetics and Breeding. 2020;24(7):747-754. (InRuss.). DOI: https://doi.org/10.18699/VJ20.669
41. HusonH. J., SonstegardT. S., Godfrey J., HambrookD., Wolfe C., Wiggans G., Blackburn H., VanTas-sell C. P. A Genetic Investigation of Island Jersey Cattle, the Foundation of the Jersey Breed: Comparing Population Structure and Selection to Guernsey, Holstein, and United States Jersey Cattle. Front. Genet. 2020:11(366): 1-17. DOI: https://doi.org/10.3389/fgene.2020.0Q366
42. Peres-Neto P. R., Jackson D. A. How well do multivariate data sets match? The advantages of a Procrustean superimposition approach over the Mantel test. Oecologia. 2001;129(2):169-178. DOI: https://doi.org/10.1007/s00442010072Q
43. Dray S., ChesselD., Thioulouse J. Procrustean co-inertia analysis for the linking of multivariate datasets. Ecoscience. 2003;10(1):110-119. DOI: https://doi.org/10.1080/11956860.2003.11682757
44. Sennyagin A. A., Dotsev A. V., GladyrE. A., TraspovA. A., Deniskova Т. E„ Kostyunina О. V., Reyer H„ WimmersK., BarbatoM., Paronyanl. A., Plemyashov К. V., SolknerJ., Popov R. G., BremG., Zinovieva N. A. Whole-genome SNP analysis elucidates the genetic structure of Russian cattle and its relationship with Eurasian taurine breeds. Genet. Sel. Evol. 2018;50(37):1-13. DOI: https://doi.org/10.1186/sl2711-018-04Q8-8
45. MaL., SonstegardT. S„ Cole J. В., VanTassell С. P., Wiggans G. R„ CrookerB. A., TanC., Praka-penkaD., LiuG., DaY. Genome changes due to artificial selection in U.S. Holstein cattle. BMC Genomics. 2019;20(128):1-14. DOI: https://doi.org/10.1186/sl2864-019-5459-x
46. CooperT. A., Eaglen S. A. E., Wiggans G. R., Jenko J., HusonH. J., MorriceD. R., BichardM., de L. Luff W. G., Woolliams J. A. Genomic evaluation, breed identification, and population structure of Guernsey cattle in North America, Great Britain, and the Isle of Guernsey. J. Dairy Sci. 2016;99(7):5508-5515. DOI: http://dx.doi.org/10.3168/ids.2Q15-10445
Сведения об авторе
И Кузнецов Василий Михайлович, доктор с.-х. наук, профессор, зав. лабораторией популяционной генетики в животноводстве, ФГБНУ «Федеральный аграрный научный центр Северо-Востока имени Н. В. Рудницкого», ул. Ленина, д. 166а, г. Киров, Российская Федерация, 610007, e-mail: priemnaya@fanc-sv.ru. ORCID: htti)s://orcid.org/0000-0002-2219-805X. e-mail: vm-kuznetsov@mail.ru
Information about the author
El Vasiliy M. Kuznetsov, DSc in Agricultural Science, professor. Head of the Laboratory of Population Genetics in Animal Husbandry, Federal Agricultural Research Center of the North-East named N. V. Rudnitsky, Lenin str., 166a, Kirov, Russian Federation, 610007, e-mail: priemnaya@fanc-sv.ru. ORCID: htti)s://orcid.org/0000-0002-2219-805X, e-mail: vm-kuznetsov@mail.ru
- Для контактов / Corresponding author