j Mechanisms
Regulatory Mechanisms
in Biosystems
ISSN 2519-8521 (Print) ISSN 2520-2588 (Online) Regul. Mech. Biosyst., 8(3), 343-348 doi: 10.15421/021753
Grouping and clustering of maize Lancaster germplasm inbreds according to the results of SNP-analysis
K. V. Derkach*, T. M. Satarova**, V. V. Borysova*, V. Y. Cherchel*, B. V. Dzyubeckiy*
*institute of Grain Crops of National Academy of Agrarian Science of Ukraine, Dnipro, Ukraine **Oles Honchar Dnipro National University, Dnipro, Ukraine
Article info
Received 19.06.2017 Received in revised form
28.07.2017 Accepted 03.08.2017
institute of Grain Crops of NAAS of Ukraine, V. Vernadsky Str., 14, Dnipro, 49067, Ukraine.
Oles Honchar Dnipro National University, Gagarin Ave., 72, Dnipro, 49010, Ukraine. Tel.: +38-056-236-26-18. E-mail: satarova2008@ukr.net, kvderkach@gmail. com
Derkach, K. V., Satarova, T. M., Borysova, V. V., Cherchel, V. Y., & Dzyubeckiy, B. V. (2017). Grouping and clustering of maize Lancaster germplasm inbreds according to the results of SNP-analysis. Regulatory Mechanisms in Biosystems, 8(3), 343-348. doi: 10.15421/021753
The objective of this article is the grouping and clustering of maize inbred lines based on the results of SNP-genotyping for the verification of a separate cluster of Lancaster germplasm inbred lines. As material for the study, we used 91 maize (Zea mays L.) inbred lines, including 31 Lancaster germplasm lines and 60 inbred lines of other germplasms (23 Iodent inbreds, 15 Reid inbreds, 7 Lacon inbreds, 12 Mix inbreds and 3 exotic inbreds). The majority of the given inbred lines are included in the Dnipro breeding programme. The SNP-genotyping of these inbred lines was conducted using BDI-III panel of 384 SNP-markers developed by BioDiagnostics, Inc. (USA) on the base of Illumina VeraCode Bead Plate. The SNP-markers of this panel are biallelic and are located on all 10 maize chromosomes. Their range of conductivity was >0.6. The SNP-analysis was made in completely automated regime on Illumina BeadStation equipment at BioDiagnostics, Inc. (USA). A principal component analysis was applied to group a general set of 91 inbreds according to allelic states of SNP-markers and to identify a cluster of Lancaster inbreds. The clustering and determining hierarchy in 31 Lancaster germplasm inbreds used quantitative cluster analysis. The share of monomorphic markers in the studied set of 91 inbred lines equaled 0.7%, and the share of dimorphic markers equaled 99.3%. Minor allele frequency (MAF) > 0.2 was observed for 80.6% of dimorphic markers, the average index of shift of gene diversity equaled 0.2984, PIC on average reached 0.3144. The index of gene diversity of markers varied from 0.1701 to 0.1901, pairwise genetic distances between inbred lines ranged from 0.0316-0.8000, the frequencies of major alleles of SNP-markers were within 0.5085-0.9821, and the frequencies of minor alleles were within 0.0179-0.4915. The average homozygosity of inbred lines was 98.8%. The principal component analysis of SNP-distances confirmed the isolation of the Lancaster group within the general set of analyzed inbred lines. Two-dimensional component analysis showed that the first principal component (PCA1) accounted for 36.0% of total variation and divided the investigated set of 91 inbred lines into two fractions, while all the inbred lines which are considered Lancaster based on pedigree information were included in one of the fractions. The second principal component (PCA2), which accounted for 12.1% of total variation, separated most of the Lancaster germplasm inbred lines from the others in this fraction, although the overlapping of the locations of Lancaster and non-Lancaster inbred lines was observed. Qualitative cluster analysis of 31 Lancaster germplasm inbred lines allowed to identify two clusters: the first one includes 23 inbred lines of Ukrainian selection and the well known Mo17 inbred line (77.4% of total number of analysed lines) inbred line, and the second cluster included 6 inbred lines of Ukrainian selection and the well known Oh43 inbred line (22.6% of total number of analysed lines) inbred line. The isolation of two clusters within Lancaster germplasm indicates the genetic diversity in this plasm. The evaluation of genome similarities through allelic states of SNP-markers can successfully be used for classification and systematization of the gene pool of maize genetic resources.
Keywords: Zea mays; markers of single nucleotide polymorphism of DNA; principal component analysis; cluster analysis
Групування та кластеризащя .liiiiii кукурудзи зародковоТ плазми Ланкастер за результатами SNP-аналiзу
К. В. Деркач*, Т. М. Сатарова**, В. В. Борисова*, В. Ю. Черчель*, Б. В. Дзюбецький*
*1нститут зерновых культур НААН Украши, Днтро, Украша **Днтровсъкий нацюналъний утверситет iMeHi Олеся Гончара, Днтро, Украша
Охарактеризовано репрезентативтсть маркерiв однонуклеотидного полiморфiзму ДНК rnHeni BDI-III з 384 SNP-маркерiв для 91 лшл кукурудзи Дншровсько! селекцшно! програми рiзних зародкових плазм. Проведено групування дослвджуваного масиву лшй за алельним станом SNP-маркeрiв та вдентифжащю кластера плазми Ланкастер серед загально! добiрки лшй шляхом проведення двовишрного
Regul. Mech. Biosyst., 8(3) 343
принципового компонентного ан^зу. За результатами яюсного кластерного аналiзу методом повного зв'язку вiдмiчено генетичне рiзноманiття всерединi плазми Ланкастер за вардаванням алельного стану SNP-маркерiв. Серед проаналiзованих лiнiй зародково! плазми Ланкастер видiлено два тдкластери. Перший пiдкластер об'еднуе 23 лши украшсько! селекцй та широковiдому лшто Мо17 (77,4%), другий - 6 лшш укра'шсько! селекцй' та широковщому лiнiю Oh43 (22,6%).
Ключовi слова: Zea mays', маркери однонуклеотидного полiморфiзму ДНК; принциповий компонентний аналiз; кластерний аналiз
Вступ
Внутршньовидова систематизадш генетичних ресуров культурних рослин - актуальна проблема, особливо для моно-типних родiв, таких як кукурудза (Zea mays L.). За рахунок ба-гатор1чно! селекцй усередиш одного виду юнують сотт, тисящ i навпъ мшьйони локальних популящй, лшш, пбридав, сортв. Упорядкування nie! маси представниив того чи шшого виду культурних рослин залежно вщ !х генетично! спорiдненостi та геномна характеристика - необхiднi завдання молекулярно! генетики та бiотехнологi!.
Сучасна селекщя кукурудзи будуеться на основi гетерозис-них моделей i полягае у використант лшшного матерiалу ргз-них тип1в зародково! плазми. Типи зародково! плазми - окрем групи, яю об'еднують значну илькить спорщнених генотишв кукурудзи, тобто тих, як мають спшьне походження, як правило, походять вщ одного вимдного сорту. Для Украши селек-щйно найперспективиша група лшш кукурудзи зародково! плазми Ланкастер. Вирощуються також лши зародкових плазм Айодент, Лакон, Рейд. Лши плазми Ланкастер вщдзняються високою комбшащйною здатнiстю, штенсивним стартовим ростом, середньою стшкютю до хвороб i, головне, значною по-сухо- та жаростшкютю, що актуально в умовах глобального потеплшня (Dzjubec'kij е1 al., 2012; Derkach е1 al., 2016).
Сучаст генотипи зародково! плазми Ланкастер походять вщ вiльнозапиленого сорту Lancaster Sure Crop, який створила родина Hershey з округу Ланкастер, штат Пенсильванш (США). Родина Hershey у 1860-1910 рр. працювала з мкцевим натвкременистим сортом, який характеризувався малими тонкими качанами лавандового (бузкового) кольору. Спочатку вiдбирали за середньою довжиною качана, добре дозршим насшням, неуражетстю плгснявою. Постшно вiдбирали кача-ни з кременистими зернами, хоча схрещування проводили з щзтми зубоподбними сортами. Шзнше тд час вщбору почали звертати увагу на мщнш! коренi та бшш качани. В!д!6-раний !з цього типу зародково! плазми сорт кукурудзи названо Sure Crop через його ранньостигтсть i посухостшюсть, що забезпечувало сталий впевнений врожай. Окремо селекщею вiльнозапиленого сорту Lancaster займалася родина Richey бшя Ла Саля, штат 1лшнойс, в 1888 по 1920 рр., створивши сорт Richey Lancaster. Насшня сорту Lancaster Sure Crop потра-пило до них через миранпв !з Мшнесоти, як1 привезли його з Пенсильвани. Селекщю вели на бшьшу довжину качана, бшь-шу масу насшня, вищу врожайтсть та кращу схожтсть насшня. Сучаст лши плазми Ланкастер переважно походять вщ двох лшш першого циклу самозапилення сорту Ланкастер - 0h40B (вщ сорту Richey Lancaster) та С103 (вщ сорту Lancaster Sure Crop), хоча практичного значення набули лши другого циклу самозапилення Мо17 (вщ лши С103) та 0h43 (вщ лши 0h40B) (Bennetzen and Hake, 2009).
1сторично склалося, що приналежтсть лшш кукурудзи до певного типу зародково! плазми, тобто внутршньовидова кла-сифжащя, яка покликана бути фшогенетичною, Грунтуеться на даних педа^ (родоводв), тобто взаемовiдносини лшш ощню-ються залежно вщ !х походження. Така класифжащя недоско-нала, бо родоводи мають так недолжи як суб'ективтсть, пропуски в записах, неможливiсть вiдновлення тих !х частин, як належать до Х1Х - першо! половини ХХ ск^ччя, мжсування неспорiднених генотипiв у генотип нащадка. Внутршньо-видова класифжащя кукурудзи, основана на ощнювант, на-приклад, комбшащйно! здатностi (подш зразкiв не на зародов плазми, а на гетерозисы групи), також не досконала, оскшьки прояв ознаки комбiнацiйно! здатностi залежить не тшьки вщ
генотипу, а i вiд факгорiв довкшля. Подш генофонду культурно! рослини по групах адаптаци до мшливих умов довкшля зустрГчаеп>ся з гим, що генотипи однге! групи адапгацй не обов'язково гомолопчт за походженням (Dzjubec'kij et al., 2012). Разом i3 цим, використання рiзних тишв молекулярно-генетичних маркерiв, зокрема, маркерiв однонуклеотидного по-лiморфiзму ДНК (single nucleotide polymorphism), тобто SNP-маркерiв, розглядаеться як потенцiйно ефективний iнструмент внутршньовидово! класифiкацii та систематизаци генофонду культурних рослин, що враховують спораднетсть i варiювання на рiвнi геномiв, на вгдмшу вiд методiв, якi базуються на порiвняннi за фенотипiчними ознаками (Elshire et al., 2013; Wu et al., 2016; Zhang et al., 2016; Mikic et al., 2017).
У зв'язку гз цим, мета нашого дослгдження - групування та кластеризаця лшш кукурудзи за результатами SNP-геноти-пування для верифжацй окремого кластера лшш зародково! плазми Ланкастер.
MaTepiai i методи дослджень
Матерiалом дослiдження виступали 91 лшш кукурудзи (Zea mays L.), зокрема, 31 лши зародково! плазми Ланкастер i 60 лшш шших зародкових плазм (23 лши плазми Айодент, 15 лшш плазми Рейд, 7 лшш плазми Лакон, 12 лшш плазми Мжс та 3 лши екзотично! плазми). Переважна бшьшктъ лшш входить до Дншровсько! селекц1йно! програми.
SNP-генотипування цих лшш проводили за панеллю BDIIII з 384 SNP-маркергв, розробленою фгрмою BioDiagnostics, Inc. (США) на основ! Illumina VeraCode Bead Plate. SNP-марке-ри панелг BDI-III бiалельнi, розташованi на всгх 10 хромосомах кукурудзи, мають ранг конструктивност! > 0,6 (Venkatramana et al., 2012). SNP-аналiз виконано у повтстю автоматизовано-му режимi на обладнант Illumina BeadStation на баз1 ФГрми BioDiagnostics, Inc. (США).
Оцшювання репрезентативност1 SNP-маркерiв для набору з 91 лши кукурудзи проводили за Lu et al. (2009) за такими показниками: частота пропущених даних, частота мономорф-них та диморфних маркергв, частота мажорних та мшорних алелгв, показник зсуву генного р1зноманитя маркера, показник генного р1зноман1ття лши, гндекс гнформативностт, гомо-зиготнГсть i гетерозиготнiстъ зразкiв.
Частоту пропущених даних за маркером i (%, missing data points) розраховували як процентне вiдношення к1лькостГ зраз-к!в, за якими не вдалося визначити алельний стан маркера i, до загально! к1лькостГ зразк1в, для яких проводили визначення алельного стану маркера i. Частоту мономорфних маркерiв у даному наборi зразкiв (%) розраховували як процентне вщно-шення к1лькостГ бiалельних маркерiв, як! в даному ш6ор! зраз-кгв виявили мономорфний стан, до загально! юлькостг бгалель-них маркерГв, за якими проаналгзовано дану сукуптсть зраз-кГв. Частоту диморфних маркергв у даному наборг зразкгв (%) розраховували як вгдношення кшькосп бгалельних маркергв, якг в даному набор! селекцгйних зразкГв виявили диморфний стан, до загально! кГлькостг бгалельних маркерГв, за якими про-аналгзовано набгр зразкГв. Частоту мажорного алеля за маркером i в даному набор! зразкгв розраховували як вгдношення кГлькостг зразкГв, в яких виявлено мажорний алельний стан за маркером i, до загально! кшькосп зразкГв, проаналгзованих за маркером i. Даний показник визначаеться в частках одинилг i завжди бГльший за 0,5. Частоту мшорного алеля за маркером i в даному набор! зразюв (minor allele frequency, MAF) розраховували як вгдношення кшькосп зразюв, у яких виявлено мшор-ний алельний стан за маркером i, до загально! к1лькостг зразкгв,
проан^зованих за маркером i. Даний показник визначаеться в частках одинищ i завжди менший за 0,5.
Показник зсуву генного рiзноманiття для маркера i у даному наборi зразкв розраховували за формулою: 1 - [(ft)2 + (Pi )2],
+ -
де Pi та Pi - частоти альтернативного стану маркера г для набору зразюв, проаналiзованих за даним маркером. Показник визначали в частках одинищ (в межах 0,0-0,5).
Показник генного рiзноманiття зразка k (gene diversity) ви-значали за формулою:
(nA^nA - 1 + nT^nT - 1 + nr^nr - 1 + Пц^ПЦ - 1 )/2№(N - 1), де nA, nT, nr i Пц - кшькютъ маркерiв, яй в маркерному сайт! мтстять, вщповщно, аденiн, тимш, гуанш та цитозин, N - за-галъна илькить маркерiв, за якими дослщжено зразок k. Показник розраховували в частках одинищ. Його значення мо-жуть коливатися вщ 0 до 0,5 i збшьшуються у разi посилення генного рiзноманiття лши.
1ндекс iнформативностi маркера i (polymorphism information content value, PIC) розраховували за формулою:
1-[(Pi+)2 + P)2] - 1^(p,+)2^-)2,
+ -
де Pi та Pi - частоти альтернативного стану маркера i для зразюв, проаналiзованих за даним маркером. PIC визначаеться в частках одинищ i змшюеться вщ 0 до 0,375.
Гомозиготшсть зразка k (%) розраховували як процентне вщношення юлькосп маркерш, що виявили гомозиготний алельний стан у зразка k, до загально1 кшькосп маркерш, за якими проаналiзовано зразок k. Гетерозиготтсть зразка k (%) розраховували як процентне вщношення илькосп маркерш, що виявили гетерозиготний алельний стан у зразка k, до за-гально1 кшькосп маркеров, за якими проаналiзовано зразок.
Завдання групування дослщжуваного масиву лшш за алель-ним станом SNP-маркерiв та щентифкагщ кластера лшш плазми Ланкастер серед загально1 сукупносп лшш виконували шляхом проведення принципового компонентного аналiзу. Цей анатз (PCA, метод головних компонент) дозволяе провести зменшен-ня кшькосп об'ектв аналiзу за рахунок нових основних змшних величин, досягти скорочення розтрносп опису, здшснити вiзуа-лiзацiю даних та видшити значиму шформапто. Основи принципового компонентного аналiзу розроблено в працях Abdi and Williams (2010).
Для встановлення iерархii лшш у проаналiзованому масивi проведено якюний кластерний аналiз 31 лши кукурудзи плаз-
ми Ланкастер. Ми застосували один з !ерарычних агломера-тивних методiв кластерного аналiзу - метод повного зв'язку (complete-linkage clustering, далею сусiди) (Brereton, 2003; Sivo-lap et al., 2011).
Данi в таблиц! наведено у виглядi X ± m, де X - середне значення показника, m - дов!рчий интервал (P = 0,05).
Результати
Аналiз алельного стану SNP-маркерiв у наборi з 91 лши кукурудзи дозволив визначити тип нуклеотиду в маркерних сайтах у 97,8% лшш. Частка мономорфних маркерiв у достд-жуваному наборi лшш склала 0,7%, диморфних - 99,3%. Частотою мшорного алеля (MAF) > 0,2 характеризувалися 80,6% диморфних маркерiв. Середнiй показник зсуву генного р!зно-манiття маркера i дор^внював 0,2984, а PIC використаних маркер!в у даному набор! лшш у середньому сягав 0,3144 за потенцшно можливого дiапазону значень 0-0,3750. Наведенi показники свiдчать про виконання вимог, як! висуваються до шформативних SNP-маркер^в, i правомочнiсть використання шформаци, отримано! тд час SNP-аналiзу.
Основт характеристики набору з 91 лши кукурудзи, ви-значенi за результатами SNP-генотипування за панеллю BDIIII, таю: середня гомозиготтсть дослщжених лшш - 98,8%, частоти мажорних алелiв SNP-маркерiв коливалися в межах 0,5085-0,9821, а мшорних алел!в - 0,0179-0,4915. Показник генного рiзноманiття лшш перебував у межах 0,1701-0,1901 (за потенцшно можливого розмаху вщ 0 до 0,5, показник збшь-шуеться у разi посилення генного рiзноманiття лши). Значення Р1С використаних маркерiв варiювало в максимально можли-вих межах. Попарнi генетичнi дистанци м!ж дослiдженими лмями перебували в даапазот 0,0316-0,8000.
Результати принципового компонентного аналiзу генетич-них SNP-дистанцiй м!ж ус!ма лшшми проаналiзованого набору наведено на рисунку 1. Двовимрний компонентний аналiз показав, що перший принциповий компонент (РСА1) пояснюе 36,0% загального вартавання та подiпяе дослщжуваний масив з 91 лши на да фракци: А i Б. Уздовж ос! ОХ фракщя А вiзуалiзуеться в штервал! -1,0 —0,2, а фракщя Б - в штервал! -0,2 - +0,8. При цьому ва лши, як! за педгр! вважаються Ланкастер (Sini кружечки на рис. 1), потрапляють у фракщю Б, розташовану на верхньому (правому) кшщ ос! ОХ.
о
-0.2
•
•• •
• • • •
• • « •
jgA • • • •• •• ° о*о
о о о о о (55 so
о ° О
о
-0,2 0,0 рса1~зб,0°/о
Рис. 1. Двовимрна дiаграма принципового компонентного аналiзу (РСА) даних ВЫР-генотипування 91 лши кукурудзи: окрем лши
представлен кружками; бшим кольором вказано лши, як! за пед1гр! належать до плазми Ланкастер (Ъ), а чорним - лши решти зародкових плазм (ЫЪ); масив достджуваних лшш за першим принциповим компонентом РСА1 розпадаеться на дв! фракци (А та Б)
Другий принциповий компонент (РСА2), який пояснюе лшш. Таким чином, принциповий компонентний анал!з попар-12,1% загального вартавання, вщокремлюе бшьшкть лшш них ВЫР-дистанщй пщкреслюе вщокремленсть групи лшш Ланкастер (нижнй кшець ос! ОУ) вщ решти лшш фракци Б, Ланкастер у загальному масив! проанал!зованих лшш. Для з'я-хоча мае мсце деяке перекриття зон розташування Ъ- та ЫЪ- сування генетичних взаемовщносин ми провели кластеризацто
Ке%и1. ЫееЬ. Вюнувг, 8(3) 345
лшш плазми Ланкастер за розмром генетичних ВИР-дистан-цш. За Б1уо1ар е! а1. (2011), «кластер» - група об'ектв, яю ма-ють спшьт властивосп, а характеристики «кластера» - вну-тршня однорщтсть та зовншня !зольованють. Кластерна модель 1ерарх1заци об'ектв передбачае, що об'екти з подбними вла-стивостями належать до одного кластера. Найчастше вона мае вигляд дендрограми. На рисунку 2 показано дендрограму генетичних взаемовщносин лшш кукурудзи плазми Ланкастер за результатами БЫР-аналву, побудовану методом повного зв'язку.
На дендрограм (рис. 2) видляються два кластери, перший з яких об'еднуе 23 лши украшсько1 селекнд плазми Ланкастер та вщому лшга Мо17 (77,4% загально1 юлькоста проанал1зова-них лшш), а другий - 6 лшш укра1нсько1 селекци плазми Ланкастер та вщому лшга ОИ43 (22,6%). Видлення двох кластер1в вказуе на р1зноманптя генетичного матер1алу усередит дано1 плазми. Дв1 з трьох фенотипiчно подабних лшш ДК267, ДК212 та ДК6080, вщбрат з вихщно! популяци за участю лши ОИ43, пд час кластеризацд за БИР-даними увшшли до кластера, сшльного з ОИ43 (ДК267, ДК212), а лшш ДК6080 потрапила до кластера з Мо17. Цей цжавий факт може свщчши про те, що серед предив вимдних генотипв лши ДК6080 окр1м ОИ43 могла бути присутньою також лмя Мо17, [ комплекс саме И алельних вар1ант1в маркер1в перейшов у спадковють до ДК6080. Лши ДК633266 та ДК298, у родовод яких присутт лши ОИ43 та Мо17, входять до одного кластера з лЫею Мо17, тобто саме в1д ще1 лши вони отримали бшьшу частку специ-ф1чних алельних вар1анпв маркер1в, тж в1д лши ОИ43.
Рис. 2. Дендрограма генетичних взаемовщносин лшш кукурудзи плазми Ланкастер за результатами БИР-анал1зу, побудована методом повного зв'язку
У таблиц! наведено оцнки вартовання основних показ-ниюв, що характеризують однонуклеотидний пол1морф1зм лъ нш плазми Ланкастер пор1вняно з аналопчною шформащею для групи неланкастер1вських лшш.
Загалом частоти мажорних алел1в БИР-маркер1в коливали-ся для Ь-лшш в межах 0,5238-0,9688, а для ИЪ-лшш - у шир-ших межах 0,5085-0,9821 (табл.). Середня частота мажорного алеля в грут Ь-лшш достов1рно перевищувала аналопчний показник у ИЪ-лшш [ була ближчою до медани потенцшно можливого штервалу значень частот мажорних алел1в (0,7500), тод як у ИЪ-лшш цей показник зсунутий у бж менших частот. За коефщентом вар1аци ще1 ознаки достов1рних вщмшностей м1ж двома трупами лшш не зафжсовано.
Показник генного р1зноманптя у лшш плазми Ланкастер коливався в межах 0,1701-0,1873, а у ИЪ-лшш - у межах 0,1725-0,1901 (за потенцшно можливого розмаху вщ 0 до 0,5, показник збшьшуеться за посилення генного р1зноматття лши). Тобто цей показник в групах Ь- та ИЪ-лшш коливався в близькому дапазот, вщповщно 0,0172 та 0,0176, але його значення в трупi Ь-лшш достов1рно менш! (в середньому на р!вт 0,1774), пор!вняно з групою ИЪ-лшш (в середньому 0,1808). Т сам закономерности простежено вщносно середнього значення показника зсуву генного р1зноманптя. Коефкценти ва-р1ащ! двох груп для показника генного р1зноманптя були низь-кими та достов1рно не вщр1знялися. Для показника зсуву генного р1зноманптя коефщент вар1ащ! групи Ь-лшш суттево (в 1,72 раза) перевищував аналопчний показник групи ИЬ-лшш
Таблиця
Вартовання основних показниюв
однонуклеотидного пол1морф1зму ДНК у лшш кукурудзи
Характеристика Група лшш
L NL
Юльюсть дослщжених л1н1й, шт. 32 59
Частота мажорного алеля, частка одиниц! Limpotentia] Lim 0,5000-1,000 0,5238-0,9688 0,5085-0,9821
X ± m 0,7678 ± 0,0159 0,6977 ± 0,0143
V, % 17,0 ± 4,3 16,8 ± 3,1
Показник генного р1зноманптя л1н1й, частка одиниц! Limpotentia] Lim X ± m 0-0,5000 0,1701-0,1873 0,1725-0,1901 0,1774 ± 0,0015 0,1808 ± 0,0009
V, % 2,4 ± 0,6 2,1 ± 0,4
Показник зсуву Limpotentia] 0-0,5000
генного р1зно- Lim 0-0,5000 0-0,5000
ман1ття, частка X ± m 0,3045 ± 0,0180 0,3866 ± 0,0133
одиниц1 V, % 51,0 ± 12,8 29,6 ± 5,5
Limpotentia] 0-0,3750
Р1С, Lim 0-0,3750 0-0,3750
частка одиниц1 X ± m 0,2462 ± 0,0132 0,3053 ± 0,0091
V, % 46,4 ± 11,6 25,6 ± 4,7
Попарн1 генетичн1 дистанцЦ', частка одиниц1 Limpotentia] Lim X ± m V, % 0-1,0000 0,0035-0,5333 0,0316-0,8000 0,3377 ± 0,0099 0,4229 ± 0,0061 33,5 ± 8,4 30,5 ± 5,6
Значення Р1С використаних MapKepiB в обох групах лшш вартовало в максимально можливих межах. Вищ1 значення Р1С виявлено у бшьш пол1морфн1й rpyni NL-лшш. Коеф1ц1ент варь ацд ознаки у грут L-лшш також суттево (в 1,81 раза), переви-щив цей показник для NL-лiнiй.
У грут лшш неланкастер1вських плазм дапазон генетичних дистанцш був б1льшим (0,7684), нiж у L-лiнiй (0,5298), л1мпи шиpшi (0,0316-0,8000 проти 0,0035-0,5333), а середне значення достовipно вищим (0,4229 ± 0,0061 проти 0,3377 ± 0,0099). Максимальна генетична дистанщя у гpупi NL-лiнiй зафiксована мiж лiнiями В73 та ДКД2725СВзМ, а у грут L-лшш - мiж Oh43 та ДК8143. Коефiцiенти вар1ацд дано! ознаки у двох груп достов1рно не розр1знялися. Генетична дистанщя м1ж двома групами, L-лiнiй та NL-лшш, склала 0,4742.
Поpiвняння вартовання за основними показниками однонуклеотидного пол1морфвму ДНК лiнiй кукурудзи очжувано св1дчить про бiльше генетичне р1зноманптя групи лш1й, де зiбpанi представники дек1лькох неланкастеpiвських плазм, але виявляе також певний piвень piзноманiття групи лшш Ланкастер.
Оскльки сучаснi лши украшсько! селекцiï ствоpенi на баз1 популяцiй р1зно! складност! 1з залученням у тому чист компо-ненпв, як1 не належать до груп Мо17 та Oh43, оцiнювання 1х под1бност1 м1ж собою за SNP-маркерами дозволить обрати доц1льну стратеггю для вибору альтернативних генотип1в 1з метою 1х використання у синтез1 високогетерозисних г1брид1в.
Таким чином, опгнювання подабносп геном1в за визначе-ними, константними сайтами чи локусами може слугувати !н-формативним джерелом для класифжаци та систематизац^! генофонду зразкв культурних рослин.
Обговорення
У пращ Semagn et al. (2012) з 450 шбредних лшш, дослщ-жених за 1065 SNP-маркерами, i прац! Wen et al. (2012), як досл1джували 350 генотипов кукурудзи раси Tuxpeno, а також значну юлькить лшш i3 р1зноматтних селекцшних програм США за 1536 SNP-маркерами, частота пропущених даних склала 10%. Xu et al. (2017) за специально п1д1браною панеллю з 55 000 SNP-маркерiв проанал1зували 593 лшл кукурудзи по-мирного та тротчного поясiв i повщомляють про частоту пропущених даних на р!вт 0,3-5,2% (у середньому 1,83%). Romay et al. (2013) показали, що кшькють пропущених даних можна зменшити щд час повторного сиквенування, а також висловлюють припущення про залежшсть кiлькостi пропущених даних в1д генотипу лши, що сиквенуеться. Так, генотипи, близьк до референсного геному, яким е геном лiнiï B73, дають найменшу юльюсть пропущених даних (до 20%), шшт - до 30%, а лшш SA24 писля 25-разового генотипування мала лише 16% пропущених даних. У нашому дослщжент частотою пропущених даних >20% характеризувалися лише ш1сть маркерiв. Вони виключет з анал1зу та подальших розрахункв, але ш-формац1ю про ïх алельний стан використано для лшш, де тип нуклеотиду було встановлено.
Середня гетерозиготтсть проанал1зованих зразк1в склала 1,2%, у середньому 0,0-0,4 гетерозиготних SNP-сайгiв на одну лшю, що св1дчить про високу (на рiвнi 98,8%) гомозиготтсть дослвджених лiнiй. У нашому дослщженш гетерозиготнi SNP-локуси виключали з аналiзiв i розрахункв. Wen et al. (2012) показали, що гетерозиготн^ть за SNP-маркерами коливаеться вiд 1% у лшш CIMMYT до 36% у мсцевих американських популяци.
У пращ Semagn et al. (2012) за даними SNP-генотипування спорiдненiсть на ршт 5-50% мали 79% лшш, а 94% попарних генетичних дистанщй вкладалися в д1апазон 0,3-0,4, оскшьки мали вузьку генетичну базу з CIMMYT-програм для Схiдноï та Швденим Африки. Бшьштсть лшш автори вважають унжаль-ними для цiеï селекцшнм програми. Xu et al. (2017) показав, що у кукурудзи потрного та троп1чного поясов спорiдненiсть 59% достджених лтнш перебувала на ршт 0-0,5%, а 25% лшш - на ршт 5-20%, тобто даний наб1р складений з1 значно вщдалених миж собою в генетичному вщношенщ рiзномаmт-них i нав1ть унжальних зразкв. У нашому набор1 дослщжених лтнш, переважна бiльшiсть яких входить до Дншровсьюм селекцiйноï програми, визначена за результатами SNP-геноти-пування спорщнетсть лтнш у дiапазонi 0-5% не зареестрова-на, а найбiльша кшькють пар лшш (65,2%) мае значення спорщненосп в штервал1 40-60%.
Показник генного р1зноманитя лiнiй Днiпровськоï селек-цiйноï програми перебував у даапазот 0,1701-0,1901. Це значно менше, нж для популяци CIMMYT (0,2669) i лшш 1з програми US-GEM для розширення зародковоï плазми США (0,3891), яю вмщують значт колекцiï, у тому числ1 троочних, азшських, пiвденноамериканських генотипiв (Wen et al., 2012). Низью значення показника генного р1зноманптя л1нш та його вузький д1апазон ми пов'язуемо з1 специф1чним набором л1нш, що анал1зували (лтнш Дншровськоï селекцини програми), генезис яких проходив у специфчних i суворих в1дносно по-сухи та спеки умовах cтеповоï зони Украши.
Таким чином, загальнi характеристики генотипування, проведеного нами за панеллю з 384 SNP-маркерiв для 91 лши кукурудзи, бшьштсть яких створена за Дншровською селекцш-ною програмою, вщповщають установленим вимогам i перебу-вають на рiвнi, отриманому шшими авторами тд час генотипування шляхом часткового сиквенування геномгв лтнш кукурудзи р1зного походження за SNP-панелями.
Wu et al. (2016), вивчивши 544 лiнiï за 362008 SNP-мар-керами за допомогою принципового компонентного анал1зу, встановили, що перш1 дв1 принципов1 компоненти пояснюють 32,8% (19,1% та 13,7%) загального вартовання для всього ма-
сиву л1нш кукурудзи, 31,0% (17,6% та 13,4%) - для групи ни-зинних трогйчних лтнш, 30,1% (18,1% та 12,0%) для субтрогйч-ноï групи лшш середным висоти та 30,8% (18,2% та 12,6%) -для тропч^^ прсьюм групи лтнш. У нашому дослщжент перша та друга принципов! компоненти пояснюють разом 48,1% загального вартовання, що на 15,3% вище, тж у пращ (Wu et al., 2016). Semang et al. (2012) визначили 237 алелiв за 236 SNP-маркерами, яю найкраще вщдшяли три групи л1нш м1ж собою. Перша та друга принципов1 компоненти пад час анал1зу за цими алелями пояснювали 99,8% (93,6% та 6,2%) загального вартовання масиву з 450 л1нш кукурудзи. Пд час досл1дження розподшу 770 пошрних i троп1чних / субтроп1чних л1нш за 1034 SNP-маркерами встановлено, що перша та друга принципов1 компоненти пояснюють лише 6,1% та 2,8% загального вартовання (Lu, 2009). Метод принципового компонентного анал1зу дозволив ефективно роздшити 346 дослщжених л1нш на чотири п1дгрупи: дв1 гетерозиснi групи (Iowa Stiff Stalk Synthetic та Non-Stiff Stalk), група троп^чти / субтропiчноï кукурудзи та змшана група (Li, 2017).
Mikic et al. (2017), проаналiзувавши 96 лтнш кукурудзи пошрного поясу Ивденно-Схадш^ Свропи за 5 SSR-маркера-ми, видшили 6 кластерiв, серед яких кластери, що мстили лши BSSS, Ланкастер i Айодент. Автори довели значне рiзномаmт-тя лшш плазми Ланкастер i перспективтсть ïï використання в селекцiйному процесi, а також для асоццативного картування цшьових ознак. Smith et al. (2015) на основ! генотипування 380 лшш Техасьюм селекцшнм програми за 766 SNP-маркерами здшснили ïх подл на групи, яю вiдповiдали групам за педа^ BSSS, NSS, Айодент та троп!чн!й грут. Разом в цим, Semagn et al. (2012) не щатверджують зв'язок м!ж результатами генотипування за 1065 SNP-маркерами 450 лшш кукурудзи та подл на гетерозисы групи за комбшацшною здатнiстю, оцшеною як у дiалельних, так i в тестерних схрещуваннях. Автори пояснюють це впливом генотипу батьювських компонентiв, а також тестера на фенотиmчний прояв комбiнацiйноï здатностi i ïï не збгашсть з результатами геномного анашзу. Пгд час аналiзу генетичноï структури 367 лшш кукурудзи, поширених у Китаï (Wu, 2014), за 56110 SNP-маркерами видшено да велика групи: до першоï з них увшшли лiнiï мiсцевоï зародковоï плазми, до другоï - штродуковажа плазми, а також п'ять щдгруп, що вадповадали р!зним гетерозисним групам (Reid Yellow Dent, Lancaster Sure Crop, P-группа, Tang Sipingtou та Tem-tropical група, всерединi яких також спостершали генетичну гетероген-н!сть, причому найменша гетерогеннiсть вiдзначена всередит Р-групи, а найбiльша - всередит Tem-tropical групи). Генетич-на р!знор!дн!сть вiдмiчена також серед 59 лтнш INERA, про-аналiзованих за 1057 SNP-маркерами (Dao, 2014), i серед 156 л!нш Пiвнiчно-Каролiнського Державного унтверситету (Nelson, 2015), i у 284 лтнш селекцiï Уйверситету Мшнесоти (Schae-fer, 2013).
Висновки
Загальт характеристики генотипування, проведеного за панеллю з 384 маркеров однонуклеотидного пол!морФ!зму ДНК для 91 лшй кукурудзи Днiпровськоï селекцiйноï програми, вщповь дають установленим вимогам i перебувають на р1вщ отримано-му шшими авторами у пропо SNP-аналiзу лГнш кукурудзи р!зного походження. Результати принципового компонентного шшТзу пГатверджують наявнiсть серед проаналiзованого масиву окремоï групи л1нш, як за педiгрi належать до зародковоï плазми Ланкастер. Результати яюсного кластерного аналiзу методом повного зв'язку свiдчать про вартовання всередит плазми Ланкастер, де видшено лши, близью як до Мо17, так i до Oh43.
References
Abdi, H., & Williams, L. J. (2010). Principal component analysis. Wiley
Interdisciplinary Reviews, Computational Statistics.
Bennetzen, J. L., & Hake, E. S. A. (2009). Handbook of maize. Genetic and genomics. New York. Springer Science.
Brereton, R. G. (2003). Chemometrics: Data analysis for the laboratory and chemical plant. Wiley, Chichester.
Dao, A., Sanou, J., Mitchell, S. E., Gracen, V., & Danquah, E. Y. (2014). Genetic diversity among INERA maize inbred lines with single nucleotide polymorphism (SNP) markers and their relationship with CIMMYT, MA, and temperate lines. BMC Genetics, 15, 127-140.
Derkach, K. V., Abraimova, O. E., & Satarova, T. M. (2016). Reguljacija morfo-genezu in vitro u linij kukurudzi grupi Lankaster [Regulation of in vitro morphogenesis in maize inbreds of the Lancaster group]. Visnyk of Dnipro-petrovsk Universitet. Biology, Ecology, 24(2), 253-257 (in Ukrainian).
Dzjubec'kij, B. V., Bodenko, N. A., Fed'ko, M. M., & Gusak, J. V. (2012). Stvorennja seredn'opiznih gibridiv kukurudzi na bazi plazmi Lankaster (Ci03) [Creation of medium-late hybrids of corn based on Lancaster germplasm (C103)]. Bjuleten' Institutu Sil's'kogo Gospodarstva Stepovoji Zony NAAN Ukrayiny, 3, 8-11 (in Ukrainian).
Elshire, R. J., Acharya, C. B., Mitchell, S. E., Flint-Garcia, S. A., McMullen, M. D., Holland, J. B., Buckler, E. S., & Gardner, C. A. (2013). Comprehensive genotyping of the USA national maize inbreds seed bank. Genome Biology, 14(6), R55.
Li, X., Jian, Y., Xie, C., Wu, J., Xu, Y., & Zou, C. (2017). Fast diffusion of domesticated maize to temperate zones. Scientific Reports, 7, 2077-2089.
Lu, Y., Yan, J., Guimaraes, C. T., Taba, S., Hao, Z., Gao, S., Chen, S., Li, J., Zhang, S., Vivek, B. S., Magorokosho, C., Mugo, S., Makumbi, D., Parento-ni, S. N., Shah, T., Rong, T., Crouch, J. H., & Xu, Y. (2009). Molecular characterization of global maize breeding germplasm based in genome-wide single nucleotide polymorphisms. Theoretical and Applied Genetics, 120(1), 93-115.
Mikic, S., Kondic-spika, A., Brbaklic, L., Stanisavljevic, D., Ceran, M., Trkulja, D., & Mitrovic, B. (2017). Molecular and phenotypic characterisation of diverse temperate maize inbred lines in Southeast Europe. Zemdirbyste-Agriculture, 104(1), 31-40.
Nelson, P. T., Krakowsky, M. D., Coles, N. D., Holland, J. B., Bubeck, D. M., Smith, J. S. C., & Goodman, M. M. (2016). Genetic characterization of the North Carolina State University Maize Lines. Crop Science, 56, 259-275.
Romay, M. C., Millard, M. J., Glaubitz, J. C., Peiffer, J. A., Swarts, K. L., Casste-vens, T. M., Elshire, R. J., Acharya, C. B., Mitchell, S. E., Flint-Garcia, S. A.,
McMullen, M. D., Holland, J. B., Buckler, E. S., & Gardner, C. A. (2013). Comprehensive genotyping of the USA national maize inbreds seed bank. Genome Biology, 14(6), R55.
Schaefer, C. M., & Bernardo, R. (2013). Population structure and single nucleotide polymorphism diversity of historical Minnesota maize inbreds. Crop Science, 53(4), 1529-1536.
Semagn, K., Magorokosho, C., Vivek, B. S., Makumbi, D., Beyene, Y., Mugo, S., Prasanna, B. M., & Warburton, M. L. (2012). Molecular characterization of diverse CIMMYT maize inbred lines from eastern and southern Africa using single nucleotide polymorphic markers. BMC Genomics, 13, 113-124.
Sivolap, J. M., Kozhuhova, N. J., & Kalendar', R. N. (2011). Variabel'nost' i spe-cifichnost' genomov sel'skohozjajstvennyh rastenij [Variability and specificity of genomes of agricultural plants]. Astroprint, Odessa (in Russian).
Smith, S. D., Murray, S. C., & Heffner, E. (2015). Molecular analysis of genetic diversity in a Texas maize (Zea mays L.) breeding program. Maydica, 60, 1-8.
Venkatramana, P., Carlson, C., Blackstad, M., Bialozynski, R., Schultz, Q., & Kaufman, B. (2010). Development and characterization of single nucleotide polymorphism (SNP) panel for marker assisted backcrossing in corn. Seed Technology, 32(2), 153-154.
Wen, W., Franco J., Chavez-Tovar, V. H., Yan, J., & Taba, S. (2012). Genetic characterization of a core set of a tropical maize race Tuxpeno for further use in maize improvement. PLoS One, 7(3), e32626.
Wu, X., Li, Y., Shi, Y., Song, Y., Wang, T., Huang, Y., & Li, Y. (2014). Fine genetic characterization of elite maize germplasm using high-throughput SNP genotyping. Theoretical and Applied Genetics, 127, 621-631.
Wu, Y., San Vicente, F., Huang, K., Dhliwayo, T., Costich, D. E., Semagn, K., & Babu, R. (2016). Molecular characterization of CIMMYT maize inbred lines with genotyping-by-sequencing SNPs. Theoretical and Applied Genetics, 129, 753-765.
Xu, C., Ren, Y., Jian, Y., Guo, Z., Zhang, Y., Xie, C., Fu, J., Wang, H., Wang, G., Xu, Y., Li, P., & Zou, C. (2017). Development of a maize 55 K SNP array with improved genome coverage for molecular breeding. Molecular Breeding, 37(3), 20-34.
Zhang, X., Zhang, H., Li, L., Lan, H., Ren, Z., Liu, D., Wu, L., Liu, H., Jaqueth, J., Li, B., Pan, G., & Gao, S. (2016). Characterizing the population structure and genetic diversity of maize breeding germplasm in Southwest China using genome-wide SNP markers. BMC Genomics, 17(1), 697-704.