ГЕНОФОНД ТУРКМЕН КАРАКАЛПАКСТАНА В КОНТЕКСТЕ ПОПУЛЯЦИЙ ЦЕНТРАЛЬНОЙ АЗИИ (ПОЛИМОРФИЗМ Y-ХРОМОСОМЫ)
Р.А. Схаляхо1'2, М.К. Жабагин3, Ю.М. Юсупов4, А.Т. Агджоян2,1, Ж.М. Сабитов5, В.М. Гурьянов2, О.А. Балаганская2, Д.А. Далимова6, Д.Х. Давлетчурин6, Ш.У. Турдикулова7, М.И. Чухряева1,2, Р.Р. Асылгужин4, А.Р. Акильжанова3, О.П. Балановский2,1, Е.В. Балановская1
1ФГБНУ «Медико-генетический научный центр», Москва, Россия
2ФГБУН Институт общей генетики им. НИ. Вавилова РАН, Москва, Россия
3National Laboratory Astana, Назарбаев Университет, Астана, Казахстан
4ГАНУ «Институт стратегических исследований Республики Башкортостан», Уфа, Россия
5 Евразийский национальный университет ЛН. Гумилева, Астана, Казахстан
6 Институт биоорганической химии, Ташкент, Узбекистан
7 Центр высоких технологий, Ташкент, Узбекистан
Туркмены - один из наименее изученных народов Центральной Азии из-за недостаточной международной научной интеграции Туркменистана в исследования генофонда народов мира. Сохранение у туркмен памяти о родоплеменной принадлежности позволяет осуществлять параллельное исследование родоплеменной структуры и Y-хромосомы, наследуемой по отцовской линии.
Изучен генофонд самой северной туркменской популяции - туркмен Каракалпакстана (Узбекистан) по высокоинформативной для изучения генетической истории популяций системе Y-хромо-сомы (панель 41 SNP и 17 STR маркеров). Выборка туркмен из Ходжейлинского и Шуманайского районов Каракалпакстана (N=83) представлена в основном (88%) одной из крупнейших туркменских родоплеменных групп - йомуд - и лишь единичными представителями других родов (гочак, олиз, укер, яглы). Из 12 выявленных гаплогрупп Y-хромосомы мажорная гаплогруппа Q вобрала три четверти всего генофонда. Оставшуюся четверть генофонда составили гаплогруппы H, R1b, R1a, G2a с частотой 4-7%, а также варианты гаплогрупп C2, J1, J2, N1*, N1c, встреченные в единичных случаях. Ярко выраженное сходство генофондов туркмен Центральной Азии (Каракал-пакстана, Ирана и Афганистана) позволило выдвинуть гипотезу, что гаплогруппа Q характерна для генофонда туркмен в целом. Генетические расстояния между генофондами туркмен и других народов Центральной Азии не выявили ощутимых влияний на генофонд туркмен Каракалпакстана его географических соседей - узбеков, дунган, каракалпаков. Анализ быстро мутирующих STR маркеров гаплогруппы Q Y-хромосомы также подтвердил этот вывод. Время возникновения кластера STR гаплотипов туркмен Каракалпакстана на филогенетической сети гаплогруппы Q для генофондов народов Узбекистана оценивается в 900±300 (методом ASD 1090±430) лет назад.
Ключевые слова: этногенез, генофонд, геногеография, Y-хромосома, гаплогруппа, туркмены, род, йомуд, Центральная Азия
Введение
Изучение генетического разнообразия народов Евразии и истории его формирования представляет собой бурно развивающуюся область популяци-онной генетики. Современные геногеографические исследования проводятся по широкой палитре генетических маркеров: митохондриальной ДНК, У-хромосоме, широкогеномным панелям, полным экзомам и геномам. Однако, несмотря на появление полногеномных аутосомных данных, маркеры У-хромосомы сохраняют высокую актуальность и востребованность, благодаря их максимальной межпопуляционной изменчивости и, как следствие, очень высокой информативности для изучения генетической истории популяций. На сегодняшний день почти все народы мира исследованы по маркерам У-хромосомы. Тем не менее, один из народов Центральной Азии - туркмены - остаются до сих пор слабо изученными из-за недостаточной международной научной интеграции Туркменистана в исследованиях генофонда его населения.
В этногенезе туркмен, говорящих на огузской ветви тюркских языков, наиболее ранний пласт составили древние ираноязычные кочевые и полукочевые племена (дахи, массагеты, позднее эфталиты и сармато-аланы), жившие на территории современного Туркменистана, а также оседлое ираноязычное земледельческое население Западного Хорезма, средней Амударьи и Северного Хорасана. Это население, особенно полукочевое, уже с !У-У! вв. стало подвергаться тюрки-зации. Массовая миграция огузов, проникших в пределы современного Туркменистана в 1Х-Х1 вв., сыграла важную роль в их этногенезе [Народы мира, 1988]. Как и многие другие среднеазиатские народы, туркмены до сих пор сохраняют память о родоплеменной принадлежности. К самым крупным родовым объединениям относятся теке, йомуды, эрсари, салоры, гоклены, языры, човдур [Народы и религии мира, 1999]. Как показано для ряда народов Евразии, параллельное изучение родоплеменной структуры и У-хромосомы, также передающейся по отцовской линии, служит мощным инструментом популяционной генетики для реконструкции структуры генофонда, выявления миграций и экспансий [Юсупов с соавт., 2013; Жабагин с соавт., 2014; Богунов с соавт., 2015; Юсупов с соавт., 2015; Ма!уагсИик е! а1., 2013; Ва!апоуэку е! а!., 2015]. Поэтому при изучении и генофонда туркмен важно учитывать их родовую структуру.
Нами исследован генофонд самой северной туркменской популяции - туркмен автономии Каракалпакстана (Узбекистан), которая граничит с Туркменистаном. В Узбекистане туркмены (чис-
ленностью около 150 тыс. чел.) расселены двумя этническими массивами: на севере (в Каракалпак-стане и Хорезмской области) и на юге (в Бухарской, Кашкардарьинской, Самаркандской, Сурхан-дарьинской и Ташкентской областях). Целью данного исследования стало изучение генофонда популяции северного массива - туркмен Кара-калпакстана (численностью около 60 тыс. чел.), представляющих один из крупнейших туркменских родов (йомуд).
Материалы и методы
Выборка туркмен (N=83 образца) собрана в ходе экспедиционного обследования популяций Узбекистана в 2012 г. в сотрудничестве с научными коллективами Узбекистана под руководством профессора Е.В. Балановской. Родоплеменная группа йомуд (включая единичных представителей родов джунаид, орсыкчи, салах, которые по данным этнографии являются подразделениями рода йомуд) составляет 88% выборки. Остальные 12% выборки представлены 4 представителями рода гочак (предположительно принадлежащего к племени сарык, входящими в ту же салорскую этнографическую группу, что и йомуды [Джикиев, 1991]), единичными представителями небольших родовых подразделений олиз, укер, яглы и тремя индивидами, не указавшими родовую принадлежность. Хотя изученные индивиды обследованы в Ходжей-лийском и Шуманайском районах автономной республики Узбекистана - Каракалпакстане (населенные пункты Озодлик, Тельман, Хужайли, Шуман, Шуманхайский), но предки (деды по отцовской линии) части изученных туркмен нашей выборки родились в Туркменистане (в селениях Кунгерен, Ташауз, Тахта). Это указывает, что не только ареал, но и генеалогические связи объединяют туркмен Каракалпакстана и Туркменистана.
Для каждого обследованного составлена родословная как минимум на три поколения. Все предки обследованных как минимум до третьего поколения относили себя к туркменам и родились в Каракалпакстане или Туркменистане. В выборку включены лишь неродственные между собой индивиды, поскольку наличие родственных индивидов не только уменьшает объем генетически эффективной выборки, но и смещает частоты, создавая иллюзию исторически интенсивных миграций, если в выборку попала группа родственников -потомков единичного мигранта. Сбор биологического материала (венозная кровь) осуществлялся согласно письменному информированному согла-
сию обследуемого под контролем Этической комиссии Медико-генетического научного центра (ФГБНУ «МГНЦ»).
ДНК изученных туркмен получена из образцов венозной крови фенол-хлороформной экстракцией с использованием протеиназы К. Генотипирование SNP маркеров Y-хромосомы проведено методом ПЦР в реальном времени с применением TaqMan зондов по 41 SNP маркерам: C(M130), C2(M217), C2b1 b(M48), D(M174), E(M96), E1b1b1(M35), E1b1b1a1(M78), F(M89), G(M201), G2a(P15), G2a1 a(P16), G2a1a1(P18), G2a2b1 (M406), G2a2b2a(P303), H1(M69), I(M170), I1(M253), I2a2a(M223), I2a1(P37.2), J(M304), J1(M267), J2(M172), J2a1a(M47), J2a1b(M67), J2a1b1(M92), J2b(M12), K(M9), L(M20), N1(LLY22g), N1c1a(M178), O2(M122), Q(M242), Q1a1a1(M120), Q1b1(M378), R(M207), R1a1a(M198), R1a1a1b1a1(M458), R1b1a2(M73), R1b1a1a2(M269), R2a(M124), T1a(M70). Наименования гаплогрупп (указаны перед скобками), маркируемых соответствующими SNP маркерами (указаны в скобках) даны согласно классификации ISOGG 2016 года [Y DNA Haplogroup Tree, 2016].
Фрагментный анализ 17 локусов STR маркеров проведен с использованием набора Y-filer PCR Amplification Kit (Applied Biosystems).
По данным о STR гаплотипах каждого индивида с помощью оригинальной программы «YPre-dictor_v1.0.5» [http://predictor.ydna.ru; www.genofond.ru] осуществляли прогноз гаплогруппы, результаты которого сопоставлялись с прямыми данными генотипирования SNP маркеров. Такая технология обеспечивает двойную проверку надежности генотипирования.
По частотам гаплогрупп в популяциях рассчитаны генетические расстояния Нея [Nei, 1975]. Расчет проведен в программе «DJgenetic», созданной Ю.А. Серегиным и Е.В. Балановской [Bala-novsky et al., 2008]. Дендрограммы строили в программе «Statistica 6.0» (StatSoft Russia, 2016) с применением метода Уорда (Ward's method).
Филогенетическая сеть STR-гаплотипов носителей гаплогруппы Q построена в программах Network и Network Publisher (Fluxus Technology Ltd.) на основе алгоритма reduced median. Для оценки возраста кластера STR-гаплотипов использованы датировки, полученные двумя методами [Балановский, 2015; Адамов (в печати)]: одна методом ASD (average squared difference, не использующим филогенетическую сеть), вторая -по числу мутационных шагов между гаплотипами кластера сети с использованием «генеалогической» скорости мутирования, полученной при прямом сравнении пар «отец-сын» [Ge et al., 2009].
Рис. 1. «Генетический портрет» туркмен
Каракалпакстана: спектр и частоты гаплогрупп Y-хромосомы
На примере кавказских популяций показано наиболее четкое соответствие датировкам истории и лингвистики тех датировок, которые получены на основе «генеалогической» скорости мутирования [Balanovsky et al., 2011]. Недавние итоги исследований по данным о полном секвенировании Y-хромосомы [Karmin et al., 2015; Balanovsky et al., 2015], подтвердили, что наиболее корректные датировки (по крайней мере, для событий последних 20-30 тыс. лет) получаются при использовании скоростей мутирования, близких к «генеалогическим».
Картографический анализ проведен с помощью программы «GeneGeo» [Кошель, 2012], разработанной под руководством О.П. Балановского.
Сравнение генофонда туркмен с другими популяциями Центральной Азии проведено на основе материалов базы данных «Y-base», разработанной под руководством О.П. Балановского [БД Y-base].
Результаты и обсуждение
«Генетический портрет» туркмен Каракалпакстана
Впервые для туркмен Каракалпакстана создан их «генетический портрет» - определены спектр и частоты гаплогрупп Y-хромосомы (рис. 1). Хотя обнаружено 12 гаплогрупп Y-хромосомы, но резко преобладает «мажорная» гаплогруппа Q с частотой 73%. Оставшуюся четверть генофонда составили гаплогруппы H (7%), варианты гаплогрупп R1b (6%), R1a1a (4%) и G2a (4%), а также варианты гаплогрупп C2, J1, J2, N1*, N1c, встреченные в единичных случаях.
Гаплогруппа Q, столь характерная для туркмен Каракалпакстана, на Евразийском континенте
Рис. 2. Геногеография гаплогруппы Q-M242 У-хромосомы в населении Евразии
наиболее часто встречается в Средней и Южной Сибири (рис. 2). Максимальной частоты гапло-группа Q-M242 достигает в генофондах кетов (94%) и селькупов (66%), у северных алтайцев (челканцев и тубаларов) составляет от половины до четверти генофонда и чуть меньше половины (38%) у сибирских татар иштякско-тогузской группы [Балаганская с соавт., 2011; Агджоян с соавт., 2015; Агджоян с соавт., 2016; БД Y-base]. Гапло-группа Q (рис.2) очень редко встречается в Европе и обнаружена лишь в нескольких популяциях с частотами менее 3% в Центральной и Восточной Европе, на Крымском полуострове [У-base]. С невысокими частотами (около 5%) эта гаплогруппа выявляется на территории Индии, в Передней и Средней Азии [Seielstad et al., 2003; БД Y-base]. Плавным коридором от северо-западного побережья Каспийского моря далее на восток с постепенным ростом частоты ареал гаплогруппы Q переходит в Центральную Азию и Сибирь, где она достигает своего евразийского максимума [Karafet et al., 2002; БД Y-base]. Эта гаплогруппа также маркирует
палеолитическое заселение Американского континента из Сибири.
С невысокими частотами гаплогруппа Q встречается почти по всей Азии (рис. 2). У географических соседей изученной популяции туркмен -узбеков Ферганы - гаплогруппа Q редка (4%), у узбеков Хорезма - несколько выше (11%), а у узбеков Ташкента повышается до 17%. В генофонде двух других изученных групп туркмен гаплогруппа Q обнаружена с высокими частотами (рис. 2): 43% -у туркмен Ирана (Golestan, рис. 2) [Grugni et al., 2012; БД Y-base], 34% - у туркмен Афганистана (Jowzjan, рис. 2) [Di Cristifaro et al., 2013]. Однако у туркмен Ставрополья гаплогруппа Q очень редка (2%) [БД Y-base].
Высокий уровень гаплогруппы Q (73%) у туркмен Каракалпакстана объясняется, возможно, тем, что они относятся в основном к одной родо-племенной группе. Это позволяет выдвинуть гипотезу, что генофонд одного из пяти крупнейших родов туркмен (отраженных на гербе и флаге Туркменистана) - рода йомуд - маркируется
Рис. 3. Географическое положение популяций туркмен Примечания. Туркмены Каракалпакастана (Ходжейлийский и Шуманайский районы, серые звездочки); туркмены из литературных источников (туркмены Ирана (провинция Голестан) и туркмены Афганистана (провинция Джаузджан), черные звездочки). Показаны провинции (велаяты) Туркменистна с преобладанием туркменского рода йомуд.
гаплогруппой Q. Для различных народов показано, что накопление одной гаплогруппы типично для многих родоплеменных групп [Юсупов с соавт., 2013; Жабагин с соавт., 2014; Богунов с соавт., 2015; Юсупов с соавт., 2015; Ма!уагсИик е! а1., 2013; Ва!апоуэку е! а!., 2015]. Это подтверждается и высокой частотой гаплогруппы Q (43%) у туркмен Ирана: провинция Голестан (Со!еБ1ап, рис. 3) Ирана входит в ареал племени йомуд, охватывающий Балканский (граничащий с Ираном) и Дашогузский (граничащий с Каракалпакстаном) велаяты (провинции) Туркменистана (рис. 3).
Но тот факт, что эта гаплогруппа с высокой частотой (34%) встречена и к востоку от Туркменистана у туркмен Афганистана провинции Джаузджан рис. 3) указывает, что гаплогруппа Q может быть мажорной и для других родов туркмен. Например, из четырех других родов, встреченных у туркмен Каракалпакстана, только представитель рода яглы относится к другой гапло-группе (G2a3b), а все представители родов сарык (4 чел.), укер (1 чел.), олиз (1 чел.), а также 3 че-
ловека, у которых род не указан, все являются носителями гаплогруппы Q. Крайняя редкость этой гаплогруппы у ставропольских туркмен (2%), может указывать, что она не характерна для родов чоудор (также один из пяти крупнейших родов туркмен), игдыр и союнаджи, представленных в Ставрополье.
Положение генофонда туркмен Каракалпакстана в генетическом пространстве народов Центральной Азии
Методы многомерной статистики позволяют рассмотреть положение генофонда туркмен Каракалпакстана в контексте тех окружающих народов Центральной Азии, которые изучены по сходной панели маркеров У-хромосомы: туркмен Афганистана, Ирана и Ставрополья, узбеков Афганистана, Хорезма, Ташкента и Ферганы, каракалпаков и киргизов.
Таблица 1. Матрица генетических расстояний между туркменами и другими популяциями Центральной Азии
Туркмены Каракалпакстатан Туркмены Ирана Туркмены Афганистана Туркмены Ставрополья Каракалпаки Киргизы Узбеки Афганистана Узбеки Хорезма Узбеки Ташкента Узбеки Ферганы
Туркмены Каракалпакстана 0 0.09 0.16 2.22 1.48 2.61 1.20 0.96 0.76 1.69
Туркмены Ирана 0.09 0 0.03 0.95 1.02 1.31 0.51 0.41 0.33 0.79
Туркмены Афганистана 0.16 0.03 0 0.72 0.76 0.93 0.40 0.31 0.26 0.60
Туркмены Ставрополья 2.22 0.95 0.72 0 0.42 0.18 0.15 0.21 0.25 0.34
Каракалпаки 1.48 1.02 0.76 0.42 0 0.13 0.42 0.25 0.30 0.16
Киргизы 2.61 1.31 0.93 0.18 0.13 0 0.34 0.28 0.32 0.22
Узбеки Афганистана 1.20 0.51 0.40 0.15 0.42 0.34 0 0.06 0.10 0.20
Узбеки Хорезма 0.96 0.41 0.31 0.21 0.25 0.28 0.06 0 0.03 0.08
Узбеки Ташкента 0.76 0.33 0.26 0.25 0.30 0.32 0.10 0.03 0 0.12
Узбеки Ферганы 1.69 0.79 0.60 0.34 0.16 0.22 0.20 0.08 0.12 0
Матрица генетических расстояний (табл. 1) фиксирует максимальную генетическую близость туркмен Каракалпакстана к туркменам Ирана ^=0,09) и Афганистана ^=0,16). Но туркмены Ставрополья генетически очень далеки от всех трех групп туркмен Центральной Азии: наиболее отличен их генофонд от туркмен Каракалпакстана ^=2,22), но также далек от туркмен и Ирана ^=0,95), и Афганистана ^=0,72)
Это может объясняться как особым родопле-менным составом туркмен Ставрополья, так и потоками генов в них от окружающих народов: туркмены переселились в Ставрополье более 300 лет назад (в конце XVII в. - начале XVIII в.) с полуострова Мангышлак, отделившись от туркменских племен чоудор, игдыр и союнаджи. Однако то, что туркмены Ставрополья наиболее генетически близки не к окружающим их народам Европы, а к узбекам Афганистана ^=0,15) и киргизам ^=0,18), указывает на сохранение их генофондом памяти о центральноазиатской родине.
Важно подчеркнуть, что генофонд туркмен Каракалпакстана резко отличается от генофонда их ближайших географических соседей - каракалпаков @=1,48) и узбеков (в среднем d=1,15). Среднее генетическое расстояние от туркмен Каракалпакстана до других народов Узбекистана, среди которых они проживают @=1,32), на порядок больше, чем генетическое расстояние до географически далеких туркмен Ирана и Афганистана ^=0,12).
Этот вывод иллюстрируется дендрограммой (рис. 4). Показано, что центрально-азиатские популяции разделились на два кластера: «турк-
менский» и остальных народов Центральной Азии. Все четыре популяции узбеков оказались генетически очень близки друг к другу (в среднем d=0,10), сформировав «узбекский» субкластер, наиболее генетически сходный с географически далекими туркменами Ставрополья (0,15^<0,25) и наиболее далекий от географически близких туркмен Каракалпакстана (0,76^<1,69).
Филогенетический анализ генофондов народов Узбекистана
По другому классу маркеров У-хромосомы (по панели быстро мутирующих 17 БТР маркеров) проведено сравнение туркмен Каракалпакстана по гаплогруппе О (составляющей у них три четверти генофонда) с другими народами Узбекистана: дунганами, каракалпаками и тремя популяциями узбеков (рис. 5).
Филогенетическая сеть вариантов (гапло-типов) гаплогруппы О выявила специфичный «туркменский» кластер (кластер а, выделенный на рис. 5 пунктирной линией), причем в него вошли все без исключения туркмены, обладающие этой гаплогруппой. Все остальные гаплотипы (других народов Узбекистана) не образовали ни одного кластера и отражают картину генетических следов единичных мигрантов с гаплогруппой О. «Туркменский» кластер а включил 72 образца, принадлежащих к 24 разным гаплотипам О. Специфичность «туркменского» кластера а равна 97% (то есть
Рис. 4. Дендрограмма генофондов туркмен и других популяций Центральной Азии (построена методом Уорда
на основе матрицы генетических расстояний)
Рис. 5. Филогенетическая сеть гаплогруппы Q-M242 в популяциях Узбекистана
97% образцов кластера представлены туркменами). Остальные 3% - это единичные образцы ташкентских и хорезмских узбеков, указывающие на миграции от туркмен к узбекам. Таким образом, филогенетическая сеть гаплогруппы Q выявляет поток генов только от туркмен к узбекам и отсутствие обратных миграций.
Стрелка на рисунке 5 указывает на предполагаемый гаплотип основателя (founder) «туркменского» кластера. Датировка формирования кластера при расчете по филогенетической сети со-
ставляет 900±300 лет назад, а методом АБй (для тех же гаплотипов) - 1090±430 лет назад. Однако в Карапалкастане представлена только часть изменчивости гаплогруппы О у туркмен. К сожалению, данных о генофонде туркмен Туркмении нет, но при анализе филогенетической сети БТР гаплотипов туркмен Узбекистана, Ирана (с наибольшей вероятностью принадлежащих к племени йомуд) и Афганистана рИаЬадт е! а1., 2016] выявлено, что практически все они входят в единый кластер с датировкой 1400±500 лет назад.
Изучение носителей гаплогруппы Q племени йомуд Туркменистана, скорее всего, еще больше увеличит разнообразие гаплотипов и потому «удревнит» датировку. Поэтому чаша генетических весов, скорее всего, склоняется в сторону версии более древнего происхождения популяции, маркируемой кластером Q-M242«a» и связанной с племенем йомуд.
Мифическим предком салорской этнографической группы, в которую входят йомуды, является легендарный Салор Казан [Джикиев, 1991]. Но есть две генеалогические версии времени жизни его потомка Йомуда - исторического предка племени йомудов. Согласно первой версии, Йомуд был приемным или старшим сыном Салор Казана [Джикиев, 1991], то есть он жил в эпоху Салор Казана. Согласно второй версии, Йомуд - очень дальний потомок Салор Казана в 13-м поколении, живший спустя 325-390 лет после Салор Казана [Кононов, 1958]. Салор Казан был одним из самых известных персонажей в фольклоре огузов, воевавшим с печенегами Сыр-Дарьи. Поэтому время его жизни помещается в период между 750-ми (изгнание огузов из Семиречья) и 890-ми гг. (изгнание печенегов с Сырдарьи) [Джикиев, 1991], что согласуется с независимыми датировками его жизни, варьирующими в интервале от второй половины VIII в. до второй половины XIX века [Книга моего деда Коркута, 1962; Ихсанов, 2013]. Поэтому согласно первой версии (сын Салор Казана) Йомуд жил в VIII или IX в., а по второй версии (потомок в 13-м поколении) - в XII в. Полученные генетические датировки косвенно указывают на справедливость первой версии, но их доверительные интервалы слишком велики для верификации версий. Поэтому лишь полногеномное секвениро-вание Y-хромосомы представителей разных ветвей йомудов у туркмен поможет решить эту историческую загадку столь же успешно, как и при анализе генофонда племени аргын у казахов [Balanovsky et al., 2015].
Однако полученные нами результаты вовсе не привязывают формирование «туркменского» кластера к массовой миграции огузов в ареал современных туркмен (датируемой IX-XI вв.). Генетический ландшафт более сложен. Например, из географических соседей туркмен повышенными частотами гаплогруппы Q отличаются ираноязычные народы (ванчцы Памира с частотой Q 27%) [Y-base]) и пуштуны Афганистана (с частотой Q 18%) [Haber et al., 2012]. С точки зрения геногео-графии появление этого генетического пласта в генофонде туркмен могло иметь разные источники (рис. 2): с юго-запада - поток генов ираноязычного населения из Передней Азии, огибая Каспий с юга; с востока - с потоком генов тюркоязычного насе-
ления; или даже с севера - с миграциями древнего населения Сибири. В данный момент нашим коллективом на основе полного секвенирования Y-хромосомы проводится реконструкция ряда ветвей филогенетического дерева гаплогруппы Q. Выявление в пределах этой гаплогруппы новых высокоинформативных субветвей и дальнейшее детальное изучение их распространения в населении Евразии позволит установить ареал возникновения и расселения носителей этой древней гаплогруппы Q, и, возможно, уточнит пути и время ее проникновения в генофонд туркмен.
Анализ уже имеющихся данных указывает на особость «туркменской» субветви гаплогруппы Q. В работе, выполненной с участием авторов данной статьи [Karmin et al., 2015], приведены итоги полногеномного изучения Y-хромосомы для трех образцов исследованной нами популяции туркмен Каракалпакстана: все они принадлежат к субветви Q2a. Дальнейший анализ этих данных показывает, что они относятся к ветви с маркерами L713, L715 (Q1a1b1a в нотации ISOGG на июнь 2016 года) и выделяются в собственно «туркменскую» субветвь Q-YP1677 [https://www.yfull.com/tree/Q-YP1677/] (с 13 одиночными полиморфизмами YP1677-YP1690). Своеобразие этой «туркменской» субветви очень велико - она отделилась от «братских» субветвей Q2c (муруты о. Борнео) и Q2b (коряки и древние америнды) [Karmin et al., 2015] около 24 тыс. лет назад. При этом все изученные на данный момент полногеномные образцы из Центральной Азии относятся к другим ветвям гаплогруппы Q, отделившимся еще раньше: это Q1 (узбеки, казахи) и Q3 (казахи, курды, пуштуны, уйгуры) [Balanovsky et al., 2016].
По данным анализа древней ДНК наиболее генетически близкими к туркменам (та же субветвь Q2a) оказались образцы эпохи бронзы и два образца эпохи железа [Allentoft et al., 2015]. Образец эпохи бронзы (карасукская культура) происходит из могильника Сабинки-2 (с датировкой 1500-1400 лет до н.э.), образцы эпохи железа -из могильника Верх-Уймон (верхняя Катунь, датировка - середина I тыс. н.э.) [Соёнов, 2000], население которого сформировалось на основе местного пазырыкского и кара-кобинского населения с включением пришлых групп, знакомых с гуннской культурой [Соёнов, Эбель, 1992].
Заключение
Таким образом, при изучении туркмен Каракалпакстана (N=83) по широкой панели маркеров У-хромосомы (41 SNP маркеров) выявлено 12
гаплогрупп, среди которых резко преобладает гап-логруппа Q, составляющая три четверти генофонда (73%). Такое своеобразие туркмен Каракалпакстана во многом объясняется его родоплеменным составом: 88% обследованных относится к одному из крупнейших родоплеменных образований туркмен - роду йомуд (ёмут). Ярко выраженное сходство генофондов туркмен Центральной Азии (Каракалпакстана, Ирана и Афганистана) позволяет выдвинуть гипотезу, что гаплогруппа Q характерна для значительного пласта в генофонде туркмен.
Генетические расстояния между генофондами туркмен и других народов Центральной Азии указывают на крайне слабый поток генов: не выявлено ощутимых влияний на генофонд туркмен Каракалпакстана его географических соседей (узбеков, дунган, каракалпаков). Этот вывод подтверждается и анализом быстромутирующих STR маркеров гаплогруппы Q Y-хромосомы. Показана высокая специфичность «туркменского» кластера гаплотипов (97% образцов составляют туркмены) с датировкой его формирования 900±300 (методом ASD 1090±430) лет назад.
Благодарности
Работа выполнена при поддержке грантов РНФ 14-14-00827, Программ Президиума РАН «Молекулярная и клеточная биология», «Динамика генофондов», Программно-целевым финансированием МОН РК (№0114РК00492) Назарбаев Университет. В картографическом анализе были использованы данные проектов РФФИ №16-06-00303_а, РФФИ №16-36-00122, РФФИ №16-0600364 мол а.
Библиография
Адамов Д.С. Оценка TMRCA по Y STR локусам (учебное пособие). 2016 (в печати).
Агджоян А. Т., Падюкова АД, Жабагин М.К., Тычинских З.А., Лавряшина М.Б., Кузнецова М.А., Схаляхо P.A., Чухряева М., Балановская Е.В., Балановский О. П. Своеобразие генофонда // История и культура татар Западной Сибири / Глав. ред. З.А. Тычинских, ответ. ред. Г.Ф. Габдрахманова. Казань: Институт истории им. Ш. Марджани АН РТ, 2015. С. 30-36. БД Y-base. Электронный ресурс и компьютерная сеть лаборатории популяционной генетики человека МГНЦ. URL: http: // www.genofond.ru/genofond.ru/default26d8e.html?s=0&p=346 (дата обращения: 17.06.2016).
Балаганская О.А., Балановский О.П., Лавряшина М.Б., Кузнецова М.А., Романов А. Г., Дибирова Х.Д., Фролова С.А., Захарова Т.А., Баранова Е.Е., Сабитов Ж., Нимадава
П., Балановская Е.В. Генетическая структура по маркерам Y-хромосомы народов Алтая (России, Казахстана, Монголии) // Вестник Московского университета. Серия XXIII. Антропология, 2011. № 2. С. 25-36. Балановский О.П. Генофонд Европы. М.: Товарищество научных изданий КМК, 2015. 354 с. Богунов Ю.В., Мальцева О.В., Богунова А.А., Балановская Е.В. Нанайский род самар: структура генофонда по данным маркеров Y-хромосомы // Археология, этнография и антропология Евразии, 2015. Т. 43. № 2. С. 146-152.
Джикиев А. Очерки происхождения и формирования туркменского народа в эпоху средневековья. Ашхабад, 1991. 336 с.
Жабагин М.К., Дибирова Х.Д., Фролова С.А., Сабитов Ж.М., Юсупов Ю.М., Утевская О.М., Тарлыков П.В., Тажигулова И.М., Балаганская О.А., Нимадава П., Захаров И.А., Балановский О.П. Связь изменчивости Y-хромосомы и родовой структуры: генофонд степной аристократии и духовенства казахов // Вестник Московского университета. Серия XXIII. Антропология, 2014. № 1. С. 96-101.
Ихсанов А.Р. Туркмены-текинцы в XVII - начале VIII в. // Тюркологический сборник 2011-2012: Политическая и этнокультурная история тюркских народов и государств. М.: Восточная литература, 2013. 431 с. Книга моего деда Коркута. Пер. В.В. Бартольда. М.-Л.: АН СССР 1962.
Кононов А.Н. Родословная туркмен. Сочинение Абул-гази, хана хивинского. М.-Л.: Изд. АН СССР, 1958. 192с. Кошель С.М.. Геоинформационные технологии в гено-географии // Современная географическая картография / Под ред. И.К. Лурье, В.И. Кравцовой. М: Дата, 2012. С. 158-166.
Народы и религии мира: энциклопедия / Гл. ред. В.А. Тиш-ков. Ред. кол.: О.П. Артемова, С.А. Арутюнов, А.Н., Кожа-новский и др. М.: Большая Российская энциклопедия, 1999. 928 с.
Народы мира: историко-этнографически справочник / Гл. ред. Ю.В. Бромлей. Ред. кол.: С.А. Арутюнов, С.И. Брук, Т.А. Жданко и др. М.: Советская энциклопедия, 1988. 624 с.
Соёнов В.И., Эбель А.В. Курганы гунно-сарматской эпохи на Верхней Катуни. Горно-Алтайск, 1992. 116 с. Соёнов В.И. Результаты раскопок на могильнике Верх-Уймон в 1999 г // Древности Алтая. Известия лаборатории археологии. Горно-Алтайск, 2000а. № 5. С. 48-62. Соёнов В.И. Продолжение охранных раскопок на могильнике Верх-Уймон в Горном Алтае // Сохранение и изучение культурного наследия Алтая. Барнаул, 20006. Вып. XI. С. 201-202.
Юсупов Ю.М., Волков В.Г., Каримов А.А., Рыскулов Р.М., Схаляхо Р.А., Харьков В.Н., Балановская Е.В. Происхождение и родственные связи рода Уран по данным генетических исследований // История башкирских родов. Уран. Т. 7. Уфа: ГУП РБ Уфимский полиграф-комбинат, 2015. 268 с.
Юсупов Ю.М., Асылгужин Р.Р., Агджоян А.Т., Дибирова Х.Д., Балановская Е.В. Исследование генофонда южных и северо-восточных кланов башкир // Урал и просторы Евразии сквозь века и тысячелетия. Уфа: Гилем, 2013. С. 132-134.
Allentoft M.E., Sikora M., Sjugren K.G., Rasmussen S., Rasmussen M., Stenderup J., Damgaard P., Schroeder H., Ahlstrum T., Vinner L., Malaspinas A-S., Margaryan A., Higham T., Chivall D., Lynnerup N., Harvig L., Baron J., Della Casa Ph., Dabrowski P., Duffy P.R., Ebel A.V., Epimakhov A., Frei K., Furmanek M., Gralak T., Gromov A., Gronkiewicz S., Grupe G., Hajdu T., Jarysz R., Khartanovich V., Khokhlov A., Kiss V., Kolar J., Kriiska A., Lasak I., Longhi C., McGlynn G., Merkevicius A, Merkyte I., Metspalu M., Mkrtchyan R., Moiseyev V, Paja L., Parifi G., Pokutta D., Pospieszny L., Douglas Price T., Saag L., Sablin M., Shishlina N., Smruka V., Soenov V., Szeverenyi V., Torth G., Trifanova S., Varul L., Vicze M., Yepiskoposyan L., Zhitenev V., Orlando L., Sicheritz-Ponten L., Brunak S., Nielsen R., Kristiansen K. and Willerslev E. Population genomics of Bronze Age Eurasia // Nature, 2015. N 522 (7555). P. 167-172. DOI: 10.1038/nature14507. Balanovsky O., Rootsi S., Pshenichnov A., Kivisild T., Churnosov M., Evseeva I., Pocheshkhova E., Boldyreva M., Yankovsky N., Balanovska E., Villems R. Two sources of the Russian patrilineal heritage in their Eurasian context // Am. J. Hum. Genet., 2008. P. 236-250. Balanovsky O., Dibirova K., Dybo A. Mudrak O., Frolova S., Pocheshkhova E., Haber M, Platt D., Schurr T, Haak W, Kuznetsova M., Radzhabov M., Balaganskaya O., Romanov A., Zakharova T., Hernanz D., Zalloua P., Koshel S., Ruhlen M., Renfrew C, Wells R., Tyler-Smith C, Balanovska E. and The Genographic Consortium. Parallel evolution of genes and languages in the Caucasus region // Mol. Biol. Evol., 2011. Vol. 28. N 10. P. 2905-2920. Balanovsky O., Zhabagin M., Agdzhoyan A., Chukhryaeva M, Zaporozhchenko V., Utevska O., Highnam G., Sabitov Zh., Greenspan E., Dibirova Kh., Skhalyakho R.A, Kuznetsova M., Koshel S., Yusupov Yu., Nymadawa P., Zhumadilov Zh., Pocheshkhova E., Haber M., Zalloua P. A, Yepiskoposyan L., Dybo A., Tyler-Smith C., Balanovska E. Deep phylogenetic analysis of haplogroup G1 provides estimates of SNP and STR mutation rates on the human Y chromosome and reveals migrations of Iranic speakers // PLoS One, 2015. Apr. N 7. Epub ahead of print. DOI:org/ 10.1371/journal.pone.0122968 (дата обращения: 10.06.2016).
Balanovsky O., Gurianov V., Zaporozhchenko V., Balaganskaya O., Urasin V., Zhabagin M., Grugni V., Canada R., Al-Zahery N., Raveane A., Wei R, Yan S., Wang X., Zalloua P., Marafi A, Koshel S., Semino O., Tyler-Smith C, Balanovska E. Phylogeography of human Y-chromosome haplogroup Q3-L275 from an academic/citizen science collaboration // BMC, 2016, (in review). Di Cristofaro, J., Pennarun E., Mazie'res S, Myres N., Lin A., Temori S., Metspalu M., Metspalu E., Witzel M., King R., Underhill P., Villems R., Chiaroni J. Afghan Hindu Kush: Where Eurasian sub-continent gene flows converge // Plos One, 2013. Oct. N 18. DOI: 10.1371/journal.pone.0076748 (2013). Ge J., Budowle B., ArandaX.G., Planz J. V., Eisenberg A.J., Chakraborty R. Mutation rates at Y chromosome short tandem repeats in Texas populations // Forensic Sci. Int. Genet., 2009. Vol. 3(3). P. 179-184. Epub 2009 Feb 14. DOI: 10.1016/j.fsigen.2009.01.007. Grugni, V., Battaglia V., Hooshiar Kashani B., Parolo S., Al-Zahery N., Achilli A., Olivieri A., Gandini F., Houshmand M., Hossein M., Torroni S., Semino O. Ancient migratory events
in the Middle East: New clues from the Y chromosome variation of modern Iranians // Plos One, 2012. N 7. DOI: 10.1371/journal.pone.0041252.
Haber M, Platt D.E., Bonab M.A., Youhanna S.C., Soria-Hernanz D.F., Martinez-Cruz B. et al., Genographic Consortium. Afghanistan's Ethnic Groups Share a Y-Chromosomal Heritage Structured by Historical Events // Plos One, 2012. Vol. 7(3). doi: 0.1371/journal.pone.0034288. Karafet T., Osipova L., Gubina M., Posukh O., Zegura S., Hammer M. High Levels of Y Chromosome differentiation among native Siberian populations and the genetic signature of a boreal hunter-gatherer way of life // Hum. Biol., 2003. Vol. 74. N 6. P. 761-789. Karmin M., Saag L., Vicente M., Wilson Sayres M., Jdrve M, Talas U, Rootsi S., Ilumde A.-M., Mdgi R., Mitt M., Pagani L., Puurand T., Faltyskova Z, Clemente F., Cardona A, Metspalu E., Sahakyan H., Yunusbayev B., Hudjashov G, DeGiorgio M., Loogvdli E.-L., Eichstaedt C., Eelmets M., Chaubey G, Tambets K., Litvinov S., Mormina M., Xue Y., Ayub Q., Zoraqi G., Korneliussen T., Akhatova F., Lachance J., Tishkoff S., Momynaliev K., Ricaut F.-X., Kusuma P., Razafindrazaka H., Pierron D., Cox M., Sultana G, Willerslev R, Muller C, Westaway M., Lambert D., Skaro V, Kovac evic L., Turdikulova S., Dalimova D., Khusainova R., Trofimova N., Akhmetova V, Khidiyatova I., Lichman D., Isakova J., Pocheshkhova E., Sabitov Zh., Barashkov N., Nymadawa P., Mihailov E, Seng J., Evseeva I., Migliano A, Abdullah S., Andriadze G., Primorac D., Atramentova L., Utevska O., Yepiskoposyan L., Marjanovic D., Kushniarevich A., Behar
D., Gilissen C, Vissers L., Veltman J., Balanovska E., Derenko M., Malyarchuk B., Metspalu A., Fedorova S., Eriksson A., Manica A., Mendez F., Karafet T., Veeramah K., Bradman N., Hammer M., Osipova L., Balanovsky O., Khusnutdinova
E., Johnsen K., Remm M., Thomas M., Tyler-Smith C., Underhill P., Willerslev E., Nielsen R., Metspalu M., Villems R., Kivisild T. A recent bottleneck of Y chromosome diversity coincides with a global change in culture // Genome Res., 2015. Vol. 25. N 4. P. 459-466. Epub. 2015. Mar. 13. DOI :10.1101/gr.186684.114.
Malyarchuk B., Derenko M., Denisova G., Maksimov A., Wozniak M., Grzybowski T., Dambueva I., Zakharov I. Ancient links between Siberians and Native Americans revealed by subtyping the Y chromosome haplogroup Q1a // J. Hum. Genet., 2011. N 56. P. 583-588. DOI.:10.1038/ jhg.2011.64.
Malyarchuk B., Derenko M., Denisova G., Khoyt S., Wozniak M., Grzybowski T., Zakharov I. Y chromosome diversity in the Kalmyks at the ethnical and tribal levels // J. Hum. Genet., 2013. N 58. P. 804-811. DOI.:10.1038/jhg.2013.108. Nei M. Molecular evolutionary genetics. Amsterdam, 1975. 278 p.
Seielstad M., Yuldashbaeva N., Singh N., Underhill P., OefnerP., Shen P., Wells R.S. A Novel Y chromosome variant Puts an Upper limit on the timing of first entry into the Americas // Amer. J. Hum. Genet., 2003. N 73. P. 700-705. Y DNA Haplogroup Tree 2016 [Электронный ресурс] URL: http://isogg.org/tree/ ISOGG_YDNATreeTrunk.html (дата обращения: 14.06.2016).
Zhabagin M., Balanovska E., Sabitov Zh., Kuznetsova M., Agdzhoyan A., Balaganskaya O., Chukhryaeva M, Markina N., Romanov A., Skhalyakho R., Zaporozhchenko V., Saroyants L., Dalimova D., Davletchurin D., Turdikulova
Sh., Yusupov U., Tazhigulova I., Akilzhanova A., Tyler-Smith C, Balanovsky O. The Connection of the Genetic, Cultural and Geographic Landscapes of Transoxiana // Scientific Reports (in peer-review, SREP-16-30589).
Контактная информация:
Схаляхо Роза Арамбиевна: e-mail: [email protected]; Жабагин Максат Кизатович: e-mail: [email protected]; Юсупов Юлдаш Мухамматович: e-mail: [email protected]; Агджоян Анастасия Торосовна: e-mail: [email protected];
Сабитов Жаксылык Муратович: e-mail: [email protected]; Гурьянов Владимир Мхайлович: e-mail: [email protected]; Балаганская Ольга Алексеевна: e-mail: [email protected]; Далимова Дилбар Акбаровна: e-mail: [email protected]; Давлетчурин Дамир Хамидович: e-mail: [email protected]; Турдикулова Шахпо Уткуровна: e-mail: [email protected]; Чухряева Марина Игоревна: [email protected]; Асылгужин Рафиль Рифгатович: e-mail: [email protected]; Акильжанова Айнур Рахметуловна: e-mail: [email protected]; Балановский Олег Павлович: e-mail: [email protected]; Балановская Елена Владимировна: e-mail: [email protected].
GENE POOL OF TURKMENS FROM KARAKALPAKSTAN IN THEIR CENTRAL ASIAN CONTEXT (Y-CHROMOSOME POLYMORPHISM)
R.A. Skhalyakho1'2, M.K. Zhabagin3, Yu.M. Yusupov4, A.T. Agdzhoyan2-1, Zh.M. Sabitov5, V.M. Gurianov2 , O.A. Balaganskaya2, D.A. Dalimova6, D.Kh. Davletchurin6, Sh.U. Turdikulova7, M.I. Chukhryaeva12, R.R. Asilgujin4, A.R. Akilzhanova3, O.P. Balanovsky2,1, E.V. Balanovska1
'Research Centre for Medical Genetics, Moscow, Russia
2Vavilov Institute of General Genetics, Moscow, Russian Academy of Sciences, Moscow, Russia
3National Laboratory Astana, Nazarbayev University, Astana, Kazakhstan
4Institute of Strategic Researches, Ufa, Russia
5Gumilov Eurasian National University, Astana, Kazakhstan
6Institute of Bioorganic Chemistry, Tashkent, Uzbekistan
7Center of High Technologies, Tashkent, Uzbekistan
Turkmens represent one of the least studied population of Central Asia due to lack of international scientific integration of Turkmenistan into the gene pool studies. Preserving in Turkmens the memory of the tribal affiliation allows the parallel study of tribal structure and Y-chromosome which are both transmitted along the paternal line.
The panel of Y-chromosome markers highly informative for genetic studies (41 SNP and 17 STR markers) has been used for the study of the gene pool of the northern Turkmen population - Turkmens in Karakalpakstan (N=83). Sample of Turkmens from Xojeyli and Shumanay districts of Karakalpakstan included mainly (88%) one of the largest Turkmen' tribe (Yomud) and only a few representatives of other clans (Gochak, Oliz, Uker, Yagly).
Among 12 identified haplogroups the major haplogroup Q composed three-quarters of the gene pool. The remaining quarter of the gene pool consisted of haplogroups H, R1b, R1a, and G2a (with frequencies from 4 to 7 per cent) and variants of haplogroups C2, J1, J2a, N1*, N1c met in 1-2 individuals each. Pronounced similarity of gene pools of the Turkmens in Central Asia - Karakalpakstan, Iran and Afghanistan - has allowed to hypothesize that haplogroup Q is typical for the gene pool of the Turkmen ethnic group as a whole.
The genetic distance between the gene pools of Turkmens and other Central Asian populations showed no appreciable effects on the gene pool of the Turkmen in Karakalpakstan by its geographical neighbors -Uzbeks, Dungans, and Karakalpaks. Analysis of Y-chromosome haplogroup Q fast mutating STR markers has also confirmed this conclusion. The estimated date of STR cluster of Turkmens in Karakalpakstan on haplogroup Q phylogenetic network was 900±300 years (date by ASD method was 1090±430).
Keywords: ethnogenesis, gene pool, gene geography, Y-chromosome, haplogroup, Turkmens, clan, Yomud, Central Asia