УДК 575.852.113:595.773.4
ОЦЕНКА РАВНОМЕРНОСТИ ХОДА МОЛЕКУЛЯРНЫХ ЧАСОВ В РОДОСЛОВНЫХ ВИДОВ ДРОЗОФИЛ ГРУППЫ VIRILIS
А.М. Куликов, О.Е. Лазебныи, Е.Ю. Рыбакова
(Институт биологии развития имени Н.К. Кольцова РАН; e-mail: [email protected])
Исследована филогения видов-двойников группы Drosophila virilis на основе изменчивости пяти ядерных и митохондриальных генов: Adh, NonA, Fu, Rasl и 16S-12S рРНК. Предложена модель для оценки неравномерности накопления замен в филогенетических линиях группы видов по произвольному числу последовательностей ДНК с учетом множественных, параллельных и обратных замен. Реконструированы периоды неравномерного хода молекулярных часов в группе видов virilis и построено филогенетическое дерево данной группы на основе нейтральной изменчивости.
Ключевые слова: эволюция, молекулярные часы, нейтральная изменчивость, Drosophila virilis.
В работах по оценке скорости накопления изменчивости в последовательностях ядерных Adh, ЫоиА, Ри, Кая1 и 165-125 рРНК митохондриальных генов мы показали нарушение хода молекулярных часов в большинстве эволюционных линий группы видов-двойников Бго$орЫ1а утШ [1, 2]. При этом неравномерность хода молекулярных часов была характерна для консервативных последовательностей генов 165-125 рРНК и Кая1, замены в которых преимущественно нейтральны [3—5]. Ранее с помощью математического моделирования была оценена роль позитивного отбора, действующего на локус [6]: интенсивный направленный отбор должен способствовать более равномерным темпам молекулярной эволюции. Полученные нами данные согласуются с выводами Катлера [6]. Именно локусы, подвергающиеся действию позитивного отбора, могут быть более предпочтительными для проведения филогенетических оценок. Однако направленный отбор по признакам, имеющим выраженный адаптивный характер, может приводить к накоплению конвергентных замен — гомоплазий в случае формирования независимых адаптаций к сходным условиям у видов, не входящих в монофилетическую группу. Очевидно, эта изменчивость связана в значительной степени с несинонимичными заменами, хотя нельзя полностью исключить и накопления гомоплазий в области промотора. Для того чтобы исключить влияние отбора при построении филоге-ний, мы предлагаем использовать исключительно "молчащие" сайты, в том числе 4-кратно вырожденные позиции нуклеотидов и некодирующие последовательности ДНК.
Задачей работы была разработка алгоритма точной оценки равномерности накопления замен в эволюционных линиях сравниваемых видов по про-
извольному числу последовательностей, построение филогенетического древа на основе нейтральной изменчивости на примере дрозофил группы утШ и реконструкция периодов нарушения равномерного хода молекулярных часов в эволюционных линиях данной группы видов.
Используемый традиционно в качестве меры скорости накопления замен индекс дисперсии Я(Т), равный частному дисперсии числа замен на их среднее число, не должен достоверно отличаться от единицы в случае нейтральной эволюции. Существуют формальные факторы, приводящие к смещению оценок Я(Т). Это число узлов филогенетического дерева или степень отличия конкретной филогении от филогении "звезды", скорость смены поколений в разных родословных, недоучет параллельных и множественных замен в сравниваемых последовательностях и др. Методы оценки величины взвешенного индекса дисперсии были разработаны Гилес-пи [7] и Балмером [8]. Эти методы приложимы к разным исходным данным и учитывают разные факторы. Гилеспи предложил использовать поправку на "эффекты происхождения", общие для разных локусов одного генома. Балмер ввел поправку — коэффициент инфляции — на чрезмерное увеличение Я(Т), возникающее при использовании сложных моделей, учитывающих множественные замены. Нами был разработан и применен новый метод, объединяющий обе поправки.
Метод невзвешенного индекса дисперсии (И(Т)), с поправкой на коэффициент инфляции. Оценивается отдельно для каждого из к локусов и каждой пары видов Я(Т)• _; м Ш. = (5 - 2)5а/(V + (5 - 4)С)(5 - 1), где V и с — обобщенные оценочные показатели Уаг(ёгу) и Соу(ёгу, фк) для каждой г-й родословной (по Балмеру) соответственно, ф — расстояние между соответствующими эволюционными линиями,
8 — число сравниваемых видов, 5а = ^(а,- - а )2,
¡=1
где а1 — число замен на один нуклеотид в данной родословной, а — среднее число замен на один нуклеотид во всех рассматриваемых эволюционных линиях. Вариационно-ковариационную матрицу этих показателей, как показал Балмер, можно определить с высокой точностью по стандартным формулам сложения дисперсий и ковариаций независимых линейных функций, принимая значения дисперсий и ковариаций расстояний между видами за первичные данные:
I
Var (djj) = Var
2 w'dij
\
= 2 wfVar (djj) + ^ WiWjCow(dij, dik),
i=1
i *j I
Cov (dij, dik) = Cov ^ Widij, ^Uidi}
\
= ^ wUiVar (dij) + ^ WiUjCow(dij, dik),
i=1 i*j
где wi, Wj и u, Uj — веса расстояний dy, dik в i-й родословной.
Стандартные значения весов (w, Wj и u, uj) входят в формулы дисперсии и ковариации расстояний для данной эволюционной линии "i" с положительным знаком и значением Wi = 1/(s — 1) для всех расстояний между видом "i" и остальными видами и с отрицательным знаком и значением wi = = 1/(s — 1)(s —2) для всех остальных расстояний.
Показатель индекса дисперсии для данной эволюционной линии R(T)i ¿ni^ определяется как среднее по всем парам, образуемым данным видом, как для одного локуса, так и по всем локусам. Статистика х2 = (s — 2)Sa/(v + (s — 4)c) определяется для искомого показателя R(T)j.j ¿ща1 по индивидуальным значениям дисперсии и ковариации каждой эволюционной линии каждого анализируемого локуса. Пользуясь свойством аддитивности независимых распределений х2, мы можем получить оценку для усредненных по всем локусам значений R(T)j.j ¿nfiat., для всех пар данного вида и внешних по отношению к нему, используя суммы соответствующих статистик х2 и суммы их степеней свободы, при этом необходимо вместо аргумента функции x использовать аргумент nx.
Метод взвешенного R(T) с поправкой на коэффициент инфляции. Данный показатель оценивается отдельно для каждого из k локусов и каждой пары видов i-j. Веса W{ определяются по средним ai для всех к локусов:
w¡=
k / i К_
s Eav ,
так что HíOj = s.
В соответствии со свойствами дисперсии и ковариации для произвольных случайных величин §1 и §2 верны равенства: Var (w?£) = w?Var (§) и
Cov (wí £1, wj £ 2) = w¡ w¡ Cov(§1, §2). Учитывая уже определенную вариационно-ковариационную матрицу, полученную для невзвешенных значений среднего числа замен на один нуклеотид a¡, воспользуемся свойствами дисперсии и ковариации и разделим значения матрицы на соответствующие им весовые коэффициенты. Соответственно получаем:
R (T)
i - j inf lat., weight =
= (S - 2)Sa weightI(Vw2 + (s - 4)(C/wiwj))(S - 1),
i
где Sa weight = 2(a¿/wi - a/w¡),
í=1
X2 = (S - 2)Sa weight/((v/w2) + (s - 4)(c/w¿wj )).
Индекс дисперсии для i-й эволюционной линии R(T)¡ ift weight также определяется как среднее по всем парам, образуемым данным видом.
Результаты применения предложенных алгоритмов для оценки индекса дисперсии по последовательностям пяти генов в эволюционных линиях видов группы virilis подтвердил сделанные ранее выводы. Высокополиморфный локус Adh, связанный с пищевыми адаптациями к бродящим субстратам и находящийся под действием положительного отбора, имеет наименьший индекс дисперсии, а консервативная последовательность 12S-16S рРНК генов мтДНК — наибольший. Среди ядерных генов наибольшее значение получено для высококонсервативного и обладающего исключительно низким по-пуляционным полиморфизмом гена Rasl. Результаты анализа генетических расстояний, рассчитанных по заменам в нейтральных позициях общей последовательности пяти исследуемых генов (4-кратно вырожденные позиции нуклеотидов кодирующих последовательностей и некодирующие последовательности ДНК) для пар эволюционных линий представлены на рис. 1.
Виды D. borealis, D. montana, D. lacicola и D.fla-vomontana субфилады montana имеют наиболее низкие и сходные между собой показатели R(T). Это свидетельствует о сходной равномерной скорости молекулярной эволюции в эволюционных линиях этих видов. При этом D. flavomontana имеет самые низкие значения R(T). Значения R(T) в парах, включающих вид D. virilis, являются максимальными, что предполагает наиболее существенные нарушения равномерности хода молекулярных часов в эволюционной линии D. virilis. Остальные виды данной филады virilis также имеют более высокие индексы дисперсии по сравнению с видами из другой филады. Это свидетельствует о значительных изменениях скорости молекулярной эволюции на всех этапах расхождения видов филады virilis. При срав-
k=1
Рис. 1. Изменения R(T)¡.j inflat,weight У ВИДОВ, относящихся к одной филаде или субфиладе: a — эволюционные линии видов филады virilis (D. virilis, D. lummei, D. novamexicana); б — эволюционные линии видов субфилады montana филады montana (D. montana, D. flavomontana, D. lacicola, D. borealis); в — эволюционные линии видов субфилады kanekoi филады montana (D. kanekoi, D. ezoana, D. littoralis). Виды обозначены двумя первыми буквами видового названия. Индексы R(T) рассчитаны по заменам в нейтральных сайтах (4-кратно вырожденные позиции нуклеотидов кодирующих последовательностей и некодирующие последовательности ДНК) общей последовательности пяти ядерных и ми-то-
нении представителей филады virilis и субфилады montana получены минимальные значения R(T). Это означает, что на ранних этапах дивергенции от общего предка молекулярные часы шли более равномерно, чем на поздних этапах. Виды — представители субфилады kanekoi (D. kanekoi, D. ezoana и D. littoralis) — имеют более сложную картину распределения индекса дисперсии R(T). Минимальные значения показателя характерны для D. ezoana. Виды D. littoralis и D. kanekoi при сравнении между собой демонстрируют промежуточное значение R(T) « 2,5, а при сравнении с представителями других субфи-лад — противоположные значения. Так, D. littoralis имеет показатели 3,12 < R(T) < 3,82 при сравнении с представителями филады virilis, что существенно выше аналогичных показателей D. kanekoi — от 2,8 до 3,3. Наоборот, при сравнении этих видов с представителями субфилады montana значения R(T) существенно ниже и близки для обоих видов (максимальные значения — 2,0 для D. littoralis и 2,3 для D. kanekoi).
Учитывая наиболее вероятную топологию дерева (рис. 2), построенного методом максимальной экономии по общей последовательности всех пяти генов с учетом изменчивости, близкой к нейтральной (4-кратно вырожденные позиции нуклеотидов кодирующих последовательностей и некодирующие последовательности ДНК), можно сделать следующие выводы. Действие отбора на изученные последовательности исключено в силу использованного близкой к нейтральной изменчивости и весовых
коэффициентов Гилеспи, поэтому неравномерная скорость накопления замен может быть связана с влиянием генетико-автоматических процессов. Одни и те же климатические условия могли по-разному влиять на виды-двойники дрозофил группы virilis в силу уже сложившихся адаптаций, времени распространения по ареалу и различной эффективно-
Рис. 2. Дендрограмма генетических расстояний, полученных по общей последовательности генов: Adh, NonA, Fu, Rasl и 16S-12S рРНК с учетом изменчивости, близкой к нейтральной (4-кратно вырожденные позиции нуклеотидов кодирующих последовательностей и некодирующие последовательности ДНК), между видами-двойниками группы virilis, построенная методом максимальной экономии. Числа в узлах дерева обозначают индексы бутстреп-поддержки. Те — хромосомная форма texana вида Drosophila americana — одного из видов-двойников группы virilis, входящего в одноименную филаду
сти действия генетико-автоматических процессов в популяциях исследуемых видов. Например, разные виды группы утШ могли проходить через разное количество "бутылочных горлышек".
* * *
Работа поддержана Российским фондом фундаментальных исследований (грант № 09-04-01745).
СПИСОК ЛИТЕРАТУРЫ
1. Куликов A.M., Лазебный O.E., Горностаев Н.Г., Че-кунова А.И. Митрофанов В.Г. Неравномерность скорости эволюции у дрозофил группы virilis. I. Применение филогенетически опосредованных тестов Такезаки // Изв. РАН. Сер. биол. 2010. Т. 37. № 1. С. 25-33.
2. Куликов А.М., Лазебный O.E., Горностаев Н.Г., Че-кунова А.И. Митрофанов В.Г. Неравномерность скорости эволюции у дрозофил группы virilis. II. Применение метода тестирования Таджимы // Изв. РАН. Сер. биол. 2010. Т. 37. № 1. С. 206-209..
3. Gasperini R., Gibson G.J. Absence of protein polymorphism in the Ras genes of Drosophila melanogaster // Mol. Evol. 1999. Vol. 49. N 5. P. 583-590.
4. Сорокина С.Ю., Мюге H.C., Андрианов Б.В., Митрофанов В.Г.Изменчивость 3'-концевого фрагмента гена
16S pPHK в группе бизкородственных видов дрозофил virilis // Генетика. 2005. Т. 41. № 8. С. 1049—1054.
5. Чекунова А.И, Куликов A.M., Михайловский С.С., Лазебный О.Е. Лазебная И.В., Митрофанов В.Г Родственные отношения дрозофил группы virilis, рекомендованные на основе последовательностей гена Drasl // Генетика. 2008. Т. 44. № 3. С. 336—345.
6. Cutler D.J. Understanding the overdispersed molecular clock // Genetics. 2000. Vol. 154. P. 1403—1417.
7. Gillespie J.H. Lineage effects and the index of dispersion of molecular evolution // Mol. Biol. Evol. 1989. Vol. 6. N 5. P. 636—647.
8. Bulmer M. Estimating the variability of substitution rates // Genetics 1989. Vol. 123. P. 615—619.
Поступила в редакцию 18.04.10.
ESTIMATION OF THE RATE OF MOLECULAR CLOCK
IN LINEAGES OF THE DROSOPHILA VIRILIS SPECIES GROUP
A.M. Kulikov, O.E. Lazebny, E.Yu. Rybakova
Phylogeny of the Drosophila virilis species group is studied on the base of five nuclear and mitochondrial genes: Adh, NonA, Fu, Rasl h 16S-12S rRNA. Mathematical simulation to estimate uneven accumulation of replacements in lineages of closely related species using arbitrary number of sequences was suggested. It accounts for multiple, parallel and reverse mutations. Periods of evolution with irregular rates in the virilis species group were reconstructed. Phylogeny tree for the group given on the base of neutral variability was constructed.
Key words: evolution, molecular clock, neutral variability, Drosophila virilis.
Сведения об авторах
Куликов Алексей Михайлович — канд. биол. наук, ст. науч. сотр., Учреждение Российской академии наук Институт биологии развития имени H.K. Кольцова РАН. Тел. (499)135-87-81; e-mail: [email protected]
Лазебный Олег Евгеньевич — канд. биол. наук, ст. науч. сотр., Учреждение Российской академии наук Институт биологии развития имени Н.К. Кольцова РАН. Тел. (499)135-87-81; e-mail: [email protected]
Рыбакова Елена Юрьевна — аспирантка, Учреждение Российской академии наук Институт биологии развития имени Н.К. Кольцова РАН. Тел. (499)135-87-81.