УДК 575
Изучение генной экспрессии при адаптации к гипотоническим условиям на примере трехиглой колюшки (Gasterosteus aculeatus)
С. М. Расторгуев1*, А. В. Недолужко1, Н. М. Груздева1, Е. С. Булыгина1, С. В. Цыганкова1, Д. Ю. Ощепков4, А. М. Мазур2, Е. Б. Прохорчук2,3, К. Г. Скрябин1,2,3 Национальный исследовательский центр «Курчатовский институт», 123182, Москва, пл. Академика Курчатова, 1
2Институт биоинженерии, ФИЦ Биотехнологии РАН, 119071, Москва, Ленинский просп., 33, корп. 2
3Московский государственный университет им. М.В. Ломоносова, биологический факультет, 119234, Москва, Ленинские горы, 1, стр. 12
4Институт цитологии и генетики, ФИЦ ИЦИГ СО РАН, 630090, Новосибирск, просп.
Академика Лаврентьева, 10
*E-mail: [email protected]
Поступила в редакцию 09.12.2016
Принята к печати 07.11.2017
РЕФЕРАТ Трехиглая колюшка (Gasterosteus aculeatus) является удобным объектом для изучения эволюции и процессов видообразования. Количество исследований с ее участием в последние годы неуклонно растет, что обусловлено процессами образования пресноводных форм у данного вида, которые происходят в настоящее время. Морская форма этого вида, заходя на нерест в пресные водоемы, часто остается там и образует пресноводные популяции. Особи в таких популяциях подвергаются отбору и начинают достаточно сильно отличаться от своих морских предков по многим морфобиологическим признакам. Процессы, происходящие в таких популяциях, представляют большой интерес для эволюционных биологов. Методом RNA-seq нами определены различия в экспрессии генов в жаберных тканях морской и пресноводной форм трехиглой колюшки, содержавшихся в морской и пресной воде соответственно. Метод RNA-seq позволяет оценить активность всех генов, экспрессирующихся в данной ткани. В результате были выявлены 2982 гена, активность которых статистически значимо различается в жабрах морских и пресноводных особей, определены функциональные категории, обогащенные найденными генами. Показано, что дифференциально экспрес-сируемые гены неслучайным образом распределены по большинству хромосом генома, и такие гены часто находятся в геномных «островках дивергенции», ответственных за пресноводную адаптацию колюшки. КЛЮЧЕВЫЕ СЛОВА трехиглая колюшка, Gasterosteus aculeatus, экспрессия генов, дифференциальная экспрессия, RNA-seq, осморегуляция, GO-анализ, видообразование.
ВВЕДЕНИЕ
Трехиглая колюшка (Gasterosteus aculeatus) (рис. 1) является модельным объектом для изучения процесса адаптивного видообразования при смене мест обитания [1], поскольку ее морская форма колонизирует пресноводные места обитания по всему побережью Северного полушария. Морская популяция трехиглой колюшки обычно использует пресноводные ручьи и озера для нереста, но при изоляции в новых условиях образуется пресноводная резидентная популяция, морфотип которой со временем изменяется и появляются другие особенности, позволяющие вы-
жить в новых условиях. Такая особенность позволяет использовать эту небольшую рыбу в качестве объекта для изучения адаптивной эволюции в сходных условиях обитания.
К настоящему времени опубликован ряд работ, посвященных полногеномным изменениям, происходящим в процессе адаптационного видообразования у трехиглой колюшки [2-4], в которых были обнаружены геномные островки дивергенции, где концентрируются нуклеотидные замены, характерные для пресноводной формы. Известны исследования, описывающие дифференциальную экспрессию ге-
Рис. 1. Трехиглая колюшка. Пресноводный морфотип. Вверху самка, внизу самец в брачном наряде
нов колюшки в тканях почек морской и пресноводной форм и при пересадке пресноводной формы в морскую воду [5], а также в мышцах, эпителиальной и костной тканях морских и пресноводных популяций колюшки при изучении пластичности экспрессии генов в ходе колонизации пресноводных мест обитания [6]. Кроме того, оценивали дифференциальную экспрессию генов G. aculeatus в тканях почки и селезенки озерных и речных особей при изучении иммунного ответа на паразитическую фауну [7].
Различия в экспрессии генов у морских и пресноводных форм достаточно широко изучают и на других объектах. Особенно удобны для этого диадромные рыбы, которые могут жить как в морской, так и в пресной воде, поскольку у них есть физиологические механизмы адаптации к воде разной солености. Кроме того, методом RNA-seq изучали глобальные изменения экспрессии генов у морских и пресноводных форм таких видов, как айю Plecoglossus altivelis [8], японский речной угорь Anguilla japonica [9], европейский угорь A. anguilla [10], тиляпия Oreochromis mossambicus [11, 12], фундулус гете-роклитус Fundulus heteroclitus [13], обыкновенный лаврак Dicentrarchus labrax [14], нерка Oncorhynchus nerka [15], арктический голец Salvelinus alpinus [16]. В большинстве случаев методом RNA-seq изменения экспрессии генов после изменения внешних условий изучали, используя жабры в качестве целевой ткани. Были выявлены категории онтологии генов (GO, Gene Ontology), которыми обогащены экспериментальные группы, предложены метаболические и биохимические пути, играющие важную роль в адаптации к изменениям осмотических условий. В частности показано, что при смене осмотических условий изменяется экспрессия генов, кодирующих белки-транспортеры и ионные каналы [12], генов, отвечающих за клеточный рост и пролиферацию,
апоптоз и молекулярный транспорт, синтез белков и энергетический обмен [9, 11, 13]. Отдельно хочется отметить активное участие в этом процессе транскрипционных факторов [15], что говорит об обширном эффекте смены осмотических условий на генную экспрессию.
Изучение экспрессии генов может пролить свет на такие фундаментальные проблемы генетики, как связь структуры и функций эукариотическо-го генома. Принято считать, что в эукариотическом геноме гены располагаются случайным образом, не образуя каких-либо функциональных кластеров, сходных с бактериальными оперонами. Однако существуют свидетельства ошибочности данного утверждения - статистический анализ полногеномных данных и данных транскрипционного анализа показал, что в геноме эукариот гены расположены не случайным образом, а организованы в совместно экспрес-сируемые кластеры [17, 18]. Более того, показано, что гены арктического гольца [16], ортологичные генам трехиглой колюшки, которые дифференциально экспрессируются в жабрах рыб из пресной и морской воды, располагаются друг к другу значимо ближе, чем при случайном расположении, что подтверждает гипотезу о кластерной организации эукариотическо-го генома. Однако эти данные было бы интересно сопоставить с экспрессией генов трехиглой колюшки.
В данной работе приведены результаты RNA-seq-анализа генов, экспрессируемых в жабрах морских и пресноводных особей трехиглой колюшки, определены гены, уровень экспрессии которых значимо отличается у этих двух форм. Мы использовали жабры в качестве целевой ткани, потому что они играют важную роль в водно-солевом обмене, а также их легко выделить, что уменьшает ошибки, связанные с отбором материалов для исследования. Определена геномная локализация дифференциально экспрес-сируемых генов. Для каждой хромосомы определено отношение межгенных расстояний таких генов к среднему по хромосоме. Проведен функциональный и Gene Ontology-анализ, определены биохимические пути, обогащенные найденными генами, полученные данные сравнили с данными, ранее опубликованными для других видов. Определено отношение дифференциально экспрессируемых генов к геномным «островкам дивергенции», участвующим в адаптации трехиглой колюшки к пресноводному обитанию [4].
ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬ
Образцы морской трехиглой колюшки (далее по тексту используется идентификатор - «M») были собраны в Белом море, близ Беломорской биологической станции МГУ им. Н.А. Перцова (ББС МГУ, пос. Приморский Мурманской области). Пресноводные
образцы (далее по тексту используется идентификатор - «F») собраны в оз. Машинное, недалеко от поселка Чкаловский, Лоухский район, Республика Карелия. Примерный возраст озера после опреснения составляет, согласно расположению над уровнем моря, 700 лет [4, 19]. В озере представлена только жилая пресноводная форма, так как ручей, вытекающий из озера и впадающий в море, заболочен и непроходим для анадромной колюшки. Кроме того, опасность ошибки сбора уменьшается благодаря значительным морфологическим отличиям морской и пресноводной форм [20]. Для синхронизации физиологического статуса образцов отбирали только самцов в брачном наряде.
Собранные образцы выдерживали в течение 4 сут каждый в своей воде в аквариумах на ББС, чтобы синхронизировать стрессовый фактор, который может отличаться в зависимости от разных условий лова. После этого выделяли жабры и фиксировали их в реагенте IntactRNA® («Евроген», Россия).
РНК из жаберных тканей G. aculeatus (по пять образцов из каждой экспериментальной группы) выделяли согласно стандартному протоколу с применением реагента TRIzol® (Invitrogen, США). Концентрацию РНК из каждого образца определяли с помощью прибора BioAnalyzer 2100 (RNA 6000 Nano Kit) (Agilent, США).
Для получения библиотек кДНК сначала на матрице РНК синтезировали кДНК с помощью набора реактивов Mint® («Евроген», Россия) согласно инструкциям фирмы. Затем, используя NEBNext Library Prep Kit for Illumina (NEB, Великобритания), приготовили 10 индексированных парно-концевых библиотек для секвенирования на анализаторах Illumina (Illumina, США). Концентрацию и степень чистоты библиотек определяли с помощью прибора Agilent Bioanalyzer 2100 (Agilent Technologies, США), после чего проводили секвенирование на Illumina HiSeq 1500 длиной 2 х 75 нуклеотидов.
Для выявления генов, дифференциально экспрес-сируемых в морских и пресноводных образцах трех-иглой колюшки, нуклеотидные чтения Illumina картировали на референсный геном G. aculeatus из базы данных Ensembl (BROAD S1, Feb 2006, assembly 81; http://www.ensembl.org) [21], используя программный пакет bowtie2 [22] с набором параметров -very-sensitive-local. В итоге получили файлы формата SAM (Sequence Alignment/Map) [23], которые подвергли дальнейшему процессингу (компрессия, сортировка, индексирование) с помощью пакета SAMtools [23, 24]. Относительную активность каждого гена определяли согласно покрытию этого гена нуклеотидными чтениями на референсном геноме после картирования каждой библиотеки. Покрытие
определяли с помощью утилиты coverageBed из программного пакета bedtools [25], используя bed-файл с координатами генов из Ensembl и индексированный bam-файл, полученный в результате картирования нуклеотидных чтений. Данные картирования для каждой библиотеки собирали в единую таблицу с помощью perl-скрипта. Статистический анализ дифференциальной экспрессии проводили с помощью пакета edgeR [26] среды для статистических вычислений R (http://www.r-progect.org).
Анализ генных онтологий (GO - Gene Ontology) и анализ биохимических путей проводили с помощью программы PANTHER (Protein Annotation through Evolutionary Rela-tionships) (http://pantherdb.org) [27], предварительно переведя Ensembl ID генов колюшки в ортологичные гены человека с помощью BioMart Ensembl service, поскольку эта программа не использует геном трехиглой колюшки в качестве референсного для поиска обогащенных категорий GO. Данная утилита использует библиотеки GO PANTHER, основанные на моделях, использующих алгоритм скрытых марковских цепей выявления обогащенных категорий. При этом используются как «полные», так и сокращенные GO slim-категории.
Межгенные расстояния для полного набора генов трехиглой колюшки сравнивали с расстояниями между генами, ответственными за осморегуляцию, используя perl-скрипт. Используя координаты генов на каждой хромосоме (указаны в bed-файлах из ftp-сервера Ensembl), измеряли расстояние от каждого гена до всех остальных генов данной хромосомы, и так для всех генов генома, получая массив межгенных расстояний в нуклеотидах. Аналогичную процедуру проводили только для тех генов, которые дифференциально экспрессировались в жабрах морских и пресноводных особей. Два полученных массива мы передавали в функцию t.test среды для статистических вычислений R, получая показатели различия двух массивов.
Работа выполнена с использованием оборудования Центра коллективного пользования «Комплекс моделирования и обработки данных исследовательских установок мегакласса» НИЦ «Курчатовский институт», http://ckp.nrcki.ru.
РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ
Первоначально для изучения дифференциальной экспрессии нами было отобрано по пять образцов колюшки из морской и пресноводной популяций, однако при приготовлении библиотек кДНК два образца (по одному из каждой популяции) имели низкое качество и были исключены из последующего анализа. Таким образом, получены по четыре кДНК-библиотеки, пригодные для секвенирования на платформе Illumina.
Таблица 1. Количество нуклеотидных чтений Illumina*
Библиотека Количество кластеров Количество нуклеотидных чтений Нуклеотидные чтения, картированные на гены Всего для морских и пресноводных особей
произведено картировано
M2 10566712 21133424 17993109 85438630 74093974
M3 10577457 21154914 18161521
M4 10262893 20525786 18489001
М5 11312253 22624506 19450343
F1 13523593 27047186 24692145 110690898 103570453
F2 15715663 31431326 28960967
F4 13359490 26718980 26307475
F5 12746703 25493406 23609866
'Приведено количество нуклеотидных чтений, полученных в результате RNA-seq, для каждой библиотеки и суммарно для морских и пресноводных образцов.
Общее количество чтений длиной 75 нуклеотидов каждое составило 85438630 и 110690898 в библиотеках из морских и пресноводных образцов соответственно. Нуклеотидные чтения (всего 177664427) картировали на гены, аннотированные в геноме G. aculeatus, из базы данных Ensembl. Информация о количестве нуклеотидных чтений, полученных в результате эксперимента, и статистике картирования приведена в табл. 1.
После картирования данных на геном G. aculeatus подсчитывали нуклеотидные чтения, картированные на каждый из аннотированных генов трехиглой колюшки и нормировали активность каждого гена с помощью пакета edgeR.
С использованием данных по покрытию аннотированных генов был построен MDS (Multi Dimensional Scaling) график, на котором расположение образцов соответствует различиям в экспрессии их генов. Выявлены ощутимые различия в экспрессии генов в морских и пресноводных образцах колюшки. Вместе с тем, образцы каждой группы образуют достаточно тесный кластер (за исключением морского образца M4), что указывает на хорошую синхронизацию физиологических процессов между изучаемыми образцами (рис. 2).
Дифференциальную экспрессию определяли с помощью пакета edgeR [26], который вычисляет дисперсию показателя экспрессии для каждого гена. Дифференциально экспрессируемыми считали гены, величина активности которых отклоняется от среднего значительно больше величины дисперсии. При вычислении дифференциальной экспрессии также имеет значение степень активности гена - для слабо экспрессируемых генов отклонение от среднего должно быть выше, чтобы раз-
о
rs
о
а л а к
3
un о
о о
un о
о
Шкала 1
Рис. 2. MDS-график, построенный по результатам анализа экспрессии аннотированных генов морских и пресноводных особей трехиглой колюшки. Морские образцы обозначены черным цветом (М), пресноводные - красным Индексы соответствуют номерам библиотек
ница в экспрессии признавалась достоверной. Рис. 3 иллюстрирует вышесказанное - дифференциально экспрессируемым (красные точки) считали ген, экспрессия которого не только значительно отклонялась от среднего значения, но и наблюдался ее достаточно высокий уровень.
Таблица 2. Гены, экспрессия которых наиболее существенно различается у морской и пресноводной форм трехиглой колюшки
Ensembl gene ID logFC logCPM P-value FDR
ENSGACG00000013714 -4.193912 10.693346 2.116876e-51 4.753656e-47
ENSGACG00000011986 -5.259545 11.215562 6.575861e-51 7.383376e-47
ENSGACG00000001275 3.860307 6.117474 2.371864e-46 1.775419e-42
ENSGACG00000014967 4.253744 6.943885 6.017277e-41 3.378099e-37
ENSGACG00000018764 -4.056880 9.038716 2.477170e-40 1.112547e-36
ENSGACG00000014959 4.706814 5.650018 7.523387e-40 2.815753e-36
ENSGACG00000003404 -4.617256 8.036567 5.344099e-37 1.714387e-33
ENSGACG00000001373 3.762800 5.512202 4.071101e-35 1.061745e-31
ENSGACG00000019813 5.816259 4.613614 4.255301e-35 1.061745e-31
ENSGACG00000014691 4.449242 4.901331 9.436192e-35 2.118991e-31
Примечание. logFC - двоичный логарифм разницы в экспрессии, logCPM - показатель глубины покрытия гена (count per million), P-value - значение разности экспрессии, FDR (false discovery rate) - значение Р, нормализованное на множественное тестирование.
генов и 1678 у пресноводной формы. В табл. 2 представлены 10 генов, экспрессия которых наиболее отличается у особей разных экотипов.
На рис. 4 в графическом виде представлены результаты дифференциального анализа 50 генов, уровень экспрессии которых наиболее существенно различается в экспериментальных группах трехиглой колюшки. Показано (как и в случае MDS-графика), что морские и пресноводные особи достаточно сильно различаются по уровню экспрессии некоторых генов (судя по кластеризации образцов вверху рисунка). Более того, среди 50 проанализированных генов преобладают гены, экспрессия которых повышена в морских образцах.
Результаты функционального анализа приведены на рис. 5. Гены, обогащенные среди UP-экспрессированных («переэкспрессированных») в жабрах морской колюшки, отклонены вправо от начала координат, тогда как DOWN-экспрес-сированные - влево. UP- и DOWN-экспресси-рованные гены можно интерпретировать как морские и пресноводные соответственно. Кроме того, среди дифференциально экспрессируемых морских генов статистически значимо повышено количество генов, относящихся к категориям, связанным с трансмембранными функциями и цитоскелетом, например, такие категории, как с активностью ионных и анионных каналов, трансмембранных транспортеров, субстрат-специфической трансмембранной транспортной активностью и другими категориями, связанными с мембранами. Это вполне логично и объясняется тем, что для поддержания внутриклеточного гомеостаза в разных осмотических условиях необходима значительная активность трансмембранных систем. Среди генов, экспрессия которых повышена у пресновод-
U
LL
ГО О
/
• //*■'':.-Ù Ä'ij.TSj-LiliiTW
0 5 10
Групповое среднее logCPM
15
Рис. 3. Дифференциально экспрессируемые гены трехиглой колюшки. Показана зависимость уровня экспрессии (logCPM - logarithm of count per million) от отклонения уровня экспрессии от среднего значения (logFC - logarithm of fold change). Здесь оба логарифма по основанию 2. Красными точками отмечены гены, активность которых статистически значимо различается у морских и пресноводных особей
При сравнении образцов морских и пресноводных особей выявлено статистически значимое отличие в экспрессии 2982 из 22456 аннотированных генов G. aculeatus (уровень значимости 95%). При этом у морских колюшек была повышена экспрессия 1304
ENSGACG00000002446 ENSGACG00000011548 ENSGACG00000007018 ENSGACG00000001741 ENSGACG00000014959 ENSGACG00000020323 ENSGACG00000013355 ENSGACG00000000757 ENSGACG00000007331 ENSGACG00000001275 ENSGACG00000007569 ENSGACG00000002451 ENSGACG00000005711 ENSGACG00000005712 ENSGACG00000013567 ENSGACG00000016741 ENSGACG00000013426 ENSGACG00000008073 ENSGACG00000019927 ENSGACG00000002336 ENSGACG00000003845 ENSGACG00000015842 ENSGACG00000011747 ENSGACG00000001596 ENSGACG00000005001 ENSGACG00000002049 ENSGACG00000010725 ENSGACG00000000730 ENSGACG00000002658 ENSGACG00000007730 ENSGACG00000013724 ENSGACG00000012477 ENSGACG00000018566 ENSGACG00000009244 ENSGACG00000015981 ENSGACG00000011728 ENSGACG00000019813 ENSGACG00000013333 ENSGACG00000006322 ENSGACG00000014691 ENSGACG00000001373 ENSGACG00000012346 ENSGACG00000014967 ENSGACG00000010315 ENSGACG00000018764 ENSGACG00000004882 ENSGACG00000003404 ENSGACG00000011986 ENSGACG00000013714 ENSGACG00000009412
Рис. 4. Heatmap 50 дифференциальных генов. В качестве показателей экспрессии использованы нормализованные данные экспрессии генов CPM (count per million). Красный цвет - повышенная экспрессия, желтый - пониженная. В строках гены, в столбцах образцы (М - морские, F - пресноводные). Дополнительно проведена кластеризация как образцов, так и генов. Видны различия в кластеризации морских и пресноводных образцов
ных особей, много генов, относящихся к категориям, связанным с клеточным циклом - репликацией ДНК, митозом, сегрегацией хромосом, а также с категориями, связанными с внутриклеточным транспортом и микротрубочками. Различия в процессах клеточного деления могут быть связаны с разной скоростью развития колюшки в море и в пресной воде, что, в свою очередь, может определяться температурным режимом. Однако этот феномен требует дальнейшего изучения и объяснения.
Среди дифференциально экспрессируемых генов морской формы повышено содержание генов, связанных с мышечной активностью, что можно объяснить, например, необходимостью морских самцов колюшки перед брачным сезоном мигрировать к побережью, где происходит нерест, тогда как у пресноводных форм такой необходимости нет, так как нерест у них происходит непосредственно в месте обитания. Различия в иммунных процессах у двух форм колюшки, по-видимому, могут быть связаны с раз-
Таблица 3. Межгенные расстояния для всех генов трехиглой колюшки и дифференциально экспрессируемых генов*
Хромосома Длина, п.н. согласно ЕтетЫ Число генов Количество дифференциально экспрессируемых генов Среднее межгенное расстояние, п.н. Среднее между дифференциально экспрессируемыми генами, п.н. Р-значение**
groupI 28185914 1647 150 9760533 10405738 < 2.2е-16
groupП 23295652 1158 113 7517040 7507226 0.8372
groupШ 16798506 1226 104 5325760 5764740 < 2.2е-16
groupIV 32632948 1719 171 11075843 10983967 0.04622
groupV 12251397 980 128 4198998 4022731 1.14е-13
groupVI 17083675 965 93 5605389 5223090 < 2.2е-16
groupVII 27937443 1726 183 9642342 10137264 < 2.2е-16
groupVШ 19368704 1177 128 6508569 6477095 0.387
groupIX 20249479 1374 149 6868532 6267635 < 2.2е-16
groupX 15657440 1050 107 5286434 5883914 < 2.2е-16
groupXI 16706052 1344 185 5543259 5455211 4.402е-05
groupXII 18401067 1301 116 6049383 6006811 0.2558
groupXШ 20083130 1303 137 6640756 6646041 0.8806
groupXIV 15246461 984 94 5118033 5192484 0.06052
groupXV 16198764 1026 114 5102727 5321175 2.422е-10
groupXVI 18115788 1063 97 5635724 5357195 6.306е-12
groupXVП 14603141 929 93 4897567 4834424 0.08998
groupXVШ 16282716 1020 101 5251120 4896094 < 2.2е-16
groupXIX 20240660 1373 132 6414729 6790731 < 2.2е-16
groupXX 19732071 1259 113 5868160 5362585 < 2.2е-16
groupXXI 11717487 599 71 3488145 2936194 < 2.2е-16
*Анализ проведен для каждой хромосомы отдельно.
**Указан показатель статистической значимости разницы межгенных расстояний.
личиями в пресноводной и морской паразитической фауне, поражающей колюшку [28].
Полученные нами результаты довольно слабо соответствовали данным для других видов рыб [9, 11-13, 15]. Связано ли это с методическими особенностями функционального анализа списков генов или действительно разные виды по-разному адаптируются к солевым условиям? Этот вопрос остается открытым и требует более углубленных исследований. Однако есть свидетельства в пользу того, что ответ на изменение осмотических условий может быть индивидуальным. Например, исследование изменений генной экспрессии в жабрах двух родственных линий арктического гольца (£. alpinus) позволило обнаружить 1045 и 1544 генов дифференциально экспрессирующихся в каждой из этих линий соответственно [16]. При этом общими были лишь 257 генов, т.е. менее чем у четверти генов, реагирующих на изменение осмотических условий, экспрессия изменяется сходным образом. И это у представителей одного вида!
Согласно определению межгенных расстояний для полного набора генов трехиглой колюшки и расстояний между генами, участвующими в осмо-регуляции, распределение дифференциально экс-прессируемых генов по хромосоме действительно неслучайно. Так, только у семи из 21 хромосомы трехиглой колюшки расстояния между генами, регуляция которых изменяется при смене осмотических условий, статистически не отличаются от межгенных расстояний для других генов (табл. 3). Это подтверждает гипотезу о том, что гены в эукариоти-ческом геноме распределены не случайно, а объединены в совместно экспрессируемые кластеры [17, 18]. Этот результат свидетельствует в пользу того, что мы до сих пор мало знаем об устройстве эукари-отического генома.
Опубликованные ранее результаты поиска одно-нуклеотидных полиморфизмов в геноме трехиглой колюшки, ассоциированных с морской и пресноводной формами [3, 4], показали, что подобные полиморфизмы преимущественно локализуются на не-
PANTHER-категории биологических процессов Мышечные сокращения Кальцевая передача сигнала Внутриклеточная передача сигнала Передача сигнала Клеточные взаимодействия Клеточные процессы Клеточная адгезия Биологическая адгезия Фосфатсодержащие комплексы ...
Иммунные процессы Процессы развития ДНК-репликация Первичные метаболические процессы Метаболические процессы Хромосомная сегрегация Полисахаридные метаболические процессы Митоз Клеточный цикл Катаболические процессы Азотные метаболические процессы
PANTHER-категории клеточных компонентов Цитоскелетный актин Плазматическая мембрана Клеточные структуры Внутриклеточные Макромолекулярный комплекс Межклеточные Клеточные структуры
PANTHER-категории молекулярных функций Функционирование анионных каналов Функционирование ионных каналов Трансмембранный транспорт Транспортная активность Актин-связывание Цитоскелетное белок-связывание Белок-связывание Структурные части цитоскелета Структурная молекулярная активность Киназная активность Каталитическая активность Двигательная активность микротрубочек Каталитическая активность Трансферазная активность
PANTHER-белковые категории Актинсвязывающие двигательные белки Цитоскелетные белки семейства актинов Цитоскелетные белки I Э-белковые модуляторы
Киназы
Двигательные белки, ассоциированные с микротрубочками Трансферазы
-8 -6 -4 -2 0 2 4
-6 -4 -2
6 8
ЭО-молекулярные функции Мышечные структурные компоненты Рецепторы стероидных гормонов Связывание гормонов Связывание Диоксигеназная активность Каталитическая активность Актин-связывание Цитоскелетное протеин-связывание Протеин-связывание Ионный трансмембранный транспорт Субстрат-специфичный трансмембранный транспорт Субстрат-специфичная транспортная активность Транспорт
Трансмембранная транспортная активность Киназная активность Ферментное связывание Глюкозное связывание Связывание
Двигательная активность микротрубочек Каталитическая активность Связывание микротрубочек Тубулин-связывание Протеин-связывание Связывание кофакторов Поли(А)РНК-связывание РНК-связывание
-10
6 8
-6 -4
-2
-6 -4 -2 0 2 4 6 8 10
Отрицательный десятичный логарифм Р-значения
-8 -6 -4 -2 0
Отрицательный десятичный логарифм Р
2 4
значения
6 8
0
2
4
6
8
0
2
4
Рис. 5. Обогащение различными ЭО-категориями списка генов, дифференциально экспрессируемых в жаберных тканях морской и пресноводной трехиглой колюшки. Увеличенная экспрессия генов конкретной функциональной категории в группе морских колюшек по отношению к пресноводным означает отклонение отрицательного десятичного логарифма Р-значения в положительную сторону. Название базы данных определенных ЭО-категорий указано в левом верхнем углу каждого бокса
больших участках генома, названных «островками дивергенции». Мы сопоставили локализацию выявленных нами дифференциально экспрессируемых генов с положением островков дивергенции, участвующих в адаптации колюшки к обитанию в пресной воде. Из 2982 дифференциально экспрессируемых генов 28 находятся в островках адаптивной дивергенции, что значительно превышает количество случайных совпадений. Всего в островках дивергенции находятся 212 из 29245 аннотированных генов трех-
иглой колюшки (согласно тесту Пуассона Р-значение равно 0.0001). Этот факт представляется вполне закономерным, поскольку если в определенных локу-сах находятся однонуклеотидные полиморфизмы, которые отличаются у морских и пресноводных образцов трехиглой колюшки, то логично предположить, что в этих локусах с большой вероятностью будет отличаться и экспрессия генов, хотя бы потому, что часть полиморфизмов может находиться в регуляторных элементах генов.
ЗАКЛЮЧЕНИЕ
Суммируя результаты, приведенные в нашей работе, можно отметить, что применение современных методов параллельного секвенирования для определения активности генной экспрессии позволяет определить массив генов и спектр механизмов, вовлеченных в исследуемый процесс. На примере устойчивости трехиглой колюшки к изменению осмотических условий показано, что гены, экспрессия которых меняется при осмотическом ответе, активно участвуют в таких процессах, как регуляция клеточного цикла, мембранный транспорт, иммунитет, мышечные сокращения и т.д. Вместе с тем, сравнение обогащенных категорий дифференциально экспрессированных генов с результатами, полученными ранее на других объектах, показало невысокую универсальность молекулярных механизмов приспособления к смене условий обитания. Этот феномен требует дальнейшего исследования.
Авторы выражают свою признательность сотрудникам Всероссийского научно-исследовательского института рыбного хозяйства и океанографии (ВНИРО) Н.С. Мюге и А.Е. Барминцевой за помощь в сборе образцов, обсуждение результатов и предоставленную фотографию исследуемого объекта (рис. 1). Отдельная благодарность сотрудникам Института биологии внутренних вод им. И.Д. Папанина РАН Б.А. Левину и А.А. Болотовскому за помощь в сборе материала на озере Машинное.
Работа поддержана грантами РФФИ (№ 14-04-01237) - сбор образцов, анализ данных; РНФ (№ 14-24-00175) - приготовление и секвенирование кДНК-библиотек. Функциональный анализ генов поддержан бюджетным проектом (№ 0324-2018-0017).
СПИСОК ЛИТЕРАТУРЫ
1. Hagen D., Gilbertson L. // Evolution. 1972. V. 26. P. 32-51.
2. Hohenlohe P.A., Bassham S., Currey M.C., Cresko W.A. // Philos. Transact. Royal Soc. B. 2012. V. 367. P. 395-408.
3. Jones F.C., Grabherr M.G., Chan Y.F., Russell P., Mauceli E., Johnson J., Swofford R., Pirun M., Zody M.C., White S., et al. // Nature. 2012. V. 484. P. 55-61.
4. Terekhanova N., Logacheva M., Penin A., Neretina T., Barmintseva A., Bazykin G., Kondrashov A., Mugue N. // PLoS Genet. 2014. V. 10. № 10. e1004696.
5. Wang G., Yang E., Smith K.J., Zeng Y., Ji G., Connon R., Fangue N.A., Cai J.J. // Front. Genet. 2014. V. 5. P. 312.
6. Morris M.R.J., Richard R., Leder E.H., Barrett R.D.H., Aubin-Horth N., Rogers S.M. // Mol. Ecol. 2014. V. 23. P. 3226-3240.
7. Huang Y., Chain F.J.J., Panchal M., Eizaguirre C., Kalbe M., Lenz T.L., Samonte I.E., Stoll M., Bornberg-Bauer E., Reusch T.B.H., et al. // Mol. Ecol. 2016. V. 25. P. 943-958.
8. Lu X.-J., Zhang H., Yang G.-J., Li M.-Y., Chen J. // Dongwuxue Yanjiu. 2016. V. 37. № 3. P. 126-135.
9. Lai K.P., Li J.-W., Gu J., Chan T.-F., Tse W.K.F., Wong C.K.C. // BMC Genomics. 2015. V. 16. P. 1072.
10. Kalujnaia S., McWilliam I.S., Zaguinaiko V.A., Feilen A.L., Nicholson J., Hazon N., Cutler C.P., Cramb G. // Physiol. Genomics. 2007. V. 31. P. 385-401.
11. Lam S.H., Lui E.Y., Li Z., Cai S., Sung W.-K., Mathavan S., Lam T.J., Ip Y.K. // BMC Genomics. 2014. V. 15. P. 921.
12. Ronkin D., Seroussi E., Nitzan T., Doron-Faigenboim A., Cnaani A. // Comp. Biochem. Physiol. Part D: Genomics and Proteomics. 2015. V. 13. P. 35-43.
13. Whitehead A., Roach J.L., Zhang S., Galvez F. // J. Exp. Biol. 2012. V. 215. P. 1293-1305.
14. Boutet I., Long Ky C.L., Bonhomme F. // Gene. 2006. V. 379. P. 40-50.
15. Evans T.G., Hammill E., Kaukinen K., Schulze A.D., Patterson D.A., English K.K., Curtis J.M.R., Miller K.M. // Mol. Ecol. 2011. V. 20. P. 4472-4489.
16. Norman J.D., Ferguson M.M., Danzmann R.G. // J. Exp. Biol. 2014. V. 217. P. 4029-4042.
17. Hurst L.D., Pal C., Lercher M.J. // Nat. Rev. Genet. 2004. V. 5. P. 299-310.
18. Ng Y.K., Wu W., Zhang L. // BMC Genomics. 2009. V. 10. P. 42.
19. Kolka V.V., Korsakova O.P. // Proc. MSTU. 2005. V. 15. P. 349-356.
20. McKinnon J.S., Rundle H.D. // Trends Ecol. Evol. 2002. V. 17. P. 480-488.
21. Cunningham F., Amode M.R., Barrell D., Beal K., Billis K., Brent S., Carvalho-Silva D., Clapham P., Coates G., Fitzgerald S., et al. // Nucl. Acids Res. 2015. V. 43. D662-669.
22. Langmead B., Salzberg S.L. // Nat. Meth. 2012. V. 9. P. 357-359.
23. Li H., Handsaker B., Wysoker A., Fennell T., Ruan J., Homer N., Marth G., Abecasis G., Durbin R. // Bioinformatics. 2009. V. 25. P. 2078-2079.
24. Li H. // Bioinformatics. 2011. V. 27. P. 2987-2993.
25. Quinlan A.R., Hall I.M. // Bioinformatics. 2010. V. 26. P. 841-842.
26. Robinson M.D., McCarthy D.J., Smyth G.K. // Bioinformatics. 2010. V. 26. P. 139-140.
27. Nesvizhskii A.I., Keller A., Kolker E., Aebersold R. // Anal. Chem. 2003. V. 75. P. 4646-4658.
28. Scharsack J.P., Franke F., Erin N.I., Kuske A., Büscher J., Stolz H., Samonte I.E., Kurtz J., Kalbe M. // Zoology (Jena). 2016. V. 119. № 4. P. 375-383.