БИОИНФОРМАТИК А
УДК 57.084.1:577.171
Б01 10.25205/1818-7900-2018-16-3-7-21
А. О. Брагин К. А. Табанюхов 1 2, И. В. Чадаева 1 3, А. В. Цуканов 1 3 Р. О. Бабенко 3, И. В. Медведева \ А. Г. Богомолов 1 3 В. Н. Бабенко 1 3, Ю. Л. Орлов 1 3
1 Институт цитологии и генетики СО РАН пр. Академика Лаврентьева, 10, Новосибирск, 630090, Россия
2 Новосибирский государственный аграрный университет ул. Добролюбова, 160, Новосибирск, 630039, Россия
3 Новосибирский государственный университет ул. Пирогова, 2, Новосибирск, 630090, Россия
[email protected],[email protected], [email protected]
КОМПЬЮТЕРНАЯ БАЗА ДАННЫХ ДЛЯ АНАЛИЗА ДИФФЕРЕНЦИАЛЬНО ЭКСПРЕССИРУЮЩИХСЯ ГЕНОВ, СВЯЗАННЫХ С АГРЕССИВНЫМ ПОВЕДЕНИЕМ, НА МОДЕЛЯХ ЛАБОРАТОРНЫХ ЖИВОТНЫХ *
Разработка и применение компьютерных средств анализа транскриптомных данных в модельных организмах животных представляет актуальную задачу биоинформатики. Задача исследования экспрессии генов современными методами высокопроизводительного секвенирования в отделах мозга лабораторных животных является исключительно важной для изучения генетических основ поведения в целом. Изучение генетических детерминант агрессивного поведения не только сохраняет актуальность для исследования молекулярных механизмов регуляции поведения, но и имеет широкую практическую составляющую при работе с животными, для решения задач агробиологии. Наследственная предрасположенность животных к агрессивному поведению приводит к появлению различий в строении головного мозга, и сравнение таких различий позволит найти как общие, так и специфичные механизмы регуляции поведения, способствующие проявлению агрессии в провоцирующих условиях среды. Представлены компьютерные программы анализа сплайсинга и прототип базы данных экспрессии генов в отделах мозга лабораторных животных - серых крыс, селектированных по проявлению агрессивного поведения. Выполнена функциональная аннотация генов с повышенной и пониженной экспрессией в экспериментах на крысах, рассмотрены варианты изоформ и альтернативного сплайсинга этих генов.
Ключевые слова: биоинформатика, транскриптомика, сплайсинг, дифференциальная экспрессия, лабораторные животные, генные онтологии, поведение, база данных.
* Работа А. О. Брагина и И. В. Чадаевой поддержана РФФИ (проект № 18-34-00496 мол_а). Экспериментальные работы и выполнение транскриптомного секвенирования были поддержаны РНФ в 2014-2016 гг. Работа с лабораторными животными поддержана грантом Минобрнауки РФ (№ RFMEFI62117X0015). Работа Ю. Л. Орлова была поддержана проектом Министерства образования РФ № 28.12487.2018/12.1.
Авторы благодарны А. Л. Маркелю, Р. В. Кожемякиной и С. С. Ковалеву за помощь в работе, предоставление экспериментальных данных и научные консультации по базе данных.
Брагин А. О., Табанюхов К. А., Чадаева И. В., Цуканов А. В., Бабенко Р. О., Медведева И. В., Богомолов А. Г., Бабенко В. Н., Орлов Ю. Л. Компьютерная база данных для анализа дифференциально экспрессирующихся генов, связанных с агрессивным поведением, на моделях лабораторных животных // Вестн. НГУ. Серия: Информационные технологии. 2018. Т. 16, № 3. С. 7-21.
ISSN 1818-7900. Вестник ИГУ. Серия: Информационные технологии. 2018. Том 16, № 3 © А. О. Брагин, К. А. Табанюхов, И. В. Чадаева, А. В. Цуканов, Р. О. Бабенко, И. В. Медведева, А. Г. Богомолов, В. И. Бабенко, Ю. Л. Орлов, 2018
Введение
Задача исследования экспрессии генов на основе современных методов высокопроизводительного секвенирования в отделах мозга лабораторных животных является исключительно важной для исследования генетических основ поведения в целом, в том числе агрессивного поведения. Несмотря на огромный научный интерес, направленный на изучение различных психофизиологических механизмов, регулирующих поведение, многие механизмы, отвечающие за проявление агрессии, до сих пор мало изучены [1]. Агрессия - это активная негативная реакция организма на различные проявления внешней среды, один из механизмов борьбы за выживание, в то время как ручное, толерантное, в том числе к человеку, поведение являлось одним из главных направлений искусственного отбора животных в ходе их доместикации, или одомашнивания. Эти вопросы поднимались еще академиком Д. К. Беляевым, основавшим целое направление генетики; по результатам работ проведена «Беляевская конференция - 2017», где широко обсуждались вопросы селекции животных [2]. Исследование основ агрессивного и толерантного поведения при совместном содержании животных может быть применено для практических работ по звероводству, а также служит основой биомедицинских исследований.
Изучение генетических детерминант агрессивного поведения в целом не только сохраняет актуальность в современном мире, но и имеет широкую практическую составляющую при работе с животными, в том числе в пушном звероводстве. На различных моделях животных (см., например, [3]) было показано, что одним из возможных последствий отбора по поведению является изменение ряда фенотипических признаков, в том числе окраса шерсти, что важно для исследования сельскохозяйственных животных, в частности норок и лис в пушном звероводстве. Выявление детерминант поведения важно и для животных мясных пород. Наследственная предрасположенность животных к агрессивному поведению приводит к появлению различий в строении головного мозга, и сравнение таких различий позволит найти как общие, так и специфичные механизмы регуляции поведения, способствующие проявлению агрессии в провоцирующих условиях среды.
Модельные линии крыс являются удобными объектами для анализа факторов, которые влияют на поведение животных. Применение современных технологий высокопроизводительного секвенирования ДНК при работе с моделями лабораторных животных позволяет провести комплексное молекулярно-генетическое и физиологическое исследование [1; 4; 5]. Селекция серых крыс, которая более 30 лет проводится в Институте цитологии и генетики СО РАН (ИЦиГ СО РАН), создает уникальную основу для анализа генетических детерминант поведения. Для анализа генетических основ агрессивного поведения в ИЦиГ СО РАН были выведены две линии серых крыс, Rattus norvégiens. Обе линии крыс в течение около 70 поколений селектировались по поведению по отношению к человеку (тест на перчатку -когда рука исследователя в защитной перчатке касается животного в клетке, с последующей видеофиксацией и численной оценкой поведения в баллах). В одну из этих линий в ходе селекции отбирали крыс по дружелюбному поведению по отношению к человеку и другим животным, в другую линию - крыс по агрессивному поведению, оцениваемому по количественной шкале.
Использование в исследованиях нескольких отделов мозга крыс вместе с применением секвенирования транскриптома позволило выявить ряд дифференциально экспрессирующих-ся генов у агрессивных и ручных (неагрессивных) крыс [4]. В данной работе уточнены механизмы действия генов, представлена кластеризация и компьютерная база данных генов крысы с дифференциальной экспрессией.
Экспериментальная часть исследования включала измерение уровней экспрессии с использованием ПЦР в реальном времени и на основе транскриптомного секвенирования. Проведена оценка экспрессии генов белков, связанных с работой дофамина и серотонина, в вентральной тегментальной области (ВТО) мозга таких крыс на основе РНК-профилирования. Были обнаружены значимые различия в экспрессии генов Th, Ddc, Drd2, Tph2, Htrla, Htrlb, Htr5b, а также дофаминового (Slc6a3) и серотонинового (Slc6a4) транспортеров между агрессивными и неагрессивными крысами.
Согласно статье [4], был проведен сравнительный транскриптомный анализ РНК из трех отделов мозга агрессивных и неагрессивных (ручных) крыс. В результате определены различия альтернативного сплайсинга некоторых генов синаптической регуляции, в том числе гена глутаматного ионотропного синапса Grini. Было получено достоверное различие между пропорциями определенных изоформ транскриптов в нескольких генах, связанных с функционированием синапса, что исследователи связывают с особенностями поведения подопытных животных. Показано значение ферментов, усиливающих действие сплайсинга и приводящих к изменениям структуры РНК (энхансеры NOVA1/2, FOX1/2, nSR100/SRM4), а также веществ, обладающих противоположным эффектом (сайленсеры PTB1, PTB2) [4].
Материалы и методы
Эксперименты выполнены на самцах серых крыс (Rattus norvégiens), прошедших селекцию на агрессивность («агрессивные» n = 10) и на прирученность («ручные» n = 12). Все крысы содержались в стандартных условиях вивария ИЦиГ СО РАН. Все манипуляции с крысами проводились в соответствии с международными правилами работы с экспериментальными животными.
РНК-секвенирование образцов осуществлялось на платформе Illumina с использованием протокола NEBNext mRNA Library PrepReagent Set for Illumina (NEB, USA). Библиотеки данных РНК-секвенирования крыс находятся в открытом доступе на сайте The European Nucleotide Archive 1 под индексом ERP011250.
В работе использовали 12 образцов нервной ткани: образцы (2 повтора) из 3-х отделов головного мозга агрессивных и ручных крыс - гипоталамус, покрышка среднего мозга (ПСМ) и периакведуктум серого вещества (ПСВ). Для каждой линии крыс анализировали по два повтора. Были рассмотрены гены, где отличия значения экспрессии (fragments per kilobase of transcript per million mapped reads - FPKM) реплик определенного отдела мозга не превышали стандартного отклонения экспрессии, вычисленного по всем 12 образцам.
Метод RNA-Seq является мощным инструментом, позволяющим определить активность генов в изучаемом образце. В данном исследовании образцами являлись ткани разных отделов головного мозга крыс (гипоталамус, покрышка среднего мозга и периакведуктальное серое вещество). Образцы нервной ткани головного мозга крыс обеих линий были изъяты в соответствии со специализированной картой, представленной в Allen Mouse Brain Atlas 2. После препарирования образцы тканей мозга крыс обрабатывались в компании «Геноанали-тика» (Москва), где мРНК были экстрагированы с использованием Dynabeads mRNA Purification Kit (Ambion). Библиотеки кДНК были получены с помощью инструментального набора Illumina (США) в соответствии с протоколом производителя и направлены на секве-нирование.
Параметры компьютерной фильтрации прочтений ДНК и картирования библиотек РНК-секвенирования крыс представлены в табл. 1.
Таблица 1
Статистика ридов библиотек РНК-секвенирования агрессивных и неагрессивных крыс
Номер животного в эксперименте Линия крыс Число ридов, млн
изначально после фильтрации картированных
2 неагрессивные 22,97 17,51 16,6
5 неагрессивные 22,01 17,13 16,32
8 агрессивные 22,5 17,33 16,56
11 агрессивные 20,15 15,41 14,68
1 http://www.ebi.ac.uk/ena/.
2 http: //mouse.brain-map.org/static/atlas/.
Как можно видеть из табл. 1, изначально в библиотеках было по 20-22 млн прочтений ДНК (ридов). После фильтрации программой Trimmomatic было удалено около 23 % ридов. Из оставшихся после фильтрации ридов около 95 % было картировано на референсный геном крысы.
Компьютерные программы
Оценка экспрессии генов
Проведен анализ экспрессии генов крыс. Для компьютерного анализа данных РНК-сек-венирования мозга крыс был задействован суперкомпьютер ССКЦ СО РАН. Фильтрованные программой Trimmomatic [6] чтения картировались программой TopHat2 [6] на референсный геном RGSC Rnor_5.0\rn5 с последующей оценкой экспрессии программой Cufflinks [8]. Уровень экспрессии генов оценивался в FPKM, что позволяет учитывать длину генов и общее количество картированных чтений ДНК. Индексы генов анализируемых белков, взаимодействующих с серотонином и дофаминов, брались из баз данных KEGG [9] и RefSeq [10].
Для обработки конечных данных секвенирования были применены программы TopHat2 (картирование на геном крысы) и Cufflinks (расчет уровней экспрессии генов) [8]. По данным экспрессии были определены дифференциально экспрессирующиеся гены.
Разработан и применен конвейер по обработке данных РНК-секвенирования образцов клеток мозга (рис. 1). Проводится оценка экспрессии генов и выявление случаев дифференциальной экспрессии между анализируемыми образцами при помощи программ Cufflinks, согласно методике, рекомендованной авторами.
Trimmomatic
TopHat
Cufflinks
MATs
rMATs
PANTHER
GeneGO
Рис. 1. Компьютерный конвейер анализа данных
Составление списков геномных мутаций проводилось Samtools [11]. Случаи альтернативного сплайсинга предсказывались программой rMATS, согласно приведенной на сайте программы инструкции [12]. Проводился поиск сверхпредставленных терминов генных он-тологий (GO) интернет-ресурсом DAVID 3 и GOseq по спискам дифференциально экспресси-рующихся генов. Полученные списки генов, сравнивались со списками генов, связанных с агрессивностью, из литературы.
Конвейер реализован на языке программирования Bash под ОС Linux Redhat, использует многопоточность. На вход конвейера подаются данные секвенирования в формате fastq. Результат представляет собой набор файлов со следующей информацией: экспрессия генов
3 https://david.ncifcrf.gov/.
в каждом из анализируемых образцов, дифференциально экспрессирующиеся гены, случаи альтернативного сплайсинга, сверхпредставленные ОО термины, полиморфизмы в каждом из анализируемых образцов, подтвержденные случаи ассоциации генов с заданным функциональным термином и полиморфизмов.
Результаты
При помощи секвенирования транскриптов удалось выявить различие уровней экспрессии генов при сравнении выборок образцов мозга ручных и агрессивных крыс, а также дифференциальный альтернативный сплайсинг для гена Опп1 (табл. 2).
Таблица 2
Уровни экспрессии гена Опп1 в трех отделах мозга агрессивных и ручных крыс
Крысы
Отдел мозга агрессивные ручные
! 2 1 2
Гипоталамус 23,9613 14,7004 17,5862 12,1724
Вентральная тегментальная область 9,3537 21,3030 5,6566 7,5530
Периакведуктальное серое вещество 1,6186 4,6650 7,9608 15,5895
Согласно полученным данным, во всех рассмотренных отделах мозга прослеживается тенденция к более широкому размаху экспрессии у агрессивных крыс, чем у ручных. Наряду с этим показатели экспрессии в периакведуктальном сером веществе у агрессивных крыс значительно ниже, чем у дружелюбных, а в вентральной тегментальной области наблюдается обратная ситуация, с более высокими уровнями экспрессии у агрессивных крыс. В гипоталамусе такие явные различия не представлены. Разнородность показателей экспрессии в ВТО и ПСВ, предположительно, связана с особенностями функций данных отделов мозга.
Гипоталамус регулирует нейроэндокринную деятельность мозга и ответственен за поддержание гомеостаза всего организма за исключением функции дыхания, сердечного ритма и кровяного давления. Кроме того, гипоталамус связан с большей частью отделов центральной нервной системы. Поэтому сходные уровни экспрессии гена Огт1 у агрессивных и ручных крыс в данном отделе мозга можно объяснить отсутствием патологий работы центральной нервной системы у этих животных. Таким образом, можно предположить, что проявление агрессивного или мирного поведения затрагивает гипоталамус в меньшей степени, нежели формирования мозга, вовлеченные в систему «награждения», такие, как вентральная тегментальная область и периакведуктальное серое вещество.
Второй представленный в табл. 2 отдел мозга - вентральная тегментальная область. Она вовлечена в мезокортикальный и мезолимбический дофаминовые пути. Через ВТО проходят множественные нервные пути, ответственные за систему вознаграждения в поведении. Этот же отдел мозга участвует в формировании зависимости от никотина, героина, кокаина и метамфетамина. Отказ от перечисленных веществ вызывает тревогу, беспокойство и повышение агрессивности. По данным таблицы, экспрессия изучаемого гена в данном отделе мозга у агрессивных крыс в 1,7-2,8 раза выше, чем у ручных. На основе этого можно сделать предположение, что экспрессия гена Огт1, а следовательно, активность рецепторов КМБЛ и чувствительность к дофамину в вентральной тегментальной области будет выше у агрессивных крыс.
Третьим отделом мозга, показавшим в ходе анализа тенденцию к различиям в уровнях экспрессии у ручных и агрессивных крыс, было периакведуктальное серое вещество. Данный участок головного мозга расположен в непосредственной близости от вентральной тегмен-тальной области и, помимо других функций, участвует в передаче тепловых и болевых им-
пульсов, связывая определенные участки таламуса и сенсорные окончания спинного мозга. Низкий уровень экспрессии гена, кодирующего синаптический рецептор, в данном отделе мозга может означать пониженную восприимчивость к боли и температуре окружающей среды. У агрессивных крыс, по данным табл. 2, показатель экспрессии гена Grini в 1,79,6 раза ниже, чем у дружелюбных по отношению к человеку.
Путем анализа и обработки данных об альтернативном сплайсинге гена Grini, представленных на сайте NCBI (Reference Sequence Database, RefSeq), была составлена табл. 3.
Таблица 3
Изоформы гена Grini (RefSeq)
RefSeq id Изоформа 3'UTR Экзон 2i Экзон 5
NM 00i270606.i 5 короткая + +
NM 00i270608.i 7 короткая - +
NM 00i270602.i i длинная + +
NM 00i270603.i 3 длинная - +
NM 00i287423 9 короткая + -
NM 0i70i0 2 длинная + -
NM 00i270605.i 4 длинная - -
NM 00i2706i0.i 8 короткая - -
В табл. 3 все восемь изоформ гена Grini отсортированы по наличию или отсутствию эк-зона 5. 3'UTR - это 3' - нетранслируемая область (3' - untranslated region), которая является участком мРНК, выполняющим регуляторные функции. Мутации, затрагивающие данный участок, способны отразиться на экспрессии многих генов за счет особенностей связывания транспортных белков с 3'UTR. Кроме того, данный отдел мРНК является заключительным (после него идет полиаденилированный конец цепочки) и терминирует синтез белка.
Согласно типам альтернативного сплайсинга (1. Альтернативная селекция промотора; 2. Альтернативный выбор сайтов расщепления / полиаденилирования; 3. Альтернативный сплайсинг с сохранением интрона; 4. Кассетный экзон (пропуск экзона)), для гена Grini представлены такие типы сплайсинга, как пропуск экзона и альтернативный выбор сайта полиаденилирования. Таким образом, самый короткий транскрипционный вариант данного гена составит 3 8i3 оснований, а самый длинный - 4 343 (по данным http://ncbi.nih.gov).
При анализе изоформ гена Grini [4] было установлено, что в гипоталамусе агрессивных крыс наиболее экспрессируемой является изоформа гена, которая представляет собой наиболее короткий транскрипт, а именно отсутствие экзонов 5 и 2i, а также короткий вариант эк-зона 22. У неагрессивных (ручных) крыс эта изоформа экспрессировалась в среднем для всей выборки режиме, в то время как экспрессия изоформы с включенным экзоном 2i была повышена.
Значения экспрессии генов белков, участвующих в работе дофамина, представлены в табл. 4. Видно что, гены ферментов, участвующих в синтезе дофамина, значимо выше экс-прессируются у агрессивных крыс (например, тирозин гидролаза Th). Экспрессия генов ферментов катаболизма дофамина незначительно выше у неагрессивных крыс. Экспрессия генов дофаминового транспортера Slc6a3 статистически значимо выше у агрессивных крыс. Экспрессия гена дофаминового рецептора второго типа почти в два раза выше у агрессивных крыс, в то время как гены рецепторов дофамина первого, третьего, четвертого и пятого типов незначительно активнее экспрессируются у неагрессивных крыс.
Было показано, что, гены ферментов синтеза серотонина активнее экспрессируются в ВТО мозга агрессивных крыс. Значимых различий экспрессии генов ферментов катаболизма серотонина между двумя линиями крыс не обнаружено. Ген серотонинового транспортера вдвое активнее экспрессируется у агрессивных крыс, экспрессия генов рецепторов Htrla, Htrlf, Htr5b, Htr3a, Htr6 у них ниже. Экспрессия генов рецепторов Htrld, Htr2c, Htrlb, Htr2a, Htr5a, Htr4, Htr7 выше у агрессивных.
Таблица 4
Экспрессия генов ферментов метаболического пути синтеза и катаболизма дофамина в ВТО мозга крыс
Функция Название гена Уровень экспрессии (БРКМ)
Неагрессивные Агрессивные
Синтез дофамина Тирозин гидролаза (Ш) КМ 012740 * 3,26 26,68
БОРЛ-декарбоксилаза (Ddc) КМ 012545 * 3,61 7,95
Катаболизм Моноаминоксидаза А (MAOA) КМ 033653 40 39
Катехол-О-метилтрансфераза (COMT) КМ 012531 23,7 22,2
Дофаминовые рецепторы Drd1 КМ 012546.3 1,75 1,21
Drd2 КМ 012547.1 ** 4,42 8,59
Drd3 КМ 017140.2 0,17 0,17
Drd4 КМ 012944.2 0,2 0,07
Drd5 КМ 012768.1 1,82 1,44
Транспортер Дофаминовый транспортер (Slc6a3) КМ 012694 * 0,92 14,46
* Значимые различия с учетом поправки на множественное сравнение. ** ¿>-уа1ие < 0,05.
Описание функций генов
Найденные гены с дифференциальной экспрессией и дифференциальным альтернативным сплайсингом представлены в разработанной компьютерной базе данных. Рассмотрим некоторые их функции. Глутамат - это аминокислота, важная для центральной нервной системы человека и других высших животных, поскольку позволяет проводить нервный импульс через специальные нейронные образования, которые называются синапсами. Рецепторы находятся на постсинаптической мембране и отвечают за соединение мембран синапса после улавливания веществ-активаторов, которые после секреции должны пройти синаптическую щель.
КМБЛ - рецепторы являются лиганд-зависимыми. Принцип их работы является нестандартным, поскольку, помимо необходимости улавливать один из активаторов-агонистов (глицин или глутамин) для проведения импульса необходимо присутствие ионов магния Ме2+. кмбл (к -метил Б-аспартат) и ОЛВЛЛ (гамма-аминомасляный тип Л) рецепторы являются главными ингибиторными ионотропными нейротрансмиттерными рецепторами головного мозга млекопитающих. Их уникальность состоит в возможности одновременно связывать два агонистичных нейротрансмиттера - Ь-глутамат и глицин вместе с осуществлением заряд-зависимой блокады ионами магния путем активации не-КМБЛ глутаматных рецепторов в синапсе [13; 14]. Эти рецепторы главным образом представлены в синапсах центральной нервной системы [15].
Наличие возбуждающего постсинаптического потенциала (ВПСП), появляющегося при активации рецептора NMDA, также способствует повышению концентрации ионов кальция в клетке. В свою очередь, ионы кальция могут действовать в качестве вторичного мессенд-жера в различных сигнальных путях. Этот процесс модулируется рядом эндогенных и экзогенных соединений и играет ключевую роль в широком диапазоне как физиологических (память), так и патологических процессов.
Анализ коэкспрессии генов
по данным RNA-seq (WGCNA)
Для проведения анализа WGCNA на данных RNA-seq в образцах агрессивных и ручных крыс количество ридов, выровненных на ген, было подсчитано с помощью функции featureCounts в пакете Subread. Из выборки были исключены гены, на которые не выровнялись прочтения RNA-seq. В дальнейший анализ вошло 18 000 генов. Анализ дифференциальной экспрессии осуществлялся с помощью пакета DESeq2 (пороговое значение 0,01). Дифференциальная экспрессия между образцами считалась для трех моделей: 1) генотип; 2) генотип + отдел мозга; 3) отдел мозга.
В первом случае было идентифицировано 37 генов, экспрессия которых выше у ручных крыс, и 40 генов, экспрессия которых выше у агрессивных крыс. Анализ представленности терминов Gene Ontology и путей KEGG 4 с помощью пакета limma показал, что у ручных крыс преобладают гены, участвующие в метаболизме сахаров, в то время как у агрессивных крыс - гены, участвующие в метаболизме пуринов и при окислительном стрессе. Для каждой модели получено топ 20 дифференциально экспрессирующихся генов (рис. 2, табл. 5, 6).
Рис. 2. Наиболее дифференциально экспрессирующиеся гены между агрессивными и ручными крысами
4 https://www.genome.jp/kegg/.
Таблица 5
Значимые генные онтологии для генов, экспрессия которых значимо выше либо у агрессивных, либо у ручных крыс
Категория генной онтологии p-value
Агрессивные Catalytic activity 6,10E-04
Transition metal ion binding 6,19E-04
ATP-dependent DNA helicase activity 7,13E-04
Bicarbonate binding 1,47E-03
Carnitine O-acetyltransferase activity 1,47E-03
Deoxyguanosine kinase activity 1,47E-03
D-xylose 1-dehydrogenase (NADP+) activity 1,47E-03
Ручные Monosaccharide binding 8,73E-05
Glucose binding 0,00016
Carbohydrate binding 0,000321
Fructose transmembrane transporter activity 0,001467
Таблица 6
Значимые генные онтологии для генов, дифференциально экспрессирующихся между линиями крыс с учетом отделов мозга
Категория генной онтологии p-value
Агрессивные Regulation of ion transport 1,19E-05
Plasma membrane part 1,40E-05
Synaptic transmission, GABAergic 0,000178
Main axon 0,000683
Ручные Regulation of parathyroid hormone secretion 6,24E-06
Oxidoreductase activity 1,25E-05
Regulation of endocrine process 7,49E-05
Regulation of developmental growth 0,000117
Positive regulation of cAMP biosynthetic process 0,000122
Во втором случае было найдено всего 439 дифференциально экспрессирующихся генов, а в третьем - 383, при этом только 83 гена из второго списка не совпало с генами из третьего списка. Поэтому дифэкспрессию именно этих генов мы посчитали ассоциированной с агрессивным / толерантным поведением у крыс. Пересечения списков генов, дифференциально экспрессирующихся только по генотипу и дифференциально экспрессирующихся по генотипу и по отделам мозга, не наблюдалось. GSEA (Gene Set Enrichment Analysis) показал, что эти гены активны при синаптической и гормональной регуляции 5. Таким образом, было выделено еще две группы генов, влияющих на агрессивное / толерантное поведение.
Анализ взвешенных сетей коэкспрессии генов осуществлялся с помощью пакета R WGCNA. После определения оптимального параметра (в = 6) алгоритм построения WGCNA был использован, чтобы преобразовать коэффициент корреляции экспрессии между генами в коэффициент смежности. Затем на основе этого коэффициента считалось расхождение в топологической матрице перекрытия (ТОМ).
Используя рассчитанное расхождение, мы провели иерархическую кластеризацию. В результате было выделено 63 кластера коэкспрессии с количеством генов более 20 в каждом. Средняя связность коэкспрессии генов внутри модулей была больше 0,75. Высокая связность генов внутри модулей показывает значительную биологическую релевантность полученных модулей. Поэтому мы оценили, в каких кластерах коэкспрессируются дифференциально экс-прессирующиеся гены. Из первой группы 47 генов попало в модуль «darkseagreen3» и 12 -
5 http://software.broadinstitute.org/gsea/index.jsp/.
в «brown2». Согласно GSEA, эти модули отвечают за метаболические процессы и за процес-синг и связывание РНК соответственно. Большая часть группы генов, экспрессия которых изменяется под влиянием генотипа и особенностей работы отделов мозга, представлена в модулях «mediumorchid», «brown», «brown2». Модуль «mediumorchid» содержит гены, наиболее вероятно участвующие в проведении синаптических импульсов, а модуль «brown» -гены, связанные с поведением и защитными механизмами в нейронах.
а> "ш х
<У>
о
оо о
Ö
CD Ö
Modules
I mu шшшитiiiiiinn Ivut I : i nil mi
■•-4
ill :
pJffl liiiÉMÉia
«ff " Sä"
б
Рис. 3. Распределение генов по модулям коэкспрессии (а). Тепловая карта корреляций экспрессии генов (б). Значения корреляции варьируются от белого к красному. На карте можно различить модули, гены которых высоко коррелируют между собой
а
Также для двух групп генов были построены ассоциативные сети с помощью программы АКБУшо с помощью раскладки в силовом поле [16].
Субъединицы КЯ-2 и КЯ-3 имеют по несколько гомологов в результате альтернативного сплайсинга, приводящего к разнообразию продуктов транскрипции за счет выборочного удаления одного или нескольких экзонов из иРНК. Альтернативный сплайсинг, обеспечивающий разнообразие вариантов КЯ-2 и КЯ-3, обеспечивает и вариабельность работы синапса, а также может иметь определяющее значение для чувствительности рецептора, что, в свою очередь, влияет на скорость и качество проводимого через синапсы нервного импульса.
Заключение и обсуждение
Разработана база данных «ГК-АСАП (Дифференциальный альтернативный сплайсинг генов крыс, селектированных по агрессивному поведению)», которая является компьютерной технологией в области системной биологии животных [17]. База данных представляет варианты дифференциального альтернативного сплайсинга генов крыс, селекционированных на агрессивное поведение, полученных по данным экспериментов транскриптомного секве-нирования. База данных разработана для экспериментаторов-селекционеров и исследователей, которые заинтересованы в получении информации о генах лабораторных животных -серых крыс, и их взаимосвязи с поведением. Представлены варианты изоформ генов с различной экспрессией у крыс с агрессивным и толерантным поведением по отношению к человеку. База данных имеет графический веб-интерфейс, который предоставляет пользователям возможность проводить поиск интересующих образцов, планировать эксперименты и обеспечивает хранение данных о различных экспериментах и образцах генов, оптимизируя научно-исследовательский процесс в области молекулярно-биологических и генетических иссле-
дований лабораторных животных. База данных содержит информацию о транскрипте, об уровнях экспрессии данного транскрипта и значимости различий у агрессивных и неагрессивных крыс. Структура базы позволяет пополнять ее данными других транскриптомных экспериментов по изучению агрессии у крыс.
База данных содержит уникальные данные об экспрессии, изоформах и дифференциальном альтернативном сплайсинге генов крыс, селектированных по агрессивному поведению, предоставляя комплементарную информацию к базе Маджин [18].
Проведено исследование кластеризации генов. Исследования [13] показали, в частности, что NMDA-рецептор не является статичной составляющей синапса, появляющейся вместе с нервной клеткой, а производится в дендритах (коротких отростках нейронов) в эндоплаз-матической сети, после чего через аппарат Гольджи происходит его транспорт через синап-тическую мембрану. Это свидетельствует, в первую очередь, о высокой пластичности и многофункциональности такой системы.
При помощи секвенирования транскриптов удалось выявить различие уровней экспрессии генов при сравнении выборок образцов мозга ручных и агрессивных крыс, а также дифференциальный альтернативный сплайсинг для гена Grinl. При анализе изоформ гена Grinl [4] было установлено, что в гипоталамусе агрессивных крыс наиболее экспрессируемой является изоформа гена, которая представляет собой наиболее короткий транскрипт. У неагрессивных (ручных) крыс эта изоформа экспрессировалась в среднем для всей выборки режиме, в то время как экспрессия изоформы с включенным экзоном 21 была повышена. Работа представляет продолжение исследований поведения на моделях лабораторных мышей [19; 20] и использует современные подходы биоинформатики для анализа транскриптомных данных [21; 22]. База данных экспрессии генов крыс по транскриптомным экспериментам развивает разработку базы данных RatDNA, построенную ранее по данным микрочипов [23].
Список литературы
1. Кудрявцева Н. Н., Маркель А. Л., Орлов Ю. Л. Агрессивное поведение: генетико-физио-логические механизмы // Вавиловский журнал генетики и селекции. 2014. Т. 18 (4/3). С.1133-1155.
2. Orlov Yu. L., Baranova A. V., Markel A. L. Computational models in genetics at BGRS\SB-2016: introductory note // BMC Genet. 2016. Vol. 17 (Suppl 3). P. 155. DOI: 10.1186/s12863-016-0465-3.
3. Kulikov A. V., Bazhenova E. Y., Kulikova E. A., Fursenko D. V., Trapezova L. I., Tereni-na E. E., Mormede P., Popova N. K., Trapezov O. V. Interplay between aggression, brain monoamines and fur color mutation in the American mink // Genes Brain Behav. 2016. Vol. 15 (8). P. 733740. DOI: 10.1111/gbb.12313.
4. Бабенко В. Н., Брагин А. О., Чадаева И. В., Маркель А. Л., Орлов Ю. Л. Альтернативный сплайсинг в отделах головного мозга селектированных по агрессивности крыс // Молекулярная биология. 2017. Т. 51, № 5. С. 870-880. DOI: 10.7868/S0026898417050159.
5. Брагин А. О., Сайк О. В., Чадаева И. В., Деменков П. С., Маркель А. Л., Орлов Ю. Л., Рогаев Е. И., Лаврик И. Н., Иванисенко В. А. Роль генов апоптоза в контроле агрессивного поведения, выявленная с помощью комбинированного анализа ассоциативных генных сетей, экспрессионных и геномных данных по серым крысам с агрессивным поведением // Вави-ловский журнал генетики и селекции. 2017. Т. 21 (8). С. 911-919.
6. Bolger A. M., Lohse M., Usadel B. Trimmomatic: a flexible trimmer for Illumina sequence data // Bioinformatics. 2014. Vol. 30 (15). P. 2114-2120. DOI: 10.1093/bioinformatics/btu170.
7. Kim D., Pertea G., Trapnell C., Pimentel H., Kelley R., Salzberg S. L. TopHat2: accurate alignment of transcriptomes in the presence of insertions, deletions and gene fusions // Genome biology. 2013. Vol. 14 (4). P. R36. DOI: 10.1186/gb-2013-14-4-r36.
8. Trapnell C., Roberts A., Goff L., Pertea G., Kim D., Kelley D. R., Pimentel H., Salzberg S. L., Rinn J. L., Pachter L. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks // Nat. Protoc. 2012. Vol. 7. No. 3. P. 562-578.
9. Kanehisa M., Goto S. KEGG: Kyoto encyclopedia of genes and genomes // Nucleic acids research. 2000. Vol. 28 (1). P. 27-30.
10. Pruitt K. D., Tatusova T., Maglott D. R. NCBI reference sequences (RefSeq): a curated nonredundant sequence database of genomes, transcripts and proteins // Nucleic acids research. 2006. Vol. 35 (suppl. 1). P. D61-65.
11. Li H., Handsaker B., Wysoker A., Fennell T., Ruan J., Homer N., Marth G., Abecasis G., Durbin R. 1000 Genome Project Data Processing Subgroup. The Sequence Alignment / Map format and SAMtools // Bioinformatics. 2009. Vol. 25. No. 16. P. 2078-2079.
12. Shen S., Park J. W., Lu Z. X., Lin L., Henry M. D., Wu Y. N., Zhou Q., Xing Y. rMATS: Robust and flexible detection of differential alternative splicing from replicate RNA-Seq data // Proc. Natl. Acad. Sci. 2014. Vol. 111. No. 51. P. E5593-E5601.
13. Wenthold R., Prybylowski K., Standley S., Sans N., Petralia R. Trafficking of NMDA receptors // Annual Review for Pharmacological Toxicology. 2003. Vol. 43. P 335-358.
14. Liu X.-B., Murray K., Jones E. Switching of NMDA Receptor 2A and 2B Subunits at Thalamic and Cortical Synapses during Early Postnatal Development // The Journal of Neuroscience. 2004. Vol. 24 (40). P. 8885-8895.
15. Furukawa H., Singh S. K., Mancusso R., Gouaux E. Subunit arrangement and function in NMDA receptors // Nature. 2005. Vol. 438 (7065). P. 185-192.
16. Ivanisenko V. A., Saik O. V., Ivanisenko N. V., Tiys E. S., Ivanisenko T. V., Demenkov P. S., Kolchanov N. A. ANDSystem: an Associative Network Discovery System for automated literature mining in the field of biology // BMC Syst. Biol. 2015. Suppl. 2. P. S2. DOI 10.1186/1752-0509-9-S2-S2.
17. Брагин А. О., Чадаева И. В., Бабенко В. Н., Богомолов А. Г., Кожемякина Р. В., Мар-кель А. Л., Орлов Ю. Л. Дифференциальный альтернативный сплайсинг генов крыс, селектированных по агрессивному поведению (ГК-АСАП) / Differential alternative splicing of rat genes selected for aggressive behavior (RG-ASAB). Заявка на гос. регистрацию базы данных, июнь 2018 г., ИЦиГ СО РАН.
18. Медведева И. В., Брагин А. О., Чадаева И. В., Маркель А. Л., Орлов Ю. Л. База данных генов, ассоциированных с агрессивным поведением (Маджин) / Database of genes associated with aggressive behavior (Maggene). Свидетельство о государственной регистрации базы данных № 2016621672 от 16.12.2016.
19. Коваленко И. Л., Смагин Д. А., Галямина А. Г., Орлов Ю. Л., Кудрявцева Н. Н. Изменение экспрессии дофаминергических генов в структурах мозга самцов мышей под влиянием хронического социального стресса: данные RNA-seq // Молекулярная биология. 2016. Т. 50, № 1. С. 184-187.
20. Smagin D. A., Kovalenko I. L., Galyamina A. G., Bragin A. O., Orlov Y. L., Kudryavtse-va N. N. Dysfunction in ribosomal gene expression in the hypothalamus and hippocampus following chronic social defeat stress in male mice as revealed by RNA-Seq // Neural Plasticity. 2016. Vol. 2016. Article ID 3289187, 6 p. DOI:10.1155/2016/3289187.
21. Спицина А. М., Орлов Ю. Л., Подколодная Н. Н., Свичкарев А. В., Дергилев А. И., Чен М., Кучин Н. В., Черных И. Г., Глинский Б. М. Суперкомпьютерный анализ геномных и транс-криптомных данных, полученных с помощью технологий высокопроизводительного секве-нирования ДНК // Программные системы: теория и приложения. 2016. Т. 4 (31). С. 3-20.
22. Fedoseeva L. A., Klimov L. O., Ershov N. I., Alexandrovich Y. V., Efimov V. M., Mar-kel A. L., Redina O. E. Molecular determinants of the adrenal gland functioning related to stresssensitive hypertension in ISIAH rats // BMC Genomics. 2016. Vol. 17 (Suppl 14). P. 989.
23. Орлов Ю. Л., Брагин А. О., Медведева И. В., Гунбин И. В., Деменков П. С., Вишневский О. В., Левицкий В. Г., Ощепков В. Г., Подколодный Н. Л., Афонников Д. А., Гроссе И., Колчанов Н. А. ICGenomics: программный комплекс анализа символьных последовательностей геномики // Вавиловский журнал генетики и селекции. 2012. Т. 16 (4/1). С. 732-741.
24. Кожевникова О. С., Мартыщенко М. К., Генаев М. К., Корболина М. К., Мурале-ва Н. А., Колосова Н. А., Орлов Ю. Л. RatDNA: база данных микрочиповых исследований на крысах для генов, ассоциированных с заболеваниями старения // Вавиловский журнал генетики и селекции. 2012. Т. 16 (4/1). С. 756-765.
Материал поступил в редколлегию 01.08.2018
A. O. Bragin 1, K. A. Tabanyukhov 1 2, I. V. C hadaeva 1 3, A. V. T sukanov 1 3 R. O. Babenko 3, I. V. Medvedeva 1, A. G. Bogomolov 1 3 V. N. Babenko 1 3, Yu. L. Orlov 1 3
1 Institute of Cytology and Genetics SB RAS 10 Academician Lavrentiev Ave., Novosibirsk, 630090, Russian Federation
2 Novosibirsk State Agrarian University 160 Dobrolyubov Str., Novosibirsk, 630039, Russian Federation
3 Novosibirsk State University 1 Pirogov Str., Novosibirsk, 630090, Russian Federation
[email protected],[email protected], [email protected]
THE COMPUTER DATABASE FOR THE ANALYSIS OF DIFFERENTIALLY EXPRESSING GENES, RELATED TO AGGRESSIVE BEHAVIOR ON MODELS OF LABORATORY ANIMALS
Development and application of computer means of the analysis of transcriptome sequencing data in model laboratory animals represents an important problem of bioinformatics. The research problem of an expression of genes on the basis of the modern methods of high-throughput sequencing in brain areas of laboratory animals is common basis for a research of genetic background of behavior. Studying of genetic determinants of aggressive behavior in general not only actual for research of molecular mechanisms of behavior regulation, but also has wide practical component for the work with animals and application in agrobiology. The genetic predisposition of animals to aggressive behavior leads to emergence of differences in a brain structure, and comparison of such distinctions allow to find both the common, and specific mechanisms of behavior regulation promoting aggression manifestation in provocative conditions of the environment. Computer programs of the gene splicing analysis, and prototype of the database of an expression of genes in brain areas of laboratory animals - gray rats, selected on manifestation of aggressive behavior are developed. We fulfilled the functional summary of over- and under-expressed genes in experiments on rats, described isoforms and the alternate splicing patterns of these genes.
Keywords: bioinformatics, transcriptomics, splicing, differential expression, laboratory animals, gene ontologies, behavior, database.
References
1. Kudryavtseva N. N., Markel A. L., Orlov Yu. L. Aggressive behavior: Genetic and physiological mechanisms. Russian Journal of Genetics: Applied Research, 2015, vol. 5, no. 4, p. 413429. (in Russ.)
2. Orlov Yu. L., Baranova A. V., Markel A. L. Computational models in genetics at BGRS\SB-2016: introductory note. BMC Genet, 2016, vol. 17 (suppl. 3), p. 155. DOI: 10.1186/s12863-016-0465-3.
3. Kulikov A. V., Bazhenova E. Y., Kulikova E. A., Fursenko D. V., Trapezova L. I., Tereni-na E. E., Mormede P., Popova N. K., Trapezov O. V. Interplay between aggression, brain monoamines and fur color mutation in the American mink. Genes Brain Behav., 2016, vol. 15 (8), p. 733740. DOI: 10.1111/gbb.12313.
4. Babenko V. N., Bragin A. O., Chadaeva I. V., Markel A. L., Orlov Yu. L. Differential Alternative Splicing in Brain Regions of Rats Selected for Aggressive Behavior. Mol. Biology, 2017, vol. 51 (5), p. 870-880. DOI: 10.7868/S0026898417050159. (in Russ.)
5. Bragin A. O., Saik O. V., Chadaeva I. V., Demenkov P. S., Markel A. L., Orlov Yu. L., Rogaev E. I., Lavrik I. N., Ivanisenko V. A. Role of apoptosis genes in aggression revealed using combined analysis of ANDSystem gene networks, expression and genomic data in grey rats with aggressive behavior. Vavilovskii Zhurnal Genetiki i Selektsii [Vavilov Journal of Genetics and Breeding], 2017, vol. 21 (8), p. 911-919. DOI: 10.18699/VJ17.312. (in Russ.)
6. Bolger A. M., Lohse M., Usadel B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics, 2014, vol. 30 (15), p. 2114-2120. DOI: 10.1093/bioinformatics/btul70.
7. Kim D., Pertea G., Trapnell C., Pimentel H., Kelley R., Salzberg S. L. TopHat2: accurate alignment of transcriptomes in the presence of insertions, deletions and gene fusions. Genome Biology, 2013, vol. 14 (4), p. R36. DOI: 10.1186/gb-2013-14-4-r36.
8. Trapnell C., Roberts A., Goff L., Pertea G., Kim D., Kelley D. R., Pimentel H., Salzberg S. L., Rinn J. L., Pachter L. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nat. Protoc, 2012, vol. 7, no. 3, p. 562-578.
9. Kanehisa M., Goto S. KEGG: Kyoto encyclopedia of genes and genomes. Nucleic Acids Research, 2000, vol. 28 (1), p. 27-30.
10. Pruitt K. D., Tatusova T., Maglott D. R. NCBI reference sequences (RefSeq): a curated non-redundant sequence database of genomes, transcripts and proteins. Nucleic Acids Research, 2006, vol. 35 (suppl. 1), p. D61-65.
11. Li H., Handsaker B., Wysoker A., Fennell T., Ruan J., Homer N., Marth G., Abecasis G., Durbin R. 1000 Genome Project Data Processing Subgroup. The Sequence Alignment/Map format and SAMtools. Bioinformatics, 2009, vol. 25, no. 16, p. 2078-2079.
12. Shen S., Park J. W., Lu Z. X., Lin L., Henry M. D., Wu Y. N., Zhou Q., Xing Y. rMATS: Robust and flexible detection of differential alternative splicing from replicate RNA-Seq data. Proc. Natl. Acad. Sci, 2014, vol. 111, no. 51, p. E5593-E5601.
13. Wenthold R., Prybylowski K., Standley S., Sans N., Petralia R. Trafficking of NMDA receptors. Annual Review for Pharmacological Toxicology, 2003, vol. 43, p. 335-358.
14. Liu X.-B., Murray K., Jones E. Switching of NMDA Receptor 2A and 2B Subunits at Tha-lamic and Cortical Synapses during Early Postnatal Development. The Journal of Neuroscience, 2004, vol. 24 (40), p. 8885- 8895.
15. Furukawa H., Singh S. K., Mancusso R., Gouaux E. Subunit arrangement and function in NMDA receptors. Nature, 2005, vol. 438 (7065), p. 185-192.
16. Ivanisenko V. A., Saik O. V., Ivanisenko N. V., Tiys E. S., Ivanisenko T. V., Demen-kov P. S., Kolchanov N. A. ANDSystem: an Associative Network Discovery System for automated literature mining in the field of biology. BMC Syst. Biol, 2015, suppl. 2. p. S2. DOI 10.1186/1752-0509-9-S2-S2.
17. Bragin A. O., Chadaeva I. V., Babenko V. N., Bogomolov A. G., Kozhemyakina R. V., Markel A. L., Orlov Yu. L. Differential alternative splicing of rat genes selected for aggressive behavior (RG-ASAB). Application on State registration of computer database, June 2018, Institute of Cytology and Genetics SB RAS. (in Russ.)
18. Medvedeva I. V., Bragin A. O., Chadaeva I. V., Markel A. L., Orlov Yu. L. Database of genes associated with aggressive behavior (Maggene). Certificate of State registration of computer database No. 2016621672 dated 16.12.2016. (in Russ.)
19. Kovalenko I. L., Smagin D. A., Galyamina A. G., Orlov Yu. L., Kudryavtseva N. N. Changes in the Expression of Dopaminergic Genes in Brain Structures of Male Mice Exposed to Chronic Social Defeat Stress: An RNA-seq Study. Molecular Biology, 2016, vol. 50 (1), p. 184187. (in Russ.)
20. Smagin D. A., Kovalenko I. L., Galyamina A. G., Bragin A. O., Orlov Yu. L., Kudryavtseva N. N. Dysfunction in ribosomal gene expression in the hypothalamus and hippocampus following chronic social defeat stress in male mice as revealed by RNA-Seq. Neural Plasticity, 2016, vol. 2016, Article ID 3289187, 6 p. DOI:10.1155/2016/3289187.
21. Spitsina A. M., Orlov Yu. L., Podkolodnaya N. N., Svicharev A. V., Dergilev A. I., Chen M., Kuchin N. V., Chernykh I. G., Glinsky B. M. Supercomputer analysis of genomics and trans-criptomics data revealed by high-throughput DNA sequencing. Program systems: theory and applications, 2015, vol. 6, no.1 (24), p. 157-174. (in Russ.)
22. Fedoseeva L. A., Klimov L. O., Ershov N. I., Alexandrovich Y. V., Efimov V. M., Markel A. L., Redina O. E. Molecular determinants of the adrenal gland functioning related to stresssensitive hypertension in ISIAH rats. BMC Genomics, 2016, vol. 17 (suppl. 14), p. 989.
23. Orlov Yu. L., Bragin A. O., Medvedeva I. V., Gunbin K. V., Demenkov P. S., Vishnevsky O. V., Levitsky V. G., Oshchepkov D. Y., Podkolodnyy N. L., Afonnikov D. A., Grosse I., Kolchanov N. A. ICGenomics: a program complex for analysis of symbol sequences in genomics.
Vavilovskii Zhurnal Genetik i Selektsii [Vavilov Journal of Genetics and Breeding], 2012, vol. 16 (4/1), p. 732-741. (in Russ.)
24. Kozhevnikova O. S., Martyschenko M. K., Genaev M. A., Korbolina E. E., Muraleva N. A., Kolosova N. G., Orlov Yu. L. RatDNA: database on microarray studies of rats bearing genes associated with age-related diseases. Vavilovskii Zhurnal Genetiki i Selektsii [Vavilov Journal of Genetics and Breeding], 2012, vol. 16 (4/1), p. 756-765. (in Russ.)
For citation:
Bragin A. O., Tabanyukhov K. A., Chadaeva I. V., Tsukanov A. V., Babenko R. O., Medvedeva I. V., Bogomolov A. G., Babenko V. N., Orlov Yu. L. The Computer Database for the Analysis of Differentially Expressing Genes, Related to Aggressive Behavior on Models of Laboratory Animals.
VestnikNSU. Series: Information Technologies, 2018, vol. 16, no. 3, p. 7-21. (in Russ.)
DOI 10.25205/1818-7900-2018-16-3-7-21