Научная статья на тему 'Метод секвенирования РНК (RNA-seq) в иммунологических исследованиях'

Метод секвенирования РНК (RNA-seq) в иммунологических исследованиях Текст научной статьи по специальности «Биология»

CC BY
21
6
Поделиться
Журнал
Иммунология
Scopus
ВАК
CAS
RSCI
Область наук
Ключевые слова
СЕКВЕНИРОВАНИЕ РНК / RNA SEQUENCING / RNA-SEQ / ТРАНСКРИПТОМ / TRANSCRIPTOME / ОБЗОР / REVIEW / SINGLE CELL RNA-SEQ

Аннотация научной статьи по биологии, автор научной работы — Круглова Наталья Андреевна, Филатов А.В.

Транскриптом является связующим звеном между ДНК и белками. Он очень лабилен и имеет сложный состав. На уровне транскриптома регулируются разнообразные клеточные процессы, поэтому для понимания того, как функционирует иммунная система, важно изучать поведение клеточных транскриптомов. Недавно появившийся высокопроизводительный метод RNA-seq вывел транскриптомные исследования на новый уровень. Он позволяет идентифицировать новые элементы генома и определять особенности экспрессии генов. Эти знания необходимы для понимания иммунологических процессов и механизмов развития заболеваний.

Похожие темы научных работ по биологии , автор научной работы — Круглова Наталья Андреевна, Филатов А.В.,

RNA-SEQ IN IMMUNOLOGY RESEARCH

Transcriptome, a set of all cellular RNAs, connects DNA with proteins. It is characterized by complex composition and high lability. Since many cellular processes are regulated at the transcriptomic level, it is important to understand the transcriptomes of immune cells and their interactors in order to reveal the mechanisms of immune reactions. A new method RNA-seq has made a breakthrough in transcriptomic studies. It allows to identify new genomic elements and determine features of gene expression. This knowledge is required for the understanding of immune processes and pathological conditions.

Текст научной работы на тему «Метод секвенирования РНК (RNA-seq) в иммунологических исследованиях»

ОБЗОРЫ

11. Skvortsova V.I., Botsina A.Yu., Kol'tsova K.V., Platonova I.A., Pochigaeva K.I., Sokolov K.V., Tvorogova T.V. Hypertension and the brain. Zhurn. nevrol. ipsikhiatr. 2006; (10): 68—78. (in Russian)

12. Kamchatnov P.R., Sal'nikova G.S., Mikhaylova N.A. Chronic disorders of cerebral circulation and the possibility of their pharmacological correction. Zhurn. nevrol. i psikhiatr. 2012; (6): 72—5. (in Russian)

13. Pyekhova K.A., Mikhin V.P., Gavrilyuk E.V., Konoplya A.I. Immune Metabolic disorders in hypertensive disease of varying severity. Vestnik novykh meditsinskikh tekhnologiy. 2012; XIX (1): 172—3. (in Russian)

14. Otman I.N., Zozulya S.A., Sarmanova Z.V., Klyushnik T.P. Inflammatory and autoimmune reactions with various forms of dysfunction of the nervous system. Pat. fiziol. 2015; 59(3): 81—8. (in Russian)

15. Konoplya A.I, Shul'ginova A.A., Laskov V.B. The immune and oxidant disturbances in patients with chronic cerebral ischemia and their correction. Zhurn. nevrol. i psikhiatr. 2015; (11): 28—32. (in Russian)

16. Lukens J.R., Gross J.M., Kanneganti T.D. IL-1 family cytokines trigger sterile inflammatory disease. Front. Immunol. 2012; (3): 315.

17. Harilin D.A. The role of tumor necrosis factor in the regulation of inflammatory responses of monocytes and macrophages. Immunologiya. 2014; (4): 195—201. (in Russian)

18. Spencer J.D., Schwaderer A.L., Becknell B., Watson J., Hains D.S. The innate immune response during urinary tract infection and pyelonephritis. Pediatr. nephrol. 2014; 29(7): 1139—49.

19. Zurochka A.V., Davydova E.V., Al'tman D.Sh. Cytokine control of the regulation of the blood-brain barrier and the levels of nonspecific markers of neural tissue damage in patients with early forms of chronic brain ischemia. Rossiyskiy immunologicheskiy zhurnal. 2013; 7(16/4): 451—5. (in Russian)

20. Pigarevkiy P.V., Mal'tseva S.V., Snegova V.A., Davydova N.G. The role of interleukin-18 in the destabilization of atherosclerotic

plaques in humans. Byulleten'eksper. biol. 2014; 157(1): 796—800. (in Russian)

21. Khaitov R.M., Ignat'eva G.A., Sidorovich I.G. Immunology. Norm and Pathology. Moscow: Meditsina; 2010. (in Russian)

22. Solov'eva E.Yu., Baranova O.A., Chekanov A.V., Panasenko O.M., Chipova D.T., Tlapshokova L.B. et al. The study of acute and chronic inflammation in the brain ischemia model of isolated neutrophils. Tsitokiny i vospalenie. 2015; 14(3): 60—4. (in Russian)

23. Belyaeva A.S., Van'ko L.V., Matveeva N.K., Krechetova L.V. Neutrophil granulocytes as the immune regulators. Immunologiya. 2016; 37(2): 129—33. (in Russian)

24. Karaulov A.V., Kalyuzhin O.V. Immunotherapy of infectious diseases: problems and prospects. Ter. arkh. 2013; 85(11): 100—8. (in Russian)

25. Shchekina E.G., Ishchenko A.M., Shtrygol' S.Yu., Drogovoz S.M., Simbirtsev A.S. Study cerebroprotective receptor antagonist properties of recombinant human interleukin 1 (IL-1R) in the experiment. II. Cerebroprotective properties of IL-1R in ischemic and traumatic brain injury in mice. Tsitokiny i vospalenie. 2013; 12(3): 29—34. (in Russian)

26. Deyko R.D., Shtrygol' S.Yu., Simbirtsev A.S., Ishxhenko A.M. Heat shock protein 70 modulates N5R-protective effect of recombinant interleukin 1 receptor antagonist, depending on the mode of application in acute cerebral ischemia. Tsitokiny i vospalenie. 2014; 13(4): 34—7. (in Russian)

27. Konoplya A.I., Gavrilyuk V.P., Loktionov A.L., Konoplya A.A., Bystrova N.A. Clinical Experience Sharing Immunomodulators, Antioxidants, and Membrane Protectors in Clinical Practice. Kursk; 2015. (in Russian)

Поступила 21.06.16 Принята в печать 03.11.16

ОБЗОРЫ

© КРУГЛОВА H.A., ФИЛАТОВ A.B., 2017 УДК 616-078.33:575.08

Круглова НА.12, Филатов А.В.1

МЕТОД СЕКВЕНИРОВАНИЯ РНК (RNA-SEQ) В ИММУНОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ

1 Лаборатория иммунохими ФГБУ «ГНЦ Институт иммунологии» ФМБА России, 115478, г. Москва, Россия;

2 Биологический факультет ФГБОУ ВПО «Московский государственный университет им. М.В. Ломоносова», 119234, г Москва, Россия

Транскриптом является связующим звеном между ДНК и белками. Он очень лабилен и имеет сложный состав. На уровне транскриптома регулируются разнообразные клеточные процессы, поэтому для понимания того, как функционирует иммунная система, важно изучать поведение клеточных транскриптомов. Недавно появившийся высокопроизводительный метод RNA-seq вывел транскриптомные исследования на новый уровень. Он позволяет идентифицировать новые элементы генома и определять особенности экспрессии генов. Эти знания необходимы для понимания иммунологических процессов и механизмов развития заболеваний.

Ключевые слова: секвенирование РНК; RNA-seq; транскриптом; обзор.

Для цитирования: Круглова Н.А., Филатов А.В. Метод секвенирования РНК (RNA-SEQ) в иммунологических исследованиях. Иммунология. 2017; 38(2): 112-117. DOI: 10.18821/0206-4952-2017-38-2-112-117

Kruglova N.A.1-2, Filatov A.V.1

RNA-SEQ IN IMMUNOLOGY RESEARCH

'Laboratory of immunochemistry, «Institute of Immunology», 115478, Moscow, Russia; 2Biological faculty, Moscow State University, 119234, Moscow, Russia

Для корреспонденции: Круглова Наталья Андреевна, мл. науч. сотр. лаборатории иммунохимии «ГНЦ Институт иммунологии» ФМБА России, аспирант 2-го года обучения, биологический факультет МГУ, E-mail: natalya.a.kruglova@yandex.ru

REVIEWS

Transcriptome, a set of all cellular RNAs, connects DNA with proteins. It is characterized by complex composition and high lability. Since many cellular processes are regulated at the transcriptomic level, it is important to understand the transcriptomes of immune cells and their interactors in order to reveal the mechanisms of immune reactions. A new method RNA-seq has made a breakthrough in transcriptomic studies. It allows to identify new genomic elements and determine features of gene expression. This knowledge is required for the understanding of immune processes and pathological conditions.

Keywords: RNA sequencing; RNA-seq; transcriptome; single cell RNA-seq; review.

For citation: Kruglova N.A., Filatov A.V. RNA-SEQ in immunology research. Immunologiya. 2017; 38(2): 112-117. DOI: 10.18821/0206-4952-2017-38-2-112-117

For correspondence: Kruglova Natalia A., Junior researcher of the laboratory of immunochemistry of «Institute of immunology» FMBA of Russia, postgraduate student of the 2nd year of study, faculty of biology, Moscow state University, E-mail: natalya.a.kruglova@yandex.ru

conflict of interest. The authors declare no conflict of interest. Acknowledgments. The work was performed with financial support from grantRSF14-15-00702.

Received 17.10.16 Accepted 03.11.16

введение

Почти все клетки многоклеточного организма содержат одинаковый набор генов, но существенно различаются по состоянию транскриптома, а именно по тому, какие гены экспрессируются и насколько активно в определенный момент времени. Транскриптом включает не только кодирующие, но и регуляторные молекулы РНК, количественный диапазон которых огромен. Под действием разных стимулов транскриптом может претерпевать существенные изменения. Первые методы изучения экспрессии генов (Nothern Blot, qPCR) позволяли детектировать небольшое количество транскриптов. Следом появились высокопроизводительные методы на основе гибридизации (микрочипы), благодаря которым стало возможным исследовать экспрессию генов на уровне целых геномов. Однако эти способы позволяли анализировать только известные последовательности, был ограничен динамический диапазон детекции и затруднено сравнение нескольких образцов [1]. Другая группа методов основана на принципе секвенирования. Эти методы — SAGE (Serial Analysis of Gene Expression) и CAGE (Cap Analysis of Gene Expression), а также метод с использованием EST-библиотек, имели существенные ограничения. В 2008 г. был предложен метод секвенирования РНК (RNA-seq), основанный на секвенировании нового поколения с использованием фрагментов кДНК. Он совершил прорыв в изучении транскриптомов благодаря ряду преимуществ перед ранее предложенными методами. Во-первых, он позволяет детектировать транcкрипты как с установленной, так и с неизвестной последовательностью. Во-вторых, RNA-seq имеет очень широкий динамический диапазон (6 порядков). По сравнению с микрочипами он имеет низкий уровень фонового сигнала. Благодаря методу глубокого секвенирования RNA-seq способен различать индивидуальные однонуклеотидные полиморфизмы (SNPs). Кроме того, с его помощью можно количественно сравнивать экспрессию генов в разных образцах [2].

RNA-seq позволяет получать как качественную, так и количественную информацию. Первое направление касается аннотации новых элементов генома. Так, с помощью RNA-seq можно идентифицировать новые гены, включая последовательности некодирующих РНК, сайты начала тражкрипции, сплайс-варианты, аллельспецифичную экспрессию, SNPs, слияния генов, границы экзонов и интронов, а также явления редактирования РНК [1]. Второе направление использования RNA-seq — анализ дифференциальной экспрессии генов. В этом случае ставится задача сравнить транскриптомы из двух или более образцов и определить транскрипты с различающейся экспрессией. Этот подход широко используется при изучении механизмов различных заболеваний. Наконец,

RNA-seq позволяет анализировать образцы с очень малым содержанием РНК, а также изучать гетерогенность клеточных популяций благодаря развитию технологий секвенирования для единичных клеток [3].

Принцип метода

При выборе биологического материала для эксперимента по RNA-seq необходимо учитывать гетерогенность образца, которая может существенно усложнить анализ результатов. Поскольку транскриптом очень лабилен, а метод высокочувствителен, при сборе образцов следует помнить о влиянии различных факторов, включая стадию клеточного цикла и циркадные ритмы. Сам сбор материала нужно проводить быстро, чтобы наблюдаемый эффект был вызван именно изучаемым воздействием, а не процедурой сбора [4].

После сбора материала из него выделяют РНК, проверяют ее качество и оценивают количество. Затем проводят обогащение определенного класса РНК. Для получения субпопуляции мРНК часто используют селекцию с поли-Т-олигонуклеотидами, гибридизующимися с полиаденилиро-ванной мРНК (этот способ подходит для эукариот). Альтернативным вариантом служит удаление рРНК. К нему прибегают и в том случае, когда образец содержит частично разрушенную РНК. Этот вариант используют для биопсийного материала [4]. Малые РНК выделяют по размеру с помощью электрофореза. Кроме того, можно проводить специфичное выделение РНК определенных генов. После этого чаще всего выделенную субпопуляцию РНК фрагментируют [5].

Следующим этапом является подготовка библиотеки. Для этого на матрице РНК синтезируют первую, а затем вторую цепь ДНК, амплифицируют молекулы ДНК и вводят адаптеры (иногда еще и баркоды) для секвенирования. Выбор конкретного метода зависит от платформы для секвениро-вания, но можно привести общие рекомендации. Во-первых, советуют фрагментировать молекулы РНК, а не кДНК, в этом случае покрытие транскриптов получается более равномерным. Во-вторых, иногда требуется цепьспецифичная (ориентированная) библиотека. Она необходима для определения антисенс-транскрипции и более точной аннотации. Наконец, лучше вводить адаптеры на этапе ПЦР, а не лигировать их к РНК, потому что лигазы имеют предпочтительные последовательности и могут избирательно обогатить библиотеку. Чтобы можно было сравнивать результы разных экспериментов, необходимо вносить в образец известное количество искусственно синтезированных молекул РНК (spike-in RNA), которые будут служить стандартом [1].

Для секвенирования в экспериментах по RNA-seq чаще всего используют платформу Illimuna. При изучении транс-криптомов отдельных клеток секвенирование ведут на плат-

ОБЗОРЫ

форме PacBio, не требующей предварительной амплификации и дающей длинные чтения [2].

После секвенирования наступает время обработки и анализа данных. Сначала необходимо разделить все чтения на образцы по баркоду и провести тримминг (удаление адаптерных участков, выбраковку чтений низкого качества и малой длины). Следующий этап — картирование (выравнивание) чтений на референс. Референсом может служить геном организма, если он прочтен и уже содержится в базе данных. Если геном изучаемого вида не собран, проводят сборку транскриптов de novo, на которые потом картируют чтения. Второй путь требует более сложной компьютерной обработки данных и не всегда дает надежные результаты. Вслед за картированием наступает этап аннотирования — определения структур генома, на которые картировались чтения. Для известных геномов эта информация может быть извлечена из баз данных. Для de novo собранных транскриптомов проводят BLAST-поиск, чтобы найти гомологичные последовательности у других организмов и аннотировать транскрипты согласно установленной гомологии. Картированные и аннотированные чтения передаются на анализ [1].

Качественный анализ подразумевает поиск новых генов, включая гены некодирующих РНК, определение сайтов начала транскрипции, сплайс-вариантов, аллельспецифичной экспрессии, SNPs, слияния генов, границ экзонов и интронов и других структурных элементов генома. С помощью количественного анализа определяют дифференциальную экспрессию генов. В этом случае для статистической обработки данных необходимы как минимум две биологические повтор-ности. Сначала рассчитывают количество картированных чтений гена Х на все экзоны этого гена, полученное значение нормируют на глубину секвенирования и/или на длину гена, применяя различные нормировочные коэффициенты. После нормировки проводят статистический анализ для выявления дифференциально экспрессированных генов между двумя образцами. Существует большое количество биоинформатиче-ских программ для анализа дифференциальной экспрессии, сравнение некоторых из них приведено в обзорах [6, 7].

Если целью является аннотация новых элементов генома, требования для параметров секвенирования более жесткие, чем для количественного анализа. Необходимая глубина секве-нирования во многом зависит от целей эксперимента и уровня транскрипционной активности генома или интересующей группы генов. Общая рекомендация: для анализа высокоэкспресси-рованных генов достаточно 8—10 млн чтений, в то время как для анализа слабоэкспрессированных генов — более 200 млн чтений на образец из клеток млекопитающего [2]. По рекомендации ENCODE (RNA Standards v1.0 (May 2011)) глубина секвенирования должна составлять более 30 млн парных чтений.

Данные, полученные с помощью RNA-seq (как и в случае любого другого высокопроизводительного метода), всегда необходимо подтверждать другими низкопроизводительными методами, например qPCR или RNA-FISH [1].

RNA-seq в иммунологии

Ниже приведены примеры использования RNA-seq в области иммунологии как для качественного, так и для количественного анализа.

Благодаря тому что RNA-seq основан на методе глубокого секвенирования, он позволяет идентифицировать отдельные SNPs [8]. SNPs — самый распространенный источник вариабельности генома человека [9]. Многие SNPs связаны с развитием патологий, поэтому их идентификация важна для диагностики и прогноза заболеваний и может помочь в выяснении механизмов и разработке методов лечения болезней. SNPs могут влиять на функциональную активность того гена, в котором они находятся (цис-эффект), а могут воздействовать на удаленные гены через регуляторные связи (транс-эффект). W. Zhang и соавт. [9] проанализировали данные RNA-seq по 140 лимфоцитарным линиям человека и с привлечени-

ем геномных данных выявили 45 тыс. потенциальных SNP-ассоциированных регуляторных связей между парами генов, причем эти связи бывают цис- и транс-типа и могут влиять на уровень экспрессии и альтернативный сплайсинг. Предсказанные регуляторные сети можно использовать как кандидатные для установления новых сигнальных путей.

Следующая задача, которую позволяет решить RNA-seq, состоит в детекции сплайс-изоформ. По приблизительным оценкам от 55 до 95% генов человека имеют альтернативные сплайс-изоформы [10], а общее число событий альтернативного сплайсинга составляет более 100 тыс. [5]. При этом 15—60% мутаций, связанных с болезнями, затрагивают альтернативный сплайсинг [11]. A. Ergun и соавт. [10] с помощью RNA-seq и микрочипов охарактеризовали альтернативные сплайс-изоформы в разных клеточных линиях иммунной системы мыши и собрали данные в базе Immunological Genome Project Consortium (www.immgen.org). Они показали, что 60% генов иммунной системы имеют сплайс-варианты. 70% таких генов связаны с дифференцировкой и клеточным циклом, и лишь немногие специфичны для отдельных популяций клеток. В то же время около 45% явлений альтернативного сплайсинга не затрагивают кодирующую белок часть генов и влияют не на аминокислотную последовательность белка, а на его экспрессию. Многие белки-регуляторы альтернативного сплайсинга сами имеют сплайс-изоформы, что делает регуляцию сплайсинга еще сложнее и, возможно, точнее. В другой работе N. Martinez и соавт. [12] показали, что многие гены, связанные с иммунной системой, изменяли характер сплайсинга при активации Т-клеток.

Метод RNA-seq применим для детекции химерных генов (фьюжн-генов или генных слияний), которые возникают в опухолевых клетках в результате хромосомных транслокаций [11]. Образование химерных генов особенно характерно для гематологических опухолей. Описано уже более 300 химерных генов [13]. Такие гены являются маркерами ряда опухолей и служат прогностическими факторами. Многие из них обладают онко-генной активностью и являются мишенями для терапии [14].

Следующий пример использования RNA-seq — определение аллельспецифичной экспрессии (АСЭ) генов [15, 16]. АСЭ — неодинаковая экспрессия материнского и отцовского аллелей — по оценкам для клеточных линий и опухолевых клеток, характерна для 30% генов [2]. Она может быть вызвана полиморфизмами, затрагивающими регуляторные области генов и влияющими на связывание транскрипционных факторов или эпигенетическую модификацию. При достаточном количестве чтений, приходящихся на гетерозиготный сайт, можно определить АСЭ. D. Edsgard и соавт. [15] анализировали образцы клеток крови человека до и после стимуляции липополисахаридов (LPS) и обнаружили гены с конститутивной и изменяющейся при стимуляции АСЭ. Объединение геномных данных с данными по RNA-seq позволило определить те случаи, в которых один аллель вовсе не экспрессиро-вался. Следующим этапом будет определение биологической значимости этого явления.

RNA-seq позволяет детектировать некодирующие РНК, например, микроРНК и длинные некодирующие РНК (днРНК) без предварительной информации об их последовательности. Некодирующие РНК играют важную роль в регуляции иммунных процессов, влияя на транскрипцию и трансляцию [17, 18]. В последнее время активно изучают роль днРНК в иммунной системе. G. Hu и соавт. [19] анализировали образцы Т-клеток разных стадий дифференцировки и описали более 1500 геномных локусов, содержащих гены днРНК. Большинство этих ло-кусов располагалось рядом с генами иммунной системы. Экспрессия многих днРНК регулировалась транскрипционными факторами T-bet, GATA-3, STAT4 и STAT6, что свидетельству -ет о взаимной регуляции генов иммунной системы и днРНК. V. Ranzani и соавт. [20] изучали днРНК в 13 субпопуляциях Ти В-клеток и определили более 500 новых днРНК. Оказалось,

что экспрессия генов днРНК более специфична для разных субпопуляций, чем экспрессия белоккодирующих генов.

Исследование того, как изменяется транскриптом клеток при различных заболеваниях, может помочь раскрыть механизмы патологических процессов и указать на возможные пути лечения. В то же время анализ транскрипционного ответа на терапию может показать эффективность лечения и прогноз. Уже есть работы, в которых с помощью RNA-seq анализировали действие IFN-a-терапии [21], сравнивали транскриптомы здоровых доноров и больных системной красной волчанкой [22], определяли мутационный статус генов тяжелых и легких цепей иммуноглобулинов [23], выясняли механизм действия вакцины [24]. Так, J. Hou и соавт. [21] изучали ответ моноцитов 14 пациентов с хроническим вирусным гепатитом С (HCV) на IFN-a-терапию и выяснили, что терапия активирует сигнальные компоненты каскада от рецептора TLR7. Это указывает на то, что для лечения хронического HCV могут применяться различные агонисты TLR7.

Наконец, многие исследования направлены на то, чтобы выявить механизмы взаимодействия патогена с организмом хозяина [25—28]. В процессе заражения в клетках хозяина изменяется экспрессия очень многих РНК, как белоккодирующих, так и регуляторных. Уровень экспрессии генов изменяется во времени с момента начала инфекции, поэтому для выявления регуляторных сигнальных путей, установления петель положительной и отрицательной обратной связи необходимо изучать транскрипционный ответ в динамике. C. Philipson и соавт. [28] по 6 временным точкам изучали динамику взаимодействия мышиных костномозговых макрофагов и внутриклеточной Helicobacter pylori. Ученым удалось выявить 3 волны ответа на инфекцию. Первая волна экспрессии включала антивоспалительные гены, вторая — в основном провоспалительные гены, экспрессировавшие-ся в течение длительного времени, третья волна состояла из генов интерферонового ответа. Согласно гипотезе авторов, цитокины первой волны ответа запускали отрицательную обратную связь для предотвращения избыточного воспаления.

Сложность в случае анализа транскриптома патогена заключается в том, чтобы выделить достаточное количество РНК патогена из тканей хозяина. Z. Bent и соавт. [29] разработали новый метод селекции патогенной РНК на основе гибридизации транскриптов патогена с биотинилированными комплементарными олигонуклеотидами. Метод позволяет повысить уровень патогенной РНК в образце в 100 раз.

Другой многообещающий подход, получивший название dual RNA-seq, состоит в совместном выделении РНК патогена и хозяина [5]. Он позволяет в динамике параллельно следить за транскрипционными изменениями клеток обоих организмов. Для этого не требуется заранее знать геном патогена, а разделение чтений на геномы патогена и хозяина происходит уже в стадии картирования.

В эксперименте по RNA-seq главной задачей является сохранение всего разнообразия молекул РНК. С этим связано два важных обстоятельства. Во-первых, количество РНК патогена и хозяина в образце сильно различается. Во-вторых, среди всех молекул РНК и у про-, и у эукариот преобладают рибосомаль-ные РНК (95%). При этом они несут мало информации, а интерес представляют молекулы РНК других классов, составляющие только 5% от всего образца. Следовательно, необходимо получить как можно больше молекул «информативных» РНК, сохранив при этом их разнообразие и не потеряв РНК патогена. По приблизительным оценкам, в клетке содержится в 10—20 раз больше РНК хозяина, чем РНК патогена. Тогда «информативная» РНК патогена составит только 0,25% всего образца (5% от общей РНК патогена, которая составляет 5% от РНК образца). Есть две возможности: обогатить образец «информативными» молекулами РНК, избавившись от рРНК, или анализировать тотальную РНК с большей глубиной секвенирования.

REVIEWS

В первом случае глубина секвенирования должна быть более 200 млн чтений для генома эукариот, чтобы получить 1 млн чтений на геном патогена. При втором подходе необходимо получить более 2000 млн чтений. Сейчас это является верхним пределом глубины секвенирования, но постоянное совершенствование технологий позволит преодолеть и это затруднение [5].

С помощью dual RNA-seq изучали взаимодействие самых разных патогенов с организмом хозяина как в моделях in vitro и in vivo, так и при анализе образцов пациентов. Две работы были посвящены исследованию взаимодействия Candida albicans с клетками хозяина в in vitro-модели инфекции эпителиальных клеток [30] и в in vivo-модели вульвовагинально-го кандидоза [31]. В обеих работах исследователи выявили сигнальные пути хозяина, которые активируются в ответ на заражение. Компоненты этих путей можно рассматривать как потенциальные мишени терапии. В двух других работах исследователи анализироали транскриптомы пациентов, зараженных Plasmodium falciparum [32] или Leishmania braziliensis [33]. J. Yamagishi и соавт. [32] с помощью dual RNA-seq искали полиморфизмы в геномах человека и P. falciparum, регулирующие экспрессию генов и связанные с тяжестью заболевания. Исследователи определили несколько молекул, повышенная экспрессия которых коррелировала с клиническими данными пациентов, а также идентифицировали SNPs в генах P. falciparum, связанные с приобретением устойчивости к антималярийным препаратам.

Наконец, A. Westermann и соавт. [34] использовали dual RNA-seq для изучения вклада малых РНК бактерии Salmonella enterica серовар Typhimurium в регуляцию инфекции. Было идентифицировано более 300 малых РНК, экспрессия которых изменялась на протяжении инфекции. Больше всего — в 100 раз — была повышена экспрессия малой РНК PinT, оказавшейся важным регулятором процессов инфицирования и выживания бактерий внутри клетки хозяина. Кроме того, PinT влияла на экспрессию более 15 тыс. РНК клеток хозяина. Многие из этих генов являлись компонентами каскада JAK/STAT.

Single-cell методы

До недавнего времени исследования в иммунологии (как и в клеточной биологии) вели по пути top—down — от клеточных популяций, которые по мере совершенствования технологий разделяли на многочисленные субпопуляции с различными свойствами [35]. Субпопуляции чаще всего выделяют по маркерам — поверхностным белковым молекулам, заранее выбранным исследователем. Остается вероятность, что при выборе дополнительных или других маркеров классификация окажется иной. В последние несколько лет благодаря развитию методов, позволяющих изучать единичные клетки, стало понятно, что популяции клеток высокоге-терогенны по целому ряду характеристик. Начался переход к исследованиям по пути bottom—up: популяция больше не представляется гомогенной, реагирующей как единой целое, и возникло стремление понять особенности отдельных клеток, их взаимодействие друг с другом и индивидуальный вклад в свойства всей популяции.

В целом вариабельность не влияет на общий фенотип (популяции клеток, органы, организм устойчивы к малым отклонениям), но за ней могут быть скрыты механизмы функционирования клеточных популяций, важные для понимания работы иммунной системы, развития и лечения заболеваний. Так, было показано, что в начале инфекции ген IFN-ß экс-прессируется стохастично в некоторых клетках благодаря определенной концентрации лимитирующих факторов, необходимых для активации его экспрессии [36]. Секретиро-ванный IFN-ß запускает мощный ответ в соседних клетках. По предположению M. Zhao и соавт. [36] такой механизм способствует поддержанию уровня и распределению IFN-ß в условиях инфекции и защищает от гиперответа. Интересно было бы выяснить, как на уровне отдельных клеток регули-

ОБЗОРЫ

руется синтез и секреция конститутивного IFN-fi, избыточную продукцию которого связывают с аутоиммунными заболеваниями.

По всей видимости, гетерогенность популяций является нормой. Главная задача — увидеть в этой гетерогенности смысл и отличить флюктуации от значимых различий. Необходимо понять, как связана вариабельность на разных уровнях и как она влияет на общий фенотип [38].

Методы исследования единичных клеток, и single-cell RNA-seq не исключение, связаны со многими сложностями [35]. Поскольку каждая клетка уникальна, повторностей в эксперименте быть не может. Нужны биоинформатические методы, чтобы различить биологическую и техническую вариабельность между клетками. Следующий вопрос состоит в том, сколько клеток необходимо брать в эксперимент, чтобы захватить важные различия и редкие особенные клетки. Соображения по этому поводу содержатся в обзоре N. Navin и соавт. [39]. По приведенному расчету, чтобы с максимальной надежностью детектировать субклон, встречающийся с частотой 10%, требуется проанализировать 50 единичных клеток. В экспериментах по single-cell RNA-seq приходится работать с очень малым количеством РНК, потери и деградация материала становятся очень ощутимыми. Необходимы особые методики выделения, амплификации и секвенирования для малого количества РНК, чтобы как можно меньше изменить исходное соотношение молекул РНК в образце. Кроме того, нужно учесть, что клетки могут находиться в разной стадии клеточного цикла, и основной вклад в наблюдаемые различия будет вносить экспрессия генов, связанных с клеточным циклом и делением. F. Buettner и соавт. [40] предложили биоинформа-тический метод, позволяющий учитывать стадию клеточного цикла и вносить поправку для всех генов. Как отмечают авторы статьи, этот подход пригоден для коррекции данных с учетом не только клеточного цикла, но и других «маскирующих» факторов. Однако необходимо, чтобы были заранее аннотированы гены, экспрессия которых связана с действием данного фактора.

С помощью метода single-cell RNA-seq можно получить разнообразные иммунологические данные. Во-первых, применяя кластерный анализ, можно идентифицировать новые субпопуляции клеток. Так, B. Mahata и соавт. [41] выделили субпопуляцию ТЬ2-клеток, синтезирующих стероид прегне-нолон. Эту популяцию выделили по специфичному маркеру Ly6C и показали, что она способна подавлять пролиферацию Th1- и №2-клеток при совместном культивировании (правда, нельзя исключить влияния ИЛ-10, ингибирование которого, как и ингибирование синтеза стероидов, вызывало частичное восстановление пролиферации).

Другое направление — изучение вариабельности популяций при их ответе на различные стимулы [3, 42]. С помощью микрофлюидики и single-cell RNA-seq A. Shalek и соавт. [42] исследовали транскрипционный ответ более 1700 дендритных клеток на 3 типа лигандов TLR. Экспрессия многих генов имела бимодальное распределение: при стимуляции часть клеток повышала экспрессию этих генов, а часть — нет. Для запуска ответа оказалась важна аутокринная и пара-кринная регуляция. При стимуляции экспрессионный ответ, включающий синтез интерферонов (IFN) 1-го типа, начинался очень рано в нескольких клетках, а потом активировался в остальных. В клетках мышей, нокаутных по IFN-р, экспрессии антивирусных генов не происходило. Когда исследователи нарушили взаимодействия между клетками, поместив клетки в индивидуальные ячейки, бимодальная экспрессия многих антивирусных генов по-прежнему наблюдалась. Это свидетельствует о наличии внутренних факторов, определяющих тип ответа клетки. В условиях изоляции повышалась экспрессия генов острого воспаления, причем у многих генов бимодальная экспрессия сменялась унимодальной. A. Shalek и соавт. предположили, что взаимодействия между клетками

необходимы для блокировки избыточного воспаления по па-ракринному механизму.

Наконец, можно использовать single-cell RNA-seq для изучения взаимодействия единичных клеток хозяина с патогеном. R. Avraham и соавт. [43] исследовали ответ макрофагов на инфекцию Salmonella [43]. Оказалось, что синтез IFN 1-го типа макрофагами зависит от активности бактериального фермента PhoPQ. Лишь в некоторых бактериальных клетках этот фермент модифицирует LPS, который и вызывает ин-терфероновый ответ макрофагов. Эта работа показывает, что в развитие иммунного ответа и течение заболевания может вносить вклад не только гетерогенность клеточных популяций хозяина, но и гетерогенность популяций бактериальных клеток.

Заключение

Таким образом, недавно появившийся высокопроизводительный метод RNA-seq является незаменимым для многих иммунологических исследований. С его помощью описывают структурные элементы генома, участвующие в регуляции иммунных процессов. Он применяется для анализа дифференциальной экспрессии генов, чтобы выявить новые субпопуляции клеток, проследить процесс дифференциров-ки клеток или развитие иммунного ответа, а также определить различия между нормой и патологическим состоянием. Dual RNA-seq позволяет изучать взаимодействие между патогеном и хозяином. С помощью single-cell RNA-seq исследуют гетерогенность популяций иммунных клеток и вклад отдельных клеток в свойства всей популяции. Объединение данных RNA-seq с геномными данными, а также с результатами метаболомики, протеомики и других омиксных технологий позволит получить еще более целостный взгляд на иммунные процессы. Развитие метода RNA-seq неотделимо от совершенствования методов биоинформатической обработки данных, поскольку с увеличением объема и сложности данных возрастают проблемы с отделением сигнала от шума и прослеживание закономерностей. Можно заключить, что полномасштабный анализ транскриптомов с помощью RNA-seq позволит лучше понять протекание иммунологических процессов, механизмы развития заболеваний и разработать новые лекарства.

Финансирование. Работа была выполнена при финансовой поддержке грантом РНФ 14-15-00702.

Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.

литература (references)

1. Wang Z., Gerstein M., Snyder M. RNA-Seq: a revolutionary tool for transcriptomics. Nature Rev. Genet. 2009; 10(1): 57—63.

2. Kukurba K.R., Montgomery S.B. RNA sequencing and analysis. Cold Spring Harb. Protoc. 2015(11): pdb.top084970.

3. Satija R., Shalek A.K. Heterogeneity in immune responses: from populations to single cells. Trends Immunol. 2014; 35(5): 219—29.

4. Han Y., Guo S., Muegge K., Zhang W., Zhou B. Advanced applications of RNA sequencing and challenges. Bioinforma Biol. Insights. 2015; 29.

5. Westermann A.J., Gorski S.A., Vogel J. Dual RNA-seq of pathogen and host. Nature Rev. Microbiol. 2012; 10(9): 618—30.

6. Janes J., Hu F., Lewin A., Turro E. A comparative study of RNA-seq analysis strategies. Brief Bioinform. 2015; 16(6): 932—40.

7. Rapaport F., Khanin R., Liang Y., Pirun M., Krek A., Zumbo P. et al. Comprehensive evaluation of differential gene expression analysis methods for RNA-seq data. Genome Biol. 2013; 14(9): R95.

8. Quinn E.M., Cormican P., Kenny E.M., Hill M., Anney R., Gill M. et al. Development of strategies for SNP detection in RNA-seq data: Application to lymphoblastoid cell lines and evaluation using 1000 genomes data. Futscher B.W., editor. PLoS One. 2013; 8(3): e58815.

9. Zhang W., Edwards A., Flemington E.K., Zhang K. Inferring polymorphism-induced regulatory gene networks active in human lymphocyte cell lines by weighted linear mixed model analysis of multiple RNA-seq datasets. Csermely P., editor. PLoS One. 2013; 8(10): e78868.

10. Ergun A., Doran G., Costello J.C., Paik H.H., Collins J.J., Mathis D. et al. Differential splicing across immune system lineages. Proc. Natl. Acad. Sci. USA. 2013; 110(35): 14324—9.

11. Ozsolak F., Milos P.M. RNA sequencing: advances, challenges and opportunities. Nature Rev. Genet. 2011; 12(2): 87—98.

12. Martinez N.M., Pan Q., Cole B.S., Yarosh C.A., Babcock G.A., Heyd F. et al. Alternative splicing networks regulated by signaling in human T cells. RNA. 2012; 18(5): 1029—40.

13. Mitelman F., Johansson B., Mertens F. The impact of translocations and gene fusions on cancer causation. Nature Rev. Cancer. 2007; 7(4): 233—45.

14. Nambiar M., Kari V., Raghavan S.C. Chromosomal translocations in cancer. Biochim. Biophys. Acta. 2008; 1786(2): 139—52.

15. Edsgärd D., Iglesias M.J., Reilly S.-J., Hamsten A., Tornvall P., Odeberg J. et al. GeneiASE: Detection of condition-dependent and static allele-specific expression from RNA-seq data without haplotype information. Sci. Rep. 2016; 6: 21134.

16. Wood D.L.A., Nones K., Steptoe A., Christ A., Harliwong I., Newell F. et al. Recommendations for accurate resolution of gene and isoform allele-specific expression in RNA-seq data. Jordan I.K., editor. PLoS One. 2015; 10(5): e0126911.

17. Turner M., Galloway A., Vigorito E. Noncoding RNA and its associated proteins as regulatory elements of the immune system. Nature Immunol. 2014; 15(6): 484—91.

18. Heward J.A., Lindsay M.A. Long non-coding RNAs in the regulation of the immune response. Trends Immunol. 2014; 35(9): 408—19.

19. Hu G., Tang Q., Sharma S., Yu F., Escobar T.M., Muljo S.A. et al. Expression and regulation of intergenic long noncoding RNAs during T cell development and differentiation. Nature Immunol. 2013; 14(11): 1190—8.

20. Ranzani V., Rossetti G., Panzeri I., Arrigoni A., Bonnal R.J.P., Curti S. et al. The long intergenic noncoding RNA landscape of human lymphocytes highlights the regulation of T cell differentiation by linc-MAF-4. Nature Immunol. 2015; 16(3): 318—25.

21. Hou J., Groothuismink Z.M.A., Koning L., Roomer R., van IJcken W.F.J., Kreefft K. et al. Analysis of the transcriptome and immune function of monocytes during IFNa-based therapy in chronic HCV revealed induction of TLR7 responsiveness. Antiviral Res. 2014; 109: 116—24.

22. Shi L., Zhang Z., Yu A.M., Wang W., Wei Z., Akhter E. et al. The SLE transcriptome exhibits evidence of chronic endotoxin exposure and has widespread dysregulation of non-coding and coding RNAs. Prokunina-Olsson L., editor. PLoS One. 2014; 9(5): e93846.

23. Blachly J.S., Ruppert A.S., Zhao W., Long S., Flynn J., Flinn I. et al. Immunoglobulin transcript sequence and somatic hypermutation computation from unselected RNA-seq reads in chronic lymphocytic leukemia. Proc. Natl. Acad. Sci. USA. 2015; 112(14): 4322—7.

24. Hoek K.L., Samir P., Howard L.M., Niu X., Prasad N., Galassie A. et al. A cell-based systems biology assessment of human blood to monitor immune responses after influenza vaccination. Yu X., editor. PLoS One. 2015; 10(2): e0118528.

25. Chang S.T., Thomas M.J., Sova P., Green R.R., Palermo R.E., Katze M.G. Next-generation sequencing of small RNAs from HIV-infected cells identifies phased microRNA expression patterns and candidate novel microRNAs differentially rxpressed upon infection. mBio. 2013; 4(1): e00549-12-e00549-12.

26. Aulicino A., Dinan A.M., Miranda-CasoLuengo A.A., Browne J.A., Rue-Albrecht K., MacHugh D.E. et al. High-throughput transcriptomics reveals common and strain-specific responses of human macrophages to infection with mycobacterium abscessus smooth and rough variants. BMC Genom. [Internet]. 2015 Dec [cited

REVIEWS

2016 Jan 28];16(1). Available from: http://www.biomedcentral. com/1471-2164/16/1046

27. Kaakoush N.O., Deshpande N.P., Man S.M., Burgos-Portugal J.A., Khattak F.A., Raftery M.J. et al. Transcriptomic and proteomic analyses reveal key innate immune signatures in the host response to the gastrointestinal pathogen campylobacter concisus. Blanke S.R., editor. Infect. andlmmun. 2015; 83(2): 832—45.

28. Philipson C.W., Bassaganya-Riera J., Viladomiu M., Kronsteiner B., Abedi V., Hoops S. et al. Modeling the regulatory mechanisms by which NLRX1 modulates innate immune responses to helicobacter pylori infection. Chakravortty D., editor. PLoS One. 2015; 10(9): e0137839.

29. Bent Z.W., Tran-Gyamfi M.B., Langevin S.A., Brazel D.M., Hamblin R.Y., Branda S.S. et al. Enriching pathogen transcripts from infected samples: A capture-based approach to enhanced host-pathogen RNA sequencing. Analyt. Biochem. 2013; 438(1): 90—6.

30. Liu Y., Shetty A.C., Schwartz J.A., Bradford L.L., Xu W., Phan Q.T. et al. New signaling pathways govern the host response to C. albicans infection in various niches. Genome Res. 2015; 25(5): 679—89.

31. Bruno V.M., Shetty A.C., Yano J., Fidel P.L., Noverr M.C., Peters

B.M. Transcriptomic analysis of vulvovaginal candidiasis identifies a role for the NLRP3 inflammasome. mBio. 2015; 6(2): e00182-15.

32. Yamagishi J., Natori A., Tolba M.E.M., Mongan A.E., Sugimoto

C., Katayama T. et al. Interactive transcriptome analysis of malaria patients and infecting Plasmodium falciparum. Genome Res. 2014; 24(9): 1433—44.

33. Maretti-Mira A.C., Bittner J., Oliveira-Neto M.P., Liu M., Kang D., Li H. et al. Transcriptome patterns from primary cutaneous leishmania braziliensis Infections associate with eventual development of mucosal disease in humans. Tschudi C., editor. PLoSNegl. Trop. Dis. 2012; 6(9): e1816.

34. Westermann A.J., Förstner K.U., Amman F., Barquist L., Chao Y., Schulte L.N. et al. Dual RNA-seq unveils noncoding RNA functions in host—pathogen interactions. Nature. 2016; 529(7587): 496—501.

35. Proserpio V., Mahata B. Single-cell technologies to study the immune system. Immunology. 2016; 147(2): 133—40.

36. Zhao M., Zhang J., Phatnani H., Scheu S., Maniatis T. Stochastic expression of the interferon-ß Gene. Ploegh H.L., editor. PLoS Biol. 2012; 10(1): e1001249.

37. Gough D.J., Messina N.L., Clarke C.J.P., Johnstone R.W., Levy D.E. Constitutive type I interferon modulates homeostatic balance through tonic signaling. Immunity. 2012; 36(2): 166—74.

38. Dueck H., Eberwine J., Kim J. Variation is function: Are single cell differences functionally important?: Testing the hypothesis that single cell variation is required for aggregate function. BioEssays. 2016; 38(2): 172—80.

39. Navin N.E. The first five years of single-cell cancer genomics and beyond. Genome Res. 2015; 25(10): 1499—507.

40. Buettner F., Natarajan K.N., Casale F.P., Proserpio V., Scialdone A., Theis F.J. et al. Computational analysis of cell-to-cell heterogeneity in single-cell RNA-sequencing data reveals hidden subpopulations of cells. Nature Biotechnol. 2015; 33(2): 155—60.

41. Mahata B., Zhang X., Kolodziejczyk A.A., Proserpio V., Haim-Vilmovsky L., Taylor A.E. et al. Single-cell RNA sequencing teveals T helper cells synthesizing steroids de novo to contribute to immune homeostasis. Cell Rep. 2014; 7(4): 1130—42.

42. Shalek A.K., Satija R., Adiconis X., Gertner R.S., Gaublomme J.T., Raychowdhury R. et al. Single-cell transcriptomics reveals bimodality in expression and splicing in immune cells. Nature. 2013; 498(7453): 236—40.

43. Avraham R., Haseley N., Brown D., Penaranda C., Jijon H.B., Trombetta J.J. et al. Pathogen cell-to-cell variability drives heterogeneity in host immune responses. Cell. 2015; 162(6): 1309—21.

Поступила 17.10.16 Принята в печать 03.11.16