УДК 595.42
Ю. И. Молородов 1, С. И. Рюмкин 2, А. М. Федотов 3
1 Институт вычислительных технологий СО РАН пр. Акад. Лаврентьева, 6, Новосибирск, 630090, Россия
2 Сибирский государственный университет телекоммуникаций и информатики ул. Кирова, 86, Новосибирск, 630102, Россия
3 Новосибирский государственный университет ул. Пирогова, 2, Новосибирск, 630090, Россия
[email protected], [email protected], [email protected]
WEB-РЕСУРС для мониторинга ГЕНЕТИЧЕСКОГО РАЗНООБРАЗИЯ КЛЕЩЕЙ И ПЕРЕНОСИМЫХ ПАТОГЕНОВ
Исследование генетического разнообразия клещевого энцефалита (КЭ) в образцах индивидуальных клещей I. persulcatus и I. pavlovskiy является одной из актуальных проблем современной молекулярной биологии и биоинформатики в наступившую после 2000 г. «пост-геномную эпоху». В основном это связано с полным секвенирова-нием геномов в рамках масштабных международных программ. Подобное исследование предполагает объединение имеющихся компьютерных ресурсов и баз данных по молекулярной биологии. Важной задачей исследований в этом направлении являлась оценка молекулярно-генетического разнообразия бактерий Borrelia spp., циркулирующих на территории Сибири. Для последующего полногеномного секвенирования проводилось культивирование двух видов боррелий, выбирались генетические варианты, выявляемые на территории Северной Азии. Еще одной из задач является определение молекулярно-генетического разнообразия потенциально патогенных для человека микроорганизмов (вирус клещевого энцефалита, анаплазмы, эрлихии, бабезии и пр.). Эмпирические материалы полевых исследований, являются основой для оценки молекулярно-генетического разнообразия бактерий Borrelia spp., циркулирующих на территории Сибири. Для последующего полногеномного секвенирования было проведено культивирование двух индивидуальных клещей I. persulcatus и I. pavlovskiy и выбраны генетические варианты, часто выявляемые на территории Западной Сибири. На основе фактографического материала по сбору клещей в полевых экспедициях на территории Северной Азии и результатов полногеномного секвенирования, разработана архитектура и создан пилотный вариант интерактивной информационной системы (ИС), предназначенной для организации процессов сбора, хранения и обработки данных полевых работ, расселения и миграции клещей и переносимых ими патогенов. С ее помощью построена интерактивная карта с отображением мест полевых сборов и биотопа местности, включая разделы публикаций, просмотра численности клещей и численности клещей по полу. Реализована возможность просмотра встречаемости инфекций и генов. Создан блок анализа имеющихся данных.
Ключевые слова: интерактивность, информационные системы, интеграция данных, клещи, секвенирование, боррелиоз, энцефалит.
Введение
Россия - один из самых больших в мире ареалов инфекционных заболеваний, передающихся клещами. Клещи встречаются в самых разнообразных географических ландшафтах,
Мстородов Ю. И., Рюмкин С. И., Федотов А. М. Web-ресурс для мониторинга генетического разнообразия клещей и переносимых патогенов // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2016. Т. 14, № 2. С. 91-99.
ISSN 1818-7900. Вестник НГУ. Серия: Информационные технологии. 2016. Том 14, № 2 © Ю. И. Молородов, С. И. Рюмкин, А. М. Федотов, 2016
с которыми связано существование природных очагов инфекционных болезней человека. Разновидности клещей были обнаружены достаточно давно. Показателем являются даты их первоначального описания: I. persulcatus (Schulze 1930), Ixodes pavlovskyi (Pomerantzev 1946), Ixodes kashmiricus (Pomerantzev 1948), Ixodes riipponensis (Kitaoka et Saito 1967), Ixodes ka-zakstani (Olenev et Sorokoumov 1934) и I. ricinus (L. 1758). Кроме таежного Ixodes persulcatus, обнаружился еще более опасный Ixodes pavlovskyi.
Эти насекомые являются переносчиками различных инфекций: клещевой энцефалит, бор-релиоз, эрлихиоз и пр. Самым распространенным является клещевой (эпидемический) энцефалит. Тяжелые осложнения острой инфекции могут завершиться параличом и летальным исходом. Проблема такова, что «список инфекционных агентов, переносимых клещами, постоянно растет, но набор пригодных диагностикумов, вакцин и лекарств пополняется значительно медленнее». Эти существа живут повсеместно, их находили даже на пингвинах антарктических островов [1]. Природные очаги клещевого энцефалита зарегистрированы во всех лесных и таежных районах. Особенно высока заболеваемость в Приуралье, на Урале и в Сибири [2].
В Сибири переносчиком возбудителя тяжелейшей (с летальностью до 25 % в период вспышек) болезни - клещевого энцефалита - традиционно считался Ixodes persulcatus, он же таежный клещ. Но буквально в последние годы стал стремительно распространяться Ixodes pav-lovskyi - наиболее опасный носитель инфекций. По материалам обследования окрестностей Новосибирского научного центра, зараженность Ixodes pavlovskyi вирусом клещевого энцефалита, патогенным для лабораторных мышей (и для человека), почти втрое выше, чем у собранных в этой же местности Ixodes persulcatus.
Эти обстоятельства и были причиной начала работы по созданию интерактивной информационной системы (ИС) «Genomics of tick-borne pathogen» 1.
Контроль над распространением основных клещей-переносчиков и их инфицированностью боррелиями осуществлялся с помощью регулярного анализа состояния природных очагов, при проведении полевых наблюдений [3]. Изучение природных очагов производилось в десяти административных территориях (Омской, Курганской, Новосибирской, Томской, Тюменской, Челябинской областях, Алтайском, Красноярском и Приморском краях и Республике Алтай), расположенных в различных ландшафтно-географических зонах.
Постановка задачи
Для обеспечения эффективных мер профилактики необходим пространственный и временной анализ распространения клещей, в том числе инфицированных разными возбудителями. В этой связи одним из наиболее перспективных способов контроля над возбудителями инфекций может стать система постоянного наблюдения.
Технология определения последовательности нуклеотидов ДНК всего генома (секвениро-вания) обеспечивает возможность анализа связи полиморфизма сотен тысяч SNP - маркеров, рассеянных по всему геному, с набором патогенов, переносимых клещами.
Процедура анализа включает взятие биологического материала, выделение ДНК, геноти-пирование на чипах и статистический анализ полученных данных.
Первым шагом к созданию подобной системы является пространственный и временной анализ на основе геоинформационных технологий зараженности некоторых территорий Сибири, Алтая и Казахстана патогенами вирусов, переносимых клещами [4-5].
Для работы с собранным материалом была разработана современная интерактивная информационная система (ИС) «Genomics of tick-borne pathogen» [5-6]. С ее помощью появилась возможность пополнения, хранения и обработки данных полевых наблюдений за расселением, миграцией клещей и переносимыми ими патогенами. Кроме указания современных средств
1 URL: http://tick1.ict.sbras.ru/.
диагностики патогенов на основе алгоритмов секвенирования, были постороены алгоритмы работы с интерактивной картой с возможностью отображения мест сбора насекомых и информации о них, включая публикацию материалов исследований. Для специалистов появилась необходимость реализации возможности просмотра численности клещей в местах наблюдения по датам и географическим местам проведения работ, по типу и полу, а также встречаемости инфекций и генов.
Архитектура информационной системы
Архитектуру ИС определяют его компоненты, их функции и взаимодействие. Система построена на основе технологии «клиент - сервер» и состоит из клиентской части, серверной и СУБД MYSQL. Клиент - сервер - вычислительная либо сетевая архитектура, в которой задания или сетевая нагрузка распределены между поставщиками услуг, называемыми серверами, и заказчиками услуг, называемыми клиентами. Физически клиент и сервер - это программное обеспечение. Они взаимодействуют через компьютерную сеть посредством сетевых протоколов и находятся на разных вычислительных машинах, но могут выполняться также и на одной машине. Программы - сервера ожидают от клиентских программ запросы и предоставляют им свои ресурсы в виде данных или сервисных функций. В описываемой архитектуре клиентом выступает браузер (пользователь), а сервером - веб-сервер. Логика системы распределена между сервером и клиентом, хранение данных осуществляется в СУБД MYSQL, обмен информацией происходит по сети. Важным преимуществом подобного подхода является то обстоятельство, что клиенты не зависят от конкретной операционной системы пользователя, следовательно, система представляет собой межплатформенный сервис.
Важный компонент - клиентская часть приложения. В ее основе лежит использование картографического сервиса Google Maps Javascript API, целиком ориентированного на применение языка JavaScript, который является языком программирования клиентских сценариев. Существенное преимущество - асинхронное взаимодействие с веб-сервером по актуальной на сегодняшний день технологии AJAX. Главенствующее положение в ней отводится клиентским сценариям, написанным на JavaScript. В пользу языка JavaScript выступают его низкие требования к аппаратным и программным платформам, а требования к серверному программному компоненту аппаратно-программного комплекса и вовсе сводятся к минимуму.
Клиентская часть реализует пользовательский интерфейс, формирует запросы к серверу и обрабатывает ответы от него. Интерфейс пользователя, или веб-интерфейс, представляет собой совокупность средств, при помощи которых пользователь взаимодействует с веб-сайтом или любым другим приложением через браузер. Веб-интерфейсы получили широкое распространение в связи с ростом популярности всемирной паутины и соответственно - повсеместного распространения веб-браузеров.
Одним из основных требований к веб-интерфейсам являются их стандартный внешний вид и неизменная функциональность при работе в различных браузерах. Основное преимущество веб-интерфейсов - отсутствие необходимости установки дополнительного программного обеспечения, так как популярные операционные системы поставляются с уже установленным браузером.
Основные модули информационной системы
Функциональность ИС обеспечивает совокупность программных реализаций, выполненных в виде отдельных модулей. Особенно выделим 8 из них (рис. 1).
1. Модуль импорта данных загружает данные из файла формата *.csv в базу данных.
2. MYSQL - система управления базами данных, в базе данных acarids хранятся все дан-
3. Модуль обработки данных на сервере отвечает за выгрузку данных из баз данных и за дополнение изменений данных в базу данных.
4. Модуль слежения за пользователем - реагирует на действие пользователя и в зависимости от логического значения выбирает нужное действие.
5. Модуль визуализации отвечает за отображение информации на экране.
6. Модуль редактирования - компонент, отвечающий за редактирование информации.
7. Модуль отчетов отвечает за создание и обработку отчетов.
8. Модуль запросов - компонент, отвечающий за показ информации по вариабельности генов и инфекций.
Каждый модуль выполняет самостоятельную функцию. В случае необходимости внесения изменений в тот или иной модуль надо просто поменять определенную функцию. Каждый модуль можно расширять и усовершенствовать, добавлять новый функционал.
Рис. 1. Модули информационной системы
А- '
Ч >
м
▼
1
*
т
т
*
т
Х74
л
%
ГСтк>1
Т
* ■
Т]4н<гтн
?
14» ■ 1мп
Рис. 2. Интерфейс пользователя
Чкмнность по 1чп«и кяещач
Закрыть
Алгя.Ч Алтаа-С^аям^казгдр.ная¡страна|
0стр»чЛ НССТЬ Инфкш.'
I УНЕ
20»
ЗакрЫТЬ шмсыядортг^ км на юг <?¥ Хабаровска ] Закрыть Хабаровск
Чисммксть по гнлу
9СТрГ<9|инТк Г*Н01
ШШ ЛЗР м |;"хг
20
1!
Ю
Рис. 3. Окна с атрибутивной информацией
Отображение данных и результатов анализа
После запуска браузера пользователь вводит в строку адреса URL информационной системы. Это приводит к передаче потока HTML-кода, графики и клиентских сценариев на его компьютер. На стороне клиента браузер выполняет рендеринг полученного кода и представляет пользователю набор визуальных элементов управления: интерактивную карту, инструменты навигации и масштабирования и инструменты переключения типа карты (рис. 2)
Интерактивная карта - основная составляющая интерфейса системы. Интерактивный режим позволяет легко перемещаться по карте и изменять масштаб. На карте маркерами отображены места сбора полевых исследований клещей. Инструменты навигации и масштабирования - состоят из различных кнопок, обеспечивающих навигацию и масштабирование карты.
Объекты, расположенные на карте, имеют различную атрибутивную информацию (рис. 3), которая всплывает в виде окна при нажатии на маркер, как показано на рис. 2. Она включает в себя: физическое название, административное название, период исследований, климат, координаты, обнаруженных клещей, публикации, численность клещей, численность клещей по полу, встречаемость генов и инфекций.
Заключение
Разработана интерактивная информационная система (ИС), предназначенная для работы с результатами полевых работ, включая данные по расселению, миграции клещей и переносимых ими патогенов 2.
Информационная система содержит базу данных с таблицами, содержащими информацию по данным полевых работ. Создана серверная и клиентская части информационной системы, построена интерактивная карта с отображением мест полевых сборов и информации о них, реализована возможность пополнения и редактирования данных о местах полевых сборов и обнаруженных клещах, разработана возможность просмотра численности клещей, численности клещей по полу и встречаемости инфекций и генов.
Список литературы
1. Доклад на заседании президиума Сибирского отделения РАН директора Института химической биологии и фундаментальной медицины СО РАН академика В. В. Власова и др. Новосибирск. 03.06.2015.
2. Ружников Г. М. и др. Современные технологии информационно-аналитической оценки // Бюл. СО РАМН. 2012. Т. 32, № 6. 57. С. 55-59.
3. Ливанова Н. Н., Боргояков В. Ю., Ливанов С. Г., Фоменко Н. В. Характеристика природных очагов клещевых боррелиозов Новосибирского научного центра и Новосибирской области // Сибирский медицинский журнал. 2012. Т. 111, № 4. С. 20-23.
4. Молородов Ю. И., Федотов А. М. Исследование динамики ареалов распространения клещей и переносимых ими бактериальных патогенов на территории азиатской части России // Междунар. конф. «Прикладной и геометрический анализ» (Самарканд, Узбекистан, 22-25 сентября 2014 г., Тез. докл. Новосибирск, 2014. С. 68. ISBN 978-5-7782-2494-0.
5. Мальцев В. Ю., Молородов Ю. И., Скачков Д. М. Технология извлечения информации об ареалах распространения видов бактериальных патогенов, переносимых иксодовыми клещами // XV Рос. конф. с междунар. участием «Распределенные информационно-вычислительные ресурсы». Новосибирск. 2-5 декабря 2014 г. URL: http://konf.ict.nsc.ru/dicr2014/report-view/249374
2 URL: http://metalls.ict.nsc.ru/acarids/
6. Tkachev S., Panov V, Dobler G., Tikunova N. First detection of Kemerovo virus in Ixodes pavlovskyi and Ixodes persulcatus ticks collected in Novosibirsk region, Russia // Ticks tick-borne dis. 2014.
Материал поступил в редколлегию 16.12.2015
Yu. I. Molorodov 1, S. I. Rumkin 2, A. M. Fedotov 3
1 Institute of Computational Technologies SB RAS 6Acad. Lavrent'ev Ave., Novosibirsk, 630090, Russian Federation
2 Siberian State University of Telecommunications and Information Sciences 86 Kirov Str., Novosibirsk, 630102, Russian Federation
3 Novosibirsk State University 2 Pirogov Str., Novosibirsk, 630090, Russian Federation
[email protected], [email protected], [email protected]
WEB-RESOURCE FOR MONITORING THE GENETIC DIVERSITY OF THE TICK-BORNE PATHOGENS
A study of the genetic diversity of tick-borne encephalitis (TBE) in the samples of individual ticks I. persulcatus and I. pavlovskiy, is one of the urgent problems of modern molecular biology and bioinformatics to come after 2000, "the post-genomic era." Basically, this is due to the complete sequencing of genomes as part of large-scale international programs. This study suggests combining existing computer resources and databases on molecular biology. An important task of research in this direction was to evaluate the molecular and genetic diversity of bacteria Borrelia spp. Circulating on the territory of Siberia. For further cultivation of the full genome sequencing was carried out two types of Borrelia, selected genetic variants often detected in Western Siberia. Another of the objectives is to determine the molecular genetic diversity of potentially pathogenic microorganisms to humans (tick-borne encephalitis virus, anaplasma, ehrlichia, babesia). Empirical field research are the basis for evaluation of molecular genetic diversity of bacteria Borrelia spp., Circulating on the territory of Siberia. For subsequent whole genome sequencing was conducted cultivation of the two individual ticks I. persulcatus and I. pavlovskiy and selected genetic variants often detected in Western Siberia. On the basis of factual material for the collection of mites in field expeditions on the territory of the Altai, Kazakhstan and Siberia, and the results of whole genome sequencing, developed the architecture and created a pilot version of an interactive information system (IS), intended for the organization of the collection, storage and processing of field work, resettlement and Migration ticks and they carry pathogens. With it built an interactive map displaying locations of field gathering and habitat areas, including sections of publications show the number of ticks and mites population by sex. The possibility of watching the occurrence of infections and genes. Created block analysis of existing data.
Keywords: interactivity, information systems, data integration, mites, sequencing, Lyme disease, encephalitis.
References
1. Report on the meeting of the Presidium of the Siberian Branch of the Russian Academy of Sciences, director of the Institute of Chemical Biology and Fundamental Medicine of the SB RAS Academician VV Vlasov et al., Russia, Novosibirsk. 03.06.2015 (In Russ.)
2. Ruzhnikov G. M. and others. Modern technologies of information and analytical assessment // SB RAMS Bulletin, Volume 32, number 6, 2012 57, p. 55-59. (In Russ.)
3. Livanov N., Borgoyakov V. Y., Livanov S. G., Fomenko N. V. Characteristics of natural foci of tick-borne borreliosis Novosibirsk Scientific Center and the Novosibirsk region // Siberian Journal of Medicine, 2012, vol.111, no. 4, p. 20-23. (In Russ.)
4. Molorodov Y. I., Fedotov A. M. Research of dynamics of habitats and the spread of ticks they carry bacterial pathogens in the Asian part of Russia // International Conference «Applied and geometric analysis» (Samarkand, Uzbekistan, 22-25 September 2014. Abstracts. Novosibirsk, 2014, S. 68-68. ISBN 978-5-7782-2494-0. (In Russ.)
5. Maltsev V. Y., Molorodov Y. I., Skachkov D. M. The technology of extracting information about the habitats of species of bacterial pathogens carried by ticks // XV Russian conference with international participation «The distributed information - computing resources» 2-5 December 2014, Novosibirsk. URL: http: //konf.ict.nsc.ru/dicr2014/ reportview / 249374. (In Russ.)
6. Tkachev S., Panov V., Dobler G., Tikunova N. First detection of Kemerovo virus in Ixodes pavlovskyi and Ixodes persulcatus ticks collected in Novosibirsk region, Russia // Ticks tick-borne dis. 2014, 5: p. 494-496.