Вычислительные технологии
Том 21, Специальный выпуск 1, 2016
Использование библиотеки Leaflet для визуализации и анализа зараженности территорий клещевыми инфекциями
Ю.И. МОЛОРОДОВ1*, В.В. ЧЕРНЕНКО2
1Институт вычислительных технологий СО РАН, Новосибирск, Россия 2Новосибирский национальный исследовательский государственный университет, Россия
*Контактный e-mail: [email protected]
Для специалистов в области молекулярной биологии разработана информационная система с удобным пользовательским интерфейсом на основе интерактивной географической карты. Карта строится с помощью Leaflet-библиотеки с открытым исходным кодом, базирующейся на языке JavaScript. С помощью Leaflet-библиотеки с сервера OpenStreetMap загружается лег-комасштабируемое векторное изображение географической карты. Навигация по карте осуществляется стандартными графическими веб-интерфейсами, при помощи которых производятся выбор территории проведения работ и визуализация статистического материала с указанием типа насекомых и переносимых ими патогенов.
Ключевые слова: локус, патоген, клещ, инфекционные агенты, зараженность территорий, секвенирование, риккетсии, боррелиоз, энцефалит.
Введение
Россия — один из самых больших в мире ареалов инфекционных заболеваний, передающихся клещами. Клещи встречаются в самых разнообразных географических ландшафтах, с которыми связано существование природных очагов инфекционных болезней человека. Разновидностей клещей обнаружено достаточно много: Ixodes persulcatus [Schulze, 1930], Ixodes pavlovskyi [Pomerantzev, 1946], Ixodes kashmiricus [Pomerantzev, 1948], Ixodes riipponensis [Kitaoka, Saito, 1967], Ixodes kazakstani [Olenev, Sorokoumov, 1934]. Кроме таежного Ixodes per-sulcatus был обнаружен еще более опасный Ixodes pavlovskyi.
Эти насекомые являются переносчиками различных инфекций: клещевого энцефалита, боррелиоза, эрлихиоза и др. Самым распространенным заболеванием является клещевой (эпидемический) энцефалит. Тяжелые осложнения острой инфекции могут завершиться параличом и летальным исходом. Список инфекционных агентов, переносимых клещами, постоянно растет, однако набор пригодных диагностикумов, вакцин и лекарств пополняется значительно медленнее. Природные очаги клещевого энцефалита зарегистрированы практически во всех лесных и таежных районах России. Особенно высока заболеваемость в Приуралье, на Урале и в Сибири [1, 2].
© ИВТ СО РАН, 2016
В Сибири переносчиком возбудителя клещевого энцефалита (с летальностью до 25 % в период вспышек) традиционно считался Ixodes persulcatus, он же таежный клещ. В последние годы стал стремительно распространяться вирус Ixodes pavlovskyi - еще более опасный носитель инфекций [3]. Согласно материалам обследования окрестностей Новосибирского научного центра, зараженность вирусом клещевого энцефалита Ixodes pavlovskyi, патогенным для лабораторных мышей (и для человека), почти втрое выше, чем у собранных в этой же местности Ixodes persulcatus [2].
Эти обстоятельства и послужили причиной начала разработки интерактивной информационной системы (ИС) "Genomics of tick-borne pathogen" (http://tick1.ict.sbras.ru/). С ее помощью можно пополнять, хранить и обрабатывать данные полевых наблюдений за расселением, миграцией клещей и переносимыми ими патогенами. Кроме современных средств диагностики патогенов на основе алгоритмов секвенирования система имеет интерактивную карту с отображением мест полевых работ по сбору насекомых. Система позволяет специалисту получать информацию по численности клещей, их полу и типу с указанием даты и места проведения работ, данные о встречаемости инфекций и генов.
Контроль над распространением основных клещей-переносчиков и их ин-фицированности боррелиями осуществлялся с помощью регулярного анализа состояния природных очагов обитания клещей при проведении полевых наблюдений [2]. Исследования проводились в десяти административных территориях России, расположенных в различных ландшафтно-географических зонах (Омской, Курганской, Новосибирской, Томской, Тюменской, Челябинской областях, Алтайском, Красноярском и Приморском краях, Республике Алтай), а также в Казахстане.
1. Постановка задачи и описание метода
Для обеспечения эффективных мер профилактики заболеваемости клещевым энцефалитом необходим пространственно-временной анализ распространения клещей, в том числе инфицированных разными возбудителями. Одним из наиболее перспективных способов контроля над возбудителями инфекций может стать система постоянного наблюдения.
Использование технологии секвенирования (определения последовательности нуклеотидов ДНК всего генома) обеспечивает возможность анализа связи полиморфизма сотен тысяч маркеров SNP (Single Nucleotide Polymorphism), рассеянных по всему геному, с набором патогенов, переносимых клещами.
Первым шагом к созданию разрабатываемой системы является пространственно-временной анализ на основе геоинформационных технологий зараженности некоторых территорий Сибири, Алтая и Казахстана патогенами вирусов, переносимыми клещами [2, 3]. Процедура анализа включает взятие биологического материала, выделение ДНК, генотипирование на чипах и исследование полученных данных.
Для работы с собранным материалом созданы современная интерактивная информационная система Genomics of tick-borne pathogen и приложение (http://ixodes.ict.nsc.ru), которое позволяет пополнять, хранить и обрабатывать данные полевых наблюдений за расселением, миграцией клещей и переноси-
мыми ими патогенами. Кроме современных средств диагностики патогенов на основе алгоритмов секвенирования разработаны алгоритмы работы с интерактивной картой при возможности отображения мест сбора насекомых и информации об их численности, поле, встречаемости инфекций и генов.
2. Архитектура информационной системы
Архитектуру информационной системы определяют ее компоненты, их функции и взаимодействие. Система построена на основе технологии клиент — сервер и состоит из клиентской части, сервера и СУБД. Клиент—сервер — это вычислительная или сетевая архитектура, в которой задания, или сетевая нагрузка, распределены между поставщиками услуг, называемыми серверами, и заказчиками услуг, называемыми клиентами. В описываемой архитектуре клиентом выступает браузер (пользователь), а сервером - веб-сервер. Логика системы распределена между сервером и клиентом, хранение данных осуществляется в СУБД MYSQL, обмен информацией происходит по сети. Преимущество такого подхода состоит в том, что клиенты не зависят от конкретной операционной системы пользователя, следовательно, система представляет собой межплатформенный сервис.
Важный компонент системы — клиентская часть приложения (рис. 1). Картографический сервис построен на основе интерактивной карты из библиотеки Leaflet (http://leafletjs.com). Это инновационная библиотека с открытым исходным кодом JavaScriptа. С ее помощью можно отображать карту, которая загружается с сервера OpenStreetMap (http://openstreetmap.org/) и представляет собой векторное изображение с возможностью масштабирования. Кроме отображения информации на географической карте порой возникает необходимость статистического анализа накопленного за несколько лет материала. С этой целью использована библиотека Google Charts (https://developers.google.com/chart/), написанная на языке JavaScript. Она предоставляет собой множество предварительно созданных диаграмм, таких как комбинированные гистограммы, столбчатые диаграммы, календарные графики, секторные диаграммы, геосхемы и др.
3. Базовые модули информационной системы
Функциональность ИС обеспечивается совокупностью программных реализаций, выполненных в виде отдельных модулей. Наиболее важны восемь из них:
1. Модуль импорта данных (загружает информацию из файла формата *.csv в базу данных (БД).
2. MYSQL — система управления базами данных, в БД acarids хранятся все материалы.
3. Модуль обработки данных (отвечает за выгрузку данных из БД и внесение в них изменений).
4. Модуль слежения за пользователем (реагирует на действия пользователя и в зависимости от задания выбирает нужную функцию).
5. Модуль визуализации (отображает информацию на экране).
6. Модуль редактирования.
7. Модуль загрузки новых данных.
Рис. 1. Функциональная схема информационной системы
8. Модуль запросов (представляет информацию по вариабельности генов и инфекций).
Каждый модуль выполняет самостоятельную функцию. Имеется возможность совершенствования модулей, внесения в них изменений (расширение, добавление новых функций).
4. Отображение данных и результатов анализа
Для запуска браузера пользователь вводит в строку URL-адрес информационной системы http://ixodes.ict.nsc.ru. На стороне клиента браузер выполняет рендеринг полученного кода и представляет пользователю набор визуальных элементов управления: интерактивную карту, инструменты навигации, масштабирования и переключения типа карты (рис. 2).
Интерактивная карта является основной составляющей интерфейса системы (рис. 2). Интерактивный режим позволяет легко перемещаться по карте и изменять ее масштаб. Отображение детальной информации осуществляется через интерфейс пользователя, графически и логически разделенный на три окна. В окне слева приведена карта, масштаб и вид которой можно изменять, для этого созданы соответствующие кнопки в правом верхнем окне. На карте расположены маркеры, которыми отмечены места проведения полевых работ. Клик по маркеру приводит к появлению информации о данных, полученных на участке. В правом верхнем окне представлен иерархический список всех областей Рос-
сии и Казахстана. Здесь можно выбирать страну, участок проведения полевых работ и получить по нему информацию.
Объекты, расположенные на карте, имеют различную атрибутивную информацию, которая всплывает в виде окна при нажатии на маркер (рис. 3). Это физическое название объекта, его административное название, период исследований, климат, координаты, биологическое название обнаруженных клещей, их численность, пол, встречаемость генов и инфекций, публикации.
Рис. 2. Интерактивная карта с перечнем территорий
Участок (село Уркан) [id: 64]
ИРКУТСКАЯ ОБЛАСТЬ
Городской округ Иркутск Иркутск
Участок (на территории города) [id: 32]
НОВОСИБИРСКАЯ ОБЛАСТЬ
Городской округ Бердск Бердск
Участок (р. Шадриха) [id: 93]
Городской округ Новосибирск Новосибирск Советский район Участок [id: 9]
Участок (Ботанический сад) [id: 92] Участок (Нижняя Ельцовка) [id: 94]
Карасукский район
Display options
Set the parameters @ Area
О Area (without marker) О Polygon О Subpolygons
Рис. 3. Окна с атрибутивной информацией
Заключение
На основе Leaflet-библиотеки разработана интерактивная информационная система "Genomics of tick-borne pathogen", предназначенная для работы с результатами полевых исследований. Система включает базу данных, содержащую информацию по расселению, миграции клещей и переносимых ими патогенах, интерактивную карту с отображением мест сбора клещей и данных об их численности и поле, встречаемости инфекций и генов. Реализована возможность пополнения и редактирования данных.
Благодарности. Исследования выполнены при частичной поддержке Президентской программы "Ведущие научные школы РФ" (грант № НШ-7214.2016.9). Статья опубликована при финансовой поддержке РФФИ (грант № 16-07-20001).
Список литературы / References
[1] Ружников Г.М., Данчинова Г.А., Федоров Р.К., Хаснатинов М.А., Парамонов В.В., Ляпунов А.В. Современные технологии информационно-аналитической оценки активности и прогноза распространения иксодовых клещей на примере города Иркутска // Сиб. науч.-мед. журнал. 2012. Т. 32, № 6. С. 55-59.
Ruzhnikov, G.M., Danchinova, G.A., Fedorov, R.K., Khasnatinov, M.A., Paramonov, V.V., Lyapunov, A.V. Modern technologies for informational and analytical evaluation of activity and forecast of spatial distribution of Ixodid ticks by the example of Irkutsk city // The Siberian Scientific Medical J. 2012. Vol. 32, No. 6. P. 55-59. (In Russ.)
[2] Ливанова Н.Н., Боргояков В.Ю., Ливанов С.Г., Тикунова Н.В., Фоменко Н.В. Характеристика природных очагов клещевых боррелиозов Новосибирского научного центра и Новосибирской области // Сиб. мед. журн. 2012. Т. 111, № 4. С. 20-23.
Livanova, N.N., Borgoyakov, V.Yu., Livanov, S.G., Fomenko, N.V. Characteristics of natural foci of tick borreliosis in Novosibirsk Scientific Center and the Novosibirsk Region // The Siberian Scientific Medical J. 2012. Vol. 111, No. 4. P. 20-23. (In Russ.)
[3] Мальцев В.Ю., Молородов Ю.И., Скачков Д.М. Технология извлечения информации об ареалах распространения видов бактериальных патогенов, переносимых иксодовыми клещами // XV Рос. конф. с междунар. участием "Распределенные информационно-вычислительные ресурсы" 2-5 декабря 2014, Новосибирск. http ://konf.ict.nsc.ru/ dicr2014/reportview/249374
Maltsev, V.Yu., Molorodov, Yu.I., Skachkov, D.M. Data mining technology for information on the natural habitat of bacterial pathogen speciens for transferability-pendent ticks // XV Russian Conference With International Participation "The Distributed Information-computing Resources" 2-5 December 2014, Novosibirsk. http://konf.ict.nsc.ru/dicr2014/reportview/249374. (In Russ.)
[4] Tkachev S.E., Panov V., Gerhard D., Tikunova N.V. First detection of Kemerovo virus in Ixodes pavlovskyi and Ixodes persulcatus ticks collected in Novosibirsk region, Russia // Ticks and Tick-borne Diseases. Ticks Tick-borne Dis. 2014. Vol. 5. P. 494-496.
[5] Rar, V.A., Epikhina, T.I., Yakimenko, V.V., Malkova, M.G., Tancev, A.K., Bon-darenko, E.I., Ivanov, M.F., Tikunova, N.V. Genetic variability of Anaplasma phagocytophilum in ticks and voles from Ixodes persulcatus/Ixodes trianguliceps sym-patric areas from Western Siberia, Russia // Ticks Tick-borne Dis. 2014. Vol. 5. P. 854-863.
Поступила в редакцию 7 ноября 2016 г.
Use of Leaflet library for visualization and analysis of contamination for areas infected by tick-borne diseases
MOLORODOV, YURI I.1* CHERNENKO, VLADISLAV V.2
1 Institute of Computational Technologies SB RAS, Novosibirsk, 630090, Russia 2Novosibirsk State University, Novosibirsk, 630090, Russia
*Corresponding author: Molorodov, Yuri I., e-mail: [email protected]
Purpose. The paper describes the architecture and function features for an information system which is working with empirical data of field observations aimed at resettlement, migration tick species Ixodes persulcatus, Ixodes pavlov-skyi and Dermacentor reticulatus and infectious agents transmitted by them. The information system has user-friendly interface, which is based on interactive geographic maps with visualization of the position of field work, in the form of tokens. Factual material for the research uses data field expeditions carried out in Altai region, the Western and Eastern Siberia and Kazakhstan since 2004 to the present time.
Methodology. To solve this problem, we used advanced GIS technology based on non-commercial Web mapping project OpenStreetMap and Leaflet library. Statistical analysis was performed using Google Charts library algorithms.
Findings. Based on factual material for the tick gathering field expeditions in North Asia, and the results of genome-sequencing, IT architecture was developed and a pilot version of interactive information system (IS,) was created that is intended for organization of collection, storage and processing of the field work, resettlement and ticks migration as well as pathogens they carry.
Navigation map was implemented by standard graphical Web-based interface, that select the area of works and visualization of statistical material, which shows the type of insects and pathogens carried by them.
Conclusion. An information resource allowing experts to evaluate the molecular genetic diversity of bacteria-carriers of tick-borne encephalitis, borrelio-sis, ehrlichiosis and other bacteria carriers circulating on the territory of Siberia was created.
Keywords: Locus, pathogen, tick, infectious agents, infected-areas, sequencing, Rickettsia, Borrelia encephalitis.
Acknowledgements. The study was supported by a grant of Leading Scientific Schools ScS-7214.2016.9. The work was supported by RFBR (grant No. 1607-20001).
Received 7 November 2016
© ICT SB RAS, 2016