Научная статья на тему 'Общедоступная информационная система по биоразнообразию цианопрокариот и лишайников cris (cryptogamic Russian information system)'

Общедоступная информационная система по биоразнообразию цианопрокариот и лишайников cris (cryptogamic Russian information system) Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
114
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИОННАЯ СИСТЕМА / INFORMATION SYSTEM / БИОРАЗНОООБРАЗИЕ / BIODIVERSITY / ЦИАНОПРОКАРИОТЫ / ЛИШАЙНИКИ / LICHENS / CYANOPROKARYOTES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Мелехин Алексей Валерьевич, Давыдов Денис Александрович, Шалыгин Сергей Сергеевич, Боровичев Евгений Александрович

Разработана информационная система, которую можно использовать как удобный инструмент хранения, организации, интеграции, визуализации и обработки данных по биоразнообразию цианопрокариот и лишайников. Система позволяет внести гербарные данные или опубликованные материалы, сделать общедоступной информацию об образцах имеющихся коллекций, познакомиться с литературными источниками, проанализировать распространение и степень изученности отдельных групп криптогамных растений на территории Мурманской обл.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Мелехин Алексей Валерьевич, Давыдов Денис Александрович, Шалыгин Сергей Сергеевич, Боровичев Евгений Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

OPEN INFORMATION SYSTEM ON BIODIVERSITY CYANOPROKARYOTES AND LICHENS CRIS (CRYPTOGAMIC RUSSIAN INFORMATION SYSTEM)

An information system supporting a convenient tool storage, organization, integration, visualization and analysis of data on the biodiversity of cyanoprokaryotes and lichens has been developed. The system allows you to add herbarium data or published material, to make publicly available the information on sample collections, learn about the literature, and analyze the distribution and degree of scrutiny of individual groups of cryptogamic plants in the Murmansk Province.

Текст научной работы на тему «Общедоступная информационная система по биоразнообразию цианопрокариот и лишайников cris (cryptogamic Russian information system)»

УДК 004.65:574.9 (470.21)

ОБЩЕДОСТУПНАЯ ИНФОРМАЦИОННАЯ СИСТЕМА ПО БИОРАЗНООБРАЗИЮ ЦИАНОПРОКАРИОТ И ЛИШАЙНИКОВ CRIS (CRYPTOGAMIC RUSSIAN INFORMATION SYSTEM)

А.В. Мелехин, Д.А. Давыдов, С. С. Шалыгин, Е.А. Боровичев

Разработана информационная система, которую можно использовать как удобный инструмент хранения, организации, интеграции, визуализации и обработки данных по биоразнообразию цианопрокариот и лишайников. Система позволяет внести гербарные данные или опубликованные материалы, сделать общедоступной информацию об образцах имеющихся коллекций, познакомиться с литературными источниками, проанализировать распространение и степень изученности отдельных групп криптогамных растений на территории Мурманской обл.

Ключевые слова: информационная система, биоразноообразие, цианопрокариоты, лишайники.

Проблемы изучения, сохранения и рационального использования природных ресурсов в современных условиях не менее актуальны, чем вопросы политики и экономики. Немаловажную роль здесь приобретают накопление первичной информации о природных объектах в гербарных хранилищах и базах данных, свобода и удобство доступа к первичным данным, а также их разносторонний анализ. Несмотря на развитие технологий обработки информации, ботаническая наука отстает в этой области от других направлений. Фактические сведения по видовому составу флор (списки видов) тех или иных территорий зачастую либо вовсе не приводятся в публикациях, либо содержатся в статьях малодоступных широкому кругу специалистов. Эта проблема может быть решена путем создания общедоступных информационных систем. Такие системы, по нашему мнению, должны включать информацию о гербарных образцах, хранящихся в коллекциях, а также опубликованные литературные данные.

Использование разного рода информационных систем (ИС), обобщающих сведения о биоразнообразии того или иного региона, посвященных разным группам организмов, становится общемировой практикой. Как правило, эти ресурсы базируются на следующих основных принципах: доступность, открытость всем пользователям, консолидация исследователей разных научных учреждений.

Примерами глобальных баз данных являются Global Biodiversity Information Facility (http://data. gbif.org) species2000 (http://www.species2000.org), Catalogue of Life (http://www.catalogueoflife.org) и др.

В основном базы посвящены отдельным группам живых организмов: AlgaeBase (http://www.algaebase.org) включает сведения о водорослях и цианопрокарио-тах, LIAS (http://www.lias.net) - о лишайниках, MOST (http://www.mobot.org/mobot/tropicos/most/checklist. shtml) - о мохообразных.

Можно привести множество примеров региональных баз данных: Биоразнообразие животного и растительного мира Сибири (http://www.nsc.ru/win/ elbib/bio/#db), Лишайники Российской Арктики (http://www.binran.ru/infsys/ra_lich/index.htm), South African Biodiversity Database (www.seen.co.za), Информационная поисковая система по фауне и флоре заповедников России (http://www.sevin.ru/ natreserves/), флора мхов России (http://arctoa.ru/Flo-ra/basa.php), ООПТ России (http://oopt.aari.ru/).

Однако здесь в большинстве случаев собраны или литературные или гербарные данные, редко базы данных содержат оба типа информации.

Несмотря на существование вышеперечисленных информационных систем эти ресурсы используются недостаточно или неоптимально. Большинство специалистов используют ИС как вспомогательный инструмент, в качестве справочника. Между тем ИС позволяет осуществлять организацию и интеграцию данных. Исследователь должен вносить первичные данные в ИС, а затем с помощью этой системы обобщать их, обрабатывать и анализировать. При этом открытость и многопользовательский режим такой ИС позволяет накопить больший объем информации, чем в разрозненных публикациях, а значит и уровень ее точности, охвата и анализа возрастает.

Информация о распространении видов крипто-гамных растений и о наличии образцов в российских гербарных коллекциях пока еще малодоступна для мировой научной общественности. Создание современных общедоступных информационных систем с высокой степенью интеграции литературных и гербарных данных позволит дать объективную оценку современному состоянию биоразнообразия крипто-гамных растений, что ляжет в основу дальнейшего мониторинга.

История создания

Созданная нами ИС CRIS (Cryptogamic Russian Information System) направлена в первую очередь на работу с данными альгологического и лихенологи-ческого гербариев и организацию интегрированных наблюдений, графических и литературных данных. Доступ к ИС осуществляется через сеть Интернет по адресу http://www.kpabg.ru/cris.

Основой для создания ИС послужила информация о гербарных образцах лишайников, хранящихся в KPABG (гербарий Полярно-альпийского ботанического сада-института (ПАБСИ) КНЦ РАН). Для хранения данных и автоматизации гербаризации в 2007 г. нами был написан комплекс скриптов (скриптовый язык php, встроенные в него SQL-команды для системы управления базами данных (СУБД) MySQL), который работал на локальном сервере в гербарии лишайников ПАБСИ. Данный комплекс был результатом логического развития и синтеза баз данных гербария лишайников Пермского государственного педагогического университета (структура разработана А.Е. Селивановым, СУБД Microsoft Access) и баз данных гербария мохообразных ПАБСИ (разработана А.Н. Савченко, СУБД dBase). Структура таблиц, в которых хранились данные, с которыми взаимодействовали скрипты, была ориентирована не столько на анализ, сколько на структурирование информации на этапе сбора. В целях аутентификации мы назвали наш способ структурирования данных «структура MUSIK-типа» (вне зависимости от используемой СУБД).

С 2009 г. данные о гербарных образцах лишайников и цианопрокариот ПАБСИ стали доступны в сети Интернет. Мы зарегистрировали доменное имя и разместили на удаленном коммерческом сервере систему баз данных со структурой MUSIK-типа, регулярно

синхронизируемую с локальной системой (Мелехин, Давыдов, 2009)1.

В 2011 г. нами была пересмотрена стратегия развития базы данных гербария лишайников и цианопрокариот: главной целью создания ИС стало достижение как можно более полной интегрированности данных о видах, что предполагает включение в систему литературных данных, наблюдений и фотографий, а также подключение к геоинформационным средам.

На имеющемся хостинге на основе системы управления содержимым (CMS) Drupal была развернута ИС; локальный сервер с локальной ИС был исключен - в настоящее время вся информация об образцах вносится через сеть Интернет непосредственно в систему на удаленном сервере. В результате перехода на готовую CMS мы получили ряд преимуществ по отношению к ИС «MUSIK».

1. Решение вопросов безопасности и создания модулей, которыми занимается целое сообщество, администратору необходимо лишь следить за обновлениями CMS.

2. Используемая нами CMS (как и система MUSIK-типа) обеспечивает автоматизацию гербарного дела и вывод информации об образцах, а также позволяет достичь очень высокой степени интеграции данных.

Структура и функционирование

Система построена на основе CMS Drupal и ее модулей. Помимо ряда других вспомогательных модулей, мы применяли в качестве веб-ГИС модуль OpenLayers, основанный на одноименной библиотеке. Этот модуль может использовать карты множества картографических сервисов, например openstreetmap. Система управления базой данных (СУБД) - MySQL. Все использованные нами программные продукты имеют открытый исходный код и распространяются свободно на основе различных копилефтных лицензий. Работа с картографическими сервисами и файловыми хранилищами проводится нами в соответствии с лицензионными соглашениями.

Использованные нами инструменты (CMS Drupal, СУБД MySQL) по сравнению с широко распространенными в России, главным образом, настольными биологическими базами данных (в Microsoft Access, Microsoft Exel и т.д.) имеют ряд преимуществ:

1Мелехин А.В., Давыдов Д.А. Использование системы баз данных в гербарии Полярно-альпийского ботанического сада-института // Формирование баз данных по биоразнообразию - опыт, проблемы, решения. Барнаул, 2009. С. 160-166.

во-первых, это надежные и высокоэффективные системы клиент-серверного типа, обеспечивающие удаленный доступ;

во-вторых, они обеспечивают поддержку нескольких одновременных запросов как на ввод так и на вывод данных;

в-третьих, позволяют создавать сложные, разнообразные выборки, в том числе с графическим выводом картографических данных;

в-четвертых, это бесплатные продукты с открытым исходным кодом, активно обновляемые и поддерживаемые сообществом.

Функционирование системы можно разделить на два блока: 1) блок внесения и организации информации и 2) блок анализа информации.

Доступ к внесению информации в систему открыт пользователю только после регистрации (осуществляется по заявке по электронной почте). Зарегистрированный пользователь может внести информацию о гербарном образце или литературные данные. Система открыта для сотрудничества с любыми гербариями, кураторы которых готовы вносить информацию: по запросу пользователя ему будет открыт доступ к соответствующему разделу для внесения информации.

Пользователь вносит информацию в следующие поля: номер сбора, страна, регион, административный район, ООПТ2, местонахождение, ценоз, местообитание, освещенность, положение в пространстве, влажность, субстрат, высота над уровнем моря, дата сбора, имя коллектора, дата определения, имя детер-минатора, координаты, точность координат, названия видов, таксоны других таксономических рангов, ссылка на фотографию (размещение на стороннем ресурсе) (рис. 1).

Внесение данных, приведенных в литературе, например в аннотированных списках, осуществляется по ссылке «Образец литературного указания» в разделе «Создать материал». При внесении указываются название вида, страна, регион, административный район, ООПТ, субстрат, координаты, высота над уровнем моря, цитата из литературного источника (содержащая данные о местонахождении и местообитании, если они приведены), ссылка на использованный источник.

При отсутствии необходимых пунктов в полях выбора пользователь должен внести их в разделе «Создать термин».

При внесении литературной и гербарной информации пользователь может вносить координаты в соответствующие поля. Внесение координат дополнено полем «точность», в котором обозначается с какой точностью (радиус точности в метрах) указывается эта географическая точка. В случае с внесением координат, установленных с помощью навигатора, указывается максимальная для данного прибора точность (например, 5 м). Для координат, вычисленных по картам, точность будет ниже, поэтому указывается больший радиус (например, 50 м). Для ряда гербарных и литературных данных зачастую невозможно дать точные координаты, так как в источнике приводятся слишком общие указания (например, Хибины). В этом случае точка ставиться в центр района и приводится точность соответствующего радиуса (например, 15 км). Таким образом, при знакомстве с географическим распространением у пользователя есть возможность оценить достоверность информации.

Данные об образце можно изменить (пункт меню «Редактировать»), можно создать новую запись в базе данных, основываясь на информации об этом образце (пункт меню «Клонировать») - это удобно при внесении нескольких образцов с одного места сбора.

Незарегистрированному в системе пользователю доступны отображения на карте точек распространения для каждого вида (рис. 2). Зарегистрированный пользователь получает доступ к карте общего распространения для всех видов.

Точки на карте являются ссылками на образцы, информация о которых хранится в ИС (рис. 3). Пользователь может перейти по данной ссылке к описанию образца.

Пользователь может получить список видов (где каждый вид является гиперссылкой на соответствующие образцы) для: страны, региона, ООПТ, административного района, номера и т.п., в том числе в различных сочетаниях (например, виды, встречаемые для страны «Россия» на субстрате «камень»). Подобный список можно получить и по таксонам невидового ранга.

Для того чтобы система не превращалась в онлайн справочник, в ней имеются функции выполнения пользовательских запросов с возможностью задавать критерии поиска. Анализ информации, доступный пользователю базы данных, включает в себя:

2Особо охраняемые природные территории.

Рис. 1. Страница внесения данных о гербарном образце

Navigation

• Annotated list

• Distribution map of lichens

• Search and copy or edit

Рис. 2. Пример карты распространения

Select the species of Cyanoprokaryote;

Phormidium autumnale [Ag.] Trev. ex Gom.

• Literary specimen of cyanoprokaryotes

69.829399108887, 31.777500152588 (precision: 500 m.), Russia. Murmansk province. Pechengsky district. П-ов Средний, мыс Земляной (Mustakallio). на мокрых скалах (Pummanki Mustakallio). Камень.

• Specimen of cyanoprokaryotes herbarium KPABG

69.823600769043, 31.625600814819 10 m.. Kandalakshsky reserve. Russia. Murmansk province. Pechengsky district. Баренцево море, Айновы острова, о. Малый Айнов, побережье. Каменистые голые пологие выходы на берегу моря в 20 м от уреза воды, лужа. -0,02 м. Высокая освещенность. Горизонталь. Под водой.. Камень бескалыдиевый. Leg.: 16.06.10 DavydovDA.. KPABG(C)-912.

• Specimen of cyanoprokaryotes herbarium KPABG

Рис. 3. Пример вывода информации об образцах на карте. Сокращенная информация об образце дополняется гаперссылкой на полный текст

1) географический блок (распространение по странам, регионам России, административным районам в пределах субъекта РФ, ООПТ), который позволяет оценить изученность, выявить «белые пятна», характер распространения группы в целом, ареалы видов, приуроченность к горным районам, репрезентативность ООПТ, все образцы привязаны к координатам места сбора;

2) эколого-ценотический блок (распределение по ценозам, местообитаниям, субстратам, высоте над уровнем моря, высоте над поверхностью земли, освещенности, увлажнению, положению в пространстве);

3) информационный блок (выборка возможна по дате сбора, имени коллектора, имени детерминатора, номеру сбора).

В дальнейшем планируется расширить информационную составляющую системы. Будет дано описание каждого вида (в настоящий момент название таксона является ссылкой на страницу с описанием, но содержание пока отсутствует) по следующему плану: систематическое положение, синонимы, диагноз, морфологическое описание, особенности жизненного цикла, ссылки на молекулярно-генети-ческие данные и коллекции культур, экологическая характеристика, географическая характеристика. Эколого-ценотический блок расширится за счет добавления новых полей в структуре описания образца: добавятся данные по величине рН среды (для гидрофитов) и самого образца (для аэрофитов), освещенности (в абсолютных значениях и в процентах относительно открытого пространства), величине ультрафиолетового излучения (в абсолютных значениях и в процентах относительно открытого пространства), температуре и влажности воздуха в местообитании образца (в абсолютных значениях и в процентах относительно открытого пространства), температуре образца.

Создаваемая нами ИС соответствует общемировым критериям:

1) является открытой, доступной посредством Интернет с помощью любого браузера, не требует от пользователя специального программного обеспечения или специфических знаний;

2) выступает универсальной интегрирующей средой, позволяющей пользователю внести данные своих наблюдений или опубликованные материалы, сделать общедоступными имеющиеся коллекции, проанализировать данные других кол -лекторов, познакомиться с литературными указаниями, проанализировать распространение и степень изученности отдельных групп на территории Мурманской обл.;

3) позволяет специалистам из разных областей использовать информацию для решения широкого круга задач, связанных с природопользованием, охраной природы и наукой.

В настоящее время ИС CRIS содержит преимущественно данные по биоразнообразию лишайников и цианопрокариот Мурманской обл., но ее возможности не ограничены жесткой привязкой к конкретному региону. Постепенно будет происходить наполнение ИС данными из других регионов России и мира.

На текущий момент раздел ИС CYANOpro, посвященный цианопрокариотам содержит 2055 записей, из которых 661 являются записями о гербарных образцах, 1391 о литературных указаниях; раздел ИС ISL, посвященный лишайникам, содержит 8447 записей, из которых 8295 являются записями о гербарных образцах, 151 о литературных указаниях.

Разработанная ИС представляет собой удобный инструмент для хранения, визуализации и обработки данных о цианопрокариотах и лишайниках Мурманской обл. Дальнейшее наполнение и развитие ИС способствуют решению многих фундаментальных научных, прикладных, образовательных и природоохранных задач, связанных с поддержанием и сохранением биологического разнообразия Мурманской обл. и других регионов России. В частности, возможно получение прогностической оценки стабильности экосистем и их способности к восстановлению в зависимости от разнообразия видов.

Автоы выражают благодарность людям, которые вносили и вносят информацию в ИС, а также сообществам программного обеспечения, которое используется нами.

Работа поддержана РФФИ (проект N° 12-04-31506) и программой фундаментальных исследований Президиума РАН «Живая природа: современное состояние и проблемы развития».

Поступила в редакцию 06.12.12

OPEN INFORMATION SYSTEM ON BIODIVERSITY CYANOPROKARYOTES AND LICHENS CRIS (CRYPTOGAMIC RUSSIAN INFORMATION SYSTEM)

A.V. Melechin, D.A. Davydov, S.S. Shalygin, E.A. Borovichev

An information system supporting a convenient tool storage, organization, integration, visualization and analysis of data on the biodiversity of cyanoprokaryotes and lichens has been developed. The system allows you to add herbarium data or published material, to make publicly available the information on sample collections, learn about the literature, and analyze the distribution and degree of scrutiny of individual groups of cryptogamic plants in the Murmansk Province.

Key words: information system, biodiversity, cyanoprokaryotes, lichens.

Сведения об авторах: Мелехин Алексей Валерьевич - инженер-исследователь лаборатории флоры и растительных ресурсов Полярно-альпийского ботанического сада-института КНЦ РАН, канд. биол. наук (melihen@yandex.ru); Давыдов Денис Александрович - ст. науч. сотр. лаборатории флоры и растительных ресурсов Полярно-альпийского ботанического сада-института КНЦ РАН, канд. биол. наук (d_disa@mail. ru); Шалыгин Сергей Сергеевич - инженер-исследователь лаборатории флоры и растительных ресурсов Полярно-альпийского ботанического сада-института КНЦ РАН (got.lifemusic@gmail.com); Боровичев Евгений Александрович - мл. науч. сотр. лаборатории флоры и растительных ресурсов Полярно-альпийского ботанического сада-института КНЦ РАН, канд. биол. наук (borovichyok@mail.ru).

i Надоели баннеры? Вы всегда можете отключить рекламу.