Научная статья на тему 'Основные подходы к управлению данными для администрирования биологических коллекций'

Основные подходы к управлению данными для администрирования биологических коллекций Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
274
52
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БАЗЫ ДАННЫХ / СИСТЕМА УПРАВЛЕНИЯ КАЧЕСТВОМ / СБОР И ОБРАБОТКА ИНФОРМАЦИИ / БИОЛОГИЧЕСКИЕ КОЛЛЕКЦИИ / СТАНДАРТНЫЕ БИОЛОГИЧЕСКИЕ ОБРАЗЦЫ / DATABASES / QUALITY MANAGEMENT SYSTEM / DATA ACQUISITION AND PROCESSING / BIOLOGICAL COLLECTIONS / BIOLOGICAL REFERENCE MATERIALS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Давыдов Д.С., Кошечкин К.А., Мовсесянц А.А.

Проведен анализ основных принципов и подходов к использованию программно-технических решений и платформ, применение которых возможно при разработке систем управления данными в биологических коллекциях. Сформулированы основные требования к функциональным возможностям программного обеспечения, предназначенного для поддержки баз данных по биологическим ресурсам и являющегося необходимым атрибутом функционирования биологической коллекции высокого организационного уровня. Рассмотрены основные подходы к ограничению доступа к информации о биологических коллекциях в случаях, предусмотренных патентной процедурой и правилами биологической безопасности. Определены особенности разработки систем информационного обеспечения открытых сервисных биологических коллекций.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Давыдов Д.С., Кошечкин К.А., Мовсесянц А.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Basic approaches to data management for administration of biological collections

The article analyses the main principles of and approaches to software and hardware solutions and platforms that could be used in the development of data management systems for biological collections. The authors summarise the key requirements for functional capabilities of the software which could be used to support biological resources databases and which is a prerequisite for maintaining a highly organized biological collection. The article sums up the main approaches to restricting access to information on biological collections as required by the patent procedure and biological safety principles. The authors identified specific aspects of developing information support systems for public biological collections.

Текст научной работы на тему «Основные подходы к управлению данными для администрирования биологических коллекций»

ОБЗОРЫ

© КОЛЛЕКТИВ АВТОРОВ, 2017 ШИФР СПЕЦИАЛЬНОСТЬ

УДК 615.012.6+004.05 03.02.03 Микробиология

Основные подходы к управлению данными для администрирования биологических коллекций

Д. С. Давыдов, К. А. Кошечкин, А. А. Мовсесянц

Федеральное государственное бюджетное учреждение «Научный центр экспертизы средств медицинского применения» Министерства здравоохранения Российской Федерации, Российская Федерация, 127051, Москва, Петровский бульвар, д. 8, стр. 2

Поступила 25.01.2017 г. Принята к публикации 26.10.2017. г.

Проведен анализ основных принципов и подходов к использованию программно-технических решений и платформ, применение которых возможно при разработке систем управления данными в биологических коллекциях. Сформулированы основные требования к функциональным возможностям программного обеспечения, предназначенного для поддержки баз данных по биологическим ресурсам и являющегося необходимым атрибутом функционирования биологической коллекции высокого организационного уровня. Рассмотрены основные подходы к ограничению доступа к информации о биологических коллекциях в случаях, предусмотренных патентной процедурой и правилами биологической безопасности. Определены особенности разработки систем информационного обеспечения открытых сервисных биологических коллекций.

Ключевые слова: базы данных; система управления качеством; сбор и обработка информации; биологические коллекции; стандартные биологические образцы.

Библиографическое описание: Давыдов ДС, Ношечкин НА, Мовсесянц АА. Основные подходы к управлению данными для администрирования биологических коллекций. БИОпрепараты. Профилактика, диагностика, лечение 2017; 17(4): 216-221.

Постоянное истощение природных ресурсов, актуальные угрозы биологической безопасности и изменения климата, снижение продуктивности традиционных таксономических исследований, увеличение потребности в инновационных методах и технологиях исследований способствуют все более четкому пониманию исключительной ценности биологических коллекций. Сохранение генетических ресурсов и биологического разнообразия подводит надежное основание под развитие экологически эффективных технологий и производств как в развитых странах, так и в странах развивающегося мира. Это необходимый аспект развития наукоемкой экономики, одним из ведущих направлений в которой являются биотехнологии.

Совершенствование методических подходов к осуществлению коллекционной деятельности и развитие биоресурсного потенциала входят в число основных задач Комплексной программы развития биотехнологий в Российской Федерации на период до 2020 года, утвержденной постановлением Правительства Российской Федерации от 24.04.2012 г. № 853п-П8, и неотъемлемы от одного из главных приоритетов развития биотехнологий, к которым относятся биофармацевтика и биомедицина. Реализация комплекса мероприятий по данному направлению запланирована в рамках федеральной целевой программы «Развитие фармацевтической и медицинской промышленности Российской Федерации на период до 2020 года и дальнейшую перспективу», утвержденной постановлением Правительства Российской Федерации от 17.02.2011 г. № 91. Основной задачей по данному направлению является создание материальной и организационной инфраструктуры для обеспечения деятельности биологических коллекций, в том числе коллекций микроорганизмов, функционирующих в Российской Федерации, в соответствии с международными нормативно-методиче-

скими требованиями, предъявляемыми к биоресурсным центрам, которые являются базовым элементом развития биотехнологий [1].

Одним из важнейших аспектов надлежащей практики коллекционной деятельности, связанной с пополнением фонда биоресурсов, хранением и изучением микроорганизмов, является наличие комплексной системы управления данными. В Российской Федерации работы в этом направлении велись в рамках выполнения программы фундаментальных исследований Российской академии наук «Биоразнообразие и динамика генофондов». Ведущим исполнителем работ являлась Всероссийская коллекция микроорганизмов Института биохимии и физиологии микроорганизмов им. Г. К. Скрябина РАН (ВКМ ИБФМ РАН), а в качестве соисполнителей выступали 17 российских коллекций. Был подготовлен в электронном виде объединенный каталог Российских коллекций немедицинского профиля. Была подготовлена и представлена в формате XML (Extensible Markup Language) часть каталога Всероссийской коллекции микроорганизмов (ВКМ) [2-4].

Окончательный вариант электронной версии Объединенного каталога (Consolidated Catalogue of Microbial Cultures Held in Russian Non-medical Collections. CD version, release 1.0 (Fall 2002)) был размещен в сети Интернет на web-сайте ВКМ в формате электронной книги MS eReader в 5 томах на английском языке [5].

Также в открытом доступе находятся отдельные разделы каталогов ряда ведущих международных биологических коллекций, в том числе Американской коллекции типовых культур (АТСС), Немецкой коллекции микроорганизмов и клеточных культур (DSMZ) и Национальной коллекции типовых культур (NCTC, Великобритания).

Однако форма этих каталогов удобна лишь с точки зрения поиска микроорганизмов по номеру штамма и не позволяет подбирать их по целевым характеристикам.

Создание полноценной базы данных (БД) как инструмента для проведения многофакторного анализа коллекционных штаммов является одной из приоритетных задач коллекционной деятельности. При этом данные литературы по разработкам баз данных комплексной структуры, направленных на каталогизацию патогенных микроорганизмов, крайне малочисленны и фрагментарны, что указывает на высокую актуальность и приоритетность разработок, ведущихся в этом направлении.

Целью настоящей статьи является краткий обзор основных принципов и подходов к использованию программно-технических решений и платформ, применение которых возможно при разработке систем управления данными в биологических коллекциях.

I. Основные типы программных решений для управления данными

1.1. Управление информацией с применением шеЬ-приложений

Использование интернет-приложений для информационного обеспечения биоресурсных центров обеспечивает возможность доступа к данным практически из любой точки мира с использования широчайшего спектра электронных устройств. Данные приложения отличает максимальная простота при проведении базовых операций и легкость обслуживания ^-подразделениями, так как все программное обеспечение (ПО) загружается, устанавливается и администрируется централизованно. Нет необходимости в установке специального ПО на оборудование, используемого кураторами коллекций, так как доступ к информации обеспечивается через браузер. Кроме того, одним из существенных преимуществ шеЬ-приложений является возможность использования одной программной платформы как для управления информацией, так и для публикации данных.

Следствием главного преимущества шеЬ-приложе-ний (легкость и мобильность доступа к данным) является главная проблема их применения, а именно — задачи обеспечения информационной безопасности использования шеЬ-приложений имеют принципиально более сложный и комплексный характер по сравнению с настольными приложениями, так как данные программы потенциально могут быть доступны для неограниченно широкого круга лиц и с любого устройства. Кроме того, шеЬ-приложения обычно зависимы от наличия постоянного и скоростного интернет-подключения и интенсивного технического сопровождения и обслуживания для того, чтобы новые версии браузеров обеспечивали функциональность приложения на должном уровне. Часто возникают трудности обеспечения сохранности вносимых изменений в БД при нарушениях подключения.

К недостаткам данного вида программных продуктов можно также отнести высокую стоимость разработки, сложность обеспечения поддержки возможности доступа с различных браузеров и их версий. Поддержка ряда функций баз данных как высокого, так и базового уровня, для шеЬ-приложений может быть сильно осложнена или невозможна, например, поддержка многокомпонентного интерфейса и одновременного выполнения операций, требующих больших объемов памяти. Имеются существенные ограничения взаимодействия с другим программным обеспечением.

1.2. Использование автономных приложений (desktop applications, DA)

Альтернативой использования web-приложений является применение автономных приложений (desktop applications, DA). Их отличает богатый программный интерфейс, возможность конвейерной передачи данных между рабочими областями, возможность взаимодействия с другим программным обеспечением и создания двусторонней передачи информации, высокая производительность и относительная легкость выполнения операций, требующих большой оперативной памяти и сложного интерфейса (основные ограничения могут быть связаны только с особенностями операционной системы, техническими характеристиками ПК и т.д.), легкость использования и высокая скорость ответа на команды и запросы пользователя. Они не вызывают дополнительных трудностей при разработке в части основных функциональных возможностей. Также их характеризует относительная простота обеспечения безопасности доступа к данным.

Существенными недостатками данного вида приложений является часто отмечаемая невозможность использования одной программы на ПК с различными операционными системами, невозможность перехода между MS Windows, Mac OS или Linux, а также сложности при установке ПО (требования к операционным системам, необходимость наличия файлов динамически компонуемой библиотеки /.dll/ и др.) Как правило, отсутствует возможность удаленного доступа с ПК и других устройств. При установке данного типа ПО более, чем на одном ПК часто могут возникать большие затруднения при внесении новой информации в БД и модификации программы, в том числе при ее апгрейде, устранении программных ошибок («bug fixing»), установке новых версий. Также сложность обновления связана с необходимостью авторизованной рассылки обновлений производителем ПО на физических носителях, что представляет для отделов технического обеспечения коллекций дополнительную задачу по логистике и требует дополнительных финансовых расходов, часто существенных.

В целом можно констатировать, что автономные приложения не имеют единого алгоритма действия, сложны в обслуживании для IT-специалистов и имеют высокую стоимость, в том числе для обновлений программы и базы данных при условии ограничений по количеству лицензий на установку.

1.3. Самостоятельная разработка

программного обеспечения для внутреннего пользования

В теории самостоятельная разработка программного обеспечения дает организации, ведущей коллекционную деятельность, возможность создания приложения, максимально соответствующего потребностям ответственных сотрудников коллекции (по крайней мере, на момент разработки программы). Также самостоятельная разработка обеспечивает высокую скорость устранения ошибок и сбоев программы, а также внедрения новых опций. При условии наличия в штате организации стабильной по составу команды высокопрофессиональных специалистов в области программирования, разработки, особенно на ранних этапах, проходят относительно просто и быстро. Также «hand-made ПО» отличается относительно невысокой стоимостью разработки — при условии сохранения простой структуры приложения и ограниченной функциональности в процессе применения.

Многие биологические коллекции начинают внедрять системный подход к управлению данными с использованием самостоятельно разработанного ПО, однако в действительности подобные разработки практически никогда не имеют успешного применения для обеспечения нужд коллекций. Тому есть несколько веских причин.

Во-первых, сотрудники, курирующие БД и использующие ее в своей научно-исследовательской работе, крайне редко являются квалифицированными специалистами в области разработки ПО и программирования и это делает использование готовой программы, ее обслуживание и усовершенствование крайне затруднительными, тогда как профессионалы в области разработки программных средств практически недоступны для биологической коллекции, так как их услуги весьма высоко оплачиваются.

Во-вторых, даже при возможности привлечения к разработке ПО специалиста высокого уровня из числа сотрудников организации велика вероятность его перехода на новое место работы — ив этом случае БД остается без технического обслуживания и без перспектив усовершенствования. Возникает необходимость искать специалиста в области программирования с учетом специфики разработанного программного продукта, что может создавать значительные затруднения. При этом для вновь поступившего специалиста проще разработать ПО «с нуля», нежели разбираться в тонкостях авторского произведения. И это неизбежно приведет к новым значительным затратам времени и средств.

В-третьих, при необходимости разработки и внедрения в практику ПО комплексного типа, с широкими функциональными характеристиками и возможностью интегрированного применения в сочетании с другими программами стоимость работ становится экстремально высокой.

В-четвертых, подавляющее большинство решений подобного типа не является масштабируемым ПО, то есть апгрейд, модификация, внесение новых разделов, заполняемых форм, алгоритмов обработки данных и прочее в соответствии с новыми требованиями невозможны без нарушения структуры их операций (например, расщепления данных на более мелкие фрагменты). Это неизбежно приводит к критическому снижению их эффективности, и, как следствие — к необходимости внести изменения в структуру или даже полностью переписать приложение. Таким образом, не обеспечивается стабильность пользовательского интерфейса, что является одним из ключевых требований к любому программному продукту.

В-пятых, период от начала разработки подобных приложений до момента получения пригодной к использованию стабильной версии часто бывает очень длительным, особенно при малой численности команды разработчиков.

Часто после нескольких месяцев использования данные приложения выходят из эксплуатации по причине накопления программных ошибок и значительного снижения производительности, становясь слишком медленными, нестабильными, «недружелюбными» к пользователю. И это — достаточно обычная ситуация для биологических коллекций.

I.4. Использование коммерческих программных продуктов

К безусловным доводам в пользу выбора специализированных коммерческих программ относится широкий спектр доступных вариантов. BioloMICS, Bionumerics, FileMaker Pro, GENEious, iCollect, KE Emu, LabCollector LIMS, MuseumPlus и ряд других программных продуктов,

а также адаптированные дериваты MS Access или Oracle имеют опыт успешного применения, обладают высоким качеством и большими функциональными возможностями. Гарантирована техподдержка со стороны разработчиков, имеется возможность разработки приложений под заказ с учетом всех потребностей пользователя и специфики задач конкретной коллекции на высоком профессиональном уровне.

В то же время де-факто не существует доступных приложений, которые могут служить комплексным решением для биологических коллекций. Данные программы обладают очень высокой стоимостью, при этом, в большинстве случаев, неадаптивны, для них характерно отсутствие гибкости структуры, невозможность ее изменения, использования дополнений и расширений. И, что очень важно, к разработке редко привлекаются специалисты, имеющие профессиональный опыт в области биологических дисциплин.

I.5. Использование бесплатного ПО

или программ с открытыми исходными кодами

Программы с открытыми исходными кодами (OSS) — программы, которые лицензируются с условием, что лицензиат получает возможность распоряжаться исходным кодом. В лицензиях на ПО с открытыми исходными кодами, например, от бесплатных программ (FSS), лицензиату обычно предоставляется право создавать модифицированные версии программы и распространять их исходный код — если это будет делаться на аналогичных условиях для последующих получателей кода. Такие ограничения введены во избежание коммерческого использования программ с открытым исходным кодом.

Доступно большое количество программных продуктов данного типа. Имеются очень высококачественные программы с широкими функциональными возможностями, предназначенные для продвинутых пользователей. Например, семейство программ BLAST (Basic Local Alignment Search Tool, предназначено для поиска гомологов белков или нуклеиновых кислот, для которых известна первичная структура (последовательность) или ее фрагмент) [6], Geneious, Mantis, RasMol, Scrathpads, SeqView, Serial Cloner, Specify, WDCM workbench и т.д. Как правило, данные программы разработаны с участием специалистов в области естественных наук, они абсолютно бесплатны и не требуют никаких дополнительных накладных расходов. Разработчики часто предоставляют бесплатные обновления и дополнения. Время использования и количество пользователей неограниченно.

Данное ПО очень хорошо подходит для коллекций, в штате ведущей организации которых имеется мощная поддержка IT-отдела и специалистов в области программирования. При этом нередко существует возможность самостоятельной разработки силами пользователей дополнений и модификаций для приложений, которые позволяют расширить функциональные характеристики стандартного интерфейса и настроить его под конкретные потребности и специфику работы конкретной коллекции.

Однако в настоящее время не существует доступных приложений, которые обеспечивали бы биологические коллекции возможностью ведения комплексных баз данных. Все приложения подобного типа являются строго специализированными и предназначены для использования, преимущественно, исследователями — специалистами в определенных областях молекулярной биологии и генетики, а также их коммуникации.

По умолчанию отсутствует возможность конвейерной передачи информации между рабочими областями; перенос массивов информации очень неудобен для пользователя. Техническая поддержка со стороны производителя в случае возникновения программных ошибок или проблем с использованием приложения практически отсутствует. При этом программные сбои, а особенно затруднения во взаимодействии с интерфейсом приложения, возникают часто. В целом данные приложения характеризует трудный в использовании интерфейс, работа с ним требует навыка и подготовки. Наконец, на практике совместное использование ПО часто бывает невозможно.

I.6. Решения, связанные с внешним размещением данных («облака»)

Данные приложения, безусловно, очень удобны как для пользователей, так и для IT-специалистов. Необходимость инсталляции отсутствует. При использовании «облачных» технологий гарантированы очень быстрый и надежный доступ, в любое время, с любого устройства (ПК, смартфон, планшет и т.д.), особенно при условии качественной IT-инфраструктуры провайдера услуги и при использовании современных технологий виртуализации, например, Citrix, удобство обслуживания и поддержки программных платформ и баз данных. Нет необходимости в приобретении собственного аппаратно-технического комплекса (сервер, локальная сеть с архитектурой «сервер-хранилище данных» /SAN/, межсетевые экраны и т.д.). Также нет необходимости в приобретении, установке и обслуживании дорогостоящего и сложного ПО для управления и мониторинга состояния системы (VMWare, vSphere и т.д.), а также включения в штат большого количества IT-специалистов. Проводится постоянный мониторинг состояния системы и техническая поддержка со стороны провайдера услуг. Гарантировано существенное уменьшение расходов в сравнении с эксплуатацией собственной инфраструктуры. Наконец, ПО, предназначенное для поддержки баз данных биологической коллекции, напрямую коммуницируется с web-сайтом, который используется для публикации данных коллекции.

Недостатки данных приложений имеют в своей основе те же причины и особенности, что и web-приложения, главные из которых — абсолютная зависимость от хостин-говой организации, необходимость постоянного высокоскоростного устойчивого интернет-соединения, отсутствие возможности мониторинга и администрирования систем обеспечения безопасности и сохранности информации, хранящейся на внешнем сервере. Доступ к ядру системы управления базами данных, как правило, закрыт, за исключением возможности периодического запроса на создание полных резервных и дельта-резервных копий баз данных. Кроме того, существует необходимость регулярных платежей за услуги провайдера, что требует выделения отдельной статьи в годовом бюджете.

Таким образом, можно констатировать, что идеального организационно-технического решения для управления данными в биологических коллекциях не существует. Тем не менее, при условии внимательного изучения специфики задач и особенностей организации деятельности любой коллекции оптимальное решение подобрать можно, главное — понять и подробно и точно сформулировать требования к системе управления данными. Выбор решения должен основываться на техническом оснащении ИТ-инфраструктуры организации, а также на наличии со-

трудников и их квалификации, занимающихся информационными технологиями.

II. Основные требования к функциональным возможностям баз данных биологических коллекции

Итак, попытаемся обобщить данные, приведенные выше, и кратко сформулировать основные требования к функциональным возможностям программного обеспечения, предназначенного для поддержки баз данных по биологическим ресурсам и являющегося необходимым атрибутом функционирования биологической коллекции высокого организационного уровня. Требованиями к функциональным возможностям программного обеспечения являются:

1. Контроль перемещения штаммов и их образцов, обеспечение полной информации о процедурах движения и передачи биологических образцов, особенно патогенных биологических агентов.

2. Управление хранением коллекционного фонда, надежная система контроля и ограничения доступа.

3. Контроль всех производственно-технологических процессов при наработке и контроле качества биологических образцов.

4. Обеспечение функций комплексного мониторинга и скрининга коллекционного фонда.

5. Возможность интегрирования в единую лабораторную информационную систему (LIMS) организации.

6. Возможность создания пользовательских шаблонов бланков и заполняемых форм, таких как паспорта штаммов, сертификаты анализа, этикетки для маркировки образцов, вариативно компонуемые каталоги, сопроводительные документы для перемещения коллекционных образцов и т.д.

7. Регистрация результатов изучения и корректирования таксономической номенклатуры, данных по результатам многофазных исследований и классификации штаммов по культурально-морфорлогическим, тинкториаль-ным свойствам, физиологии и биохимии.

8. Документирование и прослеживаемость всех этапов исследований. Для молекулярно-генетических методов — регенерация коллекционных образцов, подготовка образца ДНК, ПЦР, гель-хроматография, визуализация результатов секвенирования, параллельное размещение согласованной последовательности в базе данных и он-лайн каталоге.

9. Наличие библиотеки типовых штаммов.

10. Структура БД должна быть гибкой и динамичной, т.е. необходима возможность внесения/изменения данных, изменения структуры БД кураторами и другими ответственными сотрудниками коллекции без привлечения сотрудников IT-подразделений и/или представителей разработчика ПО.

11. Прослеживаемость данных о каждом доступе, сеансе работы, внесении любых изменений каждым авторизованным пользователем.

12. Возможность импорта и экспорта данных в различных форматах, таких как MS Excel, HTML, XML, FASTA, NCBI и т.д., текстовые файлы, графические/точечные изображения, таблицы, диаграммы, хроматограммы, данные микропланшетных ридеров и др.

13. Возможность прописывания ссылок и/или импорт-экспорт данных на мждународных авторизованных интернет-порталах, таких как Strainlnfo, NCBI, GBIF и т.д.

14. Наличие средства написания сценариев и средства устранения ошибок и отладки для автоматизации администратором типовых процедур обработки данных и событий с использованием пакетного режима и создания собственных утилит командной строки и расширения функциональности ПО в соответствии с вновь возникающими потребностями пользователей.

15. Интеграция новых сценариев в существующие меню без изменения структуры интерфейса приложения.

16. Предустановленная система управления информационным наполнением (CMS) для соответствия контента в базах данных, авторизованных коммуникационных устройствах и на web-сайтах, где размещаются данные биологической коллекции.

17. Наличие программных средств кластерного анализа методами молекулярной филогенетики, в том числе методами одиночной и полной связи (single-complete linkage), методами попарного внутригруппового (не-) взвешенного среднего (UPGMA, WPGMA), методом объединения соседних пар (neighbour-joining method) [7] и т.д.

18. Возможность построения дендрограмм.

III. Дополнительные требования к базам данных сервисных биологических коллекции

Если биологическая коллекция является публичной и сервисной, предоставляя различные услуги по поставке биологических образцов, депонированию охраноспособных штаммов в целях патентной экспертизы, проведению научно-исследовательских работ, то комплексная система управления данными должна стать оптимальным, мульти-функциональным средством коммуникации с организациями-клиентами и конечными пользователями.

В этом случае к системе информационного обеспечения коллекции могут предъявляться следующие требования:

1. Прямой доступ к публичным данным.

2. Простое и быстрое размещение новых данных.

3. Возможность авторизованного доступа пользователей к информации ограниченного распространения.

4. Интуитивно понятный интерфейс, удобные форматы для использования контента.

5. Удобство коммуникации клиентов и конечных потребителей как с коллекцией, так и между собой. Web-страницы не должны быть перегружены, должна функционировать система перекрестных ссылок, желательно наличие форумов, новостного сервиса, FAQ-раздела, посвященного рассмотрению вопросов, наиболее часто задаваемых (FAQ) пользователями коллекций.

6. Наличие кабинета клиента, возможность оформления заявки на образцы через форму, использующую алгоритм построения бинарного дерева решений (CART System), легкое составление и изменение спецификации заявки, отсутствие необходимости для зарегистрированных пользователей каждый раз вносить личные данные и реквизиты организации.

7. Удобная и быстрая связь с кураторами коллекции и ответственными сотрудниками отдела продаж/сбыта. Наличие форм обратной связи, бланков с функциями автозаполнения.

8. Возможность доступа уполномоченных сотрудников ко всей необходимой информации о подготовке договоров, счетов и другой документации, наличии оплаты, этапах работ, стадиях их выполнения. Также вся необходимая информация должна быть доступна в кабинете пользователя.

9. При развитии взаимодействия с другими коллекциями возможно увеличение трафика с помощью использования так называемой «friendly URL» и таких протоколов доступа, как REST, SOAP и т.д.

Данные характеристики системы управления необходимы для удобства всех сторон — коллекции, клиентов и пользователей. Для конечного потребителя также могут быть необходимы или весьма желательны следующие опции:

1. Возможность поиска штаммов по максимально большому перечню характеристик.

2. Расширенная поисковая система с возможностью обработки и группировки запросов по атрибутам «и», «или», «не».

3. Удобство копирования и вставки текста, возможность выделения и переноса данных как вручную, так и посредством web-сервисов.

4. Возможность сравнительного изучения результатов полифазных исследований, проведенных в рамках идентификации, классификации, типирования штамма, доступность геномных профилей, определенных с помощью MLST, MLVA и других методов, возможность попарного параллельного сравнения ДНК или аминокислотных последовательностей коллекционных штаммов в сравнении с референс-образцами и пр.

5. Возможность получения и обмена информацией в соответствии с международными стандартами протоколов, в том числе GSC (Genomic Standards Consortium, http://www.gensc.org/), TDWG (Taxonomic Databases Working Group, Biodiversity Information Standards, http:// www.tdwg.org/about-tdwg/), BioSharing и т.д.

6. Наличие внешних ссылок на данные, содержащиеся в других таксономических порталах и центрах, таких как StrainInfo, WDCM, GBIF, DSMZ, INSDC (NCBI, ENBL, DDBJ), LifeWatch, BioVel, Vibrant, LifeLink, Elixir, Q-Bank.

Выводы

Обеспечение эффективности поддержания и управления биологической коллекцией является исключительно трудной задачей, предъявляющей повышенные требования к ответственным исполнителям. Управление данными является одним из ключевых элементов системы качества биологической коллекции и совершенно необходимо для полноценного исполнения функциональных обязанностей и решения задач коллекции, при этом от сотрудников коллекции требуется повышенная степень знаний в соответствующих областях, наличие опыта и специальной подготовки. В то же время достигнутый уровень развития программно-технического обеспечения в области управления данными и перспективы дальнейших разработок предоставляют любой биологической коллекции, при наличии должной квалификации персонала, возможность выхода на принципиально новый уровень сложности целей и задач и выполнения их в соответствии с международными стандартами качества и требованиями, предъявляемыми к биологическим коллекциям.

Литература

1. «ВП-П8-2322. Номплексная программа развития биотехнологий в Российской Федерации на период до 2020 года» (утв. Правительством Российской Федерации 24.04.2012 г. № 1853п-П8).

2. Онищенко ГГ, Нутырев ВВ, Топорков АВ, Осин АВ. Современное состояние коллекционной деятельности, связанной с

использованием возбудителей инфекционных болезней I-II групп патогенности. Проблемы особо опасных инфекций 2010; 1(103): 5-10.

3. Объединенный каталог Российских коллекций немедицинского профиля. 2002. Available from: https://goo.gl/kdZmRD.

4. Всероссийская коллекция микроорганизмов (ВНМ). Федеральное агенство научных организаций Институт биохимии и физиологии микроорганизмов Г. Н Скрябина РАН. Available from: http://www.vkm.ru.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Объединенный каталог Российских биологических коллекций микроорганизмов. Научно-исследовательский институт проблем экологии и эволюции им. А. Н. Северцова РАН Available from: http://www.sevin.ru/collection/microcoll/consolidated.html.

6. Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ. Basic local alignment search tool. J Mol Biol. 1990; 215(3): 403-10.

7. Saitou N, Nei M. The neighbor-joining method: a new method for reconstructing phylogenetic trees. Mol Biol Evol. 1987; 4(4): 406-25.

Об авторах

Федеральное государственное бюджетное учреждение «Научный центр экспертизы средств медицинского применения» Министерства здравоохранения Российской Федерации, Российская Федерация, 127051, Москва, Петровский бульвар, д. 8, стр. 2. Давыдов Дмитрий Сергеевич. Начальник лаборатории бактериофагов и препаратов нормофлоры с коллекцией микроорганизмов Испытательного центра экспертизы качества МИБП, канд. биол. наук.

Ношечкин Нонстантин Николаевич. Начальник управления информатизации, канд. биол. наук.

МовсесянцАрташесАвакович. Начальник Испытательного центра экспертизы качества МИБП, д-р мед. наук, профессор. Адрес для переписки: Давыдов Дмитрий Сергеевич; ОаууЬоу@ехртеЬ.ги

Basic approaches to data management for administration of biological collections

D. S. Davydov, K. A. Koshechkin, A. A. Movsesyants

Federal State Budgetary Institution

«Scientific Centre for Expert Evaluation of Medicinal Products»

of the Ministry of Health of the Russian Federation,

Petrovsky boulevard 8, bld. 2, Moscow 127051, Russian Federation

The article analyses the main principles of and approaches to software and hardware solutions and platforms that could be used in the development of data management systems for biological collections. The authors summarise the key requirements for functional capabilities of the software which could be used to support biological resources databases and which is a prerequisite for maintaining a highly organized biological collection. The article sums up the main approaches to restricting access to information on biological collections as required by the patent procedure and biological safety principles. The authors identified specific aspects of developing information support systems for public biological collections.

Key words: databases; quality management system; data acquisition and processing; biological collections; biological reference materials.

For citation: Davydov DS, Koshechkin KA, Movsesyants AA. Basic approaches to data management for administration of biological collections. BlOpreparations. Prevention, Diagnosis, Treatment 2017; 17(4): 216-221.

References

1. VP-P8-2322. The comprehensive program of development of biotechnologies in the Russian Federation until 2020 (approved by the Government of the Russian Federation on April 24, 2012 № 1853p-P8) (in Russian).

2. Onishenko GG, Kutyrev VV, ToporkovAV, Ossin AV. Current state of collection activity relative to the use of infectious agents of l-ll pathogenicity groups. Problems of Particularly Dangerous Infections 2010; 1(103): 5-10 (in Russian).

3. Consolidated Catalogue of Microbial Cultures Held in Russian Non-medical Collections. 2002. Available from: https://goo.gl/ kdZmRD (in Russian).

4. All-Russian Collection of Microorganisms — VKM. Russian Academy of Sciences. G. K. Skryabin Institute of Biochemistry and Physiology of Microorganisms. Available from: http://www.vkm.ru.

5. All-Russian catalogue of culture collections. A. N. Severtsov' Institute of ecology and evolution Russian academy of sciences. Available from: http://www.sevin.ru/collection/microcoll/consolida-ted.html (in Russian).

6. Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ. Basic local alignment search tool. J Mol Biol. 1990; 215(3): 403-10.

7. Saitou N, Nei M. The neighbor-joining method: a new method for reconstructing phylogenetic trees. Mol Biol Evol. 1987; 4(4): 406-25.

Authors

Federal State Budgetary Institution «Scientific Centre for Expert Evaluation of Medicinal Products» of the Ministry of Health of the Russian Federation, Petrovsky boulevard 8, bld. 2, Moscow 127051, Russian Federation.

Davydov DS. Head of the Laboratory of Bacteriophages and Normal Flora Preparations with the Collection of Microorganisms of the Testing Centre for Evaluation of Medicinal Immunobiological Products' Quality. Candidate of Biological Sciences. Koshechkin KA. Head of Informatization Division. Candidate of Biological Sciences.

Movsesyants AA. Head of the Testing Centre for Evaluation of Medicinal Immunobiological Products' Quality. Doctor of Medical Sciences, professor.

Contact e-mail: Davydov Dmitrii Sergeevich; Davydov@expmed.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.