Научная статья на тему '2014. 01. 006. Ван дер граф М. , Вайерс Л. Доска для серфинга: программа действий четырех стран по исследовательским данным: доклад об обмене знаниями. Van der Graaf M. , waaijers L. A surfboard for riding The wave: towards a four country action programme on research data: a Knowledge exchange report. – Copenhagen: Knowledge exchange, 2011. – Mode of access: http://www. Knowledge-exchange. Info/surfboard'

2014. 01. 006. Ван дер граф М. , Вайерс Л. Доска для серфинга: программа действий четырех стран по исследовательским данным: доклад об обмене знаниями. Van der Graaf M. , waaijers L. A surfboard for riding The wave: towards a four country action programme on research data: a Knowledge exchange report. – Copenhagen: Knowledge exchange, 2011. – Mode of access: http://www. Knowledge-exchange. Info/surfboard Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
40
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НАУЧНАЯ ИНФОРМАЦИЯ / НАУЧНАЯ КОММУНИКАЦИЯ / НАУЧНЫЕ ЖУРНАЛЫ / НАУЧНЫЕ ПУБЛИКАЦИИ / НАУЧНЫЕ СВЯЗИ МЕЖДУНАРОДНЫЕ
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Соколова М. Е.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «2014. 01. 006. Ван дер граф М. , Вайерс Л. Доска для серфинга: программа действий четырех стран по исследовательским данным: доклад об обмене знаниями. Van der Graaf M. , waaijers L. A surfboard for riding The wave: towards a four country action programme on research data: a Knowledge exchange report. – Copenhagen: Knowledge exchange, 2011. – Mode of access: http://www. Knowledge-exchange. Info/surfboard»

зациях. Никаких общих механизмов по трудоустройству таких людей не существует, пишет автор статьи. Каждая организация решает этот вопрос по-своему. Например, в Центре социального действия существует практика заключения годовых контрактов с молодыми сотрудниками, и недавно штат Центра увеличился за счет пятерых 16-17-летних исследователей. Помимо этого, совместно с National open college network Центр открыл несколько методологических курсов, посвященных проблемам информированного согласия, конфиденциальности, хранения документации, составления отчетов [с. 215-217].

Участие молодежи в научных исследованиях, подытоживает Д. Флеминг, заставляет пересмотреть уже ставшие привычными представления о роли и месте профессионалов и «простых» людей в научном процессе. Ученым необходимо научиться признавать и ценить знания и опыт тех, кого они обычно воспринимают лишь как пассивный объект исследования.

М.А. Ядова

2014.01.006. ВАН ДЕР ГРАФ М., ВАЙЕРС Л. ДОСКА ДЛЯ СЕРФИНГА: ПРОГРАММА ДЕЙСТВИЙ ЧЕТЫРЕХ СТРАН ПО ИССЛЕДОВАТЕЛЬСКИМ ДАННЫМ: ДОКЛАД ОБ ОБМЕНЕ ЗНАНИЯМИ.

Van der GRAAF M., WAAIJERS L. A surfboard for riding the wave: Towards a four country action programme on research data: A knowledge exchange report. - Copenhagen: Knowledge exchange, 2011. -Mode of access: http://www.knowledge-exchange.info/surfboard

Достижения мировой науки в последние десятилетия все в большей степени определяются постоянно увеличивающимися потоками научных данных. Обширные базы данных становятся информационными источниками для будущих исследований и, наряду с традиционными научными публикациями, все большее распространение получает новый тип публикаций, содержащих научные данные. Такая насыщенная данными модель исследовательской деятельности описывается в настоящее время как «чет-

вертая парадигма науки»1, основанная на принципе свободного движения знаний в научном пространстве.

В реферируемом докладе рабочей группы экспертов из стран Европейского союза рассматривается практика, подходы и принципы в области создания управления данными в четырех странах ЕС, объединенных инициативами по обмену знаниями (Knowledge exchange) в поддержку высшего образования и науки. В эту группу входят представители таких организаций, как Датская электронная исследовательская библиотека (Denmark's electronic research library / DEFF), Немецкий исследовательский фонд (German research foundation / DFG), Совместный комитет информационных систем (Joint information systems committee / JISC, Великобритания), Фонд SURF (SURF foundation, Нидерланды). Всех участников этой группы объединяет задача сделать научный контент, включая данные, полученные в результате исследований, открытыми для доступа через Интернет. Стратегическими целями их партнерства является превращение обмена данными в неотъемлемую часть академической культуры, а логистики данных - в интегральный компонент академической профессиональной жизни.

В докладе освещаются различные аспекты международного сотрудничества в области создания разветвленной инфраструктуры данных как части научной электронной инфраструктуры, которая необходима для обеспечения возможности использовать и цитировать научные данные с максимальным эффектом для исследователей и представителей высшего образования и бизнеса. Авторы доклада рассматривают перспективы создания такой инфраструктуры вплоть до 2030 г.

По их мнению, дальнейшая судьба и успехи управления научными данными будут зависеть от таких факторов, как создание системы мер и стимулов, побуждающих ученых открывать доступ к полученным ими данным; формирование институциональной, национальной / международной и дисциплинарной / междисциплинарной инфраструктуры в этой области. После подробного рассмотрения международных и национальных инициатив в докладе

1 The fourth paradigm: Data-intensive scientific discovery / Ed. by T. Hey,

S. Tansley, K. Tolle. - Redmond (WA), 2009. - Mode of access: http://research.micro soft. com/en-us/collaboration/fourthparadigm/4th_paradigm_book_complete_lr.pdf

формулируется программа дальнейших действий в четырех странах-партнерах.

Целый ряд опросов указывает на понимание учеными важности деятельности, обеспечивающей открытый доступ к данным исследованиям1. Однако эти же опросы говорят и о трудностях в этой области, о необходимости организации и управления происходящими процессами на более системной и организованной основе.

Доклад структурирован по таким темам, как человеческие ресурсы и техническая инфраструктура. К основным направлениям развития инфраструктуры авторы отнесли следующие: формирование стимулов для участия ученых в сборе данных; подготовка специалистов (в том числе и самих исследователей) в области хранения и использования данных; создание инфраструктуры и вопросы ее финансирования в перспективе развития логистики данных (в частности, рассматривается роль такого источника финансирования, как грантовый менеджмент) [с. 8].

Приоритетом в становлении инфраструктуры данных является обеспечение доступа к этим данным, интероперабельности и взаимосвязи различных баз и информационных систем данных [с. 8]. Определяющая роль в этих процессах принадлежит международным инициативам, в числе которых особое значение имеет документ ОЭСР (2007), утверждающий культуру открытости и совместного обмена данными между задействованными в рассматриваемых процессах научными организациями стран-участниц этой международной организации2. В документе закреплено понимание инфраструктуры данных как части международной исследовательской инфраструктуры ЕС. Аналогичные инициативы существуют и в США - например, программа по менеджменту данных Национального научного фонда; в Австралии создана Австралийская на-

1 Beagrie N., Beagrie R., Rowlands L. Research data preservation and access: The views of researchers // Ariadne. - 29.07.2009. - N 60. - Mode of access: http://www.ariadne.ac.uk/issue60/beagrie-et-al/; Kuipers T., van der Hoeven J. PARSE.INSIGHT: Insight into digital preservation of research output in Europe: Survey report. - Swindon: Science and technology facilities council, 2009. - Mode of access:

http://www.parse-insight.eu/downloads/PARSE-Insight_D3-4_SurveyReport_final_hq.pdf

2

OECD principles and guidelines for access to research data from public funding. - P.: OECD, 2007. - Mode of access: http://www.oecd.org/dataoecd/9/61/3850 0813.pdf

циональная служба данных [с. 9]. Число участников инфраструктуры данных постоянно растет.

И все же в настоящее время сегмент опубликованных данных пока составляет относительно небольшую часть потоков научной информации. Для того, чтобы положение изменилось, необходимо, чтобы баланс преимуществ и рисков, связанных с опубликованием данных, включая этические аспекты и затраты по созданию документации и метаданных для исследователей, складывался в пользу ученых. Соответственно, навыки и виды деятельности, сопряженные с опубликованием данных, должны стать обязательной частью научной культуры и превратиться в профессиональные привычки исследователей.

Авторы доклада выделяют следующие направления формирования активности исследователей по обмену, совместному использованию и публикации данных: обеспечение возможностей для дальнейшего использования данных; разработка научными организациями национальных рекомендаций и правил поведения в данной области; требования финансирующих организаций и гран-тодателей по включению информации о публикации данных в отчеты о проделанной работе. Важную роль в этой области играет и политика редакций научных журналов.

В частности, многие узкоспециализированные журналы помимо требования об обязательном наличии файла, сопровождающего электронный вариант текста, с данными, мультимедиа, схемами и т. д., создают большие репликационные базы данных, которые могут быть использованы для написания более чем одной статьи. Например, такой деятельностью занимается Архив данных в Великобритании (Data archive, UKDA). Ставится вопрос о создании специальных репозиториев и архивов, о сотрудничестве в данной области, а также о разработке бизнес-модели такого сотрудничества [с. 15].

Появился особый тип научных публикаций, основанных на обнародовании данных исследований, что уже вошло в практику некоторых научных журналов, число которых постоянно растет. В связи с этим важную роль в процессах создания стимулов для увеличения количества таких публикаций могут сыграть новые методы измерения их цитирования. Необходимым фактором является также ограничение права собственности издателей на опублико-

ванные данные в интересах обеспечения к ним открытого доступа. Важны такие меры, как создание библиографического формата, дающего возможность цитирования данных, введение для тех же целей специальных идентификаторов - например, методы организованного при Ганноверском университете центра DataCite [с. 11]. Необходимо также увеличение числа специализированных журналов, публикующих данные, и внесение пункта о публикации данных в отчеты исследователей [там же].

Еще одним стимулом для ученых в области создания инфраструктуры данных является разработка особых рекомендаций и норм поведения в этой области. Такие рекомендации в настоящее время издаются рядом научных организаций в Великобритании и Германии [с. 12].

В условиях насыщения науки данными и для самих исследователей, и для других специалистов - представителей таких новых профессий, как «специалист по данным» (data scientist), отвечающий за компьютерную обработку, хранение и доступ к данным, и дата-библиотекарь (data librarian), занимающийся их сохранением и архивированием, - становится необходимым обучение специализированным навыкам. В связи с этим на повестке дня стоит вопрос о формировании учебных программ для университетских курсов подготовки таких специалистов.

Что касается профессии библиотекаря, работающего с данными, то в настоящее время все еще ведутся многочисленные дискуссии по поводу ее профессиональных стандартов; далеко не везде связанные с ней разделы входят в программу университетских курсов. К тому же существование трех видов специалистов, занимающихся проблемами данных, приводит к дублированию и пересечению их функций и элементов подготовки.

Поскольку дальнейшая судьба менеджмента научных данных будет зависеть во многом от новой генерации специалистов, которые сейчас обучаются в университетах, целый ряд проектов по подготовке соответствующих кадров осуществляется в Великобритании. В Нидерландах DANS (Data archiving and network services) ежегодно обеспечивает от 15 до 25 семинаров и подготовительных курсов в этой профессиональной области, проводятся лекции для менеджеров, занимающихся данными археологических институтов, и исследователей из институтов Королевской академии искусств и

наук, студентов, обучающихся в различных голландских университетах на факультетах социальных и гуманитарных наук. В Германии пока нет системного подхода к подготовке национальной программы деятельности по обучению менеджменту данных самих исследователей, но инициативы такого рода вскоре последуют.

Перспективной является подготовка кадров не только в области естественных и точных наук, но и по социальным и гуманитарным дисциплинам. Можно привести в качестве примера использование Archaeological data service (ADS), предназначенного для архивирования данных, изображений, текстов, документов в Кембриджском университете при создании учебных модулей по археологии и социальной антропологии [с. 19].

Как отмечают авторы доклада, их стратегической долгосрочной целью является превращение логистики данных в составной компонент академической профессиональной жизни и обязательное участие первичных «держателей данных» - университетов, научных обществ, библиотечно-информационных структур - в участников этих программ, а также развитие учебных курсов и программ подготовки всех трех видов специалистов в этой области.

Один из разделов доклада посвящен инфраструктуре данных каждой из стран-партнеров на институциональном, дисциплинарном, национальном и международном уровнях. Рассматривая инфраструктуру данных в каждой из стран-партнеров, авторы делают акцент на возможностях и перспективах сотрудничества и интеро-перабельности.

Констатируется, что, несмотря на принимаемые меры, можно говорить пока лишь о первичном становлении институциональной инфраструктуры. Основными ее формами являются использование программного обеспечения для совместной дистанционной групповой исследовательской работы и институциональные репозито-рии данных, информация из которых может быть доступна другим исследователям. Такие репозитории создаются на основе самых различных подходов и стандартов.

Авторы обращают внимание на особенности организации использования и хранения научных данных в «большой» и «малой» науке. В «большой» науке данные, как правило, производятся в крупных исследовательских организациях и хранятся в их же собственных специальных центрах, где с ними могут работать другие

исследователи. Что касается «малой» науки, то здесь данные создаются либо индивидуальными исследователями, либо исследовательскими группами во время выполнения какого-либо проекта и затем хранятся в соответствии с возможностями этих небольших, а зачастую и временных коллективов. Все они или только их часть могут быть включены в репликационную базу посредством линков, связанных с журнальной статьей. В таких случаях эти данные часто переносятся институтом или издателем журнала в репозиторий или архив данных [с. 20].

Существующая в настоящее время инфраструктура данных является гетерогенной, дифференцированной и имеет слабые организационные связи. Процедуры управления ею лишь начали развиваться. Слабо развиты также технологические стандарты и семантические онтологии в этой области. Многие различия обусловлены междисциплинарными или национальными особенностями инфраструктуры. Сложившееся положение нуждается в принятии серьезных мер в целях улучшения интероперабельности разнообразных банков данных.

Центры данных, обрабатывающие информацию по отдельным дисциплинам, развиваются научными сообществами согласно их собственным нуждам и стандартам. Примерами являются мировые центры данных по гео- и экологическим наукам, астрономии, кристаллографии [с. 22]1.

Авторы доклада отмечают, что все большее число научных библиотек начинает работать с исследовательскими данными, занимаясь их сбором, обработкой, хранением и архивированием. Много таких библиотек работает с данными в США, получая их от различных государственных и коммерческих структур и обеспечивая доступ к ним для академического сообщества. В Великобритании подобной деятельностью занимается, например, библиотека Эдинбургского университета. Такие библиотеки поддерживают специальные сервисы - репозитории данных, которые могут использовать сами исследователи [с. 18].

1 The world data centre system. - Mode of access: http://www.icsu-wds.org/; The world data centre for geomagnetism, Copenhagen. - Mode of access: http://www.space.dtu.dk/English/Research/Scientific_data_and_models/World_Data_Ce nter_for_Geomagnetism.aspx

Что касается информационных структур национального уровня, работающих с данными, то Великобритания имеет 17 дата-центров и архивов, в Германии их более девяти, в Нидерландах в перечень входят семь центров, в том числе и мультиинституцио-нальные репозитории данных. В области социальных и гуманитарных наук в этой стране большую роль играет DANS. В Дании насчитывается три таких центра, большую роль в поддержании и развитии национальной инфраструктуры данных играет Датский архив данных по социальным наукам (Danish data archive for social sciences) [с. 34].

Главными проблемами в развитии экосистемы репозиториев являются отсутствие связей между различными частями инфраструктуры данных, а также необходимость серьезных долгосрочных финансовых вложений. Программа развития инфраструктуры данных в будущем должна строиться в первую очередь на основе именно этих направлений.

Далее в докладе приведен перечень основных организаций, осуществляющих финансирование инфраструктуры данных в странах группы Knowledge exchange, говорится о необходимости разработки принципов такого финансирования, предлагается поддерживать ряд проектов в этой области.

В заключение своего доклада авторы, основываясь на материалах проведенного ими анализа, формулируют ряд рекомендаций как основу программы будущих действий в этой области. Среди них такие меры, как: инициирование и поддержка проектов по развитию институциональной инфраструктуры данных; проведение периодических вебинаров, конференций и пр., где участники проекта могут обмениваться практическим опытом и знаниями; усовершенствование дисциплинарной, международной и национальной инфраструктуры данных; установление связей между различными репозиториями, центрами и архивами данных; способствование проведению благоприятной в отношении данных политики редакциями журналов и научными организациями, разрабатывающими рекомендации и правила в этой области [с. 34-35].

М.Е. Соколова

i Надоели баннеры? Вы всегда можете отключить рекламу.