Научная статья на тему 'ЦИФРОВЫЕ ПЛАТФОРМЫ И ЦИФРОВЫЕ НАУЧНЫЕ БИБЛИОТЕКИ'

ЦИФРОВЫЕ ПЛАТФОРМЫ И ЦИФРОВЫЕ НАУЧНЫЕ БИБЛИОТЕКИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1279
249
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НАУЧНАЯ ЦИФРОВАЯ ПЛАТФОРМА / ЭКОСИСТЕМА ЦИФРОВОЙ ПЛАТФОРМЫ / ЦИФРОВАЯ НАУЧНАЯ БИБЛИОТЕКА / НАУЧНОЕ ИНФОРМАЦИОННОЕ ПРОСТРАНСТВО / ЦИФРОВАЯ МАТЕМАТИЧЕСКАЯ БИБЛИОТЕКА / МЕТАДАННЫЕ / ФОРМИРОВАНИЕ МЕТАДАННЫХ / ИЗВЛЕЧЕНИЕ МЕТАДАННЫХ / НОРМАЛИЗАЦИЯ МЕТАДАННЫХ / ФАБРИКА МЕТАДАННЫХ / ЦИФРОВАЯ МАТЕМАТИЧЕСКАЯ БИБЛИОТЕКА LOBACHEVSKII-DML / SCIENTIFIC DIGITAL PLATFORM / DIGITAL PLATFORM ECOSYSTEM / DIGITAL SCIENCE LIBRARY / SCIENTIFIC INFORMATION SPACE / DIGITAL MATH LIBRARY / METADATA / METADATA GENERATION / METADATA EXTRACTION / METADATA NORMALIZATION / METADATA FACTORY / LOBACHEVSKII-DML DIGITAL MATH LIBRARY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Елизаров А. М., Липачёв Е. К.

Обсуждены направления развития и использования цифровых технологий в научной деятельности на базе цифровых платформ, значение и роль цифровых библиотек в формировании таких платформ, а также проблемы обеспечения интегрированности (связности) извлекаемой информации. Рассмотрены подходы к созданию научных информационных пространств как подпространств единого информационного пространства. Введено понятие фабрики метаданных как системы взаимосвязанных программных инструментов, направленных на создание, обработку, хранение и управление метаданными объектов цифровых библиотек и позволяющих интегрировать создаваемые электронные коллекции в агрегирующие цифровые научные библиотеки. Решен ряд задач, связанных с построением фабрики метаданных цифровой математической библиотеки Lobachevskii-DML. Предложено использовать эту реализованную фабрику метаданных как элемент экосистемы любой научной цифровой платформы

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Елизаров А. М., Липачёв Е. К.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DIGITAL PLATFORMS AND DIGITAL SCIENCE LIBRARIES

The directions of the development and use of digital technologies in scientific activities based on digital platforms, the significance and role of digital libraries in the formation of such platforms, as well as the problems of ensuring the integration (connectivity) of the extracted information are discussed. Approaches to the creation of scientific information spaces as subspaces of a single information space are considered. The concept of a metadata factory is introduced as a system of interconnected software tools aimed at creating, processing, storing and managing metadata of digital library objects and allowing to integrate the created digital collections into aggregating digital scientific libraries. A number of tasks related to the construction of a metadata factory for the Lobachevskii-DML digital mathematical library have been solved. It is proposed to use this implemented metadata factory as an element of the ecosystem of any scientific digital platform.

Текст научной работы на тему «ЦИФРОВЫЕ ПЛАТФОРМЫ И ЦИФРОВЫЕ НАУЧНЫЕ БИБЛИОТЕКИ»

Цифровые платформы и цифровые научные

библиотеки

А. М. Елизаров, Е. К. Липачёв

Аннотация—Обсуждены направления развития и использования цифровых технологий в научной деятельности на базе цифровых платформ, значение и роль цифровых библиотек в формировании таких платформ, а также проблемы обеспечения интегрированности (связности) извлекаемой информации. Рассмотрены подходы к созданию научных информационных пространств как подпространств единого информационного пространства. Введено понятие фабрики метаданных как системы взаимосвязанных программных инструментов, направленных на создание, обработку, хранение и управление метаданными объектов цифровых библиотек и позволяющих интегрировать создаваемые электронные коллекции в агрегирующие цифровые научные библиотеки. Решен ряд задач, связанных с построением фабрики метаданных цифровой математической библиотеки ЬоЪасЬеузки-БМЬ. Предложено использовать эту реализованную фабрику метаданных как элемент экосистемы любой научной цифровой платформы.

Ключевые слова—научная цифровая платформа, экосистема цифровой платформы, цифровая научная библиотека, научное информационное пространство, цифровая математическая библиотека, метаданные, формирование метаданных, извлечение метаданных, нормализация метаданных, фабрика метаданных, цифровая математическая библиотека ЬоЬасЬеузки-БМЬ.

I. Введение

Как известно, в настоящее время цифровая экономика понимается как экономика, основанная на процессах производства и использования цифровых технологий (см., например, [1]), в том числе информационно-коммуникационных - ИКТ). Сегодня эти процессы в значительной степени реализуются на базе цифровых платформ, организованных в различных предметных областях и сферах деятельности и являющихся одной из разновидностей компьютерных платформ. Под последними в общем случае понимают среду, в которой должны разрабатываться и затем выполняться новые фрагменты программного обеспечения с учётом ограничений, накладываемых этой средой, и возможностей, предоставляемых ею. Цифровые

Статья получена 30 августа 2020 года

А. М. Елизаров - доктор физ.-мат. наук, профессор Института информационных технологий и интеллектуальных систем Казанского (Приволжского) федерального университета (e-mail: amelizarov@ gmail.com).

Е. К. Липачёв - кандидат физ.-мат. наук, доцент Института информационных технологий и интеллектуальных систем Казанского (Приволжского) федерального университета (e-mail:

[email protected]).

платформы обладают своими специфическими наборами сервисов и позволяют решать разнообразные комплексы задач по развитию и использованию цифровых технологий. Одной из областей применения этих технологий являются научные исследования и разработки.

Понятие «цифровая платформа» сформировалось одновременно в нескольких сферах деятельности и лишь в последние десятилетия, что привело к большому числу определений этого понятия. Например, в [2] под цифровой платформой понимают совокупность цифровых технологий, продуктов или услуг, обеспечивающих технологическую основу, на которой внешние пользователи (компании) могут создавать собственные дополнительные продукты, технологии или услуги. Как отмечено в [3], цифровая платформа -это:

• группа технологий, которые используются в качестве основы, обеспечивающей создание конкретизированной и специализированной системы цифрового взаимодействия;

• бизнес-модель, обеспеченная высокими технологиями, которая создает стоимость и облегчает обмены между двумя или большим числом взаимозависимых групп участников;

• предприятие, обеспечивающее взаимовыгодные взаимодействия между сторонними производителями и потребителями, создающее открытую инфраструктуру для участников и устанавливающую новые правила.

Другие подходы к определению цифровой платформы можно найти, например, в [4]. Само понятие цифровой платформы и некоторые особенности текущего этапа их развития проанализированы в [5], а в [6] даны оценки современного уровня развития цифровых платформ в России, включающие четыре основных компонента: определение многосторонних цифровых платформ, факторы развития цифровых платформ, бизнес-модели и динамика конкуренции.

Все определения цифровых платформ, упомянутые выше, отражают следующий наиболее существенный момент: цифровая платформа - это ключевой инструмент цифровой трансформации традиционных отраслей и рынков и центральное понятие, разграничивающее стратегии цифровизации и цифровой трансформации. При этом цифровая трансформация -это революционные изменения бизнес-моделей разнообразных видов деятельности на основе использования цифровых платформ, что приводит к радикальному росту объемов рынка и конкурентоспособности его участников.

Отметим, что формирование цифровых платформ для исследований и разработок предусмотрено программой «Цифровая экономика Российской Федерации» [7, гл. 1]. В этой программе отмечена необходимость создания цифровых платформ для фундаментальных и прикладных исследований, научно-исследовательских и опытно-конструкторских разработок. Именно научно-исследовательские и опытно-конструкторские разработки составляют основные направления деятельности в области исследований и разработок. Как правило, с каждой создаваемой цифровой платформой связана организация, которая выступает в роли оператора платформы и формирует вокруг нее собственную экосистему.

С понятием цифровой платформы в последнее время связывают понятие цифровой фабрики (Digital Factory), точное определение которого сегодня еще отсутствует. В одном из подходов к его определению (см. https://technet-nti.ru/article/fabriki-buducshego) отмечено, что цифровая фабрика - это система комплексных технологических решений, обеспечивающих в кратчайшие сроки проектирование и производство глобально конкурентоспособной продукции нового поколения. При этом цифровая фабрика предполагает использование широкого спектра digital-инструментов на всех этапах проектирования и производства продукции - от стадии исследования до опытного образца. Ниже будет дано определение фабрики метаданных научной цифровой библиотеки, построение которой является одним из основных результатов настоящей работы.

Статья организована следующим образом.

В разделе 2 обсуждены направления развития и использования цифровых технологий в научной деятельности на базе цифровых платформ, приведены базовые определения цифровых платформ и цифровых фабрик.

Раздел 3 посвящен оценке значения и роли цифровых библиотек в формировании научных цифровых платформ, а также проблемам обеспечения интегрированности (связности) извлекаемой

информации.

В разделе 3 рассмотрены подходы к созданию научных информационных пространств как подпространств единого информационного

пространства, охарактеризованы проекты,

реализованные в этом направлении.

В разделе 4 охарактеризована роль метаданных как средства навигации в информационном пространстве. Введено понятие фабрики метаданных как системы взаимосвязанных программных инструментов, направленных на создание, обработку, хранение и управление метаданными объектов цифровых библиотек и позволяющих интегрировать создаваемые электронные коллекции в агрегирующие цифровые научные библиотеки. Решен ряд задач, связанных с построением фабрики метаданных цифровой математической библиотеки Lobachevskii-DML.

В разделе 5 описаны основные подходы к управлению математическими знаниями, лежащие в основе проекта

WDML создания Всемирной цифровой математической библиотеки. Предложено использовать результаты настоящей работы для решения ряда задач, поставленных в этом проекте.

II. Цифровые научные библиотеки как элементы цифровых ПЛАТФОРМ

Одно из направлений развития и использования цифровых технологий в научной деятельности предусматривает организацию на современном уровне и с использованием ИКТ доступа к новейшим научным результатам, в частности, научным публикациям и наукометрической информации о них. Исторически это направление связано с формированием в мире цифровых (или электронных) библиотек, в том числе, научных. Их активное развитие началось в конце ХХ в. (см., например, [8-10]). Вообще под цифровыми (электронными) библиотеками любой направленности (не только научной) понимают модели сложных информационных систем, которые служат основой при создании универсальных распределенных хранилищ знаний и снабжены средствами навигации и поиска в коллекциях разнородных электронных документов, включаемых в эти хранилища.

В настоящее время цифровые библиотеки существуют во всех развитых странах мира и служат базовыми элементами многих цифровых платформ. Примерами российских научных цифровых платформ и соответствующих цифровых библиотек являются:

• Соционет (https://socionet.ru, год организации -2000) - цифровая библиотека, обеспечившая участие России в разработке международной онлайновой научно-образовательной инфраструктуры (первоначально - в области общественных наук, в настоящее время - во всех научных дисциплинах);

• eLibrary (https://elibrary.ru/, год организации - 2005)

- крупнейшая российская цифровая научная библиотека, интегрированная с Российским индексом научного цитирования (РИНЦ);

• Cyberleninka (https://cyberleninka.ru, год организации - 2012) - цифровая научная библиотека, построенная на основе концепции открытой науки (Open Science) и входящая в пятерку крупнейших открытых научных архивов мира.

Кроме перечисленных в России создано большое число разнообразных цифровых библиотек, а также цифровых платформ, связанных с современными публикационными и наукометрическими сервисами. Примерами последних являются Mendeley (https://www.mendeley.com, год организации - 2008) -инструмент управления персональной научной библиотекой и эффективной совместной научной работы; ИСТИНА (https://istina.msu.ru/, год организации

- 2014) - инструмент сбора, систематизации, хранения и анализа наукометрической информации для подготовки и принятия управленческих решений.

Крупнейшими международными научными цифровыми платформами являются наукометрические базы данных:

• Web of Science (до 2014 года - Web of Knowledge) (https://clarivate.com/ webofsciencegroup/solutions/web-of-science/) - возникла в 1961 году как продукт американской

компании ISI (Institute for Scientific Information), позже принадлежала медиакорпорации Thomson Reuters и стала цифровой, с 2016 года принадлежит компании Clarivate Analytics; основной продукт -Web of Science Core Collection;

• Scopus (https://www.scopus.com/, год основания -2004) - крупнейшая база данных, содержащая информацию о цитировании рецензируемой научной литературы.

Названные цифровые платформы (а также большой ряд других) играют огромную роль в ускорении оборота имеющегося знания и доступа к нему. Но без интернета, ставшего сегодня всеобъемлющей интегрированной информационной средой, извлечение информации из разного рода информационных источников (баз данных), каковыми являются разнообразные цифровые платформы, было бы невозможным. Одновременно возникает целый ряд серьезных проблем обеспечения интегрированности (связности) извлекаемой

информации. С этой точки зрения сужение всего пространства имеющейся информации дает возможность точнее специфицировать информацию и, следовательно, обеспечить более качественные доступ к ней и ее использование. Отметим, что такое сужение может быть обеспечено в рамках специализированных цифровых научных библиотек, которые организованы в конкретных предметных областях. Например, высокого уровня организации достигли математические цифровые библиотеки.

В области математических наук создано значительное число цифровых библиотек, выполняющих разнообразные функции интеграции математических знаний [11-16]. Обзор специфики и функциональных возможностей ряда существующих цифровых математических библиотек содержится в [17]. Такие цифровые библиотеки, как MathNet

(http://www.mathnet.ru/), Numdam

(http://www.numdam.org/) и DML-CZ (Czech Digital Mathematics Library, https://dml.cz/), предоставляют сервисы, которые учитывают особенности математического контента. Результаты их формирования и развития к 2013 году представлены в работах [18-22]. Одновременно для информационной поддержки цифровых библиотек, в том числе математических, стали разрабатываться методы обработки документов, основанные на семантических связях объектов, выделенных из их контента [23-30]. В рамках проекта The European Digital Mathematics Library (EuDML, https://initiative.eudml.org/) разрабатываются методы интеграции европейских цифровых математических коллекций.

Итак, в настоящее время в сфере науки и научных исследований сформировано значительное количество разнообразных цифровых научных библиотек. Они реализуют широкий спектр поисковых сервисов, каждая из них обладает собственной экосистемой. С другой

стороны, сегодня отсутствуют примеры созданных цифровых научных платформ, которые реализуют собственные функционалы и сервисы взаимодействия пользователей в соответствии с базовыми определениями, приведенными выше, а также собственные бизнес-модели. Представляется, что базой для построения таких цифровых платформ могут послужить цифровые научные библиотеки, а имеющиеся (не у всех) экосистемы должны быть усовершенствованы или созданы. Ниже мы обсуждаем одно из направлений такого усовершенствования.

III. Научное информационное пространство

В качестве варианта сужения множества имеющейся информации можно говорить о формировании научного информационного пространства, которое и само по себе является огромным. Отметим, что понятие «информационное пространство» и различные его аспекты широко изучены в контексте разных сфер деятельности как с теоретической, так и с практической точек зрения. В самом широком смысле информационное пространство - это совокупность результатов семантической деятельности человечества.

одним из способов сужения уже самого научного информационного пространства является ограничение круга пользователей информации, размещенной в нем. Именно на основе этих рассуждений, начиная с 2004 года, сформировался проект создания единого научного информационного пространства Российской академии наук (ЕНИП РАН) (история развития этого проекта и основные полученные результаты отражены в [31-40]). В соответствии с базовыми документами этого проекта ЕНИП РАН - это интегрированное информационное пространство распределенных и локальных цифровых (электронных) ресурсов организаций РАН и комплекс программно-технических средств, обеспечивающий использование этих ресурсов и полнофункциональное управление ими, т. е. это подпространство научного информационного пространства, ориентированное прежде всего на научных сотрудников РАН как потребителей информации, которое, в свою очередь и прежде всего, порождается и циркулирует в РАН. Названные ограничения должны были точнее специфицировать информацию и обеспечить ее интегрированность. Отметим, что проект ЕНИП во многом опирался на результаты проекта создания Интегрированной системы информационных ресурсов (ИСИР) РАН, реализованного в начале 2000-х годов на базе технологий цифровых библиотек (см., например, [41, 42]).

В недавней работе [43] введен термин «единое цифровое пространство научных знаний (ЕЦПНЗ)» и отмечен ряд проблем, решение которых необходимо для формирования и развития этого пространства. Под ЕЦПНЗ авторы понимают компьютерную среду, обращаясь к которой пользователь должен получить ответы на вопросы, касающиеся тех или иных областей науки.

Таким образом, с одной стороны, предложены различные подходы к формализации понятия научного

информационного пространства как подпространства информационного пространства и описанию его структуры и свойств. С другой стороны, в сфере науки и научных исследований в настоящее время сформировано значительное количество цифровых платформ, базой которых являются разнообразные научные цифровые библиотеки. В свою очередь эти платформы необходимы для формирования структуры научного информационного пространства или, в рамках другого определения, единого цифрового пространства научных знаний (как международного, так и российского).

IV. Метаданные как средство навигации в

ИНФОРМАЦИОННОМ ПРОСТРАНСТВЕ

Хорошо известно, что сегодня навигация в информационном пространстве в значительной степени обеспечивается наличием и полнотой набора метаданных (данных о данных) документов, представленных в сети (например, [43-47]). В настоящее время имеется достаточно много различных стандартов метаданных. Эти стандарты должны обеспечивать возможности интероперабельности с внешней средой, идентификации и интеграции информации, ее поиска в распределенной среде. Метаданные должны быть открытыми и расширяемыми, ориентированными на современные семантические и цифровые технологии. Но даже при наличии таких стандартов реально обеспечить нужные свойства метаданных различных документов весьма затруднительно. Значительно проще задачи стандартизации метаданных решаются применительно к конкретной предметной области и на базе тех цифровых библиотек, которые созданы в этой области. Примером служит область математических и компьютерных наук, где создано значительное число цифровых библиотек, которые выполняют разнообразные функции интеграции математических знаний. Особенности представления метаданных документов в различных цифровых математических библиотеках описаны в [48, 49].

Мы считаем, что существенным элементом экосистемы любой цифровой библиотеки должна стать фабрика метаданных. Мы используем термин «фабрика метаданных цифровой библиотеки» (metadata factory of digital library) в следующем смысле: фабрика метаданных - это система взаимосвязанных программных инструментов, направленных на создание, обработку, хранение и управление метаданными объектов цифровых библиотек и позволяющих интегрировать создаваемые электронные коллекции в агрегирующие цифровые научные библиотеки. С помощью этих инструментов преимущественно в автоматизированном режиме выполняются такие операции, как выделение объектов и связей между ними, экстракция метаданных из различных источников и конкретных документов, верификация, уточнение, улучшение, нормализация в различных форматах и гармонизация метаданных (с помощью ручного редактирования или автоматизированных агентов), а

также хранение и связывание метаданных с внешними базами данных. В случае цифровой математической библиотеки к перечисленным инструментам добавляется ряд специализированных. Например, это преобразование в формат MathML, разметка математических формул и организация поиска по ним [49-52].

Укажем основные задачи, которые должны быть решены в рамках фабрики метаданных цифровой библиотеки.

При работе с цифровыми библиотеками одной из важных задач является автоматизированная интеграция репозиториев соответствующих документов с другими информационными системами. Такой процесс основан на модели агрегирования и распространений метаданных. Модель OAI Protocol for Metadata Harvesting

(http://www.openarchives.org/OAI/openarchivesprotocol.ht ml, далее OAI-PMH) поддерживается большинством систем, предназначенных для хранения информационных ресурсов. Для организации работы с OAI-PMH необходимо использовать систему поддержки цифровых хранилищ. Наиболее известными из них являются DSpace, Eprints, Fedora и Greenstone. Некоторые библиотеки имеют специализированные методы харвестинга метаданных из других хранилищ. В этом случае необходимо, чтобы у поставщиков данных были инструменты и сервисы, которые позволяют распространять метаданные.

Для организации взаимодействия сервисов как в рамках цифровой библиотеки, так и с внешними библиотеками и базами данных, необходимо учитывать те форматы метаданных, которые используются в них. Даже в одной цифровой библиотеке программные инструменты работают с несколькими форматами метаданных. Это связано как с особенностями формирования цифрового контента, так и с требованиями агрегирующих цифровых библиотек и наукометрических баз данных. Отметим лишь наиболее распространенные форматы метаданных, с которыми приходится иметь дело при организации взаимодействия сервисов в цифровых библиотеках (полные их описания доступны в интернете).

Прежде всего, это формат Dublin Core и его расширения, формат каталогизации MARC, форматы библиографических ссылок RIS (Research Information Systems), AMSBib, XML-формат РИНЦ.

Отдельно отметим XML-схемы Journal Archiving and Interchange Tag Suite (NISO JATS), которые разработаны для метаописания статей научных журналов [53, 54]. Значение этих схем для цифровых математических библиотек обусловлено тем фактом, что схемы обязательного и фундаментального наборов метаданных The European Digital Mathematics Library (EuDML) [55] основаны на схеме NISO JATS v. 1.0.

Многие из задач, указанных выше, решены нами при построении фабрики метаданных цифровой математической библиотеки Lobachevskii-DML (https://lobachevskii-dml.ru/). Как и в случае любой цифровой научной библиотеки, формирование

библиотеки Lobachevskii-DML и соответствующей фабрики метаданных потребовало привлечения технологических решений управления научным контентом, как созданных ранее, так и новых, разработанных нами.

Формирование метаданных цифровых

математических коллекций в фабрике метаданных цифровой библиотеки Lobachevskii-DML проводится в несколько этапов.

На этапе препроцессорной обработки коллекция документов обрабатывается программными

инструментами с целью приведения к виду, пригодному для дальнейшей автоматической обработки [48]. Для этого производится кластеризация документов по стилевому сходству, а затем выполняется приведение к шаблонному виду стилевых конструкций, используемых в документе. Например, .tex-коллекции могут содержать документы, в которых для оформления названия статьи используются не только команда \title{}, но и \tit{}, \ArticleNAME{} и другие. Списки авторов, ключевые слова, коды предметных классификаторов и другая информация, необходимая для формирования набора метаданных, записываются с помощью tex-команд, которые существенно отличаются в стилевых файлах различных журналов.

Более того, название статьи, список авторов, ключевые слова и другие блоки, необходимые для включения в состав метаданных, могут и не оформляться командами. В этом случае они просто отличаются шрифтовым выделением, например, {\bf Paper Title}. В этих случаях производится попытка автоматически найти такие блоки по местоположению в тексте и шрифтовому оформлению. Такой подход применяется и к большинству коллекций документов, созданных в офисных форматах [56]. В работах [57-59] приведены алгоритмы выделения метаданных из научных статей. Эти алгоритмы основаны на исследовании структуры документов и онтологий описания структуры документов.

Следующим этапом является формирование набора основных метаданных. Из документов извлекаются строки с названием статьи и списком авторов. Далее производятся поиск и выделение из текста кодов предметной классификации, блока ключевых слов, аффилиации авторов и аннотации к статье, если они приведены в документе. Также в состав метаданных каждого документа включается его URL-ссылка в коллекции цифровой библиотеки. Сформированные метаданные сохраняются в xml-файле в соответствии с DTD-правилами и XML-схемами, которые установлены в цифровой библиотеке.

На этапе улучшения и уточнения метаданных используются программные инструменты, с помощью которых исправляются простые орфографические ошибки и опечатки в названии статьи, списке авторов и ключевых словах. Производится улучшение метаданных, в частности, транслитерирование названий статей, дополнение сокращений полными наименованиями («SPb» - «Saint Petersburg», «LJM» -

«Lobachevskii J. Math.», «Lobachevskii Journal of Mathematics»).

URL-ссылки проверяются с помощью имеющихся сервисов уточнения. Далее в состав метаданных включается дата обращения к веб-ресурсу. Формульные фрагменты в названиях статей и аннотациях к ним преобразуются в MathML-код.

Не все метаданные можно получить поиском соответствующих блоков в документе и последующим экстрагированием из текста. Ключевые слова, коды классификаторов и другие данные определяются только как результат текстового и семантического анализа документа [51, 57]. В фабрике метаданных эти операции выполняются на этапе формирования дополнительных метаданных. В рамках проекта создания цифровой математической библиотеки нами разработаны инструменты, позволяющие автоматизировать ряд операций этого этапа.

Одной из функций фабрики метаданных является нормализация метаданных в соответствии с форматами других агрегирующих библиотек. Так, например, протокол OAI-PMH требует включения в описание ресурса набора метаданных в нотации oai_dc, которая основана на Dublin Core. Мы используем термин нормализация [48] для обозначения методов формирования и преобразования метаданных документов в соответствии с правилами и XML-схемами цифровых библиотек и наукометрических баз данных

В фабрике метаданных цифровой математической библиотеки Lobachevskii-DML разработан метод нормализации метаданных в формат РИНЦ [60]. Этот метод реализован в виде плагина журнальной платформы Open Journal System и используется для формирования метаданных цифрового журнала "Russian Digital Libraries Journal" (https://elbib.ru/). Также созданы методы нормализации метаданных коллекции статей этого журнала в форматы библиографической базы по компьютерным наукам "dblp computer science bibliography" (DBLP, https://dblp.uni-trier.de/) [61]. Созданы методы формирования обязательного и фундаментального наборов метаданных по XML-схемам Европейской математической библиотеки EuDML (https://initiative.eudml.org/) [48, 61].

Инструменты фабрики метаданных библиотеки Lobachevskii-DML, уже реализованные нами, подробно описаны в [48].

Итак, в результате разработки фабрики метаданных цифровой научной библиотеки Lobachevskii-DML:

• предложена система сервисов автоматизированного формирования метаданных электронных математических коллекций;

• разработан xml-язык представления метаданных, основанный на Journal Archiving and Interchange Tag Suite (NISO JATS);

• созданы программные инструменты нормализации метаданных электронных коллекций научных документов в форматах, разработанных международными организациями - агрегаторами ресурсов по математике и Computer Science;

• разработан алгоритм приведения метаданных к формату оа^с и генерации структуры архивов для импорта в цифровое хранилище DSpace;

• предложены и реализованы методы интеграции электронных математических коллекций Казанского университета в отечественные и зарубежные цифровые математические библиотеки.

Модель фабрики метаданных, представленная выше, реализована в конкретной цифровой математической библиотеке. Естественно, эта модель учитывает специфику обрабатываемого контента. Вместе с тем, она может быть использована как элемент экосистемы любой научной цифровой библиотеки.

V. Цифровые технологии и управление

МАТЕМАТИЧЕСКИМИ ЗНАНИЯМИ Сегодня, благодаря широкому внедрению цифровых технологий в исследования и разработки, при проведении новых исследований стало возможным использовать всю совокупность накопленных научных знаний. Такое использование предполагает создание комплекса технологий, обеспечивающих оптимальное управление существующими знаниями, организацию эффективного доступа к ним, а также совместное и многократное использование новых типов структур знаний. Все перечисленное должно быть реализовано на базе цифровых платформ.

Наибольший эффект от внедрения цифровых технологий для дальнейшей организации научных знаний и улучшения их понимания ожидается в области математики, где, как отмечено выше, уже создано значительное количество цифровых библиотек и имеется ряд цифровых платформ. Эти ожидания полностью подтверждаются идеей создания Всемирной цифровой математической библиотеки (WDML). Основная цель WDML - объединить оцифрованные версии всего массива научных математических документов в распределенную систему взаимосвязанных репозиториев, включая как современные источники, так и те, которые уже стали историческими.

Термин WDML был введен в 2006 г. на Генеральной ассамблее Международного математического союза (см. [62-64]), где было одобрено положение о создании Цифровой математической библиотеки (DML). В 2012 году на симпозиуме «Будущая цифровая математическая библиотека всемирного наследия» в Американской национальной академии наук (см. http://ada00.math.uni-bielefeld.de/mediawiki-1.18.1/index.php/Main_Page; http://ada00.math.uni-

bielefeld.de/mediawiki-1.18.1/index.php/Final_report_draft) и в 2014 году в рамках Международного математического конгресса (Сеул, Южная Корея) [65, 66], проводились встречи экспертных групп из участников со всего мира, на которых обсуждались практические планы действий по созданию Глобальной цифровой математической библиотеки (GDML). В 2014 г. также был подготовлен отчет «Развитие глобальной библиотеки математических исследований 21 века» [67],

в котором сформулированы основные задачи построения WDML. Таким образом, основные задачи построения WDML и технологии, необходимые для их решения, обсуждались в 2014-2015 годах широким кругом математиков. Они закреплены в ряде документов, принятых Всемирным математическим союзом. В частности, было одобрено, что следующим шагом в продвижении математики будет выход за рамки традиционных математических публикаций и создание сети информации, основанной на знаниях, содержащихся в этих публикациях. Благодаря сочетанию методов машинного обучения и усилий редакций и редакционных советов математических научных журналов большая часть информации и знаний (в виде связанных открытых данных) в глобальном массиве математических знаний станет доступной для исследователей через WDML.

В целом разработчики проекта WDML считают, что следующим шагом в развитии и продвижении математики будет выход за рамки традиционных математических публикаций и создание сети, основанной на знаниях, содержащейся в этих публикациях. В то же время ученые все чаще нуждаются в новых способах открытия объектов научного знания непосредственно через интернет, а также в инструментах и сервисах, обеспечивающих создание и совместное использование новых типов структур знаний. В контексте концепции связанных данных и семантической сети такие инструменты и службы могут использоваться для создания «графиков сотрудничества», которые полезны, например, для расчета «расстояния сотрудничества» между авторами и выделения «похожих» документов. Это открывает новые возможности для тонкой настройки поиска и просмотра (см., например, [68]). Многие авторы (например, [69-71]) подчеркивают важность разработки новых онтологий предметных областей, в частности, математики, поскольку традиционной

библиографической каталогизации сегодня уже недостаточно; требуется более подробная проработка, содержащая описания, созданные с разных точек зрения.

Проведенное нами исследование, результаты которого представлены выше, соответствует идеологии проекта WDML и поможет, по нашему мнению, продвинуться в решении проблем, поставленных в рамках этого проекта.

VI. Заключение

В настоящей работе обсуждены направления развития и использования цифровых технологий в научной деятельности на базе цифровых платформ, значение и роль цифровых библиотек в формировании таких платформ. Введено понятие фабрики метаданных как системы взаимосвязанных программных инструментов, направленных на создание, обработку, хранение и управление метаданными объектов цифровых библиотек и позволяющих интегрировать создаваемые электронные коллекции в агрегирующие цифровые научные библиотеки. Решен ряд задач, связанных с построением фабрики метаданных цифровой

математической библиотеки Lobachevskii-DML. Предложено использовать эту реализованную фабрику метаданных как элемент экосистемы любой научной цифровой платформы.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Благодарности

Работа поддержана Российским фондом фундаментальных исследований (РФФИ) в рамках проекта № 18-29-03086, РФФИ и Правительством Республики Татарстан в рамках проекта № 18-47-160012 и программой развития Регионального научно-образовательного математического центра

Приволжского федерального округа, договор № 075-022020-1478/1.

Библиография

[1] Т. В. Ершова, Концептуализация предметной области «цифровая экономика» как основа развития ее понятийного аппарата. Информационное общество. 2019. Вып. 6. С. 3441.

[2] Р. С. Evans, А. Gawer, The Rise of the Platform Enterprise: A Global Survey. The Center for Global Enterprise, 2016. The Emerging Platform Economy Series No. 1. 2016. 29 p.

[3] G. G. Parker, M. W. van Alstyne, S. P. Choudary, Platform Revolution: How Networked Markets Are Transforming the Economy - and How to Make Them Work for You. W.W. Norton & Company, 2016 (Джеффри Паркер, Маршалл ван Альстайн, Сангит Пол Чаудари. Революция платформ. Как сетевые рынки меняют экономику - и как заставить их работать на вас. Манн, Иванов и Фербер, 2017. 304 с.

[4] White Paper. Digital Platforms. Digital regulatory policy for growth, innovation, competition and participation of the Economic Affairs Ministry. Berlin: Federal Ministry for Economic Affairs and Energy, 2017. 116 p. URL: https://www.de.digital/DIGITAL/Redaktion/EN/Publikation/whit e-paper.html

[5] Т. В. Ершова, Ю. Е. Хохлов, Цифровые платформы для исследований и разработок. Информационное общество. 2017. Вып. 6. С. 17-24.

[6] Я. Ю. Еферин, К. М. Россото, Ю. Е. Хохлов, Цифровые платформы в России: конкуренция между национальными и зарубежными многосторонними платформами стимулирует экономический рост и инновации. Информационное общество. 2019. Вып. 1-2. С. 16-34.

[7] Программа «Цифровая экономика Российской Федерации». Утверждена распоряжением Правительства РФ от 28 июля 2017 г. № 1632. URL: http://government.ru/docs/28653/

[8] В. Армс Электронные библиотеки. М.: ПИК ВИНИТИ, 2001. 274 с. Пер. с англ. изд. W.Y. Arms. Digital libraries. Cambridge; London, 2000.

[9] А. Б. Антопольский, Т. В. Майстрович, Электронные библиотеки: принципы создания. М.: Либерия-Бибинформ, 2007. 288 с.

[10] I. Xie, K. K. Matusiak, Discover Digital Libraries: Theory and Practice. Elsevier Inc. 2016.

[11] A. Jackson, The Digital Mathematics Library. Notices Amer. Math. Soc. 2003. V. 50. P. 918-923.

[12] T. Bouche, Introducing the mini-DML project. ECM4 Satellite Conference EMANI/DML. 2004. P. 19-29.

[13] J. M. Borwein, E. M. Rocha, J. F. Rodrigues (eds.), Communicating Mathematics in the Digital Era. Taylor & Francis, 2008. 325 p.

[14] T. Bouche, Some Thoughts on the Near-Future Digital Mathematics Library. Towards a Digital Mathematics Library. Masaryk University, 2008. P. 3-15. URL: https://eudml.org/doc/221606.

[15] T. Bouche, Digital Mathematics Libraries: The Good, the Bad, the Ugly. Math. Comput. Sci. 2010. V. 3. P. 227-241. URL: https://doi.org/10.1007/s11786-010-0029-2.

[16] T. Bouche, The Digital Mathematics Library as of 2014. Notices Amer. Math. Soc. 2014. V. 61. No. 9. P. 1085-1088.

[17] A. M. Elizarov, E. K. Lipachev, D. S. Zuev, Digital mathematical libraries: Overview of implementations and content management services. CEUR Workshop Proceedings. 2017. V. 2022. P. 317325.

[18] А. Б. Жижченко, А. Д. Изаак, Информационная система Math-Net.Ru. Применение современных технологий в научной работе математика. Успехи математических наук. 2007. Т. 62, №5 (377). C. 107-132. URL: https://doi.org/10.4213/rm8147. URL: http://www.mathnet.ru/links/ c59aff2f134382372f88aa415a76755f/rm8147.pdf.

[19] А. Б. Жижченко, А. Д. Изаак, Информационная система Math-Net.Ru. Современное состояние и перспективы развития. Импакт-факторы российских математических журналов // Успехи математических наук. 2009. Т. 64, №4 (388). С. 195-204. URL: https://doi.org/10.4213/rm9312; http://www.mathnet.ru/links/ e27ab619eaefe03fe79d663468ddd3a0/rm9312.pdf.

[20] D. E. Chebukov, A. D. Izaak, O. G. Misyurina, Yu. A. Pupyrev, A. B. Zhizhchenko. Math-Net.Ru as a Digital Archive of the Russian Mathematical Knowledge from the XIX Century to Today. Intelligent Computer Mathematics. Lecture Notes in Computer Science. 2013. V. 7961. P. 344-348. URL: https://doi.org/ 10.1007/978-3-642-39320-4_26.

[21] M. Bartosek, P. Kovár, M. Sárfy, DML-CZ Metadata Editor. In: Sojka P. (ed.) Towards Digital Mathematics Library. Masaryk University, 2010. P. 139-151. URL: https://dml.cz/bitstream/handle/10338.dmlcz/702537/DML_001-2008-1_17.pdf.

[22] M. Bartosek, J. Rákosník, DML-CZ: The Experience of a Medium-Sized Digital Mathematics Library. Notices of the AMS. 2013. V. 60. No 8. P. 1028-1033. URL: http://dx.doi.org/10.1090/noti1031.

[23] T. Bouche, Toward a digital mathematics library? In: Borwein J.M., Rocha E.M., Rodrigues J.F. (Eds) Communicating Mathematics in the Digital Era. Taylor & Francis, 2008. P. 4773. URL: https://hal.archives-ouvertes.fr/hal-00347682.

[24] C. Lange, Ontologies and Languages for Representing Mathematical Knowledge on the Semantic Web // Semantic Web. 2013. V. 4. No. 2. P. 119-158. URL: https://content.iospress.com/articles/semantic-web/sw059.

[25] Vladimir Serebryakov, Semantic digital libraries. What is it? CEUR Workshop Proceedings. 2014. V. 1297. P. 1-5. URL: http://ceur-ws.org/Vol-1297/1-5_paper-1.pdf.

[26] A. M. Elizarov, A. V. Kirillovich, E. K. Lipachev, O. A. Nevzorova, Mathematical knowledge management: ontological models and digital technology. Analitika i upravlenie danny'mi v oblastyax s intensivny'm ispol'zovaniem danny'x: sbornik statej XVIII Mezhdun. konf. DAMDID/RCDL'2016. M.: FICz IU RAN, 2016. S. 95-101.

[27] A. M. Elizarov, A. V. Kirillovich, E. K. Lipachev, O. A. Nevzorova, Mathematical Knowledge Management: Ontological Models and Digital Technology // CEUR Workshop Proceedings. 2016. V. 1752. P. 44-50. URL: http://ceur-ws.org/Vol-1752/ paper08.pdf

[28] T. Bouche, O. Labbe, The New Numdam Platform. In: Geuvers H., England M., Hasan O., Rabe F., Teschke O. (Eds) Intelligent Computer Mathematics. CICM 2017. Lecture Notes in Computer Science. Vol. 10383. Springer, Cham, 2017. P. 70-82. URL: https://doi.org/10.1007/978-3-319-62075-6_6. https://zenodo.org/ record/581405/.

[29] A. Sadegh., C. Lange, M. E. Vidal, S. Auer, Integration of Scholarly Communication Metadata using Knowledge Graphs. International Conference on Theory and Practice of Digital Libraries. 2017. P. 328-341.

[30] O. M. Ataeva, V. A. Serebryakov, Information Model of LibMeta Digital Library. Lobachevskii J. of Mathematics. 2019. V. 40. No 7. P. 861-875. URL: https://doi.org/10.1134/S1995080219070035.

[31] А. А. Бездушный, А. Н. Бездушный, А. К. Нестеренко, В. А. Серебряков, Т. М. Сысоев, Возможности технологий ИСИР в поддержке Единого Научного Информационного Пространства РАН. Электронные библиотеки: перспективные методы и технологии, электронные коллекции - RCDL-2004: Труды VI Всероссийской научной конференции. М., 2004. С. 254-262.

[32] А. А. Бездушный, А. Н. Бездушный, А. К. Нестеренко, В. А. Серебряков., Т. М. Сысоев, Предложения по наборам метаданных для научных информационных ресурсов ЕНИП

РАН. Электронные библиотеки. 2004. Т. 7, №5. URL: https://elbib.ru/article/view/256

[33] А. А. Бездушный, А. Н. Бездушный, А. Б. Жижченко, Н. Е. Калёнов, М. В. Кулагин, В. А. Серебряков, Предложения по наборам метаданных для научных информационных ресурсов ЕНИП РАН. Электронные библиотеки: перспективные методы и технологии, электронные коллекции - RCDL-2004: Труды VI всероссийской научной конференции. М., 2004. С. 277-284.

[34] А. А. Бездушный, А. Н. Бездушный, В. А. Серебряков, Схемы метаданных ЕНИП: практика применения OWL в ЕНИП. Информационное обеспечение науки: новые технологии (под ред. Н.Е. Калёнова). М., 2005. С. 155-182.

[35] А. А. Бездушный, А. Н. Бездушный, В. А. Серебряков, В. И. Филиппов, Интеграция метаданных Единого Научного Информационного Пространства РАН. М.: Вычислительный центр им. A.A. Дородницына РАН, 2006. 238 с.

[36] А. А. Бездушный, Схемы метаданных для научных информационных ресурсов ЕНИП РАН. Порядковый анализ и смежные вопросы математического моделирования: Труды IV международной научной конференции. Институт прикладной математики и информатики. Владикавказ, 2006. С. 260-271.

[37] А. А. Бездушный, А. Н. Бездушный, В. А. Серебряков, В. И. Филиппов, Интеграция метаданных Единого Научного Информационного Пространства РАН. Вычислительный центр РАН. Москва, 2006. 238 с.

[38] А. А. Бездушный, А. Н. Бездушный, А. К. Нестеренко, В. А. Серебряков., Т. М. Сысоев, К. Б. Теймуразов, В. И. Филиппов, Информационная Web-система «Научный институт» на платформе ЕНИП. М.: Вычислительный Центр им. А.А. Дородницына РАН, 2007. 248 с.

[39] А. Н. Бездушный, В. А. Серебряков, Единое научное информационное пространство (ЕНИП) РАН. Новые технологии в информационно-библиотечном обеспечении научных исследований. Сборник научных трудов. Екатеринбург, 2010. С. 6-17.

[40] М. В. Кулагин, В. А. Серебряков, Информационное пространство РАН (Проекты и реализация, 1998-2013). Научный сервис в сети Интернет: труды XVIII Всероссийской научной конференции (19-24 сентября 2016 г., г. Новороссийск). М.: ИПМ им. М.В. Келдыша, 2016. С. 194-222. doi:10.20948/abrau-2016-40

[41] А. Н. Бездушный, А. Б. Жижченко, М. В. Кулагин, В. А. Серебряков, Интегрированная система информационных ресурсов РАН и технология разработки цифровых библиотек. Программирование. 2000. Т. 26, № 4. С. 177-185.

[42] A. A. Bezdushny, A. N. Bezdushny, A. K. Nesterenko, V. A. Serebriakov, Т. М. Sysoev, Integrated System of Information Resources of the Russian Academy of Sciences. Proceedings of the 8th World Multi-Conference on Systemics, Cybernetics and Informatics SCI-2004, Orlando, Florida. 2004. P. 462-467.

[43] А. Б. Антопольский, Н. Е. Каленов, В. А. Серебряков, А. Н. Сотников, О едином цифровом пространстве научных знаний. Вестник Российской академии наук. 2019. Т. 89, №7. С. 728-735.

[44] M.-A. Sicilia, (Ed.): Handbook of Metadata, Semantics and Ontologies. World Scientific Publishing Co. Pte. Ltd., 2014.

[45] G. Alemu, B. Stevens, An Emergent Theory of Digital Library Metadata. Enrich then Filter. Chandos Publishing is an imprint of Elsevier, 2015.

[46] R. Gartner, Metadata. Shaping Knowledge from Antiquity to the Semantic Web. Springer International Publishing Switzerland, 2016.

[47] M. R. Kogalovsky, Metadata in Computer Systems. Programming and Computer Software. 2013, V. 39, No 4. P. 182-193.

[48] P. O. Gafurova, A. M. Elizarov, E. K. Lipachev, Basic Services of Factory Metadata Digital Mathematical Library Lobachevskii-dml. Russian Digital Libraries Journal. 2020, No. 3. P. 336-381.

[49] T. Bouche, O. Labbe, The New Numdam Platform. CICM 2017: Intelligent Computer Mathematics, P. 70-82.

[50] A. Elizarov, A. Kirillovich, E. Lipachev, O. Nevzorova, Digital Ecosystem OntoMath: Mathematical Knowledge Analytics and Management. Communications in Computer and Information Science, Springer. 2017. V. 706. P. 33-46. doi:10.1007/978-3-319-57135-5 3.

[51] A. M. Elizarov, E. K. Lipachev, Lobachevskii DML: Towards a Semantic Digital Mathematical Library of Kazan University. CEUR Workshop Proceedings. 2017. V. 2022. P. 326-333.

[52] A. M. Elizarov, E. K. Lipachev, Semantic Formula Search in Digital Mathematical Libraries. Proceedings of the 2nd Russia and Pacific Conference on Computer Technology and Applications (RPC 2017). IEEE. P. 39-43. URL: https://doi.org/10.1109/RPC.2017.8168063.

[53] Journal Publishing Tag Library NISO JATS, version 1.3d1 (ANSI/NISO Z39.96-2019). October 2019. URL: https://j ats.nlm.nih. gov/archiving/ 1.3d1/

[54] M. Jost, T. Bouche, C. Goutorbe, J. P. Jorda, D3.2: The EuDML metadata schema. Revision: 1.6 as of 15th December 2010, http://www.mathdoc.fr/publis/d3.2-v1.6.pdf

[55] EuDML metadata schema specification (v2.0-final). URL: https://initiative.eudml.org/eudml-metadata-schema-specification-v20-final

[56] Standard ECMA-376: Office Open XML File Formats, URL: https://www.ecma-international.org/publications/standards/Ecma-376.htm

[57] A. M. Elizarov, E. K. Lipachev, S. M. Khaydarov, Automated System of Services for Processing of Large Collections of Scientific Documents. CEUR Workshop Proceedings. 2016. V. 1752. P. 58-64.

[58] A. M. Elizarov, Sh. M. Khaydarov E. K. Lipachev, Scientific Documents Ontologies for Semantic Representation of Digital Libraries. Proceedings of the 2nd Russia and Pacific Conference on Computer Technology and Applications (RPC 2017). IEEE, 1-5. URL: https://doi.org/10.1109/RPC.2017.8168064.

[59] D. Tkaczyk, B. Tarnawski, L. Bolikowski, Structured Affiliations Extraction from Scientific Literature. D-Lib Magazine. 2015. V. 21, No. 11/12. URL: https://doi.org/10.1045/november2015-tkaczyk.

[60] A. N. Gerasimov, A. M. Elizarov, E. K. Lipachev, Subsystem of Formation Metadata for Science Index Databases on Management Platform Electronic Scientific Journals. Russian Digital Libraries Journal. 2015. V. 18, No. 1-2. P. 6-31.

[61] P. O. Gafurova, A. M. Elizarov, E. K. Lipachev, D. M. Khammatova, Metadata Normalization Methods in the Digital Mathematical Library. CEUR Workshop Proceedings/ 2020. V. 2543. P. 136-148.

[62] The Digital Mathematical Library Project. Status August 2005. URL: http://www.math.uiuc.edu/~tondeur/DML04.pdf

[63] Digital Mathematics Library: a Vision for the Future. International Mathematical Union, 2006. URL: http://www.mathunion.org/fileadmin/IMU/Report/dml_vision. pdf

[64] P. Tondeur, WDML: The World Digital Mathematics Library. The Evolution of Mathematical Communication in the Age of Digital Libraries. IMA Workshop, December 8-9, 2006. URL: http://www.math.uiuc.edu/~tondeur/WDML_IMA_DEC2006. pdf

[65] P. J. Olver, The World Digital Mathematics Library: Report of a Panel Discussion. Proceedings of the International Congress of Mathematicians, August 13-21, 2014, Seoul, Korea. Kyung Moon SA. 2014. V. 1. P. 773-785.

[66] J. Pitman, C. Lynch, Planning a 21st Century Global Library for Mathematics Research. Notices of the AMS. 2014. V. 61, No. 7. P. 776-777. URL: http://www.ams.org/ notices/201407/rnoti-p776.pdf.

[67] Developing a 21st century global library for mathematics research. Washington, D.C.: The National Academies Press, 2014. 131 p. arxiv.org/pdf/1404.1905; URL: http://www.nap.edu/ catalog/18619/developing-a-21 st-century-global-library-for-mathematics-research.

[68] R. Todeschini, A. Baccini, Handbook of Bibliometric Indicators: Quantitative Tools for Studying and Evaluating Research. Wiley-VCH Verlag, 2016.

[69] S. Staab, R. Studer (eds.), Handbook on Ontologies. Springer Verlag Berlin, Heidelberg, 2003, 2009.

[70] C. Lange, Ontologies and Languages for Representing Mathematical Knowledge on the Semantic Web. Semantic Web Journal. 2013. V. 4, No. 2. P. 119-158. URL: http://www. semantic-web-journal.net/content/ontologies-and-languages-representing-mathematical-knowledge-semantic-web.

[71] A. Elizarov, A. Kirillovich, E. Lipachev, O. Nevzorova, V. Solovyev, N. Zhiltsov, Mathematical Knowledge Representation: Semantic Models and Formalisms. Lobachevskii J. of

Mathematics, 2014. V. 35, No. 4. P. 347-353. URL: https://doi.org/ 10.1134/S1995080214040143.

Digital platforms and digital science libraries

A. M. Elizarov, E. K. Lipachev

Abstract — The directions of the development and use of digital technologies in scientific activities based on digital platforms, the significance and role of digital libraries in the formation of such platforms, as well as the problems of ensuring the integration (connectivity) of the extracted information are discussed. Approaches to the creation of scientific information spaces as subspaces of a single information space are considered. The concept of a metadata factory is introduced as a system of interconnected software tools aimed at creating, processing, storing and managing metadata of digital library objects and allowing to integrate the created digital collections into aggregating digital scientific libraries. A number of tasks related to the construction of a metadata factory for the Lobachevskii-DML digital mathematical library have been solved. It is proposed to use this implemented metadata factory as an element of the ecosystem of any scientific digital platform.

Keywords — scientific digital platform, digital platform ecosystem, digital science library, scientific information space, digital math library, metadata, metadata generation, metadata extraction, metadata normalization, metadata factory, Lobachevskii-DML digital math library.

REFERENCES

[1] T. V. Ershova, Konceptualizaciya predmetnoj oblasti «cifrovaya ekonomika» kak osnova razvitiya ee ponyatijnogo apparata. Informacionnoe obshchestvo. 2019. Vyp. 6. S. 34-41.

[2] R. S. Evans, A. Gawer, The Rise of the Platform Enterprise: A Global Survey. The Center for Global Enterprise, 2016. The Emerging Platform Economy Series No. 1. 2016. 29 p.

[3] G. G. Parker, M. W. van Alstyne, S. P. Choudary, Platform Revolution: How Networked Markets Are Transforming the Economy - and How to Make Them Work for You. W.W. Norton & Company, 2016

[4] White Paper. Digital Platforms. Digital regulatory policy for growth, innovation, competition and participation of the Economic Affairs Ministry. Berlin: Federal Ministry for Economic Affairs and Energy, 2017. 116 p. URL: https://www.de.digital/DIGITAL/Redaktion/EN/Publikation/white-paper.html

[5] T. V. Ershova, Yu. E. Hohlov, Cifrovye platformy dlya issledovanij i razrabotok. Informacionnoe obshchestvo. 2017. Vyp. 6. S. 17 -24.

[6] Ya. Yu. Eferin, K. M. Rossoto, Yu. E. Hohlov, Cifrovye platformy v Rossii: konkurenciya mezhdu nacional'nymi i zarubezhnymi mnogostoronnimi platformami stimuliruet ekonomicheskij rost i innovacii. Informacionnoe obshchestvo. 2019. Vyp. 1-2. S. 16-34.

[7] Programma «Cifrovaya ekonomika Rossijskoj Federacii». Utverzhdena rasporyazheniem Pravitel'stva RF ot 28 iyulya 2017 g. № 1632. URL: http://government.ru/docs/28653/

[8] W. Y. Arms. Digital libraries. Cambridge; London, 2000.

[9] A. B. Antopol'skij, T. V. Majstrovich, Elektronnye biblioteki: principy sozdaniya. M.: Liberiya-Bibinform, 2007. 288 s.

[10] I. Xie, K. K. Matusiak, Discover Digital Libraries: Theory and Practice. Elsevier Inc. 2016.

[11] A. Jackson, The Digital Mathematics Library. Notices Amer. Math. Soc. 2003. V. 50. P. 918-923.

[12] T. Bouche, Introducing the mini-DML project. ECM4 Satellite Conference EMANI/DML. 2004. P. 19-29.

[13] J. M. Borwein, E. M. Rocha, J. F. Rodrigues (eds.), Communicating Mathematics in the Digital Era. Taylor & Francis, 2008. 325 p.

[14] T. Bouche, Some Thoughts on the Near-Future Digital Mathematics Library. Towards a Digital Mathematics Library. Masaryk University, 2008. P. 3-15. URL: https://eudml.org/doc/221606.

[15] T. Bouche, Digital Mathematics Libraries: The Good, the Bad, the Ugly. Math. Comput. Sci. 2010. V. 3. P. 227-241. URL: https://doi.org/10.1007/s11786-010-0029-2.

[16] T. Bouche, The Digital Mathematics Library as of 2014. Notices Amer. Math. Soc. 2014. V. 61. No. 9. P. 1085-1088.

[17] A. M. Elizarov, E. K. Lipachev, D. S. Zuev, Digital mathematical libraries: Overview of implementations and content management services. CEUR Workshop Proceedings. 2017. V. 2022. P. 317-325.

[18] A. B. ZHizhchenko, A. D. Izaak, Informacionnaya sistema Math-Net.Ru. Primenenie sovremennyh tekhnologij v nauchnoj rabote matematika. Uspekhi matematicheskih nauk. 2007. T. 62, №5 (377). C. 107-132. URL: https://doi.org/10.4213/rm8147. URL: http://www.mathnet.ru/links/ c59aff2f134382372f88aa415a76755f/rm8147.pdf.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[19] A. B. ZHizhchenko, A. D. Izaak, Informacionnaya sistema Math-Net.Ru. Sovremennoe sostoyanie i perspektivy razvitiya. Impakt-faktory rossijskih matematicheskih zhurnalov // Uspekhi matematicheskih nauk. 2009. T. 64, №4 (388). S. 195-204. URL: https://doi.org/10.4213/rm9312; http://www.mathnet.ru/links/ e27ab619eaefe03fe79d663468ddd3a0Zrm9312.pdf.

[20] D. E. Chebukov, A. D. Izaak, O. G. Misyurina, Yu. A. Pupyrev, A. B. Zhizhchenko. Math-Net.Ru as a Digital Archive of the Russian Mathematical Knowledge from the XIX Century to Today. Intelligent Computer Mathematics. Lecture Notes in Computer Science. 2013. V. 7961. P. 344-348. URL: https://doi.org/ 10.1007/978-3-642-39320-4_26.

[21] M. Bartosek, P. Kovar, M. Sarfy, DML-CZ Metadata Editor. In: Sojka P. (ed.) Towards Digital Mathematics Library. Masaryk University, 2010. P. 139-151. URL: https://dml.cz/bitstream/handle/10338.dmlcz/702537/DML_001-2008-1_17.pdf.

[22] M. Bartosek, J. Rakosnik, DML-CZ: The Experience of a Medium-Sized Digital Mathematics Library. Notices of the AMS. 2013. V. 60. No 8. P. 1028-1033. URL: http://dx.doi.org/10.1090/noti1031.

[23] T. Bouche, Toward a digital mathematics library? In: Borwein J.M., Rocha E.M., Rodrigues J.F. (Eds) Communicating Mathematics in the Digital Era. Taylor & Francis, 2008. P. 47-73. URL: https://hal.archives-ouvertes.fr/hal-00347682.

[24] C. Lange, Ontologies and Languages for Representing Mathematical Knowledge on the Semantic Web // Semantic Web. 2013. V. 4. No. 2. P. 119-158. URL: https://content.iospress.com/articles/semantic-web/sw059.

[25] Vladimir Serebryakov, Semantic digital libraries. What is it? CEUR Workshop Proceedings. 2014. V. 1297. P. 1-5. URL: http://ceur-ws.org/Vol-1297/1-5_paper-1.pdf.

[26] A. M. Elizarov, A. V. Kirillovich, E. K. Lipachev, O. A. Nevzorova, Mathematical knowledge management: ontological models and digital technology. Analitika i upravlenie danny'mi v oblastyax s intensivny'm ispol'zovaniem danny'x: sbornik statej XVIII Mezhdun. konf. DAMDID/RCDL'2016. M.: FICz IU RAN, 2016. S. 95-101.

[27] A. M. Elizarov, A. V. Kirillovich, E. K. Lipachev, O. A. Nevzorova, Mathematical Knowledge Management: Ontological Models and Digital Technology // CEUR Workshop Proceedings. 2016. V. 1752. P. 44-50. URL: http://ceur-ws.org/Vol-1752/ paper08.pdf

[28] T. Bouche, O. Labbe, The New Numdam Platform. In: Geuvers H., England M., Hasan O., Rabe F., Teschke O. (Eds) Intelligent Computer Mathematics. CICM 2017. Lecture Notes in Computer Science. Vol. 10383. Springer, Cham, 2017. P. 70-82. URL: https://doi.org/10.1007/978-3-319-62075-6_6. https://zenodo.org/ record/581405/.

[29] A. Sadegh., C. Lange, M. E. Vidal, S. Auer, Integration of Scholarly Communication Metadata using Knowledge Graphs. International Conference on Theory and Practice of Digital Libraries. 2017. P. 328341.

[30] O. M. Ataeva, V. A. Serebryakov, Information Model of LibMeta Digital Library. Lobachevskii J. of Mathematics. 2019. V. 40. No 7. P. 861-875. URL: https://doi.org/10.1134/S1995080219070035.

[31] A. A. Bezdushnyj, A. N. Bezdushnyj, A. K. Nesterenko, V. A. Serebryakov, T. M. Sysoev, Vozmozhnosti tekhnologij ISIR v podderzhke Edinogo Nauchnogo Informacionnogo Prostranstva RAN. Elektronnye biblioteki: perspektivnye metody i tekhnologii, elektronnye kollekcii - RCDL-2004: Trudy VI Vserossijskoj nauchnoj konferencii. M., 2004. S. 254-262.

[32] A. A. Bezdushnyj, A. N. Bezdushnyj, A. K. Nesterenko, V. A. Serebryakov., T. M. Sysoev, Predlozheniya po naboram metadannyh

dlya nauchnyh informacionnyh resursov ENIP RAN. Elektronnye biblioteki. 2004. T. 7, №5. URL: https://elbib.ru/article/view/256

[33] A. A. Bezdushnyj, A. N. Bezdushnyj, A. B. ZHizhchenko, N. E. Kalyonov, M. V. Kulagin, V. A. Serebryakov, Predlozheniya po naboram metadannyh dlya nauchnyh informacionnyh resursov ENIP RAN. Elektronnye biblioteki: perspektivnye metody i tekhnologii, elektronnye kollekcii - RCDL-2004: Trudy VI vserossijskoj nauchnoj konferencii. M., 2004. S. 277-284.

[34] A. A. Bezdushnyj, A. N. Bezdushnyj, V. A. Serebryakov, Skhemy metadannyh ENIP: praktika primeneniya OWL v ENIP. Informacionnoe obespechenie nauki: novye tekhnologii (pod red. N.E. Kalyonova). M., 2005. S. 155-182.

[35] A. A. Bezdushnyj, A. N. Bezdushnyj, V. A. Serebryakov, V. I. Filippov, Integraciya metadannyh Edinogo Nauchnogo Informacionnogo Prostranstva RAN. M.: Vychislitel'nyj centr im. A.A. Dorodnicyna RAN, 2006. 238 s.

[36] A. A. Bezdushnyj, Skhemy metadannyh dlya nauchnyh informacionnyh resursov ENIP RAN. Poryadkovyj analiz i smezhnye voprosy matematicheskogo modelirovaniya: Trudy IV mezhdunarodnoj nauchnoj konferencii. Institut prikladnoj matematiki i informatiki. Vladikavkaz, 2006. S. 260-271.

[37] A. A. Bezdushnyj, A. N. Bezdushnyj, V. A. Serebryakov, V. I. Filippov, Integraciya metadannyh Edinogo Nauchnogo Informacionnogo Prostranstva RAN. Vychislitel'nyj centr RAN. Moskva, 2006. 238 s.

[38] A. A. Bezdushnyj, A. N. Bezdushnyj, A. K. Nesterenko, V. A. Serebryakov., T. M. Sysoev, K. B. Tejmurazov, V. I. Filippov, Informacionnaya Web-sistema «Nauchnyj institut» na platforme ENIP. M.: Vychislitel'nyj Centr im. A.A. Dorodnicyna RAN, 2007. 248 s.

[39] A. N. Bezdushnyj, V. A. Serebryakov, Edinoe nauchnoe informacionnoe prostranstvo (ENIP) RAN. Novye tekhnologii v informacionno-bibliotechnom obespechenii nauchnyh issledovanij. Sbornik nauchnyh trudov. Ekaterinburg, 2010. S. 6-17.

[40] M. V. Kulagin, V. A. Serebryakov, Informacionnoe prostranstvo RAN (Proekty i realizaciya, 1998-2013). Nauchnyj servis v seti Internet: trudy XVIII Vserossijskoj nauchnoj konferencii (19-24 sentyabrya 2016 g., g. Novorossijsk). M.: IPM im. M.V. Keldysha, 2016. S. 194-222. doi:10.20948/abrau-2016-40

[41] A. N. Bezdushnyj, A. B. ZHizhchenko, M. V. Kulagin, V. A. Serebryakov, Integrirovannaya sistema informacionnyh resursov RAN i tekhnologiya razrabotki cifrovyh bibliotek. Programmirovanie. 2000. T. 26, № 4. S. 177-185.

[42] A. A. Bezdushny, A. N. Bezdushny, A. K. Nesterenko, V. A. Serebriakov, T. M. Sysoev, Integrated System of Information Resources of the Russian Academy of Sciences. Proceedings of the 8th World Multi-Conference on Systemics, Cybernetics and Informatics SCI-2004, Orlando, Florida. 2004. P. 462-467.

[43] A. B. Antopol'skij, N. E. Kalenov, V. A. Serebryakov, A. N. Sotnikov, O edinom cifrovom prostranstve nauchnyh znanij. Vestnik Rossijskoj akademii nauk. 2019. T. 89, №7. S. 728-735.

[44] M.-A. Sicilia (Ed.): Handbook of Metadata, Semantics and Ontologies. World Scientific Publishing Co. Pte. Ltd., 2014.

[45] G. Alemu, B. Stevens, An Emergent Theory of Digital Library Metadata. Enrich then Filter. Chandos Publishing is an imprint of Elsevier, 2015.

[46] R. Gartner, Metadata. Shaping Knowledge from Antiquity to the Semantic Web. Springer International Publishing Switzerland, 2016.

[47] M. R. Kogalovsky, Metadata in Computer Systems. Programming and Computer Software. 2013, V. 39, No 4. P. 182-193.

[48] P. O. Gafurova, A. M. Elizarov, E. K. Lipachev, Basic Services of Factory Metadata Digital Mathematical Library Lobachevskii-dml. Russian Digital Libraries Journal. 2020, No. 3. P. 336-381.

[49] T. Bouche, O. Labbe, The New Numdam Platform. CICM 2017: Intelligent Computer Mathematics, P. 70-82.

[50] A. Elizarov, A. Kirillovich, E. Lipachev, O. Nevzorova, Digital Ecosystem OntoMath: Mathematical Knowledge Analytics and Management. Communications in Computer and Information Science, Springer. 2017. V. 706. P. 33-46. doi:10.1007/978-3-319-57135-5_3.

[51] A. M. Elizarov, E. K. Lipachev, Lobachevskii DML: Towards a Semantic Digital Mathematical Library of Kazan University. CEUR Workshop Proceedings. 2017. V. 2022. P. 326-333.

[52] A. M. Elizarov, E. K. Lipachev, Semantic Formula Search in Digital Mathematical Libraries. Proceedings of the 2nd Russia and Pacific Conference on Computer Technology and Applications (RPC 2017). IEEE. P. 39-43. URL: https://doi.org/10.1109/RPC.2017.8168063.

[53] Journal Publishing Tag Library NISO JATS, version 1.3d1 (ANSI/NISO Z39.96-2019). October 2019. URL: https://jats.nlm.nih.gov/archiving/1.3d1/

[54] M. Jost, T. Bouche, C. Goutorbe, J. P. Jorda, D3.2: The EuDML metadata schema. Revision: 1.6 as of 15th December 2010, http://www.mathdoc.fr/publis/d3.2-vL6.pdf

[55] EuDML metadata schema specification (v2.0-final). URL: https://initiative.eudml.org/eudml-metadata-schema-specification-v20-final

[56] Standard ECMA-376: Office Open XML File Formats, URL: https://www.ecma-international.org/publications/standards/Ecma-376.htm

[57] A. M. Elizarov, E. K. Lipachev, S. M. Khaydarov, Automated System of Services for Processing of Large Collections of Scientific Documents. CEUR Workshop Proceedings. 2016. V. 1752. P. 58-64.

[58] A. M. Elizarov, Sh. M. Khaydarov E. K. Lipachev, Scientific Documents Ontologies for Semantic Representation of Digital Libraries. Proceedings of the 2nd Russia and Pacific Conference on Computer Technology and Applications (RPC 2017). IEEE, 1-5. URL: https://doi.org/10.1109/RPC.2017.8168064.

[59] Extraction from Scientific Literature. D-Lib Magazine. 2015. V. 21, No. 11/12. URL: https://doi.org/10.1045/november2015-tkaczyk.

[60] A. N. Gerasimov, A. M. Elizarov, E. K. Lipachev, Subsystem of Formation Metadata for Science Index Databases on Management Platform Electronic Scientific Journals. Russian Digital Libraries Journal. 2015. V. 18, No. 1-2. P. 6-31.

[61] P. O. Gafurova, A. M. Elizarov, E. K. Lipachev, D. M. Khammatova, Metadata Normalization Methods in the Digital Mathematical Library. CEUR Workshop Proceedings/ 2020. V. 2543. P. 136-148.

[62] The Digital Mathematical Library Project. Status August 2005. URL: http://www.math.uiuc.edu/~tondeur/DML04.pdf

[63] Digital Mathematics Library: a Vision for the Future. International Mathematical Union, 2006. URL: http://www.mathunion.org/fileadmin/IMU/Report/dml_vision. pdf

[64] P. Tondeur, WDML: The World Digital Mathematics Library. The Evolution of Mathematical Communication in the Age of Digital Libraries. IMA Workshop, December 8-9, 2006. URL: http://www.math.uiuc.edu/~tondeur/WDML_IMA_DEC2006. pdf

[65] P. J. Olver, The World Digital Mathematics Library: Report of a Panel Discussion. Proceedings of the International Congress of Mathematicians, August 13-21, 2014, Seoul, Korea. Kyung Moon SA. 2014. V. 1. P. 773-785.

[66] J. Pitman, C. Lynch, Planning a 21st Century Global Library for Mathematics Research. Notices of the AMS. 2014. V. 61, No. 7. P. 776-777. URL: http://www.ams.org/ notices/201407/rnoti-p776.pdf.

[67] Developing a 21st century global library for mathematics research. Washington, D.C.: The National Academies Press, 2014. 131 p. arxiv.org/pdf/1404.1905; URL: http://www.nap.edu/ catalog/18619/developing-a-21 st-century-global-library-for-mathematics-research.

[68] R. Todeschini, A. Baccini, Handbook of Bibliometric Indicators: Quantitative Tools for Studying and Evaluating Research. Wiley-VCH Verlag, 2016.

[69] S. Staab, R. Studer (eds.), Handbook on Ontologies. Springer Verlag Berlin, Heidelberg, 2003, 2009.

[70] C. Lange, Ontologies and Languages for Representing Mathematical Knowledge on the Semantic Web. Semantic Web Journal. 2013. V. 4, No. 2. P. 119-158. URL: http://www. semantic-web-journal.net/content/ontologies-and-languages-representing-mathematical-knowledge-semantic-web.

[71] A. Elizarov, A. Kirillovich, E. Lipachev, O. Nevzorova, V. Solovyev, N. Zhiltsov, Mathematical Knowledge Representation: Semantic Models and Formalisms. Lobachevskii J. of Mathematics, 2014. V. 35, No. 4. P. 347-353. URL: https://doi.org/ 10.1134/S1995080214040143.Research & Social Science. 2019. 47. P. 16-27. DOI: 10.1016/j.erss.2018.08.018.

i Надоели баннеры? Вы всегда можете отключить рекламу.