Научная статья на тему 'Что скрывается за термином «Метаданные»?'

Что скрывается за термином «Метаданные»? Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
1176
248
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИЯ / ВТОРИЧНАЯ ИНФОРМАЦИЯ / МАШИНОЧИТАЕМАЯ ИНФОРМАЦИЯ / ЧЕЛОВЕКОЧИТАЕМАЯ ИНФОРМАЦИЯ / ИНФОРМАЦИОННЫЕ РЕСУРСЫ / МЕТАДАННЫЕ / РАЗНОРОДНОСТЬ / ПОЛИСЕМИЯ / INFORMATION / SECONDARY INFORMATION / MACHINE-READABLE INFORMATION / MEN-READABLE INFORMATION / INFORMATION RESOURCES / METADATA / HETEROGENEITY / POLYSEMANTICISM

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Берестова Татьяна Фёдоровна

Проанализированы взгляды на объем понятия «метаданные». Метаданные рассматриваются как вторично-информационное явление и разновидность информационного ресурса, которому присущи все свойства данных феноменов. Cопоставлены широкий и узкий подходы к этому понятию. Приводятся доказательства того, что метаданные это вторичная машиночитаемая информация, причем указывается, что ряд метаданных, перечисленных авторами публикаций по данной теме, не укладывается в «лоно» вторичной информации. Проведенный анализ позволяет сделать вывод о разнородности феномена «метаданные» и полисемичности термина «метаданные».

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

WHAT IS HIDDEN BEHIND THE “METADATA” TERM?

The article contains the analysis of the “metadata” term. Metadata are considered as a secondary-informational phenomenon and the variety of information resource which possesses all properties of the given phenomena. The author has compared wide and narrow approaches to the “metadata” notion and proved that metadata are secondary machine-readable information where some metadata are given by the authors of the publications on this topic but they do not fit the secondary information “bosom”. The author concludes by pointing out heterogeneity and polysemanticism of the “metadata” phenomenon.

Текст научной работы на тему «Что скрывается за термином «Метаданные»?»

УДК 01

Т. Ф. Берестова

д-р пед. наук, профессор, Челябинский государственный институт культуры E-mail: berestova. home@mail. ru

ЧТО СКРЫВАЕТСЯ ЗА ТЕРМИНОМ «МЕТАДАННЫЕ»?

Проанализированы взгляды на объем понятия «метаданные». Метаданные рассматриваются как вторично-информационное явление и разновидность информационного ресурса, которому присущи все свойства данных феноменов. Сопоставлены широкий и узкий подходы к этому понятию. Приводятся доказательства того, что метаданные - это вторичная машиночитаемая информация, причем указывается, что ряд метаданных, перечисленных авторами публикаций по данной теме, не укладывается в «лоно» вторичной информации. Проведенный анализ позволяет сделать вывод о разнородности феномена «метаданные» и полисемичности термина «метаданные».

Ключевые слова: информация, вторичная информация, машиночитаемая информация, человекочи-таемая информация, информационные ресурсы, метаданные, разнородность, полисемия

Для цитирования: Берестова, Т. Ф. Что скрывается за термином «метаданные»? / Т. Ф. Берестова // Вестник культуры и искусств. - 2017. - № 1 (49). - С. 7-11.

Наиболее полно явление метаданные описано в работах А. Б. Антопольского [1; 2] и М. Р. Когаловского [7; 8], однако изучение этого феномена продолжается, и вопросов, связанных с его научным осознанием, становится все больше [См, напр., 12]. Исследованием метаданных в основном занимаются представители технических специальностей. Они пытаются определить феномен метаданные, опираясь на понятийный аппарат своих наук, чаще всего подчеркивая, что метаданные возникают вслед за основным информационным ресурсом, т. е. они вторичны.

Информационная природа метаданных не вызывает сомнения. Они возникли как явление информатизации и функционируют чаще всего как машинная информация которая имеет много общего с семантической. Наиболее удачно понятие информация дефинировал А. В. Соколов: «Семантическая информация - это амбвива-лентное понятие, обозначающее средство для выражения смысла через коммуникативные знаки» [11, с. 416]. Общность семантической и машинной информации основана на том, что любая социальная информация существует только в социуме (человеческом обществе), и она выражает смыслы. Семантическая инфор-

мация - это источник знаний, смыслы, представленные в виде человекочитаемой информации. Машинная информация также выражает смыслы, но через машиночитаемые знаки. Смыслы машиночитаемой информации связаны с командами, а передаются они в виде электрических импульсов по алгоритмическим программам и воспринимаются компьютером, если он снабжен соответствующим программным обеспечением. «Структура семантической и машинной коммуникации изоморфны (подобны по форме): в обоих случаях передаваемая информация амбивалентна и включает смысловое (идеальное) содержание (допустим человекочи-таемые указания или машиночитаемые команды) и материальную форму (текст, изображение, закодированное сообщение)» [10, с. 295-296].

Большинство исследователей метаданных признает их разновидностью информационных ресурсов [2; 7; 14]. Определение последних уже предложено нами, и в данной статье мы только повторим его: «Информационный ресурс - это целенаправленно созданная информация, обладающая инструментальной функцией и используемая в качестве средства определенного вида деятельности, она обладает ярко выраженными потребительскими цен-

7

ностями, которые зачастую позволяют позиционировать этот продукт в качестве товара на информационном рынке» [3; 4]. Феномен метаданные возникает как явление и понятие, производное от явления информационные ресурсы, а потому обладает всеми характеристиками, перечисленными в дефиниции информационных ресурсов.

К сожалению, вопрос об объеме понятия информационные ресурсы не имеет общепринятого решения, и это обуславливает подходы к широкому или узкому пониманию термина метаданные. Если информационные ресурсы - это общее явление и понятие, включающее в себя и традиционные (нецифровые), и машинные (цифровые) ресурсы, то метаданные - термин для обозначения вторичной информации о любых информационных ресурсах. Если признается, что информационные ресурсы существуют исключительно в электронной среде, то метаданные - разновидность вторичной информации, которая может быть только машиночитаема. Снятие противоречия, отражающего разное понимание явления метаданные, связано с разрешением вопроса об объеме понятия информационные ресурсы. При дальнейшем изучении метаданных мы будем опираться на узкое понимание данного термина, обозначающего феномен машиночитаемых информационных ресурсов.

В работах о метаданных нередко представлены позиции, которые определяют этот феномен беспредельно широко, и часто наряду с электронными феноменами в число метаданных включаются явления, зародившиеся и функционирующие в рамках традиционной (печатной) коммуникации. Так, М. Р. Когаловский считает, что метаданные существовали задолго до появления компьютерных систем, и в качестве примера таковых он называет библиографические описания, различные каталоги, классификации и аннотации [7]. Он относит к метаданным также: информационные потребности пользователей, характеристики владельцев генераторов и ИПС, слабоструктурированные данные Веба и вообще неструктурированные данные, в частности тексты на естественных языках, совокупность разметки тегов, необходимых в гипертекстовых

8

системах, поисковый образ документа, описания схемы баз и банков данных, концептуальных схем и онтологий, научных приборов, технических сервисов, устройств программных систем и их элементов, процессов и сред их функционирования, бизнес-процессов и бизнес-правил (полномочия и ограничения в доступе и использовании) [Там же]. Исходя из такого подхода, к метаданным можно отнести и нецифровые объекты, а значительная часть подобной информации, как известно, воспринимаема человеком. При этом упомянутый автор отмечает: если метаданные присутствуют в тексте, изображениях, сообщениях электронной почты и других объектах в скрытом, неявном виде, то их приходиться извлекать вручную, но при создании особых программ даже в неструктурированных ресурсах метаданные изымаются из текста автоматически.

Столь широкий подход к использованию термина метаданные кажется нам неправомерным. Ведь явление метаданные зародилось только после возникновения информационно-коммуникационных технологий, только во времена информатизации, термин метаданные сформировался применительно к машиночитаемой информации - это обстоятельство, которое надо учитывать при проведении познавательных процедур по отношению к феномену метаданные. Признав метаданные вторично-информационным ресурсом, нет резона при этом включать в их число уже давно известные и неплохо изученные явления вторичной информации, уже обозначенные специальными терминами и закрепленные в профессиональной лексике у очень широкого круга специалистов и ученых документально-коммуникационной сферы. Разновидности вторичной информации давно выявлены и названы, это - библиографическая и вторично-семантическая (аналитико-синтетически переработанная) информация [5; 9; 13], а значит, нет смысла для их обозначения использовать термин метаданные, появившийся значительно позднее и обозначающий явление, порожденное автоматизацией информационных процессов. Если же метаданные - еще один вид вторичной инфор-

мации, то надо выявить его общность с другими вторично-информационными объектами и указать на различия с ними.

Очень часто представление метаданных осуществляют через перечисление технологических операций, которые производят с их помощью. При подобной перечислительной конкретизации метаданными называют любую информацию, необходимую для анализа, проектирования, построения, внедрения и применения компьютерной системы при использовании информационных технологий. В ряде публикаций говорится, что метаданные упрощают и рационализируют управление ресурсами, могут быть инструментом генерирования и управления записями, дают правила взаимосвязи внутри информационных систем, они обеспечивают полноценное использование и понимание данных и создание запросов, метаданные выступают как технические стандарты, информируют об условиях долговременной сохранности отражаемых объектов и включают различные их характеристики: идентификацию, программно-аппаратное обеспечение, описание физических свойств объекта, формат файла, номер версии, информацию о миграции и возможных потерях во время ее процесса, данные на аутентичность, информацию об авторских правах, стоимости доставки [6, с. 163; 7]. В приведенных примерах под термином метаданные, в одном ряду со вторичными информационными явлениями, широко представлены явления первичной информации, например, информация об авторских правах, условиях сохранности, правила взаимосвязи внутри информационных систем, а также данные о технических устройствах, обеспечивающих функционирование метаданных и других информационных ресурсов. Иногда даже стандарты метаданных фактически нельзя отнести к вторично-информационным явлениям, например, стандарт для идентификации организаций (ISO 6523) вряд ли можно назвать вторичным информационным ресурсом.

Одним из способов познания разнообразия тех или иных феноменов является классифицирование. В настоящее время есть ряд классифи-

9

каций метаданных на основе использования таких признаков, как уровни семантической абстракции и архитектуры, свойств и выполняемых функций и т. д. Для данной публикации наиболее продуктивно использовать разделение метаданных на описательные (контентные), структурные и административные. В административные метаданные включены несколько разновидностей: технические метаданные, данные, используемые в управлении сохранением и обработкой ресурса, а также в управлении правами интеллектуальных и иных собственников. Структурные метаданные включают описание объемов, структуры ресурса и его компонентов. Структурные, и особенно административные, метаданные пока слабо дифференцированы, а группы их разновидностей не имеют собственного «словесного» обозначения, именно в них нет четкого разделения на объекты вторично-информационной природы и объекты, обладающие признаками первичной (фактографической) информации. Третья группа, так называемые описательные метаданные, характеризует информационный ресурс (т. е. контент) по структуре или по предметным областям, целям и другим качествам, с помощью этих метаданных ресурс может быть идентифицирован и аутен-тифицирован [7].

Название описательные метаданные нам кажется неудачным, потому что и в других группах метаданных также используется описание. Описание - это технологическая процедура, общая и для административных, и для структурных метаданных. Вопрос о характеристиках структурных и административных метаданных требует особого изучения, но самые предварительные суждения можно высказать уже в данной статье. Считаем, что описывать информационный ресурс можно и по признакам, связанным с его структурой, а также по возможностям защиты, сохранения, движения в инфосистеме и т. д., но необходимо разобраться, каков характер у такого описания: является ли полученный результат вторичной информацией (информацией об информации) или он несет первичную (фактографическую) информацию. Безусловно, вторичным является описание контента, которое

осуществляется с помощью описательных метаданных в рамках определенного формата (стандарта) представления той или иной категории ресурсов. Другие метаданные не всегда правомерно называть информацией об информации.

В результате детального изучения явления метаданные каждая из групп должна быть четко терминологически обозначена, их совокупность - очерчена и более детально дифференцирована, а затем и классифицирована на основе разных признаков (как общих с другими информационными объектами, так и специфичных, проявляющихся только у метаданных). Решение этих задач позволит создать де-

финицию метаданных как вторично-информационного явления и выявить особенности феноменов, называемых сегодня метаданные, но не обладающих признаком вторич-ности информации. Все сказанное приводит нас к выводу: явление метаданные - разнородно, а термин метаданные - многозначен (полисемичен). Многозначность термина не только тормозит научное осмысление феномена метаданные, но и затрудняет научное познание, профессиональное общение и учебный процесс, направленный на увеличение числа людей, использующих метаданные в своей деятельности.

1. Антопольский, А. Б. Информационные ресурсы России: науч.-метод. пособие / А. Б. Антопольский. -Москва: Либерея, 2004. - 424 с. - (Библиотекарь и время. XXI век. Вып. 14).

2. Антопольский, А. Б. Системы метаданных в электронных библиотеках / А. Б. Антопольский // Научные и технические библиотеки. - 2002. - № 3. - С. 26-44.

3. Берестова, Т. Ф. Информационные ресурсы и другие элементы ресурсоцентристской библиографоведче-ской парадигмы / Т. Ф. Берестова // Библиография и книговедение. - 2015. - № 6. - С. 46-55.

4. Берестова, Т. Ф. Понятие «информационные ресурсы» и другие компоненты теории информационного ресурсоведения / Т. Ф. Берестова // Научно-техническая информация. Сер. 1. Организация и методика информационной работы. - 2016. - № 4. - С. 1-6.

5. Берестова, Т. Ф. Свойства информации как потенциал ее иерархического функционирования и видового многообразия / Т. Ф. Берестова // Научно-техническая информация. Сер. 1. Организация и методика информационной работы. - 2013. - № 3. - С. 1-7.

6. Земсков, А. И. Электронные библиотеки: учеб. для вузов / А. И. Земсков, Я. Л. Шрайберг. - Москва: Либерея, 2003. - 352 с.

7. Когаловский, М. Р. Метаданные, их свойства, функции, классификация и средства предоставления / М. Р. Когаловский // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: труды 14-й Всерос. науч. конф. RCDL-2012 (Переславль-Залесский, 15-18 окт. 2012 г.). - Пере-славль-Залесский: УГП, 2012. - 400 с.

8. Когаловский, М. Р. Энциклопедия технологии баз данных / М. Р. Когаловский. - Москва: Финансы и статистика, 2002. - 800 с.

9. Коршунов, О. П. Проблемы общей теории библиографии: моногр. / О. П. Коршунов. - Москва: Книга, 1975. - 192 с.

10. Соколов, А. В. Парадигмы библиографоведения: книга, документ, ресурс: очерки о прошлом и будущем библиографической науки / А. В. Соколов, Т. Ф. Берестова; Челяб. гос. акад. культуры и искусств. - Челябинск, 2014. - 489 с.

11. Соколов, А. В. Философия информации: учеб. пособие / А. В. Соколов; Челяб. гос. акад. культуры и искусств. - Челябинск, 2011. - 455 с.

12. Универсальная система метаданных для характеристики наноматериалов / А. О. Еркимбаев, В. Ю. Зи-церман, Г. А. Кобзев, М. С. Трахтенгерц // Научно-техническая информация. Сер. 1. Организация и методика информационной работы. - 2015. - № 10. - С. 8-20.

13. Berestova T. 2013. The properties of information as a potential of its hierarchic functioning and diversity of its types. Scientific and technical information processing. Vol. 40. Issue 1: 39-45. (In Eng.).

14. Brackett, M. H. 1996. The data warehouse challenge: taming data chaos. New York: Wiley. 579 p. (In Eng.).

Получено 17.10.2016

10

T. Berestova

Doctor of Pedagogic Sciences, Professor, Chelyabinsk State Institute of Culture and Arts E-mail: berestova. home@mail. ru

WHAT IS HIDDEN BEHIND THE "METADATA" TERM?

Abstract. The article contains the analysis of the "metadata" term. Metadata are considered as a secondary-informational phenomenon and the variety of information resource which possesses all properties of the given phenomena. The author has compared wide and narrow approaches to the "metadata" notion and proved that metadata are secondary machine-readable information where some metadata are given by the authors of the publications on this topic but they do not fit the secondary information "bosom ". The author concludes by pointing out heterogeneity and polysemanticism of the "metadata" phenomenon.

Keywords: information, secondary information, machine-readable information, men-readable information, information resources, metadata, heterogeneity, polysemanticism

For citing: Berestova T. 2017. What is hidden behind the "metadata" term?. Culture and Arts Herald. No 1 (49): 7-11.

References

1. Antopolskii A. 2004. Informatsionnye resursy Rossii [Information resources of Russia]. Moscow: Libereya. 424 p. (In Russ.).

2. Antopolskii A. 2002. Metadata systems in electronic libraries. Scientific and technical libraries. No 3: 26-44. (In Russ.).

3. Berestova T. 2015. Information resources and other elements of the resource-centre bibliographic paradigm. Bibliography and bibliology. No 6: 46-55. (In Russ.).

4. Berestova T. 2016. The concept of "information resources" and other components of the theory of informational resources science. Scientific and technical information processing. No 4: 1-6. (In Russ.).

5. Berestova T. 2013. Information properties as the potential of its hierarchical functioning and species diversity. Scientific and technical information processing. No 3: 1-7. (In Russ.).

6. Zemskov A., Shraiberg IA. 2003. Elektronnye biblioteki [Electronic libraries]. Moscow: Libereya. 352 p. (In Russ.).

7. Kogalovskii M. 2012. Metadata, their properties, functions, classification and means of providing. Elektronnye biblioteki: perspektivnye metody i tekhnologii, elektronnye kollektsii [Electronic libraries: advanced methods and technologies, digital collections]. 400 p. (In Russ.).

8. Kogalovskii M. 2002. Entsiklopediya tekhnologii baz dannykh [Encyclopedia of database technologies]. Moscow: Finansy i statistika. 800 p. (In Russ.).

9. Korshunov O. 1975. Problemy obshchey teorii bibliografii [Problems of the bibliography general theory]. Moscow: Kniga. 192 p. (In Russ.).

10. Sokolov A., Berestova T. 2014. Paradigmy bibliografovedeniya: kniga, dokument, resurs: ocherki o proshlom i budushchem bibliograficheskoy nauki [Paradigm bibliography: book, document, online: essays about the past and future bibliography]. Chelyabinsk. 489 p. (In Russ.).

11. Sokolov A. 2011. Filosofiya informatsii [Philosophy of information]. Chelyabinsk. 455 p. (In Russ.).

12. Erkimbaev A., Zitserman V., Kobzev G., Trakhtengerts M. 2015. A universal metadata system for the characterization of nanomaterials. Scientific and technical information processing. No 10: 8-20. (In Russ.).

13. Berestova T. 2013. The properties of information as a potential of its hierarchic functioning and diversity of its types. Scientific and technical information processing. Vol. 40. Issue 1: 39-45. (In Eng.).

14. Brackett M. H. 1996. The data warehouse challenge: taming data chaos. New York: Wiley. 579 p. (In Eng.).

Received 17.10.2016

11

i Надоели баннеры? Вы всегда можете отключить рекламу.