Научная статья на тему 'ОПЫТ ИСПОЛЬЗОВАНИЯ ОНТОЛОГИЙ В ФОЛЬКЛОРИСТИКЕ'

ОПЫТ ИСПОЛЬЗОВАНИЯ ОНТОЛОГИЙ В ФОЛЬКЛОРИСТИКЕ Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
76
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОНТОЛОГИЯ / ФОЛЬКЛОРИСТИКА / МЕТАОНТОЛОГИЯ / ПРЕДМЕТНАЯ ОНТОЛОГИЯ

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Гриневич Анна Александровна

На примере системы электронного портала «Фольклор народов Сибири» в статье рассматривается метод применения онтологий в фольклористике. Очерчивается круг проблем в области фольклористики, которые позволяет решить этот тип организации данных. Автор предлагает масштабируемые классификации фольклорных ресурсов по жанровым признакам (ветвь метаонтологии «Жанр») или контексту исполнения (ветвь метаонтологии «Ритуал»). Фольклористика является слабоструктурируемой областью знания. Понятия фольклористики предлагается описывать посредством нескольких предметных онтологий. Онтологии позволяют описать как внешнюю, так и внутреннюю сторону фольклорных произведений. Предложенные модели могут быть использованы как для характеристики фольклорных ресурсов, так и для навигации в системе. Для формального метаописания коллекции ресурсов адаптируется стандарт CIDOC-CRM, который используется для выражения процессов сбора и подготовки фольклорных произведений. Для описания элементов текста, их свойств и отношений, выявленных в корпусе текстов исследователями, предлагается использовать онтологию культурных универсалий, которая применяется для разметки внутри текстов. В рамках предметной онтологии разработана система персонажей. Предложенный онтологический метод позволяет описывать фольклорные ресурсы с точки зрения их формы, а также выявлять содержательные компоненты произведений.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Гриневич Анна Александровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AN ATTEMPT TO USE ONTOLOGIES IN FOLKLORE STUDIES

The paper examines the method of using ontologies in folklore study by describing it on the example of the electronic portal system “Folklore of the peoples of Siberia”. Ontological data organization allows solving the range of problems in the field of folklore studies. The author puts forward scalable classifications of folklore resources by genre (the Genre meta-ontology branch) or the performance context (the Ritual meta-ontology branch). Folklore study proves to be a poorly structured area of knowledge. The concepts of folklore are proposed to be described by means of several domain ontologies. Ontologies allow describing both the exterior and the interior sides of folklore works. The models suggested can be used both to characterize folklore resources and to navigate the system. The CIDOC-CRM standard is adapted for a formal meta-description of a collection of folklore resources. It is used to describe the processes of collecting and preparing folklore works. The ontology of cultural universals, used for marking within texts, is proposed to describe the text elements, their properties and relationships identified in the language corpus by the researcher. Within the framework of the domain ontology, a system of Characters has been developed. The ontological method, suggested here, makes it possible to describe folklore resources from the point of view of their form, as well as to identify the content components of folklore works.

Текст научной работы на тему «ОПЫТ ИСПОЛЬЗОВАНИЯ ОНТОЛОГИЙ В ФОЛЬКЛОРИСТИКЕ»

Фольклористика

УДК 82.0-398

DOI 10.17223/18137083/76/1

Опыт использования онтологий в фольклористике А. А. Гриневич

Институт филологии СО РАН Новосибирск, Россия

Аннотация

На примере системы электронного портала «Фольклор народов Сибири» в статье рассматривается метод применения онтологий в фольклористике. Очерчивается круг проблем в области фольклористики, которые позволяет решить этот тип организации данных. Автор предлагает масштабируемые классификации фольклорных ресурсов по жанровым признакам (ветвь метаонтологии «Жанр») или контексту исполнения (ветвь метаонтологии «Ритуал»). Фольклористика является слабоструктурируемой областью знания. Понятия фольклористики предлагается описывать посредством нескольких предметных онтологий. Онтологии позволяют описать как внешнюю, так и внутреннюю сторону фольклорных произведений. Предложенные модели могут быть использованы как для характеристики фольклорных ресурсов, так и для навигации в системе. Для формального метаописания коллекции ресурсов адаптируется стандарт СГООС-СКМ, который используется для выражения процессов сбора и подготовки фольклорных произведений. Для описания элементов текста, их свойств и отношений, выявленных в корпусе текстов исследователями, предлагается использовать онтологию культурных универсалий, которая применяется для разметки внутри текстов. В рамках предметной онтологии разработана система персонажей. Предложенный онтологический метод позволяет описывать фольклорные ресурсы с точки зрения их формы, а также выявлять содержательные компоненты произведений.

Ключевые слова

онтология, фольклористика, метаонтология, предметная онтология

Для цитирования

Гриневич А. А. Опыт использования онтологий в фольклористике // Сибирский филологический журнал. 2021. № 3. С. 9-21. DOI 10.17223/18137083/76/1

An attempt to use ontologies in folklore studies A. A. Grinevich

Institute of Philology SB RAS Novosibirsk, Russian Federation

Abstract

The paper examines the method of using ontologies in folklore study by describing it on the example of the electronic portal system "Folklore of the peoples of Siberia". Ontological data organization allows solving the range of problems in the field of folklore studies. The author

© А. А. Гриневич, 2021

puts forward scalable classifications of folklore resources by genre (the Genre meta-ontology branch) or the performance context (the Ritual meta-ontology branch). Folklore study proves to be a poorly structured area of knowledge. The concepts of folklore are proposed to be described by means of several domain ontologies. Ontologies allow describing both the exterior and the interior sides of folklore works. The models suggested can be used both to characterize folklore resources and to navigate the system. The CIDOC-CRM standard is adapted for a formal meta-description of a collection of folklore resources. It is used to describe the processes of collecting and preparing folklore works. The ontology of cultural universals, used for marking within texts, is proposed to describe the text elements, their properties and relationships identified in the language corpus by the researcher. Within the framework of the domain ontology, a system of Characters has been developed. The ontological method, suggested here, makes it possible to describe folklore resources from the point of view of their form, as well as to identify the content components of folklore works. Keywords

ontology, folklore study, domain ontology, meta-ontology For citation

Grinevich A. A. An attempt to use ontologies in folklore studies. Siberian Journal of Philology, 2021, no. 3, pp. 9-21. (in Russ.) DOI 10.17223/18137083/76/1

Современные методы работы с текстами немыслимы без их компьютерной обработки и Интернета. В настоящее время активно развивается область знаний, изучающая и конструирующая искусственный интеллект. Применение методов компьютерной обработки текста чрезвычайно актуально и в фольклористике, так как эта гуманитарная дисциплина имеет дело с большим массивом текстовых данных, которые носят типизированный характер. Чрезвычайно продуктивным является представление текстов на основе технологий Semantic Web - в виде электронных корпусов, снабженных семантической разметкой, выполненной на основе онтологии.

Онтология - это один из способов представления данных. Существует множество определений онтологии. Для нашего исследования актуальным является определение, данное Т. Грубером, согласно которому онтология - это формальная спецификация концептуализации («is an explicit specification of a conceptualization» [Gruber, 1993]). Под концептуализацией понимается набор понятий, объектов, сущностей, принятых в соответствующей области знания, а также отношения между ними. Иными словами, это абстрактное упрощенное представление о мире, вселенная дискурса (the universe of discourse). Понятие онтологии было разработано в рамках направления Semantic Web, но заимствовано из философии, где оно обозначает науку о бытии.

Онтология предполагает определенный формат или средства для ее формализации. Компоненты онтологии можно представить формулой O = <C, R, T, D, A, F, Ax>, где O - онтология портала знаний; C - конечное непустое множество классов, описывающих предметную область; R - конечное непустое множество бинарных отношений, заданных на классах (понятиях); T - конечное непустое множество стандартных типов; D - множество доменов, отношений заданного типа; A - конечное множество атрибутов, описывающее свойства понятий С; F -множество ограничений на значения атрибутов понятий и отношений; Ax - множество аксиом, определяющих семантику классов и отношений онтологии [Заго-рулько, 2009, с. 162]. Главная цель разработки онтологий - совместное использование общего понимания структуры информации людьми и программами [Gruber, 1993; Musen, 1992].

В настоящее время онтологии широко используются в различных отраслях деятельности: в медицине, торговле, экономике, промышленности, лингвистике и т. п. Онтологии прекрасно подходят для систематизации знаний, и их можно интегрировать в едином пространстве и семантически связывать, что позволяет структурировать знание в мировой сети Интернет.

Применение онтологий в гуманитарной области, в частности в культурологии и фольклористике, становится всё более востребовано. В разных странах исследователи работают над тем, чтобы оцифровать и представить в общем доступе культурное наследие своего народа: 1) Энциклопедия иранского фольклора, разработанная Мохсеном Амади на гуманитарном факультете Университета г. Иювя-скюля в Финляндии [ЕшаШ, 2014]; 2) Электронная библиотека болгарского фольклора - национальный проект Болгарской академии наук [ЬиеИеу е! а1., 2008]; 3) Семантик Калевала - одна из задач национального семантического проекта веб-онтологий в Финляндии ^ппОЭТО) [Иуубпеп е! а1., 2007].

В России онтологии только начинают проникать в гуманитарные науки. Опыт составления электронных языковых корпусов гораздо богаче. Из доступных функционирующих на данный момент ресурсов можно перечислить следующие. Русские корпусы: Национальный корпус русского языка Тезаурус русского языка в формате WordNet 2. Хорошо представлена в Интернете монгольская языковая семья [Бадмаева, 2015] - это Бурятский корпус текстов 3, Монгольский корпус текстов 4, Калмыцкий корпус текстов 5, для которых использована адаптированная поисковая система Армянского корпуса текстов 6 Эта же система использована для Корпуса удмуртского языка 7. Тюркские языки Сибири представлены Хакасским корпусом текстов 8. Мультимедийный интернет-ресурс «Малые языки Сибири» представляет материалы по малым языкам бассейна Среднего Енисея и Среднего и Верхнего Таза - селькупскому, кетскому и эвенкийскому 9.

Методы корпусной лингвистики применяются для проведения этнографических исследований на селькупском фольклорном материале [Тучкова, 2018]. Начинают появляться фольклорные корпусы, созданные для решения задач не только лингвистики, но и фольклористики, например Корпус нганасанских фольклорных текстов 10 ИЭА РАН создает корпусы текстов на языках малочисленных народов Сибири 11. На данный момент обслуживаются корпусы на ненецком, телеутском, шорском и эвенкийском языках.

В России попыткой систематизировать фото-, аудио-, видео- и текстовые материалы, посвященные фольклору коренных народов Сибири, на основе онтоло-

1 Русский корпус текстов: http://www.ruscorpora.ru/

2 RuWordNet: http://www.labinform.ru/pub/ruwordnet/index.htm

3 Бурятский корпус текстов: http://web-corpora.net

4 Монгольский корпус текстов: http://web-corpora.net/MongolianCorpus/search/7interface_ language=ru

5 Калмыцкий корпус текстов: http://web-corpora.net/KalmykCorpus/search/7interface_ language=ru

6 Армянский корпус текстов: http://eanc.net/EANC/search/?interface_language=ru

7 Удмуртский язык: http://web-corpora.net/UdmurtCorpus/search/7interface_language=ru

8 Электронный корпус хакасского языка: https://khakas.altaica.ru/

9 Siberian lang: http://minlang.srcc.msu.ru/

10 Корпус нганасанских фольклорных текстов: http://www.iling-ran.ru/gusev/Nganasan/ index.php

11 Корпусы ИЭА РАН: http://corpora.iea.ras.ru/corpora

гии является электронный портал «Фольклор народов Сибири» 12. Помимо библиотеки ресурсов портал предоставляет и инструменты для аннотирования текстов на основе предметной онтологии. Для многонационального сибирского региона вопрос систематизации и доступа к явлениям традиционного культурного наследия особенно актуален. Проект решает фундаментальную задачу гуманитарных наук по систематизации и интеграции ресурсов в общее информационное пространство. Систематизация ресурсов на основе онтологии представляет данные как в человеко-, так и в машиночитаемом виде. Портал представляет собой мультиязычную базу данных с двуязычными корпусами национальных фольклорных текстов с переводом их на русский язык. В настоящее время сформированы языковые корпусы текстов на хантыйском, алюторском, бурятском, хакасском, шорском, алтайском, русском и корякском языках. Чтобы представить фольклор максимально близко к его бытованию во взаимодействии слова и действия, на портале объединены текстовые и мультимедийные материалы. При наличии тексты снабжаются аудиозаписью и видеозаписью их исполнения. Информационная система портала позволяет загружать разные типы ресурсов: аудио-, видео-, фотоиллюстрации, нотные расшифровки, глоссы, научные публикации, и связывать их друг с другом. Важной особенностью портала является использование онтологической разметки на основе системы понятий для выделения в текстах значимых элементов. Система портала позволяет осуществлять разметку в текстах на основе онтологий, посвященных различным задачам изучения внутренней структуры и семантики фольклорных текстов.

Далее в статье описывается опыт представления фольклора в виде онтологии, очерчивается круг проблем в области фольклористики, которые позволяет решить этот тип организации данных, а также трудности, с которыми столкнулись авторы системы.

Перед разработчиками стояло две основные задачи: 1) структурирование текстовых и мультимедийных данных, посвященных фольклору народов Сибири, в едином информационном пространстве, в виде, позволяющем интеграцию с другими подобными ресурсами; 2) содержательное описание публикуемых произведений при помощи создания системы понятий.

Гуманитарные предметные области являются слабоструктурируемыми. «Слабоструктурированные данные часто описывают как "с отсутствующей схемой" или "самоописывающие". Это означает, что не существует наложенной схемы или типа, и необходима система для интерпретации слабоструктурированных данных, которая обычно подчиняется некоторой графической форме» [Карташов и др., 2018, с. 10]. Онтологии - один из способов представления слабоструктурированных данных.

Первая проблема - разграничение предметных областей. Принципиальным решением стало различение в системе портала двух видов онтологий. Онтология ресурсов, или метаонтология, которая представляет формальное описание коллекции материалов, является основой навигации в системе. Онтология культурных универсалий, или предметная онтология, содержит понятия или концепты, имеющие универсальный общераспространенный характер для Сибирского макрорегиона. Она используется для содержательной характеристики и разметки фольклорных текстов. При этом система может содержать более одной предметной онтологии.

12 Электронный портал «Фольклор народов Сибири»: http://folk.philology.nsc.ru

Метаонтология разработана на основе известной стандартной онтологии CIDOC-CRM 13. CIDOC Conceptual Reference Model - это формальная модель, созданная для поддержки интеграции, стандартизации и обмена информацией в области культурного наследия. Данная модель является зарегистрированным стандартом ISO 14.

CIDOC-CRM спроектирована таким образом, что основными концептами являются События (Event), связанные со временем действия и местами, в которых они произошли. При разработке метаонтологии при помощи событий выражаются процессы сбора и подготовки фольклорных произведений. Событие характеризуется временем, местом действия, актором и результатом. Акторами являются персоны, задействованные в процессе подготовки материалов: сборщики, переводчики, люди, ответственные за расшифровки аудиозаписей, и др.

На рис. 1 представлено фольклорное произведение (E33 Linguistic Object) жанра "л'оцул'туп ар" (легкая песня) (P2_has_type Genre) с оригинальным названием dbo:originalTitle "Лэху, лэху..." и его переводом dbo:title на русский язык (в данном случае оригинальное название совпадает с переводом) исполнено на хантыйском языке (P72_has_language), а точнее на его шурышкарском диалекте (has dialect), сынском говоре (has speech). Языки, диалекты и говоры образуют иерархическую структуру через отношения P127_has_broader_term.

Текст произведения хранится (P128 carries) на носителе (Digital Carrier), который имеет тип (E55 Type) "txt" и идентифицируется именем (P1_identified_by) "laehoo.txt". Произведение переведено на русский язык (P73 has translation).

Процесс подготовки произведения к публикации представляется множеством событий вида Preparing to Publish, являющихся частными случаями объектов вида E55 Event. Роль произведения в событии определяется типом связи с событием. На рис. 1 показаны 4 события: сбор (collected), исполнение (performed), расшифровка (decrypted) и перевод (translated). Для каждого события указывается соответствующий Актор (P14 carried out by). Для события сбора также указаны время и место (P4 has time span, P7 took place at). Из данного фрагмента следует, что произведение было записано во время экспедиции 2003 г. в дер. Овгорт.

Инструмент онтологической разметки достаточно гибкий и позволяет решать разнообразные исследовательские задачи. Одной из задач, которую позволяет решить система портала при помощи онтологии, является описание культурных универсалий, распространенных на территории Сибири. Сибирь - регион тесных контактов различных этносов, место образования уникального сплава культур и традиций. Фольклорный текст как репрезентант картины мира этноса заключает в себе всё богатство культурных и языковый значений. В условиях культурного взаимодействия, обусловленного территориальной близостью и социальными контактами, проявляются этнокультурные константы, которые играют важную роль в формировании социокультурного ландшафта региона. Культурные универсалии понимаются нами, с одной стороны, как широко распространенные концепты, формирующие картину мира сибирских этносов. На данный момент существует множество теоретических исследований в данной области: Н. И. Толстой [1995], С. М. Толстая [2008], Е. С. Серебренников и соавторы [1988], Ю. С. Степанов [2007], А. Вежбицкая [2011] и др. Авторы этих исследований

13 http://www.cidoc-crm.org/

14 https://www.iso. org/standard/57832. html

Рис. 1. Сущность класса Лингвистический объект, описанная в метаонтологии Fig. 1. An instance of Linguistic Object described in the meta-ontology

являются специалистами в таких междисциплинарных гуманитарных областях, как этнолингвистика, лингвокультурология, когнитивная лингвистика. С другой стороны, универсальными являются способы сохранения устной традиционной культуры, а также поэтика и форма фольклорных явлений: A. Lord [1951; 1968], M. Parry [1932], A. Widmer [2000].

Как уже отмечалось, сложность поставленной задачи заключается в первую очередь в том, что рассматриваемая предметная область слабо формализуема. Описание же фольклорных материалов в системе осуществляется посредством как характеристики формы, так и внутреннего концептуального анализа. Культурные универсалии включают концепты и понятия, формирующие картину мира сибирских этносов, а также устойчивые элементы поэтики. По этой причине предметная область не может быть описана в рамках единой онтологии и представляется множеством онтологий, каждая из которых описывает специальную предметную область. Подход, предлагаемый для данного исследования, предполагает решение дополнительной задачи проведения границы между предметной и метаонтологиями. Граница проводится формально. Сущности, необходимые для описания метаинформации ресурсов, были отнесены к метаонтологии. Наряду с уже описанными местом, временем записи, исполнителем, собирателем и т. п. к метаонтологии были отнесены характеристики ресурса с точки зрения его жанровой атрибуции, а также контекста его исполнения.

Благодаря множественному наследованию при помощи онтологии могут быть разработаны масштабируемые классификации, что для фольклористики очень актуально, поскольку в этой науке уже сложилось большое количество подходов, масштабируемая же классификация позволяет их совмещать в рамках единой системы.

Для характеристики формы фольклорных произведений, а также для осуществления навигации по ресурсам разработана масштабируемая классификация фольклорных жанров. Хотя сами по себе жанры всё-таки нельзя считать универсалиями, деление произведений устного народного творчества на роды и виды зафиксировано во всех национальных традициях. Проблема фольклорных жанров - это нерешенная задача в фольклористике. Исследователи В. Я. Пропп [1964], В. Н. Топоров [Toporov, 1974; Топоров, 1974], W. Bascom [1965], C. S. Littleton [1965] и многие другие предлагают критерии различения жанров. В фольклористике уже сложилась определенная общеупотребительная терминология, разделяемая научным сообществом. Чтобы учесть терминологическую традицию, а также как можно большее количество жанроразличительных признаков, разработаны три взаимосвязанные модели: универсальная жанровая модель, локальная жанровая модель и система жанровых признаков. Универсальная модель представляет общеупотребительные термины, такие как песня, эпос, сказка и т. п. Дальнейшее деление этих жанров представлено в рамках предметной онтологии. Локальная жанровая система демонстрирует деление на жанры в национальной традиции, которая может существенно отличаться от универсальных жанров, аналогов которым может не найтись в конкретной традиции. Проблему интерференции жанров позволяет решить система жанровых признаков, которая делит фольклорные произведения на группы по таким параметрам, как нарративность (или повествовательность), достоверность или недостоверность, по их форме (прозаической или стихотворной) и т. п. Данная онтологическая модель характеризуется множественным наследованием. Благодаря множественному наследованию один и тот же ресурс может быть частью нескольких классов, а значит, иметь

несколько характеристик. Таким образом, каждый текстовый и мультимедийный ресурс на портале характеризуется пучком различительных жанровых признаков. Разработанная масштабируемая классификация объединяет даже противостоящие друг другу научные классификации, а также предоставляет исследователю многообразные поисковые средства. На рис. 2 показан фрагмент метаонтологии, посвященный жанрам.

) Жанр фольклора } Жанр хантыйского фольклора / Сказка

Active ontology * Entities « Annotation properties * Individuals by class * DL Query * Individual Hierarchy Tab Classes Object properties Data properties Annotation properties Datatypes Individuals

Annotation property hierarchy:

Class hierarchy: Сказка

щшш

▼ # ум • го

▼ ф Жанр фг.т.клорл

▼ О Жанр хантыйского фопккпора ▼ # Пенни

т • Ç Медвежья песня

# Песнн «пион Миш

Щ ГЮсня пгтних вепикаиов Мгнкгв

# Пнснн ЧМ1И1КИ

# 11есни смеха

О Песня, восхиаляющая медведя — # Par.f . кал

■а :. g

# Ун и вере <и 1 ьн ын Жан р фог 1ыи юра

— # Ь<1ЛЛ4Д<1

— ♦ II огон да

Ф Лирическая песня 1 Меморат

• Миф

• Предание 9 Сказка

I Словесная формула

• Эпос Жанровый признак

Вовлечение

Предназначенность для детей

• Тип достоверности Тип стиха

ф Форма

■ owl:backwardCompatibleWith

■ owl:deprecated

■ owl:incompatibleWith

■ owl:priorversion

■ owl:versionlnfo

■ rdfs:comment

■ rdfslsDefinetlBy

■ rdfslaQel

■ rdfs:seeAlso

= Сказка — http://www.semanticweb.Org/zagor/o

1 Annotations 1 Usage

I Annotations: Сказка 1

Annotations

rdfsilabel [language: ru]

Сказка

rdfs:label [language: en]

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Tale

rdfsilabel [language: kh]

Могыц

Рис. 2. Онтология жанров Fig. 2. Genre ontology

Многокомпонентному поиску служит онтологическое описание фольклорного произведения в контексте его бытования, которое тоже является частью метаонтологии. Обусловленность исполнения фольклорных произведений социальным контекстом можно считать универсальной. Некоторые жанры привязаны к определенным ритуалам. Ритуалы мы понимаем широко - как коммуникативные ситуации (или события), и относим к ним не только сакрализованные действия (обряды), имеющие отношение к какому-либо культу, но также любые коммуникативные акты, носящие типизированный повторяющийся характер (ср. микросоциологический подход [Collins, 2004]). Такое определение позволяет причислять к ритуалам, например, русские вечёрки - молодежные посиделки, которые характеризуются своим набором акторов (молодые девушки и парни), репертуаром (игры, хороводы, вечёрочные песни), временем (зимнее вечернее время), местом (так называемый «связной дом», который парни по очереди откупали у одного из жителей деревни). Ритуалом будут и детская игра, и хоровод, и вечерняя молитва, и жертвоприношение. Классификация ритуалов также представляет собой систему признаков, которая призвана охарактеризовать тот или иной фольклорный ресурс с точки зрения контекста его исполнения. Один и тот же ритуал может входить в разные классы, что свидетельствует о его сложной синкретичной природе. Например, в обряде Медвежьего праздника обских угров выявляются черты как хозяйственного обряда, так и обряда перехода. Модель CIDOC-CRM и ее основ-

ной концепт Event подходят для описания Ритуала, который также характеризуется набором ролей (Actor), временем (Time span) и местом (Place). Контекст исполнения фольклорного произведения служит одним из параметров для навигации в системе. Например, при наличии запроса пользователь может найти произведения, которые обусловлены временем проведения (календарные обряды), либо такие, которые исполняются во время определенного обряда, например свадьбы.

Онтология, которая используется для разметки внутри текстов, называется онтологией предметной области. Она позволяет описывать элементы текста, их свойства и отношения, выявленные в корпусе текстов исследователями. К понятиям, которые являются частью предметной онтологии и при помощи которых осуществляется навигация внутри текстов, относится система персонажей. Это один из критериев различения фольклорных жанров. Верхний уровень жанровой классификации, как правило, является содержательным. Жанры различаются по типу сюжетов, мотивов или по типу персонажей. Так различаются сказки в указателях, то же верно для исторических песен и других жанров. По типу персонажей, например, делятся исторические песни (ср. песни о стрелецком бунте). По типическим сюжетам различают, например, сказки (ср. сказки о трудных задачах). Однако онтология фольклорных персонажей была отнесена нами к предметной онтологии, а не к ветви «Жанр» в составе метаонтологии. Понятия метаонтологии характеризуют ресурс целиком. Персонажи - содержательная характеристика произведений. Отнесение системы персонажей к предметной онтологии позволяет выявлять типических персонажей в текстах и осуществлять поиск на основе этой разметки. Предметная онтология создается для выявления типических элементов в национальных текстах. Для представления персонажей фольклора также применяется несколько критериев, одним из которых является облик. Так различаются Люди, Боги и Животные. Сформирован тематический список, отражающий социальные роли персонажей (поп, царь, дурак, лесной великан, черт и т. п.). Поскольку поиск культурных универсалий - сквозная задача для разрабатываемых онто-логий, система персонажей дополнена такими общераспространенными ролями, как Трикстер, Культурный герой, Великая Мать и т. п., которые позволят сравнить разные национальные культуры.

Онтологии позволяют описать как внешнюю, так и внутреннюю сторону фольклорных произведений. Предложенные онтологии служат, с одной стороны, для систематизации фольклорных ресурсов, а с другой - используются для навигации как в системе, так и внутри текстов. Аннотирование текстов на основе онтологии позволяет выявить концептуальное пространство публикуемых произведений.

Перспективным является использование нескольких онтологий. Это позволяет избежать ряда проблем, которые возникают при наличии единой онтологии:

а) необходимость помечать в системе, какие сущности могут быть размечены, а какие нет (сущности метаонтологии, которые не могут участвовать в разметке текстов, необходимо как-то выделять);

б) при разделении на несколько языковых корпусов необходимо помечать, какие сущности могут быть размечены в заданном корпусе (если формально объединенные предметные области онтологий содержательно не пересекаются, нужно указывать, какие ветви онтологии можно использовать для заданного корпуса);

в) для разработчиков онтологии предметных областей, посвященных разным этническим традициям, наличие единой онтологии будет означать проблемы омо-

нимии при обозначении онтологических элементов, которые так или иначе могут дублироваться в разных ветках онтологии.

Таким образом, применение онтологий в фольклористике позволяет решать широкий спектр вопросов. Масштабируемые онтологические системы понятий особенно актуальны для фольклористики, где на сегодняшний момент разработано множество подходов и классификаций. «Настраиваемые» для конкретного ресурса системы понятий позволяют учесть большое количество точек зрения, включая противоположные, и максимально точно охарактеризовать фольклорный ресурс как в содержательном, так и в формальном отношении. Применение международных стандартов позволяет интегрировать разрабатываемые онтологии с другими аналогичными фольклорными ресурсами, что будет способствовать накоплению и систематизации данных по мировому фольклору.

Список литературы

Бадмаева Л. Д. Монголоязычные корпуса: современное состояние // Вестник Бурят. гос. ун-та. 2015. № 10. С. 148-152.

Вежбицкая А. Семантические универсалии и базисные концепты. М.: Языки славянских культур, 2011. 568 с.

Загорулько Ю. А. Подход к обеспечению многоязычного доступа к систематизированным знаниям и информационным ресурсам заданной предметной области // Изв. Том. политехн. ун-та. 2009. Т. 314, № 5. С. 161-165.

Карташов О. О., Бутакова М. А., Чернов А. В., Костюков А. В., Жарков Ю. И. Средства представления знаний и извлечения данных для интеллектуального анализа ситуаций // Инженерный вестник Дона. 2018. № 4 (51). 36 c. URL: http:// ivdon.ru/ru/magazine/archive/n4y2018/5421

Пропп В. Я. Принципы классификации фольклорных жанров // Сов. этнография. 1964. № 4. С. 34-45.

Серебренников Б. А., Кубрякова Е. С., Постовалова В. И. и др. Роль человеческого фактора в языке: Язык и картина мира. М.: Наука, 1988. 216 с.

Степанов Ю. С. Константы: Словарь русской культуры. М.: Языки славянских культур, 2007. 824 с.

Толстая С. М. Пространство слова. Лексическая семантика в общеславянской перспективе. М.: Индрик, 2008. 527 с.

Толстой Н. И. Язык и народная культура: Очерки по славянской мифологии и этнолингвистике. М.: Индрик, 1995. 262 с.

Топоров В. Н. К проблеме жанров в фольклоре // Материалы всесоюзного симпозиума по вторичным моделирующим системам I (5). Тарту, 1974. С. 3-16.

Тучкова Н. А. Корпусный метод в фольклористике и его возможности для этнографических исследований (опыт использования на селькупском фольклорном материале) // Томский журнал ЛИНГ и АНТР. 2018. Вып. 2 (20). С. 100-111.

Bascom W. The forms of folklore: Prose narratives // The Journal of American Folklore. 1965. Vol. 78. P. 3-20.

Collins R. Interaction Ritual Chains. Princeton & Oxford: Princeton University Press, 2004. 439 p.

Hyvönen Eero, Takala Joeli, Alm Olli, Ruotsalo Tuukka, Mäkelä Eetu. Semantic Kalevala - Accessing Cultural Content Through Semantically Annotated Stories // Proceedings of the Cultural Heritage on the Semantic Web Workshop at the 6th Interna-

tional Semantic Web Conference (ISWC-2007). Busan, Korea, Nov, 2007. URL: https://seco.cs.aalto.fi/publications/2007/hyvonen-et-al-kalevala-2007.pdf

Emadi M. From an encyclopedia of Iranian Folklore to an ontology of Iranian folklore. Master 's Thesis. Jyvaskyla, 2014. 79 p.

Gruber T. R. A Translation Approach to Portable Ontology Specification // Knowledge Acquisition. 1993. Vol. 5, iss. 2. P. 199-220.

Littleton C. S. A two-dimensional scheme for the classification of narratives // Journal of American Folklore. 1965. Vol. 78. P. 21-27.

Lord A. B. Composition by theme in Homer and South Slavic epos // Transactions and proceedings of the American philological association. 1951. Vol. 82. P. 71-80. DOI 10.2307/283421

Lord A. B. Homer as oral poet // Harvard Studies in Classical Philology. 1968. Vol. 72. P. 1-46. DOI 10.2307/311074

Luchev D., Paneva D., Rangochev K. Use of Knowledge Technologies for Presentation of Bulgarian Folklore Heritage Semantics // Information Technologies and Knowledge. 2008. Vol. 2. P. 307-313.

Musen M. A. Dimensions of knowledge sharing and reuse // Computers and Biomedical Research. 1992. Vol. 25. P. 435-467.

Parry M. Studies in the epic technique of oral verse-making: II. The Homeric language as the language of an oral poetry // Harvard Studies in Classical Philology. 1932. Iss. 43. P. 1-50.

Toporov V. N. Folk poetry: general problems // Current Trends of Linguistics. 1974. Vol. 12. P. 683-739.

Widmer A. Die poetischen Formeln der nordostjakischen Heldendichtung. Wiesbaden: Harrassiwitz Verz., 2000.

References

Badmaeva L. D. Mongoloyazychnye korpusa: sovremennoe sostoyanie [Corpora of the Mongolian Languages: Modern State]. VestnikBSU. 2015, no. 10, pp. 148-152.

Bascom W. The forms of folklore: Prose narratives. The Journal of American Folklore. 1965, vol. 78, pp. 3-20.

Collins R. Interaction Ritual Chains. Princeton & Oxford, Princeton University Press, 2004, 439 p.

Emadi M. From an encyclopedia of Iranian Folklore to an ontology of Iranian folklore. Master 's Thesis. Jyvaskyla, 2014, 79 p.

Gruber T. R. A Translation Approach to Portable Ontology Specification. Knowledge Acquisition. 1993, vol. 5, iss. 2, p. 199-220.

Hyvonen E., Takala J., Alm O., Ruotsalo T., Makela E. Semantic Kalevala - accessing cultural content through semantically annotated stories. Proceedings of the Cultural Heritage on the Semantic Web Workshop at the 6th International Semantic Web Conference (ISWC 2007), Busan, Korea, Nov, 2007. URL: https://seco.cs.aalto.fi/ publica-tions/2007/hyvonen-et-al-kalevala-2007.pdf

Kartashov O. O., Butakova M. A., Chernov A. V., Kostyukov A. V., Zharkov Yu. I. Sredstva predstavleniya znaniy i izvlecheniya dannykh dlya intellektual'nogo analiza situatsiy [Means of knowledge representation and data extraction for mining situations]. Engineering journal of Don. 2018, iss. 4 (51), 36 p. URL: http://ivdon.ru/ru/magazine/ archive/n4y2018/542

Littleton C. S. A two-dimensional scheme for the classification of narratives. Journal of American Folklore. 1965, vol. 78, pp. 21-27.

Lord A. B. Composition by theme in Homer and South Slavic epos. Transactions and proceedings of the American philological association. 1951. vol. 82, pp. 71-80. DOI 10.2307/283421

Lord A. B. Homer as oral poet. Harvard Studies in Classical Philology. 1968, vol. 72, pp. 1-46. DOI 10.2307/311074

Luchev D., Paneva D., Rangochev K. Use of Knowledge Technologies for Presentation of Bulgarian Folklore Heritage Semantics. Information Technologies and Knowledge. 2008, vol. 2, pp. 307-313.

Musen M. A. Dimensions of knowledge sharing and reuse. Computers and Biomedical Research. 1992, vol. 25, pp. 435-467.

Parry M. Studies in the epic technique of oral verse-making: II. The Homeric language as the language of an oral poetry. Harvard Studies in Classical Philology. 1932, iss. 43, pp. 1-50.

Propp V. Ya. Printsipy klassifikatsii fol'klornykh zhanrov [The Principles of Classifying Folklore Genres]. Sovetskaya etnografiya. 1964, no. 4, pp. 34-45.

Serebrennikov B. A., Kubryakova E. S., Postovalova V. I. et al. Rol' cheloveche-skogo faktora v yazyke: Yazyk i kartina mira [The role of the human factor in the language: Language picture of the world]. Moscow, Nauka, 1988, 216 p.

Stepanov Yu. S. Konstanty: Slovar' russkoy kul'tury [Dictionary of Russian culture]. Moscow, LRC Publishing House, 2007, 824 p.

Tolstoi N. I. Yazyk i narodnaya kul'tura: Ocherki po slavyanskoy mifologii i etno-lingvistike [Language and popular culture. Essays on Slavonic mythology and ethnolinguistics]. Moscow, Indrik, 1995, 262 p.

Tolstaya S. M. Prostranstvo slova. Leksicheskaya semantika v obshcheslavyanskoy perspektive [Extent of a word. Lexical semantics in the common Slavic perspective]. Moscow, Indrik, 2008, 527 p.

Toporov V. N. Folk poetry: general problems. Current Trends of Linguistics. T. Se-beok (Ed.). 1974, vol. 12, pp. 683-739.

Toporov V. N. K probleme zhanrov v fol'klore [To the problem of genres in folklore]. In: Materialy vsesoyuznogo simpoziuma po vtorichnym modeliruyushchim siste-mam I (5). [Proceedings of the All-Union Symposium on Secondary Modeling Systems I (5)]. Tartu, 1974, pp. 3-16.

Tuchkova N. A. Korpusnyi metod v fol'kloristike i ego vozmozhnosti dlya etnogra-ficheskikh issledovanii (opyt ispol'zovaniya na sel'kupskom fol'klornom materiale) [The corpus method in folkloristics and its potential for further ethnographic investigations (the experience in its application to the Selkup folklore materials)]. Tomsk Journal of Linguistics and Anthropology. 2018, vol. 2 (20), pp. 100-111.

Widmer A. Die poetischen Formeln der nordostjakischen Heldendichtung. Wiesbaden, Harrassiwitz Verz., 2000.

Wierzbicka A. Semanticheskie universalii i bazisnye koncepty [Semantic universals and basic concepts]. Moscow, LRC Publishing House, 2011, 568 p.

Zagorul'ko Yu. A. Podkhod k obespecheniyu mnogoyazychnogo dostupa k sistema-tizirovannym znaniyam i informatsionnym resursam zadannoi predmetnoi oblasti [An approach to providing multilingual access to systematized knowledge and information resources of a given subject area]. Bulletin of the Tomsk Polytechnic University. 2009, vol. 314, no. 5, pp. 161-165.

Сведения об авторе

Гриневич Анна Александровна - кандидат филологических наук, научный сотрудник сектора фольклора народов Сибири Института филологии СО РАН (Новосибирск, Россия) annazor@mail.ru ORCID 0000-0002-7607-8387

Information about the author

Anna A. Grinevich - Candidate of Philology, Researcher at the Department of Siberian Folklore, Institute of Philology of the Siberian Branch of Russian Academy of Sciences (Novosibirsk, Russian Federation) annazor@mail.ru ORCID 0000-0002-7607-8387

i Надоели баннеры? Вы всегда можете отключить рекламу.