Научная статья на тему 'Применение технологии извлечения знаний при обработке фольклорных ресурсов'

Применение технологии извлечения знаний при обработке фольклорных ресурсов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
67
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФОЛЬКЛОРНЫЕ РЕСУРСЫ / ИНТЕЛЛЕКТУАЛЬНАЯ ОБРАБОТКА / ХРАНИЛИЩА ДАННЫХ / DATA MINING / АССОЦИАТИВНЫЕ ПРАВИЛА / ПОКАЗАТЕЛЬ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кузьмина Э. В., Пьянкова Н. Г.

Рассматриваются возможности использования ассоциативных правил для интеллектуальной обра-ботки фольклорных ресурсов, организованных на основе технологии хранилищ данных (Data Mining). Обосновываются показатели достоверности и поддержки ассоциативного правила

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Применение технологии извлечения знаний при обработке фольклорных ресурсов»

УДК:398:001.891.34

Э. В. Кузьмина, Н. Г. Пьянкова Краснодарский филиал Финансового университета при Правительстве РФ,

Краснодар, Россия

ПРИМЕНЕНИЕ ТЕХНОЛОГИИ ИЗВЛЕЧЕНИЯ ЗНАНИЙ ПРИ ОБРАБОТКЕ ФОЛЬКЛОРНЫХ РЕСУРСОВ

Рассматриваются возможности использования ассоциативных правил для интеллектуальной обработки фольклорных ресурсов, организованных на основе технологии хранилищ данных (Data Mining). Обосновываются показатели достоверности и поддержки ассоциативного правила.

Ключевые слова: фольклорные ресурсы, интеллектуальная обработка, хранилища данных, Data Mining, ассоциативные правила, показатель.

E. V. Kuzmina, N. G. Pyankova Krasnodar Branch of

Financial University under the Government of the Russian Federation,

Krasnodar, Russia

THE APPLICATION OF KNOWLEDGE EXTRACTION TECHNOLOGY AT PROCESSING OF FOLKLORE RESOURCES

The possibilities of associative rules using for intellectual processing of folklore resources organized on the basis of Data Mining technology are considered. The indicators of reliability and support of the association rule are substantiated.

Keywords: folklore resources, intellectual processing, databases, Data Mining, association rules, indicator.

Современное состояние информационно-коммуникационных технологий и тенденции их развития в области интеллектуализации информационных систем и сервисов требует пересмотра подходов к обработке и представлению фольклорных ресурсов. Создание Web-ресурсов и аккумуляция на них цифровых коллекций фольклорных ресурсов, проявлений народного творчества требует их анализа и систематизации и определения подходов к организации с учетом возможности технологии извлечения знаний [4, с. 98].

Интеллектуализация современных Web-сервисов в настоящее время ограничена. Аналитические синтезаторы используются в основном глобальными поисковыми системами для определения предпочтений пользователей и таргетирования рекламных компаний.

С другой стороны в области информационно-коммуникационных технологий сформировались следующие направления интеллектуализации: поиск по ключевым словам, наличие меток, обратная связь, рубрикация, классификация, фильтры и сортировка [3, с. 62]. Данные направления затрагивают только интерфейсную часть Web-ресурса и не обеспечивают технологию построения интеллектуальной модели данных.

Развивающиеся в настоящее время технологии под общим названием Data Mining предлагают алгоритм для решения основных классов интеллектуальных задач: ассоциация, кластеризация, классификация и регрессия [2, с. 40].

Использование ассоциативных правил должно быть приоритетным при извлечении знаний из фольклорных ресурсов. Аффинитивный анализ позволяет исследовать взаимную связь между событиями, которые происходят совместно. Фольклорное творчество, как правило, представляет собой цепь исторических событий. Аффинитивный анализ позволяет обнаружить ассоциации между событиями на основе ассоциативных правил. Для фольклорных ресурсов ассоциативные правила могут применяться при решении следующих задач: выявления набора фольклорных событий, которые на фольклорных праздниках происходят совместно или никогда не пересекаются; определение доли участников фольклорных событий, которые присутствуют в модификации фольклорных действий; определение категории участников фольклорных событий; определение доли случаев «неудачных» фольклорных мероприятий.

Базовым понятием в теории ассоциативных правил является транзакция [1, с. 135]. При обработке фольклорной информации под транзакцией будем понимать последовательность событий происходящих совместно. Типичная транзакция - фольклорный праздник. В большинстве случаев культура региона предполагает прохождение некоторого количества фольклорных праздников, которая может называться фольклорной традицией. При этом ставится вопрос: является ли один фольклорный праздник следствием или причиной другого праздник. То есть необходимо установить: связаны ли данные события. Данную связь устанавливают ассоциативные правила.

Следующим понятием транзакции является предметный набор, который представляет собой непустое множество предметов, появившихся в одном действии [5, с. 67]. Анализ фольклорного праздника -это анализ набора фольклорных данных для определения комбинаций фольклорных элементов, связанных между собой. Фольклорным элементом может быть: фольклорная песня, фольклорный танец, фольклорная проза, поэзия и т. д. Иными словами производится поиск фольклорных элементов, присутствие которых в фольклорном празднике влияет на вероятность наличия других фольклорных элементов или их комбинации [7, с. 104].

Ассоциативное правило формируется в виде: если условие, то следствие. Условие может ограничиваться только одним фольклорным элементом (песня с конкретным текстом, танец с заданным перечнем элементов, конкретное фольклорное действие и т. д.).

Поддержка ассоциативного правила - это вероятность выполнения правила [6, с. 68]. Поддержкой ассоциативного правила для обработки фольклорных ресурсов является число фольклорных праздников, содержащих, как условие, так и следствие и может быть найдено по формуле (1).

. п/'л пА количество праздников,содержащих А и В .л Ь (Л D) — г(ЛПо] — --(1)

общее количество праздников

Достоверность ассоциативного правила А^ В представляет собой меру точности правила и рассчитывается, как отношение количества фольклорных праздников, содержащих и условие и следствие к количеству праздников, содержащих только условие (2).

d\ _ Р(А1ЯЛ ___ количество праздников,содержащих А и В (2)

Р(А) общее количество праздников,содержащих только А

Данные показатели интерпретируются следующим образом: высокие коэффициенты достоверности, стремящиеся к 1, позволяют с большой вероятностью утверждать, что любой будущий фольклорный праздник, включающий, заданное в формуле условие, будет содержать заданное следствие. Например, все наблюдения, содержащие песню с конкретными словами должны включать в себя конкретное фольклорное действие, что говорит о наличии интеллектуального фольклорного правила.

Рассмотренная методика ассоциативных правил обработки фольклорных ресурсов позволяет выявить все ассоциации, которые имеют высокие коэффициенты поддержки и достоверности. Данная методика предполагает анализ большого количества ассоциаций, что невозможно реализовать вручную. Программные инструменты Data Mining позволяют решать эту задачу, что влечёт перевод обработки фольклорных ресурсов на новый интеллектуальный уровень.

Список литературы

1. Кузьмина Э. В. Подходы к интеллектуализации web-ресурсов фольклорного творчества / Э. В. Кузьмина, Н. Г. Пьянкова, В. В. Салий // Культурная жизнь Юга России. - 2016. - № 2 (61). - С. 133137.

2. Кузьмина, Э. В. Использование технологий хранилищ данных для интеллектуализации фольклорных информационных ресурсов / Э. В. Кузьмина, Н. Г. Пьянкова // Информационные ресурсы России. - 2016. -№ 6. - С. 39-41.

3. Мальцева, Е. Ю. Применение информационных технологий при проведении социологического исследования [Электронный ресурс] / Е. Ю. Мальцева, Е. В. Молчанова // Концепт. - 2015. - № 2(февраль). -С. 61-65. - Режим доступа: http://e-koncept. ru/2015/15037. htm.

4. Молчанова, Е. В. Духовное здоровье общества: к постановке проблемы исследования / Е. В. Молчанова // Фундаментальные и прикладные направления модернизации современного общества: экономические, социальные, философские, политические, правовые, общенаучные аспекты : материалы между-нар. науч.-практ. конф. : в 4 ч / отв. ред. Н. Н. Понарина, С. С. Чернов. - Саратов : Академия управления, 2015. - С. 98-99.

5. Орлянская, Н. П. Реляционная аналитика запросов к базе данных в информационной системе учета работы автотранспорта средствами реляционной алгебры / Н. П. Орлянская, А. В. Нагоев // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. - 2006. -№ 23. - С. 66-70.

6. Пантелеева, М. А. Применение информационных технологий для развития бизнес-коммерции / М. А. Пантелеева, О. Б. Пантелеева // Актуальные проблемы экономической теории и практики : сб. науч. тр. / под ред. В. А. Сидорова. - Краснодар, 2015. - С. 67-75.

7. Салий, В. Применение формализованных методов аналитико-синтетической переработки информации в библиотечно-библиографической деятельности / В. В. Салий, Э. В. Кузьмина // Культурная жизнь юга России. Приложение. - Краснодар : Краснод. гос. ин-т культуры. - 2015. - № 1(1). - С. 102-105.

i Надоели баннеры? Вы всегда можете отключить рекламу.