Научная статья на тему 'Проблемно-ориентированный контент-анализ в структуре системы поддержки принятия решений (СППР)'

Проблемно-ориентированный контент-анализ в структуре системы поддержки принятия решений (СППР) Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
253
73
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОНТЕНТ-АНАЛИЗ / СППР / ОНТОЛОГИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Морозов А. А., Вьюн В. И., Кузьменко Г. Е.

Рассматривается один из подходов к обеспечению жизнеспособного развития СППР на основе использования интерактивных методов интеллектуального анализа прошлой деятельности объединения . Соответствующий набор механизмов и инструментов, расширяющих интеллектуальные способности традиционной СППР, предлагается рассматривать как проблемно-ориентированный контент-анализ истории деятельности объединения

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

It is discussed one from approaches for providing viable development. SSMD on the base of using interactive methods of intelligent analysis of data of the past activity . The corresponding set of mechanisms and instruments that broaden intelligent ability of the traditional SSMD is proposed to consider as problem-oriented content analysis of history activity of association

Текст научной работы на тему «Проблемно-ориентированный контент-анализ в структуре системы поддержки принятия решений (СППР)»

^ "________НОВІ інформаційні і телекомунікаційні технології

УДК 004.318

А.А. МОРОЗОВ, В.И. ВЬЮН, Г.Е. КУЗЬМЕНКО

ПРОБЛЕМНО-ОРИЕНТИРОВАННЫЙ КОНТЕНТ-АНАЛИЗ В СТРУКТУРЕ СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ (СППР)

Abstract: It is discussed one from approaches for providing viable development. SSMD on the base of using interactive methods of intelligent analysis of data of the past activity <SSMD+Object>. The corresponding set of mechanisms and instruments that broaden intelligent ability of the traditional SSMD is proposed to consider as problem-oriented content analysis of “history” activity of association.

Key words: content-analysis, SSMD, ontology.

Анотація: Розглядається один із підходів щодо забезпечення життєздатного розвитку СППР на основі використання інтерактивних методів інтелектуального аналізу даних минулої діяльності об'єднання <СППР+ОБ’ЄКТ>. Відповідний набір механізмів та інструментів, що розширяють “інтелектуальні” здібності традиційної СППР, пропонується розглядати як проблемно-орієнтований контент-аналіз “історії” діяльності об'єднання.

Ключові слова: контент-аналіз, СППР, онтологія.

Аннотация: Рассматривается один из подходов к обеспечению жизнеспособного развития СППР на основе использования интерактивных методов интеллектуального анализа прошлой деятельности объединения <СППР+ОБЪЕКТ>. Соответствующий набор механизмов и инструментов, расширяющих “интеллектуальные” способности традиционной СППР, предлагается рассматривать как проблемноориентированный контент-анализ “истории” деятельности объединения.

Ключевые слова: контент-анализ, СППР, онтология.

1. Введение

Одним из аспектов искусственного интеллекта является то, что это самообучающийся инструмент, усиливающий мыслительную деятельность человека по генерации и принятию решений [1]. Исходя из этого, повышение уровня интеллекта системы поддержки принятия решений (СППР) можно рассматривать как экспериментальную научную дисциплину, в которой роль эксперимента выполняет “история” фактической деятельности системы как информационная платформа процессов самообучения и саморазвития.

В этом плане под интеллектуализацией СППР будем понимать расширение традиционной структурно-функциональной организации (базовой) СППР проблемно-ориентированными механизмами и инструментами содержательного анализа результатов фактической деятельности объединения <СППР+ОБЪЕКТ> по сценарию {вчера/сегодня ^ сегодня/завтра}.

Цель анализа - выявление тенденций и неизвестных ранее закономерностей функционирования <СППР+ОБЪЕКТ> для формирования, а при необходимости и упреждающего внесения релевантных изменений в структурно-функциональную организацию базовой СППР.

В работах [2 - 4] были предложены системотехнические механизмы поддержки анализа результатов деятельности <СППР+ОБЪЕКТ> на базе Хранилища Данных (ХрД). В данной работе предлагается рассмотреть содержательные аспекты операций и процедур динамического ведения ХрД как “истории” функционирования объединения.

© Морозов А.А., Вьюн В.И., Кузьменко Г.Е., 2009

ІБвИ 1028-9763. Математичні машини і системи, 2009, № 3

2. Постановка задачи

2.1. Одинаковое (аналитиком и системой) восприятие результатов деятельности, поступающих в ХрД, в определенной степени достигается заданием открытого множества ключевых параметров-показателей (КПП) деятельности <СППР+ОБЪЕКТ>, однозначная интерпретация которых обеспечивается на базе априорной онтологии [5] <СППР+ОБЪЕКТ> и КПП.

В данном случае под заданием КПП мы имеем в виду представление профессиональных знаний и навыков специалистов аналитических служб ОБЪЕКТА в операциях содержательной обработки оперативных данных его деятельности.

Эти представления и определяют начальную, или априорную, онтологию <СППР+ОБЪЕКТ>. Оценка результатов содержательного анализа входного потока оперативных данных деятельности на платформе априорной онтологии является для аналитика источником возможных идей и гипотез по обоснованию необходимости ее модернизации или построения более релевантной текущим условиям и требованиям к функционированию СППР&ОБЪЕКТ апостериорной модели онтологии.

Отметим, что именно итерационный процесс модернизации/адаптации моделей онтологии и является объективным отражением процесса эволюционного развития “интеллекта” <СППР+ОБЪЕКТ>.

2.2. Почему могут не выполняться принятые решения? Что такое “правильные” решения и почему со временем меняются критерии “правильности”? Как такие изменения отражаются на функциональной структуре базовой СППР?

Так как результаты текущего функционирования объединения оценивает человек, то всегда будет возникать проблема адекватной их интерпретации, а, значит, факты несоответствия ожидаемому будут проявляться вновь и вновь [6].

Имеет ли право аналитик, обнаруживший определенную закономерность в проявлении несоответствия и несогласованности фактических и ожидаемых значений КПП по результатам наблюдения за деятельностью <СППР+ОБЪЕКТ>, безапелляционно квалифицировать их как ошибки в работе базовой СППР? По нашему мнению, интерпретацию подобных событий типа - это проявление ранее неизвестной семантической и/или логической не следует игнорировать. Связанная с ней возможность осознания необходимости уточняющих изменений в модели онтологии и технологических процессах функционирования делает систему более жизнеспособной.

Естественно, с целью избежать возможного “эффекта маятника” при внесении изменений в структурно-функциональную организацию <СППР+ОБЪЕКТ> следует учитывать следующее: реализации подлежат лишь изменения, полученные на основе длительного анализа и тестирования устойчивости новых зависимостей между КПП онтологических моделей объединения.

Онтологии и онтологическое моделирование в настоящее время представляют весьма популярное, быстро развивающееся (и вширь, и вглубь) научно-техническое направление системных исследований конкретных динамически развивающихся объектов.

Будем считать, что онтология <СППР+ОБЪЕКТ> задает внешнюю аппроксимацию (“горизонты” основных аспектов существования - цель, назначение, ресурсные атрибуты (материальные и нематериальные) деятельности, их взаимоотношения и взаимодействия и др.)

представления предметной области (ПрО) [5]. Как всегда, практика опережает теоретическое осмысление проблемы. Границы и градации используемых понятий со временем оказываются размытыми, и в какой-то момент участники процесса начинают испытывать потребность в том, чтобы переопределить концептуальные рамки проекта.

2.3. Структура входного потока атрибутов {ОБД^ХрД} является неоднородной совокупностью информационных объектов. Это записи реляционных БД, текстовые файлы и сообщения (включая внешние источники), графики и таблицы, документы и т.п. Вследствие этого, предлагается пользоваться более широким пониманием термина контент-анализ, определяя его как проблемноориентированный процесс на добывание (data mining) новых знаний.

В данной работе термин контент-анализ охватывает все типы содержательной обработки информационных объектов входного потока, включая всевозможные семантические зависимости и отношения между ними типа подобных по структуре поведения, имеют одинаковое содержание и т.п. В этом контексте расширение базовой СППР непосредственно зависит от операционного обеспечения процессов проблемно-ориентированого контент-анализа (ПОКАН) с применением онтологических описаний <СППР+ОБЪЕКТ> и КПП.

3. Базисные технологии ПОКАН

Схема взаимодействия всех компонент процесса повышения

уровня интеллекта СППР &ОБЪЕКТ на основе

содержательного анализа

результатов его фактической деятельности представлена на рис. 1.

Рассмотрим функции блока ПОКАН, который выполняет посредническое или пороговое

взаимодействие базовой СППР и ее интеллектуального расширения на платформе ХрД.

С нашей точки зрения, для порогового взаимодействия

важным моментом является

фиксация текущих значений

составляющих КПП атрибутов

(оперативных данных деятельности) в виде многомерного вектора-выборки из множества X(V) атрибутов ОБЪЕКТА, распределенного по некоторой совокупности оперативных баз данных (ОБД) базовой СППР. Векторы-выборки отображают текущие значения КПП, которые должны быть доступными для модулей последующих контент-операций. Таким образом, исполнительные

Рис. 1. Схема взаимодействия компонент процесса интеллектуализации СППР на основе ПОКАН

подсистемы СППР заканчивают очередной этап выполнения принятых решений - формирование совокупности зафиксированных V-значений атрибутов X(V), которые и рассматриваются как входной поток порогового взаимодействия {ОБД=>ХрД}.

В работах [5, 6] определены основные контент-операции обработки входного потока данных от ОБД для размещения их в специлизированное ХрД. Это операции извлечения, согласования, консолидации атрибутов X (V), формирование временных рядов КПП.

Входной поток оперативных данных для ПОКАН является потоком копий текущих значений атрибутов X (V). Начальная операция контент-анализа - извлечение оперативных данных из ОБД -поддерживается интерфейсными модулями блока, адаптированными к оболочкам ОБД и действующей модели онтологии <СППР+ОБЪЕКТ>. Последующие контент-операции будем рассматривать как “разворачивание панорамы” целостного представления СППР&ОБЪЕКТ в виде многомерного отображения V-вектора атрибутов X(V) = {а(V) | I = 1,2,..М}, где М - общее

количество атрибутов.

К ним относятся следующие операции:

• выборки атрибутов и формирование на данный момент времени текущих значений многомерного пространства {КППу | у = 1,2,...,к} как подмножеств Xj(V)е X(V) в виде

временного ряда (ВР) XJ (V ) = {я/(^ )| / = 1,2,... ту.; 5 = 1,2,..., п}. Отметим, что некоторые

атрибуты могут входить в состав нескольких КПП и, следовательно, т1 + т2 +.... + тк > М;

• сглаживание рядов X у (^) с целью устранения случайных всплесков значений, а также

временного согласования полученных данных, заполняя “пропуски” интерполяционными значениями;

• выявление поведенческих характеристик поведения ВР:

• тренд - отклонения значений ai(t) сглаженного ряда от исходного значения ai(t) на

данном временном интервале. Формально представляется в виде трендовых кривых, обычно линейных или нелинейных. Используется в прогнозных оценках “сегодня/завтра”;

• поворотные точки - точки локальных экстремумов типа ( а1_1 < ai > ai+1} и

(а1_1 > ai < аi+1}. Используются в оценках “подобия” поведения ВР атрибутов и КПП;

• фазы ВР (интервалы монотонности) - отрезки ряда между двумя поворотными точками;

• формирование Витрин Данных информационного отображения конкретного КПЦ в составе ХрД;

• завершение операций порогового взаимодействия - прогнозирование “сегодня-завтра”, выявление неизвестных ранее тенденций, закономерностей и взаимозависимостей в поведении КПП “вчера-сегодня” - выполняется совместно с аналитиком в процессах интерактивного взаимодействия, инициируемых как аналитиком, так и системой ведения ХрД по результатам “знакомства с последними поступлениями” входного потока.

4. Пример

Рассмотрим предложенную технологию ПОКАН на примере.

- перечень атрибутов состояния ОБЪЕКТА -

X(1 ) = а(1) | / = 1,2,...10};

- описание КПП ОБЪЕКТА (табл. 1);

- описание отношений и зависимостей между КПП:

X,(( )П Х,(1) = X,(/),

х2_{1) П х б(!) = {а9}.

Рис. 2. Онтология ОБЪЕКТА Таблица 1. Описание КПП объекта

х¡ Атрибуты т]

х, {а,} 1

X 2 '"а Ъ ■Ь. 2 Ъ 00 2 Ъ Ю 2 4

X 3 \а 3, Ъ} 1- 3’ 1 > 2

X 4 К-<> а,4о I 3

X 5 {а6} 1

X 6 {аб, аб, а6]} 1 7 5 5 ’ 10 J 3

2) Хранилище данных (табл. 2).

Таблица 2. Отображение п -регистраций совокупности 1 -значений атрибутов

ъ а2 (^1 ) аз (^1 ) а4 (^1 ) а5 (^1 ) аб (¿1 ) а7 (^1 ) а8 (^1 ) ъ о

а1 (*2 ) а2 (*1 ) а3 (^2 ) а4 (^2 ) а5 (^2 ) аб (^2 ) а7 (^2 ) а8 (^2 ) а9 (^2 ) а10 ^ 2 )

£ а2 (1п ) а3 (1п ) а4 (1п ) а5 (1п ) аб (^п ) а7 (1п ) а8 (^п ) а9 (1п ) а10 (1п )

3) Формирование атрибутного состава, например, {Х3} как витрины ХрД. Таблица 3. Атрибутный состав {Х3}

Атрибут а3 (сглаженный ряд) Тренд (лин./ нелин.) Поворот. точки (аКФ) Фаза моно- тон. [к, Ч ] Атрибут а1 (сглажен. ряд) Поворот. точки (аКФ) Фаза монотон. к, ¿1 ] Тренд (лин./ нелин.)

а3 (^1 ) а3 ^) [¿1,] а1 (11)

а3 (^2 ) л а1 (12 ) — 1п ] л

нл

а3 (1п ) а1 (1п )

1) Онтология ОБЪЕКТА (рис. 2):

Анализ примера.

Приведенный фрагмент работы ПОКАН по обработке данных входного потока отражает работу

интеллектуальных модулей по формированию ХрД и витрины ХрД для КПП Х3 на платформе

действующей онтологии ОБЪЕКТА (рис. 2).

Практическую пользу, которую представляют полученные результаты, сформулируем в виде следующих методологических положений [7], определяющих сущность практического интеллекта (умение адаптироваться к окружающей обстановке, добиваясь поставленных целей) ПОКАН:

- формирование Витрин ХрД по отображению реального состояния КПП (Х1 - X6);

- обеспечение более полного восприятия аналитиком характеристик реального поведения объединения в изменяющихся условиях внешней среды;

- разработка альтернативных направлений адаптации системы к новым условиям;

- формирование релевантных к новым условиям существования изменений в онтологической модели <СППР+ОБЪЕКТ> и КПП.

Отметим также, что в примере не отражены результаты контент-операций, связанных с выявлением неизвестных ранее зависимостей между КПП, или их взаимовлияние, которые несомненно обогащают “аналитические размышления”.

Вместе с этим аналитикам должна быть предоставлена возможность непосредственного доступа к ХрД.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Выводы

В работе введено понятие проблемно-ориентированного контент-анализа (ПОКАН) как процесса, направленного на добывание новых знаний из фактов реальной деятельности объединения <СППР+ОБЪЕКТ>. Сформулированы методические положения реализации блока ПОКАН на базе онтологической модели объединения.

Предложен общесистемный набор контент-операций поддержки порогового взаимодействия “базовая СППР система формирования ХрД”.

По нашему мнению, этот подход обеспечивает создание активной информационной платформы для “аналитических размышлений” экспертов-аналитиков над проблемами деятельности и, при необходимости, разработки предложений по изменениям в структурнофункциональной организации <СППР+ОБЪЕКТ>.

“Базовый хребет” предложения определяется простым и понятным условием - онтология любого объединения <ИС+ОБЪЕКТ> (не только СППР) должна иметь внутреннюю

функциональность, основу которой составляют модули контент-операций целостного представления объединения.

СПИСОК ЛИТЕРАТУРЫ

1. Шемакин Ю.И. Системантика: (Монография). - М.: Изд-во РАГС, 2006. - 266 с.

2. В'юн В.І., Кузьменко Г.Є. Інтелектуалізація ІС: від інформаційно-пошукових тезаурусів до онтологічних схем змістовного аналізу результатів діяльності системи // Доклады ІХ междунар. научн. конф. им. Т.А. Таран “Интеллектуальный анализ данных” ИАИ-2009. - Киев, 2009. - 19-22 мая. - С. 68 - 72.

3. Морозов А.О., В'юн В.І., Кузьменко Г.Є. Інтелектуалізація інформаційних систем: орієнтація на формування знань в процесах аналізу “інформаційних згорток” // Математичні машини та системи. - 2005. - № 2. - С. 140 -146.

4. Асельдеров З.М., В'юн В.І., Морозов А.О. Континуум розумності інформаційних систем // Матеріали конф. «Искусственный интеллект». - Донецьк, Кацивелі, 2004. - Т. 2. - С. 167 - 168.

5. Артемьева И.Л., Гаврилова Т.Л., Клещев А.С. Модели предметной области с атомарными объектами // НТИ. - 2004. - № 12. - С. 8 - 17.

6. Балабанов А.С. Выделение знаний из баз данных - передовые компьютерные технологии интеллектуального анализа данных // Математичні машини і системи. - 2001. - № 1-2. - С. 40 - 54.

7. Мейтус В.Ю. Программирование и интеллект // Проблемы программирования. - 2009. - № 1. - С. 17 - 26.

Стаття надійшла до редакції 18.03.2009

i Надоели баннеры? Вы всегда можете отключить рекламу.