Научная статья на тему 'Інтелектуалізація інформаційних систем: орієнтація на формування знань в процесах аналізу “інформаційних згорток”'

Інтелектуалізація інформаційних систем: орієнтація на формування знань в процесах аналізу “інформаційних згорток” Текст научной статьи по специальности «Экономика и бизнес»

CC BY
288
48
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
INTERACTIVITY “USER-SYSTEM” / ИНТЕЛЛЕКТУАЛИЗАЦИЯ / ИНФОРМАЦИОННАЯ СИСТЕМА / ИНТЕРАКТИВНОЕ ВЗАИМОДЕЙСТВИЕ / ХРАНИЛИЩЕ ДАННЫХ / РЕИНЖИНИРИНГ / ИНФОРМАЦИОННАЯ СВЕРТКА / INTELLECTUALIZATION / REENGINEERING / DATA STORAGE / INFORMATION SYSTEM / INFORMATION ROLLINGS

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Морозов А. О., В’юн В. І., Кузьменко Г. Є.

В работе рассматривается один из аспектов интеллектуализации, связанный со способностью системы анализировать прошлую деятельность в режимах интерактивного взаимодействия “ пользователь-система ”, определять причины и тенденции развития потенциальных угроз жизнеспособности системы, разрабатывать предложения по частичной или полной ее реорганизации (реинжиниринг). Информационная поддержка этих процессов обеспечивается независимыми от профильной деятельности операциями и процедурами формирования истории деятельности в виде Хранилища данных (ХрД) информационных сверток. На основе анализа записей ХрД предлагаются возможные схемы индуктивного обобщения и формирования новых функциональных зависимостей между параметрами-показателями как необходимых этапов подготовки и планирования реинжиниринга.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

In the paper one of the aspects of Intellectualization connected with ability of the system to analyze the past activity in the re п imes of the interactivity “user-system” to define causes and tendencies of the development of the potential threats of the vital activity, to develop offers on partial or full reorganization (reengineering). Information support of these processes is provided by independent on profile activity operations and procedures of forming“history of activity in the form of Data Storage (DS) of information rollings. On the bases of the analysis DS the possible schemes of the inductive conclusion, forming new functional dependences between parameters-indices are proposed as necessary stage of preparing and planning of reengineering.

Текст научной работы на тему «Інтелектуалізація інформаційних систем: орієнтація на формування знань в процесах аналізу “інформаційних згорток”»

УДК 681.3.00:007

А.О. МОРОЗОВ, В.І. В’ЮН, Г.Є. КУЗЬМЕНКО

ІНТЕЛЕКТУАЛІЗАЦІЯ ІНФОРМАЦІЙНИХ СИСТЕМ: ОРІЄНТАЦІЯ НА

ФОРМУВАННЯ ЗНАНЬ В ПРОЦЕСАХ АНАЛІЗУ “ІНФОРМАЦІЙНИХ ЗГОРТОК”

Abstract: In the paper one of the aspects of Intellectualization connected with ability of the system to analyze the past activity in the reпimes of the interactivity “user-system” to define causes and tendencies of the development of the potential threats of the vital activity, to develop offers on partial or full reorganization (reengineering). Information support of these processes is provided by independent on profile activity operations and procedures of forming“history of activity in the form of Data Storage (DS) of information rollings. On the bases of the analysis DS the possible schemes of the inductive conclusion, forming new functional dependences between parameters-indices are proposed as necessary stage of preparing and planning of reengineering.

Key words: intellectualization, interactivity “user-system”, reengineering, Data Storage, information system, information rollings.

Анотація: В роботі розглядається один з аспектів інтелектуалізації, пов'язаний із здатністю системи аналізувати минулу діяльність у режимах інтерактивної взаємодії “користувач-система”, виявляти причини та тенденції розвитку потенційних загроз життєздатності системи, розробляти заходи щодо часткової або повної її реорганізації (реінжиніринг). Інформаційна підтримка цих процесів забезпечується незалежними від профільної діяльності операціями і процедурами формування історії діяльності системи у вигляді Сховища даних (СхД) інформаційних згорток. На базі аналізу записів СхД пропонуються можливі схеми індуктивного узагальнення та формування нових функціональних залежностей між параметрами-показниками як необхідних етапів підготовки та планування реінжинірингу.

Ключові слова: інтелектуалізація, інформаційна система, інтерактивна взаємодія, реінжиніринг, Сховище даних, інформаційна згортка.

Аннотация: В работе рассматривается один из аспектов интеллектуализации, связанный со способностью системы анализировать прошлую деятельность в режимах интерактивного взаимодействия “пользователь-система”, определять причины и тенденции развития потенциальных угроз жизнеспособности системы, разрабатывать предложения по частичной или полной ее реорганизации (реинжиниринг). Информационная поддержка этих процессов обеспечивается независимыми от профильной деятельности операциями и процедурами формирования истории деятельности в виде Хранилища данных (ХрД) информационных сверток. На основе анализа записей ХрД предлагаются возможные схемы индуктивного обобщения и формирования новых функциональных зависимостей между параметрами-показателями как необходимых этапов подготовки и планирования реинжиниринга.

Ключевые слова: интеллектуализация, информационная система, интерактивное взаимодействие, Хранилище данных, реинжиниринг, информационная свертка.

1. Вступ

Однією з ознак інтелектуальності інформаційної системи (ІС) є її здатність адаптуватися до змін як внутрішніх, так і зовнішніх умов та вимог до результатів діяльності. У роботах [1-3] були окреслені системотвірні механізми та інструментарій відповідного, інтелектуалізуючого систему оснащення ІС. До них відносяться: Сховище даних (СхД) або просторово-часова база впорядкованої сукупності “інформаційних згорток” [4], що характеризують стан системи у вигляді проблемно-орієнтованих груп параметрів-показників, які тематично зв'язані, Olap (онлайнові аналітичні) та ІАД (інтелектуального аналізу даних) - технології.

У даній роботі ми зупинимося на методичних та технологічних засадах формування нових знань та вмінь системи (складових її “континууму розумності” [3]) з використанням схем інтерактивного ситуативного аналізу та індуктивного виводу (узагальнення) на платформі СхД.

2. Постановка проблеми

Необхідність у новій методології та інструментах обумовлена наявністю ряду важливих, але нерозв'язаних на засадах традиційних підходів до організації інформаційних систем (ІС) з

використанням комп'ютерної підтримки діяльності задач [5]. Перш за все, це задачі самоорганізації та адаптації системи до швидкоплинних змін в умовах існування, які визначають нові вимоги до результатів діяльності, нові відносно часу формування та впровадження ІС.

У даному контексті проблемою є надання системі здатності до людино-машинної самоорганізації й адаптації, маючи на увазі включення в її функціонально-організаційну структуру “розумних” механізмів та інструментів, які в інтерактивних процесах ситуативного аналізу діяльності спираються на засади, що допускають можливість часткової або повної реорганізації системи в порівнянні “з першими днями” її експлуатації. Надання ІС таких можливостей забезпечує далекоглядні її переваги, пов'язані саме з наявністю засобів самонавчання, самоорганізації та реорганізації (реінжинірингу).

Процес накопичення знань протягом багатьох століть, включаючи останні 50 років, коли почали говорити про накопичення знань комп'ютерами, підтримувався з використанням схем дедуктивного аналізу та умовиводу, що базувалися на логічно зв'язаній послідовності операцій, які, у свою чергу, визначались вже здобутими знаннями: скінченною множиною сформованих апріорі та виведених у процесі розробки системи аксіом аналізу та правил виводу. Оскільки логічні початки та наслідки дедуктивних систем - це множина лише істинних тверджень, то, по суті, такі схеми прийняття рішень були логічно неповними. Більш того, процес розширення системи додатковою кількістю нових аксіом, залишаючись на базі логіки дедуктивного виводу, не збільшує її логічної повноти, оскільки потужність множини правдоподібних (можливих) умовиводів від цього розширення аксіом не зменшується. Отже збільшення діапазону вірогідності рішень за рахунок правдоподібних умовиводів можливе лише на платформі використання систем індуктивного узагальнення. Виходячи з того, що “істина” одна, а “не зовсім істин” багато, Розробник ІС при формуванні орієнтованого на аналіз діяльності СхД змушений вибирати певну базову модель підтримки та забезпечення правдоподібних умовиводів. Задача, яка при цьому розв'язується, це - “вибрати адекватну ПрО модель, що забезпечує необхідну вірогідність виводу”. Найбільш широкий огляд існуючих моделей приводиться в [6].

Отже, процес аналізу результатів діяльності нетрадиційної ІС пропонується розглядати як паралельний процесу функціонування системи процес неперервного, інтерактивного, ситуативного аналізу результатів та проблемних ситуацій минулої діяльності, тенденцій їх розвитку, формування та прийняття на цій основі запобіжних заходів стосовно адаптації та самоорганізації системи в цілому.

Основними етапами цього процесу є:

- безпосереднє сприйняття проблемних ситуацій (подій, явищ);

- співставлення фактографічного опису їх характеристичних показників з існуючими знаннями про предметну область. Цей етап може розглядатися як етап ’’розуміння” проблемної ситуації, що склалася. При цьому можуть бути сформовані декілька уточнюючих описів (тобто, має місце певна неоднозначність розуміння), можуть пропонуватися варіанти змін та доповнень до функціонально-організаційної структури, а також пропозиції стосовно розширення бази знань;

- планування відповідних операцій реінжинірингу, аналіз та тестування на базі фактографічних записів СхД можливих наслідків;

- вибір цілеспрямованої послідовності операцій, яка найкраще узгоджується з метою реорганізації і забезпечує достатній рівень життєздатності ІС.

Відмітимо, що сьогоднішнє успішне застосування ІС тісно пов'язане з задачами, в яких чітко визначені й формалізовані критерії оптимізації та обмежень впливу оточуючого середовища. Але разом з цим існує досить широкий пласт проблем-задач, в яких не завжди вдається апріорі перерахувати всі як внутрішні, так і зовнішні фактори впливу, тому, що цьому заважає множина об'єктивно протирічних критеріїв, які повинні бути врахованими і які в той же час не можуть одночасно задовольнятися.

До розширення функціонального наповнення ІС, яке повинно скласти операційну базу саморозвитку та проблемної (об'єктної) орієнтації методів аналізу життєздатності системи в цілому, повинні належати механізми і інструментарій, які реалізують:

- ідентифікацію проблемної ситуації (ПрС) або початкові кроки її розуміння (визначення причин та факту виникнення, тенденцій розвитку, формування додаткових задач, які потребують розв'язку);

- використання системи не тільки для фіксації та відображення ПрС, а й для проектування та реалізації засобів підтримки, подальшої ефективної діяльності;

- опис (планування) послідовності операцій стосовно адаптації та самоорганізації системи з урахуванням таких методичних засад: “гасіння пожеж" - це процеси, якими можна керувати та планувати; “ігнорування дрібниць", не звертаючи увагу на те, що “компанії гублять дрібниці”; “штопання дірок" - з'їдає ресурси, час, але не взмозі розв'язати проблеми адаптації; “неперервні зміни" - стиль життя організації; “тління" - пульс організації, тому не зупиняйте його.

Інформаційна підтримка цих процесів забезпечується операціями вилучення поточних (узгоджених в часі) значень певних сукупностей оперативних атрибутів (а, Ь, с,...), що

характеризують стан системи

формуванням тематично або предметно-

стан

системи

▼Час

Примітка:

1. Лн - в більш вузькому розумінні, певна

У

функціональна залежність від атрибутів

(аі, Ь, сі,...) або

Рис. 1. Сховище даних

2. Деякі атрибути можуть входити в різні інформаційні згортки, тобто для незалежних Лк і Лі перетин використаних для їх ідентифікації атрибутів

A n A.

Кожному з елементів Aj відповідає домен \_Лц-e.Aj +є\. З урахуванням цього будемо говорити, що стовпчик At матриці (рис. 1) складається з рівних з точністю e значень An, Ai2,..., An1. Вихід одного із значень за межі e-інтервалу підключає в підсистемі, яка “веде” цей

показник, механізми регулювання. Для аналізу життєздатності системи інтерес представляють ті показники, які у зв'язку зі змінами в умовах існування не регулюються існуючими механізмами, що і потребує їх реорганізацій'. Крім того, СхД може зберігати факти, які не були відомі Розробникам системи. Наприклад, факт існування прихованої залежності пари інформаційних згорток Ak та At,

не зважаючи на їх різну тематичну спрямованість. Виявлення таких фактів може стимулювати роботи стосовно більш масштабної реорганізації, пов'язаної, наприклад, з перерозподілом функцій між підсистемами і та ін.

І в першому, і у другому випадках “ідеї реорганізації” підказує аналіз поведінки [At} або

аналіз часових рядів {A} - стовпчиків матриці “ tj - зріз СхД”. Їх розкопки (data mining) у процесах

“роздумів” над записами СхД дозволяють аналітику виявити факти - моменти істини як не відомі раніше причини або закономірності, яким вони підпорядковуються.

Представимо схему роздумів аналітика в умовах моменту істини у вигляді такої послідовності міркувань:

а) спостерігається ланцюжок минулих явищ та подій діяльності системи або часовий ряд інформаційних згорток {At} і відповідних часових рядів базових атрибутів (an2,bn2,cn2,...);

в) звертається увага на певні сталі характеристики (інваріанти) явищ або значень показників;

c) висувається апріорна гіпотеза про наявність таких же інваріантів у всіх подібних випадках і встановлюється прототип функціональної залежності між відповідними показниками;

d) на цій основі формуються (модифікуються існуючі) та тестуються на накопиченому фактичному в СхД матеріалі [7, 8] нові правила виводу та узагальнення даних діяльності з метою використання їх у подальших прогнозних та управляючих процесах.

Отже, вся інформація, яка необхідна для процедури розкопок At (tj), представлена в

неявному виді в сукупності m - спостережень. Ключовим моментом обґрунтування процесу індуктивного виводу є структура навчальної вибірки та її імовірнісні розподіли.

Засади індуктивного виводу та пошуку нових функціональних залежностей

СхД (у більш широкому розумінні, просторово-часовий образ ІС) - множина інформаційних згорток A (tj), які можуть належати певному класу проблемних ситуацій Х.

З використанням типових схем індуктивного узагальнення [8]: (1) подібності, (2) відміни, (3) залишки в табл. 1 представлені приклади логіки можливих індуктивних висновків за результатами аналізу записів СхД.

№ з/п Вхідні дані спостережень Індуктивне узагальнення

1 {а, Ь, с}с Ах Для всіх А з властивостями а £ Лі ®{Лі }с X Примітка: значення п не визначає “точності” виводу. Інтуїтивно відчувається, що п повинно бути великим

{а,е,ё}е А2

{а, /, £}£ А3

{а ^ 7}с А„

2 {а, Ь, с}с Ах а £ Лк ®{Лк}£ х (і < к < п) (інформаційні згортки без властивостей Ь і с не належать класу Х)

{а, е,ё}с Ак

-{b, с}с Ак_ ® Ак_і Ё X

3 {а, Ь.с} е Ах ® Ах с Хх п X2 п Х3 с £ Лі ®{Лі }£ Х3

{а}£ А2 ® А2 с Х2

{Ь}с А3 ® А3 с Х3

Для визначення виду (з певною мірою вірогідності /и(ґ) функціональної залежності аналізуються на “схожість поведінки” часові ряди Ак (ґ) та Аі (ґ) або їх відповідні похідні (перші,

другі різниці). Для оцінки “схожості” пропонується багатоетапна процедура, на кожному з етапів якої виконується оцінка певних характеристик поведінки часових рядів.

Як приклад розглянемо наступні етапи аналізу емпіричних даних спостережень:

- виявлення тенденцій або тренду поточного середнього та дисперсії рядів, пов'язаних з

аналізом Ак (ґ) та Аі (ґ). Якщо один з них є з виявленим трендом, а другий - ні, робиться висновок

про “несхожість їх поведінки”, і процедури порівняння продовжуються на наступних етапах;

- знаходження числа локальних екстремумів - при виявленні певних закономірностей у поведінці точок локального екстремуму показників вхідних рядів Ак (ґ) та Аі (ґ), що змістовно

характеризує їх ’’схожість” в розподілі “вершин” та “низин”, робиться висновок: “часові ряди схожі”;

- розподіл інтервалів між локальними екстремумами - ряди з однаковими характеристиками розподілу фаз монотонності розвитку показників визначаються як ряди зі “схожістю поведінки”.

За оцінкою “схожості” часових рядів Ак (ґ) та Аі (ґ) або їх похідних визначається вид можливої функціональної залежності між ними (табл. 2).

Вид функціональної залежності Оцінюється схожість для вхідних рядів Обчислення коефіцієнтів

Лінійна Лк () = а0 + аі Л1 () (а1 Ак (ґ), А1 А1 (ґ)), де А1 - ряд перших різниць a0 Akl = An — ai Ak 2 = Al 2

Квадратична Лк (і)=т аЛі (і) або Лк(*) =т а0 + аі Лі (і)+а2 Л (*) (ач (ґ) / АЛ, (ґ)), «Е (А(‘ (>)) (А(аТ (ґ)/ а1 А (ґ ік А2 Аі(і))) - де А2 ряд других різниць відповідного ряду a0 + ai A11 + a2 A11 = Akl\ ao + ai A12 + a2 A12 = Akl 2 a0 + ai A13 + a2 A13 = Akl 3

Гіперболічна Лк (1 )=* Л-1 (1) (Ак(ґ^ А_(ґ^ де а-1 (ґ )=(а_і\ А_2\...)

Експоненціальна Лк (1 )=* "1) (1п Ак (ґ ^ А, (ґ ))

Примітка:

1. Під функціональною залежністю двох проблемних ситуацій ми розуміємо можливі взаємні переходи між ними.

2. =п - дорівнює з певною мірою вірогідності т(ґ), яка вибирається для кожного ПрО.

3. Змістовно “інтегральна” та “диференціальна” залежності визначають зв'язок швидкостей змін значень показників відповідних часових рядів.

3. Висновки

Відмітимо, що не можуть існувати універсальні правила отримання раціональних знань з емпіричних узагальнень. Але, на нашу думку, мають місце нетривіальні, проблемно (предметно)-орієнтовані правила, які можуть бути використані при певних, добре описаних умовах і можуть бути корисними у процесах інтерактивних суб'єктивних роздумів.

Отримані за розглянутими в роботі схемами індуктивного узагальнення та визначення і подальшого тестування можливих функціональних залежностей “раціональні елементи нових знань” можуть бути на перших порах і некоректними з точки зору точного логічного виводу, але арбітром, як завжди, може виступати лише практика їх використання.

Викладене можна розглядати як пропозиції до реалізації у складі ІС інтелектуалізуючих її' механізмів та інструментів ситуативного аналізу виробничих процесів ПрО та пов'язаних з ними певних показників оточуючого середовища з використанням накопиченого емпіричного матеріалу Ідіяльності з метою виявлення можливих проблем поточної самоорганізації, адекватної зміненим умовам існування.

СПИСОК ЛІТЕРАТУРИ

1. Морозов А.О. Ситуаційні центри - основа керування організаційними системами // Математичні машини та системи. - 1997. - № 1. - С. 7 - 10.

2. Асельдеров З.М., В'юн В.І., Морозов А.О. “Континуум розумності” інформаційних систем // Матеріали конференції ’’Искусственный интеллект”. - Донецьк: Кацивелі. - 2004. - Вересень.

3. В'юн В.І. Інтелектуалізація ІС - механізми та інструментарій інтерактивного ситуативного аналізу // Математичні машини та системи. - 2004. - № 3. - С. 125 -131.

4. Морозов А.О. Базы знаний в системах ситуационного управления коллективного пользования // УСиМ. -1995. - № 4/5. - С. 91 - 95.

5. Балабанов А.С. Выделение знаний из баз данных - передовые компьютерные технологии интеллектуального анализа данных // ММС. - 2001. - № 1-2. - С. 40 - 54.

6. Саймон Н.А. Склады данных // Открытые системы. - 1997. - № 3. - С. 5 - 15.

7. Спирли Э. Корпоративное хранилище данных. - Москва: Изд. дом “Вильямс”, 2001. - 396 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8. Ивашко В.Г., Финн В.К. Экспертные системы и некоторые проблемы их интелектуализации // Семиотика и информатика. - 1986. - Вып. 27. - 164 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.