Мультилингвистическая модель распределенной системы на основе тезауруса

Зеленков Павел Викторович; Ковалев Игорь Владимирович; Карасева Маргарита Владимировна; Рогов Сергей Викторович

Разработанная структура отчетных данных легла в основу создания структуры сводных отчетов и логической структуры базы данных для АИС «Профобразование».

Библиографический список

1. Техническое задание на разработку автоматизированной информационной системы мониторинга состоя-

ния готовности учреждении начального и среднего профессионального образования к переводу в форму негосударственных организации : отчет о НИР : № 1136у / Сиб. федер. ун-т , Политехн. ин-т ; рук. М. П. Головин. Красноярск, 2006.

2. Рынок труда и рынок образовательных услуг в субъектах РоссиИскоИ Федерации / В. Н. Васильев, В. А. Гуров, Е. А. Питухин [и др.]. М. : Техносфера, 2006.

M. P. Golovin, A. A. Gorodilov, Yu. Yu. Yakunin, E. A. Yudkin

STRUCTURE OF DATA FOR REPORT REPRESENTATION

It is considered the principles of organization and presentation of various reports data for filing and the foolowing mathematical analysis.

ХЦК 681.3

П. В. Зеленков, И. В. Ковалев, М. В. Карасева, С. В. Рогов

МУЛЬТИЛИНГВИСТИЧЕСКАЯ МОДЕЛЬ РАСПРЕДЕЛЕННОЙ СИСТЕМЫ НА ОСНОВЕ ТЕЗАУРУСА

Предложена модель, решающая проблему одноязычного представления информации в информационно-управ-ляющих системах и проблему организации, хранения и обработки информации в современных распределенных мультилингвистических корпоративных системах поддержки принятия решений.

В настоящее время разработано множество моделей для представления распределенных систем (РС) вычисления и обработки информации. Их частными случаями являются информационные системы, корпоративные информационные системы и интенсивно развивающиеся системы поддержки принятия решениИ. Одним из перспективных направлении при создании новых моделеИ распределенных систем является применение словареИ, или тезаурусов. Однако большинство этих моделеИ строится на основе одноязычного представления информации или учитывает многоязычность неявно.

Авторами была разработана модель РС, использующая тезаурусы, выполненные на основе мультилингвис-тическоИ технологии [1]. Эта технология направлена в первую очередь на решение проблемы многоязычного представления информации в информационно-управля-ющих системах [2], поскольку в современных условиях даже небольшие корпоративные информационные системы, как правило, уже работают в мультилингвистичес-ком режиме.

Рассмотрим следующее определение мультилингви-стического тезауруса Т слов Т. (где i - языковое множество; у - терм в языковом множестве), сформированное на базе положениИ, представленных ниже и отвечающих следующим условиям:

1) имеется непустое подмножество Т с Т, называемое множеством дескрипторов;

2) имеется симметричное транзитивное рефлексивное отношение К с ТхТ, такое, что:

- ¿1 * ^2 Л ¿1Щ2 ^ (1П е То) V V,2 е То);

- ¿,1 е То ^ Э; е То)(?А-1>

Отношение Я называется синонимическим отношением, а слова г , г;2, отвечающие этому отношению, - это синонимические дескрипторы;

3) имеется транзитивное и несимметричное отношение К с Т X Т, называемое обобщающим отношением.

В случае если два дескриптора г, г.2 удовлетворяют отношению г е г , то полагается, что дескриптор г более общиИ, чем дескриптор га.

Элементы множества Т/Т называются множеством

о

аскрипторов.

Таким образом, информационную систему с применением тезауруса можно представить в виде четверки (Т, D,, М, 5), где Т - мультилингвистическиИ тезаурус с дескрипторным множеством Т; D. - коллекция разноязычных документов; М. - множество разноязычных вопросов; 5 ^ 2° - отображение, сопоставляющее каждому независимому от языковоИ принадлежности вопросу множество разноязычных документов.

Пусть описание любого документа d. е D. представлено в виде

г(Л) = {г11, га, •••, У

и удовлетворяет условию: ни один из двух дескрипторов не встречаются в одном г.^.), если они удовлетворяют отношению К.

Можно также считать, что каждыИ вопрос т. е М. представлен в форме, аналогичноИ описанию разноязычных документов.

Множество описаний вопросов и документов частично упорядочено отношением включения < следующим образом:

Vda, di 2 £ ,

t, d) < t, (d,.2) « (Vt' £ t, (dj)) X

х(3/;е t, (di 2))(t; Kt") v (t;-1-), т. е. каждый дескриптор из ^(d) представляет собой обобщение дескриптора из t(d ) или идентичен дескриптору

из t(da).

Отношение < позволяет сформулировать ответ Q на вопрос m. £ М в виде

Q = 8(т,) = {d , : d . £ Dл т., < t,(d ,)} .

Пусть S1, ..., Sn - локальные информационные системы, где S. = (T, D, M, 5), n. Соединим системы S.,

J J У j J 1

..., Sn в одну систему S, которую в дальнейшем будем называть распределенной информационной системой, базирующейся на глобальном тезаурусе T = U Tj.

Итак, пусть у нас имеется распределенная^ информационная система S = (Т, D,, М, 5) с синонимическим отношением R и обобщающим отношением К. Тогда последовательность информационных систем можно определить следующим образом:

Sj = (Т, D, М j, 5^), где Tj £ Т, D „ £ Dj, My £ М; 5 - сужение 5 на Му; Vj = 1, n . Кроме того, отношения Rj = R п (Tj х Ty) и Kj = K п (Т0j х Т0j), T0j - множество дескрипторов системы S.

J

Необходимо отметить, что множества T и Diy могут пересекаться.

Также покажем возможность существования подсистемы, которая позволяет формализовать отношение предпочтения одной системы перед другой.

Пусть Si = (Tj, D i, Мл, 5i) и S2 = (T2, D,.2, Mi2, 52) -информационные системы. Система S1 является подсистемой S2, S1 с S2, если:

1) (T с T2) л (Ki = K2 п (T01X T01)) л (Ri = R2 п (Ti х Ti));

2) D,i с D n ;

3) (M,i с Mi2) л < = <2 (M,i xMi));

4) 5i (mi ) = 52(mi ) п D,i, mi £ M ,i.

Очевидно, что локальные информационные системы являются подсистемами распределенной информационной системы.

Ввиду того что множество разноязычных документов распределенной системы поддержки принятия решений является объединением множеств разноязычных документов локальных систем, можно выразить ответ на вопрос к распределенной системе как результат некоторых операций над ответами от локальных систем.

Пусть mt = {mt} - вопрос, содержащий один дескриптор, а 5(mi) - ответ на вопрос mi. В подсистеме Sy ответ на локальный вопрос mt = {mt} описывается в следующей форме:

5j(mi) ={d i: d i £ D j л mi <■ t (di)} ■

В свою очередь в распределенной системе S глобальный ответ на вопрос mt = \mi} будет объединением локальных ответов 5(mt) = и 5} (mt).

Ответ на произвольный вопрос mt ={ma,..., mk} для любого языкового множества i в распределенной системе выражается формулой

___ k ______ _____

5(mt) = J 5(mn), mu = {mil}. (1)

l=i

Покажем справедливость этой формулы и ее согласованность с определением последовательности информационных систем (в рамках произвольного языкового множества i):

П1М :dt ODyOm, <tt (di)} ,

/=i ./=1

I {di : di £ UDj- л mi < ti (di)},

l=i j=i

k ________________

I {di: di£ Diл mu < t. (di)},

l=i

{di : dt £ Di л mi < (dt)}.

Необходимо отметить, что формула (1) может быть модифицирована и для случая, когда имеется произвольное количество языковых множеств.

Итак, распределенная информационная система обладает свойством включения, если множество вопросов частично упорядочено отношением и выполняется условие

{ii, mi2} с Mi л mii < mi2 ^ 5(mi) з 5(mi2) .

Свойство включения позволяет формулировать цепь ответов на цепь вопросов, уточняя ответы более специализированными вопросами.

Таким образом, предлагаемая авторами мультилинг-вистическая модель позволяет решить проблему организации, хранения и обработки информации в современных распределенных мультилингвистических корпоративных системах поддержки принятия решений. Кроме того, представленные выше модели учитывают неопределенность описания как мультилингвистических документов, так и запросов и позволяют составить более гибкие муль-тилингвистические ответы даже на одноязычные запросы по сравнению с простой распределенной информационной системой.

Библиографический список

1. Зеленков, П. В. Автоматизация формирования информационно-терминологического базиса мультилинг-вистической обучающей технологии / П. В. Зеленков, И. В. Ковалев // Телекоммуникации и информатизация образования. 2005. № 3 (28). С. 68-82.

2. Зеленков, П. В. Мультилингвистическая адаптивнообучающая технология для обеспечения доступности информационных ресурсов / П. В. Зеленков, И. В. Ковалев,

А. А. Ступина // Современные проблемы информатизации в техники и технологиях : сб. тр. по результатам IX Междунар. науч. конф. / Воронеж. гос. техн. ун-т. Воронеж, 2004. С. 234-235.

P. V. Zelenkov, I. V. Kovalev, M. V. Karaseva, S.V. Rogov

MULTILINGUAL MODEL OF THE DISTRIBUTED SYSTEM ON THE THESAURUS BASIS

It is covered a model aimed at one-lingual information providing problem solving in information control systems and problems of information structuring, storage and processing in modern distributed multilingual corporative systems of decision-making support.

ХЦК 543.878:541.127:519.2

В. P. Пен, И. В. Ковалев, С. И. Левченко

КИНЕТИКА ДЕСТРУКЦИИ ПОЛИМЕРОВ С РАСПРЕДЕЛЕННЫМИ КИНЕТИЧЕСКИМИ ПАРАМЕТРАМИ КАК СТОХАСТИЧЕСКИЙ ПРОЦЕСС

Показана возможность представления кинетической модели полихронного процесса деструкции полимера нерегулярного строения как случайного процесса, что дает возможность решить уравнение Колмогорова и найти явный вид плотности распределения для кинетических ансамблей. Полученное решение позволяет моделировать кинетику деструкции полимеров нерегулярного строения, имеющих несколько типов различных химических связей.

Согласно теории Крамерса [ 1] применительно к кинетике реакций в конденсированных средах, существуют несколько кинетических режимов, зависящих от отношения

т

а=-^ (1)

где Ту и тх - соответственно время релаксации и время пребывания системы вблизи барьера [1]. При а скорость реакции

C(t) = J C0 exp(-Kt) f (к, 0)dk,

(2)

гдеДк, 0) - распределение в начальный момент времени, определяющее условия приготовления реакционной смеси. Такой режим называется полиэкспоненциальным, а кинетика, соответственно, - полиэкспоненциальной, или полихронной. Уравнение (2) означает, что в каждой точке на оси С^) генерируется химическая реакция со своей собственной константой скорости К(г), а исходная концентрация реагентов задается начальным распределени-емДк, 0). Такие режимы, обусловленные, как правило, стохастической природой влияния растворителя на элементарный акт химического взаимодействия и большим временем релаксации системы, неоднократно наблюдались в средах с малой подвижностью [2; 3] и в процессах делигнификации [4; 5]. При моделировании полихронной кинетики возникает необходимость определения А(к, 0) по экспериментальным данным. Но эта задача, связанная с решением интегрального уравнения (2), является некорректной и требует использования методов регуляризации [6]. Учет особенностей, обусловленных высокомолекулярной природой реагента, дает возможность заменить решение интегрального уравнения параметрической идентификацией.

Для полимеров нерегулярного строения полихрон-ность кинетики может быть следствием существенной хи-

мической неоднородности самой макромолекулы, вступающей в химическое взаимодействие, из-за затрудненности перераспределения энергии между ее связями [7]. В этом случае кинетика также будет стохастической ввиду наличия распределения связей в макромолекуле полимера по кинетическим параметрам, а уравнение (2) для таких систем окажется уравнением кинетической кривой.

Поэтому для изменения во времени наблюдаемой константы скорости процесса при первом кинетическом порядке реакции можно записать следующее стохастическое уравнение:

— = -ак + т -^(т), (3)

дт

где к - константа скорости; а и т - постоянные; ^(т) -белый шум, т. е. случайная функция, обладающая корреляционной функцией

К (т) = 8(т). (4)

Для того чтобы решение уравнения к(т) являлось марковским процессом, предположения о виде корреляционной функции недостаточно. Необходимо еще допустить быстрое убывание вероятностной зависимости между ординатами процесса £(т) с ростом интервала времени между ординатами.

Предположим, что ординаты процесса £(т) являются независимыми случайными величинами. Тогда функция к(т) будет марковским процессом, так как она является решением уравнения первого порядка, однозначно определяемым ее начальным значением, а благодаря независимости ординат функции £(т) значения последней функции в прошлом никак не влияют на ее значения в будущем. Если функция £(т), в дополнение к условию (4), является еще и нормальной, то требование независимости ее ординат будет выполнено и, следовательно,

K

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Мультилингвистическая модель распределенной системы на основе тезауруса Текст научной статьи по специальности «Компьютерные и информационные науки»

Multilingual model of the distributed system on the thesaurus basis

Текст научной работы на тему «Мультилингвистическая модель распределенной системы на основе тезауруса»