ЕСТЕСТВЕННЫЕ И ТЕХНИЧЕСКИЕ НАУКИ
УДК 519.673: 004.9
ИНТЕРПРЕТАЦИЯ КОНЦЕПТУАЛЬНОЙ МОДЕЛИ ПРОСТРАНСТВЕННОГО ДИНАМИЧЕСКОГО ОБЪЕКТА В КЛАССЕ ФОРМАЛЬНЫХ СИСТЕМ*
А.Я. Фридман
Институт информатики и математического моделирования КНЦ РАН
Аннотация
Рассматриваются вопросы моделирования сложных динамических объектов (СДО) в слабо формализованных предметных областях. Для предложенной ранее ситуационной концептуальной модели подобных объектов разработана интерпретация в классе семиотических формальных систем, что позволяет интегрировать различные средства исследования СДО, обеспечив совместную логико-аналитическую обработку данных и ситуационный анализ состояния изучаемого объекта с применением экспертных знаний и учетом пространственно-временных зависимостей в характеристиках СДО, выполняемые с использованием картографической информации.
Ключевые слова:
концептуальная модель, пространственный динамический объект, семиотическая формальная система.
Введение
В настоящей работе рассмотрены вопросы моделирования СДО в слабо формализованных предметных областях. Помимо структурной сложности, особенность СДО состоит в том, что результаты их функционирования существенно зависят от пространственных характеристик составных частей и от времени.
При моделировании СДО необходимо учитывать разнообразные информационные, финансовые, материальные, энергетические потоки, предусматривать анализ последствий изменения структуры объекта, возможных критических ситуаций и т.п. Принципиальная неполнота знаний о подобных объектах ограничивает применимость классических аналитических моделей и определяет ориентацию на использование опыта экспертов, что, в свою очередь, связано с созданием соответствующих средств формализации экспертных знаний и их встраиванием в систему моделирования. Поэтому в современном моделировании значительно возросла роль такого понятия, как концептуальная модель предметной области (КМПО) [1, 2]. Основа КМПО -не алгоритмическая модель передачи и преобразования данных, как в аналитических моделях, а декларативное описание структуры объекта и взаимодействия его составных частей. Таким образом, КМПО изначально ориентирована на формализацию знаний экспертов. В КМПО определяются элементы исследуемой предметной области и описываются отношения между ними, которые задают структуру и причинно-следственные связи, существенные в рамках определенного исследования [3, 4].
Представленная в данной работе ситуационная система моделирования (ССМ) [5] на основе древовидной ситуационной концептуальной модели (СКМ) есть один из вариантов
* Работа частично поддержана грантами РФФИ (проекты № 13-07-00318-а, № 14-07-00256-а,
№ 14-07-00257-а, № 14-07-00205-а, № 15-07-04760-а, № 15-07-02757-а).
100
ВЕСТНИК Кольского научного центра РАН 4/2015(23)
Интерпретация концептуальной модели...
реализации технологий типа CASE (Computer Aided Software Engineering) и RAD (Rapid Application Development).
Семиотические формальные системы
Основное достоинство логических исчислений в качестве модели представления и обработки знаний заключается в наличии единообразной формальной процедуры доказательства теорем. Однако оно влечет за собой и основной недостаток данного подхода -сложность использования при доказательстве эвристик, отражающих специфику конкретной проблемной среды [6]. Это особенно важно при построении экспертных систем, вычислительная мощность которых в основном определяется знаниями, характеризующими специфику предметной области. К другим недостаткам формальных систем следует отнести их монотонность (невозможность отказаться от заключений, если становится истинным дополнительный факт, и в этом смысле они отличаются от рассуждений на основе здравого смысла), отсутствие средств для структурирования используемых элементов и недопустимость противоречий.
Стремление устранить недостатки формальных систем при их использовании в искусственном интеллекте привело к появлению семиотических систем, формализуемых восьмеркой [6]:
S ::= (В, F, A, R, Q(B), Q(F), Q(A), Q(R)). (1)
Символом ::= здесь и далее обозначается равенство по определению. При необходимости используются также другие символы языка БНФ (металингвистических формул Бэкуса-Наура).
В (1) первые четыре компонента те же, что и в определении формальной системы [6], а остальные компоненты - правила изменения первых четырех компонентов под влиянием накапливаемого в базе знаний опыта о строении и функционировании сущностей в данной проблемной среде. Теория подобных систем находится на начальной стадии развития, но существует много примеров решения конкретных задач в рамках этой парадигмы. Ниже описывается один из таких примеров.
Основы ситуационного моделирования
При постановке задачи и подготовке процесса моделирования КМПО предназначена для представления знаний о структуре исследуемой предметной области. Для элементов КМПО существует соответствие между собственно объектом реального мира и его модельным представлением. В обеспечение возможности автоматизации последующих этапов моделирования осуществляется отображение модели предметной области на адекватную ей формальную систему. Этот переход реализуется в ходе построения КМПО путем задания каждому ее элементу некоторого формального описания. В результате, завершение построения КМПО будет соответствовать переходу от неформальных знаний об исследуемой предметной области к их формальному представлению, допускающему только однозначную процедурную трактовку. Полученная формальная модель носит декларативный характер, так как в ней описывается в первую очередь состав, структура и отношения между объектами и процессами, независимо от конкретного способа их реализации в компьютере.
Декларативный язык описания СКМ [5] состоит из двух частей: части, соответствующей объектам описываемого мира, и части, соответствующей отношениям и атрибутам представленных в модели объектов. В качестве математической основы декларативного языка использована аксиоматическая теория множеств.
В СКМ описываются три вида элементов (сущностей) реального мира - объекты, процессы и данные (или ресурсы). Объекты отображают организационную и пространственную структуру объекта исследования, с каждым из них может быть связан набор процессов. Под процессом понимается некоторое действие (процедура), преобразующее подмножество данных, называемых входными по отношению к рассматриваемому процессу, в другое их подмножество,
ВЕСТНИК Кольского научного центра РАН 4/2015(23)
101
А.Я. Фридман
именуемое выходным. Данные характеризуют состояние системы. Они используются при реализации процессов, служат результатами их выполнения. Выполнение любого процесса изменяет данные и соответствует переходу системы из одного состояния в другое. Взаимосвязи и взаимодействие объектов реального мира описывается в модели с помощью отношений, задаваемых на множествах объектов, процессов и данных. Каждое отношение связывает элемент модели с некоторым множеством других элементов.
Имена элементов СКМ даются в терминах предметной области. Каждому элементу модели назначается исполнитель, обеспечивающий его реализацию в ходе моделирования. Тип исполнителя определяет характеристики реализации, например, язык программирования, на котором пишется исполнитель соответствующего процесса, и тип исполнителя в алгоритмическом языке.
Атрибуты, описывающие тип отношения иерархии [4], конкретизируют представление объектов модели на следующем, нижнем уровне иерархии. Тип отношения «композиция» (&) определяет, что объект строится агрегацией его подобъектов. Тип «классификация» (v) указывает, что объект верхнего уровня есть обобщение группы объектов нижнего уровня. Отношение типа «классификация» в СКМ используется для представления различных вариантов элемента верхнего уровня. Тип «итерация» (*) позволяет определять в СКМ итеративные процессы и описывать регулярные структуры данных.
В зависимости от типа отношения иерархии объекту назначается управляющее данное. Управляющие данные используются для доопределения структуры процессов, имеющих тип отношений иерархии «классификация» или «итерация», и данных, имеющих иерархическое отношение типа «итерация».
Формальное представление СКМ дает возможность существенно автоматизировать анализ корректности структуры и разрешимости СКМ [3-5].
Важный аспект эффективности СКМ состоит в удобстве представления результатов моделирования. В настоящее время наиболее перспективной средой для компьютеризованного исследования объектов класса СДО считается географическая информационная система (ГИС) [7]. Кроме продвинутых способов визуализации и графической обработки данных, инструментальные средства ГИС в принципе позволяют ставить задачи для пространственно координированных расчетов в дружественной к пользователю графической среде, хотя это требует дополнительных разработок программного обеспечения. Кроме того, ГИС-пакеты не рассчитаны на анализ динамики объекта и серьезную математическую обработку данных.
Еще одно достоинство ГИС в рамках рассматриваемой задачи заключается в том, что с каждым графическим элементом можно связать дополнительные поля БД, доступные для модификации внешними вычислительными модулями, в отличие от графических атрибутов. В частности, в этих полях можно хранить атрибуты концептуальной модели, относящихся к заданному элементу, и другие параметры, необходимые для организации и проведения моделирования.
Таким образом, каждый цикл расчетов в ходе моделирования включает три стадии: задание условий расчета, собственно расчет и вывод результатов. Неформальная цель разработки СКМ заключается в автоматизации всех этих стадий с обеспечением максимального сервиса непрограммирующему пользователю, то есть с использованием терминологии предметной области и дружественного интерфейса пользователя с компьютером. По тем же соображениям ССМ должна быть функционально полной, то есть предоставлять пользователю все нужные ему средства без явного выхода в другие программные среды. Создание специализированных графических библиотек и средств генерации отчетов потребовало бы неоправданных затрат на программирование и значительно удлинило сроки разработки. Поэтому представляется целесообразным компромиссное решение: возложить задачи вывода данных на стандартные пакеты или специализированные программные модули, но в максимальной степени автоматизировать их работу, исключив диалог с пользователем в их среде.
102
ВЕСТНИК Кольского научного центра РАН 4/2015(23)
Интерпретация концептуальной модели...
Формальное описание СКМ
СКМ базируется на представлении объекта моделирования в виде древовидного И-ИЛИ графа, отображающего иерархическую декомпозицию структурных элементов СДО в соответствии с их организационными связями.
Чтобы избежать вычислительных проблем, связанных с малыми изменениями данных, и обеспечить поддержку совместной расчетно-логической обработки данных, в СКМ выходными данными процедур обработки (исключение составляют данные, вычисляемые ГИС) могут быть только данные с дискретным конечным множеством значений (типа списков). Если значения некоторого данного есть строковые константы, то такое данное называется параметром (категория PAR), а имеющее числовые значения именуется переменной (категория VAR), и над ним можно выполнять определенные математические операции. Если результат вычислений представляет собой значение переменной, он округляется до ближайшего значения из списка допустимых значений. В дальнейшем, если сказанное относится к данным любого разрешенного в СКМ типа, употребляется термин «данное». Таким образом, множество имен данных делится на множества имен переменных и параметров:
D ::=< Var, Par >, Var ::= {var }, i = 1, N ;
7 7 к l 7 v 7 (2)
Par ::={parj}, j = 1, Np, где Nv и Np - мощности этих множеств.
Данные моделируют ресурсы (количественные характеристики) объектов или процессов (категория RES), переменные могут также использоваться как настроечные параметры функций (критериев) качества функционирования элементов СКМ (категория ADJ). Соответственно, множество имен переменных делится на подмножество имен ресурсов элементов СКМ и подмножество имен настроечных параметров критериев качества этих элементов:
Var ::=< Res, Adj > (3)
Отдельную категорию (категорию GIS) составляют графические характеристики объектов СКМ, непосредственно вычисляемые в ГИС. Все они относятся к переменным, но не рассматриваются как списки, так как используются только как входные ресурсы элементов модели и не меняются в ходе имитации.
Объекты СКМ имеют три основные характеристики: имя, функциональный тип, который определяет структуру и функции объекта и используется в процессе анализа корректности СКМ, и имя суперобъекта, доминирующего данный объект в СКМ (отсутствует для объекта верхнего уровня). По положению в дереве объектов и на карте выделяются три категории объектов СКМ: примитивы (категория LEAF), структурно неделимые с точки зрения глобальной цели моделирования, элементарные объекты (категория GISC), географически связанные с одним ГИС-элементом (полигоном, дугой или точкой какого-либо покрытия), и составные объекты (категория COMP), состоящие из элементарных и/или составных объектов. Структура объектов категории GISC в СКМ может быть достаточно сложной, но все их подобъекты имеют одну и ту же географическую привязку. Множество объектов образует иерархию:
t \ Nl
О = {а 0Уа}::=2°а, (4)
а=1
где а = 1, Nl - номер уровня дерева объектов, к которому относится данный объект (L - общее количество уровней декомпозиции);
вб = 1, Nб - порядковый номер объекта на его уровне декомпозиции;
г = 1, N6_ - порядковый номер суперобъекта, доминирующего заданный элемент на вышележащем уровне;
Об - множество объектов, принадлежащих уровню с номером а.
ВЕСТНИК Кольского научного центра РАН 4/2015(23)
103
А.Я. Фридман
Для обеспечения связности СКМ принимается, что существует единственный суперобъект, доминирующий все объекты первого уровня декомпозиции, то есть справедливо соотношение:
O. -i0.”} 0, = (5)
Процессы в СКМ отображают преобразования данных и реализуются различными способами в зависимости от присвоенной процессу одной из трех следующих категорий: внутренние процессы (категория INNER), все их входные и выходные данные относятся к одному объекту; внутриуровневые процессы (категория INTRA), связывающие объекты СКМ, не подчиняющиеся друг другу; межуровневые процессы (категория INTER), описывающие передачу данных между объектом и подобъектами или между объектом и суперобъектом. Введенное категорирование процессов несколько усложняет процесс создания СКМ (в некоторых случаях может потребоваться создавать фиктивные процессы, обеспечивающие такую типизацию), но позволяет сделать процедуры формального контроля СКМ значительно более полными и детальными.
Основные характеристики процессов: уникальное имя, характеристика исполнителя процесса и функциональный тип процесса, который определяет тип преобразований, им осуществляемых, и используется в процессе анализа корректности СКМ; дополнительно используются список входных и выходных данных и их допустимых граничных значений. Исполнитель процесса специфицирует его динамические свойства и способ реализации в компьютере. Исполнитель можно задать либо непосредственно (в виде разностного уравнения), либо косвенно - ссылкой на имя реализующего этот процесс программного модуля.
Схема концептуальной модели образуется кортежем:
^ССМ ::=<о,P,DCM,H,OP,PO,U >, (6)
где O - множество объектов КМПО (9);
P ::= {pn I n = 1, Np - множество процессов КМПО;
DCM с D - множество данных концептуальной модели, где D определено в (4), (5);
H - отношение иерархии объектов, которое с учетом (4) и (5) примет вид:
Nl-i
H = £ H „
б=1
где Hб с O6х B,(O6 ) - отношения иерархии для каждого из уровней дерева объектов, причем b'(o6 ) есть разбиение множества Оа;
OP с O х B (P) - отношение «объект - порождающие его выходные данные процессы», причем B (P) есть разбиение множества P;
PO с P х B(О) - отношение «процесс - создающие его входные данные объекты»;
U ::= Up иU0 - отношение, формализующее управление процессом вычислений на основе СКМ, имеет составляющие следующего вида:
U с P х B(Res) - отношение «процесс - управляющее данное»;
Uo с О х B(Res) - отношение «объект - управляющее данное».
Отношение «объект (процесс) - управляющее данное» ставит в соответствие некоторому объекту (процессу) модели данное, которое доопределяет этот объект при переходе к алгоритмической интерпретации. Передача данных между объектами осуществляется только через списки входных и выходных данных этих объектов, что согласуется с принципами инкапсуляции данных, принятыми в современном объектно-ориентированном программировании. Все процессы, приписанные к одному объекту, описываются отношением OA с О х B(P) «объект - приписанные к нему процессы». Это отношение не входит в схему
104
ВЕСТНИК Кольского научного центра РАН 4/2015(23)
Интерпретация концептуальной модели...
СКМ, поскольку, в отличие от отношений Н, ОР и РО, не задается пользователем при конструировании модели, а формируется автоматически.
Отношения, определенные в модели, удобно представлять в форме функций (7), частично определенных на множествах О и Р, с областями значений В(Р), B(O) или В'(Об). Названия
функций обозначены строчными символами, соответствующими прописным символам в названиях отношений:
h :°б_1 ^B'(Oa),(Vo;. е06,Vo! е°б_Hoj = hб(o))оojHbог); op . O ^ B(p^ (Vo е O, Vp е р)({р; = opio)) «■ o,Opp]);
Po.p ^ b(0), (vo е O, VP] е p)((o = po(P])) «• P]OPot);
(7)
u.
u„
oa: O ^ B(P),(VOi е O, Vp} е P)((p} = oa(ot))otOAp});
: p ^ B(Res\(vPi е p, Vres] е Res)((res] = up (pi)) ptUpres]);
: O ^ B(Res), (Vo1 е O, VreSj е Res){(resj = uo (o1)) o1Uo resj).
Множества значений функций (7), формирующие сечения областей значений введенных отношений по некоторому элементу областей их определения, обозначаются жирным шрифтом:
h6 (oi )::= \Р] : o] = ha(oi)}; oP(oi) ::= \Р] : Р] = oP(oi)};
ро(Р]) ::= {o : oi = po(p])}; oci(pi) ::= ^ . p} = oa(oi)}; (8)
up (Pi) ::= \res]: res] = up (Pi)}; uo (o) ::= \res]: res] = uo (o)}.
Аналогично (8) записываются сечения введенных отношений по подмножествам их областей определения, строящихся как объединения всех сечений по элементам этих подмножеств. Например, h (Oi), где Oi с O6_х, есть множество объектов уровня а, доминируемых данным подмножеством объектов oj е O t, которые находятся на уровне а - 1.
Ниже также используется множество подчиненности объекта oi h ’(oi)::= U h(oi).
a<k < L
Разработанные алгоритмы присвоения категорий элементам СКМ используют вышеописанные отношения и выявляют все возможные ошибки категоризирования элементов модели [5]. Процедуры контроля правильности назначений исполнителей элементов СКМ используют следующие ограничения (доказательства даны в [5]).
Теорема 1. В конечной СКМ не может иметь места рекурсивная декомпозиция типов исполнителей объектов, то есть ни один объект, входящий во множество подчиненности некоторого объекта, не может иметь исполнителя того же типа, что и исходный объект.
Теорема 2. В конечной СКМ не может иметь места инверсия подчиненности исполнителей объектов, то есть ни один объект, входящий во множество подчиненности некоторого объекта с исполнителем типа е1, не может иметь исполнителя того же типа, что и любой другой объект, во множестве подчиненности которого содержится какой-либо объект с исполнителем типа е1.
Принципы контроля разрешимости СКМ
Выполненное согласно принятым в ССМ правилам построение корректной модели еще не гарантирует, что эта модель разрешима, то есть можно решить все задачи, в ней декларированные. Под разрешимостью в общем случае понимается достижимость некоторого подмножества объектов модели, которые определяются как целевые, из другого подмножества объектов, которые определяются как исходные. Разрешимость может рассматриваться в двух основных аспектах: при анализе всей модели в целом (до начала расчетов) она подразумевает согласованность и однозначность описания всех допустимых вариантов достижения глобальной цели на различных уровнях иерархии, а в процессе
ВЕСТНИК Кольского научного центра РАН 4/2015(23)
105
А.Я. Фридман
реализации моделирования разрешимость состоит в обеспечении выбора корректного фрагмента модели, описывающего изучаемую ситуацию. Функциональное различие между перечисленными аспектами состоит в том, что при анализе всей модели оценивается только потенциальная возможность моделирования всех описанных в модели объектов, а при анализе конкретной ситуации дополнительно ставятся задачи выбора минимального фрагмента, описывающего эту ситуацию, и количественного сопоставления возможных альтернатив, в ней содержащихся. Второй аспект разрешимости исследуется в [5], здесь же представлены особенности анализа разрешимости СКМ в целом, который автоматически проводится после завершения контроля ее корректности, а по требованию пользователя может быть выполнен в любое время. В общем случае, задачу анализа разрешимости можно сформулировать в следующем виде: указывается два множества элементов модели - исходное и целевое, при этом модель разрешима, если существует последовательность шагов, позволяющая получить целевое множество из исходного. Для этого пригодны простые волновые алгоритмы [4].
При анализе обоих аспектов разрешимости концептуальная модель рассматривается как формальная система. В ее алфавит входят:
символы, обозначающие элементы модели (pi, on, resj, ...);
функциональные символы, описывающие отношения и связи между элементами модели (ha, ор,...);
специальные и синтаксические символы (=, (,), ^,...).
Множество формул в рассматриваемой формальной системе образуют: собственно символы, обозначающие элементы КМПО:
{Pi е P} u {Oj eO] u {resk e DCM}; (9)
выражения (7), (8) и другие формулы для вычисления функций и множеств, определяемых с помощью отношений, которые введены над множествами (5);
выражения вычислимости для каждого процесса концептуальной модели:
list_in(pi) \ list out(pi), Up(pi) [, sp)] ^ p„ list_out(p,), (10)
где в силу принятого в ССМ предположения об автономности структуры каждого объекта во множество s(p) процессов, предшествующих pi, могут входить только процессы, приписанные к тому же объекту:
s(pi) с оа(оа'1(р1)); (11)
выражения вычислимости для каждого объекта концептуальной модели: list_in(oi), up(Oj), оа(о,), h(o,) ^ oi, list_out(oi); (12)
выражения вычислимости входных данных каждого объекта концептуальной модели, получающего материальные ресурсы от других объектов (ог: oo(o) Ф 0):
00(0,) ^ list_in(oi). (13)
В выражения (9)—(13) входят только материальные ресурсы, то есть в них не анализируются выходные данные процессов настройки и обратной связи, относящиеся к информационным ресурсам СКМ. Кроме того, вычислимость определенных в предпосылках этих выражений множеств констатируется при условии вычислимости всех элементов указанных множеств.
Дополнительного обоснования требует первая предпосылка предложения (10). Как известно, при наличии циклов по ресурсам в предметной области могут появляться данные, которые при построении концептуальной модели должны декларироваться как входные и выходные для некоторого процесса КМПО одновременно. По принятому в ССМ предположению такие циклы вносятся внутрь объектов КМПО, то есть должны учитываться при анализе разрешимости на уровне процессов.
Если при анализе разрешимости СКМ использовать выражение вычислимости, предложенное в [4] и принимающее для СКМ вид:
list_in(p,) & up(p,) [& s(p,)] ^ p, & list_out(p,), (14)
106
ВЕСТНИК Кольского научного центра РАН 4/2015(23)
Интерпретация концептуальной модели...
то в модель нельзя будет включать ресурсы, служащие одновременно входными и выходными данными одного и того же процесса, то есть описывать часто встречающиеся на практике рекуррентные процессы вычислений. Выход из положения дает приведенная ниже теорема, доказанная в работе [5].
Теорема 3. Ресурс, одновременно входной и выходной для одного и того же процесса СКМ и не являющийся выходным ни для одного из предшествующих ему процессов, связанных с указанным процессом отношением порождения процессов (13), можно исключить из левой части предложения вычислимости без нарушения корректности анализа разрешимости модели.
Во множество аксиом рассматриваемой формальной системы входят:
аксиомы вычислимости всех ресурсов, относящихся к внешним данным (имеющим исполнителей типа DB, GISE или GEN)
|- resj : (ter(resj) = DB) v (ter(resj) = GISE) v (tS[(resJ) = GEN); (15)
аксиомы вычислимости всех ГИС-элементов СКМ (типы которых начинаются символами dot, pol или arc)
|- 0J : <х> dot) v (to(o/) Ю pol) V (to(oj) Ю arcX (16)
где символом <x> условно обозначено вхождение стандартных ГИС-типов в функциональный тип объекта.
В рассматриваемой формальной системе заданы два правила вывода:
правило непосредственного следования -
Fi, Fi ^ F2 |— F2; (17)
правило следования с равенством -
Fi, Fi = F2, F2 ^ F3 |— F3, (18)
где F, - некоторые формулы из (9)-(13).
Структура описанной формальной системы аналогична структуре системы, предложенной в [8]. Существенное отличие - вид выражений вычислимости (10), (12), (13) и состав аксиом, на основе которых проводится анализ разрешимости концептуальной модели.
Совокупность представленных в СКМ знаний о предметной области может быть признана корректной, если на различных уровнях иерархии в концептуальной модели действительно представлены взаимосогласованные спецификации объектов и процессов, обеспечивающих корректное порождение ресурсов для функционирования объектов вышележащих уровней. Соответствие спецификаций на всех уровнях ведет к тому, что концептуальная модель полностью характеризует корневой объект, соответствующий глобальной задаче, которую решает система в целом. Концептуальная модель разрешима [8], если в соответствующей ей формальной системе существует вывод каждой теоремы вычислимости из множества аксиом и других теорем.
Определение 1. СКМ разрешима тогда и только тогда, когда для каждого элемента модели, не входящего во множество аксиом, применение выражений вычислимости вида (10), (12), (13) к аксиомам и уже доказанным формулам (множеству теорем T) позволяет построить вывод с применением правил (17), (18) из множества аксиом (A) формальной системы (9)—(13).
При анализе разрешимости, который, согласно определению 1, представляет собой разновидность методов автоматического доказательства теорем, используется понятие «механизм вывода», в данном случае оно понимается как способ, алгоритм применения правил вывода (17), (18), обеспечивающий эффективное доказательство всей требуемой совокупности формул из множества T теорем (то есть синтаксически правильно построенных формул) рассматриваемой формальной системы. Наиболее простой способ организации вывода -«потоковый» механизм, при котором множество считающихся доказанными формул A', вначале равное множеству аксиом (A1 = A), расширяется в результате применения правил вывода [4, 8]. Если по истечении некоторого времени T с A', то модель разрешима, если это неверно и не удается применить ни одно из правил, то СКМ неразрешима.
ВЕСТНИК Кольского научного центра РАН 4/2015(23)
107
А.Я. Фридман
В качестве стратегии доказательства, используемой при анализе концептуальной модели общего вида, предложена стратегия снизу-вверх [5], состоящая в циклическом выполнении следующих этапов.
Этап I. Применяется правило (17) для получения всех возможных следствий из формул и аксиом.
Этап II. Применяются правила (17), (18) для получения всех возможных следствий из аксиом и полученных на предыдущем этапе доказательства формул.
Этап III. Применяется правило (13) для расширения списка считающихся вычислимыми объектов.
Доказано, что для построенных по описанным выше правилам корректных концептуальных моделей анализ разрешимости модели в целом сводится к анализу разрешимости отдельных входящих в ее состав шаблонов процессов категории INTRA и процессов агрегирования [5].
Обработка ситуаций
В теории ситуационного управления [6] отмечается принципиальная важность разработки процедур обобщения описаний ситуации на основе их классификации с использованием множества прагматически важных признаков, которое само подлежит синтезу. К фундаментальным особенностям формирования понятий и классификации в ситуационном управлении отнесены:
• наличие процедур обобщения, основанных на структуре отношений между элементами ситуаций;
• возможность работы с именами отдельных понятий и ситуаций;
• необходимость согласования классификации ситуаций по некоторому основанию с классификацией на множестве воздействий (управлений).
Для реализации перечисленных принципов классификации и обобщения ситуаций в ССМ предусмотрен ряд программных средств:
• аппарат синтеза и анализа типов ситуаций, в частности, оптимальных достаточных ситуаций, ориентированный на решение вопросов координации и согласования управляющих воздействий на различных уровнях СКМ;
• инструментальные средства порождения и проверки гипотез о сравнительных характеристиках достаточных ситуаций в рамках вероятностной интерпретации этих гипотез с учетом влияния инструментальных погрешностей исходных данных на результаты моделирования;
• процедуры обобщения описаний ситуаций с учетом пространственно-временных отношений между элементами ситуаций, использующие библиотеку пространственновременных функций (ПВФ).
Синтез и анализ типов ситуаций. В результате классификации ситуаций по разработанным для ССМ алгоритмам [5] генерируется большое количество классов ситуаций, полученных для различных объектов принятия решений (ОПР) и различных листьевых объектов фрагментов. С целью аккумуляции знаний о результатах классификации в ССМ предлагается использовать средства обобщения описаний ситуаций по синтезированным типам этих ситуаций. Этот способ конкретизирует общие рекомендации по построению иерархического описания ситуаций в системах ситуационного управления [6]. Аналогично описанию полной ситуации обобщенное описание каждой достаточной ситуации строится на основе перечисления входящих в нее листьевых объектов и ОПР, что однозначно ее определяет ввиду древовидности декомпозиции объектов СКМ. Для синтеза обобщенного описания ситуации на первом уровне иерархии описаний применяется та же процедура, которая обеспечивает генерирование типов исполнителей объектов по типам приписанных к ним процессов [5]. Исходные данные в ней -типы листьевых объектов и ОПР исследованных достаточных ситуаций, а результат работы -
108
ВЕСТНИК Кольского научного центра РАН 4/2015(23)
Интерпретация концептуальной модели...
уникальный тип достаточной ситуации, дополненный порядковым номером ее класса и ее номером в этом классе. В отличие от лексикографического порядка, который используется при генерации типов исполнителей объектов, здесь типы объектов, входящих в ситуацию, упорядочиваются по их положению в дереве объектов (4). Порядковый номер класса определяется номером ресурса, доминирующего в этом классе, согласно списку выходных ресурсов ОПР, а порядковый номер ситуации в пределах класса задается ее предпочтительностью [5]. Оптимальная достаточная ситуация данного класса получает номер 1. Абсолютной шкалой классификации ситуаций естественно считать их классификацию по глобальному критерию качества, то есть по принадлежности к тому или иному классу ситуаций, обеспечивающих доминирование одного из выходных параметров глобального объекта СКМ по обобщенным затратам [5], которые рассчитаны по критерию качества ОПР этой достаточной ситуации. Первым ключом при построении типа ситуации выбран ее порядковый номер в пределах класса, затем идет номер ОПР, затем - индексы типов списка листьевых объектов, а в конце - номер класса. Описанный порядок индексации использован для удобства формирования запросов типа: «Найти среди оптимальных достаточных ситуаций некоторого заданного уровня ситуацию, составляющую подграф такой-то глобальной оптимальной ситуации», которые типичны при решении задач координации управлений на различных уровнях принятия решений.
Задача обобщения описаний ситуаций в ССМ на основе типов ситуаций включает два основных этапа: поиск общих признаков ситуаций, попавших в один класс для каждого исследованного фрагмента КМПО, и поиск вхождений ситуаций в ситуации более высоких уровней (высота уровня здесь задается уровнем нахождения ОПР). Общая схема рассуждений при обобщении вполне вписывается в идеологию ДСМ-метода [9]. Однако программная реализация ДСМ-метода в ССМ потребовала бы весьма значительных объемов программирования, поэтому был применен вероятностный механизм вывода, реализованный в оболочке ОЭС ССМ [5], то есть вместо оценок обоснованности тех или иных гипотез, вычисляемых согласно ДСМ-методу, использованы специальные функции пересчета условных вероятностей причинно-следственных связей между конфигурациями достаточных ситуаций и результатами их классификации.
Как следует из изложенного способа типизации ситуаций в ССМ, описания достаточных ситуаций, классифицированных по одному фрагменту КМПО, качественно различаются списками своих листьевых объектов, которые все вместе образуют разбиение множества листьевых объектов использованной при построении фрагмента полной ситуации. Поэтому при обобщении их описаний в основном применяются метод сходства и метод различия, причем в качестве предпосылок используются подстроки конкатенации типов листьевых объектов. Результаты обобщения формируются в виде двух наборов правил, в первый включаются положительные примеры, во второй - отрицательные. По формулам, аналогичным пересчету априорных вероятностей в апостериорные [10], наличие положительных примеров приводит к повышению условной вероятности соответствующего правила, причем степень увеличения пропорциональна порядковым номерам ситуаций, использованных в данном примере, а наличие отрицательных примеров в той же степени уменьшает условную вероятность правила. После окончания первого этапа обобщения отбраковываются правила с вероятностью меньше 0.5.
На втором этапе обобщения отыскивается сходство между ситуациями различных уровней. Применяется тот же механизм обобщения, но синтезируемые правила отражают условные вероятности появления достаточных ситуаций нижних уровней декомпозиции в составе достаточных ситуаций более высоких уровней и, в частности, глобальных достаточных ситуаций путем оценки частости вхождения типов нижележащих ситуаций в типы вышележащих. Таким образом делается попытка сопоставить между собой классы ситуаций, составленные для ОПР различных уровней, что при достаточном количестве обучающих примеров позволяет составить
ВЕСТНИК Кольского научного центра РАН 4/2015(23)
109
А.Я. Фридман
иерархическую классификацию достаточных ситуаций с указанием ситуаций, оптимальных для перевода объекта в некоторое состояние из заданного класса.
Еще одна группа правил ориентирована на оценку эффективности заложенных в КМПО альтернатив. Идея поиска заключается в следующем: степень эффективности той или иной альтернативы (как для процессов, так и для объектов) тем выше, чем шире набор классов ситуаций, в которые попадают достаточные ситуации с различными вариантами данной альтернативы. И обратно: если ни один из имеющихся вариантов выбора не меняет класс достаточной ситуации, то данная альтернатива не предлагается пользователю при расширении минимальных полных ситуаций, по крайней мере, для того же самого ОПР, что позволяет ускорить процесс классификации ситуаций. С другой стороны, желательно уметь заранее определять тот набор свойств, которыми обладают самые «радикально действующие» альтернативы, а точнее, несколько наборов - для каждого потенциально желательного варианта изменения областей доминирования.
Все полученные в ходе обобщения правила (по терминологии ситуационного управления они относятся к логико-трансформационным правилам) хранятся в ЭС ССМ и используются как управляющие формулы в процессе классификации ситуаций. Следует отметить еще одну особенность разработанного вероятностного механизма вывода - возможность снизить влияние погрешностей исходных данных на результаты обобщения ситуаций путем учета вероятности ошибочного отнесения ситуации к тому или иному классу. Рассмотрим основную идею его применения для повышения достоверности обобщения ситуаций.
При классификации достаточных ситуаций некоторого фрагмента СКМ могут возникать ошибки из-за структурной неустойчивости процесса вычисления затрат при их передаче между элементами модели. Например, если в КМПО допускаются циклы по ресурсам, то при изменении текущего значения какого-либо участвующего в цикле ресурса класс достаточной ситуации, где рассчитываются затраты по этому ресурсу, может значительно измениться, что, по мнению автора, нарушает устойчивость процедур классификации и обобщения. Такие ситуации предлагается отбраковывать из процедур обобщения, для чего в ССМ рекомендуется применять процедуры проверки зависимости результатов от возможных погрешностей моделирования. Если при анализе влияния погрешностей моделирования для некоторого ресурса СКМ выявлено превышение доли изменения затрат на выходе ОПР по сравнению с долей тестового изменения текущего значения ресурса, такой ресурс рассматривается как недостоверный, вероятность сбоя при его использовании для классификации принимается пропорциональной степени упомянутого превышения. Если вероятность сбоя превышает заданное пороговое значение (по умолчанию используется пороговая вероятность 0.3), то данный ресурс исключается из процедур классификации. В противном случае классификация ситуаций все же проводится, но с учетом вероятности сбоев, что в принципе приводит к снижению контрастности процедур классификации и, как следствие, к снижению вероятности включения ситуаций с участием недостоверного ресурса в категорию оптимальных или весьма предпочтительных.
Анализ пространственно-временных зависимостей. Работа с пространственно-временными зависимостями осуществляется с помощью библиотеки пространственно-временных функций (ПВФ) - программных модулей, обеспечивающих выборку из соответствующих баз исходных данных (БИД) релевантной информации для текущего запроса, занесение этой информации в основную БД и ее обработку для принятия решения об истинности или ложности условия, формирующего запрос. Поэтому в общем случае программа каждой ПВФ включает три части: драйвер БИД, организующий интерфейс основной БД и БИД, программу записи результатов запроса в основную БД и программу интерпретации результатов запроса. При этом изменение предметной области приводит к необходимости модифицировать только драйверы БИД.
Все ПВФ имеют выход логического типа, то есть возвращают ответ «да» или «нет» в результате анализа входящего в них логического условия. Разработаны два вида временных и три вида пространственных функций.
110
ВЕСТНИК Кольского научного центра РАН 4/2015(23)
Интерпретация концептуальной модели...
Временная функция ИНТЕРВАЛ поддерживает выборку ретроспективных данных за некоторый промежуток времени, ее синтаксис таков:
в_течение (<условие>,<начало>,<конец>,<доля>), (19)
где <условие> может иметь вид:
<имя> <знак> <подсписок_значений (n)>, (20)
оно определяет контролируемую характеристику элемента массива;
<начало> и <конец> задают соответственно начальный и конечный моменты интервала проверки (их отстояние в прошлое от текущего момента времени);
<доля> определяет минимальный допустимый процент (количество) элементов среди всех анализируемых, которые должны удовлетворять <условию>, чтобы функция (19) дала утвердительный ответ на запрос.
Если введено нулевое значение параметра <начало>, проводится анализ всей имеющейся информации до момента времени <конец>. Аналогично, при нулевом значении параметра <конец>, анализируются данные от момента <начало> до текущего момента времени. При совпадении величин <начало> и <конец> рассматривается только один момент времени в прошлом.
Следующая функция позволяет провести временную привязку хранимых данных
к заданному в запросе моменту времени:
момент (<условие>,<время>,<доля>), (21)
где <условие> и <доля> формируются аналогично функции (19), а <время> - фиксированный момент времени, для которого производится операция.
Пространственные функции записываются в форме:
соседние (<условие>,<доля>) (22)
и
сходные (<условие>,<доля>,<параметры_сходства>). (23)
Параметры <условие> и <доля> задаются как в функциях (19), (21); различие между видами пространственных функций заключается в критерии отбора элементов для совместного анализа: в функции (22) анализируются элементы, примыкающие к текущему геометрически, в функции (23) отбираются элементы, имеющие одинаковые с текущим элементом значения <параметров_сходства>, выбираемых из списка имен существующих параметров и переменных. Например, в приложении ССМ к задаче прогнозирования горных ударов <параметр_сходства> имел имя «разлом» и использовался для совместного анализа характеристик элементов объекта, принадлежащих к тектоническому разлому.
Функция БЛИЖАИШИИ предназначена для определения объекта, имеющего наиболее близкие пространственные координаты к заданным. Функция возвращает утвердительный ответ, если координаты объекта попадают в заданную окрестность. Функция имеет следующий вид:
ближайший (<условие>,<координаты>,<допуск>), (24)
где параметр <условие> имеет уже описанный смысл, параметр <координаты> описывает пространственные характеристики точки привязки, параметр <допуск> задает допустимое удаление по пространственным координатам от указанной точки.
ПВФ можно использовать только в частях ЕСЛИ правил и управляющих формул ЭС. Так как все ПВФ имеют выход логического типа, допускается однократная вложенность различных ПВФ друг в друга, то есть запросы вида
соседние (сходные (<условие>,<доля1>,<параметры_сходства>),<доля2>). (25)
При этом драйвер БИД генерирует запрос, по которому вначале отбираются элементы, удовлетворяющие самой внутренней ПВФ, затем из них отбираются удовлетворяющие более внешней, и т.д. Характеристики отобранных элементов переписываются в БД (эта информация используется в режиме объяснения), интерпретатор вычисляет выходное значение ПВФ, которое заносится в базу правил. Вложенные запросы представляют наибольший интерес, так как
ВЕСТНИК Кольского научного центра РАН 4/2015(23)
111
А.Я. Фридман
позволяют путем комбинирования ПВФ оценивать совместно пространственные и временные характеристики исследуемого объекта.
Описанные выше ПВФ обеспечивают анализ достаточно широкого класса
пространственно-временны'х соотношений между характеристиками элементов объекта экспертизы, однако в зависимости от специфики предметной области возможна разработка и других ПВФ.
В отличие от правил, генерируемых при обобщении ситуаций по их типам, правила обобщения рассматриваемой здесь группы относятся не к ситуации в целом, а к отдельным объектам, процессам или даже ресурсам СКМ. В слоты ПВФ <условие>
и <параметры_сходства> можно включать логические условия и различные характеристики элементов СКМ, в том числе типы и категории этих элементов. В ССМ не предусмотрено автоматических процедур генерации подобных правил, они конструируются пользователем, и вероятности в них пересчитываются в ходе классификации аналогично изложенному выше.
Заключение
На основе введенных формальных определений различных видов ситуаций, возникающих при моделировании СДО, разработана его иерархическая модель, включающая: формальную систему - СКМ и интегрированную с ней ЭС - со множеством базовых элементов (7)—(10), набором синтаксических правил порождения одних элементов СКМ другими в виде отношений типа (7), (8), системой аксиом (15), (16) и правилами вывода (17), (18), а также правила изменения компонентов этой формальной системы в зависимости от целей моделирования и сложившейся на объекте исследования ситуации, задаваемые посредством выбора соответствующих фрагментов СКМ и управления выводом в ЭС ССМ. СКМ относится к семиотическим (знаковым) моделям, поскольку в ней разработаны три группы логикотрансформационных правил - пополнения, классификации и обобщения ситуаций.
Отличия предложенной модели состоят в интеграции средств, ориентированных на исследование СДО, что обеспечивает совместную логико-аналитическую обработку данных и ситуационный анализ состояния изучаемого объекта с применением экспертных знаний и учетом пространственно-временных зависимостей в характеристиках СДО, выполняемых с использованием картографической информации.
ЛИТЕРАТУРА
1. Кузьмин И.А., Путилов В.А., Фильчаков В.В. Распределенная обработка информации в научных исследованиях. Л.: Наука, 1991. 304 с. 2. Цикритзис Д., Лоховски Ф. Модели данных. М.: Финансы и статистика, 1985. 420 с. 3. Самарский А.А. Введение в численные методы. М.: Наука, 1987. 288 с. 4. Бржезовский А.В., Фильчаков В.В. Концептуальный анализ вычислительных систем. СПб.: ЛИАП, 1991. 78 с. 5. Фридман А.Я. Ситуационное управление структурой промышленно-природных систем. Методы и модели. Saarbrucken, Germany: LAP LAMBERT Academic Publishing, 2015. 530 с. 6. Поспелов Д.А. Ситуационное управление: теория и практика. М.: Наука, 1986. 288 с. 7. Митчел Э. Руководство ESRI по ГИС-анализу. 1999. Т. 1. 190 с.
8. Концептуальное моделирование информационных систем / под ред. В.В. Фильчакова. СПб.: СПВУРЭ ПВО, 1998. 356 c. 9. Автоматическое порождение гипотез в интеллектуальных системах / сост. Е.С. Панкратова, В.К. Финн. М.: ЛИБРОКОМ, 2009. 528 с. 10. Darwiche A. Modeling and Reasoning with Bayesian Networks. Cambridge University Press, 2009. 526 p.
Сведения об авторе
Фридман Александр Яковлевич — д.т.н., профессор, ведущий научный сотрудник Института информатики и математического моделирования КНЦ РАН; e-mail: fridman@iimm. kolasc.net.ru
112
ВЕСТНИК Кольского научного центра РАН 4/2015(23)