Научная статья на тему 'Алгоритм построения ортогонального тезауруса объектно-ориентированной СУБД'

Алгоритм построения ортогонального тезауруса объектно-ориентированной СУБД Текст научной статьи по специальности «Математика»

CC BY
92
28
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Алгоритм построения ортогонального тезауруса объектно-ориентированной СУБД»

использования композиции вместо наследования. Поэтому прозрачный ящик заменятся черным. В связи с непрекращающимся потоком новых требований и стремление к всё более высокой степени повторной используемости, объектно-ориентированная программа должна вновь и вновь проходить через фазы экстенсивного роста и консолидации. От этого цикла никуда не деться. но хороший проектировщик применит изменения которые могут потребовать реорганизации. Он знает такие структуры классов и объектов позволят избежать реорганизации его проектов. Требования проанализированы и выявлены из них те, которые по всей вероятности изменятся на протяжении жизненного цикла программы и в проекте это учтено.

В паттернах проектирования нашли свое применение многие структуры, появившиеся в результате реорганизации. Использование паттернов на ранних стадиях проекта предотвратит реорганизацию в будущем. Но даже если вы не увидели, как применить паттерн, пока не создали всю систему, он все равно подскажет, как ее можно изменить.

Литература

1. C++ для профессионалов. - Солтер, Николас А., Клепер, Скотт Дж.: Пер. с англ. - М. : ООО «И.Д. Вильямс», 2006.

2. Приемы объектно-ориентированного программирования. Паттерны проектирования. -СПб: Питер, 2009.

3. Мартин Фаулер - Архитектура корпоративных программных - М.: «Вильямс», 2007. — С. 544.

УДК 004.9

АЛГОРИТМ ПОСТРОЕНИЯ ОРТОГОНАЛЬНОГО ТЕЗАУРУСА ОБЪЕКТНООРИЕНТИРОВАННОЙ СУБД

Чубухчиев Борис Христофорович, к.т.н., с.н.с., доц., Магаданский филиал Российского государственного гуманитарного университета, Россия, Магадан, [email protected] Логун Кристина Александровна, к.п.н., доц., Магаданский филиал Российского государственного гуманитарного университета, Россия, Магадан, [email protected]

1. Некоторые алгоритмы классификации состояния АИС

При исследовании систем различной степени сложности часто возникают проблемы, связанные с синтезом минимального числа информативных признаков с целью объективной идентификации их состояний для сокращения минимизации их описаний и поиска в СУБД.

Обычно такого рода задачи решаются методами теории распознавания образов и должны предшествовать задачам синтеза и анализа систем.

В соответствии с этим мы предложили и апробировали несколько процедур распознавания, которые на нашем материале по сравнению с классическим методом дискриминантного анализа дали несколько лучшие результаты при значительно меньшей сложности вычислительного алгоритма, доступного, кстати, для ручной реализации.

К таким процедурам распознавания мы относим процедуру оптимальной классификации состояния, которая включает в себя задачи минимизации описания эталонов посредством синтеза оптимальной по числу признаков (измерений) диагностической процедуры с использованием в качестве решающего правила критерия хеммингова расстояния. Для тех случаев, когда по исходному набору параметров все-таки не удается получить удовлетворительные результаты, можно использовать процедуру формирования «новых» понятий (комплексов исходных признаков), структура которых может быть ортогональна относительно заданного набора классов состояний.

2. Оптимальная классификация состояния АИС

106

При решении ряда практических задач возникает необходимость классификации состояния АИС как информационной модели функциональной системы в целях осуществления и выработки для каждого класса состояний оптимальной системы управляющих воздействий, переводящих систему в требуемое состояние.

Такая задача возникает, например, при технической и медицинской диагностике, при планировании эксперимента и относится также к классу задач теории распознавания образов.

Особенно важно при решении такого рода задач минимизировать количество измеряемых (исследуемых) признаков (параметров) при их достаточной для принятия решения информативности.

С этой целью может быть использован алгоритм информационно-логической классификации [3], который основывается на процедуре кодирования Шеннона-Фэно и его обучающая часть реализуется следующим образом.

Пронормируем элементы матрицы [а^^, относительно средних по каждому из параметров P каждой из подсистем L для каждого состояния k и получим новую матрицу [а*т]. По каждой из LM элементов этой матрицы вычислим значения неопределенности каждого из параметров

S

НМ = - „ a^^akLM (1)

k=1

по совокупности из S классов.

В качестве первого параметра при построении эталона (обучения) выбираем тот, неопределенность которого максимальна.

Производим квантование строки матрицы [а*т], соответствующей выбранному для этого шага параметру, относительно среднего a*LM по этой строке. Этой операцией исходная матрица [а*т] разбивается на две непересекающиеся подматрицы [а*1т](1) и [а*ут](2) так, что в них оказываются элементы, соответствующие разным наборам классов состояний: для одного из которых по выбранному параметру выполняется неравенство а*ут > a*jLM, для другого - а*^м < ajM.

На следующем шаге указанные процедуры повторяются для каждой из подматриц исходных параметров до тех пор, пока в каждой из них не останется по одному столбцу, соответствующему какому-либо одному классу состояния.

Полученный таким образом набор параметров с адаптивными порогами квантования (зависящими от точности классификации на этапе обучения), соответствующий каждому из S состояний, принимается в качестве эталонов, согласно которым и реализуется маршрут классификации.

При этом число необходимых и достаточных проверок N* (наблюдений, измерений) при классификации заключено в пределах

(S-1) > N* > log2S, (2)

где S - как и ранее, число классов состояний.

3. Синтез новой системы признаков состояния АИС

В некоторых случаях, например, когда число признаков (параметров) исследуемой системы или ее аналога - АИС - меньше числа классов ее состояния, т. е. когда P < S или множество параметров «размыто», по алгоритму информационно-логической классификации не удается получить удовлетворительные, в смысле точности, результаты классификации.

Для этого случая можно использовать алгоритм формирования понятий [2] - новых систем признаков, представляющих собой комбинацию исходных признаков, объединенных различными логическими операциями, например операциями конъюнкции и отрицания, что увеличивает количество «новых» признаков классификации и может привести к ортогонализации пространства признаков для совокупности классов состояний и, как следствие, к повышению точности классификации.

107

Предполагается, что в пространстве признаков (параметров) m€M для каждого из состояний k;GK, отображаемых в этом пространстве, существует хотя бы один признак (параметр) а**; , высказывание о котором при наличии класса состояния к; истинно, а относительно всех остальных классов состояний - ложно. Такие признаки могут быть определены следующим образом:

а*ТМ атЫ (атЫ ‘ аткЬ атЫ ‘ аmka, —, атк ‘ атку)

(3)

„ а*пку атку (атку ‘ аткЬ атку ‘ аmki), —, атку ‘ аткь

Выражение (3) непосредственно следует из условия отсутствия попарного пересечений признаков а*тк;, а*тф ..., а*тку. Если оно выполняется, задача считается решенной, так как для любого к;€к существует множество признаков а*тькСатьк , которое однозначно определяет фиксированный к;€К. Такое множество а*лТк назовем допустимым множеством признаков.

Можно предполагать, что в некоторых случаях из исходного массива признаков не удается выделить допустимое множество признаков. В этом случае необходим синтез нового допустимого множества а* *пТк признаков из исходного множества аЩгь

Известно, что количество логических функций от т переменных выражается числом 2 2™. Однако для решения поставленной задачи оно является избыточным, так как включает функции, не содержащие ортогональной комбинации, или функции, повторяющие исходные комбинации переменных, которые являются избыточными. Кроме того, в некоторых случаях могут быть избыточными дизъюнктивные комбинации параметров, так как эти логические отношения приведут к увеличению количества совместных признаков. Таким образом, из всех возможных комбинаций переменных (признаков) для дальнейшего исследования представляют интерес в основном лишь комбинации, содержащие операции конъюнкции и отрицания. В этом случае поиск допустимого множества признаков а*тТк сокращается и реализуется в виде проверки условий (3) или его другой эквивалентной формы, где вместо исходных признаков синтезируются признаки, связанные операциями конъюнкции и отрицания, и т. д.

Алгоритм поиска допустимого множества а*тькСатьк может быть реализован следующим образом.

Проверяют, существует ли среди исходных признаков признак, удовлетворяющий условию (3). Если да, то этот признак закрепляется за соответствующим классом. Поиск остальных признаков допустимого множества проводится среди оставшихся признаков множества атьк. Если такого признака не существует, производится синтез новых признаков (формирование новых понятий) из а*пьк путем соединения их попарно отношениями конъюнкции и отрицания. Для каждого «нового» признака проверяется условие (3), и если для части классов оно выполняется, то за ними закрепляются соответствующие «новые» признаки. Если синтезированные признаки не удовлетворяют условию (3) или удовлетворяют только для некоторых классов состояния, производится синтез следующих групп признаков (формирование следующего класса понятий) из признаков множества а**тТк, удовлетворяющих условиям (3) и т. д., до тех пор пока не будет найдена требуемая допустимая группа признаков либо пока формирование новых понятий станет невозможным.

Так как Cm ^1 при т = n, то на последнем шаге останется конечное число синтезированных признаков, и процесс выбора допустимого множества признаков по числу операций также будет конечен.

Однако ортогонализация описания классов (информативных признаков) состояний не гарантируется.

Пример. Описанная процедура иллюстрируется следующим образом. В эксперименте по классификации фаз травматического шока [1] из множества исходных параметров были выявлены 2 информативных параметра - 11 ОКС и 17 ОКС (оксикортикостероиды) с различными порогами квантования (пороги «1», «2», «3»). Оптимальный маршрут классификации пяти состояний представлен в таблице 1 и изображен на рис. 1. Здесь в кружках представлены информативные параметры 11ОКС и 17ОКС с оптимальными для каждого из них порогами квантования «1» - «3» .

108

Таб. 1. Оптимальный маршрут классификации по состояниям

Условные фазы шока Измеряемые параметры с порогами квантования «1» - «3»

11 ОКС (1) 11 ОКС (2) 17 ОКС (1) 17 ОКС (2) 17 ОКС (3)

I 0 1 - - -

II 0 0 - - -

III 1 - 0 - 1

IV 1 - 0 - 0

V 1 - 1 1 -

VI 1 - 1 0 -

Как видно из таб.1, при данной структуре можно ожидать наличия ошибок в классификации из-за сходства кодов, что в действительности имело место (процент ошибок составлял 7,7).

III

Рис. 1. Оптимальный маршрут классификации исследуемых состояний

Применяя к оптимальной по числу наблюдений системе признаков элементарные логические операции конъюнкции и отрицания, удалось получить ортогональную систему признаков (см. таб. 2) с нулевым (по критерию сходства кодов) процентом ошибок классификации.

Таб. 2. Ортогональная система признаков исследуемых состояний

«Новая» система признаков -информационных параметров Условные фазы шока

I II III IV V VI

Т Л 2 I

1 Л2 I

1 Л 5; Т Л 5; 1 Л 3 I

1 Л Т; 3 Л 5; 1 Л З I

1 Л ЗЛ 4 I

1 Л 4; 3 Л 4; 1 Л 3 I

На рис. 2 представлена блок-схема принятия решения по новой синтезированной системе признаков (табл. 2). В кружках представлены «новые» (синтезированные) признаки.

109

Рис. 2. Блок-схема принятия решения по ортогональной системе признаков

Литература

1. Чубухчиев Б. Х., Еремина С. А., Сааков Б. А. Некоторые результаты применения дискретной информационной модели для анализа характера регуляторных связей в элементах симпатоадреналовой системы // Механизмы некоторых патологических процессов. - Ростов н/Д : РГМИ, 1971. - Вып. 4. - С. 226-234.

2. Чубухчиев Б. Х., Чубухчиева З. С. Об одной процедуре формирования классификационных признаков // V Всесоюзный симпозиум по кибернетике : Материалы симпозиума. - Тбилиси, 1970. - С. 235-236. Тр. Санкт-Петербургского фил. ИУиЭ. - Магадан, 2004. - С. 97-107.

3. Чубухчиев Б. Х. Некоторые аспекты информационного моделирования систем // Вопр. техн. диагностики. - Ростов н/Д : РИСИ, 1983. - С. 150-159.

4. Чубухчиев Б. Х. Информационное моделирование функциональных систем. - Магадан: Кордис, 2007. - 197с.

УДК 004.414.2

ОБЪЕКТНО-ОРИЕНТИРОВАННОЕ ПРОЕКТИРОВАНИЕ ТЕМПОРАЛЬНЫХ

ИНФОРМАЦИОННЫХ СТРУКТУР

Колыхалова Евгения Владимировна, ведущий программист, Воронежский государственный архитектурно-строительный университет, Россия, Воронеж, [email protected]

Введение

Темпоральными данными принято называть любые данные, меняющиеся с течением времени.[1] При проектировании информационных систем наиболее часто специалисты сталкиваются с тремя различными ситуациями, в которых необходимо учитывать аспект темпоральности данных предметной области:

1. меняется большое число значений атрибутов экземпляра класса;

2. меняется несколько значений атрибутов экземпляра класса;

3. меняется связь между несколькими экземплярами классов [2].

Проектирование темпоральных данных будет различаться в зависимости от ситуации

(рис.1). В первом случае (рис. 1, а) будем считать, что меняется весь экземпляр класса. Для учета изменений экземпляра класса к атрибутам экземпляра необходимо добавить время.

а) б) в)

Рис. 1. Схемы проектирования темпоральных данных: а) меняется большое число атрибутов; б) меняется несколько атрибутов; в) меняется связь между экземплярами классов

110

i Надоели баннеры? Вы всегда можете отключить рекламу.