Научная статья на тему 'Открытость структур в эволюционной модели данных'

Открытость структур в эволюционной модели данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
85
30
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Открытость структур в эволюционной модели данных»

лений - 30; турнирная селекция (3 индивида в турнире); равноточечная рекомбинация; средняя мутация; максимальное количество скрытых нейронов - 10; скорость миграции - 2 индивида; синхронная миграция с интервалом в 3 поколения; схема миграции - для перемещения случайным образом отбираются недоминируемые индивиды; замещаются индивиды с наименьшим значением функции пригодности.

В результате решения данной задачи была получена аппроксимация Парето-множества - множество из 16 нейросетевых моделей с ошибкой настройки от 3,42 до 3,74 % и вычислительной сложностью, лежащей в пределах от 357,04 до 369,27. Приближение фронта Парето на последнем поколении ГА показано на рисунке.

Таким образом, полученные результаты свидетельствуют об эффективности применения

предложенного модельно-алгоритмического и программного обеспечения к решению задач ней-росетевого моделирования. Разработанная система автоматизации проектирования ИНС многокритериальными ПГА позволяет значительно ускорить процесс построения нейросетевых моделей, повысить их качество и предоставить возможность выбора нейросетевой модели из множества альтернатив, исходя из требуемой точности и имеющихся вычислительных ресурсов.

Литература

1. Гладков Л.А., Курейчик В.В., Курейчик В.М. Генетические алгоритмы. М.: Физматлит, 2006. 320 с.

2. Cantu-Paz E. Designing scalable multi-population parallel genetic algorithms // IllGAL Report 98009. The University of Illinois, 1998, pp. 82-122.

3. Гонебная О.Е. Экспертная система рудно-термической плавки: дисс. ... канд. технич. наук. Красноярск: ГУЦМиЗ, 2004. 136 с.

ОТКРЫТОСТЬ СТРУКТУР В ЭВОЛЮЦИОННОЙ МОДЕЛИ ДАННЫХ

В.В. Дрождин, к.т.н. (Пензенский государственный педагогический университет им. В.Г. Белинского, [email protected])

Рассмотрена проблема открытости структур данных в эволюционной модели данных и предложены методы реализации открытости структур как вверх до формирования единой структуры данных локальной системы, так и вниз до байтов и битов, имеющих, по крайней мере, конструктивную семантику.

Ключевые слова: самоорганизующаяся система, информационная система, модель данных, эволюционная модель данных, структура данных, преобразование структур данных, операции над структурами данных, семантика данных.

Эволюционная модель данных (ЭМД) предназначена для создания активных самоорганизующихся информационных сред (СИС), способных самостоятельно поддерживать информационные модели с высокой степенью адекватности отражаемой предметной области в течение длительного времени. Это требует наличия в ЭМД очень мощных средств для организации информации об объектах различной структуры и сложности и возможности формирования представлений объектов с требуемой степенью детализации, включающих обобщенные (укрупненные, интегральные) показатели.

В [1] на основе системного подхода определяется пятислойная организация данных локальных систем. Эта организация данных является достаточно гибкой и может быть адаптирована для создания СИС. При этом различают структуры Я1, являющиеся целостными объектами-системами и представляющие один объект 1-го уровня, и структуры К1, являющиеся множествами допустимых структур Я1 [2].

В таблице приведены слои организации данных локальной системы с их описаниями.

Номер слоя Струк туры слоя Описание структур Отношения между данными Ограничения на данные

0 S0, R° Абстрактный тип данных - -

1 S1, R1 Допустимое подмножество абстрактного типа данных Ограничения на атомарные данные

2 S2, R2 Структура с жесткими (логическими) связями Отношения (взаимосвязи) между данными типа функциональных и многозначных зависимостей Ограничения на наличие и определен-ность ключей и др.

3 S3, R3 Структура, представляющая совместно используемые данные Отношения, определяющие совместное использование данных Ограничения на совместное использование данных

4 S4, R4 Структура, представляющая всю совокупность данных локальной системы Отношения, определяющие автономную совокупность данных Ограничения на автономность данных

Приведенные структуры конструктивно имеют следующие характеристики:

К0 - тип данных языка программирования или абстрактный тип данных, определенный и реализованный в системе, элементами которых являются атомарные объекты Я0;

К1 - подмножество базового типа К0, объекты Я1 которого получены по закону f (в частном случае тривиальному) из объектов Я0;

К2 - множество сложных объектов Я2, каждый из которых является композицией объектов Я1;

К3 - более сильно связанная (совместно используемая) часть объектов Я2 или совместно используемые Я2 и ранее созданные объекты Я3;

К4 - единственный объект Я4, представляющий всю взаимосвязанную совокупность данных 82 и Я3 локальной системы.

Можно провести определенную аналогию между структурами ЭМД и структурами реляционной модели данных (РМД) соответственно: Я1 -элемент домена; К1 - домен; Я2 - кортеж; К2 - отношение; Я3 - кортеж представления; К3 - представление; Я4, К4 - базы данных.

Как видно из характеристики структур и проведенной аналогии их со структурами РМД, открытость структур ЭМД вверх до формирования единой структуры, содержащей всю БД локальной системы, не содержит серьезных (логических) ограничений, следовательно, может считаться вполне приемлемой для организации данных в рамках ЭМД. Однако открытость структур вниз (до байтов и битов) ограничивается структурами К1, объекты Я1 которых обладают изначально минимальной семантикой в моделируемой предметной области и представляют, например, фамилии, адреса, даты рождения и др. Но возникшая потребность в более точном моделировании предметной области часто требует выделения отдельных компонентов из принятых изначально минимальных объектов, например, названия населенного пункта из адреса или фамилии из ФИО. Поэтому необходима разработка методов и средств, позволяющих декомпозировать целостные структуры Я1 на более мелкие подструктуры Я-1 с возможностью восстановления из них исходных структур Я1.

Для декомпозиции и согласования структур Я1 и Я-1 будем использовать две операции - 01 и Э-1, которые определим следующим образом:

Э;:8; ^(8-1,8-1); Э-1:(8-1,8-1) ^ Я1.

Операция Э1 осуществляет декомпозицию структуры Я1 на две более низкого уровня, Я-1 и Я2-1 , выделением по определенному закону из структуры Я1 подструктуры Я-1 и формированием оставшейся части структуры Я-1, а операция Э-1 выполняет композицию структур Я-1 и Я-1 в структуру Я1 по закону, обратному Э1. Из объектов

Я-1 и Я-1 формируются, соответственно, объекты К1-1 и К2-1 , которые в общей структуре объектов будут соответствовать объектам уровня К1.

Использование объектов К1-1 и К2-1 ничем не отличается от использования обычных объектов К1, и только для восстановления исходного объекта К1 необходимо применить ко всем объектам Я-1 и Я-1 операцию Э-1.

Последовательное применение операций Э1, Э2,..., ЭЩ, к остаточной структуре предыдущего

разбиения (01 :8; 02 :8-1; ^(Я-*^

:^-,1т-1 ^8-,1га,8-!1га}) позволяет декомпозировать исходную структуру Я1 на т+1 структур более низкого уровня, а последовательность операций Э-1, Э-1, •••, ЭШ1 восстанавливает исходный объект Я1, то есть

Э1 оЭ2 °...°эШ Я1 ^ ¿-1 ,...,8-Ш ,8-ш);

Э-1 оЭ-1 о-оЭт1:^-,; ¿-1 ,...,8-Ш ,8-Ш) ^ Я1.

В качестве простой операции Э1 может использоваться операция выделения одного или к первых слов из Я1, в результате чего Я1 разбивается на Я-1 и Я-1, причем в Я-1 может содержаться

не более одного или к слов, а в Я-1 - оставшаяся

часть строки Я1. При этом операция Э-1 будет выполнять конкатенацию, то есть приписывание в конец строки Я-1 строки Я-1.

В более сложных случаях операция Э1, например, может выделять различные компоненты адреса, заданного строкой символов, и некоторую подстроку из строки по заданному условию, декомпозировать числовое значение на два значения путем использования операции взятия по модулю и другие. Операция Э-1 всегда будет восстанавливать из объектов Я-1 и Я-1 исходный объект Я1.

Типы данных объектов Я-1 и Я-1, то есть объекты Я0 и 82, из которых формируются объекты Я-1 и Я-1, могут совпадать с объектом Я0, из которого формировался исходный объект Я1, или отличаться от него. Например, при выделении фамилии из ФИО как Я0, так и 8° и 82 являются строками символов, а при выделении почтового индекса из адреса Я10 может быть преобразован в целое число, но Я02 , как и Я0, останется строкой символов.

Семантика объектов 8-1 и 8-1 может быть

двоякой. Если для реализации операции Э1 используется поименованный запрос или хранимая процедура, то их имя присваивается объекту К1-1 , а объект К-1 будет иметь имя исходной структу-

ры К1. Поэтому после декомпозиции объекты Я-1 и Я-1 будут опять обладать семантикой в терминах предметной области.

Если же для реализации операции 01 используется общая часть часто задаваемых запросов, то объекту К-1 присваивается некоторое стандартное (внутрисистемное) имя и он будет обладать только конструктивной семантикой, которая отражает целостность и способ получения объектов Я-1. Интерпретации в предметной области объекты Я-1 в этом случае иметь не будут. Однако если при дальнейшем функционировании СИС встретится поименованный запрос, выбирающий все объекты Я-1, объекту К-1 будет присвоено имя

этого запроса и объекты Я-1 приобретут семантику в терминах предметной области.

Если операция 01 осуществляет разбиение объекта Я1 на Я-1 и Я-1, то после формирования объектов К-1 и К-1 путем применения 01 ко всем

К1 операция 01 становится тривиальной, а операция 0-1 - эквивалентной обычной операции композиции объектов Я1 и Я1 , что позволяет удалить специализированные операции 0 и 0- . Наиболее часто разбиением является деление строки на две подстроки. Например, после выделения из всех адресов почтового индекса могут считаться самостоятельными структурами К1 - «почтовый индекс» и К-1 - «адрес», операции выделения почтового индекса и восстановления полного почтового адреса могут быть удалены.

Проблема формирования обобщенных показателей существенно более сложная, поэтому в данной работе рассмотривается только простейший вариант обобщения объектов.

Простое обобщение можно сформировать на основе принципа совместного использования данных. Например, если имеются отдельные парамет-

ры «число», «месяц» и «год», «часы», «минуты» и «секунды» или «фамилия», «имя» и «отчество», а их данные в подавляющем большинстве случаев используются совместно, то целесообразно ком-позировать их в укрупненные параметры «дата», «время» и «ФИО» с указанием местоположения каждого отдельного параметра в укрупненном параметре. При этом отдельные параметры будут соответствовать структурам Я-1, Я-1 и Я-1, а укрупненный параметр - структуре Я1. Осуществление композиции укрупненного параметра из отдельных параметров будет соответствовать операции 0- , а выделение отдельных параметров из укрупненного параметра - операции 01.

Укрупнение параметров позволяет стандартно уменьшать количество компонентов в СИС без организации дополнительных слоев, что повышает эффективность обработки данных. Взаимообратные операции 0- и 0 , введенные для осуществления композиции и декомпозиции структур, являются операциями-шаблонами, для которых известны назначение, принцип действия и требования к исходным данным и результату. Особенности выполнения операций зависят от типов обрабатываемых данных и методов преобразования структур, поэтому их реализация на основе запросов пользователей будет определять возможности конкретных СИС в эволюции внутренней организации данных и достижении определенного максимума эффективности обработки данных.

Таким образом, открытость структур данных вверх и вниз в ЭМД позволяет создавать информационные модели предметной области с произвольной степенью детализации и последующим уточнением или огрублением этой модели с помощью средств, имеющихся в ЭМД.

Литература

1. Дрождин В.В. Системный подход к построению модели данных эволюционных баз данных // Программные продукты и системы. 2007. № 3. С. 52-55.

2. Система, симметрия, гармония. М.: Мысль, 1988. 315 с.

ОЦЕНКА ЭФФЕКТИВНОСТИ МЕТОДА КЛАСТЕРИЗАЦИИ, ИСПОЛЬЗУЮЩЕГО СУБЪЕКТИВНЫЕ ОЦЕНКИ

Г.П. Виноградов, к.т.н.; А.А. Мальков

(Тверской государственный технический университет, [email protected])

В статье приведены результаты исследования эффективности метода кластеризации, представляющего собой нейронную сеть, реализующую принципы самоорганизации. Метод предполагает использование субъективных оценок качества кластеризации, формируемых на основе визуализации результатов кластеризации. Сравнение работы предложенного алгоритма с известными аналогами на примере задачи Фишера показало, что количество ошибок колебалось на уровне от 1 до 3 процентов, но при этом пользователь за счет участия в процессе расчетов мог быстро интерпретировать полученные результаты.

Ключевые слова: кластеризация, нечеткие оценки, визуализация, нейронные сети, самоорганизация.

В последнее время возрос интерес к разработке гибридных кластерных процедур, сочетающих

кластерный анализ с другими методами анализа данных [1-3]. В работе [4] предложена схема гиб-

i Надоели баннеры? Вы всегда можете отключить рекламу.