Научная статья на тему 'Методы анализа и синтеза информационной системы распознавания образов'

Методы анализа и синтеза информационной системы распознавания образов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
191
15
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Амиргалиев Е.Н., Амиргалиева С.Н.

В данной работе рассматривается разработка концептуальной модели информационной системы распознавания и классификации на основе математических методов и моделей распознавания образов и классификации, предназначенная для анализа и обработки многомерных данных. Методология разработки информационной системы реализована с использованием объектно-ориентированного подхода и осуществлена на языке моделирования сложных программных систем унифицированного языка моделирования UML. Рассмотренная концепция построения информационной системы может быть использована в разных предметных областях, как современная концепция разработки подобных информационных систем. Для реализации проектных решений использовано CASE-средство

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Амиргалиев Е.Н., Амиргалиева С.Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Rational Rose.In the given work development of information system conceptual model of recognition and classification on the basis of mathematical methods and models of image recognition and classification, intended for the analysis and processing of multidimensional data is considered. The methodology of working out of information system is realised with use of the object-oriented approach and carried out in language of modelling of complex program systems the unified language of modelling UML. The considered concept of construction of information system can be used in different subject domains, as the modern concept of working out of similar information systems. For realisation of design decisions it is used CASE-means Rational Rose.

Текст научной работы на тему «Методы анализа и синтеза информационной системы распознавания образов»

УДК 5019.7

МЕТОДЫ АНАЛИЗА И СИНТЕЗА ИНФОРМАЦИОННОЙ СИСТЕМЫ РАСПОЗНАВАНИЯ ОБРАЗОВ

© Амиргалиев Е.Н., Амиргалиева С.Н.

Казахстан, Алматы, КазНТУ им. К.И.Сатпаева, КБТУ e-mail: amir_ed@mail.ru

Abstract. In the given work development of information system conceptual model of recognition and classification on the basis of mathematical methods and models of image recognition and classification, intended for the analysis and processing of multidimensional data is considered. The methodology of working out of information system is realised with use of the object-oriented approach and carried out in language of modelling of complex program systems - the unified language of modelling UML. The considered concept of construction of information system can be used in different subject domains, as the modern concept of working out of similar information systems. For realisation of design decisions it is used CASE-means Rational Rose.

Введение

В быстроразвивающейся сфере разработки объектно-ориентированных приложений становится все труднее и труднее создавать и поддерживать приложения, обладающим высоким качеством, укладываясь при этом в разумные временные рамки. Унифицированный язык моделирования (Unified Modeling Language, UML) появился как ответ на потребность в универсальном языке объектного моделирования, который могла бы использовать любая компания. UML - это технология моделирования сложных программных систем, принятая в современная технология в индустрии информационных технологий. Это метод детального описания архитектуры системы. С помощью нотации UML легче создавать и сопровождать систему, вносить в неё требуемые изменения и совершенствовать ее далее.

Язык UML, пришедший на смену многочисленным системам нотации и методикам проектирования, предложил нотацию для описания объектно-ориентированных моделей, которая стала промышленным стандартом. Однако для эффективного применения нотации UML необходимо сочетать ее с каким-либо методом объектно-ориентированного анализа и проектирования.

В описываемом методе сочетаются прецеденты использования, статическое моделирование, и диаграммы последовательности событий, которые встречаются в нескольких методах. Применяемая нотация основана на UML. В ходе моделирование прецедентов определяется функциональное требование к системе в терминах актеров и прецедентов. Статическая модель предлагает статический взгляд на информационные аспекты системы. Класс определяется в терминах своих атрибутов и взаимоотношений с другими классами. Результатом динамического моделирования является динамический взгляд на систему. Уточняются сформулированные ранее прецеденты с целью показать взаимодействие объектов, участвующих в каждом из них. Разрабатываются диаграммы кооперации и последовательности, отражающие кооперацию

объектов в каждом прецеденте. Зависящие от состояния аспекты системы описывается с помощью диаграмм состояний, причем для каждого объекта составляется своя диаграмма.

В качестве математического обеспечения разрабатываемой системы рассмотрены математический аппарат решения задачи распознавания и классификации, задачи групповых классификации и оптимизационные модели, использующие различные виды функциоалов качества.

1. Постановка задачи классификации Zk

Пусть задана начальная информация I, {S} - множество допустимых объектов и каждый объект Si £{5} , i=l,..., т характеризуется n-мерным вектором, координаты которого называются признаками, взятыми из алфавита признаков, т.е.

Si=(ail,ai2,....,ain), i=l,..., т , п - число признаков, aijEMj .

Требуется построить алгоритм классификации А для множеств // (S) , S}, классифицирующий исходное множество объектов S на ряд непересекающихся классов (кластеров), Kj. j /..... I, так чтобы объекты, принадлежащие к одному классу (кластеру) были сходными (близкими), в то время как объекты, принадлежащие различным классам, были в некотором определенном смысле непохожими (удаленными):

I

.\{HS).S} = [jKrK;f)Kl 0.

3 = 1

если 'кф'}, г, j=l, 2,..., I.

Построение кластеров можно рассматривать как задачу распознавания образов без учителя, учитывая, что на заданном множестве объектов, как правило, отсутствует всякая информация, касающаяся числа классов и структуры классов.

При построении алгоритмов по принципу минимума расстояния, отыскание кластеров и определение эталонов являются вопросами первостепенной важности. При построении таких алгоритмов, как правило, используются два подхода. Один из них - эвристический, и в его основе лежит интуиция и опыт. Второй подход предусматривает минимизацию или максимизацию некоторого выбранного показателя качества классификации.

В моделях групповых классификации введена метрика, используемая в пространстве классификаций. Рассмотрим задачу синтеза групповой классификации '/, ■. Пусть А\,..., Ат G ■{. 1} - исходный набор алгоритмов решения задачи классификации Zk для множества объектов М = {Su Sn}.

Результатом применения алгоритмов Ai к множеству (М, ./ (Л /)) являются классификации h'i(M) е Л/). Л/)- пространство классификаций конечного множества объектов Л/, элементами которого являются отдельные классификации. Пусть определена метрика (1(/\~'. К'') в :,)i( Л/) и .г:(/о v;;"lf/(A-.AY). Кг = Кг(М), К (г Ш(М).

Тогда основная задача группового синтеза (групповых классификации) Z( ■ состоит в следующем. Найти классификацию К*(М) б Ш(М), минимизирующую функционал <р(К), т.е.

<р{К*) = min <р(К), К е Ш(М).

Рассмотрим пространство классификаций 9?(М) множества М. Известно, что по любой классификации К е Л/) можно построить соответствующее ей бинарное отношение R, которое является отношением эквивалентности на множестве М. Также, любому отношению эквивалентности R(M) на множестве М однозначно соответствует классификация Ш(М) для М.

Будем рассматривать стандартное представление классификаций К(М) 87 Ш(М) в виде конечного множества классов А",; (Л/) - подмножеств множества М, т.е. К(М) = {К\{М)1 К2(М),..., Ki(M)} и значит для описания классификации достаточно перечисления номеров объектов, попавших в каждый из классов. Причем, как будет показано ниже, способ нумерации классов может быть произвольным для полученной любой классификации, и не влияет на результат их сравнения. При таком представлении классификаций для решения задачи Х( ■ нужно иметь метрику в 9?(М), которая бы достаточно полно отражала реально существующие в данном пространстве расстояния, и исследовать свойства пространства Л/), являющегося структурой.

Обозначим через К'(М) множество классификаций Л/ па /.!</<„ классов, т.е. и"=1 К1{М) = Л/). Пусть /\"„(/)- произвольная классификация из Л/). Зададим отображение d : К(М) х К(М) -)• Z с помощью следующей формулы:

d(KZ(Q,KZ(lv)) = 2n-Y!;=1 max {П I }-

- Eil max { I Klßv) П RIß;) I } ,

где KKk) = { K^ik),Kljßt) } , 1 < lt < n, te {u.,v}.

Введенная метрика обладать свойствами метрики[3].

Концептуальная модель информационной системы распознавания и классификации. Концептуальная схема разработанной информационной системы распознавания и классификации показана на рисунке 1,

Кратко опишем функциональные назначения подсистем, входящих в состав системы: Подсистема Справка-Help представлена как справочная система. Показывает справку о функциональных возможностях, как отдельных подсистем, так и системы в целом; Управление - подсистема представляет программный интерфейс процесса управления проектируемой системы; База данных ^Совокупность ряда таблиц для хранения данных необходимых для системы; Подсистема предварительной обработки предназначена для предварительной обработки исходных данных: определения незаполненных данных и определение оптимальных подсистем признаков в описании объектов; определение информативных признаков;

Модели и алгоритмы классификации осуществляет работу алгоритмов классификации, составляющих базовый набор для системы; Модели группового синтеза представляет работу алгоритмов группового синтеза, реализованных в рамках системы; Визуализация результатов представляет результаты работы,

Рис. 1. Концептуальная модель системы распознавания и классификации

как подсистем, так и системы в целом для пользователей в нужном формате: Анализ и оценка результатов предназначена для анализа и оценки результатов на основе показателей выбранных видов функционалов качества и представляет основу для выработки рекомендации об использовании различных вычислительных схем: Подсистема ГИС моделирование представляет возможности использования разработанных методов, алгоритмов группового синтеза в рамках геоинформационного моделирования.

На рисунке 2 приведена функциональная модель информационной системы распознавания и классификации с применением методологии функционального анализа и проектирования системы SADT - (Structured Analysis & Design Technique). На диаграмме указана схема передачи управляющих параметров входных и выходных данных для каждой подсистемы.

В рамках информационной системы, в зависимости от постановок задач пользователя, можно осуществить оптимизационные процедуры, используя конкретный вид функционалов качества. Схема проведения оптимизационных процедур осуществляет подсистема Анализ и оценка (Рисунок 3).

В рамках данной схемы возможны следующие модели оптимизации (применяются различные комбинации алгоритмов, моделей группового синтеза, функционалов качества): одноуровневая модель Ml {(М k, Aj, F t ): к=1, ..., N; j=l,..., М; t=l,..., N.}; двухуровневая модель N12 {(М к, Aj, Z ci, F t ): k=l, ..., N; j=l,..., M; i=l,.. ., T; t=l,.. ., K.}.

Установление параметров

м

Начальная обработка —

полное

описание

объектов

А лгорит м модели

НС модели

Фу н кцион а ль ныи блок

инфср* вектор;

Групповой синтез

обобщенный информационный uwihj-

оценка

качества

решения

Анализ и

оценка

ГИС ПрИЛОЖ.

результат

R

Рис. 2. Функциональная модель системы распознавания и классификации

Исходная информация

Ал горитмичес кие модели

Модели

группового

синтеза

коррекция результатов

Критерия

оценки

качества

Рис. 3. Схема оптимизационных процедур (двухуровневая модель). Здесь: Ь'Ш - множество исходных данных, АМ - алгоритмы классификации, модели группового синтеза, РК - функционалы качества.

В процессе моделирования системы использованы следующие виды диаграмм (нотации) UML: диаграммы, прецедентов (use case diagram) представляет функциональность и поведение разрабатываемой системы, позволяет определить требования к системе, определить действующие в системе объекты и основные задачи, выполняемые этими объектами (отображение сценариев): диаграммы, классов (class diagram,) обеспечивают статическое проектное представление системы: диаграммы, кооперации

(collaboration diagram,) описывают взаимодействие объектов, абстрагируясь от последовательности передачи данных, отражаются все принимаемые и передаваемые сообщения конкретного объекта и типы этих сообщений: диаграммы, последовательности (sequence diagram,) позволяют определить последовательность передачи сообщений между объектами, показывают поток сообщений: диаграммы, состояний (state, diagram,) предназначены для отображения состояний объектов системы, имеющих сложную модель поведения.

Для управления функционированием системы создается, так называемый сеанс обработки, диаграмма прецедентов которой показана па рис, 4,

Сеапс, обработки - выбор вычислительного процесса и формирование совокупности входных и выходных данных для определенной подсистемы и сам процесс обработки данных. Входные данные - исходные данные, список алгоритмов и параметров, Исходные данные - подмножество входных данных подсистемы, которое является общим для всех алгоритмов этой подсистемы. Структура исходных данных регламентируется подсистемой. Список алгоритмов - подмножество алгоритмов подсистемы, которые выполняют обработку в данном сеансе. Параметры - подмножество входных данных подсистемы, которое по является общим для всех ее алгоритмов. Параметры группируются по алгоритмам. Каждый алгоритм объявляет свой набор параметров и их структуры. Выходные данные - совокупность кодов возврата и результатов. Каждый выполнявший обработку алгоритм ассоциируется с кодом возврата и результатом. Код возврат,а - числовое значение, обозначающее статус окончания алгоритма.

Рис. 4. Диаграмма прецедентов для сеанса обработки

Представим описания некоторых прецедентов, приведенных па рисунке 4,

Создать сеанс - создание нового сеанса. Предусловие - система незапущена или сеанс находится в состояний новый. Основной поток событий: пользователь, запуская программу, или, используя элементы управления пользовательского интерфейса запущенной программы, создает новый сеанс .пользователя. Пост,условие -система находится в состоянии Новый сеанс.

Открыть сеанс — открытие предварительно созданного сеанса. Предусловие-сеанс в состояний Новый или Рабочий. Основные потоки событий: 1)пользователь выбирает файл сеанса; 2) файл открывается для чтения; 3)сеанс инициализируется данными из файла; 4) файл закрывается. Альтернативный поток событий-различные ошибки ввода-вывода. Выводится соответствующее сообщение. Постусловие - сеанс переходит в состояние Рабочий.

Работать с сеансом — работа с сеансом. Предусловие- сеанс в состоянии Новый или Рабочий. Основные потоки событий:!) вводит данные; 2) обрабатывает данные; 3) просматривает результаты обработки. Альтернативный поток событий -различные ошибки при работе соответствующих подсистем. Выводится соответствующее сообщение. Пост,условие - сеанс переходит в состояние Работающий, а затем в Рабочий.

Также по указанной схеме описываются и другие прецеденты сеанса обработки, указанные на диаграмме прецедентов (Рисунок 4).

Заключение

Таким образом, в данной работе мы показали некоторые аспекты моделирования информационной системы распознавания и классификации с применением унифицированного языка моделирования. Для реализации проектных решений использованы инструментарии CAS Е- средства Rational Rose.

Разработанная информационная система применена для решения реальных прикладных задач из области гидрогеологии, экологического мониторинга с использованием данных дистанционного зондирования и геологии.

список литературы

1. Г. Буч Объектно-ориентированный анализ и проектирование. - М.: «Издательство Бином», 1999.

2. Уэнди Боггс Rational Rose & UML. - M.: «Издательство Лори», 1999, - 480с.

3. Айдарханов М.Б., Амиргалиев E.H. Алгоритмические основы построения систем классификации. - Алматы, 1998. - 100с.

4. Вендров A.M. Проектирование программного обеспечения ЭИС. - М.: 2000, - 290 с

Статья поступила в редакцию 27.04-2008

i Надоели баннеры? Вы всегда можете отключить рекламу.