ISSN 1992-6502 (P ri nt)_
2015. Т. 19, № 1 (67). С. 258-263
Ъыьмт QjrAQnQj
ISSN 2225-2789 (Online) http://journal.ugatu.ac.ru
УДК 004.415
Метод проектирования адаптивного программного комплекса на основе методологии категорийной формальной модели открытой предметной области
В. В. Антонов
ФГБОУ ВПО «Уфимский государственный авиационный технический университет» (УГАТУ)
Поступила в редакцию 22 января 2015 г.
Аннотация. Задачи создания адаптивных открытых информационных систем с заданными характеристиками всегда принадлежали к числу труднорешаемых, в том числе из-за наличия взаимной зависимости бизнес платформ с информационной платформой уже на стадии проектирования. Огромная размерность возникающих при этом задач требует декомпозиции глобальных бизнес-целей в проекции на иерархию целей информационных. При этом остается открытым основной вопрос системного проектирования, а именно как, из общего описания глобальных бизнес-целей, не всегда согласованных и взаимоувязанных, получить максимально ориентированную на достижение данных целей информационную систему. Программное обеспечение, реализующее информационные процессы, постоянно взаимодействует как с внутренними, так и внешними факторами и, вследствие этого, должно постоянно повергаться модернизации.
Ключевые слова: семантическая модель; категория множеств; облачная обработка данных; программный комплекс; предметная область; big data; государственная услуга.
ВВЕДЕНИЕ
На данном этапе информатизации общества происходит массовое внедрение автоматизированных информационных систем (ИС) во все виды деятельности человека. Присутствует зависимость от правильности реализации разработчиками нормативной базы и соответствия ей формализованных алгоритмов. В связи с наличием больших объемов данных, представленных в плохо структурированном или не формализованном виде, хранением их во множестве разнообразных хранилищ, и все убыстряющимися темпами их обновления (так называемая проблема "Big data"), возникает задача учета семантики данных. Постоянная модернизация деятельности организаций и предприятий, изменения нормативной и правовой базы этой деятельности требуют адекватных изменений перечня прикладных функций, выполняемых информационной системой. При этом изменения этих функций конкретных подсистем не должны затрагивать другие подсистемы информационной системы, во избежание необходимости перепроектирования всей информационной системы. Предметная область содержит различные виды неопределенности, нечеткости и неточности. Сама же модель и разрабатываемое на
ее основе программное обеспечение не могут содержать неточности. Весь процесс формализации предметной области представляет собой жизненный цикл, который осуществляется по уровням (на верхнем уровне - объекты и отношения между ними, на нижнем - язык программирования и соответствующие словари).
Недостатком известных технологий и методологий анализа предметной области, препятствующим решению этой проблемы, остается сохранение семантического разрыва между полными представлениями о предметной области, моделями различных уровней и методологиями, которые применяются для выражения этих представлений в виде формальных спецификаций. Для сокращения и ликвидации семантического разрыва используют представление модели с использованием более высокого уровня абстракции. Это в данном случае связано с проблемой описания семантики, а именно представлением свойств отношений между математическими описаниями объектов. Применение теории категорий, позволяет описывать и свойства предметной области, накладывать на нее ограничения на основе более общего представления, не требующего фиксации несущественных деталей модели предметной области ранее, чем это необходимо (рис. 1).
Рис. 1. Теоретическая база методологий анализа предметной области
Предлагается формальный метод построения системной модели для предметной области, представляемой рядом известных научных категорий.
На основе такого подхода решается задача проектирования программного комплекса, определяются правила поиска класса сходных (похожих) моделей. Мерой кластеризации выступает схожесть структуры и соответствующий данной структуре алфавит (символьный). Для решения задачи в данной постановке более всего подходит математическая теория категорий множеств [1]. В основе такой модели лежит формальный графо-аналитический метаязык с символьным базисом и логикой нулевого порядка [2, 3].
МЕТОДОЛОГИЯ ПОСТРОЕНИЯ КАТЕГОРИЙНОЙ ФОРМАЛЬНОЙ МОДЕЛИ ПРЕДМЕТНОЙ ОБЛАСТИ
Рассмотрим подробнее процесс выбора объектов. На первом этапе число выделяемых объектов не велико, структура их сложная и не формализована. Однако могут быть выделены отношения между ними. Причем эти отношения могут носить нечеткий характер. Процесс будем многократно повторять. При этом будет расти число объектов с одновременным снижением их
структурной сложности, увеличиваться число отношений между объектами. В общем виде функция выбора представима в виде множества альтернативных объектов (выбранных по определенным условиям), которое, в свою очередь может быть представлено в виде суммы сведений о свойствах объекта и множестве правил выбора. Одной из определяющих сложностей при разработке модели предметной области является бесконечное число вариантов ее формализации. На основе идей метода синтаксически-ориентированной трансляции, предложенными Н. Хомским [2], семантический анализ может быть заменен синтаксическим путем пошагового выполнения процессов распознавания структуры и построения выходных действий на базе этой структуры. Это позволяет определить конечное множество цепочек, которыми локализуется рассмотрение вариантов. То есть существует формальный язык, заданный в виде множества, использование которого позволяет рассматривать предметную область в виде множества взаимодействующих взаимосвязанных функций, независимо от объектов, т. е. отношения могут быть использованы также в качестве объектов модели [3]. Рассматривая в отдельности каждое из полученных множеств, имеющих не полностью формализованные па-
раметры, можно сделать вывод, что каждый из них может быть покрыт более простыми множествами (часть из которых будет полностью формализовано). Рекурсивно повторяя эту процедуру, возможно пошагово снижать уровень неформализованности атрибутов информационной системы [8] - покрытия информационного пространства информационными объектами. В результате выполнения указанных процессов получаем упрощенную структуру элементов информационной системы, связанных формализованными отношениями между собой.
При этом неизбежен переход сложности к структуре покрытий. Структурные и параметрические состояния информационной системы могут быть представлены в виде класса объектов, для каждой пары объектов которого задано множество морфизмов и определена их композиция. Процесс построения информационной системы будет определяться конечным числом структур бизнес-процессов, что открывает возможность представления ее в виде управляемой по времени информационной системы, определяемой конечным числом своих параметрических состояний (рис. 2).
Для определения структуры предметной области и описания модели можно использовать
теорию категорий множеств, т. к. объекты предметной области связаны между собой определенными отношениями. Эта модель может быть реализована с помощью какой-либо объектно-ориентированной методологии. При этом очевидно, что для системного моделирования должны применяться формализованные графоаналитические метаязыки, формальные логические свойства, и правила которых, должны базироваться на основных положениях теории множеств, теории категорий и грамматик Н. Хомского не выше второго уровня [3].
Концептуальная модель предметной области и модель информационной системы соответствуют математической модели категории множеств, информационные объекты атрибутивного и операционного типов являются основой для формального представления системы отношений.
На основе приведенных исследований, положений и выводов, предложенных в [3, 4], представляется возможным определить логические правила для формирования функционального взаимодействия объектов как на всех стадиях жизненного цикла процесса проектирования программного комплекса, так и в пределах отдельных стадий.
Рис. 2. Отображение предметной области в ИС
Для идентифицируемости и прослеживаемо-сти параметрических состояний необходимо использовать многомерную систему координат, подходящую под определение пространства. Таким образом, формируется модель представления значений атрибутов в пространстве структурно-параметрических состояний системы. Моментное (точечное) параметрическое состояние системы может быть отображено многомерным кубом данных [7, 11]. При этом, пространство состояний может отображаться множеством подобных кубов, связанных между собой структурой процесса в пространстве и времени [8, 10].
Использование нечеткой логики дает возможность утверждать, что для каждого объекта могут быть измерены (в определенной количественной шкале) все значения его атрибутов, и каждому объекту поставлен в соответствие определенный вектор с координатами, являющимися количественными значениями соответствующих атрибутов. Определив функцию принадлежности объекта к тому или иному нечеткому кластеру, которые образуют нечеткое покрытие множества объектов (по построению), можем утверждать об отображении множеств друг на друга [3, 5].
Применение данного метода позволяет ограничиться уровнем «Формальная Семантическая модель» для принятия решений (рис. 3), т. к. возможно осуществить переход от формальной модели к семантической модели, и по наличию некоторых количественных атрибутов определять качественную составляющую, и на основе полученных данных принимать управленческие решения.
Реализация указанной модели позволяет спроектировать программный комплекс, осуществляющий распределенную обработку данных - «облачная обработка данных», при этом информация постоянно хранится на серверах, и, кроме того, происходит временное кэширование на пользовательской стороне. Это позволяет обеспечить быстрое масштабирование. Так, на основе предложенной модели и результатов исследований, предложенных в [9], может быть организован процессный мониторинг эволюции развития государственной услуги в электронном виде. Учитывая, что процесс перевода государственной услуги в электронный вид носит итерационный характер, т. к. в процессе ее оказания с применением программного обеспечения (в электронном виде) возникает множество инцидентов, ликвидация которых требует проведения реинжиниринга ранее разработанных процессов и программных модулей. С учетом обозначений, принятых в [9], модель итеративного процесса проектирования программного комплекса (ПК) реализации государственной услуги (ГУ) может быть представлена диаграммой (рис. 4), представляющей собой схему цикла Дёминга.
Рассматриваемая модель соответствует математической модели категорий множеств, а ее информационные объекты атрибутивного и операционного типов являются основой для формального представления системы отношений между математическими объектами.
Взаимодействие между объектами модели, которое осуществляет функциональный сервер мониторинга процесса (движок процесса), можно понимать как отображение между категориями, сохраняющее структуру - функтор. Это открывает возможность создания компонентной программной архитектуры ПК, где каждой компоненте ПК поставлены в соответствие функции процесса, что позволяет постоянно отслеживать семантические и программные инциденты, и, тем самым, обеспечивать развитие системы и её адаптацию к изменяющимся условиям, как в технологии «клиент-сервер», так в виртуальных и в облачных вычислениях. В результате процесс реинжиниринга ПК, связанный с реинжинирингом ГУ (для ликвидации инцидентов), сократится до реинжиниринга компонентов, связанных с выявленными в процессе эксплуатации инцидентами.
Рис. 3. Интерпретация системной модели предметной области
Рис. 4. Модель итеративного процесса проектирования ПК реализации ГУ
ЗАКЛЮЧЕНИЕ
Обобщая результаты исследований, можно отметить, что в каждом случае может быть построена многомерная матрица (OLAP куб), измерениями которой являются приведенные к определенной мере (оцифрованные) знаковые показатели объектов. Значениями кубов являются на низшем уровне - элементарные значения, на более высоких уровнях иерархии -OLAP кубы более низшего порядка.
Семантической основой этого куба будет являться словарь данных, составленный из алфавита моделируемой предметной области и последующих семантических определений-проекций (частные структур). Эти символьно-синтаксические структуры могут выполнять роль моделей для интеллектуальной конфигурации системы, а предложенный формализованный метод может быть применен при проектировании программного комплекса для организации взаимодействия функциональных программ, обеспечивающих интеграцию системы аналитического анализа объектов предметной области с учетом динамических свойств предметной области.
Применяя результаты приведенных исследований и выводы, предложенные в [6, 7, 9], можем рассматривать проектируемый программный комплекс как множество категорий. Причем присутствует отображение категорий множеств, сохраняющее структуру этих катего-
рий-множеств, связь описывается функторами, которые ставят в соответствие объекту одной категории объект другой категории. Например, функции программного комплекса образуют: класс объектов, для каждой пары объектов которого PS и PS2, задано множество морфиз-
мов Hom(PSl, PS2 ) , для каждой пары которых (морфизмов), например gps е Hom(PSx, PS2 ) и fps е Hom(PS2, PS3 ), определена их композиция gps о fps е Hom(PSl,PS3) . Так, согласно
полученным результатам, любой поисковый запрос можно представить как новый объект, который также является отдельной категорией, связь которого с пользователем (в частности) описывается функтором.
На основе предложенной методологии, проектируемый программный комплекс может быть реализован в виде конструктора банков данных, позволяющий легко создавать новые виды учета и определять необходимую политику интеграции с ранее созданными учетами, при этом для хранения и формирования ряда реквизитов взаимодействующих объектов учета может быть применена технология многомерного анализа OLAP. При этом могут быть применены наборы базовых стандартов (профиль системы), которые комплексно определяют интерфейсы, форматы обмена данными и протоколы взаимодействия.
СПИСОК ЛИТЕРАТУРЫ
1. Википедия. Категория множеств. [Электронный ресурс]. URL: http://ru.wikipedia.org/wiki/Категория множеств (дата обращения 09.04.14). [[ Wikipedia. Category of sets [Online]. Available: http://ru.wikipedia.org/wiki/ Категория множеств ]]
2. Хомский Н. Язык и проблема знания // Вестник МГУ. 1996. Вып. 6. С. 157-185. [[ N. Chomsky, " The language and the problem of knowledge," (in Russian), in Vestnik MGU, no. 6, pp. 157-185, 1996. ]]
3. Антонов В. В., Куликов Г. Г., Антонов Д. В. Теоретические и прикладные аспекты построения моделей информационных систем. LAP LAMBERT Academic Publishing, Germany, 2011. 134 с. [[ G. G.Kulikov, V. V. Antonov, D. V. Antonov, Theoretical and applied aspects of building models of information systems, (in Russian). LAP LAMBERT Academic Publishing GmbH & Co.KG, Germany, 2011. ]]
4. ГОСТ Р ИСО/МЭК 15288-2005 Информационная технология. Системная инженерия. Процессы жизненного цикла систем. М.: Стандартинформ, 2006. 54 с. [[ Information technology. System engineering. System life cycle processes, (in Russian), Federal standard R ISO/IEC 15288:2008, Moscow, Standatrinform, 2006. ]]
5. Антонов В. В., Куликов Г. Г. Метод построения математической модели предметной области // Вестник СГЭУ. 2010. № 5 (67). С. 10-14. [[ V. V. Antonov, G. G.Kulikov, "Method of construction of a mathematical model of a subject domain," (in Russian), Vestnik SGEU, no. 5 (67), pp. 10-14, 2010. ]]
6. Антонов В. В., Куликов Г. Г. Семантико-математический язык описания структуры интеллектуальной системы на основе нечеткой логики // Программные продукты и системы. 2011. № 3 (95). С. 33-35. [[ V. V. Antonov, G. G. Kulikov, "Semantic-mathematical language of the description of structure of intellectual system on the basis of fuzzy logic," (in Russian), in Software and systems, no. 3 (95), pp. 33-35, 2011. ]]
7. Куликов Г. Г. , Антонов В. В. , Антонов Д. В. Формальная модель информационной системы в аспекте требований хранилищ данных // Научное обозрение. 2012. № 5. С. 711-719. [[ G. G. Kulikov, V. V. Antonov, D. V. Antonov, "Formal model of information system in aspect of requirements of storehouses of the data," (in Russian), in Nauchnoe Obozrenie, no. 5, pp. 711-719, 2012. ]]
8. Антонов В. В., Куликов Г. Г. Метод построения математической модели предметной области // Интеллектуальные системы управления / Под ред. акад. РАН С. Н. Васильева. М.: Машиностроение, 2010. С. 63-70. [[ V. V. Antonov, G. G. Kulikov, "Method of construction of a mathematical model of a subject domain," (in Russian), in Intellectual control systems, pp. 63-70. Moscow: Mashino-stroenie, 2010. ]]
9. Антонов В. В., Навалихина Н. Д., Куликова В. Г. Разработка теоретико-множественной модели жизненного цикла государственных услуг на основе сервис-ориентированной архитектуры // Проблемы информатики в образовании, управлении, экономике и технике: 14-я междунар. науч.-техн. конф. Пенза, 2014. С. 29-36. [[ V. V. Antonov, N. D. Navalihina, V. G.Kulikova, "Development theoretical-plural model of a life cycle of the state services on a basis service-guided of architecture," (in Russian), in Problems of computer science in education, management,
economy and engineering, The fourteenth international scientific and technical conference, Penza, pp. 29-36, 2014. ]]
10. Миронов В. В., Юсупова Н. И., Шакирова Г. Р.
Иерархические модели данных: концепции и реализация на основе XML. М.: Машиностроение, 2011. 453 с. [[ Mironov V. V., Yusupova N. I., Shakirova G. R. Hierarchical data models: concept and implementation based on XML. Moscow: Mashinostroenie, 2011, (In Russian). ]]
11. Павлов С. В., Христодуло О. И. Совместное описание пространственных и атрибутивных данных на основе многомерных информационных объектов // Научно-технические ведомости СПбГПУ. 2011. № 3 (126). С. 37-42. [[ S. V. Pavlov, O. I. Hristodulo, "The joint description of the spatial and attributive data on the basis of multivariate information objects," (in Russian), in The scientific and technical sheets SPbGPU, no. 3 (126), pp. 37-42, 2011. ]]
ОБ АВТОРЕ
АНТОНОВ Вячеслав Викторович, доц. каф. АСУ. Дипл. математик (Баш. гос. ун-т, 1979). Канд. техн. наук по упр. в соц. и экон. системах (УГАТУ, 2007). Иссл. в обл. автом. систем управления, проектирования и анализа программ и прогр. систем.
METADATA
Title: Method the design of adaptive software system based on the methodology categorical formal model of open subject area. Author: V. V. Antonov Affiliation:
Ufa State Aviation Technical University (UGATU), Russia. Email: [email protected] . Language: Russian.
Source: Vestnik UGATU (scientific journal of Ufa State Aviation Technical University), vol. 19, no. 1 (67), pp. 258-263, 2015. ISSN 2225-2789 (Online), ISSN 1992-6502 (Print). Abstract: Problems of creation of information systems with the given characteristics always belonged to number difficultly decided, including because of presence of interdependence business - platforms with information already at the stage of designing. Huge dimension of tasks arising at it demands decomposition global business - the purposes in a projection to hierarchy of the purposes information. Thus there is open a principal point of philosophy of system designing namely as, proceeding from the generic description global business - the purposes, not always mutually coordinated, and sometimes even directly contradicting each other, to receive as much as possible focused on achievement of the given purposes information system and the software realizing information processes, taking place in dynamics of the constant development, exposed to active influence on the part of external and internal factors and thereof to constant upgrades. Key words: Semantic model; a category of sets; cloudy data processing; a program complex; a subject domain; big data; public service.
About the author:
ANTONOV, Vyacheslav Viktorovich, docent faculty of ASU (UGATU). Cand. Tech. Sci. (UGATU, 2007).