Козлов С.В.
Смоленский государственный университет, г. Смоленск, к.п.н., доцент кафедры информатики,
svkozlov [email protected]
ИСПОЛЬЗОВАНИЕ СООТВЕТСТВИЯ ГАЛУА КАК ИНВАРИАНТА ОТБОРА КОНТЕНТА ПРИ ПРОЕКТИРОВАНИИ ИНФОРМАЦИОННЫХ СИСТЕМ
КЛЮЧЕВЫЕ СЛОВА
Информатика, информационные системы, программирование, информационно-коммуникационные технологии, соответствие Галуа, инвариантные методы, контент, графовая модель.
АННОТАЦИЯ
В статье обсуждается значимость использования инвариантов при проектировании информационных систем. Предлагаются инвариантные методы отбора контента с помощью соответствия Галуа. Рассматриваются структура и принципы функционирования информационных систем построенных на алгоритмах с использованием соответствий Галуа. Описываются особенности использования соответствия Галуа в совокупности с инвариантами теории графов на иерархических моделях информационных систем.
Задача проектирования информационных систем условно может быть разделена на два этапа. Первый составляет собственно разработка структуры информационной системы. Второй -выбор алгоритмов и определение сценариев функционирования ее основных и вспомогательных элементов [1, 2]. Данные этапы в последующем будут основополагающими при введении информационной системы в использование [3]. Они закладывают ее востребованность на рынке информационных услуг, устойчивость и эффективность использования как единой системы.
Основными структурными элементами информационных систем являются базы данных, большинство из которых имеют табличную организацию. Контент базы данных храниться во взаимосвязанных друг с другом таблицах, записи которых идентифицируются посредством ключевого поля. Однако табличная форма представления данных вовсе не единственная и далеко не всегда в полной мере отражает сущность взаимосвязей в информационной системе. В связи с этим вопрос о поиске инструмента проектирования инновационных информационных сред, который выступал бы инвариантом вне зависимости от области их представления и последующего применения, имеет важное теоретическое значение [4].
На разных этапах развития принципов построения информационных систем предлагались различные способы, базирующиеся на математических инвариантах. У каждого из них имеются как свои достоинства, так и недостатки. Одни успешно применяются на протяжении многих лет, другие не используются вовсе. Определяющую роль здесь играет область применимости метода относительно контента информационной системы [5]. При этом метод, используемый в качестве инварианта информационной системы, должен объяснять результаты практического ее применения и соответствовать данным полученным иным способом.
Использование соответствия Галуа в качестве метода, определяющего взаимодействие элементов системы, возможно в независимости от контентной области информационной среды и ею решаемых задач [6]. Соответствие Галуа задается на паре множеств A и B. Так, при табличной форме организации в качестве таковых можно использовать множества записей двух таблиц взаимосвязанных друг с другом или части этих таблиц как их подмножества. При иерархической форме организации можно рассматривать множества соподчиненных друг другу уровней или же опять их структурные подуровни. На заданных множествах A и B определяется множество пар R как подмножество их прямого произведения. При этом структура множеств естественным образом может разниться в информационных системах и быть как достаточно простой, так и сложной. Множества могут иметь базовые поля данных, например, текстовые или числовые, а могут представлять собой записи, в свою очередь состоящие из полей различного типа, то есть, по сути, представлять данные файлового типа с произвольным доступом. Таким образом, множество пар множества R соответствует одному из типов связей «один ко одному» или «один ко многим»
структурных элементов баз данных информационных систем.
Для отбора контента в информационной системе с использованием соответствия Галуа необходимо задать два множества X и Y. Первое из них является подмножеством множества A, а второе - подмножеством множества B соответственно. Тогда отображение Галуа Г(Х) есть множество элементов y множества B, таких что пары (x, y) принадлежат множеству R для любого элемента x их множества X. Аналогичным образом строится обратное отображение Галуа Г'(У) -это множество элементов x множества A, таких что пары (x, y) принадлежат множеству R для любого элемента y их множества Y.
Теперь, после определения отображений, можно определить и соответствие Галуа. Для этого строят отображения Г и Г' на булеанах множеств A и B соответственно. При этом данные отображения должны обладать двумя дополнительными свойствами.
Первое из них состоит из двух соотношений. Для любого подмножества Xi множества X2 следует, что множество Г^) есть подмножество множества T(Xi)). И для любого подмножества Yi множества Y2 следует, что множество Г'^) есть подмножество множества T'(Yi)).
Второе свойство также включает два соотношения. Множество X есть подмножество множества, полученного как композиция отображения T(X) и обратного отображения Г^Г^). А множество Y есть подмножество множества, полученного как композиция обратного отображения Г'(У) и отображения Г (Г'(У)).
При этом следует заметить, что если выполняются два указанных свойства, то выполняется и третье - ГГ'ГСТ = ГЭД, Г'ГГ'И = ГГ'^.
Итак, пара отображений между булеанами множеств A и B или, в общем случае, между двумя любыми множествами называется соответствием Галуа, если выполняются первые два свойства (и, следовательно, вытекающее из них третье свойство) [7].
Свойства соответствия Галуа выступают инвариантом отбора контента при составлении запросов в базах данных информационных систем. Они позволяют с использованием языка запросов SQL отбирать ключевое содержимое во взаимосвязанных блоках информационной системы. Так соответствие Галуа позволяет выявить базисные элементы всей информационной системы, от которых зависит ее стабильное функционирование [8, 9]. Помимо данной важной функции можно:
•выявить элементы-реперы информационной системы, влияющие друг на друга; •выявить силу корреляционного взаимодействия между структурными элементами информационной системы;
•выявить элементы-записи в информационной системе, которые определяют поведение ее подсистем.
Соответствие Галуа позволяет выполнять данные операции на любом контенте информационной системы [10, 11]. По отношению к нему данный метод выступает инвариантом. Применение метода не ограничивается ни типом базы данных информационной системы ни ее содержательным направлением.
Рассмотрим несколько примеров, которые иллюстрируют применение метода. Так, например, данная методология востребована при проектировании информационных мониторинговых систем [12, 13]. Вне зависимости от области использования такой информационной системы мониторинга соответствие Галуа дает действенный инструмент получения выводов о состоянии и функционировании среды исследования.
В области образования информационная система мониторинга, основанная на соответствии Галуа [14], позволяет, например, на основании:
•соответствия между уровнем знаний учащихся и их способностями сгруппировать обучаемых в группы и указать формы работы с классом;
•данных обучения формировать «подвижные» группы для продолжения обучения или ликвидации «проблемных» вопросов в обучении отдельных учеников;
•сведений о достигнутом уровне обученности и диагностики обучаемости определить истинную картину достижений ученика.
В области здравохранения подобная мониторинговая информационная система позволяет, например:
•отслеживая динамику роста заболеваемости выявлять факторы влияния на нее отдельных показателей;
•устанавливать степень воздействия компонентов лекарственных средств на состояние пациента;
•определять необходимость обеспечения лекарственными препаратами людей различных социальных групп.
В области строительства такого рода мониторинговые информационные системы дают возможность, например:
•отслеживать потребность социально-незащищенных слоев населения в различных мерах государственной целевой социальной поддержки;
•выявлять зависимость старения жилищного фонда капитальных строений от факторов коммунального хозяйствования;
•строить перспективные планы городского строительства домов, дорог, систем обеспечения электричеством и водоснабжением.
Однако следует заметить, что сам по себе инвариантный метод отбора контента, основанный на соответствии Галуа, будет оказывать заметное, но не решающее влияние без привлечения других инвариантных инструментов исследования информационных систем. Так продемонстрировать действенность рассматриваемого метода можно не только на информационных системах с табличной формой организации, но и на иерархических системах. В последнем случае для описания структуры системы наиболее целесообразно применять разнообразные графовые модели [15]. Это могут и п-арные деревья, и сети, и графы произвольной ориентации.
Рассмотрим различные инварианты теории графов применительно к инвариантному методу отбора контента, основанному на соответствии Галуа, иерархических моделей информационных систем.
Так инварианты «полустепень исхода вершины графа» и «полустепень захода вершины графа» позволяют задать два параметра соответственно. Первый - это параметр базовости вершины, второй - параметр выводимости вершины. Данных два инварианта позволяют в свою очередь определить такие инварианты как «вектор полустепеней исхода вершин графа» и «вектор полустепеней захода вершин графа». Эти инваринаты совместно с инвариантом соответствия Галуа отбора контента позволяют установить базисные элементы иерархической информационной системы. Они математически описывают набор распределения вершин информационной системы по параметрам базовости и выводимости. В этом случае соответствие Галуа в зависимости от изменения значений свойств выявляет зависимости в распределении существенных и несущественных значений записей вершин графовой модели. В частности в случаях представления некорректной информации с помощью соответствия Галуа на контенте информационной системы можно определить «пораженные» участки. Это дает возможность вовремя скорректировать процесс обработки системных данных.
Инварианты «полустепень исхода графа» и «полустепень захода графа» позволяют определить вершины иерархической информационной системы, имеющие наибольшие параметры базовости и выводимости. В общем случае эти максимальные значения могут быть приписаны разным вершинам. Наполнение системы контентом в свою очередь может менять данные параметры. При этом соответствие Галуа выступает инструментом определения дальнейшего поведения системы при добавлении в нее новых элементов. Возможность предвидеть развитие системы в конечном итоге задает ее устойчивость к воздействию внутренних и внешних факторов.
Инвариант «число слабых компонент графа» устанавливает классы эквивалентности подграфов графовой модели иерархической информационной системы. Он позволяет разбить информационную систему на подсистемы со слабыми связями. Соответствие Галуа в таком случае позволяет выявить элементы системы, обладающие недостающими значениями, а также недостающие элементы необходимые для внесения в ее структуру. Процесс поиска компонент системы со слабыми связями становится более эффективным по времени. Это предопределяет стабильное функционирование информационной системы.
Инвариант «число независимости» задает коэффициенты независимости подмножеств информационной системы и ее число «неплотности». Данные числовые значения определяют внутреннюю устойчивость подмножеств иерархической системы. Они характеризуют связи между отдельными ее элементами. Чем числа независимости подмножеств больше, тем слабее связь между их элементами. Анализ связей между элементами с помощью соответствия Галуа позволяет выявить такие элементы контента, которые максимально понижают «число независимости» добавлением минимального количества дополнительных связей. Применение соответствия Галуа также дает возможность определить те элементы системы, добавление связей между которыми не
влияет или не оказывает существенного влияния на поведение информационной системы в целом.
Дополняющие друг друга инварианты «число ¿-взаимозависимости» и «число взаимонезависимости» характеризуют разветвленность иерархической информационной системы. Многоступенчатость связей определяет коэффициент сложности системы. Большое число ¿-взаимозависимости указывает на сложность внутренней конструкции элемента системы. Как правило, в таких случаях элементами выступают записи с достаточно большим количеством свойств, каждое из которых в свою очередь представляет запись. Соответствие Галуа с одной стороны дает возможность выявить элементы информационной системы, влияющие на показатели взаимозависимости ее структурных подмножеств. С другой стороны оно выступает инструментом отбора контента, формирующего иерархическую информационную систему с заданными ¿-показателями.
Инвариант «вектор разделения» характеризуется двумя числовыми параметрами. Ими выступают числа внешнего и внутреннего разделения исследуемой вершины модели иерархической информационной системы. Первое число характеризует длину пути до наиболее удаленной вершины, второе - наибольшую из длин кратчайших путей в нее. Такие пары чисел, определяющие вектор для всех вершин графовой модели иерархической системы, описывают ее структуру, а, следовательно, и задают сложность ее контента. Соответствие Галуа на данном инварианте позволяет определить особенности структуры такого строения, выявить общие закономерности и частные случаи в ее проектировании и дальнейшем наполнении контентом.
С предыдущим инвариантом неразрывно связаны еще два инварианта «центр» и «радиус». Вершина графовой модели иерархической информационной системы с минимальным первым параметром является внешним центром, а с минимальным вторым - внутренним центром. Минимальные числовые значения, характеризующие данные величины выступают внешним и внутренним радиусами соответственно. Применительно к графовой модели иерархической информационной системы они определяют компоненты, которые являются базовыми для наибольшего числа других элементов системы. Соответствие Галуа собственными функциональными соотношениями также позволяет определить данные параметры, но с точки зрения контента рассматриваемых элементов. Это дает возможность сопоставить структурные и содержательные связи внутри информационной системы.
Инвариант «число полукомпонент диаметра р» характеризуется двумя числовыми величинами - собственно диаметром и полуплотностью. Это позволяет рассматривать подсистемы информационной системы, для графовой модели которых расстояние между любыми ее вершинами не превышает значение р. Максимальное число в таких полукомпонентах определяет р-полуплотность. Данные параметры позволяют анализировать структурные связи информационной системы длиной не больше р. Соответствие Галуа, определив параметр р в качестве входного значения, предоставляет функциональные возможности проанализировать содержательные связи в подграфе между рассматриваемыми элементами, их сложность и влияние друг на друга.
Инвариант «вектор надежности» характеризует значение коэффициента корреляции между эталонными числовыми параметрами и действительными значениями некоторой подсистемы контента информационной системы. Одному из числовых свойств каждого компонента контента системы придают определенное вероятностное значение. Оно определяет критическую точку между двумя состояниями изучаемого параметра. Затем на практике получают тем или иным исследовательским способом фактическое значение, которое переводят в вероятностную шкалу. Вектор надежности получают как результат применения мультипликативной функции к фактическим значениям элементов контента. Он будет характеризовать связь между составляющими контента. Вектора надежности, полученные для всех компонентов рассматриваемой подсистемы, позволяют построить матрицу надежности. Она будет определять функциональную устойчивость относительно задаваемых начальных вероятностных параметров. Применение соответствия Галуа к изучаемым подсистемам контента информационной системы дает возможность определить степень влияния одних содержательных компонентов подмножеств на другие подмножества. А в совокупности с другими параметрами выявить базовые и критические значения для рассматриваемых компонентов системы.
Инварианты можно рассматривать и между отдельными множествами информационной системы. Так инвариант «прочность связи» характеризует количество связей между элементами информационной системы, то есть число ребер между вершинами в ее графовой модели. Чем
больше таких связей, тем прочнее связь между элементами. Также определяют и прочность связи для всей графовой модели как наименьшее значение из значений прочности связей между всеми элементами. Это позволяет выделить подсистемы мультиграфовой модели целостной информационной системы и определить их взаимное влияние друг на друга. В этом случае соответствие Галуа выступает инструментом исследования, как структуры, так и ее содержимого системы. С одной стороны оно также оперирует количеством связей между системными элементами. С другой выделение контента с помощью соответствия Галуа в анализируемых подсистемах отвечает критериям конструктивной полноты, а, следовательно, и критериям ее стабильного функционирования.
Инвариант «слабая перемычка» задает множество всех связей между элементами двух подграфов информационной системы, которые не имеют общих вершин. Данный параметр определяет качество связей и в совокупности с соответствием Галуа отражает общую картину отношений среди различных подсистем системы в целом.
Инвариант «прочность слабой перемычки» задает параметр, который характеризуется количеством ребер содержащихся во множестве «слабой перемычки». Иными словами это количественный показатель инварианта «слабая перемычка», трактуемый как числовой показатель связи между рассматриваемыми множествами информационной системы. Данный показатель целесообразно анализировать совместно с показателем прочности связей между компонентами изучаемых подсистем с помощью соответствия Галуа. В этом случае данный инструмент анализа позволяет сопоставить связи между множествами связям между отдельными их элементами, выявить степень корреляционного влияния. При этом изначально количественный анализ получает качественные трактовки изучаемый связей на контенте информационной системы.
Инвариант «вектор прочности графа» определяет набор числовых значений, отражающий показатели прочности различных множеств «слабой перемычки» для рассматриваемых двух подсистем информационной системы. Этот вектор характеризует коэффициенты прочности, позволяет их сравнивать между собой. Это позволяет с использованием соответствия Галуа либо ослаблять, либо усиливать связи контента друг с другом в зависимости от ряда внутренних и внешних факторов, влияющих на устойчивое функционирование системы.
Итак, соответствие Галуа совместно с инвариантами теории графов, интерпретируемые к структуре и контенту информационных систем, позволяют предложить теоретическую основу их исследования. Соответствие Галуа на основе анализа собственных количественных показателей и числовых параметров инвариантов графовых моделей также представляет и инструмент изучения качественных интерпретаций контента информационной системы. Такая теоретико-практическая направленность инварианта соответствия Галуа, как инструмента исследования функционирования структурных компонентов системы от их наполнения контентом, определяет актуальность и значимость его использования при проектировании и сопровождении информационных систем.
Литература
1. Козлов С. В. Возможности и особенности построения автоматизированных дидактических систем // Математическая морфология: электронный математический и медико-биологический журнал. - Т. 10. - Вып. 3. -Смоленск: СГМА, 2011.
2. Баженов Р. И., Корнилков А. П., Лопатин Д. К. Проектирование web-ориентированной информационной системы университета на основе клиент-серверных технологий // Актуальные проблемы гуманитарных и естественных наук. - 2014. - № 4-1. - С. 68-71.
3. Козлов С. В. Актуальные вопросы развития инновационных информационных технологий и систем в образовании // Проблемы и перспективы инновационного развития территорий: материалы международной научно-практической конференции профессорско-преподавательского состава. - Ч.1. - Коломна: МГОСГИ, 2013. - С.173-176.
4. Емельченков Е. П., Бояринов Д. А., Козлов С. В. Информационные системы автоматизированной поддержки инновационной деятельности: модели, проектирование и реализация. - Смоленск: Изд-во СмолГУ 2011. - 164 с.
5. Киселева О. М. Преподавание дисциплины «Современные системы управления базами данных» в ВУЗе для направления подготовки «Социальная работа» // Психология, социология и педагогика. - 2014. - № 7 (34). - С. 4345.
6. Козлов С. В., Емельченков Е. П. Соответствия Галуа. САПР учителя // Системы компьютерной математики и их приложения. - Смоленск: СмолГУ 2006. С. 100-102.
7. Кон П. М. Универсальная алгебра / П. М. Кон; пер. с англ. Т. М. Баранович; под ред. А. Г. Куроша. - М.: Мир, 1968. -351 с.
8. Козлов С. В. Особенности применения системы индивидуального тестирования «Комплекс измерения обученности» в школьном курсе информатики // Системы компьютерной математики и их приложения. -
Смоленск: СмолГУ 2008. С. 247-251.
9. Козлов С. В. Программный комплекс «Advanced Tester»: проектирование индивидуальных тестов в автоматизированной информационной системе // Современная педагогика. 2014. № 9 [Электронный ресурс]. URL: http://pedagogika.snauka.ru/2014/09/2696 (дата обращения: 29.10.2014).
10. Козлов С.В. Математические аспекты выбора оптимального набора тестовых заданий индивидуального теста // Психология, социология и педагогика. - 2014. - № 9 (36) [Электронный ресурс]. URL: http://psychology.snauka.ru/2014/09/3603 (дата обращения: 07.10.2014).
11. Андреева А.В., Максимова Н.А. ИСУ ВУЗ как инструмент управления качеством образования // В мире научных открытий. - 2013. - № 11.8 (47). - С. 22-28.
12. Козлов С. В. Система индивидуального тестирования «Комплекс измерения обученности» // Системы компьютерной математики и их приложения. - Смоленск: СмолГУ 2007. С. 223-225.
13. Козлов С. В. Функциональные назначения и возможности информационно-образовательного ресурса «Advanced Tester» // Горизонты науки. - 2011. - №2 (6). - С. 9-12.
14. Козлов С. В. Актуальные вопросы использования адаптивных информационно-образовательных систем в профильной школе // Наука и образование в XXI веке: сборник научных трудов по материалам международной научно-практической конференции 30 сентября 2013 г.: в 34 частях. - Ч. 21. - Тамбов: Бизнес-Наука-Общество, 2013. - С. 48-51.
15. Козлов С. В. Вопросы проектирования инновационных автоматизированных информационных систем: анализ элементов графовых моделей // Система обеспечения качества образования: модели, технологии, анализ: материалы научно-методической конференции. - Смоленск: Смоленский филиал РГТЭУ 2012. С. 53-57.