падает, MySQL выдает ошибку. И последняя строчка: если в тексте SQL-инъекции запрашивается таблица USERS, то над каждой ее строкой в БД DB2 выполняется оператор UPDATE с указанной функцией. В данном случае для каждого пароля еще раз высчитывается хэш-свертка.
Такой подход позволяет администратору добавлять в работу сайта (запрос к БД) любые дополнительные параметры и таким образом строить уникальную с точки зрения защиты от исследования систему.
Работа системы
Работу модулей можно проиллюстрировать следующим образом. В поиске уязвимостей первое, что сделает злоумышленник, это попытается определить, осуществляется ли на сайте проверка параметров, передаваемых через массивы $GET и $P0ST. Для этого он может ввести в запрос одинарную кавычку или конструкции «=1 and 1=1», «=1 and 1=0» и т.п. Любые простые запросы система переадресует к исходной БД, и нарушитель может сделать вывод о возможности успешной атаки. Однако дальнейшие его исследования будут осуществляться на множестве (DBj, DB2, DB2x, DB22, ..., DB2m} и вряд ли дадут ему сколько-нибудь значительную информативную обрат-
ную связь. Кроме того, модуль сразу запротоколирует источник несанкционированной активности (/Р-адрес, версию браузера, тип операционной системы и т.д.).
Механизмы защиты от исследования не подразумевают блокирование уязвимостей (хотя и не исключают их применение). Здесь используется принципиально иной ресурс защиты от преднамеренных атак - информационное управление нарушителем. Следовательно, технология защиты от исследования позволяет дополнительно снижать риск систем информационной безопасности. Рассмотренные механизмы являются примером технической реализации данной технологии.
Литература
1. Стюгин М.А. Создание «хаоса» с целью защиты от исследования // Проблемы управления безопасностью сложных систем: тр. XVI Междунар. конф. М.: РГГУ, 2008.
2. Семенкин Е.С., Стюгин М.А. Защита от исследования и ее применение в системах безопасности / Вест. Сибир. гос. аэрокосмич. ун-та им. акад. М.Ф. Решетнева. 2009. Вып. 2 (23).
3. Лакатос И. Доказательства и опровержения. Как доказываются теоремы. М.: Наука, 1967.
4. Стюгин М.А. Планирование действий в конфликте на уровне функциональных структур // Информационные войны. 2009. № 2.
5. Денисов А.А. Проблемы и задачи новой кадровой политики // Рефлексивные процессы и управление. 2007. № 2. Т. 8.
СТРУКТУРИЗАЦИЯ ЗНАНИЙ О ПРОЦЕССЕ СХЕМНОГО ПРОЕКТИРОВАНИЯ СИСТЕМ УПРАВЛЕНИЯ
О.Л. Ахремчик, к.т.н. (Тверской государственный технический университет, [email protected])
Предложено развитие концепции структуризации знаний в области проектирования систем управления технологическими объектами. В качестве эксперта выступает программная система, осуществляющая синтез набора описаний объекта проектирования на разных уровнях абстракции представлений. Раскрытие объема формальных понятий осуществляется через определяющие их свойства, представляемые в количественных и порядковых шкалах. Выделяется группа композиционных отношений между абстрактными и реальными объектами и определяется местность, на которой задаются данные отношения.
Ключевые слова: знание, отношение, проектирование, свойство, система.
Применение существующих систем для разработки моделей знаний в области проектирования схем технической реализации систем управления технологическими объектами связано с трудностями их ориентации на проблемную область, заключающимися в поиске скрытых правил вывода [1]. Например, для использования системы SALT (разработка университета Carnegie Mellon) необходима базовая модель понятийной системы проблемной области. Опыт использования подобных систем практически не способствует выявлению латентных знаний, свойственных для проек-
тирования схем [2]. Быстрое обновление приборного ряда современных технических средств, отличающихся значительной номенклатурой и числом дополнительных свойств при схожих функциональных характеристиках, приводит к необходимости модификации знаний и к значительным затратам по ведению БД технических средств и систем управления.
Настоящая статья посвящена обсуждению подхода к разработке информационных программных систем для автоматизированного проектирования систем управления технологически-
ми объектами (АСУТП), предложенного сотрудниками лаборатории САПР центра новых информационных технологий Тверского государственного технического университета. Основной идеей развиваемого подхода является использование методов интроспекции в процессе диалога специалиста с программной системой.
Использование программной системы в процессе структуризации знаний
Последовательность разработки моделей знаний предусматривает этапы: идентификация, концептуализация, структуризация, формализация рассматриваемой области, программная реализация полученных моделей, тестирование прототипа программной системы [3]. Концепция извлечения знаний в области проектирования АСУТП реализуется на этапах идентификации и концептуализации. В основе концепции лежит формирование иерархий обобщений и абстрактных элементов, предусматривающих описание требований к системе управления и ее элементам, методов построения системы, требований к результатам проектирования.
Методика структуризации на макроуровне включает: получение требований к модели; выявление основных показателей, принципа действия и роли основных структурных компонентов системы; выявление структурных компонентов, выполняющих основные функции, а также соответствия между техническими элементами и элементами концепции структуризации; определение видов связей между элементами; выделение признаков, характеризующих элементы и обеспечивающих установление связей в системе; установление свойств связей и правил их построения; представление описания структуры на языках, принятых при проектировании АСУТП.
В качестве эксперта в процессе извлечения и структуризации знаний используется программная система, реализация модели проблемной области в которой предоставляет возможность генерации вариантов схемных описаний технической реализации выбранных алгоритмов управления. На основе моделей объекта и процесса проектирования осуществляется построение моделей большей степени формализации, программная реализация которых обеспечивает автоматическое построение описаний физических связей на функциональных схемах в частично заданном элементно-параметрическом базисе и их преобразование в совокупность связей, отображаемых на принципиальных схемах. Анализ схемных решений осуществляется с точки зрения организации перехода от описаний примеров технической реализации в терминах естественного языка к схемной документации:
Ех^№^сз«Е.М(Еь Ei+l)}),
Nai=Sim(Naj), Nai=Dif(Nak), (1)
где Ex - примеры схемных описаний, генерируемые программной системой; Nai, Naj, Nak - термины, используемые для кодирования основных понятий и отношений; Dif - операторы поиска различий; Sim - операторы поиска подобия; {Ea} -множество типов абстрактных элементов; {(Ej, Ei+1)} - множество межэлементных связей на поле схемы.
Каждый тип элемента Еа является формальным эквивалентом системного компонента концепции структуризации. На множестве типов элементов составляется таксономия с возможностью задания отношений связи (соединения) Rc таким образом, чтобы множество {Еа, Rc} однозначно и адекватно отображало структурные свойства технической реализации алгоритмов управления.
Таксономия типов элементов является базой формальной атрибутной грамматики для синтеза схемных решений в выбранном элементно-параметрическом базисе в процессе перехода от одного уровня представления системы к другому и задает способ расположения объектов по классам, характеризующий отличия между ними. Таксономия отражает существование определенного свойства у элемента, принадлежность элемента к определенному классу, существование отношений между элементами. Выявление свойств элементов ориентировано на построение схемных описаний технической структуры АСУТП и производится с использованием правил Pr:
Рг1=<класс CZ имеет свойство Atr>,
Рг2=<свойство Atr предназначено для связи элементов классов
cz1 и cz2>, (2)
Рг3=<соединение Ei с Ej приводит к появлению свойства Atr>, где CZ, Atr, E - переменные.
Новизной подхода является рассмотрение классов элементов на разных уровнях абстрагирования и детализации. Решаемые при диалоге с программной системой задачи формулируются как четыре формы представления технического обеспечения одной АСУТП: {текст}, {функциональная схема}, {принципиальная схема}, {схема соединений}. В чем различие описаний? Что одинакового в описаниях? Имеется набор схем технического обеспечения разных АСУТП. Отыскать соответствие в схемных описаниях и соответствующих им технических реализациях. Решение осуществляется на основе анализа выражения (1).
На основе выражений (2) находится решение задач, которые формулируются в виде: имеется набор элементов для построения технического обеспечения АСУТП. Какие свойства позволяют отличать элементы? Какие свойства элементов одинаковы? Имеется схема технического обеспечения АСУТП. Выявить правила для установки связи между элементами.
Постановка вопросов в ходе диалога осуществляется в виде: выделить схемы рассуждений при переходах от текста технического задания к 0-графу, от 0-графа к орграфу (модели функциональной схемы), от орграфа к мультиграфу (модели принципиальной схемы), осуществить конфигурацию программируемых приборов с использованием выбранного программного обеспечения для работы в создаваемой системе управления в соответствии с разработанной схемой технической реализации.
Алгоритм извлечения знаний
Рассматриваемые алгоритмы были предложены и апробированы в ходе разработки прототипов программных систем для проектирования:
— функциональных схем технической реализации измерительных, управляющих цепей и цепей сигнализации систем управления температурой и расходом в объектах непрерывных технологических линий пищевой, рыбной и стекольной промышленности (FDсS - functional design of control system);
— принципиальных схем технической реализации измерительных и управляющих систем управления технологическими объектами (ASED -automatic synthesis of electric diagrams);
— тренажерных комплексов для обучения автоматизированному проектированию систем управления температурой, расходом, давлением, уровнем при подготовке специалистов по направлению «Автоматизация и управление» (TADCS -trainers for automated design of control systems).
Специалист (человек) в процессе извлечения знаний выступает как наблюдатель, реализующий процедуры анализа действий другого специалиста (программной системы) в ходе разработки функциональных и принципиальных схем при частичном определении элементно-параметрического базиса.
Алгоритм извлечения знаний предусматривает следующее.
Шаг 1. Подбор вариантов подсистем АСУТП. Ведение БД технических заданий.
Шаг 2. Поиск и выбор технических средств для реализации функциональной структуры выбранных подсистем. Ведение БД, технических средств.
Шаг 3. Генерация вариантов технической реализации, отсутствующих в инженерной практике, но логически непротиворечивых с точки зрения моделирования схем технического обеспечения.
Шаг 4. Исследование наследования свойств в ветвях таксономии элементов в БД. Возврат к шагу 2 при нарушении наследования при переходе с уровня элементов на уровень разъемов элементов.
Шаг 5. Выявление наследуемых свойств и необходимости их представления при разработке
функциональной структуры в выбранном элементно-параметрическом базисе.
Шаг 6. Задание области поиска для работы правил выбора элементов в БД по результатам оценки общего числа вариантов, соотношения правильных и неправильных вариантов.
Шаг 7. Проверка непротиворечивости правил вывода для синтеза межэлементных связей и их агрегации.
Шаг 8. Проверка сходимости алгоритма синтеза функциональной структуры в частично заданном элементно-параметрическом базисе.
Шаг 9. Переформулирование правил вывода на основе обобщения полученных примеров и выделенных отношений. Возврат к шагу 2.
Шаг 10. Выбор варианта схемной реализации технического обеспечения. Сохранение его в БД типовых решений.
Шаг 11. Для выбранного варианта генерация описаний принципиальной схемы.
Шаг 12. Проверка соответствия описаний и непротиворечивости правил преобразования схем.
Шаг 13. Проверка сходимости алгоритма синтеза описания принципиальной схемы для выбранной функциональной схемы.
Шаг 14. Переход к шагу 10.
Особенность алгоритма выражается в накоплении данных об условиях выделенных задач, о процессе их решения, требуемых конкретных элементах, а также в статистической постановке задачи выбора, выражающейся в равновероятном выборе технического средства в классе элементов. Наблюдение за работой программной системы сопровождается протоколированием результатов с воспроизведением отдельных стадий решения.
Разработанный алгоритм предусматривает организацию информационного потока между специалистом и программной системой, выражающуюся в определении носителя информации, формировании вопросов и задач, организации диалога и записи результатов и собственно извлечении знаний из потока (редукция информации и выделение фрагментов). При организации потока в ходе диалога возможны варианты как дуальные, так и многосвязные. К дуальным относятся варианты: носитель знаний - разработчик программной системы, носитель - программная система, программная система - ее разработчик. В случае применения интроспективной методологии используется информационный обмен по варианту носитель знаний (эксперт) - программная система.
При создании моделей в области построения и проектирования технического обеспечения АСУТП предполагается, что в системе используются известные понятия, образующие информационное пространство для представления рассматриваемой области с использованием известных терминов. Разработанный автором алгоритм
формирования обобщенного понятия в области АСУТП базируется на подходе В.П. Гладуна, развитом В.Н. Вагиным и предусматривающем выделение в качестве определяющих понятий свойства объектов [4].
Шаг 1. Формирование понятия, соответствующего объектам множества АСУТП или их частей.
Шаг 2. Раскрытие объема понятия через определяющие его свойства.
Шаг 3. Выделение свойства, одно из значений которого соответствует всем объектам рассматриваемого класса.
Шаг 4. Выделение объектов других классов, имеющих такое же значение выделенного свойства.
Шаг 5. Составление примеров из описания объектов, выделенных на предыдущем шаге.
Шаг 6. Оценка по примерам принадлежности объекта к обобщенному понятию.
Отличие рассматриваемого алгоритма от существующих заключается в следующем: на шаге 2 в качестве базовых выбираются свойства, определяющие возможность совместимости технических элементов; на шаге 3 последовательно рассматриваются свойства, выделенные в количественных и порядковых шкалах; на шаге 4 обобщаются линейно связанные свойства и объединяются в новые свойства. Итогом оценки является гипотеза, которая представляется в виде логической функции, полученной в результате выделения понятий. В случае принятия гипотезы функция в дальнейшем является решающим правилом классификации при построении таксономии абстрактных элементов.
Выделение отношений в проектировании систем управления
Результатом применения разработанных алгоритмов являются структуризация знаний в виде множества отношений между элементами систем управления и их формальными эквивалентами (см. табл.), а также определение множеств, на которых задаются данные отношения.
Новым в выделении отношений является то, что классификация Д.А. Поспелова [5] в области построения и проектирования технических реализаций систем управления дополняется набором композиционных отношений, являющихся сочетанием общих отношений и отношений порядка для обеспечения условий выполнения набора каузальных и смысловых отношений. Выделенный класс отношений используется для описания информационного и энергетического взаимодействия элементов и их формальных эквивалентов.
Пример формирования композиционного отношения «измерять»: К=К21 ° К51 ° К42(К43(Ху)) ° ° К41(К24(К22(^91 ° ^25^)))), где Ку - отношения: К - «измерять», К21 - часть-целое (преобразователь
и регулятор являются частью системы измерения); К25 - соответствия (физический параметр является входом для измерительного преобразователя); К22 - соединяться с (выход преобразователя соединяется с входом регулятора); К24 - настраиваться (регулятор настраивается на тип преобразователя); К41 - иметь свойство (регулятор имеет свойство индикации); К43 - быть причиной (изменение параметра является причиной изменения показаний); К42 - целевое назначение (индикация служит для информирования оператора о значении физического параметра); К51 - предшествовать (преобразователь предшествует регулятору в линейной структуре системы); К91 - род-вид (преобразователь является видом класса «измерительные преобразователи»).
Группа отношений Наименование
Классификации Род-вид (is-a)
Общие Являться частью (part of), соединяться с, настраиваться, соответствовать, доминировать над, пересекаться
Смысловые Служить для, сочетаться с, эквивалентности, обладать состоянием, являться неопределенным, обобщения, интерпретации
Каузальные Иметь свойства, иметь цель, быть причиной, зависеть от, иметь значения свойств
Порядковые Предшествовать, следовать за
Временные Быть раньше, быть одновременно, быть позже
Для описания динамики Участвовать в процессе, накапливать, возрастать, уменьшаться
Композиционные Измерять, регулировать, сигнализировать о, передавать данные, обеспечивать энергоснабжение, получать энергоснабжение от
Композиционные отношения обладают свойствами п-арных отношений: при представлении в виде таблицы каждая строка - кортеж отношения, все строки различны, порядок строк не играет роли, отношения упорядочены по столбцам [4]. В ходе решения сформулированных выше задач определяется местность для задания выделенных отношений как набор множеств систем управления, свойств систем, технических элементов, свойств элементов, алфавитов для представления систем и элементов, символов алфавитов, САПР, типовых проектных решений, критериев для оценки вариантов построения системы. Каждое из данных множеств является иерархией подмножеств, построенных по отношению род-вид (например, множество функций как подмножество свойств). Каждое подмножество при декомпозиции приобретает дополнительные свойства. В ходе извлечения знаний осуществляется построение семантических сетей из элементов выделенных множеств, которые в дальнейшем транслируются в реляционные модели БД информационной сис-
темы для выбора технических средств автоматизации в процессе проектирования.
Концепция структуризации знаний в области проектирования систем управления технологическими процессами рассматривается на основе применения программной системы. В результате применения алгоритмов выделения понятий и извлечения знаний определяется набор п-арных отношений с указанием места их выполнения. Базовыми отношениями в композиции являются отношения порядка, отношения соединения, задаваемые на множестве свойств элементов и их формальных эквивалентов.
Полученные результаты позволили создать логические модели реляционных БД, использованных в прототипах систем для автоматизиро-
ванного проектирования схем систем управления и в комплексах для обучения проектированию, предоставляющие возможность для выхода на качественно новый уровень интеллектуализации и автоматизации проектных операций, связанных с выбором технических средств.
Литература
1. Дюк В.А., Самойленко А.В. Data Mining: учебный курс. СПб: Питер, 2001. 232 с.
2. Осипов Г.С. Приобретение знаний интеллектуальными системами. М.: Наука. Физматлит, 1997. 112 с.
3. Шенк Р. Обработка концептуальной информации. М.: Энергия, 1980. 360 с.
4. Вагин В.Н. Дедукция и обобщение в системах принятия решений. М.: Наука, 1988. 384 с.
5. Поспелов Д.А. Ситуационное управление: теория и практика. М.: Наука, 1986. 288 с.
ОЦЕНКА РЕЗУЛЬТАТОВ КЛАСТЕРИЗАЦИИ ПРИ ИСПОЛЬЗОВАНИИ РАЗЛИЧНЫХ КРИТЕРИЕВ КАЧЕСТВА
В.С. Киреев, к.т.н. (Московский инженерно-физический институт (государственный университет), [email protected])
В статье исследуется качество кластерных решений метода к-средних в смысле различных критериев на практическом примере. Полученные результаты сравниваются с результатами метода карманной кластеризации, предложенного ранее автором, показываются преимущества этого метода. На примере одного из кластеров оценивается практическая разница в качестве кластеризации по составу объектов кластеров.
Ключевые слова: кластерный анализ, факторный анализ, сегментация, кластер инноваторов.
В различных прикладных областях науки и производства часто возникают задачи кластеризации данных. Основной целью при их решении является разбиение совокупности объектов, определяемых всевозможными характеристиками, на максимально различные группы - кластеры, содержащие максимально похожие объекты. Одной из важных проблем в этих задачах является качество получаемых кластерных решений, которое принято определять через значения критериев.
Использование разных критериев может приводить к различным конечным результатам, но практическая оценка влияния этих критериев изучена недостаточно подробно. Рассмотрим решения задачи кластеризации на практическом примере двумя различными методами.
Данная задача многофакторного анализа и выделения сегмента преподавателей-новаторов решалась в рамках выполнения Национального проекта «Образование» в 2006 г. по программе «Совершенствование системы повышения квалификации и профессиональной переподготовки педагогических, инженерно-технических кадров общеобразовательных школ в области информационных и коммуникационных технологий (ИКТ) и смежных областей». Была собрана и обработана информация по использованию ИКТ в профессио-
нальной деятельности среди 5 500 участников программы из семи федеральных округов, прошедших в 2006 г. повышение квалификации. Рассматриваемая выборка содержит оценки 595 респондентами 25 утверждений психологического характера по 4-балльной шкале согласия Лайкер-та. На первом шаге исследования была сокращена размерность задачи за счет параметров, характеризующих респондентов.
Методом главных осей из раздела факторного анализа удалось сгруппировать упомянутые 25 утверждений в 10 факторов (см. табл.), при этом значения полученных факторов были приведены к исходной шкале методом ранжирования по квартилям. Для последующего кластерного анализа проинтерпретированы значения факторов и рассчитаны факторные рейтинги по регрессионной модели. Соответствующие расчеты проделаны в пакете статистической обработки данных SPSS версии 13.0.
В процессе исследования рассмотрены кластерные решения, полученные методом k-средних для различного числа кластеров, в интервале от двух до двадцати кластеров. Для каждого кластерного решения были вычислены значения нескольких критериев качества, характеризующих дисперсию объектов в кластерах, и их арифметиче-