ИНТЕЛЛЕКТУАЛЬНЫЕ АЛГОРИТМЫ ОБРАБОТКИ
ИНФОРМАЦИИ В МНОГОКРИТЕРИАЛЬНЫХ СИСТЕМАХ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ
В. А. Гречкин
INTELLECTUAL ALGORITHMS OF INFORMATION PROCESSING IN MULTICRITERION SYSTEMS OF DECISION MAKING SUPPORT
Grechkin V. A.
The general task of information processing in muiticriterion systems of decision making is considered. The methods and algorithms of solving such problems are analyzed. The research has been made in the frames of the "Scientific and Scientific-Pedagogical Personnel of Innovational Russia " Federal Program.
Key words: decision making, information processing, intellectual algorithms.
Рассматривается общая постановка задачи обработки информации в многокритериальных системах принятия решений. Анализируются методы/ и алгоритмыы решения задач данного типа. Исследования вы/полнены/ в рамках ФЦП «Научные и научно-педагогические кадры инновационной России».
Ключевые слова: принятие решений, обработка информации, интеллектуальные алгоритмы .
УДК 519.6
При решении ряда прикладных задач (в области экономики, военного дела, обработки информации и т. д.) приходится сталкиваться с ситуациями, в которых результат зависит от последовательности производимых исполнителем действий и операций. Человек как непосредственный участник данных действий напрямую заинтересован в получении оптимальных решений данных задач, т. е. наиболее предпочтительных по тем или иным соображениям решений. Решение индивидуальных примеров таких задач не представляет теоретической трудности. Гораздо больший интерес представляют универсальные способы решения любых примеров таких задач, т. е. алгоритмы.
В данной работе рассматривается одна из прикладных задач обработки информации - задача поиска решения в экспертной системе, дается ее общая постановка, а также проводится аналогия между рассматриваемыми задачами и задачами теории расписаний. Анализируются методы, подходы и алгоритмы решения задач обработки информации.
Пусть имеется гибридная система обнаружения атак, построенная по принципу «нейросеть - экспертная система». Правила экспертной системы образуют семейства правил Б = {$!,* , }, соответствующие возможному профилю атак, причем найдутся такие /, у, что 8{ о Б у Ф 0, / Ф у . Правила семейства Б у = {^ • ^ } ранжированы по степени важности, задан вес каждого
г В. А. Гречкин
Интеллектуальные алгоритмы обработки информации в многокритериальных системах.
из правил w(я у) > 0. Нейросеть содержит
профили возможных атак и позволяет для данной аномальной активности определить набор правил базы знаний экспертной системы, позволяющий адекватно определить ту или иную атаку. Считается, что нейросеть «достаточно точно» определяет профиль (профили) атаки. Проверка правила я у осуществляется за момент времени ?.. Необходимо проверять правила экспертной системы в таком порядке, который бы обеспечил проверку максимально возможного числа наиболее значимых правил, а также минимизировал отклонение времени нахождения данного правила от заданного момента Т . Требования к системе обусловлены ее работой в режиме реального времени, а также необходимостью уменьшения возможного ущерба от непроверки решающего правила. Будем называть данную задачу задачей поиска информации в экспертной системе.
В такой постановке рассматриваемая задача представляет собой частный случай общей задачи теории расписаний [2] [3]. Для выполнения п работ выделено т машин. Для каждой машины г (г = 1,* , т) и работы у в расписании определены один или более интервалов, в которых происходит выполнение машиной г работы у . Расписание возможно, если отсутствуют перекрытия интервалов, соответствующих каждой работе, или отсутствуют перекрытия временных интервалов, соответствующих каждой машине, а также если оно удовлетворяет различным ограничениям, относящимся к определенному типу задачи. Тип задачи определяется свойствами машин, характеристиками работ и критериями оптимальности.
Будем считать, что для рассматриваемых задач определены следующие ограничения: имеется только один исполнитель, машина, прибор, доступный сразу в момент времени ноль; выполняемые задачи известны заранее. Допустимы прерывания выполнения работ, число критериев оптимальности больше либо равно единице.
В соответствии с принятыми ограничениями и допущениями для каждой работы
j могут быть определены следующие числовые значения: целочисленные жесткие директивные сроки и положительный вес w j. Для данной последовательности выполнения действий обработки информации О и работы j можно вычислить: момент завершения работы C j (О) , время работы в системе Fj (О) = C j (О) - r,; временное смещение Lj (О ) = C j (О ) - dj, преждевремен-ность Ej (О) = max {dj - C, (О),о}, запаздывание Tj (О) = max {cj (О) - dj ,о}, опоздание Uj = sign(Tj). Более того, если fj -
регулярная целевая функция, т. е. неубывающая функция, то стоимость работы j
есть fj (О) = fj (C j (О)) . Если более ничего
не известно про расписание, то мы будем
писать C,, F,, L ., E,, T,, U, и f, соот-
}' j ' J ' J ' J ' J j J
ветственно.
Часто используют критерий оптимальности, включающий минимизацию: максимального момента завершения работы Cmax = max, C j, максимального временного смещения L = max L , максимальной max j j
стоимости fmax = max , f,; максимальной
max j j
преждевременности Emax = max, E,, суммарного взвешенного момента завершения работы ^, (Wj )Cj , суммарного взвешенного времени прохождения ^ , (w, )F, , суммарной взвешенной преждевременности ^ , (Wj )Tj , взвешенного количества опоздавших работ ^ , (w, )Uj .
Среди всех вышеперечисленных критериев наиболее актуальными являются преждевременность E. и запаздывание T.. Объяснение тому - философия теории управления: наилучший момент использования ресурса - момент, когда он действительно необходим. Этот момент задается директивными сроками. В результате при составле-
нии последовательностей обработки объектов нежелательны как раннее завершение, что приводит к издержкам, возникающим до непосредственного использования ресурсов, так и позднее время завершения. Некоторые практические ситуации требуют одновременного рассмотрения более одного критерия.
В контексте рассматриваемых задач уточним сделанные ранее допущения: число критериев оптимальности больше либо равно единице, минимальный набор критериев - преждевременность Е. и запаздывание
Ту. Рассматриваемые задачи в записи Гре-
хама [4] представлены как 11| Е(Е., Ту ).
Задачи с одним критерием оптимальности принято называть однокритериальными задачами, а задачи с числом критериев более одного - многокритериальными.
Рассмотрим общие подходы, используемые при анализе и решении задач обработки информации. Т. к. задачи обработки информации - особый тип оптимизационных комбинаторных задач, то для решения таких задач применяют соответствующую методологию комбинаторной оптимизации:
• доказательство трудности решения оптимизационной задачи;
• сокращение перебора вариантов при отыскании точного решения;
• алгоритмы полиномиальной трудоемкости для нахождения приближенного решения без гарантий качества получаемых решений;
• алгоритмы полиномиальной трудоемкости для нахождения приближенного решения с гарантированными оценками качества.
Доказательство трудности решения оптимизационной комбинаторной задачи -один из первых этапов по исследованию практической задачи обработки информации. Считается, что алгоритм достаточно хорошо справляется со своей задачей, если время решения любой индивидуальной задачи данным алгоритмом является полиномом от записи входной информации [1]. В данном случае и алгоритм, и задача называются полиномиальными. Иначе задача назы-
вается ЫР задачей. Самыми трудными в классе ЫР задач являются ЫР полные задачи. Изменение способа кодирования входной информации может привести к изменению сложности задачи. Задачи, сложные даже при унарном способе представления входной информации, называются ЫР полными в сильном смысле, а сводимые к ним -ЫР трудными в сильном смысле. Задачи, решаемые при унарной схеме записи ЫР полных задач, называются псевдополиномиальными. Однако факт того, что задача не может быть решена ни псевдополиномиальным алгоритмом, ни точным, не несет в себе практической ценности.
К методам сокращения перебора вариантов при поиске точного решения можно отнести: метод ветвей и границ, динамическое программирование. Процесс решения задачи с использование метода ветвей и границ может быть удобно представлен деревом поиска. Каждый узел дерева поиска соответствует подмножеству возможных решений задачи. Правило ветвей определяет, как возможные решения для данного узла делятся на подмножества (узлы). Для таких задач используются правила ветвления, включающие прямое и обратное упорядочивание. При организации ветвления требуется наличие целевой функции, например нижняя граница. При данном подходе удаляются те узлы дерева, для которых нижняя граница больше или равна значению наилучшего известного возможного решения, т. к. дальнейшее исследование таких узлов не может привести к улучшению решения. Исключение узлов без вычисления нижних границ возможно при использовании доминирующих правил. Слабость данного метода - недостаточность для решения задач «практической размерности».
Динамическое программирование является многошаговой задачей оптимизации. Каждое частичное решение задачи представляется некоторым состоянием. Когда два или более частных решения достигают некоторого состояния, одно из них (с наименьшим значением) оставляют, а другие исключают. Удаление частичных решений
д
В. А. Гречкин
Интеллектуальные алгоритмы обработки информации в многокритериальных системах.
обычно выполняется рекурсией, в ходе которой сравниваются все возможные значения состояний и выбирается одно с минимальным значением.
К методам полиномиальной трудоемкости для нахождения приближенного решения без гарантий качества получаемых решений относят: локальный поиск, поиск соседей, поиск табу, симуляция отжига, генетические алгоритмы. При локальном поиске используют определенные эвристики. Так, например, при «поиске соседей» используется решающее правило, которое определяет, будет ли изменено текущее решение. Если изменение принимается, тогда полученное решение замещает предыдущее. В противном случае изменение отменяется, и текущее решение остается без изменений. Данный процесс прекращается, если улучшение значения целевой функции невозможно (достигнуто некоторое условие). Относительно рассматриваемых задач возможны следующие варианты изменения текущего решения: перестановка элементов, занимающих смежные позиции; перестановка произвольных элементов; перестановка со вставками. Полученное решение является локальным оптимумом. Локальный оптимум необязательно будет глобальным оптимумом. Следующие методы позволяют выйти из локального оптимума: симуляция отжига, колония муравьев, поиск табу [7].
В противоположность локальным методам генетические алгоритмы работают с популяцией решений, в которой каждое решение представлено хромосомой. Набор решений формируется из текущей популяции, где каждое решение может быть выбрано или может появиться в следующие моменты времени. Новая популяция решений формируется применением двух генетических операторов. Первый: кроссинговер (кроссовер) - секции хромосом двух решений меняются местами, которые дают новые решения. Второе: мутационные изменения некоторых элементов в хромосомах с целью сохранения различий в новой популяции. Процесс повторяется до тех пор, пока не будет достигнуто некоторое условие.
Дадим краткое определение алгоритма полиномиальной сложности нахождения приближенного решения с гарантированными оценками качества. Для рассматриваемых задач с минимизацией стоимостной функции F(•) > 0 алгоритм H называется p -приближающим p > 1, если
F(H (I)) £ pF(S *(I)) для всех вариантов задачи I, где H (I) и S *(I) обозначают последовательности, найденные алгоритмом H и оптимальную последовательность. p
является показателем качества для алгоритма H , т. к. он представляет границы выполнения при различных ограничениях. Если p - наименьшее возможное значение, то он называется показателем алгоритма H в наихудшем случае. Если задача NP трудна в сильном смысле, то она не позволяет применить псевдополиномиальный алгоритм для ее решения [1].
Рассмотрим некоторые неклассические интеллектуальные алгоритмы обработки информации [6,5]:
• генетические нейронные сети;
• методы с применением быстрых «жадных» алгоритмов (GRASP методы);
• гибридные методы.
Идея гибридных методов и построенных на их основе алгоритмов заключается в комбинации нескольких методов полиномиальной трудоемкости для нахождения приближенного решения без гарантий качества. Изначально под термином «гибридные интеллектуальные алгоритмы» понималось взаимодействие только основных методов искусственного интеллекта - нейронных сетей и экспертных систем. В настоящий момент под данным термином стали понимать интеграцию как символьных, так и адаптивных методов. Главной особенностью таких систем является использование отдельного модуля для принятия решений, в который, например, поступает разнородная информация из нейронной сети и структурированные данные из экспертной системы. Использование таких систем оправдано при автоматизации аналитических процессов обработки большого массива данных с последующей
агрегацией, а также при автоматизации сложных технологических процессов. При внедрении гибридных интеллектуальных систем часто возникают проблемы, связанные с интеграцией отдельных компонентов, из-за более сложной иерархической архитектуры такие системы имеют низкую отказоустойчивость. Одной из последних тенденций в разработке гибридных интеллектуальных алгоритмов и систем является объединение классических методов искусственного интеллекта с нечёткими системами, генетическими алгоритмами и т. п.
Так, например, в генетических нейронных сетях производится обучение нейронных сетей решению дискретных экстре-
мальных задач определенного класса. В качестве нейронных сетей в этом подходе используют сети вида Artifical Neural Networks. Применение GRASP-методов заключается в разбиении процесса решения задачи на два этапа. На первом этапе применяется быстрый Greedy («жадный») алгоритм нахождения возможного оптимального решения. На втором этапе происходит поиск конечного решения, например, с использованием методов локального поиска. Идея метода заключается в том, что на первом этапе с некоторой вероятностью промежуточное оптимальное решение достигается быстрее.
ЛИТЕРАТУРА
1. Гэри М., Джонсон Д. Вычислительные машины и труднорешаемые задачи. - М.: Мир, 1982.
2. Конвей Р. В., Максвелл В. Л., Миллер Л. В. Теория расписаний. - М.: Наука, 1975.
3. Танаев В. С., Гордон В. С., Шафран-ский Я. М. Теория расписаний. Одностадийные системы. - М.: Наука, 1984.
4. Chen B., Potts C. N., Woeginger G. J. A Review of machine scheduling- Complexity, algorithms and approximability // Handbook of Combinatorial Optimization. - 1998. -V.4. - P. 151-211.
5. Ehrgott M., Gandibleux X Approximative solution methods for multiobjective combinatorial optimization // TOP. - 2004. - vol. 12(1). - P. 1-90.
6. Landa S. An Introduction to Multiobjective Metaheuristics for Scheduling and Timetabling
// Multiple Objective Metaheuristics. - Paris, 2002. - P. 1-39. 7. Rossi-doria O. A comparison of the performance of different metaheuristics on the timetabling problem // In Proceedings of the 4th international conference on the Practice Ant Automated Timetabling. - Cent, 2002.
Об авторе
Гречкин Виктор Алексеевич, ГОУ ВПО «Ставропольский государственный университет», кандидат физико-математических наук, доцент кафедры организации и технологии защиты информации. Сфера научных интересов - моделирование социально-экономических процессов и систем, дискретная математика и математическая кибернетика, проектирование и моделирование информационных систем и процессов. [email protected]