Научная статья на тему 'Методы управления параметрами эволюционного поиска'

Методы управления параметрами эволюционного поиска Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
214
73
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Субботин Сергей Александрович, Олейник Андрей Александрович

Рассматривается задача управления параметрами методов эволюционной оптимизации. Разрабатывается метод управления параметрами эволюционного поиска с оценкой однородности популяции и эволюционной адаптации. Результаты сравнительного анализа подтверждают высокую эффективность предложенного метода.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Субботин Сергей Александрович, Олейник Андрей Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Methods for Parameter Control of Evolutionary Search

The problem of parameters control of evolutionary optimization methods is considered. The method of evolutionary search parameters control with an estimation of a population uniformity and evolutionary adaptation is developed. Results of the comparative analysis confirm high efficiency of the suggested method.

Текст научной работы на тему «Методы управления параметрами эволюционного поиска»

КОМПЬЮТЕРНЫЕ _

УДК62.19:519.7

МЕТОДЫ УПРАВЛЕНИЯ ПАРАМЕТРАМИ ЭВОЛЮЦИОННОГО ПОИСКА

СУББОТИН С.А., ОЛЕЙНИК А.А._______________

Рассматривается задача управления параметрами методов эволюционной оптимизации. Разрабатывается метод управления параметрами эволюционного поиска с оценкой однородности популяции и эволюционной адаптации. Результаты сравнительного анализа подтверждают высокую эффективность предложенного метода.

Введение

Современная практика решения оптимизационных задач показывает, что в большинстве случаев целевая функция не удовлетворяетусловиям (унимодальность, непрерывность, гладкость, монотонность, дифференцируемость), при выполнении которых могут быть использованы классические численные методы оптимизации [1]. Кроме того, данные методы являются методами локального поиска и сильно зависят от выбора начальной точки поиска. В настоящее время при поиске решений задач глобальной оптимизации широко применяют методы эволюционного поиска [2-4], которые основаны на аналогии с естественными процессами эволюции, не требуют вычисления значения производных целевых функций и обладают возможностями для выхода из локальных оптиму-мов, что позволяет применять их к широкому кругу задач.

Одним из недостатков известных эволюционных методов является сильная зависимость эффективности их функционирования (достигнутого значения целевой функции задачи, времени нахождения оптимума, количества вычислений целевой функции) от параметров поиска (размер популяции, вероятностные характеристики эволюционных операторов, параметры кодирования независимых переменных и т. п.).

Известно [4], что не существует оптимальных значений параметров эволюционного поиска, позволяющих эффективно решать все возможные задачи. Поэтому при решении практических задач из всех возможных значений параметров необходимо выбрать наиболее оптимальные с учетом особенностей решаемой задачи и входных данных.

Таким образом, сильная чувствительность эволюционных методов к значениям параметров поиска вызвала необходимость разработки различных методов управления параметрами эволюционного поиска.

88

Однако существующие подходы [6] к управлению параметрами не учитывают показателей, характеризующих структуру текущей популяции хромосом и степень ее улучшения по сравнению с предыдущей популяцией.

Целью настоящего исследования является разработка метода управления параметрами эволюционного поиска, свободного от недостатков традиционных методов, который использует информацию об уровне эволюционной адаптации и однородности популяции хромосом.

1. Анализ методов управления параметрами эволюционного поиска

В настоящее время предложены следующие методы управления параметрами эволюционного поиска [46]:

1) методы настройки параметров;

2) детерминированное управление параметрами;

3) самоприспосабливающиеся методы.

При использовании первого подхода параметры эволюционного поиска устанавливаются на этапе инициализации и являются постоянными на протяжении всего процесса поиска. Для повышения эффективности эволюционного поиска при решении конкретных оптимизационных задач при использовании методов настройки параметров подбирается такая их комбинация, которая была бы оптимальна для исследуемого класса задач оптимизации [4]. При этом происходит поиск оптимальных значений параметров до начала работы эволюционного метода, после чего полученная комбинация применяется без изменения на протяжении всего оптимизационного процесса. Как правило, для настройки параметров эволюционного поиска экспериментально тестируются различные варианты комбинации значений параметров, затем выбирается комбинация параметров, обеспечивающая наилучшие результаты оптимизации.

Недостатками такого подхода являются:

- сложность повторного использования настроенных параметров при решении задач, частично или полностью отличающихся от тех, которые были использованы при настройке параметров;

- разная эффективность полученного набора параметров на различных итерациях эволюционного поиска.

К детерминированным методам управления параметрами эволюционного поиска [5] относятся методы, в которых применяется стратегия изменения параметров в соответствии с определенным законом без обратной связи от оптимизационного процесса.

При детерминированном управлении изначально задается функция изменения параметров эволюционного поиска, которая, как правило, зависит от номера итерации.

Существенным недостатком такого подхода является то, что функция изменения параметров эволюционно -

РИ, 2007, № 4

го поиска полностью зависит от номера итерации и не зависит от других характеристик процесса поиска (достигнутое значение фитнесс-функции, разнообразие в популяции и т.п.).

Самоприспосабливающиеся методы [6] относятся к адаптивным методам контроля, которые изменяют параметры эволюционного поиска в зависимости от результатов, достигнутых на предыдущих итерациях. При использовании самоприспосабливающихся методов хромосома кроме основных настраиваемых в задаче переменных содержит также параметры эволюционного поиска. При этом в процессе поиска анализируется то, с помощью каких значений включенных в хромосому параметров получены наиболее оптимальные решения.

К недостаткам таких методов относятся:

- необходимость большего количества вычислительных ресур сов для обработки и хр анения дополнительной информации в хромосомах;

- возможность ситуации, при которой параметры поиска, закодированные в оптимальной на текущей итерации хромосоме, окажутся малоэффективными для применения ко всей популяции хромосом.

2. Метод управления параметрами эволюционного поиска с оценкой однородности популяции и эволюционной адаптации

Общим недостатком всех описанных выше методов управления параметрами эволюционного поиска является то, что они не используют информацию о структуре полученной популяции хромосом и ее эффективности при решении рассматриваемой задачи.

В целях устранения недостатков рассмотренных ранее методов в разработанном методе управления параметрами эволюционного поиска предлагается анализировать следующие показатели:

- критерии однородности популяции;

- критерии эволюционной адаптации.

Оценивание однородности популяции на различных итерациях позволяет делать выводы о равномерности покрытия пространства поиска особями текущей популяции. Для оценки однородности популяции предлагается использовать следующие критерии.

1. Коэффициент однородности генотипа t-й популяции:

1 N 1

Ь g = ^ 2---------—

g N j=i1 + Dg(Hj,H),

где N - количество хромосом в популяции; Hj - j-я хромосома; H - хромосома, гены которой рассчитываются как средние значения генов хромосом текущей популяции; Dg(Hj,H) - расстояние между хромосомами Hj и H .

Расстояние D(Hj,H) предлагается вычислять по одной из формул:

- евклидово расстояние:

Dg(Hj,H)

E(h,j - hi)2;

- расстояние Хемминга: Dg (Hj, H) = £ | hy - h; |,

i=1

где L - размер (количество генов) хромосомы; hij -

. . — 1 N

значение i-го бита j-й хромосомы; hi = — У hij -

Nj=1 j

среднее значение 1-го гена в текущей популяции.

2. Коэффициент однородности генотипа-фенотипа t-й популяции:

Я = - jc 1 -

gf N j=11 + Dgf(Hj,H).

Расстояние Dgf (Hj, H) между хромосомами Hj и H

может быть вычислено различными способами в зависимости от решаемой с помощью эволюционного поиска задачи. Для задачи отбора информативных

признаков расстояние Dgf (H j,H) предлагается рассчитывать по формуле:

Dgf (Hj,H) = JZ,I12(hij -h,)2 ,

где і, - значение индивидуальной информативности i-го признака [7], который соответствует i-му гену хромосомы Hj.

Разработанные критерии однородности популяции позволяют оценивать разнообразие хромосом в текущем поколении эволюционного поиска.

Для устранения неоднородности популяции предлагается применять оператор инверсии, который изменяет порядок следования генов в хромосомах. Использование такого оператора для популяций, в которых отсутствует разнообразие хромосом, позволяет значительно расширить область поиска и увеличить вероятность нахождения таких сочетаний генов, при которых достигаются более оптимальные по сравнению с найденными значения фитнесс-функции.

Оценивание эволюционной адаптации позволяет определить устойчивость поиска, т.е. способность эволюционного метода улучшать средние значения целевой функции и не попадать в локальные оптимумы.

Оценивание эволюционной адаптации предлагается выполнять с помощью следующих критериев.

1. Критерий стабильности t-й популяции Ct:

РИ, 2007, № 4

89

C N ост ,t -1

Ct —

t Nt ’

где N0CT, t_i - количество особей текущей t-й популяции, перешедших в нее из (t - 1)-ой популяции; Nt -общее количество особей t-ой популяции.

2. Критерий оценивания скорости изменения фитнессфункции KDf :

K Af = ft - f^|,

— 1 Nt ------ 1 Nt-1

здесь ft =—— Zfj и ft_1 =---- ^fj - средние зна-

Nt j=1 Nt-1 j=1

чения фитнесс-функции на t-й и (t - 1)-й итерациях, соответственно.

В случае появления популяций с неудовлетворительными значениями критериев эволюционной адаптации предлагается увеличить вероятность мутации хромосом, повысив тем самым вероятность нахождения областей пространства поиска, соответствующих более оптимальным значениям целевой функции.

Таким образом, в основном цикле эволюционного поиска предлагается использовать процедуру управления параметрами, состоящую из следующих шагов.

Шаг 1. Вычислить значение выбранного критерия оценивания однородности текущей популяции X t.

заданная пользователем на этапе инициализации параметров эволюционного поиска.

Шаг 7. Останов процедуры управления параметрами эволюционного поиска.

3. Эксперименты и результаты

В целях сравнения различных подходов использовался набор, состоящий из семи тестовых функций, обладающих различными свойствами (унимодальность, непрерывность, гладкость, монотонность, дифференцируемость). В табл. 1 приведено аналитическое описание функций, выбранных для исследования методов управления параметрами эволюционного поиска.

Исследование эффективности применения различных методов управления параметрами эволюционного поиска проводилось с помощью пакета Matlab на компьютере с процессором Athlon 2,5ГГц и ОЗУ 512 Мб. Для выполнения такого исследования разработано программное обеспечение, которое реализует различные подходы к управлению процессом выполнения методов эволюционной оптимизации.

Сравнивались следующие подходы к управлению параметрами методов эволюционной оптимизации:

1) метод настройки параметров [4], при котором па-раметрыэволюционного поискаустанавливаются один раз на этапе инициализации и являются неизменными в процессе поиска;

Шаг 2. Если выполняется условие: Xt > Xп , где Xп -пороговое значение критерия оценивания однородности популяции, тогда считается, что большинство особей текущей популяции располагаются вблизи одной или нескольких точек пространства поиска, образуя неоднородную популяцию. В случае невыполнения такого условия перейти к шагу 4.

Шаг 3. Применить с вероятностью pin (pin є [0,01; 0,5]) оператор инверсии к близко расположенным особям текущей популяции, выполнив циклическую замену генов выбранных для инверсии хромосом.

Шаг 4. Вычислить значение критериев эволюционной адаптации Ct и K .

Шаг 5. Если выполняется одно из следующих условий: Ct > Cn или K Af t < K Af, П , где XП и K Af,n -пороговые значения критерия стабильности популяции и критерия оценивания скорости изменения фитнесс-функции, соответственно, тогда выполнить переход к шагу 6. В противном случае перейти к выполнению шага 7.

Шаг 6. Увеличить вероятность мутации хромосом на текущей итерации:

Pm(t) = Р Pm(0),

где р - коэффициент увеличения вероятности мутации, 1 < р < (pm(0))-1; pm(0) - вероятность мутации,

2) метод детерминированного управления [5], предполагающий изменение вероятности мутации в зависимости от номера текущей итерации по формуле:

pm(t) =

Т — 2

(2 + -----1)-1, 0 <t <tp,

tp

1/L, tp < t,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где L - количество генов в хромосоме; tp - пороговое значение номера итерации, при котором происходит изменение вероятности мутации;

3) самоприспосабливающийся метод [6], в котором хромосомы популяции содержат дополнительную информацию о вероятности мутации при эволюционном поиске;

4) метод управления параметрами эволюционного поиска с оценкой однородности популяции и эволюционной адаптации.

Для всех исследуемых методов изначально устанавливаются следующие операторы и параметры эволюционного поиска: оператор отбора - отбор с использованием рулетки, оператор скрещивания - одноточечный, оператор мутации - гауссова мутация, количество особей в популяции N = 100, вероятность скрещивания p^ = 0,8, вероятность мутации pm = 0,05, максимальное количество итераций T = 50, количество элитных особей Nj, = 2.

90

РИ, 2007, № 4

Таблица 1

Функция х* fmin (х*)

fl(x) = • x2, x <-10, x • sinx + x, -10< x <-5, x2 • |sinx|, -5 < x < 5, x, x > 5. -3n « -9,4248 -3n

22 f^Xi,xJ =1 (( 1 ) 200 2 ) cos(xi + з)• cos( ) +2) 1 (-3; -3) 0

/3 (Хьх>) = Целое(15/ (Х1,Х2)) (-3 ± A; -3 ± A) 0

Задача линейного программир /4(x1,x2) = - 4x1 - 12x2 ^ min при ■ ования: 8x1 - 5x2 - 40, 2x1 + 5x2 - 10, - 6x1 + 5x2 - 60, 2x1 + x2 < 14, x1, x2 > 0. (0,625; 12,75) -77,75

/5 (x1 ,x2,.. ,,x10) = 100 - ^ (ю cos(2rcxi) - x2) i=1 (0; 0; 0; 0; 0; 0; 0; 0; 0; 0) 0

f6(x1,x2) = 0,391-(sm(rc-x1) + sin(jt-x2^• 0,2+0,01-(0,4 • (x1 - 5,5)2 + 0,5 • (x2 - 5,5)2j (4,5; 4,5), (6,5; 6,5) 0

f7 (x1,x2) = 1,4388+(sin^/x? + x2 +1 • sin ^2 +1 - 0,5)/(1 + 0,001- (x? + x2))2 (1,211; 4,413), (-1,211; 4,413) (1,211; -4,413), (-1,211; -4,413) 0

Поскольку методы эволюционной оптимизации имеют вероятностный характер, то тестирование проводилось с помощью 1000 запусков каждого из исследуемых методов управления параметрами эволюционного поиска с одинаковыми начальными значениями параметров.

Результаты экспериментов приведены в табл. 2, где МНП - метод настройки параметров, МДУ - метод детерминированного управления, СМ - самоприспосабливающийся метод, МУП - метод управления параметрами эволюционного поиска с оценкой однородности популяции и эволюционной адаптации.

Как видно из табл. 2, наихудшие показатели у метода настройки параметров, поскольку в нем не используется информация о процессе выполнения эволюционного поиска и его эффективности. Все методы, кроме

предложенного, не справились с нахождением глобального оптимума, расположенного в так называемом “узком горле” (функция fi), а также показали недостаточно хорошие результаты при решении задачи линейного программирования (функция f4). Эффективность разработанного метода управления параметрами эволюционного поиска с оценкой однородности популяции и эволюционной адаптации объясняется использованием получаемой в процессе поиска информации о структуре популяции хромосом и ее эффективности для решении рассматриваемой задачи.

Выводы

Решена задача управления параметрами методов эволюционного поиска.

Таблица 2

Тестовая функция fi Достигнутое оптимальное значение функции fimin Количество вычислений функции fi Время оптимизации, с.

МНП МДУ СМ МУП МНП МДУ СМ МУП МНП МДУ СМ МУП

f1 4,5-10-8 1,3-10-9 2,5-10-9 -8,32 200 200 200 380 0,0234 0,0171 0,0211 0,0240

f2 0,127 0,127 0,127 0,127 5100 5100 5100 5100 0,3256 0,3062 0,3137 0,3087

f3 0 0 0 0 200 210 210 210 0,0156 0,0171 0,0168 0,0163

f4 -26,02 -19,77 -28,77 -62,24 200 200 200 200 0,0234 0,0254 0,0249 0,0218

f5 0,124 0,930 0,630 0,301 5100 5100 5100 5100 0,3757 0,3687 0,3695 0,3503

f6 1,9-10-4 3,8-10-5 2,2-10-5 1,6-10-6 4152 2775 3435 2284 0,2565 0,1703 0,1952 0,1515

f7 2,8-10-4 1,2-10-4 1,5-10-4 1,110-4 1075 1443 1083 1177 0,0682 0,0937 0,0704 0,0781

РИ, 2007, № 4

91

Научная новизна работы заключается в том, что:

- предложены критерии оценивания однородности популяции и эволюционной адаптации, позволяющие оценивать разнообразие хромосом в текущем поколении и определять спосо бность метода эволюционного поиска улучшать средние значения целевой функции и не попадать в локальные оптимумы;

- разработан метод управления параметрами эволюционного поиска с оценкой однородности популяции и эволюционной адаптации, который позволяет повысить эффективность поиска путем использования получаемой в процессе поиска информации о структуре популяции хромосом и ее эффективности для решении рассматриваемой задачи.

Практическая ценност ь результатов работы состоит в том, что: разработано программное обеспечение, реализующее различные подходы к управлению процессом выполнения методов эволюционной оптимизации.

Работа выполнена в рамках госбюджетной темы “Научно-методические основы и математическое обеспечение для автоматизации и моделирования процессов управления и поддержки принятия решений на основе процедур распознавания и эволюционной оптимизации в нейросетевом и нечеткологическом базисах” (Номер гос. регистрации 0106U008621).

Литература: 1. Химмельблау Д. Прикладное нелинейное программирование. М.: Мир, 1974. 534 с. 2. The Practical Handbook of Genetic Algorithms. Volume II. New Frontiers / Ed. by L.D. Chambers. Florida: CRC Press, 2000. 421 p.

3. Олейник Ан.А. Выбор системы информативных признаков для классификации транспортных средств на основе эволюционного поиска // Комп’ютерне моделювання та інтелектуальні системи: Збірник наукових праць / За ред. Д.М. Пізи, С.О. Субботіна. Запоріжжя: ЗНТУ, 2007. С. 134-146. 4. Eiben A.E., Hintering R.., Michalewicz Z. Parameter Control in Evolutionary Algorithms // IEEE Transactions on Evolutionary Computation. 1999. № 3. P. 124-141. 5. Grefenstette J.J. Optimization of control parameters for genetic algorithms // IEEE Transactions on Systems, Man, and Cybernetics. 1986. № 16. P. 122-128.

6. Gremling J.T., Passino K.M. Genetic Adaptive Parameter Estimation // International Journal of Intelligent Control and Systems. 1999. № 3. P. 465-503. 7. Биргер И.А. Техническая диагностика. М.: Машиностроение, 1978. 240 с.

Поступила в редколлегию 08.11.2007

Рецензент: д-р техн. наук, проф. Бодянский Е.В.

Субботин Сергей Александрович, канд. техн. наук, лауреат премии Президента Украины, доцент кафедры программных средств Запорожского национального технического университета. Научные интересы: интеллектуальные системы поддержки принятия решений. Адрес: Украина, 69063, Запорожье, ул. Жуковского, 64, тел.: (061) 769-82-67.

Олейник Андрей Александрович, аспирант кафедры программных средств Запорожского национального технического университета. Научные интересы: интеллектуальные системы поддержки принятия решений. Адрес: Украина, 69063, Запорожье, ул. Жуковского, 64.

УДК004.056.57

УНИВЕРСАЛЬНЫЙ РАСПАКОВЩИК ДЛЯ АНАЛИЗА ВРЕДОНОСНЫХ ПРОГРАММ

АЙРАПЕТЯН Р.А.___________________________

Рассматривается новый универсальный метод распаковки вредоносных программ в памяти для сигнатурного поиска антивирусным сканером. В процессе распаковки происходит эвристический анализ программы. Такой подход позволяет увеличить количество обнаружения вредоносных программ и скорость работы антивируса.

1. Введение

В настоящее время антивирусным программам приходится бороться со все более и более изощренными методами сокрытия вредоносного кода (повсеместное использование навесных защит и упаковщиков). Уследить за всем разнообразием новых упаковщиков невозможно, поэтому ни один современный антивирус не обходится без универсальных модулей распаковки и эвристического анализа.

Начнём с обобщения всей известной информации об эвристических анализаторах. В рекламах антивирусных программных пакетов обычно сообщается примерно следующее: “Наш антивирус ловит не только известные вирусы, заложенные в базу, но и неизвестные вирусы при помощи эвристического анализато-

ра”. Это единственная информация, которую фирмы по разработке антивирусного программного обеспечения сообщают. Всё остальное охраняется как зеница ока и является ноу-хау каждой фирмы в отдельности

Так, компания Eset разработала технологию ThreatSense [1]. Эта технология - сложная, сбалансированная система продвинутой эвристики и сигнатур -ного анализа. Данная система позволяет обеспечить одну из лучших возможностей по обнаружению не только известных, но и новых угроз, не снижая при этом скорости работы используемой системы.

Архитектурно эвристик состоит из следующих модулей: набор статических распаковщиков, эмулятор ЦП (а в некоторых случаях и операционной системы), реконструктор структур данных и поток управления (data and control flows). Поверх них «натянут» сам эвристический анализатор, представляющий собой совокупность детекторов правил. В чистом виде система правил совершенно бесполезна, и чтобы эвристический анализатор работал, как полагается, ему необходимы данные, собираемые остальными компонентами антивируса [2].

В отличие от эвристических анализаторов первого поколения, новые эвристики более требовательны к ресурсам компьютера, однако и уровень обнаружения у них значительно выше. Эвристические анализаторы в большинстве современных антивирусов являются эвристиками второго поколения. Казалось бы,

92

РИ, 2007, № 4

i Надоели баннеры? Вы всегда можете отключить рекламу.