УДК 519.95
ПРИМЕНЕНИЕ ГЕНЕТИЧЕСКИХ АЛГОРИТМОВ ПРИ ОПТИМИЗАЦИИ НЕЛИНЕЙНЫХ ФУНКЦИЙ
© А. А. Андреев
Ключевые слова: генетический алгоритм; оптимизация нелинейных функций; популяция; хромосома; генотип; селекция; оператор скрещивания; оператор мутации.
В статье обсуждаются возможности применения генетических алгоритмов при оптимизации нелинейных функций и выявляются параметры, влияющие на эффективность их использования.
ВВЕДЕНИЕ
Нейронные сети были созданы в результате наблюдений за естественными процессами, происходящими в нервной системе живых существ, и попыток воспроизведения этих процессов. Аналогично, генетические алгоритмы возникли в результате наблюдения и попыток копирования естественных процессов, происходящих в мире живых организмов, в частности, эволюции и связанной с ней селекции (естественного отбора) популяций живых существ.
Идею генетических алгоритмов высказал Дж. Холланд [1] в конце шестидесятых - начале семидесятых годов ХХ века. Он заинтересовался свойствами процессов естественной эволюции (в т. ч. фактом, что эволюционируют хромосомы, а не сами живые существа). Холланд был уверен в возможности составить и реализовать в виде компьютерной программы алгоритм, который будет решать сложные задачи так, как это делает природа - путем эволюции. Поэтому он начал трудиться над алгоритмами, оперировавшими последовательностями двоичных цифр (единиц и нулей), получившими название хромосом. Эти алгоритмы имитировали эволюционные процессы в поколениях таких хромосом. В них были реализованы механизмы селекции и репродукции, аналогичные применяемым при естественной эволюции. Так же, как и в природе, генетические алгоритмы осуществляли поиск «хороших» хромосом без использования какой-либо информации о характере решаемой задачи. Требовалась только некая оценка каждой хромосомы, отражающая ее приспособленность. Механизм селекции заключается в выборе хромосом с наивысшей оценкой (т. е. наиболее приспособленных), которые репродуцируют чаще, чем особи с более низкой оценкой (хуже приспособленные). Репродукция означает создание новых хромосом в результате рекомбинации генов родительских хромосом. Рекомбинация - это процесс, в результате которого возникают новые комбинации генов. Для этого используются две операции: скрещивание, позволяющее создать две совершенно новые хромосомы потомков путем комбинирования генетического материала пары родителей, а также мутация, которая может вызывать изменения в отдельных хромосомах.
Генетические алгоритмы в различных формах можно применять ко многим научным и техническим проблемам, например, при моделировании развития в различных предметных областях, таких как экономика, политические и когнитивные системы, ну и, конечно, экология, иммунология и популяционная генетика. В машинном обучении их можно использовать при проектировании нейронных сетей или управлении роботами.
Возможно наиболее популярное приложение генетических алгоритмов - оптимизация многопараметрических функций. Многие реальные задачи могут быть сформулированы как поиск оптимального значения, где значение - сложная функция, зависящая от некоторых входных параметров. В некоторых случаях представляет интерес найти те значения параметров, при которых достигается наилучшее точное значение функции. В других точный «оптимум» не требуется - в качестве решения можно взять любое значение, которое лучше некоторой заданной величины. В этом случае генетические алгоритмы являются одним из наиболее приемлемых методов для поиска «хороших» значений. С другой стороны, нередки случаи, когда генетический алгоритм работает не так эффективно, как ожидалось. Эффективность генетического алгоритма сильно зависит от таких деталей, как метод кодировки решений, операторы, настройки параметров, частный критерий успеха и т. д. [2].
Целью данной работы является оценка возможности применения генетических алгоритмов при оптимизации нелинейных функций и выявление параметров, влияющих на эффективность их использования.
ГЕНЕТИЧЕСКИЕ АЛГОРИТМЫ
Генетические алгоритмы - это процедуры поиска решений, основанные на механизмах естественного отбора и наследования. В них используется эволюционный принцип выживания наиболее приспособленных особей. При этом генетическим алгоритмам присущи следующие свойства, характеризующие их устойчивость [1]:
1) кодирование параметров - обрабатываются не значения параметров самой задачи, а их закодированная форма;
2) операции на популяциях - поиск решения осуществляется исходя не из единственной точки, а из их некоторой популяции (набора точек);
3) использование минимума информации о задаче -используется только целевая функция поиска, а не ее производная или какая иная дополнительная информация;
4) рандомизация - применяются вероятностные, а не детерминированные правила выбора.
При описании генетических алгоритмов используются определения, заимствованные из генетики (популяция, хромосома и т. д.) и соответствующие этим терминам определения из технического лексикона (цепь, двоичная последовательность и т. п.).
Популяцией является конечное множество особей, которые в генетических алгоритмах представляются хромосомами с закодированным в них множествами параметров задачи, т. е. решений, которые иначе называются точками в пространстве поиска. В некоторых работах особи называются организмами.
Хромосомы (другие названия - цепочки или кодовые последовательности) - это упорядоченные последовательности генов. Ген (также называемый свойством, знаком или детектором) - это атомарный элемент генотипа, в частности, хромосомы. Под генотипом или структурой понимается набор хромосом данной особи. Таким образом, особями популяции могут быть генотипы либо единичные хромосомы (в довольно распространенном случае, когда генотип состоит из одной хромосомы).
Фенотип - это набор значений, соответствующих данному генотипу, т. е. декодированная структура или множество параметров задачи.
Аллель - это значение конкретного гена, также определяемое как значение свойства или вариант свойства. Локус или позиция указывает место размещения данного гена в хромосоме (цепочке). Множество позиций генов в генетических алгоритмах называется локи.
Очень важным понятием в генетических алгоритмах считается функция приспособленности, иначе называемая функцией оценки. Она представляет меру приспособленности данной особи в популяции. Эта функция играет важнейшую роль, поскольку позволяет оценить степень приспособленности конкретных особей в популяции и выбрать из них наиболее приспособленные (т. е. имеющие наибольшие значения функции приспособленности) в соответствии с эволюционным принципом выживания «сильнейших» (лучше всего приспособившихся). Функция приспособленности также получила свое название непосредственно из генетики. Она оказывает сильное влияние на функционирование генетических алгоритмов и должна иметь точное и корректное определение. Например, в задачах оптимизации функция приспособленности, как правило, оптимизируется (точнее говоря, максимизируется) и называется целевой функцией. В задачах минимизации целевая функция преобразуется, и проблема сводится к максимизации. В теории управления функция приспособленности может принимать вид функции погрешности, а в теории игр - стоимостной функции. На каждой итерации генетического алгоритма приспособленность каждой особи данной популяции оценивается при помощи функции приспособленности, и на этой основе создается следующая популяция особей,
составляющих множество потенциальных решений проблемы, например, задачи оптимизации.
Очередная популяция в генетическом алгоритме называется поколением, а к вновь создаваемой популяции особей применяется термин «новое поколение» или «поколение потомков».
КЛАССИЧЕСКИЙ ГЕНЕТИЧЕСКИЙ АЛГОРИТМ
Основной классический генетический алгоритм (также называемый элементарным или простым генетическим алгоритмом) состоит из следующих шагов (рис. 1):
1) инициализация, или выбор исходной популяции хромосом;
2) оценка приспособленности хромосом в популяции;
Рис. 1. Блок-схема генетического алгоритма
3) проверка условия остановки алгоритма;
4) селекция хромосом;
5) применение генетических операторов;
6) формирование новой популяции;
7) выбор «наилучшей» хромосомы.
Инициализация, т. е. формирование исходной популяции, заключается в случайном выборе заданного количества хромосом (особей), представляемых двоичными последовательностями фиксированной длины.
Оценивание приспособленности хромосом в популяции состоит в расчете функции приспособленности для каждой хромосомы этой популяции. Чем больше значение этой функции, тем выше «качество» хромосомы. Форма функции приспособленности зависит от характера решаемой задачи. Предполагается, что функция приспособленности всегда принимает неотрицательные значения и, кроме того, что для решения оптимизационной задачи требуется максимизировать эту функцию. Если исходная форма функции приспособленности не удовлетворяет этим условиям, то выполняется соответствующее преобразование (например, задачу минимизации функции можно легко свести к задаче максимизации).
Проверка условия остановки алгоритма. Определение условия остановки генетического алгоритма зависит от его конкретного применения. В оптимизационных задачах, если известно максимальное (или минимальное) значение функции приспособленности, то остановка алгоритма может произойти после достижения ожидаемого оптимального значения, возможно - с заданной точностью. Остановка алгоритма также может произойти в случае, когда его выполнение не приводит к улучшению уже достигнутого значения. Алгоритм может быть остановлен по истечении определенного времени выполнения либо после выполнения заданного количества итераций. Если условие остановки выполнено, то производится переход к завершающему этапу выбора «наилучшей» хромосомы. В противном случае на следующем шаге выполняется селекция.
Селекция хромосом заключается в выборе (по рассчитанным на втором этапе значениям функции приспособленности) тех хромосом, которые будут участвовать в создании потомков для следующей популяции, т. е. для очередного поколения. Такой выбор производится согласно принципу естественного отбора, по которому наибольшие шансы на участие в создании новых особей имеют хромосомы с наибольшими значениями функции приспособленности. Существуют различные методы селекции. Наиболее популярным считается так называемый метод рулетки, который свое название получил по аналогии с известной азартной игрой. Каждой хромосоме может быть сопоставлен сектор колеса рулетки, величина которого устанавливается пропорциональной значению функции приспособленности данной хромосомы. Поэтому чем больше значение функции приспособленности, тем больше сектор на колесе рулетки. Все колесо рулетки соответствует сумме значений функции приспособленности всех хромосом рассматриваемой популяции. Каждой хромосоме, обозначаемой chi для i = 1, 2, ... , N (где N обозначает численность популяции), соответствует сектор колеса v(ch), выраженный в процентах согласно формуле:
у(аИг) = ^(СЬг) 100%,
(ск,)
г=1
где Е(сН) - значение функции приспособленности хро-
^ (ск-)
мосомы ск, а число р(скг) = —-----------г---- называется
(ск-- )
г=1
вероятностью селекции хромосомы ск. Таким образом, селекция хромосомы может быть представлена как результат поворота колеса рулетки, поскольку «выигравшая» (т. е. выбранная) хромосома относится к выпавшему сектору этого колеса. Очевидно, что чем больше сектор, тем больше вероятность «победы» соответствующей хромосомы. Поэтому вероятность выбора данной хромосомы оказывается пропорциональной значению ее функции приспособленности. Если всю окружность колеса рулетки представить в виде цифрового интервала [0, 100], то выбор хромосомы можно отождествить с выбором числа из интервала [а, Ь], где а и Ь обозначают соответственно начало и окончание фрагмента окружности, соответствующего этому сектору колеса; очевидно, что 0 < а < Ь < 100. В этом случае выбор с помощью колеса рулетки сводится к выбору числа из интервала [0, 100], которое соответствует конкретной точке на окружности колеса.
В результате процесса селекции создается родительская популяция, также называемая родительским пулом с численностью М, равной численности текущей популяции.
Применение генетических операторов к хромосомам, отобранным с помощью селекции, приводит к формированию новой популяции потомков от созданной на предыдущем шаге родительской популяции. В классическом генетическом алгоритме применяются два основных генетических оператора: оператор скрещивания и оператор мутации. Однако оператор мутации играет явно второстепенную роль по сравнению с оператором скрещивания. Это означает, что скрещивание в классическом генетическом алгоритме производится практически всегда, тогда как мутация - достаточно редко. Вероятность скрещивания, как правило, достаточно велика (обычно 0,5 < рс < 1), тогда как вероятность мутации устанавливается весьма малой (чаще всего 0 < рт < 0,1). Это следует из аналогии с миром живых организмов, где мутации происходят чрезвычайно редко.
Скрещивание - это ключевой оператор генетических алгоритмов, определяющий их возможности и эффективность. Мутация играет более ограниченную роль. Она вводит в популяцию некоторое разнообразие и предупреждает потери, которые могли бы произойти вследствие исключения какого-нибудь значимого гена в результате скрещивания. В генетическом алгоритме мутация хромосом может выполняться на популяции родителей перед скрещиванием либо на популяции потомков, образованных в результате скрещивания.
Оператор скрещивания. На первом этапе скрещивания выбираются пары хромосом из родительской популяции (родительского пула). Это временная попу-
ляция, состоящая из хромосом, отобранных в результате селекции и предназначенных для дальнейших преобразований операторами скрещивания и мутации с целью формирования новой популяции потомков. На данном этапе хромосомы из родительской популяции объединяются в пары. Это производится случайным способом в соответствии с вероятностью скрещивания рс. Далее для каждой пары отобранных таким образом родителей разыгрывается позиция гена (локус) в хромосоме, определяющая так называемую точку скрещивания. Если хромосома каждого из родителей состоит из L генов, то очевидно, что точка скрещивания 1к представляет собой натуральное число, меньшее Ь Поэтому фиксация точки скрещивания сводится к случайному выбору числа из интервала [1, L-1]. В результате скрещивания пары родительских хромосом получается следующая пара потомков:
1) потомок, хромосома которого на позициях от 1 до 1к состоит из генов первого родителя, а на позициях от 1к + 1 до L - из генов второго родителя;
2) потомок, хромосома которого на позициях от 1 до 1к состоит из генов второго родителя, а на позициях от 4 + 1 до L - из генов первого родителя.
Оператор мутации. Оператор мутации с вероятностью рт изменяет значение гена в хромосоме на противоположное (т. е. с 0 на 1 или обратно). Как уже упоминалось выше, вероятность мутации обычно очень мала, и именно от нее зависит, будет данный ген мутировать или нет. Вероятность рт мутации может эмулироваться, например, случайным выбором числа из интервала [0, 1] для каждого гена и отбором для выполнения этой операции тех генов, для которых разыгранное число оказывается меньшим или равным значению рт.
Формирование новой популяции. Хромосомы, полученные в результате применения генетических операторов к хромосомам временной родительской популяции, включаются в состав новой популяции. Она становится т. н. текущей популяцией для данной итерации генетического алгоритма. На каждой очередной итерации рассчитываются значения функции приспособленности для всех хромосом этой популяции, после чего проверяется условие остановки алгоритма и либо фиксируется результат в виде хромосомы с наибольшим значением функции приспособленности, либо осуществляется переход к следующему шагу генетического алгоритма, т. е. к селекции. В классическом генетическом алгоритме вся предшествующая популяция хромосом замещается новой популяцией потомков, имеющей ту же численность.
Выбор «наилучшей» хромосомы. Если условие остановки алгоритма выполнено, то следует вывести результат работы, т. е. представить искомое решение задачи. Лучшим решением считается хромосома с наибольшим значением функции приспособленности.
ПРИМЕНЕНИЕ ГЕНЕТИЧЕСКИХ АЛГОРИТМОВ ПРИ ОПТИМИЗАЦИИ НЕЛИНЕЙНЫХ ФУНКЦИЙ ДВУХ ПЕРЕМЕННЫХ
При оптимизации функции нескольких переменных с помощью генетических алгоритмов, важным является способ кодирования исходных данных в виде набора хромосом [1]. Так как исходные данные являются ве-
щественными числами, то длина хромосомы и способ ее построения влияют на точность решения. В классическом генетическом алгоритме применяется двоичное кодирование - аллели всех генов в хромосоме равны либо 0, либо 1. Длина хромосомы зависти от условий задачи. При фиксированной длине хромосомы на точность решения влияет размер области, в которой осуществляется оптимизация функции. Так, если ищется максимум функции / (х, у) в некоторой области Б = = {(х, у) | х є [хі, х2]; у є [уь у2]}, то при длине хромосомы т количество значащих цифр д после запятой для переменной х определяется выражением
q =
log
2m -1
10
x2 - x.
Пересчет же значений хромосомы в значения реальных переменных осуществляется по формуле:
x = x, + x.
bin
x2 - X1 2m -1
где xbin - десятичное значение двоичнои последовательности, кодирующей число х. При этом значению xj соответствует последовательность из m нулей, а значению х2 - из m единиц. Для переменной у ситуация аналогичная.
В данной работе для оптимизации функции двух переменных использовался классический генетический алгоритм с длиной хромосомы в 32 разряда (m = 16): старшие 16 разрядов соответствуют переменной х, младшие - у. Непосредственно сам алгоритм реализован в среде Turbo Delphi, а все генетические операторы на языке ассемблера.
Например, для функции f ( x, y) = e
= e-( x2 + У2)
(рис. 2)
результаты работы генетического алгоритма приведены в табл. 1 и на рис. 3.
Рис. 2. График функции f (x, y) = e (x +y )
Рис. 3. Поиск максимума функции f (х,у) = е (' ное значение f (х, у), ♦ - среднее значение f (х, у), '
у ) классическим генетическим алгоритмом (случай 3 табл. 1): - максимальное значение / (х, у)
минималь-
Таблица 1
№ п п Область D Число значащих цифр после запятой q Число попу- ляций Точка максимума
1 x є [-3, 3] У є [-3, 3] по х: 4 по у: 4 5 f (0,00462; -0,01231) = = 0,9998270
2 x є [-3, 3] У є [-3, 3] по х: 4 по У: 4 2 f (0,00444; 0,00417) = = 0,9999629
3 x є [-3, 3] У є [-3, 3] по х: 4 по У: 4 5 f (-0,11110; 0,08263) = = 0,9810119
4 x є [-10, 10] y є [-10, 10] по х: 3 по у: 3 5 f (-0,1067; 0,3072) = = 0,8996709
Данная функция имеет глобальный максимум в точке f (0; 0) = 1. Число особей в популяции - 1000. Вероятность мутации рт = 0,1. Чтобы ускорить работу алгоритма, мутация применялась не для каждого гена в хромосоме, а для одного случайно выбранного, поэтому истинное значение вероятности мутации ниже. В качестве критерия остановки алгоритма использовалось неравенство |шах^ — - тах< в , в = 0,001.
Следует отметить, что максимум обычно находится
за достаточно малое число популяций: 2-6, но возникают ситуации, когда лучшее значение максимума теряется («проскакивается») из-за малого количества соответствующих особей в популяции (рис. 3 и случай 3 в табл. 1). На результат оптимизации очень сильно влияет критерий завершения алгоритма и размер области оптимизации.
ЛИТЕРАТУРА
1. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. М.: Горячая линия-Телеком, 2006. 452 с.
2. Люггер Дж.Ф. Искусственный интеллект. М.: Издат. дом «Вильямс», 2003. 864 с.
Поступила в редакцию 7 июля 2009 г.
Andreyev A.A. Use of the genetic algorithms in optimization of non-linear functions. In the articles the possibilities of usage of the genetic algorithms in optimization of non-linear functions are discussed, parameters affecting the effectiveness of its use are discovered.
Key words: genetic algorithm; optimization of non-linear functions; population; chromosome; genotype; selection; breeding operator; mutation operator.