УДК 681.3
ЭВОЛЮЦИОННЫЕ АЛГОРИТМЫ С МАТРИЧНОЙ РЕПЛИКАЦИЕЙ
Е.М. Васильев, И.В. Крутских
Излагается анализ причин, затрудняющих достижение глобальных экстремумов ИР-иолных задач с помощью генетических алгоритмов, использующих механизмы расщепления родительских признаков. Обоснован переход от механизма скрещивания к варианту эволюции, осуществляемой путём мутагенеза особей с матричной репликацией индивидуальных последовательностей. Представлены результаты экспериментальной проверки предложенного алгоритма, подтверждающие его эффективность
Ключевые слова: генетический алгоритм, механизм скрещивания, мутагенез, матричная репликация
1. Анализ проблемы
Хорошо известные в настоящее время генетические алгоритмы решения оптимизационных задач [1,2] воспроизводят эволюцию видов с использованием механизма скрещивания, подчиняющегося закону расщепления родительских признаков Г. Менделя [3]. Высокая степень избирательности этого механизма, выражающаяся во всё возрастающей частоте порождения себе подобных, обеспечивает быстрое вытеснение неконкурентоспособных особей из популяции и сопровождается снижением его эволюционной пластичности. Это обстоятельство отражает, в частности, закон гомологических рядов Н.И. Вавилова (родственные виды имеют сходные спектры изменчивости) [4], и с прикладной точки зрения - теории принятия решений -предопределяет низкую вероятность завершения поиска в глобальном экстремуме.
Целеустанавливающая роль термина “поиск” в этой теории постепенно привела к подмене методологической сущности генетических алгоритмов: процесс создания нового уровня организации системы стал рассматриваться как процесс его обнаружения в многомерном пространстве её состояний. Эта подмена, незаметная на уровне элементарных алгоритмических процедур, приводит к неверной оценке возможностей генетических алгоритмов в плане достижения единичных наилучших решений. Действительно [5,6], целенаправленный отбор имеющейся информации из шума, эквивалентный поиску единственного наилучшего варианта в их колоссальном многообразии во многомерных задачах, не оставляет практически никаких надежд на успешное его завершение в глобальном экстремуме. В то же время, обсуждая вопрос о предполагаемой ничтожной вероятности возникновения жизни, М. Эйген [5,6] отмечает, что рост белков происходит по принципу сигнатуры, т.е. всякая биологическая последовательность обладает неотъемлемой способностью инструктировать построение своего продолжения. Этот механизм эволюции получил название матричной репликации и соответствует её довидовому
Васильев Евгений Михайлович - ВГТУ, канд. техн. наук, ст. науч. сотрудник, e-mail: [email protected], тел. 8 (4732) 437776
Крутских Иван Владимирович - ВГТУ, студент, e-mail: [email protected], тел. 8 (4732) 437720
этапу, т.е. эволюции индивидуальных последовательностей поколений простейшим мутагенезом.
На целесообразность реализации в генетических алгоритмах механизма индивидуальной матричной репликации указывает и тот факт, что фенотипические преимущества особей по степени приспособленности быстро стабилизируются, т.е. приводят к локальному экстремуму, в то время как генотипические изменения, несовпадающие с фенотипическими, требуют для своей фиксации пространственного разделения особей, т. е. индивидуального развития.
Несовпадение направленных изменений генотипа и фенотипа особи в генетических алгоритмах ярко проявляется в комбинаторных КР-полных задачах оптимизации. На рисунке показано изменение функции цели г в квадратичной задаче о назначениях 1а120а [7,8] по мере увеличения хеммингова расстояния ё от оптимального расположения генов в хромосоме.
8.5-10
8-10
5
7.5-10
7-10
tai20a
n=20
10
15 d 20
Иллюстрация взаимосвязи фенотипа и генотипа
Очевидно, что улучшение критерия г в общем случае не свидетельствует об улучшении генотипа особи в смысле его приближения к оптимальному. Это обстоятельство объясняется известной в генетике многосвязностью каждого гена с несколькими фенотипическими признаками и каждого фенотипического признака с несколькими генами. Чем сильнее характер этих перекрёстных взаимосвязей, тем ниже эффективность направленного отбора лучших особей по фенотипическим признакам для достижения глобального генотипического экстремума.
В рассмотренном плане использование функции цели в качестве критерия решения задач комбинаторной оптимизации утрачивает свою очевидность и монопольную единственность. С точки зрения эволюции на основе матричной репликации,
z
0
5
т.е. самоорганизации, для успешного продолжения важна не степень приспособленности особи, а её самоинструктирующая способность к дальнейшему безошибочному репликационному развитию - селективная ценность. В химических и биологических системах такая селективная ценность особей может определяться как разность энергии взаимодействия комплементарных и некомплементарных пар элементов систем. В генетических алгоритмах разработка аналогичного критерия является актуальной проблемой, временным решением которой может служить, как отмечалось выше, реализация раздельной эволюции последовательных поколений с независимым получением множества конкурентоспособных решений и исключающим возможность их взаимного вытеснения в ходе решения. Отметим, что косвенным признаком селективной ценности, а значит, и точности репликации каждой из последовательностей, может служить, например, частота сменяемости одних и тех же генов в генотипе, когда в ходе эволюции будет наблюдаться многократное включение и исключение этих генов в хромосому, свидетельствующее о низкой энергии взаимодействия с ними. Это признак полезен также для постепенного сокращения перечня локусов, участвующих в эволюционных механизмах, предполагая, что устойчивые локусы прошли точку невозврата, и их содержание целесообразно зафиксировать.
Таким образом, с целью повышения эффективности генетических алгоритмов в плане достижимости глобальных экстремумов оптимизационных задач предлагается переход от механизма расщепления родительских признаков к механизму матричной репликации мутагенезом.
Опишем схему предлагаемого алгоритма.
2. Алгоритм с матричной репликацией
Выделим следующие основные процедуры механизма матричной репликации:
введение матриц репликации в исходное множество особей;
выполнение шага эволюции;
проверка условия завершения эволюции.
Рассмотрим хромосому, содержащую т локу-сов, в каждом из которых может быть размещён ген
gi, I = 1,т , имеющий одну аллелоформу. Некото-
рый, неизвестный вариант Я*={/ь /2, ... ,/,-, ... , 1т} размещения генов / в локусы ] (у = 1, т ) будет соответствовать глобальному экстремуму решаемой задачи. Заметим. что мощность множества V возможных решений составляет для указанных условий |^=т!, т.е. равно числу перестановок генов в хромосоме.
Очевидно, что в качестве матрицы репликации могут служить любые г локусов размещения Я*, г = 1, т , при этом не ставится требование их обязательной смежности.
Тогда задача введения матрицы длиной г в исходную популяцию Р сведётся к регулярному раз-
мещению Агт без повторений г произвольно взятых генов в т локусах:
- = т(т - 1)...(т - г +1),
Аг =-
лт
т!
(т - г)!
которое и определит собою объём исходной популяции |Р|= Агт . Например, для хромосомы длиной т=20 (т!=20!«2,4-1018), и размером матрицы г=4 получим размер исходной популяции
|Р|= Агт =20-19-18-17= 116280 особей, т.е. примерно
4,8-10-14 часть Щ. Оставшиеся т-г локусов хромосомы заполняются не вошедшими в матрицу генами равновероятным случайным образом. При этом количество особей Ок, у которых не менее к элементов обязательно совпадёт с вариантом Я*, составит: о = Ск (т - к)!
Ок = Сг --------,
к г (т - г)!
где Скг - число сочетаний из г по к без повторений. Ряд значений Ок и их доля в исходной выборке для приведённого числового примера представлены в табл. 1.
Таблица 1
Количество Ок начальных особей, содержащих не менее к элементов матрицы репликации
(т=20, | Р |г=4 = 116280, | Р |г=5 = 1860480)
Значение к
і шраме і р 1 2 3 4 5
Sk (г=4) 23256 1836 68 1 -
$к И г=4 0,2 0,016 0,0006 8-10-6 -
Sk (г=5) 465120 48960 2720 80 1
Sk И г=5 0,25 0,026 0,0015 40-10-6 0,5-10'6
Анализ табл. 1 показывает, что введение матрицы репликации размером г в хромосому длиной т обеспечивает нижнюю границу доли матрицированных особей в исходной популяции на уровне
Ртт = ~, причём эту долю занимают особи с кодо-
т
вым расстоянием ё от Я*, равным ё=т-к. Число особей с ё>1 быстро уменьшается, однако с ростом ё особей также быстро возрастает их начальная селективная ценность.
Шаг индивидуальной эволюции заключается в случайном равновероятном изменении одного локу-са (или одной их пары при у = 1, т), что соответствует процедуре генной мутации, и последующем отборе из родителя и мутанта лучшей особи. Стремление чрезмерно увеличить количество локусов, участвующих в мутациях, приводит к снижению точности репликации.
Так как доля ртт матрицированных особей в исходной популяции, как правило, невысока (см. табл. 1), то естественна попытка зафиксировать сформированные матрицы и подвергать эволюционным изменениям только локусы, не содержащие элементы матрицы; однако это приведёт к необходимости затрат вычислительных ресурсов на эволюцию (1-ртш)-|Р| заведомо неоптимальных вариантов.
В результате эффективность алгоритмов с таким фиксированием оказывается невысокой (см. табл.2).
Из этого следует, что параметром настройки алгоритма является возможность влияния на эффективность рассматриваемых процедур включением локусов матрицы в процесс мутагенеза, что аналогично, в некоторой степени, свойству отражения окружающей среды в генотипе.
Условием завершения эволюции при наличии |Р| индивидуальны последовательностей целесообразно выбрать число N совершённых шагов мутагенеза.
3. Экспериментальная проверка алгоритма
Для проверки работоспособности алгоритма с матричной репликацией использовалась тестовая квадратичная задача о назначениях 1а120а с заранее известной величиной глобального экстремума. Эта задача решалась двумя алгоритмами:
типовой генетический алгоритм с генной мутацией одной пары генов в популяции из 6000 особей и формированием новой популяции такого же объёма из лучших родителей и мутантов;
генетический алгоритм с матричной репликацией одной пары генов в 116280 особях и последующим отбором лучшего варианта отдельно в каждой последовательности.
Кроме того, были исследованы варианты решений с одновременным использованием генной и хромосомной мутаций, где случайным образом реверсировалось расположение нескольких смежных генов, количество которых также выбиралось случайным на каждом шаге эволюции.
Для сопоставимости результатов численного эксперимента число повторений Е алгоритма без репликации выбрано таким, чтобы общее количество особей, участвующих в эксперименте, для обоих алгоритмов было примерно одинаковым: |Р|г=о-Е=6000-40=240000«|Р|г=4-2=116280-2, т.е. алгоритм без репликации повторялся 40 раз для популяции объёмом 6000 особей, а алгоритм с репликацией
Воронежский государственный технический университет
осуществил двукратную индивидуальную эволюцию для 116280-ти особей.
Результаты решения представлены в табл. 2.
Таблица 2
Сравнительные результаты решения задачи 1аі20а различными генетическими алгоритмами
Вариант алгоритма с числом шагов N=3000 Количество эволюций, завершившихся формированием глобального экстремума
Генные мутации Генные и хромосомные мутации Генные мутации с фиксированной матрицей
Без репликации |Р|г=0=6000, Е=40 1 2 -
С репликацией |Р|г=4=116280, Е=2, г=4, 8 11 1
Результаты эксперимента подтверждают эффективность применения механизма матричной репликации в задачах достижения глобального экстремума.
Литература
1. Батищев Д.И. Генетические алгоритмы решения экстремальных задач / Д.И. Батищев. - Воронеж: ВГТУ, 1995 .- 69 с.
2. Pardalos P.M. Heuristics for nonlinear assignment problems
/ P.M. Pardalos, L.S. Pitsoulis // Kluwer. - 2000. - P. 175 - 215.
3. Мендель Г. Опыты над растительными гибридами /
Г. Мендель. - М.: Наука, 1965. - 159 с.
4. Вавилов Н.И. Закон гомологических рядов в наследст-
венной изменчивости / Н.И. Вавилов. - Л.: Наука, 1987. - 256 с.
5. Эйген М. Самоорганизация материи и эволюция биоло-
гических макромолекул / М. Эйген. - М.: Мир, 1973. -224 с.
6. Эйген М. Игра жизни / М. Эйген, Р. Винклер. - М.:
Наука, 1979. - 99 с.
7. Taillard E.D. Robust tabu search for the quadratic assingn-
ment problem / E.D. Taillard // Parallel Computing, 1991, №17.- Pp.443-455.
8. Taillard E.D. Comparison of iterative searches for the quad-
ratic assingnment problem / E.D. Taillard // Location Science. - 1995. - №3. -P. 87-105.
EVOLUTIONARY ALGORITHMS WITH MATRIX REPLICATION E.M. Vasilyev, I.V. Krutskih
The analysis of the reasons complicating achievement of global extremes NP-full problems with the help of genetic algorithms, using mechanisms of splitting parental attributes is stated. Transition from the mechanism of crossing to variant of the evolution that is carried out in the way mutagenesis of individuals with matrix replication of individual sequences is proved. Results of experimental check of the offered algorithm, confirming its efficiency are submitted
Key words: genetic algorithm, the mechanism of crossing, mutagenesis, matrix replication