УДК 681.3 ГЕНЕТИЧЕСКИЙ АЛГОРИТМ РЕШЕНИЯ КВАДРАТИЧНОЙ ЗАДАЧИ О НАЗНАЧЕНИЯХ
Е.М. Васильев, И.В. Крутских
Рассматриваются этапы решения квадратичной задачи о назначениях генетическим алгоритмом на основе мутагенеза. Подробно раскрыты процедуры генной и хромосомной мутаций этого алгоритма и исследовано влияние их настраиваемых параметров на сходимость поиска. В результате анализа решений тестовых задач 1аі12а - 1аі20а обсуждена проблема достижимости глобального экстремума и предложено построение алгоритма на базе матричной репликации. Представлена проверка эффективности репликационного подхода к имитации эволюционного процесса
Ключевые слова: задача о назначениях, генетический алгоритм, мутагенез, матричная репликация
1. Постановка задачи
Рассмотрим квадратичную задачу о назначениях (QAP - the Quadratic Assignment Problem) [1]:
n n n n
Z = ZZ Z ZciJqkpxIkxJp ^ min (1)
i=1j=1k=1 p=1
в которой: n - количество объектов и пунктов их назначения; Cj - затраты на передачу единицы ресурсов из пункта i в пункт j; qkp - объём ресурсов, направляемых от объекта k к объекту p;
[1 при назначении объекта к в пункт i; lk [О, иначе;
1 при назначении объекта p в пункт j;
]р [0, иначе,
I = 1, п ; к = 1, п ; ] = 1, п ; р = 1, п ; 2 - затраты, необходимые для обмена ресурсами между объектами.
Поставленная задача является математической моделью многих реальных прикладных задач, возникающих при проектировании информационных систем, размещении промышленных объектов и оборудования, выборе конфигураций сетей электроснабжения [2]. Явно выраженный комбинаторный характер этой задачи, общее количество вариантов решения которой определяется числом перестановок Я(п)=п!, превосходящим по скорости роста экспоненциальную зависимость, а также наличие существенных внутрисистемных связей, выражающихся в том, что вклад назначения каждого объекта в общие затраты зависит от назначения всех других объектов, привели к тому, что точные методы решения РЛР удаётся применить для размерностей п задачи не превышающей 20, и приходится использовать приближённые методы, способные за приемлемое время получать решение, близкое к оптимальному [3]. Наиболее известными из таких методов являются генетические алгоритмы, хорошо зарекомендовавшие себя при решении различных задач оптимизации [4], однако успехи их применения в рЛР остаются достаточно скромными.
Причина такого положения заключается, на наш взгляд, в излишне приписываемой этим алгоритмам уникальности настроек для решения каждой конкретной задачи и, как следствие, недостатке конкретных рекомендаций по их использованию.
В предлагаемой работе подробно излагаются процедуры генетического алгоритма на примере решения ОЛР, количественно исследовано влияние его настраиваемых параметров на сходимость, выявлены пределы этой сходимости в задачах №-класса и обсуждены перспективы применения.
Указанные вопросы обсуждаются в следующем порядке:
общая структура алгоритма; исследование механизма генной мутации; исследование хромосомной мутации; анализ влияния на сходимость объёма популяции;
проблема достижения глобального экстремума; исследование матричной репликации.
2. Общая структура алгоритма
Поскольку каждый вариант решения задачи (1) соответствует некоторому варианту перестановки без повторений, то в генетической интерпретации многообразие этих вариантов может быть обеспечено хромосомой Н, содержащей п генов кг, / = 1, п, каждый из которых может занимать любой из п ло-кусов хромосомы, причём все гены имеют по одной аллелоформе.
Таким образом, модель задачи можно представить множеством хромосом (наборов генов)
Нг = {к[,Иг2,...,кгп,}, совокупность г = 1,Я которых определяет собою общее число возможных генотипов (рис. 1).
а в
к ы. . hi hi+1 | . • И hp+1|. \К
Васильев Евгений Михайлович - ВГТУ, канд. техн. наук, тел. (473) 243-77-76, e-mail: [email protected] Крутских Иван Владимирович - ВГТУ, студент, тел. (473) 243-77-20, e-mail: [email protected]
Нг
Рис.1. Генетическая модель задачи о назначениях
Различные особи не отличаются друг от друга составом своих хромосом, и для воспроизводства потомков Е в данной задаче возможен единственный механизм реализации эволюции - мутагенез.
Глубина внутрихромосомной перестройки в ходе эволюции определялась количеством локусов, участвующих в мутациях:
генная мутация предусматривала случайный выбор нескольких пар локусов и обмен размещающихся в них аллелоформ;
хромосомные мутации осуществлялись выбором точки а рекомбинации и длины 1=р-а отрезка хромосомы, подлежащего инвертированию.
Таким образом, задача построения эффективного генетического алгоритма на основе мутагенеза сводится к выбору процедур внутрихромосомных перестановок.
Наиболее общим подходом к выбору этих процедур является сочетание взаимодополняющих мутаций отдельных генов (генной мутации) и мутаций участков хромосом (хромосомной мутации), обеспечивающее как небольшие, так и крупные изменения генома. Соответствующая минимальная структура алгоритма представлена на рис. 2.
К=100, пгтах=б, пхтах=12 для задачи (1) с п=12 (1аі12а) представлен на рис. 3 (график 1).
Содержание указанных процедур:
1. Формирование V элементов исходной (родительской) популяции Р0, каждой особи которой соответствует одна хромосома со случайным равновероятным порядком размещения генов.
2. Независимая генная мутация случайного количества пг (1<пг<пгтах) пар генов в хромосоме каждой исходной особи путём перестановки генов в каждой из пг пар. В результате применения генной мутации к V особям множества Р0 формируется множество МГ0 мутантов мощностью |МГ0|=V.
3. Независимая хромосомная мутация каждой исходной особи путём инверсии отрезка хромосомы длиной 2...пхтах (2<пхтах<п-2) с его случайным расположением относительно границ хромосомы. В результате применения хромосомной мутации к каждой особи из множества Р0 формируется множество МХ0 мутантов мощностью |МУ0|=К
4. Формируется множество 01сР0иМГ0иМУ0 из V лучших особей, 10^^.
5. Множество 01 принимается в качестве исходного Р0, и алгоритм повторяется с п. 2 до тех пор, пока не выполнится условие окончания поиска.
Пример поиска, реализованного описанным алгоритмом с произвольно взятыми параметрами
г 2.6 10:
2.4 10
2.2.10
п_
/1 2
3
1 N 2 104 4 104 б 104 8 104
Рис. 3. Сравнение хода поиска алгоритмами: 1 - генетический с неоптимальными настройками; 2 - равновероятный поиск; 3 - генетический с оптимальными настройками
Сравнение хода поиска (рис. 3 (график 1)) с движением к экстремуму г =224416 при равновероятном случайном формировании особей (рис. 3 (график 2)) подтверждает эффективность генетического алгоритма даже с указанными произвольными настройками. Однако, учитывая, что в результате 15-кратного повторения поиска с количеством вычислений функции цели N=20-104 экстремум г достигался всего 2...4 раза, была поставлена задача улучшить сходимость алгоритма путём оптимизации его параметров:
максимальное количество пар генов пгтах, участвующих в генной мутации;
максимальное количество генов пхтах, участвующих в хромосомной мутации; объём V популяции.
3. Исследование механизма генной мутации
Генные мутации осуществляются равновероятным случайным выбором номеров генов, обменивающихся местами в хромосоме (рис. 4).
Процедура генной мутации оставляет возможность выбора оптимального параметра её проведения: количества пар пг генов, участвующих в мутагенезе на каждом шаге. Наличие такой возможности объясняется для генной мутации, тем, что с ростом пг возрастает число обменов и генные мутации по своему эффекту начинают приближаться к хромосомной, т.е. утрачивают своё предназначение.
Р Ґ
И?
И63
И? 28
Рис. 4. Иллюстрация генной мутации
На рис. 5 показаны значения функции цели 2, полученные при поиске экстремума для целочисленных комбинаций пг и пхтах с разным количеством
N вычислений критерия 2. Размерность задачи п=15 (1аЛ5а); для каждой комбинации пг и пхтах поиск повторялся 15 раз с последующим вычислением математического ожидания критерия.
а)
б)
в)
Рис. 5. Определение оптимальных параметров генной мутации
Анализ рис. 5 показывает, что по всей глубине поиска достаточна генная мутация одной пары генов.
4. Исследование хромосомной мутации
Иллюстрация механизма инвертирования при хромосомных мутациях представлена на рис. 6.
Р /
ИР
И54
ИР
И15
ИР
27
И?
И24
И? И1б
И?
И57
Рис. 6. Иллюстрация хромосомной мутации
Возможность выбора некоторого оптимального числа пхтах генов, участвующих в хромосомных мутациях, определяется тем обстоятельством, что очень малое или очень большое число пхтах в первом случае неэффективно, а во втором - слишком сильно расшатывает наследственные признаки. Так, из
рис. 5а-в следует, что длину пхтах хромосомной мутации целесообразно увеличивать по мере приближения к экстремуму, например, для задачи 1а115а с пхтах =2 до пхтах =8. Для каждого значения пхтах проведено 15 экспериментов, выявлено влияние пхтах на сходимость (рис. 7) и найден оптимальный диапазон
пхтах 5...6.
Рис. 7. Исследование влияния параметров хромосомной мутации
5. Анализ влияния объёма популяции
Для оптимальных значений параметров пгтах=1 и пхтах=5 для 1аЛ5а проведён анализ влияния на сходимость объёма V популяции (рис. 8).
^5
2.5-10
г
2.4-10: 2.3-10: 2.2-10:
N=10 т ыс.
N=25 тыс. г*
N=50 тыс.
0 200 400 600 V 800
Рис. 8. Анализ влияния объёма V популяции
Из рис. 8 следует, что оптимальное значение V связано с ограничением на количество вычислений N при недостаточно большом N алгоритм не в состоянии реализовать необходимое для достижения экстремума число эволюций. Для указанных настроек следует принять V=400, при этом количество вычислений должно быть не менее 100 в расчёте на одну особь, т.е. при популяции V особей, получим необходимое количество вычислений N>100^
При найденных оптимальных настройках глобальный экстремум в задачах с п<15 достигался в 80...100% поисков, однако с повышением размерности до п=20 этот показатель не превышал 5% ни при каких значениях указанных параметров, и возникла необходимость обсуждения проблемы достижения глобального экстремума.
6. Проблема достижения глобального экстремума
Малые изменения генома в результате генных мутаций не обязательно соответствуют малым
изменениям фенотипа (критерия задачи), так же, как и инверсия большого участка хромосомы не всегда приводит к существенным изменениям критерия.
Для количественной оценки изменения генома удобно использовать кодовое расстояние между исходной хромосомой p и её мутантом/
11, если Мр Ф МГ;
п п
ё = ЬЬ™іі>
1=1]=1
=■
і]
0, иначе,
где И], И? -гены і в локусе ] хромосомы р и/
Максимальное количество вариантов Рвг\г, Рвг\х перестановок, возможных в результате одной генной и одной хромосомной мутации, одинаково:
п(п -1)
Рег1г = Рег х =
1х
2
За один цикл последовательных процедур генной и хромосомной мутаций возможен выбор одного из Рет\ вариантов; Рег\=Рег\г-Рег\х:
/- \ 2 п(п -1)
РеГ1 =
2
которые составляют малую часть общего многообразия Я=п\ Например, для п=10 эта часть равна Ре^/Я=0,00056. При таком соотношении Ретх и Я достижение экстремума возможно только за счёт направленности поиска, реализуемого отбором и сохранением лучших особей с их последующим использованием в качестве исходного генетического материала для мутагенеза. Вместе с тем, направленный поиск сам по себе не обеспечивает достижение глобального экстремума. Если рассматривать проблему сходимости к глобальному экстремуму на уровне процедур алгоритма, то можно выделить два обстоятельства, препятствующие её разрешению.
1. Полное вытеснение локально лучшими вариантами решений худших на текущем этапе поиска, но перспективных вариантов. Для смягчения этого обстоятельства можно увеличить объём популяции V, а также исключить из её состава особи с одинаковыми значениями 2.
2. Варианты решений с малым расстоянием ё от оптимального могут характеризоваться значительным удалением критерия 2 от 2 . На рис. 9 представлены значения 2 в задаче 1а120а для 190 вариантов, отстоящих от оптимального на расстояние ё=2.
-.5
8-10
г
7.75 -10
7.5 -10
7.25 -10
7-10
Ко довое с расст 1=2 ояние
7 Ж82
40 80 120 160
Номер варианта
200
Рис. 9. Анализ отклонения критерия 2 от оптимального значения 2 =703482 в вариантах решений с ё=2
Значительная удалённость Ъ от экстремального значения Ъ* , достигающая 10% от Ъ*, не только способствует вытеснению этих вариантов из популяции V, но делает бессмысленным понятие направленного движения к оптимуму в обширной по своим размерам окрестности глобального экстремума (движение при ё=2 соответствует одному шагу генной мутации, в которой выбор пары переставляемых генов осуществляется равновероятным образом).
Указанные обстоятельства процедурного уровня носят принципиально неустранимый характер, и для их преодоления необходимо перейти на другой - информационный уровень рассмотрения процесса мутагенеза.
Воспользуемся данным Г. Кастлером [5] определением эволюционного процесса как процесса создания информации путём запоминания случайного выбора. Из такого понимания процесса эволюции вытекает необходимость пространственного разделения особей для фиксации их генотипов, т. е. обеспечения условий их независимого развития.
Такой подход к процессу эволюции как к процессу упорядочения - создания информации получил своё развитие в работе М. Эйгена [6], в которой выдвигается тезис о том, что любая последовательность эволюционизирующих особей обладает способностью инструктировать своё дальнейшее построение. Этот механизм получил название матричной репликации, позволяющей объяснить самоорганизацию материи на таком высоком уровне энтропии, как уровень возникновения жизни.
Применим его к рассматриваемой задаче.
7. Исследование матричной репликации
В рамках решаемой задачи механизм матричной репликации был реализован следующим образом.
1. Выбирается размер г матрицы репликации, т. е. количество генов, положение которых в хромосоме заведомо совпадает с оптимальным. Это значение определяет собою начальную селективную избирательность особей и размеры популяции V.
2. Выбираются, (в общем случае, произвольно), номера генов, включаемых в матрицу репликации. Если в рЛР есть некоторые объекты, выделяющиеся по своей значимости из их общего перечня, т.е. обладающие высокими структурообразующими свойствами, то эти объекты целесообразно включить в матрицу репликации.
3. Регулярным образом формируются особи, содержащие выбранную матрицу. Например, для задачи с п=20 и размером матрицы г=1 потребуется 20 особей, в одной из которых выбранный ген обязательно займёт оптимальный локус. Такие особи составят исходную популяцию V, объём которой определится выражением:
п!
V = .
(п - г)!
Очевидно, что с ростом г повышается селективная избирательность матрицированных особей,
0
приближая их к так называемой точке невозврата, но растёт объём V и, как следствие, возрастает трудоёмкость алгоритма. Например, для п=20 и г=5 получим V=1860480 особей, каждая из которых должна будет пройти одинаковое число шагов эволюции.
Остальные п-г локусов хромосомы заполняются равновероятным случайным образом генами, не вошедшими в матрицу.
4. Для каждой особи популяции V осуществляются независимые последовательности процедур генной мутации, реализующие их раздельную эволюцию.
При детерминированном подходе к процессу мутагенеза гены матрицы репликации не подвергаются мутациям.
Однако на практике, в условиях ограниченных вычислительных и временных ресурсов оказалось, что частота завершения эволюций глобальным экстремумом в несколько раз выше, если допустить участие матричных генов в общем процессе мутагенеза.
Этот результат очевидно вытекает из того обстоятельства, что из всей начальной популяции V только одна полная матрица длиной г занимает оптимальное расположение в хромосоме, и её сохранение возможно только при условии сохранения матриц в других особях - с неоптимальным расположением. Это приводит к тому, что для всех начальных особей, кроме одной - заведомо оптимальной, заранее предопределено неудачное завершение эволюционного процесса. В результате, эффективность алгоритма в статистическом смысле существенно снижается.
Поскольку процесс репликации по своей природе является случайным, то при отборе одного из вариантов решения, соответствующего родителю или мутанту, допускалась малая уступка Е2 - замена родителя со значением 2р мутантом с худшим значением 2у< 2р, при условии, что 2р-2-/<Е1.
В таблице представлены результаты сравнительного исследования обычного мутагенеза и различных модификаций алгоритма с матричной репликацией.
В каждом исследовании была реализована эволюция равных по объёму популяций, содержащих 332560 особей с п=20. В алгоритмах с матричной репликацией выбран размер матрицы г=4.
Исследование алгоритма с матричной репликацией
Модификация алгоритма Количество оптимальных особей
Общий мутагенез без репликации 2
Матричная репликация Общий мутагенез Ez=0 11
Ez=0,001Z 7
Ez=0,01Z 1
Генная мутация = о 8
Ez=0,001Z 22
Ez=0,01Z 6
Из таблицы следует, что применение механизма матричной репликации даже без введения уступки Ez обеспечивает рост числа сформированных глобально оптимальных особей с 2 до 11. Введение малой уступки Ez=0,001Z увеличивает это преимущество вдвое.
Литература
1. Pardalos P. The quadratic assignment problem: A survey
and recent developments / P. Pardalos, F. Rendl, H. Wolkowicz // DIMACS. - 1994. - Vol. 16. - P. 1 - 42.
2. Brixius N.W. The Steinberg Wiring Problem / N.W. Brix-
ius, K.M. Anstreicher // Fest-Schrift in Honor of Manfred Padberg’s 60th Birthday, SIAM. - 2003. - P. 331 - 348.
3. Романовский И.В. Дискретный анализ / И.В. Романов-
ский. - С.-Пб.: Невский диалект, 2000. - 240 с.
4. Батищев Д.И. Генетические алгоритмы решения экстремальных задач / Д.И. Батищев. - Воронеж: ВГТУ, 1995 .- 69 с.
5. Кастлер Г. Возникновение биологической организации /
Г. Кастлер . - М.: Мир, 1967. - 90 с.
6. Эйген М. Самоорганизация материи и эволюция биоло-
гических макромолекул / М. Эйген. - М.: Мир, 1973. -224 с.
Воронежский государственный технический университет
GENETIC ALGORITHM FOR THE QUADRATIC ASSIGNMENT PROBLEM E.M. Vasilyev, I.V. Krutskih
Stages of the decision of the quadratic assignment problem by genetic algorithm for a basis mutagenesis are considered. Procedures of gene and chromosomal mutations of this algorithm are in detail opened and influence of their adjusted parameters on convergence of search is investigated. As a result of the analysis of decisions of test tasks tai12a - tai20a the problem of accessibility of a global extremum is discussed and construction of algorithm is offered based on matrix replication. Check of efficiency of the offered approach to imitation of evolutionary process is submitted
Key words: quadratic assignment problem, genetic algorithm, mutagenesis, matrix replication