Слепцов Н.В., Зияутдинов В.С., Юркова Т.М. ЭВОЛЮЦИОННО - ГЕНЕТИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ: СПОСОБЫ ФОРМАЛЬНОГО ПРЕДСТАВЛЕНИЯ
Методы эволюционных вычислений и эволюционной информатики становятся в последние годы востребованным инструментом в приложениях, где требуется проведение существенных объемов вычислений при недостаточно строгой формулировке конечной цели и\или границ процесса вычислений, либо при невозможности получения в полном объеме данных требуемой точности.
Наиболее существенные моменты процесса организации эволюционных вычислений представлены на рис.1:
Рис. 1 Организация эволюционных вычислений
Под общим названием эволюционные вычисления (ЭВ), эволюционно - генетические вычисления (ЭГВ), эволюционные алгоритмы (ЭА) объединяют ряд алгоритмов и методов, использующие для поиска решения эволюционные принципы, основными из которых являются генетические алгоритмы (ГА), эволюционное программирование (ЭП), эволюционные стратегии (ЭС), генетическое программирование ( ГП).
Рассмотрим основные черты эволюционных вычислений применительно к их реализации в форме ГА [2,16 ] .
ГА - поисковые алгоритмы, основанные на механизмах натуральной селекции и натуральной генетики. Они реализуют принцип «выживания наиболее приспособленных» среди анализируемых структур, формируя и изменяя поисковый алгоритм на основе моделирования эволюции поиска. В очередной генерации особей новое множество искусственных последовательностей создается путем использования части старых и добавления новых частей со свойствами, являющихся по каким - то параметрам предпочтительными. Базисным отличием ГА от алгоритмов случайного поиска является эффективное использование информации, накопленной в процессе эволюции.
Первоначальная популяция ГА формируется, как правило, случайным образом, но при этом она должна содержать ряд приемлемых решений. Чтобы оценить качество закодированных решений или пригодность, используют функцию приспособленности или пригодности. По результатам оценки особей наиболее приспособленные из них отбираются (селекция) для скрещивания, в результате которого посредством применения генетического оператора кроссовера создаются потомки, генетическая информация которых формируется в результате обмена хромосомной информацией между родительскими особями. Эти потомки формируют новую популяцию, причем часть потомков мутирует (генетический оператор мутации) , что выражается в случайном изменении их генотипов. Этап, включающий последовательность операций оценки популяции, селекции, скрещивания, мутации носит название поколения. Эволюция популяции состоит из последовательности поколений. Окончание эволюции возможно в следующих ситуациях:
нахождение решения в результате эволюционного поиска;
достижений граничных условий - ограничение на число поколений, количество вычислений целевой функции, общее время работы ГА;
вырождение популяции, при которой степень разнородности хромосом в популяции становится меньше установленного значения.
В хромосоме кодируются параметры решения. Определение приспособленности 1-й особи в популяции производится в соответствии с оценкой решения, определяемого набором параметров, закодированных в хромосоме 1-й особи, и зависит от рассматриваемой задачи. Основополагающим для использовании ГА является предположение, что в результате повторяющегося отбора наиболее приспособленных особей, их скрещивания и мутации будет производиться отсев неудовлетворительных решений и постепенное повышение качества (приспособленности) существующих решений, иными словами, направление эволюционирования всей системы приводит к некоторому оптимуму.
Отличие в реализации других видов ЭВ от приведенной схемы ГА состоит в деталях реализации, например, способах кодирования параметров задачи (вещественное, целочисленное), наборе и роли генетических операторов, особенностях их реализации, количестве подпопуляций, критериях и принципах эволюции (эволюции Дарвина, Ламарка, сальтационизм, номогенез, синтетическая эволюция
Н.Дубинина и др.[5,7 ]).
Формально генетический алгоритм можно представить в следующем виде
ГА = (Р°,Л,l,s,p, f,t) , где P0 = (a?,..,a°)
исходная популяция, - решение задачи, представленное в виде хромосомы;
X размер популяции, целое число; l — длина каждой хромосомы популяции, целое число; s — оператор отбора; p - отображение, определяющее рекомбинацию ( кроссовер, мутация, инверсия, сегрегация...); f - функция пригодности ( оценки); t - критерий остановки.
Оператор отбора s порождает промежуточную популяцию P1 из популяции посредством отбора и
генерации новых копий элементов P1 : P1 = s(P‘) . Функция пригодности f используется для отбора
конкурентоспособных особей популяции и обеспечивает обратную связь от результатов, полученных в течение поколения t. При отборе часто используется ранг элементов популяции rank, который задается следующим образом:
Vi е{!,...,Я}: гапк(а\) = i, следовательно, индекс i можно использовать для обозначения ранга эле-
мента. В соответствии с этим предполагается, что элементы сортируются согласно их оптимальности, таким образом для P1 лучшим элементом будет .
Отбор (селекция) проводится на основании значения вероятности P (а*) , вычисленной для каждой особи популяции, при этом применяются в основном следующие схемы отбора [2,8,11 ]:
пропорциональная селекция;
линейное ранжирование;
пропорциональное ранжирование.
Для пропорциональной селекции:
А а) = 4^ Z f aj)
J=1
Для линейного ранжирования:
P(at) = ~ (nmax ~Vmn) J^) , где
Vmrn = 2-Vmx , 0 < 2 .
Для равномерного ранжирования (ц,А):
, fl / и, 1 < i < и
P° (at) = fn U , ■ и
[0 , и <1 <4
Приведенные варианты отбора имеют некоторые недостатки, главным из которых является негаранти-рованность асимптотической сходимости, для преодоления недостатков часто используется т.н. элитный отбор, или стратегия элитизма, который всегда сохраняет наилучшие особи популяции. Такой вид отбора гарантирует асимптотическую сходимость, но скорость сходимости может существенно различаться в зависимости от вида конкретной задачи.
По завершении отбора выполняются генетические операции, практически всегда в их число входят кроссовер и мутация. Обе эти операции носят случайный характер ( вероятность применения, выбор
локуса внутри хромосомы) . При этом, если это необходимо, например, для кроссовера, особью е P1
выбирается партнер из P1 для рекомбинации и строится новая хромосома.
Различия в реализации оператора кроссовера оставляет неизменным главное свойство - все типы кроссовера контролируют баланс между дальнейшим использованием уже найденных пригодных (хороших) областей пространства поиска и исследованием новых подобластей.
Совместное использование отбора и кроссовера приводит к тому, что области пространства, обладающие лучшей средней оптимальностью, содержат больше элементов популяции, чем другие и т.о., эволюция популяции направляется к областям, содержащим оптимум с большей вероятностью, чем другие.
Мутации вносят новизну и предотвращают потерю аллелей в определенных позициях, которые не могут быть восстановлены кроссовером, тем самым ограничивая преждевременное сжатие пространства поиска.
Отметим два обстоятельства. ГА изначально вызваны к жизни попыткой моделировать естественные процессы эволюции для поиска решений, однако реальные процессы эволюции несравненно более сложные и включают большое количество механизмов, использование которых в полном объеме в ГА вряд ли возможно, хотя некоторые направления развития ГА следуют в этом направлении, например, мобильный ГА. Второе, реализация общих принципов ГА может быть существенно различной, в том числе из - за особенностей прикладных задач, поэтому под ГА понимается не столько алгоритм в традиционном понимании, а некоторая методология решения прикладных проблем. В связи с этим представляется существенным четкое формальное описание эволюционно - генетических преобразований, учитывающих особенности требований максимально широкого круга задач.
Прежде всего отметим, что многие модели, рассматриваемые в популяционной генетике [ 1,2,7 ]
схожи с моделями, реализуемыми в ЭГВ. При этом результаты, получаемые с использованием ЭГВ, особенно в ряде направлений, таких как «Адаптивное поведение» [7,19], часто повторяют природные феномены ( прерывистое равновесие [10,13], эффект Болдуина [ 15,18] и др.). Эти обстоятельства позволяют сделать предположение о существовании определенной связи между природными процессами и компьютерными моделями.
Среди известных биологических моделей в теории ЭГВ нашли применение: модель Райта-Фишера
[1,7], модель квазивидов [7], теорема Прайса [16,17] и др. При этом в силу схожести терминологии и моделей, рассматриваемых в популяционной генетике и ЭА, часто возможен непосредственный «перенос результатов» между этими областями, что можно отметить в теоретических и экспериментальных работах по эволюционной динамике [3,4].
Проблему описания процесса ЭГВ можно интерпретировать как проблему описания макроскопических системы путем построения и анализа распределений микроскопических параметров элементов, входящих в эти системы, без рассмотрения каждого элемента в отдельности.
Поскольку в большинстве реализаций ЭГВ изменения зависят только от состава имеющейся популяции и не зависят от того, каким образом данная популяция получена, для моделирования ЭГВ принципиально очень удобен формализм марковских цепей [6,9]. Обозначив популяцию в момент времени t через Б
(Ь), эволюцию популяции можно представить в виде:
+1) = Г# Б(Г)
где Г - матрица переходных вероятностей, определяющая вероятность изменения хромосом (строк) в результате одной итерации эволюционного процесса. Поскольку моделируемый эволюционный процесс состоит, в общем случае, из циклической последовательности генетических операторов, то для тройки «селекция-воспроизводство-мутация» матрица Г вычисляется как произведение «промежуточных» матриц переходных вероятностей:
Г = Р•К • м
где матрица Г задает вероятности селекционного отбора хромосом, а И и М - матрицы вероятностей изменения хромосом в результате скрещивания и мутации соответственно. Таким образом, определив матрицы Г , И и М с учетом используемых эволюционных операторов, принципиально можно точно промоделировать эволюционный процесс:
+ 1) = Р • К • м • 5 (г)
Очевидным ограничением здесь является размер получаемых матриц, например, для модели ГА для хромосомы длиной 8 бит и популяции из 8 особей матрица переходов имеет более 1029 элементов [11]. Ввиду вычислительной сложности прямой реализации точных моделей ЭГВ на основе цепей Маркова можно предложить альтернативные подходов.
Одним из таких подходов является подход к моделированию ЭГВ на основе статистической теории принятия решений, рассматривающий своеобразное «упрощение» целевой функции [12]. Согласно этому подходу, при рассмотрении целевой функции она считается декомпозируемой и т.о. ее параметры независимы, при этом среди них можно выделить параметр хо, наиболее значимо влияющий на приспособленность особей. Вклад в приспособленность особи остальных параметров рассматривается как аддитивный шум, проявляющийся при вычислении значения приспособленности и влияющий на вероятность селективного отбора особей.
Другим подходом является подход, основанный на анализе представления данных задачи, решаемой средствами ЭГВ, что обеспечивает выбор компактного представления для конкретной задачи, конструктивность эволюционного поиска, возможность целенаправленного управления генетическими операторами. На этом пути возможно не просто решение задачи эволюционного отбора наиболее оптимального решения, но и задачи эволюционного развития особи, кодирующей максимальную приспособленность к окружающим требованиям с набором свойств, количественно отличающимся от первоначально определенных в исходной популяции.
В завершение отметим следующее:
Основным достоинством формально - математического описания ЭВ является возможность прогнозирования влияния значений параметров ЭВ на результат эволюционного поиска. Данное свойство позволяет осуществлять более тонкую настройку параметров ЭВ, однако, в настоящее время в данной области еще много нерешенных проблем, во многом обусловленных разнообразием решаемых задач, используемых схем эволюции и операторов.
Модели способствуют более глубокому пониманию динамики ЭВ и позволяют выделить некоторые специфичные свойства эволюционных процессов в целом. Примерами являются: прерывистое равновесие
[6,7], описывающее эволюцию как смену периодов активного поиска и периодов «застоя», соответствующих «нейтральной» стадии эволюции; влияние конечного размера популяции на вид распределения приспособленности в процессе эволюции .
Кроме того, аналитические модели ЭВ позволяют получить оценки времени сходимости при решении ряда модельных задач, что представляет интерес при решении практических задач. В [11 , 18] неод-
нократно отмечается полиномиальная сложность ЭВ, не превышающая порядка О(п3).
Представленные подход к ЭГВ в целом обеспечивает возможности дальнейших исследований по следующим направлениям:
способы представления/кодирования данных задач, решаемых средствами эволюционно- генетического поиска, обеспечивающих единый подход к представлению единичных и связанных областей данных;
управление генетическими операциями на уровнях воздействия на признаки решения и на уровне системы эволюционных вычислений;
исследование характеристик процесса оценки/выбора оптимального решения, его практической реализации, обеспечение необходимых характеристик эволюционного давления ( обоснованные критерии эволюции применительно к классам решаемых задач, их применение);
обеспечение конструктивности эволюционно - генетического поиска;
решение вопросов оптимального соотношения генотип/фенотип с точки зрения вычислительной эффективности, критерии выбора генотип/фенотип с точки зрения оптимальности эволюционного поиска над множеством популяций, оптимальности поиска над множеством конечных решений и оптимальности преобразований генотип-фенотип с точки зрения компактности представления и прозрачности кодирования.
Литература
1. Букатова И.Л. Эвоинформатика: теория и практика эволюционного моделирования/ Букатова И.Л., Михасев Ю.И., Шаров А.М. - М, Наука, 1991
2. Вороновский Г.К., Махотило К.В., Петрашев С.Н., Сергеев С.А. Генетические алгоритмы, искусственные нейронные сети и проблемы виртуальной реальности. Харьков: Основа, 1997.
3. Донской Д.А., Слепцов Н.В. Нейросетевые средства реализации обрабатывающей части тренажерных комплексов., ПГУ, Пенза
4. Донской Д.А., Слепцов Н.В. Проблема выбора способа представления в генетических алгоритмах ПГУ, г. Пенза - 2006
5. Емельянов В.В., Курейчик В.В., Курейчик В.М. Теория и практика эволюционного моделирования. М.: ФМЛ, 2003.
6. Мосалов О.П., Редько В.Г. Модель эволюционной ассимиляции приобретенных навыков в нейросе-тевых системах управления адаптивных агентов // Научная сессия МИФИ-2005. VII Всероссийская научно-практическая конференция "Нейроинформатика-2005": Сборник научных трудов. В 2-х частях. Часть
1. М.: МИФИ, 2005. С.210-217. См. также: http://www.iont.ru/projects/rfbr/90197/
7. Редько В.Г. Эволюционная кибернетика. М.: Наука, 2001.
8. Слепцов Н.В. Математические модели генетических алгоритмов ПГУ, Пенза-2007
9. Тарасов В.Б. От многоагентных систем к интеллектуальным организациям: философия, психоло-
гия, информатика. М.: Эдиториал УРСС, 2002. 352 с.
10. Фогель Л., Оуэнс А., Уолш М. Искусственный интеллект и эволюционное моделирование. М.:
Мир, 19 6 9.
11. Chambers Practical handbook of genetic algorithms v 3 Complex coding systems 2 ed, 2001
12. De Jong K. An analysis of the behavior of a class of genetic adaptive systems. Unpublished PhD thesis. University of Michigan, Ann Arbor, 1975. (University Microfilms No. 76-
9381). See also: http://www.cs.gmu.edu/~eclab/
13. Eiben A.E., Rudolph G. Theory of Evolutionary Algorithms: A Bird's Eye View // Theoreti-calComputer Science, 1999, vol. 229, no. 1, pp. 3-9. See also: http://wi.leidenuniv.nl/~gusz/
14. Goldberg D.E. Genetic Algorithms in Search, Optimization and Machine Learning. Addison-Wesley, 1989.
15. Holland J.H. Adaptation in Natural and Artificial Systems. The University of Michigan Press, 1975.
16. Holland J.H. Building Blocks, Cohort Genetic Algorithms, and Hyperplane-Defined Functions // Evolutionary Computation, 2000, no. 4(8), pp. 373-391.
17. Kitano H. Designing neural network using genetic algorithm with graph generation system // Complex Systems, 1990, no. 4, pp. 461-476.
18. Koza J. Genetic programming: a paradigm for genetically breeding computer population of
^mputer programs to solve problems. Cambridge, MA: MIT Press, 1992.
19. Meyer J.-A., Guillot A. Simulation of Adaptive Behavior in Animats: Review and Prospects / In Meyer J.-A., Wilson S. W. (Eds.) Proceedings of the First International Conference on Simulation of Adaptive Behavior: from animals to animats. Cambridge, MA: MIT Press, 2001. pp. 2-14.