12. Панченко Т.В. Генетические алгоритмы . - Астрахань: Изд. дом «Астраханский университет», 2007. - 88 с.
13. Курейчик В.В., Курейчик В.М., Родзин С.И. Концепция эволюционных вычислений, инспирированных природными системами // Известия ЮФУ. Технические науки. - 2009. - № 4 (93). - С. 16-27.
Статью рекомендовал к опубликованию д.т.н., профессор М. Д. Молев.
Бегляров Вадим Валерьевич - ФГБОУ ВПО Южно-Российский государственный университет экономики и сервиса; e-mail: torbww@yandex.ru; 346500, г. Шахты, ул. Шевченко, 147; тел.: 89081760312; кафедра информационных системм и радиотехники; аспирант.
Берёза Андрей Николаевич - e-mail: anbirch@mail.ru; тел.: 89281574449; кафедра информационных систем и радиотехники; к.т.н.; доцент.
Beglyarov Vadim Valeryevich - South-Russian State University of Economics and Service; e-mail: torbww@yandex.ru; 147, Shevchenko street, Shakhty, 346500, Russia; phone: +79081760312; the department of information systems and radio engineering; postgraduate student.
Bereza Andrey Nikolaevich - e-mail: anbirch@mail.ru; phone: +79281574449; the department of information systems and radio engineering; cand.of eng. sc.; associate professor.
УДК 681.31.001.8
В.В. Гудилов
ДИНАМИЧЕСКОЕ ЭВОЛЮЦИОННОЕ МОДЕЛИРОВАНИЕ*
Современная теория эволюционного моделирования, разработанная Дж. Холландом в 1975 году, не рассматривает одно из важнейших направлении биологической эволюции -методы образования новых видов. Структура алгоритмов и генетических операторов в эволюционном моделировании носит исключительно статический характер. Получение в процессе эволюции новых видов происходит посредством изменения структуры генома, следовательно, представление генома при кодировании на уровне хромосомы должно быть динамическим, что коренным образом влияет на структуру генетических операторов, методики оценки и моделирования эволюционных процессов, переводя их в область динамического эволюционного моделирования.
Моделирование открытой эволюции; динамическое эволюционное моделирование; динамическое кодирование хромосомы; динамический критерий оценки решений.
V.V. Gudilov DYNAMIC SIMULATION OF EVOLUTION
Developed by John Holland in 1975 the modern theory of evolution modeling doesn't consider one of the major areas of biological evolution, notably the methods of formation new species. Algorithm structure and genetic operators is solely static nature in evolutionary modeling. Getting in the evolution of new species occurs through the changing in the genom's structure, therefore, the view of the genome encoding at the level of the chromosome must be dynamic, which fundamentally has an influence on the structure of the genetic operators, on estimation procedures and modeling of evolutionary processes, transfer them to dynamic evolutionary modeling.
Simulation of the evolution of an open; dynamic evolutionary modeling; dynamic coding chromosome; a dynamic criterion decisions.
Введение. Алгоритмы эволюционного поиска [1] разработаны для закрытых систем, в рамках которых «рассматриваемая система либо изолирована от внешних возмущающих воздействий, либо этими воздействиями можно пренебречь или
* Работа выполнена при частичной поддержке РФФИ (проект № 10-07-00055).
свести их к аддитивному шуму» [2]. Эволюционные алгоритмы априори рассматривают статические системы и не могут исследовать открытые системы без внесения ограничений в пространство поиска, т.е. до тех пор, пока исследуемое пространство не будет сведено к некоторой модели. На этапе разработки эволюционного алгоритма, на основе выбора множества ограничений и параметров, строится модель внешней среды, в которую помещается исследуемая модель объекта, и уже затем выполняется эволюция модели объекта с помощью выбранных генетических преобразований. Таким образом, существующие эволюционные алгоритмы исследуют модель внутри модели, что позволяет, ограничив область поиска, находить приемлемое решение за отведенное время.
В основе эволюционного алгоритма лежит набор методов, оперируемых множеством решений, называемых хромосомами, закодированных в соответствии с выбранным алгоритмом или методом кодирования. Ограничения, заданные при кодировании решений являются теми рамками, в области которых выполняется поиск возможных решений, т.к. хромосома может принимать только те состояния, которые были учтены при кодировании. Известно [2], что “наука развивается в направлении анализа и моделирования сложных систем”, но дальнейшее развитие эволюционных алгоритмов ограничено текущими методами построения модели и описаний внешней среды для моделируемого объекта. Расширение области применения эволюционных алгоритмов для моделирования эволюции открытых или сложных систем заключается в том, чтобы несколько иначе взглянуть на задачу разработки алгоритмов эволюционного поиска, пересмотрев методы кодирования решений, заложив в представление хромосомы возможность появления новых свойств или состояний индивида и обеспечив эволюционный процесс необходимой гибкостью и изменчивостью.
В теории эволюционного моделирования целью разработки эволюционных алгоритмов являются решение задачи поиска или оптимизации [3], но не учитывается такой важный аспект эволюции, как возможность образования новых видов или подвидов в процессе эволюционного развития популяции. В данной работе рассмотрены основные механизмы эволюционного процесса, обеспечивающие возможность видообразования в рамках биологической эволюции, и на их основе определены методы искусственного моделирования для решения задачи проектирования сложных технических систем.
Современные методы эволюционного моделирования, адаптированные к применению в задачах поиска или оптимизации, представлены стратегиями, в основе которых лежат идеи эволюции, сформулированные Ч. Дарвином и Г. Менделем, синтетической теорией эволюции, концепциями прерывистого равновесия, теорией нейтральности и т.д. Существующие эволюционные алгоритмы подразумевают неизменность длины хромосомы на всем этапе моделирования эволюционного процесса [4], что позволяет беспрепятственно оперировать генетическим материалом, не заботясь о нарушении целостности и допустимости генерируемых решений.
Для эволюционных алгоритмов пространство поиска может иметь не только разрывы и области, в которых оно не определено, но и может быть бесконечным или иметь нечеткие границы, характерные описанию открытых систем. Основное препятствие использования эволюционных алгоритмов для открытых систем лежит в их основе - методике строения хромосомы, которая жестко оговаривает границы пространства состояний параметров объекта и не позволяет выйти за их пределы в процессе эволюционного развития.
Постановка задачи. Пусть имеется некоторый объект Q (рис. 1), представленный конечным множеством состояний в п-мерном пространстве S = <1, 2, ..., п>, определяющем внешнюю среду обитания, каждое измерение которого задано
множеством параметров ki (где i = 0,1, ..., n). При кодировании объекта на основе внешней среды обитания S выделяют некоторую среду обитания A (модель), такую, что |A| < |S|, в рамках которой выполняется уточнение граничных значений m и l, где m < k, l < n. Далее выполняется переход от фенотипического представления объекта Q к его генотипу G, так, что |G| < |Q|, и генотип G объекта Q, представленного в пространстве A, определен набором закодированных параметров l из множества измерений m: G = <m, l>. При организации эволюционного процесса, формируется некоторая популяция P, состоящая из множества особей H, определяющая генотип вида V, обитающего в рамках среды обитания А. Если граничные параметры среды обитания A заданы в виде статической модели, то параметры m и l остаются неизменны в процессе эволюционного развития объекта Q и |G| = const. В случае открытой среды мощность множества параметров l и количество измерений m среды обитания А , в результате взаимодействия объекта с внешней средой
S, могут меняться в процессе выхода объекта Q за пределы среды обитания A. Уточнение параметров среды обитания создает предпосылки к формированию нового набора параметров, описывающих множества состояний в рамках новой среды обитания A'< |S|, что, в свою очередь, приводит к возможности появления у хромосом из вида V новых свойств с последующим формированием подвидов или новых видов. Видовое образование является следствием выхода объекта за рамки параметров m и l, определенных текущим генотипом G, при изменении среды обитания и внешних воздействий, в результате чего происходит получение новых свойств и структур на уровне генома.
Рис. 1. Упрощенное представление пространств состояний и допустимых параметров при моделировании произвольного объекта в рамках его среды обитания
Задача: определить механизмы эволюционного процесса, в результате которых происходит образование новых видов и подвидов, и рассмотреть методы искусственного моделирования этих механизмов для проектирования сложных технических систем.
Моделирование эволюции. Движущим фактором эволюции является отбор. Материалом, как для естественного, так и для искусственного отбора выступают небольшие наследственные изменения, которые накапливаются из поколения в поколение. Поэтому общая структура эволюционных алгоритмов для моделирования статической и открытой эволюции остается неизменной, меняются только методы и алгоритмы, обеспечивающие возможность динамических преобразований структуры генотипа, его оценки и отвечающие за передачу наследственной информации.
С позиции динамического эволюционного моделирования, в рамках которого возможно образование новых видов и подвидов, необходимо обратиться к представлениям генетического материала на уровне строения генома и методам его
передачи, общепринятым в биологической эволюции и в современной синтетической теории эволюции. Основное внимание необходимо уделить вопросам видообразования, кодирования и методам оценки решений в рамках динамически изменяющейся среды обитания индивида при решении задачи моделирования открытой эволюции. На основе анализа текущего состояния методов проектирования предлагается использовать рассмотренные в работе методы динамического эволюционного моделирования для решения задач проектирования сложных технических систем с динамической архитектурой.
Общая методология видообразования. Потенциальное развитие объекта, находящегося в рамках среды обитания А, ограничено пределами и информацией, накладываемой внешней средой 8, т.к. для того, чтобы выйти за среду обитания необходимо обладать информацией об изменении пространства и законов действующих за ее пределами. В некоторых случаях объекту необходимо предварительное изучение и подготовка (адаптация структуры генома) к новым условиям существования, с которыми он может столкнуться, выйдя за пределы среды обитания. На начальном этапе, в результате выхода за границы среды обитания А, ограниченной рамками внешней среды 8, происходит расширение границ среды обитания объекта без образования новых видов или подвидов, т.к. изменения, вносимые в геном объекта, являются незначительными. Возвращаясь в популяцию, данный индивид вносит в генотип приобретенные признаки, основная часть из которых остается рецессивными, и лишь некоторые могут проявиться в виде доминантных на уровне фенотипа у отдельных особей его потомков. Дальнейшее расширение среды обитания с позиции объекта связанно с необходимостью накопления информации о новых пространствах или параметрах и возможности эволюционировать (адаптироваться) в рамках этих параметров, подстраивая геном под измененные требования новой окружающей среды.
Если подобная адаптация возможна, то в результате могут произойти необратимые изменения в геноме с последующей возможностью образования новой структуры генома (например, в результате мутаций), т. е. подвидов и новых видов. Из работ Н.Н. Иорданского [5] известно, что “степень доминантности фенотипического проявления аллелей может эволюционировать, повышаясь под контролем отбора, если данный аллель становится благоприятным для его носителя при изменениях внешних условий. Если в генотипе популяции недостаточно генетического материала, в том числе, отраженного в рецессивных генах или аллелях и способного удовлетворить требования измененных условий выживания, то это приводит к массовой гибели индивидов.
Основной механизм образования рецессивных признаков в биологии - скрещивание и мутации. Отличие скрещивания и мутации в биологической эволюции от операторов мутации и кроссинговера, принятых в теории эволюционного моделирования заключается в том, что в природе мутация и скрещивание не ограничиваются рамками допустимых значений или ограничениями структур генома, что является причиной порождения гибридов и мутантов. Н. Н. Иорданский утверждает [5], что “новые мутации могут, конечно, сразу обладать доминантным проявлением в фенотипе диплоидных особей, но вероятность выживания мутантов вообще невелика, и поэтому преимущественно сохраняются именно рецессивные мутации. Впоследствии, если при каких-либо изменениях внешних условий новый признак окажется благоприятным, обусловливающий его мутантный аллель может вторично приобрести доминантное фенотипическое выражение”.
Таким образом, несложно видеть, что основные механизмы видообразования связаны с накоплением в популяции генетической информации, отраженной на уровне разнообразия генотипа и в виде рецессивных признаков, что способствует
адаптации индивидов при попадании в новые условия обитания и изменениях критерия отбора. Основными механизмами формирования разнообразия генотипа являются мутации и скрещивание, приводящие в биологических системах к образованию мутантов и гибридных особей.
Представление генома. Наличие в геноме живых организмов признаков, никак не отражающихся на уровне фенотипа, и являющихся рецессивными, говорит о том, что геном хранит значительно больше информации об индивиде, нежели ему необходимо для существования в рамках его среды обитания. Для моделирования динамических систем с применением методов эволюционного моделирования, необходимо понимать, каким образом происходит накопление, хранение и передача информации в геноме, какое влияние имеют рецессивные аллели и что является механизмом представления и формирования разнообразия видов. Так же необходимо понимать - каким образом выполняется кодирование признаков и как могут быть синтезированы принципиально новые свойства, изначально определяющие рецессивные аллели.
В рамках одного вида или подвида хромосомы могут иметь различную длину, т.е. они заданы различным количеством ген. Более того, количество ген в хромосоме не является постоянным и для самого индивида, и может изменяться из поколения в поколение. Интересным фактом является то, что из результатов работ по расшифровке генома человека [6] стало известно, что “геном человека характеризуется однонуклеотидными вариациями числа копий, такими как делеции и дупликации, которые составляют около 1 % всей нуклеотидной последовательности человека” [7], т.е. геном является избыточным и содержит частично повторяющиеся элементы, представленные в различных вариациях генетического материала. Помимо кодирующих последовательностей, ДНК клеток содержит последовательности, выполняющие регуляторные и структурные функции. У многих видов только малая часть общей последовательности генома кодирует белки. Так, только “около 1,5 % генома человека состоит из экзонов, кодирующих белок, а больше 50 % ДНК человека состоит из некодирующих повторяющихся последовательностей ДНК” [8]. Следовательно, кроме того, что информация о фенотипических признаках организма, хранящаяся в геноме является избыточной, геном еще хранит достаточно много “служебной” информации, часть из которой определяет структуру генома и регулирует процессы, протекающие при эволюционном развитии организма.
Структура хромосомы при динамическом кодировании. С биологической точки зрения, когда объекту нужны новые свойства, он имеет возможность развивать их в процессе эволюции, направленно модифицируя свое фенотипическое представление посредством изменений генома. С позиции моделирования открытой эволюции данную возможность необходимо закладывать в структуру хромосомы изначально, либо позволять ей приобретать новые свойства в процессе эволюции. Для реализации механизма видообразования необходимо определить, какие различия проявляются у разных видов на уровне генома и реализовать поддержку данных различий в структуре хромосомы. Сравнивая количество хромосом, которое содержится, например, в геноме различных видов лисиц [9, 10], видно, что лисица обыкновенная имеет наименьшее количество хромосом (равное 34), и, вероятно, является базовым видом, от которого произошли другие виды и подвиды, количество хромосом в ДНК которых различно, и достигает 74-76 шт. Другой особенностью является то, что различие видов и подвидов обусловлено средой обитания. Таким образом, можно предположить, что одно из межвидовых различий закреплено в количестве хромосом, определяющих различия между особями в рамках этих видов. Но среди представителей одного рода обычно существует множество различных видов, с одинаковым количеством хромосом [11], что указывает на значение не только количества хромосом, но и объема и структуры генетической информации, представленной
в генотипе. Следовательно, задачей разработки структуры хромосомы при динамическом кодировании является решение вопроса представления генотипа для динамических последовательностей с переменной структурой, и разработки методов управления данной динамической структурой.
Так как в биологии генетическая информация об индивиде хранится не в одной, а в некотором конечном наборе хромосом, то для обеспечения преемственности общепринятой в эволюционном моделировании терминологии, введем понятие сегмента - части хромосомы, отвечающей за отдельные элементы или подсистемы в рамках кодируемого объекта. Представляя в искусственных системах хромосому как линейный набор (вектор), представленный в виде динамического списка сегментов переменной длины (рис. 2), можно максимально близко приблизиться к биологическому представлению строения генома с позиции современной синтетической эволюции, и моделировать процессы динамических изменений структуры генома.
Пример структуры динамической хромосомы
Рис. 2. Пример структуры динамической хромосомы
Как видно из рисунка (см. рис. 2), хромосома состоит из множества секций, каждая из которых имеет поля служебной информации, определяющей: тип секции, длину (количество ген), признак открытости, рецессивный признак и т.д. Так как рецессивные гены не оказывают влияния на фенотип, но при этом присутствуют в генотипе, то реализация поддержки рецессивных признаков с точки зрения кодирования возможна посредством ввода в хромосому (секцию) дополнительной служебной информации: рецессивного признака. В процессе эволюционного развития происходит изменение параметров рецессивного признака, и, тем самым, активация тех или иных ген (секций) на уровне генома, отражающаяся в проявлении этих ген на фенотипическом уровне, т.е. при оценке критерия выживания.
Механизмы управления структурой динамической хромосомы. При динамическом кодировании в хромосоме будет храниться часть служебной информации о структуре хромосомы, сегментации и принадлежности некоторых ген к тем или иным признакам. Если структура хромосомы остается неизменной, то это позволяет упростить методы кодирования и определять структуру хромосомы на уровне эволюционного алгоритма, что возвращает нас к статическим методам эволюционного моделирования. Если же речь идет о том, что каждый индивид в популяции способен развиваться не только в рамках статической среды обитания, но и эволюционируя приобретать новые свойства, не характерные для генотипа данного вида, то информация, относящаяся к индивидуальным отличиям хромосомы должна храниться в самой хромосоме.
При моделировании открытой эволюции, в рамках одной популяции могут существовать особи с различным представлением генома: количеством хромосом и их длины. Для определения возможности динамического изменения этих параметров необходимо ввести дополнительный параметр эволюционного алгоритма, который будем называть «степенью открытости» или параметром открытости. Параметр открытости указывает - насколько данная хромосома (ее сегменты или от-
дельные гены) может быть подвержена изменениям, выходящим за изначально заданные ограничения параметров, т.е. открыта к возможным влияниям внешней среды. Так, например, с позиции решения задачи эволюционного синтеза сложных систем геном состоит из набора хромосом (сегментов), каждая из которых отвечает за кодирование определенного элемента сложной системы и обладает уникальными свойствами, степенью подверженности мутациям и параметром открытости, т. е. способностью приобретать новые состояния.
Кроме перечисленных признаков, в структуре хромосомы можно хранить информацию необходимую для реализации требуемых методов эволюционного моделирования и протекания эволюционного процесса. Так же возможно хранение уникальной для индивида информации (например, истории эволюционных изменений), по аналогии с хранением в ДНК биологических организмов фрагментов реликтовых вирусов [12] или участков от структурно разрушенных хромосом предков, так называемого, генетического мусора.
Критерий отбора в динамических системах. В условиях эволюции динамической системы параметры внешней среды (размерность пространств состояний и допустимых параметров), функции и алгоритмы оценки критериев отбора, а также структура генома объекта, могут подвергаться непрерывным изменениям. Для объекта основным способом получения информации об изменении среды обитания является критерий отбора, определяющий, выживет ли данный объект в данных условиях или нет. С накоплением информации и расширением среды обитания происходит постепенное уточнение и определение новых границ внешней среды, расширяющейся за счет ранее неизвестных областей окружающего мира. Процесс роста сложности (накопления информации) объекта сопровождается расширением границ сред, в рамках которых он может эволюционировать. Т.е. критерий отбора должен максимально полно учитывать особенности среды обитания и изменение внешней среды должно отражаться на изменении критерия отбора. Очевидно, что, если алгоритм вычисления критерия является статическим, т.е. не способен учитывать изменение условий обитания и изменение влияния рецессивных признаков на фенотип организма при их переходе в доминантное состояние, то накопление информации и изменение генотипа не окажет никакого влияния на искусственный отбор, и, следовательно, отбор нельзя считать направленным, т.к. эволюция будет носить случайный, мутационный характер.
Таким образом, речь идет уже не о некотором общем алгоритме оценки критерия выживания, а о необходимости разработки механизма, позволяющего этому алгоритму эволюционировать в различных представлениях, соответствуя идеологии эволюционного образования новых видов, их обитания и развития в различных условиях. С позиции вопроса эволюционного моделирования открытых систем, рассмотренные особенности влияния окружающей среды на критерий отбора, требуют дополнительного изучения. Эволюция открытой системы может протекать при взаимодействии и непрерывном изменении множества параметров, и, следовательно, изменении критериев оценки. В этом случае необходимо говорить не о последовательном (дискретном) изменении критерия, а о непрерывном процессе эволюции критерия. То есть изменения алгоритма вычисления критерия необходимо рассматривать с позиции непрерывного направленного процесса, управляющего направленным поиском (эволюцией) или оптимизацией структуры и параметров открытой системы.
Заключение. Рассмотренные в статье вопросы и механизмы эволюционных процессов, в результате которых происходит образование новых видов и подвидов
- это лишь небольшая часть инструментов, которыми оперирует биологическая эволюция, и которые, к сожалению, пока не используются при решении задач проектирования технических систем. Необходимо признать, что объем незатронутого
материала настолько большой, что в рамках текущей работы можно лишь обозначить некоторые вопросы, связанные с эволюционным моделированием при реализации процессов образования новых видов. Предложенные в работе методы динамического представления генетического материала и организации эволюционного процесса могут быть положены в основу новых методов динамического эволюционного моделирования, чего раньше никто не предлагал. Использование предложенных методов расширяет область применения эволюционного моделирования для нового класса задач, структура и представление которых может изменяться в процессе разработки и жизненного цикла.
При моделировании открытой эволюции динамической становится не только структура хромосомы (генома) и методы оценки решений, но и все генетические операторы, выполняющие эволюционное преобразование. Поэтому дальнейшие работы в этом правлении связаны с изучением существующих механизмов эволюции и разработки на их основе методов и алгоритмов динамических генетических операторов, методов передачи наследственно информации, образования переходных форм, методов формирования мутантов и гибридов и т.д. Применение новых, динамических методов эволюционного моделирования при решении технических задач, позволит разработчикам получить совершенно новые и непредсказуемые результаты в медицине, в нанотехнологии и других областях, где требуется формирование новых структур или свойств, о существовании которых разработчики или эксперты даже не могли предполагать на начальном этапе постановки задачи синтеза или моделирования.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Гладков Л.А., Курейчик В.В., Курейчик В.М. Генетические алгоритмы. - М.: Физматлит, 2010.
2. Цой Ю.Р. Нейроэволюционные алгоритмы и сложные адаптивные системы. Бионические информационные системы и их практические применения. - М. Физматлит, 2011.
- С. 109-127.
3. Кныш Д.С. Курейчик В.М. Параллельные генетические алгоритмы: обзор и состояние проблемы. Теория и системы управления. - М.: РАН. - C. 72-82.
4. Курейчик В.В., Родзин С.И. О правилах представления решений в эволюционных алгоритмах // Известия ЮФУ. - 2010. - № 7 (108). - С. 13-21.
5. Иорданский Н.Н. Эволюция жизни. - М.: Академия, 2001. - 425 с.
6. Barnhart, Benjamin J. «DOE Human Genome Program». Human Genome Quarterly 1: 1. Retrieved 2005-02-03.
7. Levy S, Sutton G, The Diploid Genome Sequence of an Individual Human. PLoS Biol.
8. Wolfsberg T, McEntyre J, Schuler G. «Guide to the draft human genome». Nature 409 (6822): 824 - 6. 2001.
9. Sillero-Zubiri, Claudio; Hoffmann. Dave Mech Canids: Foxes, Wolves, Jackals and Dogs: Status Survey and Conservation Action Plan. World Conservation Union, 2004.
10. Redei G.P. Genetics manual: current theory, concepts, terms. World Scientific. - P. 1142.
11. Соколов В.Е. Систематика млекопитающих. - М.: Высш. шк., 1973. - С. 432.
12. Gregory T. «The C-value enigma in plants and animals: a review of parallels and an appeal for partnership». Ann Bot (Lond) 95 (1): 133 - 46. 2005
Статью рекомендовал к опубликованию д.т.н., профессор Н.И. Витиска.
Гудилов Виталий Витальевич - ООО "Ямал", г. Ростов-на-Дону; e-mail: vgudilov@mail.ru; 344000, г. Ростов-на-Дону, ул. Шаумяна 48, оф. 2; тел.: +79198781600; к.т.н.; руководитель отдела информационных технологий.
Gudilov Vitaly Vital’evich - Ltd. "Yamal", Rostov-on-Don; e-mail: vgudilov@mail.ru; 48, Shaumyana street, of. 2, Rostov-on-Don, 344000, Russia; phone: +79198781600; cand. of eng. sc.; head of information technology.