Научная статья на тему 'К вопросу о единой концепции эволюционных вычислений'

К вопросу о единой концепции эволюционных вычислений Текст научной статьи по специальности «Математика»

CC BY
94
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «К вопросу о единой концепции эволюционных вычислений»

Секция математического обеспечения и применения

ЭВМ

УДК 004.8

С.И. Родзин К ВОПРОСУ О ЕДИНОЙ КОНЦЕПЦИИ ЭВОЛЮЦИОННЫХ ВЫЧИСЛЕНИЙ

Идеи эволюции и самоорганизации оказались чрезвычайно плодотворными, на практике доказали свою непримитивность. Их особенность заключается в том, что они находят свое подтверждение не только для биологических систем, успешно развивающихся миллионы лет. Сегодня эти идеи возродили интерес к изучению и развитию адаптивных высоконадежных искусственных систем, которые обладают когнитивными возможностями в условиях изменения внутренней и внешней , ,

. -вые компьютерные технологии для моделирования и оптимизации, а также разнообразные системы поиска, анализа и синтеза всех видов информации. Ключевой доминантой здесь остается повышение качества компьютерных вычислений, кото, , формализуемых задач [1].

С точки зрения методологии искусственного интеллекта эволюционные вычисления, являясь адаптивным стохастическим методом, стали собирательным понятием, основанным на некоторых формализованных принципах (адгоритмах) естественного эволюционного процесса. Эволюционные алгоритмы (ЭА) превратились в универсальный инструмент поиска субоптимальных решений для многих трудных практических задач. Они успешно конкурируют с другими эвристическими методами оптимизации по качеству решений в сочетании с трудоемкостью их , -. - , главным становится смысловое содержание параметров управления эволюцией.

, -стей эволюционных алгоритмов на единой концептуальной основе, связанной с моделированием поведения живых организмов, созданием интеллектуальных программ и искусственных систем [2].

Причины появления проблемы известны: неполнота знаний о внешнем мире, непредсказуемость реальных ситуаций, размерность решаемых задач - все это заставляет исследователей использовать различные модели эволюционных вычисле-: ( ), ( ), -ционные стратегии (ЭС) и эволюционное программирование (ЭП) [3]. Эволюционная модель системы должна отвечать определенным критериям качества, обладать способностью к адаптации, к передаче своих характерных черт по наследству, в

модели должен присутствовать механизм порождения новых форм, обычно содержащий элемент случайности.

Основными критериями оценки качества любого эвристического алгоритма являются универсальность (пригодность для решения широкого класса задач) и вычислительная мощность (качество полученного решения в сочетании с трудоемкостью его получения). Это означает, что все эвристические алгоритмы можно разделить на «слабые» (универсальные, но не мощные) и «сильные» (мощные, но ). ,

« » « » .

С другой стороны, согласно №Ъ-теореме (Вольперт-Макрид, 1995), не существует эвристического алгоритма, который был бы одновременно лучшим с точки зрения качества получаемых решений и универсальности. Чтобы найти хорошее эвристическое решение для заданного класса задач, необходимо вначале идентифицировать характеристические особенности решаемой задачи и на этой основе искать подходящий алгоритм. Эволюционика пока не построила единую концепцию эволюционных вычислений, однако, на наш взгляд, различия ЭА не носят методологический характер и не затрагивают фундаментальные принципы, присущие эволюции независимо от формы и уровня абстракции модели. Мы считаем, что эти принципы можно выразить в виде абстрактного эволюционного алгоритма, включающего следующие этапы:

1. Настройка параметров эволюционного алгоритма (инициализация).

Для ГА обычно случайно генерируется исходная популяция Р(1=0), состоящая

из хромосом аъ 1=1, 2,..., ц (обычно 30<ц<500), причем каждая хромосома состоит , -. -невероятно и независимо друг от друга.

Для ГП случайно генерируется популяция Р0=0), состоящая из ц древовид-( ), , ( -

).

Для ЭС случайно по равномерному закону распределения генерируется начальная популяция Р(1=0) из ц индивидов вида а1=(х^ак), где XJ - вещественные пе-, ( ), ок - среднеквадратичное отклонение, которое означает среднюю величину наследственной изменчивости и характеризует адаптивные свойства ЭС.

Для ЭП на этапе инициализации случайным образом генерируется популяция Р0=0), состоящая из ц артефактов а1 (ц>200), причем величина а1 устанавливается случайно с помощью равномерного распределения на некотором интервале, границы которого также устанавливаются случайно и могут изменяться.

Параметры ЭА подбираются таким образом, чтобы обеспечить скорость работы алгоритма и поиск лучшего решения.

2. Оценка решений, входящих в популяцию.

В ГА на этом шаге оценивается качество хромосом, входящих в популяцию с целью последующей селекции, и вычисляется целевая функция Р(а1).

В ГП на этом этапе оценивается каждая программа в Р(1), а поскольку все программы выбираются случайно, то в качестве оценки выбирается разница между лучшим и худшим значением целевой функции в популяции.

В ЭС для каждого решения а1 вычисляется целевая функция Р(а1).

(а1), -

купность образует множество родителей для формирования новой популяции.

3. Формирование новой популяции Р(и=1+1).

В простейших ГА применяется пропорциональная (не дискриминационная или рулеточная) селекция и репликация, т.е. вычисляется вероятность селекции хромосомы р3(а1) как отношение Б(а1) к сумме значений всех Р(а1), 1=1,..., ц. Выбранная таким образом хромосома копируется в первоначально пустой список ро, .

, , а1

качестве родительской хромосомы, равно цор3(а1). Результатом является список .

выбора с вероятностью 1/ц пары партнеров для кроссинговера (скрещивания) с вероятностью рк и мутации с вероятностью рм. Затем производится оценка потомков и формирование новой популяции путем выбора ц лучших хромосом.

В ГП вначале выбираются вероятности применения операторов репродукции и кроссинговера рь и рк соответственно (рк+рк=1), а затем выполняются селекция , .

, . -

( ),

случайным образом определяются точки кроссинговера и образуются два потомка путем обмена списками между двумя программами при сохранении синтаксической корректности вновь получаемых программ.

В ЭС генерация потомков состоит в получении X потомков из ц родителей. Для этого необходимо выбрать родителей, провести их рекомбинацию и реплика-

( ), потомков. Рекомендуется соотношение ц/Х=1/7, причем (х~15, А.—100. Данный этап алгоритма выполняется X раз и включает в себя следующую последовательность действий: случайный выбор родителей; в результате случайного обмена отдельными родительскими фенотипическими компонентами возникает потомок, который затем мутирует по фенотипическому закону нормального распределения (дети похожи на своих родителей, а любые небольшие изменения в наследовании призна-, ). , подойти к поиску оптимального значения переменных, к настройке и установке параметров ЭС при достаточно большом размере популяции ц. Далее, производится оценка каждого из потомков и различные виды селекции. Согласно контроверзе Ч.Дарвина в ходе естественного отбора побеждает сильнейший, но материал для , , . , селекции отдельные из отбрасываемых решений рекомендуется запоминать в отдельный список для последующего периодического их использования в ходе эволюции. Пропорция цА указывает на степень «суровости» селекции. Управляя этой , , , -

.

В ЭП генерация потомков выполняется ц раз и включает в себя следующие : 1- ; -тем мутации копии через нормально распределенную случайную величину с нулевым математическим ожиданием и динамически изменяемым среднеквадратичным отклонением («ширина мутации»); оценка потомка путем определения его функции

(а1), . -

мер популяции становится равным 2-ц, то выполняется селекция по соревнова-. , -ветствия не хуже, чем у противника. Затем подсчитывается сумма одержанных

, ,

.

4. Проверка критерия остановки работы алгоритма.

ЭА являются итерационными. Условия для остановки процесса эволюции в ЭА примерно схожи: достижение максимального числа шагов эволюции (поколений) Ъщи, достижение заданного уровня качества (значение целевой функции всех

),

заданного уровня сходимости (индивиды в популяции настолько подобны, что дальнейшее их улучшение происходит чрезвычайно медленно) и т.п.

Различные формы ЭА моделируют эволюционный процесс на различном уровне абстракции. Например, ГА и ГП делают акцент на генетический механизм наследственности на уровне хромосом. ЭС, напротив, рассматривают ход эволюции на уровне фенотипа, а ЭП анализируют эволюцию на уровне популяции в целом. В алгоритмах ЭС и ЭП оператор мутации применяется с частотой, соответствующей нормальному закону распределения, что является оправданным для выбранного уровня моделирования, в отличие от мутации на генном уровне, где она проявляется как редкое событие и практически не влияет на фенотип. В алгоритмах ЭП мутация вообще является единственным оператором поиска. Наконец, оператор кроссинговера, который не применяется в алгоритмах ЭП, является основным алгоритмом для ГА и ГП.

Многочисленные эксперименты с различными формами ЭА, проведенные автором и другими исследователями, показывают, что они являются достаточно эффективным инструментом для инженерного проектирования, управления, эконо-, -ноформализуемых задач распознавания образов, кластеризации, ассоциативного , . объясняются не только их адаптивными свойствами, но также параллелизмом и ,

систем на основе комбинирования с такими парадигмами как нейросети и нечеткая логика [4, 5].

Вместе с тем, несмотря на впечатляющие практические результаты, следует признать, что в этой области существует целый ряд теоретических проблем [6]. , , целесообразность применения ГА для некоторых оптимизационных задач. Автор считает, что в ГП применение теоремы Холланда для описания динамики эволюционного процесса является сильно упрощенным подходом, и предлагает альтер-, -ских особенностей различных форм представления хромосом в популяции. Такие теоретические аспекты ЭС как частота мутации и ее влияние на целевую функцию в конкретной задаче, самоадаптивность также требуют дальнейших усилий в дан. , на теории марковских цепей, справедливо лишь для частного случая селекции и простейших форм эволюционного процесса.

Преодоление указанных трудностей на единой концептуальной основе максимально приблизит эволюционные вычисления к естественному эволюционному , -

.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Курейчик В.М., Родзин С.И. Эволюционные алгоритмы: генетическое программирование (обзор) // Известия РАН. Теория и системы управления. 2002. №1. С.127-137.

2. Rodzin S.I. Schemes of Evolution Strategies // Proc. of IEEE int. conf. ICAIS. Los Alamos (USA). P.375-380.

3. Куре йчик В.М., Родзин С.И. Компьютерный синтез программных агентов и артефактов // Программные продукты и системы. 2004. №1. С.23-27.

4. Родзин С.И. Мягкие параллельные вычисления // Новости искусственного интеллекта.

2005. 4. C.53-58.

5. . . // . -

венный интеллект. 2003. №4. С.485-492.

6. Родзин С.И. Когнитивные возможности и проблемы генетических алгоритмов // Труды Межд. НТК «AIS'05». - М.: Физматлит, 2005. С.67-77.

УДК 681.3.007.001.33

..

ТЕМАТИЧЕСКИЙ ИНФОРМАЦИОННЫЙ ПОИСК

Повсеместная информатизация общества приводит к необходимости развития функциональных надстроек над данными, в частности к совершенствованию поис-.

Цель работы - создание тематической поисковой системы, позволяющей неквалифицированному пользователю сориентироваться в справочно-поисковом аппарате тематической библиотеки и, не имея навыков информационного поиска, суметь получить необходимые сведения.

, , представление о своих информационных потребностях, которые затем уточняются с помощью системы, помогающей отобрать нужные для него документы.

Для создания тематической поисковой системы необходимо решить три ос: , -вать особенности предметной области на этапе сбора данных о коллекции доку;

пользователя с системой; предоставить поисковой системе аппарат, позволяющий переформулировать служебные элементы естественного языка в команды системы.

, -

исковой системе позволяет использование синонимических рядов по тематике по,

« - », -

странстве тематических понятий предметной области, построенное на этапе индексирования коллекции документов и позволяющее оценить смысловую близость

.

По нашему мнению, ключевой доминантой в области тематического информационного поиска является его интеллектуализация. В предлагаемой системе это достигается на этапе расширения поискового запроса путем предоставления пользователю возможности добавить ключевые слова для поиска, расширить запрос за , . -, , представление слов в пространстве тематических понятий предметной области.

i Надоели баннеры? Вы всегда можете отключить рекламу.