Секция математического обеспечения и применения
ЭВМ
УДК 004.8
С.И. Родзин К ВОПРОСУ О ЕДИНОЙ КОНЦЕПЦИИ ЭВОЛЮЦИОННЫХ ВЫЧИСЛЕНИЙ
Идеи эволюции и самоорганизации оказались чрезвычайно плодотворными, на практике доказали свою непримитивность. Их особенность заключается в том, что они находят свое подтверждение не только для биологических систем, успешно развивающихся миллионы лет. Сегодня эти идеи возродили интерес к изучению и развитию адаптивных высоконадежных искусственных систем, которые обладают когнитивными возможностями в условиях изменения внутренней и внешней , ,
. -вые компьютерные технологии для моделирования и оптимизации, а также разнообразные системы поиска, анализа и синтеза всех видов информации. Ключевой доминантой здесь остается повышение качества компьютерных вычислений, кото, , формализуемых задач [1].
С точки зрения методологии искусственного интеллекта эволюционные вычисления, являясь адаптивным стохастическим методом, стали собирательным понятием, основанным на некоторых формализованных принципах (адгоритмах) естественного эволюционного процесса. Эволюционные алгоритмы (ЭА) превратились в универсальный инструмент поиска субоптимальных решений для многих трудных практических задач. Они успешно конкурируют с другими эвристическими методами оптимизации по качеству решений в сочетании с трудоемкостью их , -. - , главным становится смысловое содержание параметров управления эволюцией.
, -стей эволюционных алгоритмов на единой концептуальной основе, связанной с моделированием поведения живых организмов, созданием интеллектуальных программ и искусственных систем [2].
Причины появления проблемы известны: неполнота знаний о внешнем мире, непредсказуемость реальных ситуаций, размерность решаемых задач - все это заставляет исследователей использовать различные модели эволюционных вычисле-: ( ), ( ), -ционные стратегии (ЭС) и эволюционное программирование (ЭП) [3]. Эволюционная модель системы должна отвечать определенным критериям качества, обладать способностью к адаптации, к передаче своих характерных черт по наследству, в
модели должен присутствовать механизм порождения новых форм, обычно содержащий элемент случайности.
Основными критериями оценки качества любого эвристического алгоритма являются универсальность (пригодность для решения широкого класса задач) и вычислительная мощность (качество полученного решения в сочетании с трудоемкостью его получения). Это означает, что все эвристические алгоритмы можно разделить на «слабые» (универсальные, но не мощные) и «сильные» (мощные, но ). ,
« » « » .
С другой стороны, согласно №Ъ-теореме (Вольперт-Макрид, 1995), не существует эвристического алгоритма, который был бы одновременно лучшим с точки зрения качества получаемых решений и универсальности. Чтобы найти хорошее эвристическое решение для заданного класса задач, необходимо вначале идентифицировать характеристические особенности решаемой задачи и на этой основе искать подходящий алгоритм. Эволюционика пока не построила единую концепцию эволюционных вычислений, однако, на наш взгляд, различия ЭА не носят методологический характер и не затрагивают фундаментальные принципы, присущие эволюции независимо от формы и уровня абстракции модели. Мы считаем, что эти принципы можно выразить в виде абстрактного эволюционного алгоритма, включающего следующие этапы:
1. Настройка параметров эволюционного алгоритма (инициализация).
Для ГА обычно случайно генерируется исходная популяция Р(1=0), состоящая
из хромосом аъ 1=1, 2,..., ц (обычно 30<ц<500), причем каждая хромосома состоит , -. -невероятно и независимо друг от друга.
Для ГП случайно генерируется популяция Р0=0), состоящая из ц древовид-( ), , ( -
).
Для ЭС случайно по равномерному закону распределения генерируется начальная популяция Р(1=0) из ц индивидов вида а1=(х^ак), где XJ - вещественные пе-, ( ), ок - среднеквадратичное отклонение, которое означает среднюю величину наследственной изменчивости и характеризует адаптивные свойства ЭС.
Для ЭП на этапе инициализации случайным образом генерируется популяция Р0=0), состоящая из ц артефактов а1 (ц>200), причем величина а1 устанавливается случайно с помощью равномерного распределения на некотором интервале, границы которого также устанавливаются случайно и могут изменяться.
Параметры ЭА подбираются таким образом, чтобы обеспечить скорость работы алгоритма и поиск лучшего решения.
2. Оценка решений, входящих в популяцию.
В ГА на этом шаге оценивается качество хромосом, входящих в популяцию с целью последующей селекции, и вычисляется целевая функция Р(а1).
В ГП на этом этапе оценивается каждая программа в Р(1), а поскольку все программы выбираются случайно, то в качестве оценки выбирается разница между лучшим и худшим значением целевой функции в популяции.
В ЭС для каждого решения а1 вычисляется целевая функция Р(а1).
(а1), -
купность образует множество родителей для формирования новой популяции.
3. Формирование новой популяции Р(и=1+1).
В простейших ГА применяется пропорциональная (не дискриминационная или рулеточная) селекция и репликация, т.е. вычисляется вероятность селекции хромосомы р3(а1) как отношение Б(а1) к сумме значений всех Р(а1), 1=1,..., ц. Выбранная таким образом хромосома копируется в первоначально пустой список ро, .
, , а1
качестве родительской хромосомы, равно цор3(а1). Результатом является список .
выбора с вероятностью 1/ц пары партнеров для кроссинговера (скрещивания) с вероятностью рк и мутации с вероятностью рм. Затем производится оценка потомков и формирование новой популяции путем выбора ц лучших хромосом.
В ГП вначале выбираются вероятности применения операторов репродукции и кроссинговера рь и рк соответственно (рк+рк=1), а затем выполняются селекция , .
, . -
( ),
случайным образом определяются точки кроссинговера и образуются два потомка путем обмена списками между двумя программами при сохранении синтаксической корректности вновь получаемых программ.
В ЭС генерация потомков состоит в получении X потомков из ц родителей. Для этого необходимо выбрать родителей, провести их рекомбинацию и реплика-
( ), потомков. Рекомендуется соотношение ц/Х=1/7, причем (х~15, А.—100. Данный этап алгоритма выполняется X раз и включает в себя следующую последовательность действий: случайный выбор родителей; в результате случайного обмена отдельными родительскими фенотипическими компонентами возникает потомок, который затем мутирует по фенотипическому закону нормального распределения (дети похожи на своих родителей, а любые небольшие изменения в наследовании призна-, ). , подойти к поиску оптимального значения переменных, к настройке и установке параметров ЭС при достаточно большом размере популяции ц. Далее, производится оценка каждого из потомков и различные виды селекции. Согласно контроверзе Ч.Дарвина в ходе естественного отбора побеждает сильнейший, но материал для , , . , селекции отдельные из отбрасываемых решений рекомендуется запоминать в отдельный список для последующего периодического их использования в ходе эволюции. Пропорция цА указывает на степень «суровости» селекции. Управляя этой , , , -
.
В ЭП генерация потомков выполняется ц раз и включает в себя следующие : 1- ; -тем мутации копии через нормально распределенную случайную величину с нулевым математическим ожиданием и динамически изменяемым среднеквадратичным отклонением («ширина мутации»); оценка потомка путем определения его функции
(а1), . -
мер популяции становится равным 2-ц, то выполняется селекция по соревнова-. , -ветствия не хуже, чем у противника. Затем подсчитывается сумма одержанных
, ,
.
4. Проверка критерия остановки работы алгоритма.
ЭА являются итерационными. Условия для остановки процесса эволюции в ЭА примерно схожи: достижение максимального числа шагов эволюции (поколений) Ъщи, достижение заданного уровня качества (значение целевой функции всех
),
заданного уровня сходимости (индивиды в популяции настолько подобны, что дальнейшее их улучшение происходит чрезвычайно медленно) и т.п.
Различные формы ЭА моделируют эволюционный процесс на различном уровне абстракции. Например, ГА и ГП делают акцент на генетический механизм наследственности на уровне хромосом. ЭС, напротив, рассматривают ход эволюции на уровне фенотипа, а ЭП анализируют эволюцию на уровне популяции в целом. В алгоритмах ЭС и ЭП оператор мутации применяется с частотой, соответствующей нормальному закону распределения, что является оправданным для выбранного уровня моделирования, в отличие от мутации на генном уровне, где она проявляется как редкое событие и практически не влияет на фенотип. В алгоритмах ЭП мутация вообще является единственным оператором поиска. Наконец, оператор кроссинговера, который не применяется в алгоритмах ЭП, является основным алгоритмом для ГА и ГП.
Многочисленные эксперименты с различными формами ЭА, проведенные автором и другими исследователями, показывают, что они являются достаточно эффективным инструментом для инженерного проектирования, управления, эконо-, -ноформализуемых задач распознавания образов, кластеризации, ассоциативного , . объясняются не только их адаптивными свойствами, но также параллелизмом и ,
систем на основе комбинирования с такими парадигмами как нейросети и нечеткая логика [4, 5].
Вместе с тем, несмотря на впечатляющие практические результаты, следует признать, что в этой области существует целый ряд теоретических проблем [6]. , , целесообразность применения ГА для некоторых оптимизационных задач. Автор считает, что в ГП применение теоремы Холланда для описания динамики эволюционного процесса является сильно упрощенным подходом, и предлагает альтер-, -ских особенностей различных форм представления хромосом в популяции. Такие теоретические аспекты ЭС как частота мутации и ее влияние на целевую функцию в конкретной задаче, самоадаптивность также требуют дальнейших усилий в дан. , на теории марковских цепей, справедливо лишь для частного случая селекции и простейших форм эволюционного процесса.
Преодоление указанных трудностей на единой концептуальной основе максимально приблизит эволюционные вычисления к естественному эволюционному , -
.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Курейчик В.М., Родзин С.И. Эволюционные алгоритмы: генетическое программирование (обзор) // Известия РАН. Теория и системы управления. 2002. №1. С.127-137.
2. Rodzin S.I. Schemes of Evolution Strategies // Proc. of IEEE int. conf. ICAIS. Los Alamos (USA). P.375-380.
3. Куре йчик В.М., Родзин С.И. Компьютерный синтез программных агентов и артефактов // Программные продукты и системы. 2004. №1. С.23-27.
4. Родзин С.И. Мягкие параллельные вычисления // Новости искусственного интеллекта.
2005. 4. C.53-58.
5. . . // . -
венный интеллект. 2003. №4. С.485-492.
6. Родзин С.И. Когнитивные возможности и проблемы генетических алгоритмов // Труды Межд. НТК «AIS'05». - М.: Физматлит, 2005. С.67-77.
УДК 681.3.007.001.33
..
ТЕМАТИЧЕСКИЙ ИНФОРМАЦИОННЫЙ ПОИСК
Повсеместная информатизация общества приводит к необходимости развития функциональных надстроек над данными, в частности к совершенствованию поис-.
Цель работы - создание тематической поисковой системы, позволяющей неквалифицированному пользователю сориентироваться в справочно-поисковом аппарате тематической библиотеки и, не имея навыков информационного поиска, суметь получить необходимые сведения.
, , представление о своих информационных потребностях, которые затем уточняются с помощью системы, помогающей отобрать нужные для него документы.
Для создания тематической поисковой системы необходимо решить три ос: , -вать особенности предметной области на этапе сбора данных о коллекции доку;
пользователя с системой; предоставить поисковой системе аппарат, позволяющий переформулировать служебные элементы естественного языка в команды системы.
, -
исковой системе позволяет использование синонимических рядов по тематике по,
« - », -
странстве тематических понятий предметной области, построенное на этапе индексирования коллекции документов и позволяющее оценить смысловую близость
.
По нашему мнению, ключевой доминантой в области тематического информационного поиска является его интеллектуализация. В предлагаемой системе это достигается на этапе расширения поискового запроса путем предоставления пользователю возможности добавить ключевые слова для поиска, расширить запрос за , . -, , представление слов в пространстве тематических понятий предметной области.