Научная статья на тему 'Исследование эффективности различных методов самонастройки генетического алгоритма'

Исследование эффективности различных методов самонастройки генетического алгоритма Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
278
121
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Становов В.В., Семенкин Е.С.

Исследуется эффективность различных подходов к автоматическому выбору операторов генетического алгоритма. Рассмотрены два метода самонастройки, проведено тестирование и сравнение с множеством других методов оптимизации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Исследование эффективности различных методов самонастройки генетического алгоритма»

Секция «Математические методы моделирования, управления и анализа данных»

УДК 519.68

В. В. Становов Научный руководитель - Е. С. Семенкин Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ РАЗЛИЧНЫХ МЕТОДОВ САМОНАСТРОЙКИ ГЕНЕТИЧЕСКОГО АЛГОРИТМА

Исследуется эффективность различных подходов к автоматическому выбору операторов генетического алгоритма. Рассмотрены два метода самонастройки, проведено тестирование и сравнение с множеством других методов оптимизации.

Генетические алгоритмы являются мощным оптимизационным средством, относящимся к методам прямого поиска (т. е. не требуют никаких сведений о структуре целевой функции). С их помощью могут быть решены задачи многомерной оптимизации сложных функций, в том числе в случаях когда присутствуют смешанные переменные. В данной работе рассматриваются лишь задачи безусловной оптимизации на множестве действительных чисел.

Существенной проблемой для генетических алгоритмов является невозможность определения наилучших типов операторов для конкретной задачи. На сегодняшний день предложены различные методы решения данной проблемы - коэволюционные подходы, множество типов самонастройки и самоадаптации. В данной работе рассмотрены два метода самонастройки из [1] - Population-Level Dynamic Probabilities (PDP, динамические вероятности на уровне популяции) и Individual-Level Dynamic Probabilities (IDP, динамические вероятности на уровне индивида). Данные подходы были разработаны для настройки вероятности выбора того или иного типа мутации в генетическом программировании.

Была разработана программная система, реализующая эти подходы, адаптированные к применению в генетическом алгоритме. Основная идея метода PDP состоит в том, что вероятности выбора операторов зависят от успешности их применения. То есть, после последовательного применения операторов селекции, скрещивания и мутации пригодность полученного потомка сравнивается с пригодностями родителей и, в случае увеличения пригодности, примененные операторы поощряются. Вероятности вычисляются следующим образом:

Pf = Paii *

-CUM»

acafo

-1,

gatrarag 20 scate = Уij

it

где м^иц

Здесь - число успешных применений опе-

ратора I, - общее число применений, п - общее число операторов.

Метод ГОР в предложенном виде применим только для выбора оператора мутации, поэтому он был модифицирован для выбора оператора скрещивания. Суть метода состоит в том, что каждому индивиду из популяции ставится в соответствие несколько счетчи-

ков як числа неудачных применений данного оператора, значения которых используются для вычисления вероятностей следующим образом:

Pi = Pail +

(maturtdnf^ +1 - cnffj- ЩЮ- к ■ jj^.O

где Psii- ~

R - (тахдоя^сп^ + l)-20

n -число операторов Так как данный метод требует наличия одного или двух родительских индивидов, он неприменим для выбора типа селекции. Таким образом, при использовании метода IDP для настройки вероятностей выбора операторов скрещивания и мутации, вероятности выбора типов селекции использовался метод PDP.

Сравнение результатов тестирования

Функция Точность PDP IDP Simple GA

1 1,00E-07 3459 1220 4316

2 1,00E-03 1326 1402 782

3 1,00E-03 79 19 40

4 1,00E-03 19 41 37

5 1,00E-07 282 249 6800

6 1,00E-03 534 1059 3073

7 1,00E-07 87 18 67

8 1,00E-03 270 255 1342

9 1,00E-03 1102 146 2167

10 1,00E-01 614 640 2828

11 1,00E-01 650 409 5039

12 1,00E-01 282 467 575

13 1,00E-01 238 714 1090

14 1,00E-03 187 82 276

15 1,00E-01 15 15 13

16 1,00E-03 62 21 178

17 1,00E-03 88 186 91

18 1,00E-01 33 54 23

19 1,00E-03 146 310 108

20 1,00E-03 93 21 45

21 1,00E-07 27 25 271

22 1,00E-07 110 115 1855

23 1,00E+00 8 6,30 6,6

24 1,00E+00 40 17 67

Тестирование производилось по методологии [2]. Список содержит 24 тестовые функции разных размерностей (от 2 до 40). Результатом тестирования является количество вычислений функции пригодно-

Актуальные проблемы авиации и космонавтики. Информационные технологии

сти до достижения заданной точности. По результатам тестирования можно заключить, что предложенные алгоритмы превосходят принимавший участие в соревновании базовый генетический алгоритм на большинстве тестовых задач. При этом методы PDP и IDP примерно равны по эффективности. В таблице приведены значения ожидаемого числа вычислений функции для размерности 2 для трех алгоритмов: PDP, IDP и Simple GA (взято из [3]).

Библиографические ссылки

1. Niehaus, J., Banzhaf, W. Adaption of Operator Probabilities in Genetic Programming. In: Miller J. et al. (Eds.): EuroGP 2001, LNCS 2038. 2001. Р. 325-336.

2. URL:

http://coco.gforge.inria.fr/lib/exe/fetch.php?media=downl oad3.6:bbobdocexperiment.pdf.

3. URL: http://coco.lri.fr/BB0B2009/rawdata/

© Становов В. В., 2012

УДК 330.43

А. В. Стрельников научный руководитель - А. В. Медведев Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

О НЕПАРАМЕТРИЧЕСКОМ МОДЕЛИРОВАНИИ ДЕФИЦИТНЫХ РИСКОВ

Рассматривается задача оценки дефицитных рисков ежедневной доходности. Для оценки применяются метод нижних частных моментов, параметрический и непараметрический подходы. Приводятся графики сравнения качества работы методов.

Одной из задач инвестиционного анализа является оценка рисков потерь вложенных средств. Как правило, риск является вероятностью того, что предпринимательская деятельность, в которую мы вложили деньги, окажется убыточной. Для построения оценок можно использовать необходимую априорную информацию об этой и других предприятий, существующих на едином рынке. В качестве такой априорной информации может быть показатель ежедневной доходности rt - натуральный логарифм отношения

стоимости активов компании сегодня к стоимости активов вчера. Этот показатель является безразмерной величиной, содержащей случайную составляющую и зависящей от предыдущих своих состояний и от ситуации на внешнем рынке.

Для оценки финансовых рисков обычно используется стандартная мера [1]. Но эта оценка имеет существенный недостаток, при котором прибыль и потери оцениваются одинаково. В случае если закон распределения показателей не является симметричным, то стандартная мера становится неадекватной. Для решения данной задачи предлагается использовать оценку дефицитов риска.

Рассмотрим самый простой вариант, когда rt является случайной величиной. В защиту такого упрощения можно привести утверждение, что сумма случайных величин также является случайной величиной.

По сути, оценкой дефицита риска (ESR - Estimation of Shortfall Risk) является вероятность того, что значение показателя r (или Index) окажется ниже значения z. На рис. 1 заштрихованной областью обозначена оценка дефицита риска, z - величина показателя r на момент инвестиций.

Сформулируем задачу оценки дефицитных рисков. Для удобства здесь и в дальнейшем будем называть вектор ежедневных доходностей r вектором показа-

телей. Пусть существует набор показателей r - случайных величин, имеющих функцию плотности распределения P(r). Зафиксировано значение z. Имеется ряд статистически независимых наблюдений rt, объемом s. Необходимо оценить площадь ESR под кривой плотности.

Существует три метода для вычисления ESR [2]: метод нижних частных моментов, параметрическая и непараметрическая методы. Первый метод заключается в вычислении нижних частных моментов для случайной величины rt с зафиксированным значением z, n - положительный коэффициент:

1 ^ / \n fl if rt < z;

LPMn =-Y(z-rt)"IZ, Iz =\ J t (1)

s~~1 [0 otherwise,

Другие методы заключаются в оценивании функции плотности вероятности P(r). Для этого существует два способа: параметрический и непараметрический. Принципиальное отличие между этими способами заключается в уровне априорной информации. В первом подходе сначала определяется структура функции плотности распределения, а потом оцениваются ее параметры. В случае, когда априорной информации не хватает, чтобы определить структуру закона распределения, используют непараметрический подход, в котором плотность распределения показателей оценивается с помощью непараметрической оценки. Например, оценки Розенблата-Парзена [3; 4]:

P(r) = (s■ hs)-1 £Ф(( (r -rt)) (2)

t=1 '

где Ф(-) - ядерная функция; hs - параметр размытости.

Тогда ESR для параметрического и непараметрического подходов будет вычисляться:

i Надоели баннеры? Вы всегда можете отключить рекламу.