Научная статья на тему 'Нижние оценки трудоемкости марковского симметричного случайного поиска'

Нижние оценки трудоемкости марковского симметричного случайного поиска Текст научной статьи по специальности «Математика»

CC BY
100
47
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЛУЧАЙНЫЙ ПОИСК / ГЛОБАЛЬНАЯ ОПТИМИЗАЦИЯ / СТОХАСТИЧЕСКАЯ ОПТИМИЗАЦИЯ / RANDOM SEARCH / GLOBAL OPTIMIZATION / STOCHASTIC OPTIMIZATION

Аннотация научной статьи по математике, автор научной работы — Тихомиров А. С.

Исследуется трудоемкость марковских алгоритмов случайного поиска экстремума функции. Показано, что для широкого класса случайных поисков, обладающих естественным свойством симметрии, число вычислений целевой функции, необходимое для достижения требуемой точности ε решения задачи, не может расти медленнее, чем | lnε |

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Нижние оценки трудоемкости марковского симметричного случайного поиска»

УДК 519.626

НИЖНИЕ ОЦЕНКИ ТРУДОЕМКОСТИ МАРКОВСКОГО СИММЕТРИЧНОГО СЛУЧАЙНОГО ПОИСКА

А.С.Тихомиров

Институт электронных и информационных систем НовГУ, Alexey.Tikhomirov@novsu.ru

Исследуется трудоемкость марковских алгоритмов случайного поиска экстремума функции. Показано, что для широкого класса случайных поисков, обладающих естественным свойством симметрии, число вычислений целевой функции, необходимое для достижения требуемой точности £ решения задачи, не может расти медленнее, чем | lne |.

Ключевые слова: случайный поиск, глобальная оптимизация, стохастическая оптимизация

The computational complexity of the Markov random search algorithms designed for finding the function extremizer is investigated. It is shown that for a wide class of random search methods that possess a natural symmetry property the number of evaluations of the objective function needed to find the extremizer accurate to £ cannot grow more sluggish than | lne |.

Keywords: random search, global optimization, stochastic optimization

Введение

Пусть целевая функция f: X ^ R (где, например, X = Rd) принимает минимальное значение в единственной точке x*. Рассмотрим задачу поиска точки глобального минимума x* с заданной точностью є. Один из способов решения этой задачи состоит в применении алгоритмов случайного поиска экстремума функции (см. [1-1б]). Такие методы давно и успешно используются при решении сложных задач оптимизации. Тем не менее, существует мало теоретических результатов о скорости сходимости этих алгоритмов (см. [3-7]). Данная работа посвящена исследованию трудоемкости марковских алгоритмов случайного поиска экстремума. Отметим, что алгоритм simulated annealing («имитации отжига»), являющийся одним из самых знаменитых алгоритмов стохастической глобальной оптимизации, принадлежит рассматриваемому семейству методов.

В качестве характеристики трудоемкости алгоритма используем число вычислений целевой функции, требуемое для достижения заданной точности є решения задачи. Причина выбора такой характеристики состоит в том, что именно вычисления целевой функции составляют основной объем вычислительной работы при выполнении исследуемых алгоритмов. Кроме того, такая характеристика удобна при сравнении различных алгоритмов случайного поиска экстремума между собой. Подробнее выбранная характеристика обсуждается в [5].

В данной работе продолжены исследования статьи [17] и представлены нижние оценки трудоемкости марковских алгоритмов случайного поиска экстремума функции. Удалось доказать, что такие алгоритмы не могут быть слишком быстрыми. Оказывается, что (при некоторых ограничениях) число вычислений целевой функции, необходимое марковским алгоритмам случайного поиска для достижения заданной точности є решения задачи, не может расти медленнее, чем | lne |.

Отметим также, что в задачах стохастической глобальной оптимизации удалось построить такие марковские поиски (см., напр., [4,12-16]), для которых (при некоторых ограничениях на целевую функцию, разумеется) требуемое число вычислений целе-

вой функции логарифмически зависит от заданной точности решения задачи.

Результаты работы позволяют оценить потенциальные возможности марковских алгоритмов и сделать вывод о том, что трудоемкость некоторых построенных алгоритмов близка к оптимальной, по крайне мере по порядку зависимости от е.

2. Постановка задачи

Назовем пространством оптимизации множество оптимизации X, снабженное метрикой р. Мы ограничимся случаем ^-мерного евклидова простран-

Ка

с метрикой

р( ^ У ) = Рш (^ У) = тах| хп - Уп V

1<п<а

где х = (х1,...,ха) и у = (у1,...,уа). Замкнутый шар радиуса г с центром в точке х обозначим через Вг(х) = {уеRа :р(х,у)<г}.

Далее предполагается, что целевая функция I: R " ^ R измерима и удовлетворяет следующему условию: функция/принимает минимальное значение в единственной точке х*.

Никаких других ограничений на поведение целевой функции наложено не будет. При получении нижней оценки трудоемкости никаких специальных ограничений на поведение целевой функции не требуется. Жесткие ограничения на поведение целевой функции нужны в задачах построения «быстрых» алгоритмов и при получении верхних оценок скорости сходимости.

Случайным поиском называется произвольная последовательность случайных величин {4п }п>0 со

значениями в Яа . Следуя [18,19] приведем общую схему марковских алгоритмов случайного поиска.

Алгоритм 1

Шаг 1. 40 ^ х, п ^ 1.

Шаг 2. Пп ^ Рп (4п-1, •).

ттт ч е К,с вер°ятностью <2п ,

Шаг 3. %

[4п-1,с вероятностью 1 - Qn,

где вп = вп (Пп ,4*1 1(Пп ), /(4п-1)) .

Шаг 4. п ^ п +1 и перейти к шагу 2.

Здесь х — начальная точка поиска, а п — номер итерации алгоритма. Обозначение «Пп ^ Рп (4п-1,')» читается как «получить реализацию случайной величины пп с распределением Рп (4п-1, •)». Распределение Рп (4п-1, •) зависит от номера шага п и «старой» точки поиска 4 п—. В соответствии со структурой алгоритма 1, распределения Рп (4п-1, •) будем называть пробными переходными

функциями, а случайные величины пп — пробными точками.

После получения новой пробной точки пп (на втором шаге алгоритма) на третьем шаге поиск или переходит в эту точку пп с вероятностью Qn, или остается в старой точке поиска 4 п—.

При получении нижних оценок скорости сходимости будем исследовать момент первого попадания поиска в є-окрестность точки глобального минимума. При этом условие остановки алгоритма обсуждаться не будет. Таким образом, мы будем рассматривать бесконечные алгоритмы. Поэтому на четвертом шаге алгоритма номер итерации п просто увеличивается на единицу, и алгоритм вновь переходит к выполнению второго шага.

Разные правила задания вероятностей Qn и

пробных переходных функций Рп приводят к различным вариантам марковских алгоритмов случайного поиска. В частности, если вероятности Qn задать в виде

Ґ1, если Д < 0,

О =\ п

п 1ехР(-РпД п X если Д п > 0,

где Дп = /(пп) -/(4п-1), а величины вп > 0 являются

параметрами алгоритма, то получим знаменитый алгоритм «имитации отжига» (см., напр., [20]).

Далее будем рассматривать марковский случайный поиск, пробные переходные функции Рп (х, •) которого обладают симметричными плотностями Рп (х,У) вида

Рп (х, У) = (Р( х, У)), (*)

где р — метрика, а gn — невозрастающие неотрицательные функции, определенные на полуоси (0,+да). Функцию gn будем называть формой переходной плотности рп, а также формой распределения Рп . Не умаляя общности будем считать, что функции gn

непрерывны слева.

Марковский поиск алгоритма 1, пробные переходные функции которого обладают плотностями вида (*), будем называть марковским симметричным случайным поиском.

Отметим, что в задачах стохастической глобальной оптимизации вместо евклидовой метрики р2 часто используют метрику р ш (см. [4,12]). Использо-

Ка _

^ вызвано следующими при-

чинами. Во-первых, выбор метрики р ш несколько меняет цель поиска. Более существенно то, что поиск и метрика пространства оптимизации согласованы (см. формулу (*)). Здесь кроме всего прочего появляются соображения простоты моделирования: например, моделировать равномерное распределение в шаре, определяемом метрикой р ш, очень просто, в то время как при больших ё аналогичная задача в стандартной евклидовой метрике р2 весьма не проста. Простота моделировании является важным критерием выбора используемых переходных функций. Оказалось, что любое распределение с симметричными плотностями вида (*) можно представить в виде смеси равномерных распределений в шарах (см. [21]). Данное свойство можно использовать для получения эффективных процедур моделирования распределений с симметричными плотностями. Соответствующие примеры приведены в [12-14].

3. Характеристики случайного поиска

Случайный поиск используем для отыскания точки минимума х* с заданной точностью е (аппроксимация «по аргументу»). При этом нас будет интересовать попадание поиска в шар Ве( х*). Через те = шш{п > 0:4п е Ве (х*)}

обозначим момент первого попадания поиска в е-окрестность точки глобального минимума.

Как правило, предполагается, что для моделирования распределений Рп не требуется вычислений

функции / Тем самым на каждой итерации 4 п-1 ^ 4 п

алгоритма 1 происходит ровно одно вычисление целевой функции, и распределение случайной величины те дает нам достаточно полную информацию о качестве случайного поиска. Действительно, при выполнении те шагов поиска значения функции / вычисляются те +1 раз.

Мы рассмотрим две характеристики скорости сходимости случайного поиска. Трудоемкость случайного поиска определяется через Ете и имеет смысл среднего числа шагов поиска до достижения им множества Ве (х*).

Гарантирующее число шагов N(х, /,е,у) определяется как такое минимальное число шагов поиска, при котором достижение множества Ве(х*) гарантировано с вероятностью, не меньшей чем у. Иначе говоря,

N(х,/,е,у) = шш{п>0:Р(те <п)>у}.

(Полагаем N (х, / ,е,у) = +ш в случае, когда

Р(те < п) < у при всех п > 0).

4. Нижние оценки трудоемкости

Основной результат работы представляет следующая теорема. В ней показано, что число вычислений целевой функции, необходимое марковскому симметричному случайному поиску для достижения

требуемой точности е решения задачи, не может расти медленнее, чем 11пе | .

Теорема. Пусть целевая функция /: Яа ^ Я принимает минимальное значение в единственной точке х* . Рассмотрим марковский симметричный случайный поиск {4 п }п>0 алгоритма 1, пробные переходные функции которого имеют плотности вида (*). Пусть х — начальная точка поиска, 0<е<р(х,х*), 0 < у < 1. Тогда справедливы неравенства Ете > 1п(р( х, х*)/е) + 2, N (х, / ,е,у) > у(1п(р(х, х*)/е) + 2).

Полученные неравенства позволяют оценить потенциальные возможности марковских алгоритмов и сделать вывод о том, что трудоемкость некоторых построенных алгоритмов (см., напр., [4,12-16]) близка к оптимальной, по крайне мере по порядку зависимости от е.

1. Ермаков С.М., Жиглявский А.А. О случайном поиске глобального экстремума // Теория вероятностей и ее применения. 1983. №1. С.129-136.

2. Ермаков С.М., Жиглявский А.А., Кондратович М.В. О сравнении некоторых процедур случайного поиска глобального экстремума // Журн. вычисл. математики и мат. физики. 1989. Т.29. №2. С.163-170.

3. Жиглявский А.А., Жилинскас А.Г. Методы поиска глобального экстремума. М.: Наука, 1991. 248 с.

4. Zhigljavsky A., Zilinskas A. Stochastic Global Optimization. Berlin: Springer-Verlag, 2008. 262 p.

5. Spall J.C. Introduction to stochastic search and optimization: estimation, simulation, and control. New Jersey: Wiley, 2003. 618 p.

6. Spall J.C., Hill S.D., Stark D.R. Theoretical framework for comparing several stochastic optimization approaches // Probabilistic and randomized methods for design under uncertainty. L.: Springer, 2006. P.99-117.

7. Yin G. Rates of convergence for a class of global stochastic optimization algorithms // SIAM J. on Optimization. 1999. V.10. No.1. P.99-120.

8. Ingber L. Very fast simulated re-annealing // Math. Comput. Modelling. 1989. V.12. P.967-973.

9. Лопатин А.С. Метод отжига // Стохастическая оптимизация в информатике. 2005. Вып.1. С.133-149.

10. Граничин О.Н., Поляк Б.Т. Рандомизированные алгоритмы оценивания и оптимизации при почти произвольных помехах. М.: Наука, 2003. 291 с.

11. Абакаров А.Ш., Сушков Ю.А. Статистическое исследование случайного поиска // Математические модели. Теория и приложения. Вып.2. СПб.: Изд-во НИИХ СПбГУ, 2002. C.70-86.

12. Тихомиров А.С., Некруткин В.В., Марковский монотонный поиск экстремума. Обзор некоторых теоретических результатов // Математические модели. Теория и приложения. Вып.4. СПб.: ВВМ, 2004. С.3-47.

13. Тихомиров А.С. Об однородном марковском монотонном поиске экстремума // Журн. вычисл. математики и мат. физики. 2006. Т.46. №3. С.379-394.

14. Тихомиров А.С. О быстрых вариантах алгоритма отжига (simulated annealing) // Стохастическая оптимизация в информатике. 2009. Вып.5. С.65-90.

15. Тихомиров А.С. О скорости сходимости алгоритма simulated annealing // Журн. вычисл. математики и мат. физики. 2010. Т.50. №1. С.24-37.

16. Тихомиров А.С. О быстром варианте алгоритма отжига // Вестник НовГУ. Сер.: Техн. науки. 2010. №60. С.53-56.

17. Тихомиров А.С. Нижние оценки скорости сходимости марковского симметричного случайного поиска // Журн. вычисл. математики и мат. физики. 2011. Т.51. №9. С.1630-1644.

18. Жиглявский А.А., Жилинскас А.Г. Указ. соч. С.127.

19. Zhigljavsky A., Zilinskas A. Op. cit. P.116.

20. Ibid. P.118.

21. Тихомиров А.С. О моделировании случайных векторов с монотонными симметричными плотностями // Вестник НовГУ. Сер.: Техн. науки. 2004. №28. С.111-113.

Bibliography (Translitirated)

1. Ermakov S.M., Zhigljavskijj A.A. O sluchajjnom poiske global'nogo ehkstremuma // Teorija verojatnostejj i ee prime-nenija. 1983. №1. S.129-136.

2. Ermakov S.M., Zhigljavskijj A.A., Kondratovich M.V. O sravnenii nekotorykh procedur sluchajjnogo poiska global'nogo ehkstremuma // Zhurn. vychisl. matematiki i mat. fiziki. 1989. T.29. №2. S.163-170.

3. Zhigljavskijj A.A., Zhilinskas A.G. Metody poiska global'nogo ehkstremuma. M.: Nauka, 1991. 248 s.

4. Zhigljavsky A., Zilinskas A. Stochastic Global Optimization. Berlin: Springer-Verlag, 2008. 262 p.

5. Spall J.C. Introduction to stochastic search and optimization: estimation, simulation, and control. New Jersey: Wiley, 2003. 618 p.

6. Spall J.C., Hill S.D., Stark D.R. Theoretical framework for comparing several stochastic optimization approaches // Probabilistic and randomized methods for design under uncertainty. L.: Springer, 2006. P.99-117.

7. Yin G. Rates of convergence for a class of global stochastic optimization algorithms // SIAM J. on Optimization. 1999. V.10. No.1. P.99-120.

8. Ingber L. Very fast simulated re-annealing // Math. Comput. Modelling. 1989. V.12. P.967-973.

9. Lopatin A.S. Metod otzhiga // Stokhasticheskaja optimizacija v informatike. 2005. Vyp.1. S.133-149.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10. Granichin O.N., Poljak B.T. Randomizirovannye algoritmy ocenivanija i optimizacii pri pochti proizvol'nykh pomek-hakh. M.: Nauka, 2003. 291 s.

11. Abakarov A.Sh., Sushkov Ju.A. Statisticheskoe issledovanie sluchajjnogo poiska // Matematicheskie modeli. Teorija i prilozhenija. Vyp.2. SPb.: Izd-vo NIIKh SPbGU, 2002. C.70-86.

12. Tikhomirov A.S., Nekrutkin V.V., Markovskijj monotonnyjj poisk ehkstremuma. Obzor nekotorykh teoreticheskikh rezul'tatov // Matematicheskie modeli. Teorija i prilozhenija. Vyp.4. SPb.: VVM, 2004. S.3-47.

13. Tikhomirov A.S. Ob odnorodnom markovskom monotonnom poiske ehkstremuma // Zhurn. vychisl. matematiki i mat. fiziki. 2006. T.46. №3. S.379-394.

14. Tikhomirov A.S. O bystrykh variantakh algoritma otzhiga (simulated annealing) // Stokhasticheskaja optimizacija v informatike. 2009. Vyp.5. S.65-90.

15. Tikhomirov A.S. O skorosti skhodimosti algoritma simulated annealing // Zhurn. vychisl. matematiki i mat. fiziki. 2010. T.50. №1. S.24-37.

16. Tikhomirov A.S. O bystrom variante algoritma otzhiga // Vestnik NovGU. Ser.: Tekhn. nauki. 2010. №60. S.53-56.

17. Tikhomirov A.S. Nizhnie ocenki skorosti skhodimosti mark-ovskogo simmetrichnogo sluchajjnogo poiska // Zhurn. vy-chisl. matematiki i mat. fiziki. 2011. T.51. №9. S.1630-1644.

18. Zhigljavskijj A.A., Zhilinskas A.G. Ukaz. soch. S.127.

19. Zhigljavsky A., Zilinskas A. Op. cit. P.116.

20. Ibid. P.118.

21. Tikhomirov A.S. O modelirovanii sluchajjnykh vektorov s monotonnymi simmetrichnymi plotnostjami // Vestnik NovGU. Ser.: Tekhn. nauki. 2004. №28. S.111-113.

i Надоели баннеры? Вы всегда можете отключить рекламу.