Научная статья на тему 'О переходных функциях алгоритма отжига'

О переходных функциях алгоритма отжига Текст научной статьи по специальности «Математика»

CC BY
121
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЛУЧАЙНЫЙ ПОИСК / АЛГОРИТМ ОТЖИГА / ГЛОБАЛЬНАЯ ОПТИМИЗАЦИЯ / СТОХАСТИЧЕСКАЯ ОПТИМИЗАЦИЯ / RANDOM SEARCH / SIMULATED ANNEALING ALGORITHM / GLOBAL OPTIMIZATION / STOCHASTIC OPTIMIZATION

Аннотация научной статьи по математике, автор научной работы — Тихомиров А. С.

Рассмотрена задача построения оптимальных алгоритмов отжига и показано, что такие поиски, оптимальные в достаточно широком классе методов оптимизации, имеют простую структуру переходных функций.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON THE TRANSITION FUNCTIONS OF THE SIMULATED ANNEALING ALGORITHM

The problem of constructing optimal simulated annealing algorithms is considered. It is shown that such methods being optimal in a very wide sense have a simple structure of the transition functions.

Текст научной работы на тему «О переходных функциях алгоритма отжига»

УДК 519.626

О ПЕРЕХОДНЫХ ФУНКЦИЯХ АЛГОРИТМА ОТЖИГА А. С. Тихомиров

ON THE TRANSITION FUNCTIONS OF THE SIMULATED ANNEALING ALGORITHM

A.S.Tikhomirov

Институт электронных и информационных систем НовГУ, Alexey.Tikhomirov@novsu.ru

Рассмотрена задача построения оптимальных алгоритмов отжига и показано, что такие поиски, оптимальные в достаточно широком классе методов оптимизации, имеют простую структуру переходных функций.

Ключевые слова: случайный поиск, алгоритм отжига, глобальная оптимизация, стохастическая оптимизация

The problem of constructing optimal simulated annealing algorithms is considered. It is shown that such methods being optimal in a very wide sense have a simple structure of the transition functions.

Keywords: random search, simulated annealing algorithm, global optimization, stochastic optimization

1. Введение

Пусть целевая функция f :Rd ^ R ограниченна снизу и измерима. Рассмотрим задачу оценки минимального значения целевой функции f с заданной точностью е (аппроксимация «по функции»). Один из способов решения этой задачи состоит в применении алгоритмов отжига (см. [1-14]). Алгоритмы отжига (simulated annealing) давно и успешно используются при решении сложных задач оптимизации и являются одними из самых знаменитых алгоритмов стохастической глобальной оптимизации. Тем не менее, существует мало теоретических результатов о скорости сходимости этих алгоритмов (см. [3-6]). Теоретическое исследование некоторых алгоритмов марковского случайного поиска экстремума выполнено в работах [11-16]. Данная работа является продолжением работ [15,16] и посвящена теоретическому исследованию свойств алгоритма отжига.

Построение конкретного варианта алгоритма отжига заключается в выборе переходных функций для получения новых точек в пространстве оптимиза-

ции и задании вероятностей перехода поиска в эти новые точки. Данная работа посвящена обсуждению выбора переходных функций. Показано, что можно сузить семейство используемых переходных функций, не теряя свойства оптимальности в смысле минимальности числа шагов поиска, при котором достижение искомого множества гарантировано с заданной надежностью.

Результаты данной работы распространяют результаты статьи [15], полученные для монотонного марковского поиска, на другой класс методов случайного поиска — алгоритмы отжига. Кроме того, здесь рассмотрен другой, широко используемый на практике класс переходных функций, применяемый, в частности, Л.Ингбером в методе сверхбыстрого отжига (very fast annealing) см. [7,8].

2. Постановка задачи

Назовем пространством оптимизации множество оптимизации X, снабженное метрикой р. Мы

ограничимся случаем X = Rd и следующими вариантами метрик p(x,y) для Rd :

( d

Ру (X У) =

N1/У

^ 11 Xn У n 1

V n=1

р» (x y)=max| xn - Уп |>

1<n<d

где у>1 — любое фиксированное число, х=(х1,..., ха)

и У=(уР...у).

Случайным поиском называется произвольная последовательность случайных величин {|п}п>0 со значениями в R1 . Следуя [17] приведем общую схему моделирования т шагов алгоритма отжига §0,§р...,^т. Алгоритм 1 Шаг 1. ^тс(-), п ^1. Шаг 2. ц ^Р(§ ,,-).

Гц , с вероятностью Q ,

Шаг 3. § ^

где

Qn =

§ р с вероятностью 1-Qn 1, если Д < 0,

[exp(-pпДп), если Дп > 0, Дп = f Слп) - f (§п-1), а величины Рп > 0 являются параметрами алгоритма.

Шаг 4. Если п<m , то п^п+1 и перейти к шагу 2, иначе STOP.

Здесь л(-) — начальное распределение, m — число шагов поиска, а п — номер итерации алгоритма. Обозначение цп ^Рп(§п-1,-) читается как «получить реализацию случайной величины цп с распределением Pn(§п-1, •)». Распределение Pn(§п1, •) зависит от номера шага п и «старой» точки поиска §п-1. В соответствии со структурой алгоритма 1, распределения Рп (§ р •) будем называть пробными переходными функциями, а случайные величины цп — пробными точками.

После получения новой пробной точки цп (на втором шаге алгоритма) на третьем шаге поиск или переходит в эту точку цп с вероятностью Qn, или

остается в старой точке поиска § р

Случайный поиск используем для оценки минимального значения целевой функции f с заданной точностью е (аппроксимация «по функции»). При аппроксимации по функции нас будет интересовать попадание поиска в множество

A ={xeRd: f (x) <inf f+е}. Может, однако, случиться так, что поиск {§п}п>0, оказавшись в множестве Ае на шаге п, выйдет из Ае на одном из последующих шагов. Чтобы избежать анализа таких эффектов, введем величины §n = argminf (§0),..., f(§n)}. Будем считать, что argminf(§0).,f(§n)}=§], где j =maxke{0,...,n}:f(§k)=

=min{f(§0),...,f(§n)}}. Случайная величина §*n, попав в множество А , из него больше не выйдет.

Мы рассмотрим одну характеристику скорости сходимости случайного поиска. Гарантирующее число шагов N(/,8^) определяется как такое минимальное число шагов поиска, при котором достижение множества А8 гарантировано с вероятностью большей, чем у. Иначе говоря,

N (f ,8, у)=тш{п > 0:Р(^е А) >У} Полагаем N(/,8,у) = +да в случае, когда Р(^ 6А8)<у при всех п > 0. Вероятность уе(0,1) будем называть надежностью.

Мы рассмотрим марковские алгоритмы случайного поиска, переходные функции Р (х,-) которых

обладают плотностями рп(х, у) вида

1 1 Рп(х, У)=П рпк (хк ,Ук)=П^п,к(| хк " Ук|), (1)

k=1

k=1

где х=(х1,...,х1) и у=(у1,...,у1), рпк — плотности в одномерном пространстве R, а gnk — невозрас-

тающие неотрицательные функции, определенные на множестве (0,+а>). Не умаляя общности будем считать, что функции gnk непрерывны слева. Функцию

gn к будем называть формой плотности рп к.

Пусть р — множество всех переходных функций с плотностями вида (1). Переходные функции такого вида широко используются на практике (см. [7,8,12]), и применяются, в частности, в методе сверхбыстрого отжига Ингбера.

В случае одномерного пространства R простейшим из таких распределений является равномерное распределение иа (х,-) в шаре радиуса а > 0 с

центром в точке xeR . Форма g=g(а) плотности такого распределения имеет вид

(а) 1 11, если 0 < r < а,

g (а)(г) = ~ра

2а 10, если r > а.

(2)

Рассмотрим теперь пространство Я . Пусть а = (а1,...,а1) и все ак>0. Через иа обозначим переходную функцию с плотностью

Р(а)(х,У)=Пg)(l Xk - Ук I)

(3)

k=1

где х=(х1,...,х1) и у=(у1,...,у1), а функции g(ак) задаются формулой (2). Здесь иа (х,-) — это равномерное распределение в 1-мерном прямоугольном параллелепипеде с центром в точке хеЯ1 и сторонами 2ак при к=1,...,1. Пусть П — множество всех переходных функций с плотностями вида (3). Ясно, что

U^P

3. Оптимальность простых поисков

Оказалось, что можно сузить семейство используемых переходных функций, не теряя свойства оптимальности в смысле минимальности числа шагов

поиска, при котором достижение множества Ле гарантировано с заданной надежностью.

Теорема 1. Пусть целевая функция f, точность е>0, надежность уе(0,1), начальное распределение п и параметры Рп > 0 вероятностей перехода в новые пробные точки фиксированы. Тогда справедливо равенство

шшММу): Рер}=шшММу): Рпе,,}. (4)

Равенство (4) показывает, что минимальное значение гарантирующего числа шагов при использовании переходных функций из множества р совпадает с минимальным значением гарантирующего числа шагов при использовании переходных функций из множества ц . Таким образом доказано, что переходные функции оптимального алгоритма отжига (т.е. поиска с минимальным значением гарантирующего числа шагов) имеют простую структуру. В качестве таких переходных функций можно использовать равномерные распределения в ^-мерных прямоугольных параллелепипедах.

Полученный теоретический результат имеет ясное прикладное значение, так как обосновывает выбор вида поиска, рекомендованного в ряде работ (как правило, прежнее обоснование было либо эмпирическим, либо основывалось на соображениях «простоты»).

1. Ермаков С.М., Жиглявский А.А. О случайном поиске глобального экстремума // Теория вероятностей и ее применения. 1983. №1. С.129-136.

2. Ермаков С.М., Жиглявский А.А., Кондратович М.В. О сравнении некоторых процедур случайного поиска глобального экстремума // Журн. вычисл. математики и мат. физики. 1989. Т.29. №2. С.163-170.

3. Zhigljavsky A., Zilinskas A. Stochastic Global Optimization. Berlin: Springer-Verlag, 2008. 262 p.

4. Spall J.C. Introduction to stochastic search and optimization: estimation, simulation, and control. New Jersey: Wiley, 2003. 618 p.

5. Spall J.C., Hill S.D., Stark D.R. Theoretical framework for comparing several stochastic optimization approaches // Probabilistic and randomized methods for design under uncertainty. L.: Springer, 2006. P.99-117.

6. Yin G. Rates of convergence for a class of global stochastic optimization algorithms // SIAM Journal on Optimization. 1999. V.10. №1. P.99-120.

7. Ingber L. Very fast simulated re-annealing // Math. Comput. Modelling. 1989. V.12. P.967-973.

8. Лопатин А.С. Метод отжига // Стохастическая оптимизация в информатике. 2005. Вып. 1. С.133-149.

9. Граничин О.Н., Поляк Б.Т. Рандомизированные алгоритмы оценивания и оптимизации при почти произвольных помехах. М.: Наука, 2003. 291 с.

10. Абакаров А.Ш., Сушков Ю.А. Статистическое исследование случайного поиска // Математические модели. Теория и приложения. Вып.2. СПб.: Изд-во НИИХ СПбГУ, 2002. C.70-86.

11. Тихомиров А.С., Некруткин В.В. Марковский монотонный поиск экстремума. Обзор некоторых теоретических результатов // Математические модели. Теория и приложения. Вып.4. СПб.: ВВМ, 2004. С.3-47.

12. Тихомиров А.С. О быстрых вариантах алгоритма отжига (simulated annealing) // Стохастическая оптимизация в информатике. 2009. Вып.5. С.65-90.

13. Тихомиров А.С. О скорости сходимости алгоритма simulated annealing // Журн. вычисл. математики и мат. физики. 2010. Т.50. №1. С.24-37.

14. Тихомиров А.С. Нижние оценки скорости сходимости марковского симметричного случайного поиска // Журн. вычисл. математики и мат. физики. 2011. Т.51. №9. С.1630-1644.

15. Тихомиров А.С. Об оптимальном марковском монотонном симметричном случайном поиске // Журн. вычисл. математики и мат. физики. 1998. Т.38. №12. С.1973-1982.

16. Тихомиров А.С. Об оптимальном марковском случайном поиске // Вестник НовГУ. Сер. Естеств. и техн. науки. 1999. №13. С.109-112.

17. Zhigljavsky A., Zilinskas A. Op. cit. P.118.

References

1. Ermakov S.M., Zhigliavskii A.A. O sluchainom poiske global'nogo ekstremuma [On the Random Search of Global Extremum]. Teoriia veroiatnostei i ee primeneniia - Theory of Probability and its Applications, 1983, no. 1, pp. 129-136.

2. Ermakov S.M., Zhigliavskii A.A., Kondratovich M.V. O srav-nenii nekotorykh protsedur sluchainogo poiska global'nogo ek-stremuma [Comparison of some random search procedures for a global extremum]. Zhurnal vychislitel'noi matematiki i matematicheskoi fiziki - Computational Mathematics and Mathematical Physics, 1989, vol. 29, no. 2, pp. 112-117.

3. Zhigljavsky A., Zilinskas A. Stochastic Global Optimization. Berlin, Springer-Verlag, 2008. 262 p.

4. Spall J.C. Introduction to stochastic search and optimization: estimation, simulation, and control. New Jersey, Wiley, 2003. 618 p.

5. Spall J.C., Hill S.D., Stark D.R. Theoretical framework for comparing several stochastic optimization approaches. Probabilistic and randomized methods for design under uncertainty. London, Springer, 2006, pp. 99-117.

6. Yin G. Rates of convergence for a class of global stochastic optimization algorithms. SIAM Journal on Optimization, 1999, vol. 10, no. 1, pp. 99-120.

7. Ingber L. Very fast simulated re-annealing. Mathl. Comput. Modelling, 1989, v. 12. pp. 967-973.

8. Lopatin A.S. Metod otzhiga [Simulated Annealing Method]. Stokhasticheskaia optimizatsiia v informatike, 2005, no. 1, pp. 133-149.

9. Granichin O.N., Poliak B.T. Randomizirovannye algoritmy ot-senivaniia i optimizatsii pri pochti proizvol'nykh pomekhakh [Randomized estimation and optimization algorithms in "almost arbitrary" noise]. Moscow, "Nauka" Publ., 2003. 291 p.

10. Abakarov A.Sh., Sushkov Iu.A. Statisticheskoe issledovanie sluchainogo poiska [Statistical Investigation of Random Search]. Matematicheskie modeli. Teoriia i prilozheniia [Mathematical Modeling: Theory and Applications], Research Studies Institute of Chemistry, St. Petersburg State University, St. Petersburg, 2002, no. 2, pp. 70-86.

11. Tikhomirov A.S., Nekrutkin V.V., Markovskii monotonnyi poisk ekstremuma. Obzor nekotorykh teoreticheskikh rezul't-atov [Markov Monotone Search for Extrema: Survey of Some Theoretic Results]. Matematicheskie modeli. Teoriia i prilozheniia [Mathematical Modeling: Theory and Applications], VVM Publ., St. Petersburg, 2004, no. 4, pp. 3-47.

12. Tikhomirov A.S. O bystrykh variantakh algoritma otzhiga (simulated annealing) [On some variants of the fast simulated annealing algorithms]. Stokhasticheskaia optimizatsiia v in-formatike, 2009, no. 5, pp. 65-90.

13. Tikhomirov A.S. Tikhomirov A.S. O skorosti skhodimosti al-goritma simulated annealing [On the convergence rate of the simulated annealing algorithm]. Zhurnal vychislitel'noi mate-matiki i matematicheskoi fiziki - Computational Mathematics and Mathematical Physics, 2010, vol. 50, no. 1, pp. 19-31.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

14. Tikhomirov A.S. Nizhnie otsenki skorosti skhodimosti mark-ovskogo simmetrichnogo sluchainogo poiska [Lower bounds on the convergence rate of the Markov symmetric random search]. Zhurnal vychislitel'noi matematiki i matematicheskoi fiziki - Computational Mathematics and Mathematical Physics, 2011, vol. 51, no. 9, pp. 1524-1538.

15. Tikhomirov A.S. Ob optimal'nom markovskom monotonnom simmetrichnom sluchainom poiske [Optimal Markov monotone symmetric random search]. Zhurnal vychislitel'noi matematiki i matematicheskoi fiziki - Computational Mathematics and Mathematical Physics, 1998, vol. 38, no. 12, pp. 1894-1902.

16. Tikhomirov A.S. Ob optimal'nom markovskom sluchainom poiske [On optimal Markov random search]. Vestnik of Novgorod State University. Ser.: Estestv. i tekhn. nauki - Vestnik NovSU. Issue: Natural and Engineering Sciences, 1999, no. 13. pp. 109-112.

17. Zhigljavsky A., Zilinskas A. Op. cit., p.118.

i Надоели баннеры? Вы всегда можете отключить рекламу.