Научная статья на тему 'Библиотека алгоритмов и программ аппроксимации многоэкстремальных функций'

Библиотека алгоритмов и программ аппроксимации многоэкстремальных функций Текст научной статьи по специальности «Математика»

CC BY
261
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕХНОГЕННЫЕ КОМПЛЕКСЫ / INDUSTRIAL COMPLEXES / МНОГОЭКСТРЕМАЛЬНЫЕ ФУНКЦИИ / MULTIEXTREMAL FUNCTIONS / АППРОКСИМАЦИЯ / APPROXIMATION / АЛГОРИТМЫ / ALGORITHMS / ПРОГРАММЫ / PROGRAMS

Аннотация научной статьи по математике, автор научной работы — Петрунина Елена Валерьевна, Соловьев Валерий Владимирович, Щербань Александр Борисович

Актуальность и цели. Современные условия функционирования и устойчивого развития региональных гетерогенных техногенных комплексов (РГКТ) определяют необходимость поиска инновационных походов к построению моделей и методов для создания универсальных библиотек алгоритмических и программных средств, которые можно применять для решения разнообразных задач оптимизации. Актуальность предлагаемого подхода к созданию адаптивной библиотеки обусловлена широкой областью практического применения аппроксимации многоэкстремальных функций. Материалы и методы. Был проведен анализ теоретических результатов работ А. Н. Колмогорова, В. И. Арнольда и Р. Хехт-Нильсена для выбора методов аппроксимации. Результаты. Представлены основные практические реализации алгоритмов аппроксимации многоэкстремальных функций, используемых при создании адаптивной библиотеки алгоритмических и программных средств. Реализация программ производилась в системе распределенных вычислений. Выводы. Рассмотрен подход к разработке алгоритмических и программных средств решения широкого класса задач аппроксимации. Материалы статьи являются обобщением работ авторов по данному направлению, выполненных в период с 1990 по 2014 г. В настоящее время проводится отработка средств адаптивной библиотеки с использованием облачных технологий параллельных вычислений.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Петрунина Елена Валерьевна, Соловьев Валерий Владимирович, Щербань Александр Борисович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

LIBRARY OF ALGORITHMS AND PROGRAMS APPROXIMATION OF MULTIEXTREMAL FUNCTIONS

Background. The relevance and purpose of Modern conditions of functioning and sustainable development of the regional anthropogenic heterogeneous systems (RGCT) define the need of finding innovative approaches to building models and methods for creating universal libraries of algorithmic and software tools that can be applied to solve various optimization problems. Relevance of the proposed approach to creation of the adaptive library associated with a broad area of practical application of the approximation of multiextremal functions (AMF). Materials and methods. An analysis was conducted of the theoretical results of A. N. Kolmogorov, V. I. Arnold and R. Hecht-Nielsen for the choice of methods of approximation. Results. This article presents the main practical implementation of the approximation algorithms of multiextremal functions are used to create adaptive library algorithms and software tools. Implementation of programs was carried out in the distributed computing system. Conclusions. The approach to the development of algorithmic and software tools for solving a wide class of approximation problems. Materials of the article are generalizations of the authors ' works in this direction, made in the period from 1990 to 2014, currently under test means of the adaptive library with the cloud, parallel computing.

Текст научной работы на тему «Библиотека алгоритмов и программ аппроксимации многоэкстремальных функций»

УДК 629.7.072.8

БИБЛИОТЕКА АЛГОРИТМОВ И ПРОГРАММ АППРОКСИМАЦИИ МНОГОЭКСТРЕМАЛЬНЫХ ФУНКЦИЙ

Е. В. Петрунина, В. В. Соловьев, А. Б. Щербань

LIBRARY OF ALGORITHMS AND PROGRAMS APPROXIMATION OF MULTIEXTREMAL FUNCTIONS

E. V. Petrunina, V. V. Solovyev, A. B. Shcherban

Аннотация. Актуальность и цели. Современные условия функционирования и устойчивого развития региональных гетерогенных техногенных комплексов (РГКТ) определяют необходимость поиска инновационных походов к построению моделей и методов для создания универсальных библиотек алгоритмических и программных средств, которые можно применять для решения разнообразных задач оптимизации. Актуальность предлагаемого подхода к созданию адаптивной библиотеки обусловлена широкой областью практического применения аппроксимации многоэкстремальных функций. Материалы и методы. Был проведен анализ теоретических результатов работ А. Н. Колмогорова, В. И. Арнольда и Р. Хехт-Нильсена для выбора методов аппроксимации. Результаты. Представлены основные практические реализации алгоритмов аппроксимации многоэкстремальных функций, используемых при создании адаптивной библиотеки алгоритмических и программных средств. Реализация программ производилась в системе распределенных вычислений. Выводы. Рассмотрен подход к разработке алгоритмических и программных средств решения широкого класса задач аппроксимации. Материалы статьи являются обобщением работ авторов по данному направлению, выполненных в период с 1990 по 2014 г. В настоящее время проводится отработка средств адаптивной библиотеки с использованием облачных технологий параллельных вычислений.

Ключевые слова: техногенные комплексы, многоэкстремальные функции, аппроксимация, алгоритмы, программы.

Abstract. Background. The relevance and purpose of Modern conditions of functioning and sustainable development of the regional anthropogenic heterogeneous systems (RGCT) define the need of finding innovative approaches to building models and methods for creating universal libraries of algorithmic and software tools that can be applied to solve various optimization problems. Relevance of the proposed approach to creation of the adaptive library associated with a broad area of practical application of the approximation of multiextremal functions (AMF). Materials and methods. An analysis was conducted of the theoretical results of A. N. Kolmogorov, V. I. Arnold and R. Hecht-Nielsen for the choice of methods of approximation. Results. This article presents the main practical implementation of the approximation algorithms of multiextremal functions are used to create adaptive library algorithms and software tools. Implementation of programs was carried out in the distributed computing system. Conclusions. The approach to the development of algorithmic and software tools for solving a wide class of approximation problems. Materials of the article are generalizations of the authors ' works in this direction, made in the period from 1990 to 2014, currently under test means of the adaptive library with the cloud, parallel computing.

Key words: industrial complexes, multiextremal functions, approximation, algorithms, programs.

В современной практике обеспечения устойчивого развития региональных гетерогенных техногенных комплексов (РГКТ) используются алгоритмические и программные средства, реализующие различные модели и методы решения практических задач [1]. В последние годы наметилась тенденция разработки обобщенных подходов и моделей для создания универсальных библиотек, которые можно применять для решения разнообразных задач идентификации и оптимизации [2, 3]. Актуальность создания адаптивной библиотеки с использованием предлагаемого подхода обусловлена высокой сложностью решаемых задач а также широкой областью практического применения аппроксимации многоэкстремальных функций (АМФ), важной в решении задач дискретной оптимизации и идентификации, к которым сводятся модели многих реальных процессов [4-6].

Цель создания библиотеки - обеспечить исследователей РГКТ универсальными и удобными в использовании средствами для решения широкого круга задач, связанных с поиском оптимальных параметров моделей.

В настоящей работе рассматривается методика создания библиотеки точных, приближенных, эвристических, метаэвристических и гиперэвристических алгоритмов, разработанная авторами для решения региональных задач с использованием современных облачных технологий программирования и параллельных вычислений.

В данном случае под гиперэвристикой понимается эвристический метод поиска, обеспечивающий формализацию выбора, комбинирования, обобщения или адаптации нескольких более простых эвристик или их частей при решении вычислительной задачи. В библиотеке используются гиперэвристики, основанные на выборе некоторого количества простых эвристик, каждая из которых имеет свои слабые и сильные места.

Для объектов, относящихся к РГКТ, решаются следующие основные задачи:

- многокритериальная оптимизация, идентификация и распознавание образов [6];

- обработка результатов экологического контроля и мониторинга [5];

- обработка результатов мониторинга состояния здоровья личного состава, обслуживающего объекты инфраструктуры РГТК;

- компрессия и кодирование персональных данных [7].

В соответствии с принципом «оптимальности» на практике при моделировании объектов и процессов РГТК ограничиваются поиском не оптимальных, а достаточно хороших решений, обеспечивающих эффективность решений и минимизацию затрат на их поиск. Методы аппроксимации многоэкстремальных функций многих переменных представляют инструменты для поиска таких компромиссов. Популярность применения методов аппроксимации в этом случае вызвана рядом причин, основными из которых являются:

- простота и ясность концепций Колмогорова, лежащих в основе методик, обусловливают относительно несложную реализацию;

- возможность проведения аналогий с задачами о ранце позволяет использовать точные, приближенные, эвристические и метаэвристические алгоритмы для решения широкого круга практических задач;

- высокий уровень абстракции и возможность получения заданной точности решения позволяют на основе базовых методов получать более эффективные гиперэвристические методы аппроксимации.

Классическая информационная технология аппроксимации в укрупненном виде состоит из следующих основных этапов:

- получение исходных расчетных и экспериментальных данных;

- первичная обработка и формирование массива данных;

- назначение областей изменения параметров аппроксимации и областей пространства аргументов;

- выбор методов аппроксимации и генерация рабочих алгоритмов выполнения самой аппроксимации (основной этап технологии);

- оценка точности.

В результате многолетней научной работы А. Н. Колмогорова, В. И. Арнольда и Р. Хехт-Нильсена был получен целый ряд важных теоретических результатов для выбора методов аппроксимации:

- теорема о возможности представления непрерывных функций нескольких переменных суперпозициями непрерывных функций меньшего числа переменных (1956) [8];

- теорема о представлении любой непрерывной функции трех переменных в виде суммы функций не более двух переменных (1957) [9];

- теорема о представлении непрерывных функций нескольких переменных в виде суперпозиций непрерывных функций одного переменного и сложения (1957) [10];

- теорема Хехт-Нильсена доказывает представимость функции многих переменных достаточно общего вида с помощью двухслойной нейронной сети с прямыми полными связями с Л-компонентами входного сигнала, 2Л + 1-компонентами первого («скрытого») слоя с заранее известными ограниченными функциями активации (например, сигмоидальными) и М-компонентами второго слоя с неизвестными функциями активации (1987) [11].

Основная схема алгоритмов аппроксимации МЭФ, основанная на этих теоремах, изложена в работе А. Т. Ерохина (1991) [12].

В рассматриваемом подходе используется алгоритм аппроксимации по

известным координатам экстремумов х, = (,х2,...,хП ), а также их значения

/(х, | = у,, у = 1,2,...,т реализации многоэкстремальной функции многих

переменных (ММЭФ) / (х), х = (х1,х2,...,хп ), п - размерность пространства [12]. В качестве функций, входящих в суперпозицию, выбираются сферически симметричные функции ^(х), например:

^(х) = ехр

1 + х

1

-12 '

Интерполяционный полином Эрмита определяется в виде

т

У =1

где а}, Ру, х, - параметры, подлежащие определению.

, п .

р , = (( ,р2 ,..., Р,,..., РП ) = ((, X 2,..., х),..., хП ), ' = 1,2,...,

В общем случае эти параметры задаются следующими матрицами:

Р1 р2 ... РП Р2 Р2 .. Р2

а1

А = а2 , в =

ап

р1 р2 рп

ГШ гт ^п

х =

Хо Хо

Х1 х2

т т

Всего подлежит определению т (2п +1) неизвестных. Фиксируя параметры Р; , можно решать систему т (п +1) уравнений с т (п +1) неизвестными:

ф(Х; )

= а,

— ф(Х; ) = 0. Эх' 1

Можно построить различные достаточно эффективные, как показывает практика, итерационные процедуры поиска решения этой системы [12], например:

а ()

-1

(а, - ар )

'(р+1) ' 1

х; = х, —- • g1, рг

;

р;

П-Л(,р)

(0)

7 * ' — .

при начальных условиях ау = ак, х(0 = хк , к = 1,2,...,т , где gjj (х) -функция, обратная логарифмической производной функции ^(х) по аргументу х,;

Л(р) = £а(р)¥р ; л,) = ¿^^(р ; , =¥(р, (х, -х^

, =1

,=1

X' (х) - строго возрастающая монотонная функция Х((х| = 0) = 0. X(х| = 1) = 1, функции у(х) и X' (х) вычислены в точке х = Рг- (х, - х,р)

Рассмотрим две основные практические реализации алгоритмов аппроксимации МЭФ, используемые для моделирования экспериментальных данных [5]:

- получение исходных экспериментальных и расчетных данных;

- аппроксимация на постоянной сетке (алгоритм последовательных приближений, использующий метод дихотомии поиска значений Р');

- аппроксимация на переменной сетке (алгоритм случайного поиска, использующий метод Монте-Карло для поиска значений ai, , xi).

Суть алгоритма последовательных приближений заключается в итерационном выполнении следующих процедур:

- определение max f (x,) - максимумов функции f (xt) и координат этих максимумов x{ max ;

- выбор «подходящих» функций x) е Т (функций, отражающих моделируемый процесс или структуру);

- определение параметров комплекта основных функций а0j, a1 j и а2j ;

- проверка выполнения критерия аппроксимации

( ^

Vf е FV¥kj) е K f - £ vk;) ^

V к

означающего совпадение значений оригинала и изображения в узлах принятой сетки с точностью до е.

Как следует из алгоритма аппроксимации, число функций в комплекте

K (^k) = {vkj)(Xj )J может быть произвольным (в зависимости от требуемой точности), а параметры а0j и a1j комплекта основных функций будут строго

соответствовать выбранной сетке аппроксимации. Такое соответствие может искажать отображение реальных физико-химических процессов, поэтому следует допустить смещение и изменение значений экстремумов основных функций ^k (x), а также изменение критерия аппроксимации.

Возможность варьировать эти параметры обеспечивается в алгоритме аппроксимации на переменной сетке, который заключается в последовательном выполнении следующих процедур:

- определение S = {maxr f (xi)} - множества всех максимумов функции f (xi) и координат этих максимумов ximax , где r = 1,2,...,m , m - количество максимумов;

- выбор «подходящих» функций (x) еТ (функций, отражающих моделируемый процесс или структуру) для каждого f (xi) е S;

- составление системы 3n нелинейных уравнений для определения параметров основных функций ^ r (x) еТ по принятому критерию;

- решение системы и определение матрицы параметров A(K,). Пример результата выполнения алгоритма в табличном процессоре Microsoft Excel для куска реализации a(t) на интервале t = [0...3,8] при допол-

(( Л 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

нительном критерии Vf е Fе K fi - ^) ^ min представлен

VV K ) )

на рис. 1 (координаты относительные).

Рис. 1. Поиск а3г- методом дихотомии для экспоненциальной функции

на интервале [0:3,8]

В соответствии с алгоритмом положения экстремумов основных функций могут не совпадать с исходной сеткой, а в процессе аппроксимации будут появляться дополнительные узлы, связанные с этими экстремумами. В качестве дополнительного может быть принят критерий минимума средне-квадратического отклонения сеточных значений оригинала и изображения

Vf е FV¥(/) е K ¿1 f - X ) ^ min

i=i V к

Пример результата выполнения алгоритма в табличном процессоре Microsoft Excel для всей реализации a(t) на интервале t = [0...66,5] представлен на рис. 2.

При необходимости выполнение алгоритма может быть закончено на первой итерации без последующей проверки точности аппроксимации в отдельных узлах сетки. Такая реализация применяется в методах прогноза и коррекции при решении различных задач исследования динамики гетерогенных структур [6].

Если провести аналогию между интерполяционным полиномом Эрмита и содержимым ранца, то можно использовать большой теоретический материал, накопленный при решении связанных с соответствующими постановками проблем.

Существует множество разновидностей задачи о ранце, которые привели к ее применению в математике, информатике и в криптографии. Задача

о ранце относится к классу КР-полных задач. Поэтому при решении задачи о ранце всегда нужно выбирать между точными алгоритмами, которые не применимы для «больших» рюкзаков, и приближенными, которые работают быстро, но не обеспечивают оптимального решения задачи.

Рис.2. Фрагмент результата аппроксимации по всей экспериментальной реализации МЭФ

Для аппроксимации ММЭФ в постановках, аналогичных задаче о ранце, применяются соответствующие точные (полный перебор, метод ветвей и границ), приближенные (жадный алгоритм, случайный поиск и т.п.) и метаалго-ритмы (генетические алгоритмы, имитация отжига, поиск с запретами и т.п.).

В ходе реализации метаэвристики часто возникает задача ее тестирования или нахождения поведенческих характеристик (описывающих процесс поиска решения). Примером такой характеристики служит зависимость среднего времени нахождения оптимального решения (или, например, решения, отстоящего от оптимума не более чем на 10 %) от размерности задачи. Особый интерес представляет ответ на вопрос об эффективности разработанных метаэвристик при решении различных подклассов решаемой задачи. Тестирование позволяет выявить слабые места и сравнить полученные результаты с результатами аналогов.

Основной особенностью рассматриваемой библиотеки является разделение программного кода на две части: универсальную, или проблемно-независимую, общую для всех решаемых задач, и специализированную, или проблемно-зависимую, отражающую специфику конкретной задачи. Эффективная реализация проблемно-независимой части определяется используемыми средствами компьютерной математики, а реализация (точнее, модификация) проблемно-зависимой части зависит от квалификации пользователя библиотеки [13].

Реализация программ производилась в системе распределенных вычислений (grid), образованной средствами кафедры ИВТ Пензенской архитектурно-строительной академии и Центра «Вымпел» Академии наук Республики Казахстан. Низкая доступность каждого узла системы, т.е. невозможность гарантировать его работу в заданный момент времени (узлы подключаются и отключаются в процессе работы), определяла разбиение процедур поиска решения на ряд не зависимых друг от друга процессов. Аппаратно-программная конфигурация системы следующая: количество компьютеров в системе - до 40; процессоры - Intel(R) Соге(ТМ) i5 CPU M 430@ 2.27GHz by GenuineIntel 226Mhz; Total Usable Physical Memory 3885MB; сеть - 100 Мбит Ethernet; операционная система - Linux 2.6.25-gentoo-r7; MPI - LAM 7.1.2.

Материалы статьи являются обобщением работ авторов по данному направлению, выполненных в период с 1990 по 2014 г., и отражают их личный вклад в решаемые задачи исследования алгоритмов аппроксимации и анализ полученных результатов исследований. Первая реализация алгоритмов проведена в филиале «Восход» МАИ при решении задач обработки экспедиционных данных экологического мониторинга районов падения отделяемых фрагментов ракет-носителей (отчет о НИР гос. рег. № 01.90.0009924). В настоящее время проводится отработка средств адаптивной библиотеки для облачных технологий параллельных вычислений.

Список литературы

1. Динамика гетерогенных структур : в 3 т. Т. 1. Эволюция ракетно-космических гетерогенных структур / под ред. В. В. Смогунова. - Пенза : Изд-во Пенз. гос. ун-та, 2001. - 311 с.

2. Зубков, А. Ф. Структурно-синтаксический подход к поиску альтернатив управления сложными системами / А. Ф. Зубков, А. Б. Щербань, И. А. Семенов // Научно-технические ведомости Санкт-Петербургского государственного политехнического университета. Информатика. Телекоммуникации. Управление. - 2010. -№ 3.- С. 45-49.

3. Тюрин, М. В. Структурный подход к анализу состояний сложных систем / М. В. Тюрин, А. Б. Щербань, В. В. Соловьев, Е. Н. Мурашкина // Современные информационные технологии. - 2011. - № 14. - С. 72-76.

4. Лапшин, Э. В. Методы аппроксимации функций многих переменных авиационных комплексов / Э. В. Лапшин // Надежность и качество сложных систем. -2013. - № 4. - С. 14-20.

5. Соловьева, Е. В. Метод экспресс-обработки экспедиционных данных о загрязнении почв / Е. В. Соловьева, Б. П. Селенко, А. Н. Кошев // Measuring and computing devices in technological processes, International scientific-technical magazine. - 2002. - № 1. - С. 175-179.

6. Петрунина, Е. В. Алгоритмы функциональных преобразований в задачах поиска оптимальных параметров техногенных структур / Е. В. Петрунина // Оптимальные методы решения научных и практических задач : материалы Междунар. науч. конф. - Таганрог : Антон, ТРТУ, 2005. - Ч. 3. - С. 57-61.

7. Петрунина, Е. В. Применение функций класса сигмоид для кодирования текстовой информации / Е. В. Петрунина, М. Ю. Михеев, А. А. Папко, А. Б. Щербань // XXI век: итоги прошлого и проблемы настоящего плюс. - 2014. - № 1 (3). -С. 169-176.

8. Колмогоров, А. Н. О представлении непрерывных функций нескольких переменных суперпозициями непрерывных функций меньшего числа переменных / А. Н. Колмогоров // Доклады АН СССР. - 1956. - Т. 108, № 2. - С. 179-182.

9. Арнольд, В. И. Офункциях трех переменных / В. И. Арнольд // Доклады АН СССР. - 1957. - Т. 114, № 4. - С. 679-681.

10. Колмогоров, А. Н. О представлении непрерывных функций нескольких переменных в виде суперпозиций непрерывных функций одного переменного и сложения / А. Н. Колмогоров // Доклады АН СССР. - 1957. - Т. 114. - С. 953-956.

11. Hecht-Nielsen, R. Kolmogorov's Mapping Neural Network Existence Theorem / R. Hecht-Nielsen // IEEE First Annual Int. Conf. on Neural Networks. - San Diego, 1987. - Vol. 3. - P. 11-13.

12. Ерохин, А. Т. Аппроксимация реализаций случайных процессов ядрами типа Файера / А. Т. Ерохин // Геофизические методы мониторинга природных сред. -М. : ИОФ АН СССР, 1991. - С. 115-125.

13. Цыганов, А. В. Исследование эффективности библиотеки MaLLBa на примере задач максимальной выполнимости / А. В. Цыганов, О. И. Булычев, Д. С. Лавыгин // Программные продукты и системы. - 2009. - № 3.- С. 116-120.

Петрунина Елена Валерьевна

кандидат технических наук, доцент, докторант,

Пензенский государственный университет E-mail: [email protected]

Petrunina Elena Valeryevna candidate of technical sciences, associate professor, doctoral student, Penza State University

Соловьев Валерий Владимирович

доктор технических наук, доцент E-mail: [email protected]

Solovyov Valery Vladimirovich doctor of technical sciences, associate professor

Щербань Александр Борисович кандидат технических наук, доцент, кафедра информационных технологий и систем,

Пензенский государственный технологический университет E-mail: schas999@ yandex.ru

Shcherban Alexander Borisovich candidate of technical sciences, associate professor, sub-department of information technology and systems, Penza State Technological University

УДК 629.7.072.8 Петрунина, Е. В.

Библиотека алгоритмов и программ аппроксимации многоэкстремальных функций / Е. В. Петрунина, В. В. Соловьев, А. Б. Щербань // Модели, системы, сети в экономике, технике, природе и обществе. - 2016. - № 2 (18). - С. 242-250.

i Надоели баннеры? Вы всегда можете отключить рекламу.