Численный метод аппроксимации множества решений системы нелинейных неравенств
Ю.Г. Евтушенко1, М.А. Посыпкин2, Л.А. Рыбак3, А.В. Туркин4
Аннотация—В работе представлен метод приближенной оценки множества решений системы нелинейных неравенств с предопределенной точностью, основанный на концепции неравномерных покрытий. Предложены два подхода к построению аппроксимаций: с использованием глобальной оптимизации для поиска решения на отдельном параллелепипеде покрытия и с применением приближенных оценок максимума и минимума. Выделены их недостатки: время вычислений, в случае использования глобальной оптимизации и точность аппроксимации, в случае применения приближенных оценок экстремумов функции на параллелепипеде. Эффективность предложенных методов иллюстрируется на задаче нахождения рабочей области планарного робота параллельной структуры.
Ключевые слова—Метод неравномерных покрытий, системы нелинейных неравенств, аппроксимация, рабочая область робота
I. ВВЕДЕНИЕ Существует много задач, решениями которых являются некоторые множества. Например, при многокритериальной оптимизации ищется множество Парето. В задачах управления динамическими объектами строятся области достижимости. При решении систем равенств и неравенств может возникнуть необходимость нахождения всех решений или их аппроксимации. В [1], [2], [3] рассмотрена аппроксимация выпуклых тел с помощью многогранников. Приближение области достижимости динамических систем исследовалось в [4], [5]. В [6] предложена аппроксимация образа компактного множества при отображении с помощью понятия е-эффективной оболочки и дан метод ее построения. Следует также отметить работы, посвященные построению расчетных сеток в областях сложной формы [7], [8].
В данной работе представлен метод приближенной оценки множества решений системы нелинейных неравенств с предопределенной точностью. Поиск множества решений осуществляется с использованием концепции
*Работа выполнена при поддержке Российского научного фонда, проект 16-19-00148
1Ю.Г. Евтушенко — директор Вычислительного центра им. А.А. Дородницына Федерального исследовательского центра «Информатика и управление» Российской академии наук. [email protected]
2 М.А. Посыпкин — заведующий отделом прикладных проблем оптимизации Вычислительного центра им. А.А. Дородницына Федерального исследовательского центра «Информатика и управление» Российской академии наук. [email protected]
3Л.А. Рыбак — профессор кафедры Технологии машиностроения Белгородского государственного технологического университета им. В. Г. Шухова [email protected]
4А.В. Туркин — младший научный сотрудник Вычислительного центра им. А.А. Дородницына Федерального исследовательского центра «Информатика и управление» Российской академии наук; доцент кафедры Вычислительной техники Национального исследовательского университета «МИЭТ». [email protected]
неравномерных покрытий. Приводятся два подхода к оценке аппроксимационных множеств: с использованием процедуры глобальной оптимизации и без нее, с применением приближенных оценок. С помощью предлагаемого метода строится внешнее и внутреннее аппрокси-мационные множества и рассматриваются их свойства. Внутреннее аппроксимационное множество включается во множество решений системы неравенств, а внешнее включает его. Оба множества представлют собой объединения п-мерных параллелепипедов.
II. ПОСТАНОВКА ЗАДАЧИ
Рассматривается задача определения и описания множества X решений системы неравенств общего вида:
9j (х) < 0,j G 1,m,
ai < xi < bi, i G 1,n.
(1)
Пусть каждая функция д^ : М" ^ £ 1,т удовлетворяет условию Липшица, т.е. для любых х,у £ Р выполнены неравенства:
\dj(x) - 9jШ < Lj||x - y\\, j € 1,m,
(2)
где Р = [а, Ь] = {х : а^ < х^ < Ъ^, г £ 1, п} — п-мерный параллелепипед. Диаметром параллелепипеда Р будем называть величину ¿(Р) = ||Ъ — а||.
Заметим, что система неравенств (1) имеет то же множество решений, что и следующая система:
ф(х) < 0,
ai < Xi < bi, i G 1,n,
(3)
где ф{х) = maXj.=Tm 9j(x)-
Требуется оценить множество X С P С R" решений системы (1) с некоторой заданной точностью.
III. ТЕОРЕТИЧЕСКОЕ ОБОСНОВАНИЕ Решение задачи будем искать, используя покрытие множества P [9], под которым будем понимать совокупность n-мерных параллелепипедов Pj, i G l,k таких что:
P Ç ^ieikPi.
(4)
Для каждого из параллелепипедов покрытия выполняется одно из трех условий:
max ф(х) < 0, xePi
min ф(х) > 0, xePi
(5)
(6)
условия (5), (6) не выполнены и d(Pi) < S, (7)
где 6 — заданная положительная величина, определяющая точность аппроксимации.
Введем следующие обозначения для объединений параллелепипедов: QI = иге1 Рг — объединение таких параллелепипедов, для которых выполняется утверждение (5), I С 1,к — множество индексов этих параллелепипедов; QE = игеЕРг — объединение таких параллелепипедов, для которых выполняется утверждение (6), Е С 1,к — множество их индексов; Qм = игемРг — объединение параллелепипедов, для которых выполняется утверждение (7), М С 1,к — множество индексов таких параллелепипедов.
Из определения множества решений вытекает справедливость следующего утверждения.
Утверждение 1: Для того, чтобы параллелепипед Рг, г £ 1,к, был подмножеством множества X решений системы (1) (не содержал решений системы (1)) необходимо и достаточно, чтобы выполнялось условие (5) (выполнялось условие (6)).
Утверждение 2: Справедливы включения
Qi С X С Q! и Q
M
А С Еп. Рассмотрим множество X= X\В(дХ, 6), полученное из X удалением границы с ее 6-окрестностью, а также множество X= X и B(дX, 6).
Следствие 1: Если множество X регулярно, то справедливо включение
Qm С B(dX,ö).
(9)
Доказательство: Рассмотрим один из параллелепипедов, г £ М, Рг С Qм. Согласно утверждению 4 найдется точка ж £ Рг П дX. Так как ¿(Рг) < 6, то Рг С В6). ■ Множества QI и QI и Qм являются внутренней и внешней аппроксимацией множества X. Представление о точности аппроксимации дает следующая Теорема 1: Если множество X регулярно, то
XС Qi С X С Qi и Qm С X
+s
(10)
(8)
Доказательство: Выполнение включения QI С X очевидно ввиду выполнения условия (5) для всех параллелепипедов, включенных в Ql. Рассмотрим второе включение: X С QI и Qм. Предположим, что включение не выполнено. Тогда найдется точка ж £ X, которая не принадлежит ни QI, ни Qм, а, следовательно, ж £ QE. Учитывая условие (6) и утверждение 1, можно заключить, что ж £ X, что приводит к противоречию с предположением. ■
Утверждение 3: Пусть дX — граница множества X. Тогда справедливо включение дX С Qм.
Доказательство: Предположим, что это не так, т.е. найдется точка ж £ дX, не принадлежащая Qм, а, следовательно, ж £ QI или ж £ QE. Исходя из условий (5) и (6) ф(ж) = 0. Очевидно, что для любой точки ж £ дX выполняется ф(ж) = 0, что приводит к противоречию. ■ Определение. Множество X будем называть регулярным, если его граница совпадает со множеством решений уравнения ф(ж) =0.
Утверждение 4: Пусть дX граница регулярного множества X, тогда любой параллелепипед, для которого выполняется условие (7), содержит точку границы.
Доказательство: Рассмотрим такой параллелепипед Р' , для которого справедливо (7). Невыполнение условия (5) приводит к тому, что найдется точка ж £ Р' , для которой ф(ж) > 0. Из невыполнения условия (6) следует, что найдется такая точка у £ Р', что ф(у) < 0. Из непрерывности функции ф и теоремы о промежуточном значении вытекает, что найдется такая точка г £ [ж, у], для которой значение функции ф(г) = 0. Так как множество Р' — выпукло, то г £ Р'. Учитывая регулярность множества решений X, получаем, что г — граничная точка. ■
Введем следующие обозначения и понятия: В (а, 6) = {ж £ Яп : \\ж — а|| < 6} — 6-окрестность точки а £ Яп, В (А, 6) = иаеАВ(а, 6) — 6-окрестность множества
Доказательство: Справедливость включений X— С QI и QI и Qм С X+ непосредственно вытекает из следствия 1. Из этого факта и утверждения 2 следует утверждение теоремы. ■ Для проверки справедливости неравенств (5), (6) требуются процедуры нахождения глобального максимума и минимума функции ф(ж) на п-мерном параллелепипеде. Рассмотрим альтернативный вариант, основанный на использовании верхних и нижних оценок. Справедливо следующее
Утверждение 5: Функция ф(ж) является липшицевой с константой Ь = тах^у-^ Ь^.
Доказательство:
Пусть числа к, I £ 1,т — индексы функций, значения которых для точек ж и у соответственно являются максимальными: дк (ж) = ф(ж), дь(у) = ф(у).
В случае, когда к = I, утверждение верно, что непосредственно следует из (2): \дк(ж) — дь(у)\ < Ьк\\ж — у\\ = Ьь\\ж — у\\ < Ь\\ж — у\\.
Для случая к = I рассмотрим следующие варианты: (1) дк(ж) > д1 (у) > 0; (2) 0 > дь(у) > дк(ж); (3) дк(ж) > дь (у), дк (ж) > 0, д1(у) < 0.
1) Пусть дк (ж) > дь (у) > 0, тогда \д(ж) — д(у)\ = \дк(ж) — дь(у)\ < \дк(ж) — дк(у)\ < Ьк\\ж — у\\.
2) Пусть 0 > дь(у) > дк (ж), тогда \д(ж) — д(у)\ =
\дк(ж) — дь(у)\ < \дь(ж) — дь(у)\ < Ьь\\ж — у\\.
3) Пусть дк (ж) > дь(у), дк(ж) > 0, дь (у) < 0, тогда \д(ж) — д(у)\ = \дк(ж) — дь(у)\ < \дк(ж) — дк(у)\ < Ьк\\ж — у\\
Анатогично рассматриваются три следующих варианта: (1) дь(у) > дк (ж) > 0, (2) 0 > дк (ж) > дь(у), (3) дь (ж) > дк (у), дь(ж) > 0, дк (у) < 0. Следовательно, \дк(ж) — дь(у)\ < тах(Ьк,Ьь) < Ь\\ж —
у\\. ■
Свойство липшицевости позволяет построить миноранту Цг(ж) и мажоранту Мг(ж) функции ф(ж) на параллелепипеде Рг = [а(г),Ь(г)]:
цг(ж) = ф(с(г))—Ь ж — с(г) ,Мг(ж) = ф(с(г))+Ь ж — с(г)
где с(г) = у (а(г) + Ь(г)) — центр параллелепипеда Рг.
Очевидно /лг(ж) < ф(ж) < Мг(ж) при ж £ Рг. Сформулируем условия на покрывающие множества с использованием эти оценок.
Для каждого из параллелепипедов покрытия выполняется одно из трех условий:
max Mi(x) < 0, xePi
min ui(x) > 0,
xePi
(11) (12)
условия (11), (12) не выполнены и (Р.\) < 5, (13)
где 5 — заданная положительная величина, определяющая точность аппроксимации.
Заметим, что экстремумы миноратны и мажоранты находятся аналитически по формулам
max Mi(x) = ф (c(iA + Ld(Pi)/2, xePi V /
min ni(x) = ф (c(iA - Ld(Pi)/2,
x Pi
(14)
что делает условия (11), (12) легко проверяемыми.
Очевидно, что утверждения 2 и 3 остаются справедливыми, в отличие теоремы 1, доказательство которой становится неверным при замене функции ф(х) на ее оценки.
Для е > 0 определим £-границу множества X, множество деХ = {х £ М" : —е < ф(х) < е}.
Лемма 1: Пусть параллелепипед Pi удовлетворяет условию (13). Тогда ^ £ деХ, где е = 5Ь/2.
Доказательство: Так как Pi удовлетворяет условию (13), то ф (е«) — ЪЗР)/2 < 0 < ф )е«) + Ы(Р)/2. Следовательно —Ьй(Р^)/2 < ф (е^У{ < Ы(Р{)/2. По условию леммы ¿(Р.\) < 5 и е = 5Ь/2. Следовательно —£ < ф (е^У) < е. Тем самым лемма доказана. ■
Следствие 2: Множество Qм является подмножеством В(5, деХ), где е = 5Ь/2.
Рассмотрим множество Х-8 = X \ В(5,деХ), и множество X+8 = Х и В(5, деХ), где е = 5Ь/2.
Используя введенные понятия, можно сформулировать следующий аналог теоремы 1.
Теорема 2: Справедливы включения
X— Ç Qj Ç X Ç Qj U Qm Ç X,
:+s,
Входные данные: P, S Выходные данные: QI, QE, QM
T (1) := P ; Sc := d(P); Lc := 1;
Qi := 0; Qe Пока S,
Nl.
0;
= 0; Qm c> S :
:= T (все вершины уровня Lc);
Для каждого
Pq ^ Nq ;
Nq G Nlc
Если ттхеР ф(х) > 0 , тогда
N := (РЧч, ^е") QE := QE и Pq;
продолжить с другой вершиной из Конец условия
Если тахжер ф(х) < 0 , тогда
N := (Рч] 'VI") QI := QI и Pq;
продолжить с другой вершиной из Конец условия
Разбить Pq на два: Р^ и РТЧ
Р), Р)
T (Nq, Lc -
1) :
5с := тах(¿(Р1Ч), ¿(Рг) Конец цикла Ьс := Ьс + 1 Конец цикла
QM ^ Т(все вершины уровня Ьс) Возвратить QI, QE, Qм
(15)
где е = 5Ь/2.
Доказательство: Включения Х-8 С QI и QI и QM С Х+8 справедливы в силу следствия 2. Из этого факта и утверждения 2 вытекает справедливость теоремы. ■
IV ПОСТРОЕНИЕ ПОКРЫТИЯ
Рассмотрим алгоритм построения покрытия для аппроксимации множества решений системы (1).
На начальном этапе работы алгоритма 1 создается бинарное дерево Т с одним узлом, которому приписывается пометка — исходный параллелепипед Р. Вычисляется диаметр указанного параллелепипеда и результат сохраняется в переменную 5с. Инициализируется переменная Ьс, используемая для хранения сведений о текущем уровне бинарного дерева. В основе алгоритма лежит многократное повторение двух операций: выбор всех узлов дерева некоторого уровня и анализ приписанных им пометок-параллелепипедов.
Во внешнем цикле осуществляется отбор всех узлов дерева (NLc), расположенных на уровне Ьс, с последующим переходом на следующий. Во вложенном цикле
Рис. 1: Псевдокод построения покрытия Р для решения задачи приближенной оценки множества решений системы нелинейных неравенств (1) с некоторой заданной точностью 5.
осуществляется перебор узлов N из Мрс с проверкой каждого приписанного этому узлу параллелепипеда Р на выполнение условий (6) и (5). При выполненнии условия (6) узлу приписывается пометка о принадлежности к множеству QE. При выполнении условия (5) узлу приписывается пометка опринадлежности к множеству QI .В каждом из рассмотренных случаев параллелепипед добавляется к соответствующего множеству. При невыполнении указанных выше условий происходит разбиение текущего параллелепипеда на два: Р^ и Рг, создаются два новых узла, являющихся дочерними к N 1}, и им приписываются пометки, содержащие информацию о вновь полученных параллелепипедах. Вычисляется диаметр этих параллелепипедов и значение переменной 5с обновляется.
На заключительном этапе работы алгоритма сведения о параллелепипедах из множеств QI, QE и Qм возвращаются в качестве результата работы алгоритма.
Аналогичным образом может записывается алгоритм для приближенного оценивания значений максимума и минимума функции ф(х) . Для этого проверка условий (6) и (5) заменяется проверкой условий (12) и (11).
V. ОЦЕНКА РАБОЧЕЙ ОБЛАСТИ ПАРАЛЛЕЛЬНОГО РОБОТА
Рассмотренный подход к нахождению множества решений системы нелинейных неравенств может быть при-
W
О *2/ \ >т г" ¡X 2
ш ш
10
(16)
Рис. 2
менен к оценке рабочей области роботов параллельной структуры, под которой понимается множество положений рабочего инструмента робота. Рабочая область X для ряда роботов может быть задана как множество ре-шениий системы (1). Рассмотрим простейший случай параллельного планарного робота (X С М2), приведенного на рисунке 2, и соответствующую его рабочей области систему неравенств:
91(х11х2)=х21+х22-(1?ах)21
д2(х1,х2) = (1Гп)2 - - х1
дз(х1,х2) = (х1-10)2+х22-(1Гх)2,
94(х1,х2) = №п)2-(х1-10)2-х1
где х 1,Х2 — координаты рабочего инструмента робота,
Iтпгп и Iшах^ }шгп и £шах - КОНСТРУКТИВНО ВОЗМОЖНЫе
минимальные и максимальные длины штанг 1\ и вместе с ¿о образующие треугольник ¡оЬЬ-
Необходимо аппроксимировать с некоторой точностью рабочую область этого робота, т.е. определить множество точек на плоскости, в котором может находиться точка ¿V. Две штанги робота закреплены в точках 1,2 с помощью механизмов, позволяющих изменять длины ¿1,^2 и обеспечивающих беспрепятственное вращение штанг вокруг точек закрепления.
Длина горизонтального ребра исходного прямоугольника Р не может превышать ¿з^+^о+^Г^? а веРтикаль_ ного — тт^™0^, 1'21ах), левый нижний угол расположен в точке
Константы Липшица для функций некоторо-
го прямоугольника Р\ оцениваются следующим образом:
¿1= ¿2 = 1^2= эир {\\\7д1(х1,х2)\\}
(Х!,Х2 )£Рг
Ь3 = ЬА = ЬМ= Бир {\\4дз(хих2)\\}-
(X! ,х2)еРг
Принимая во внимание утверждение 5, значение константы Липшица для функции ф(х г,х2) и некоторого прямоугольника Р\ может быть получено вычислением максимума двух найденных констант:
Ь = тах(£12,Ь34), Ь12 = 2(тах(|а1|, \Ьг\)2 + тах(|а2|, |^|)2)1/2, Ьм = 2(тах(|а1 - /0|, |Ьх - ¿о|)2 + тах(|а2|, \Ь2\)2)1/2.
Для проведения эксперимента были выбраны следующие параметры робота: 1г{1гп = 2, Х™71 = 4, 1™ах
(о) 02 = 0.06
(г) <54 = 0.06
Рис. 3: Приближенные оценки множества решений системы (16) для двух значений 6: 0.5 и 0.06, полученные как с использованием оценок (14) (За,36) так и с применением процедуры глобальной оптимизации (3в,3г).
1<тах _ iшах _ ^ /0 = 4. Расчет проводился на персональном компьютере, имеющем четырехъядерный процессор Intel \1 с тактовой частотой 2.2 ГГц и оперативной памятью объемом 16 Гб. Алгоритм был реализован на языке Python с использованием библиотеки ete [ 10]1 для работы с бинарным деревом, которое было выбрано в качестве структуры дланных для хранения информации о каждой итерации общего цикла.
!Bce результаты, представленные в этой работе, были получены с использованием программы на языке Python, опубликованной на GitHub: https://github.com/andreiturkin/INJOIT2016.NUCovering.git
На рис. 3 приведены четыре покрытия, которые аппроксимируют множества решений системы (16), построенные со значениями 5х = 0.5 (Рис. 3а), 52 = 0.06 (Рис. 3б), а также 53 = 0.5 (Рис. 3в) и 54 = 0.06 (Рис. 3г). Покрытия, изображенные на рисунках 3в и 3г, получены с использованием оценок (14), а те, что изображены на 3в и 3г — с применением процедуры глобальной оптимизации.
Из приведенных результатов видно, что использование процедуры нахождения точного значения оптимума на прямоугольнике позволяет добиться визуально лучших результатов. Однако, при таком подходе следует учитывать вычислительную сложность. Так, например, при использовании приближенных оценок покрытие, приведенное на рисунке 3а, было получено за 0.03 секунды, в то время как для получения результата, показанного на рисунке 3в, потребовалось около 90 секунд, что объясняется многократным использованием алгоритма глобальной оптимизации, в качестве которого был выбран МГОАСО[11] из библиотеки РуОр^12].
VI. ЗАКЛЮЧЕНИЕ
В работе рассмотрен подход к приближенной оценке множества решений систем нелинейных неравенств. Получены два способа построения аппроксимаций: с использованием процедуры глобальной оптимизации для поиска решения на параллелепипеде и применяя приближенную оценку максимума и минимума целевой функции. Исследуются свойства таких аппроксимаций и приводится пример их использования для решения задачи нахождения рабочей области планарного параллельного робота. Результаты экспериментов показывают особенности применения каждого из представленных способов построения приближенных оценок множества решений системы нелинейных неравенств. Недостатком применения процедуры глобальной оптимизации является время вычислений, в то время как при использовании подхода к приближенной оценке экстремумов функции на прямоугольнике возникает проблема, связанная с точностью аппроксимации.
[6] Евтушенко Юрий Гаврилович, Посыпкин Михаил Анатольевич. Детерминированный глобальный метод аппроксимации эффективной оболочки множества // Доклады Академии Наук. — 2014. — Vol. 459. — P. 550-553.
[7] Гаранжа Владимир Анатольевич. Барьерный метод построения квазиизометричных сеток // Журнал вычислительной математики и математической физики.— 2000.— Vol. 40, no. 11.— P. 16851705.
[8] Гаранжа Владимир Анатольевич, Кудрявцева Людмила Николаевна. Построение трехмерных сеток Делоне по слабоструктурированным и противоречивым данным // Журнал вычислительной математики и математической физики. — 2012. — Vol. 52, no. 3. — P. 499-520.
[9] Евтушенко Юрий Гаврилович, Посыпкин Михаил Анатольевич. Метод неравномерных покрытий для решения задач многокритериальной оптимизации с гарантированной точностью // Журнал вычислительной математики и математической физики. — 2013. — Vol. 53, no. 2. — P. 209-224.
[10] Huerta-Cepas Jaime, Serra François, Bork Peer. Ete 3: reconstruction, analysis, and visualization of phylogenomic data // Molecular biology and evolution. — 2016. — Vol. 33, no. 6. — P. 1635-1638.
[11] Schlüter Martin, Egea Jose A, Banga Julio R. Extended ant colony optimization for non-convex mixed integer nonlinear programming // Computers & Operations Research. — 2009. — Vol. 36, no. 7. — P. 2217-2229.
[12] Perez Ruben E., Jansen Peter W., Martins Joaquim R. R. A. py-Opt: A Python-based object-oriented framework for nonlinear constrained optimization // Structures and Multidisciplinary Optimization. — 2012. — Vol. 45, no. 1. — P. 101-118.
Список литературы
[1] Лотов Александр Владимирович, Поспелов Алексей Игоревич. Модифицированный метод уточнения оценок для полиэдральной аппроксимации выпуклых многогранников // Журнал вычислительной математики и математической физики. — 2008. — Ш. 48, по. 6. — Р. 990-998.
[2] Каменев Георгий Кириллович. Метод полиэдральной аппроксимации шара с оптимальным порядком роста мощности гранной структуры // Журнал вычислительной математики и математической физики. — 2014. — 54, по. 8. — Р. 12351248.
[3] Каменев Георгий Кириллович. Эффективность метода уточнения оценок при аппроксимации многомерных шаров многогранниками // Журнал вычислительной математики и математической физики. — 2016. — 56, по. 5. — Р. 756-767.
[4] Бушенков Владимир А, Лотов Александр Владимирович. Методы и алгоритмы анализа линейных систем на основе построения обобщенных множеств достижимости // Журнал вычислительной математики и математической физики. — 1980. — 20, по. 5. — Р. 1130-1141.
[5] Численные методы построения области достижимости динамической системы / Евгений Михайлович Воронов, Анатолий Павлович Карпенко, Оксана Геннадьевна Козлова, Владимир Андреевич Федин // Вестник Московского государственного технического университета им. НЭ Баумана. Серия «Приборостроение». — 2010. — по. 2.
Numerical method for approximating the solution set of a system of non-linear inequalities
Yuri G. Evtushenko, Mikhail A. Posypkin, Larisa A. Rybak, Andrei V. Turkin
Abstract—This paper presents a method of finding an approximation to the solution set of systems of nonlinear inequalities, which is based on the non-uniform covering concept. Two approaches to constructing approximations are discussed: the first one is based on using a global optimization technique to get a solution for a box of the covering, the second one relies on a optimum approximation technique to avoid the drawbacks of the first approach. We point out the following features of these approaches: the amount of time that the program takes to solve the problem by using global optimization, the precision of the solution when using extrema approximations for a box of the covering.
Keywords—the non-uniform covering concept, systems of nonlinear inequalities, approximation, workspace of a manipulator.