Вычислительная сложность построения композиционных моделей липшиц-ограниченных отображений

Калинников Иван Сергеевич

2014 Вычислительные методы в дискретной математике №3(25)

ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ В ДИСКРЕТНОЙ МАТЕМАТИКЕ

УДК 510.52

ВЫЧИСЛИТЕЛЬНАЯ СЛОЖНОСТЬ ПОСТРОЕНИЯ КОМПОЗИЦИОННЫХ МОДЕЛЕЙ ЛИПШИЦ-ОГРАНИЧЕННЫХ ОТОБРАЖЕНИЙ

И. С. Калинников

Национальный исследовательский университет «МИЭТ», г. Москва, Россия

E-mail: gaminot@gmail.com

Работа посвящена вопросам численного построения композиционных моделей липшиц-ограниченных сюрьективных функций одного аргумента. Композиционные модели являются частным случаем функциональной аппроксимации, получаемым путём композиции функций из заданного множества. Доказывается NP-трудность задачи построения оптимальной композиционной модели при заданном множестве функций, используемых для построения модели, и определённой приближаемой функции. Рассматриваются различные алгоритмы нахождения приближённых композиционных моделей, часть из которых имеет полиномиальную сложность; оцениваются возможности применения данных подходов.

Ключевые слова: композиция функций, композиционные модели, NP-полнота, липшиц-ограниченность, вычислительная сложность.

Введение

Композиционные модели используются в различных областях науки и техники, в том числе при представлении и анализе экспериментальных данных, для оптимизации процессов вычислений, анализа программного обеспечения методом «чёрного ящика», получения эквивалентных функциональных преобразований. Примеры применения композиционных моделей приводятся в работах [1-3]. Существенным недостатком композиционных моделей является отсутствие вычислительно эффективных алгоритмов их получения в общем случае. Известны эффективные алгоритмы для некоторых подклассов отображений, например для полиномов [4].

Точной композиционной моделью длины n для отображения f, построенной по системе функций F = {g1, g2, ... , gm}, назовём композицию функций gil (... gin (x)), такую, что gil (... gin (x)) = f. Оптимальной композиционной моделью длины n будем называть композицию gil (... gin (x)), такую, что по заданной метрике ß достигается min (ß(gil (... gin (x)), f)) . Приближённой композиционной моделью будем называть результат процесса минимизации функции H (i1,... ,in) = ß (gil (... gin (x)), f) по набору индексов (i1,... ,in), ij E {1,... ,m}, j = 1,... ,n, с использованием методов, не гарантирующих глобальной оптимальности найденного решения в общем случае.

Основной целью работы является доказательство отсутствия эффективных алгоритмов (NP-трудности) построения оптимальных композиционных моделей в случае, если функции из FU{f} являются липшиц-ограниченными сюръективными отображениями [0,1] ^ [0,1] . Под липшиц-ограниченными отображениями понимаются такие

функции, что существует константа L, для которой верно

Vxi,x2 G [0,1] (|f (xi) - f (Х2)| ^ L|xi - X2|).

В работе NP-полнота понимается в смысле сводимости к ней за полиномиальное время остальных задач класса NP [5, 6].

Рассматриваются также вопросы построения алгоритмов поиска приближённой композиционной модели, приводятся имеющиеся методы решения данной задачи, кратко проводится их сравнение. В заключении подводятся итоги и перечисляются некоторые открытые вопросы.

1. NP-трудность построения оптимальной и точной композиционной модели

В настоящее время доказана NP-трудность задачи MGS — поиска минимальной генерирующей последовательности перестановок для заданной перестановки. NP-трудность MGS доказывается редукцией к ней проблемы 3XC, входящей в список 21 проблемы Карпа [5, 6]. В приводимом далее доказательстве NP-трудности задачи построения композиционной модели используются некоторые идеи работы [7], где проводится доказательство NP-трудности задачи MGS.

Дадим формулировки задач, которые фигурируют в доказательстве:

— 3XC(S, U) (точное покрытие 3-множествами). Дано множество S = {u1,... , u3n} и подмножество U С S3, |U| = m. Определить, существует ли подмножество S' С U, |S'| = n, такое, что для любого u G S есть ровно одно 3-множество s' G S', содержащее u.

Примечание: элементы из U — неупорядоченные множества из трёх различных элементов S, называемые 3-множествами.

— COMP-L(F, f, ß, е) (распознавание композиции липшиц-ограниченных функций, приближающей целевую функцию с заданной погрешностью). Дан набор функций F = {gi.. ,gm} и целевая функция f, причём функции f, g являются сюръек-тивными липшиц-ограниченными отображениями [0,1] ^ [0,1]. Определить, существует ли набор (ii,..., in), такой, что ß (gil (... gin), f) ^ е.

В качестве метрики ß может рассматриваться любая метрика, для которой вычисление (или приближение с устанавливаемой погрешностью) значения между определяемыми в доказательстве функциями может быть произведено за полиномиальное время.

Теорема 1. 3XC(S, U) редуцируется к COMP-L(F, f, ß, е).

Доказательство. Каждый элемент s G U можно задать как бинарный вектор bs длины 3n, где bs(i) = 1, если u G s, а все прочие позиции в bs заняты нулями. Очевидно, получение таких векторов может быть выполнено за время, полиномиальное от n и m.

Каждому бинарному вектору bs поставим в соответствие кусочно-определённую липшиц-ограниченную функцию из Ci[0,1]. B качестве базовой функции выберем 9

t(x) = ^ sign(x) ((1 — |x|)3 — (1 — |x|)2), x G [-1,1], введём также функцию окна

f 1,x G

w(i, N, x)

" 0, x G

i — 1 i

N ' N i — 1 i

NN

и функции

1 3 п

дз(х) = х +--^ Ьз(г)ы(г, 3п, х)г(6пх — 2г + 1).

3п г=1

Систему функций Г для задачи СОМР-Ь определим так: Г = {дз : в € и}, |Г| = т; а целевую функцию f как

1 3п

f (х) = х +--У] т(г, 3п, х)г(6пх — 2г + 1).

3п ¿=1

Построение и вычисление функций из Г и функции f выполняется за время, линейное от п и т. Константа Липшица всех функций из Г и функции f равна 4.

Построенные функции дз1, дз2 при выполнении композиции ведут себя следующим образом:

1) Если в1 и в2 не содержат одинаковых элементов щ, то дз1(дз2) = дз2(дз1) соответствуют функции д, построенной для бинарного вектора Ь = Ьз1 V Ьз2, так как

1 3п

дз1 (дз2 (х)) = х + — (г) ы (г, 3п, х) г (6пх — 2г + 1) + 3п 1=1

1 3п

+--^2Ьз2 (г) ы (г, 3п, х) г (6пх — 2г + 1) =

3п ¿=1

1 3п

= х +--(Ьз1 (г) V Ьз2 (г)) ы (г, 3п, х) г (6пх — 2г + 1).

3п ¿=1

2) Если в1 и в2 содержат одинаковые элементы, то функция в соответствующих частях изменяется следующим образом: если Ьз1(г) = Ьз2(г) = 1 для некоторого г,

г — 1 г

выполняется равенство

то для х €

3п 3п

дз1(дз2(х)) = х+-1 г (6пх — 2г + г (6п( х + г (6пх — 2г + 1м — 2г + 1 3п 3п 3п

что отличается от значений дз1 и дз2. При дальнейших композициях дз1(дз2(х))

г — 1 г

с функциями дз(х), такими, что Ьз(г) = 1, на отрезке -, — будут образовы-

3п 3п

ваться многократные подстановки г(х) в саму себя, не совпадающие с исходной функцией.

Подобные свойства позволяют определить отсутствие, однократное или многократное покрытие элемента щ в результате объединения 3-множеств в € Б, представляемых функциями из Г. Приведём возможные результаты композиции функций дз1 (х) и дз2(х) в таблице:

МО — бит покрытия элемента 3-мно-жеством в! МО — бит покрытия элемента 3-мно-жеством в2 Функция результата композиции на Г г — 1 г ] отрезке ——,— 3п 3п

0 0 X

1 0 ¿(бпх — 2г + 1) X +-- 3п

0 1 ¿(бпх — 2г + 1) х + о 3п

1 1 х + — £ (бпх — 2г + 1) + 3п +—Ц бп ( х + — ¿(бпх — 2г + 1) ) — 2г + 1 ) 3п \ \ 3п ) )

Свойства построенной системы функций показывает рис. 1, на котором сверху вниз изображены функция дз1 для = {«, п2,п4}; функция дз2 для в2 = {п2,п3,п5}; композиция функций дз1(дз2) при т =2.

х

Рис. 1. Функции, представляющие 3-множества, и их композиция

Пусть определено существование решения задачи COMP-L(F, f, ß, е) при е = 0, тогда если оно существует, то покрытие для задачи 3XC также существует, и найденный набор индексов (i\,... ,im) соответствует S' — решению задачи 3XC. Отсутствие решения задачи COMP-L ведёт к отсутствию решения задачи 3XC. Для получения покрытия из набора индексов используется обратное преобразование функций с данными индексами в бинарные векторы, а их — в 3-множества. Сложность данного преобразования, очевидно, является полиномиальной от n и т. ■

Замечание 1. Может показаться, что задача может быть NP-полной в силу необходимости вычисления значений метрики между липшиц-ограниченными функциями, но в данном случае метрика Чебышева для приведенных наборов функций может быть вычислена за полиномиальное от т и n время на основе таблицы расстояний между подстановками функции t(x). Аналогично может рассматриваться метрика Чебыше-ва по любой дискретной системе узлов, позволяющей различать композиции функции t(x) .

Замечание 2. Задача построения точной композиционной модели является частным случаем задачи COMP-L(F, f, ß, е) при е = 0. Значит, в доказательстве можно совместно рассматривать задачу распознавания композиционной модели, приближающей целевую функцию с заданной погрешностью, и задачу построения точной композиционной модели.

Замечание 3. Задача построения оптимальной композиционной модели NP-трудна, так как задача распознавания композиционной модели COMP-L(F, f, ß, е) NP-полна. Предположим, решена задача построения оптимальной композиционной модели и известен min (ß (gi1 (. . . gin) , f)); тогда задача распознавания решается путём

сравнения е с найденным минимумом. Следовательно, задача построения оптимальной композиционной модели не может решаться проще задачи распознавания композиционной модели.

Таким образом, задача построения точной композиционной модели липшиц-ограниченной функции является NP-полной, а задача построения оптимальной композиционной модели — NP-трудной. Названные задачи скорее всего не имеют эффективных алгоритмов решения (проблема P = NP). Однако данный факт не влияет на возможность выполнять поиск приближённой композиционной модели.

2. Методы поиска приближённой композиционной модели

Рассмотрим различные методы поиска приближённых композиционных моделей и их свойства. Методы поиска приближённых композиционных моделей по основному принципу работы можно разделить на использующие:

— аппроксимации специальными видами функций;

— параметрическую оптимизацию;

— теорию поиска в метрических пространствах;

— случайный или генетический поиск.

При аппроксимации специальными функциями необходимо подобрать класс отображений C так, что:

1) возможно аппроксимировать f и gi Е F функциями данного класса;

2) в выбранном классе существуют эффективные алгоритмы построения композиционных моделей.

Если такой класс C отображений находится, то функция f заменяется на f Е C (входящую в выбранный класс), а функции gi Е F заменяются на g Е F С C. Далее решается задача построения точной/оптимальной композиционной модели в классе C. Пусть решение в классе C найдено, погрешность равна е = = yf,gi1 (. . . gin . Рассмотрим погрешность решения (i1,...,in) для исходной задачи: е ^ /) + у f, gil (. ..gin ^ + y (gi1 {...gin), g^ (... gin)) = у /) + е + + У (gi1 (... gin) ,gi1 (... gin)). Таким образом, погрешность ограничена сверху функцией от расстояний между исходными функциями и их функциями-представителями из класса C, а также погрешностью решения задачи в классе C. Более точный анализ погрешностей можно провести для конкретной метрики, например метрики Чебышева:

е = у (f,gii (...gin)) ^ y(fJ) + е + Е| П [min (L9ik ,L§ik) ]у {g%j ,g4 j

\ / j=1 Y k=1 L v 7 J

при этом, если обозначить ес = max I max (у (gj ,gj)) ,y(f ,f) ), а L = max(Lg.), то

V j J i

Í Ln - 1 Л получаем оценку е ^ ес I ——— + 11 + е.

Так как L > 1 (по условию на отображения f, gi Е F), то верхняя оценка погрешности возрастает очень быстро с ростом длины композиционной модели n, при этом на практике L редко бывает меньше 3. Таким образом, аппроксимационный подход может применяться, например, для классов C полиномиальных [4] и рациональных [8] функций, для которых существуют полиномиальные алгоритмы построения композиционных моделей. При этом аппроксимационный подход будет эффективен, когда

функции f и Г с малой погрешностью ес приближаются функциями из С, а длина п композиционной модели мала.

Методы поиска приближённой композиционной модели, основанные на параметрическом подходе, традиционно включают две стадии:

— параметрическую оптимизацию с использованием традиционных (классических) методов оптимизации;

— прямой перебор вариантов с целью определения подходящего.

Данные стадии могут быть сгруппированы различным образом. Например, в работе [3] автор предлагает, рассматривая бесконечное множество Г (с семействами функций, зависящими от параметров), изначально, на основе приближённых значений параметров, выбрать перебором подходящую композиционную модель. При выполнении перебора поиск выполняется с точностью до определения семейства каждой входящей в композицию функции. После этого автор [3] предлагает применить параметрическую оптимизацию для определения конкретных функций в каждом семействе. Полагается, что Г = Г1 и Г2 и ... и Гт; на первом этапе перебором ищется

где select (f, Fi) выбирает некоторым вычислительно простым алгоритмом параметры функции из Fi для того, чтобы она приближала f (например, на основе метода МНК). На втором этапе ищется минимум функции

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где (г1,... ,гп) —индексы, выбранные в результате поиска на первом этапе. Альтернативой является изначальное сведение задачи к задаче параметрической оптимизации, а затем поиск лучшего целочисленного округления полученного решения, подобный подход рассмотрен в работе [9]. Недостатками этих подходов является сложность предсказания качества получаемого решения и быстрое возрастание числа параметров, по которым проводится оптимизация, с ростом длины композиционной модели. Последний недостаток не позволяет использовать многие методы оптимизации, поэтому в большинстве случаев производится поиск только локального экстремума.

Поскольку на множестве {f} и {д^ (... д^) : г1,...,гп € {1,... ,т}} = {f} и Гп в задаче построения композиционной модели определена метрика, то могут использоваться методы теории поиска в метрических пространствах, рассматриваемые в работах [10, 11]. Оптимизация поиска в метрических пространствах достигается за счёт применения неравенства треугольника, на основе предвычислений расстояний во множестве Гп, дальнейшая оптимизация с ограничением точности получаемого результата может быть достигнута с использованием методов либо раннего прекращения поиска, либо методом ослабления условий сравнений в ходе поиска. Проблема данного подхода заключается в необходимости хранения предвычислений размера О(|Г|п) для оптимизации процесса поиска. Это объясняется тем, что оценка расстояния ^ ^,д) за счёт неравенства треугольника может быть произведена, только если существует г, такое, что ^ (f, г) и ^ (г, д) могут быть оценены. Таким образом, отношение «оцениваемости» расстояния ие¡^ С [{f} и Гп] является транзитивным замыканием отношения

mm

{(il,...,i„):il,...,i„e{1,...,m}}

н (pi,...,pn) = v(f, gi = Fii (pi) (---9n = Fin (Pn))),

«определённости» и^ С [{f} и Гп] расстояния на множестве {f} и Гп при условии, что оценки строятся за счёт неравенства треугольника с использованием «определённых» значений расстояния. Следовательно, С [{f} и Гп]2, только если отношение «определённости» расстояния и^ включает дерево на вершинах {f }и Гп, что требует минимум О(|Г|п) вычисленных расстояний. С учётом необходимости хранения пред-вычисленных значений расстояний невозможно организовать поиск для больших значений п и множеств Г со значительным количеством функций. Также следует иметь в виду, что если f заранее не известна, а предвычисления проводятся исключительно над множеством функций Гп, что чаще всего и необходимо в практических задачах, то, пока не будет найдено (г1,... ,гп) : ^ д¿1 (... д%п)) ^ 1, предвычисленные значения не могут быть использованы для эффективной оценки расстояний ^ (f, д^1 (... д^п)), используемых в работе алгоритма. Таким образом, на первых этапах работы алгоритма эффективность предвычислений незначительна.

Методы, основанные на случайном или генетическом поиске, применяются к задачам, аналогичным задаче поиска приближённой композиционной модели, в работах [1, 2]. Поскольку методология самих этих процедур хорошо известна [1, 12], обратим внимание лишь на проблемы их применения к задаче поиска приближённой композиционной модели. Случайный поисковый алгоритм для повышения эффективности работы требует определения перечня параметров распределения вектора модификации текущего решения, которые должны адаптироваться, исходя из истории поиска. Пока объём параметров адаптации незначителен, их выбор, как и определение правил адаптации, составляет значительную проблему, а возрастание эффективности незначительно. Если параметров адаптации много, то адаптация происходит крайне медленно и возрастание эффективности также незначительно. В случае применения генетического алгоритма проблема его использования заключается в определении функции смешивания элементов, такой, что коэффициент корреляции средней метрики элемента, получающегося на выходе функции смешивания, со средней метрикой элементов, попадающих на вход функции смешивания, не равен нулю. Это условие следует из теоремы Прайса [13] об эффективности генетического алгоритма, где под метрикой элемента понимается значение метрики между данным вариантом композиционной модели (названным здесь элементом) и целевой функцией f. На текущий момент для задачи построения приближённой композиционной модели такая процедура смешивания не известна.

Заключение

Задача построения точной композиционной модели липшиц-ограниченной функции является КР-полной, а задача построения оптимальной композиционной модели — КР-трудной. Автору не известны непереборные алгоритмы решения данных задач, например алгоритмы с константами о,й < 1 и сложностью О^(с|Г, хотя их существование вполне возможно.

Алгоритмы поиска приближённой композиционной модели могут иметь полиномиальную сложность (например, алгоритмы, основанные на аппроксимации специальными видами функций и параметрической оптимизации), но применимость этих алгоритмов ограничена. Более универсальные алгоритмы, основанные на теории поиска в метрических пространствах, генетическом и случайном поисках, не гарантируют объёма вычислений (или предвычислений) менее О(|Г|п), поэтому актуальным является построение и математическое обоснование алгоритмов, позволяющих снизить объём вычислений. Отдельную область исследований представляют алгоритмы, использующие

функции распределения расстояний между элементами {f} U Fn и применяющие эту информацию для оптимизации поиска. Для таких алгоритмов могут быть вычислены оценки на достигаемое повышение эффективности и вероятностные характеристики точности решения, исходя из способов оценки распределения расстояний.

ЛИТЕРАТУРА

1. Koza J. R. Genetic Programming: on the Programming of Computers by Means of Natural Selection. London: A Bradford Book, 1998. 815 p.

2. Luke S. Essentials of metaheuristics. http://cs.gmu.edu/~sean/book/metaheuristics. 2009.

3. Лабутин С. А., Пугин М. В. Анализ сигналов и зависимостей: учеб. пособие. Н.Новгород: Нижегород. гос. тех. ун-т, 2001. 158с.

4. Seong J. K., Elber G., and Kim M. S. Polynomial decomposition and its applications. http: //cana.kaist.ac.kr/seong/decomposition.pdf. 2003.

5. KarpR.M. Reducibility among combinatorial problems // GJ-474 report. 1971. P. 87-103. http://www.seas.upenn.edu/~bhusnur4/cit596_spring2014/karp-1971.pdf

6. Пападимитриу X. X., Стайглиц К. Комбинаторная оптимизация: Алгоритмы и сложность. М.: Мир, 1987. 520 с.

7. Even S. and Goldreich O. The minimum-length generator sequence problem is NP-hard // J. Algorithms. 1981. No. 2. P. 311-313.

8. Alonso C., Gutierrez J., and Recio T. A rational function decomposition algorithm by near-separated polynomials //J. Symbolic Comput. 1995. V. 19. P. 527-544.

9. Калинников И. С. Алгоритм построения декомпозиции непрерывной функции одного аргумента по заданному множеству функций // Инновации в науке, образовании и бизнесе: Х Междунар. научн. конф. Калининград: КГТУ, 2012. Ч.2. С. 160-163.

10. Chavez E., Navarro G., Baeza-Yates R., and Marroquin J. L. Search in metric spaces // ACM Computing Surveys. 2001. V.33. No. 3. P. 273-321.

11. Zezula P., Amato G., Dohnal V., and Batko M. Similarity Search: The Metric Space Approach. N. Y.: Springer Verlag, 2006. 220 p.

12. Растригин Л. А., Рипа К. К., Тарасенко Г. С. Адаптация случайного поиска. Рига: Зи-натне, 1978. 243 с.

13. Alenberg L. The schema theorem and Price's theorem // Foundations of Genetic Algorithms 3. San Francisco: Morgan Kaufmann, 1995. P. 23-49.

Вычислительная сложность построения композиционных моделей липшиц-ограниченных отображений Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Калинников Иван Сергеевич

Похожие темы научных работ по математике , автор научной работы — Калинников Иван Сергеевич

Computational complexity of the synthesis of composite models for Lipschitz-bounded functions

Текст научной работы на тему «Вычислительная сложность построения композиционных моделей липшиц-ограниченных отображений»