Научная статья на тему 'Об оптимальной конструкции моделирования разложения полиномиального хаоса в задачах количественной оценки неопределенности'

Об оптимальной конструкции моделирования разложения полиномиального хаоса в задачах количественной оценки неопределенности Текст научной статьи по специальности «Математика»

CC BY
12
2
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
разложение полиномиального хаоса (РПХ) / выборка латинского гиперкуба / когерентно оптимальная выборка / D-критерий оптимальности / функ-ция Ишигами / ферменная конструкция / polynomial chaos expansion / Latin hypercube sampling / coherence-optimal sampling / D-optimal criterion / Ishigami function / truss function

Аннотация научной статьи по математике, автор научной работы — Облакова Татьяна Васильевна, Фам Куок Вьет

Рассмотрено применение обобщенного разложения полиномиального хаоса (РПХ) в задачах количественной оценки неопределенности. Реализован программный код для изучения влияния схемы генерации входных данных на качество модели, коэффи-циенты которой вычисляются методом наименьших квадратов. В качестве крите-риев качества использовались значения среднеквадратической ошибки и скользя-щего контроля. Наряду с классическим методом заполнения пространства входных признаков по схеме латинского гиперкуба рассмотрены два варианта моделирова-ния когерентно-оптимальной выборки: с использованием марковской цепи и с допол-нительным прореживанием по D-критерию. В то время, как выборка латинского гиперкуба равномерно распределяет точки по всему пространству случайных пере-менных, когерентно-оптимальные методы нацелены на распределение проб более плотно в областях с большой дисперсией и более редко в областях с малой диспер-сией. Такой подход позволяет более полно учесть информацию о реальной модели, что приводит к уменьшению количества проб при планировании эксперимента и как следствие экономии дорогого процессорного времени. Реализованные методы срав-нивались на модельной функции Ишигами и конструкции фермы со случайными зна-чениями физических характеристик. В результате сравнительного моделирования установлено, что в случае малого диапазона изменения случайных параметров, ко-гда их градиенты медленно меняются, конструкция латинского гиперкуба показы-вает наименьшие значения ошибки и скользящего контроля. В то же время в случае сильной нелинейности применение когерентно-оптимальной конструкции приводит к созданию более стабильной и эффективной модели, а дополнительное прорежи-вание по критерию D-оптимальности дает лучший результат и является самым устойчивым. Также показано, что оба алгоритма планирования эксперимента не-устойчивы и некорректны при недостаточном количестве проб.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Облакова Татьяна Васильевна, Фам Куок Вьет

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On the optimal modeling design polynomial chaos expansion in problems of quantitative assessment of uncertainty

Application of generalized decomposition of polynomial chaos (RPH) in problems of quantitative estimation of uncertainty is considered. A pro-gram code has been imple-mented to study the influence of the input data generation scheme on the quality of the model whose coefficients are calculated by the least squares method. Standard error and sliding control values were used as quality criteria. Along with the classical method of filling the space of the input features on the scheme of the Latin hyper-cube, two variants of modelling coherent-optimal sample are considered: using the Markov chain and with additional thinning on the D-criterion. While the Latin hypercube sample evenly distrib-utes points across the whole space of random variables, coherent optimum methods aim to distribute samples more densely in areas with greater variance and more rarely in areas with small variance. This approach allows for a better integration of information about the real model, which leads to a reduction in the number of samples in the planning of the experiment and as a result save costly CPU time. The implemented methods were compared on the Ishigami model function and the farm design with random values of phys-ical characteristics. As a result of comparative modeling, it is established that in case of small range of change of random parameters, when their gradients slowly change, the design of the Latin hypercube shows the lowest values of error and sliding control. At the same time, in the case of strong non-linearity, the application of coherent-optimal design leads to a more stable and efficient model, and additional thinning according to the crite-rion of D-optimality gives the best result and is the most sustainable. It has also been shown that both the planning algorithms of the experiment are unstable and incorrect if there are insufficient samples.

Текст научной работы на тему «Об оптимальной конструкции моделирования разложения полиномиального хаоса в задачах количественной оценки неопределенности»

УДК 519.2

БОТ: 10.18698/2309-3684-2024-3-120139

Об оптимальной конструкции моделирования разложения полиномиального хаоса в задачах количественной оценки неопределенности

© Т.В. Облакова, Фам Куок Вьет МГТУ им. Н.Э. Баумана, Москва, 105005, Россия

Рассмотрено применение обобщенного разложения полиномиального хаоса (РПХ) в задачах количественной оценки неопределенности. Реализован программный код для изучения влияния схемы генерации входных данных на качество модели, коэффициенты которой вычисляются методом наименьших квадратов. В качестве критериев качества использовались значения среднеквадратической ошибки и скользящего контроля. Наряду с классическим методом заполнения пространства входных признаков по схеме латинского гиперкуба рассмотрены два варианта моделирования когерентно-оптимальной выборки: с использованием марковской цепи и с дополнительным прореживанием по D-критерию. В то время, как выборка латинского гиперкуба равномерно распределяет точки по всему пространству случайных переменных, когерентно-оптимальные методы нацелены на распределение проб более плотно в областях с большой дисперсией и более редко в областях с малой дисперсией. Такой подход позволяет более полно учесть информацию о реальной модели, что приводит к уменьшению количества проб при планировании эксперимента и как следствие экономии дорогого процессорного времени. Реализованные методы сравнивались на модельной функции Ишигами и конструкции фермы со случайными значениями физических характеристик. В результате сравнительного моделирования установлено, что в случае малого диапазона изменения случайных параметров, когда их градиенты медленно меняются, конструкция латинского гиперкуба показывает наименьшие значения ошибки и скользящего контроля. В то же время в случае сильной нелинейности применение когерентно-оптимальной конструкции приводит к созданию более стабильной и эффективной модели, а дополнительное прореживание по критерию D-оптимальности дает лучший результат и является самым устойчивым. Также показано, что оба алгоритма планирования эксперимента неустойчивы и некорректны при недостаточном количестве проб.

Ключевые слова: разложение полиномиального хаоса (РПХ), выборка латинского гиперкуба, когерентно оптимальная выборка, D-критерий оптимальности, функция Ишигами, ферменная конструкция

Введение. На прогнозирование поведения сложных физических и инженерных систем влияют различные типы неопределенностей, в том числе несовершенные знания о параметрах системы и их изменчивость. Для количественной оценки возникающей неопределенности весьма эффективным является разложение по системе ортонормиро-ванных полиномов, связанных с законом распределения входных случайных параметров (разложение полиномиального хаоса — РПХ). Использование РПХ позволяет исследовать построенную прямую функцию по многим параметрам, включая вычисление чувствительности,

без дополнительной выборки [1, 2]. Задача РПХ может быть сформулирована как в интрузивной, так и в неинтрузивной форме. Интрузивный подход предполагает изменение исходного кода математической модели и по этой причине редко используется в практических приложениях. Использование неинтрузивных методов более удобно при проведения вероятностного анализа любой модели чёрного ящика. Наиболее распространены два типа неинтрузивных методов расчета детерминированных коэффициентов: спектральная проекция [3] и линейная регрессия. Хотя линейная регрессия, как правило, требует меньших вычислительных затрат, чем спектральная проекция, тем не менее она также подвержена «проклятию разности». Кроме того, как это недавно было показано в обширном обзорном исследовании [4], на качество модели регрессии на основе РПХ могут существенно влиять схемы выборки. Данная работа посвящена поиску оптимальных сочетаний РПХ со стратегией отбора проб.

Разложение полиномиального хаоса. Пусть имеется вероятностное пространство (О.,^,!^), где Т - а -алгебра на О и V -вероятностная мера на Т . Разложение ПХ случайной величины У = Л4(Х), где Х(^), йеП — тоже является случайной величиной, имеет вид:

Г = М(Х)= X А^ЛУ. (1)

где Ра — детерминированные коэффициенты; — М -мерные ортогональные полиномы. Поскольку компоненты вектора входных данных X по предположению независимы, полиномы представляют собой тензорные произведения соответствующих одномерных полиномов щ

М

= ПЩ (£), Щ Щ > = Ь = . (2)

г=1

В свою очередь ортогональные полиномы щ определяются в соответствии с законом распределения входных данных. В частности, при равномерном законе распределения вектора X используют полиномы Лежандра, при нормальном — полиномы Эрмита, а в случае произвольного закона полиномы щ вычисляют с помощью некоторого нелинейного отображения на основе схемы Аски [5, 6].

Для практических вычислений схема РПХ должна быть усечена до конечного числа членов р (максимальный порядок многомерных полиномов ). Таким образом, усеченный набор слагаемых РПХ определяется как

Лм^=|аеМм:|а| =;£аг< Л.

(3)

Мощность усеченного множества индексов Л ,р при этом равна

сагсЫ^ =Р =

ГМ + рл

V М J

(4)

Для минимизации ошибки аппроксимации будем использовать метод наименьших квадратов (МНК)

1 N 2

в = argmin — £[у(' -вТ(')]

(5)

где

Т = (Т ,) =

ч>0(4(2)) ч^)

Ч>0(О Ч^*)

(6)

Из формулы (4) замечаем, что число членов Р в РПХ сильно зависит от размерности входных случайных переменных М и максимальной полной степени полиномов р . Со другой стороны в работе в [7] показано, что для существования стабильного решения (5) требуется по крайней мере 0(Р 1п Р) признаков.

После построения РПХ необходимо оценить точность полученной модели, что важно в числе прочего и при прямом сопоставления нескольких моделей в целях выбора наилучшей. И это еще одна причина целесообразности применения методов, не требующих каких-либо трансформаций исходной математической модели. Естественная оценка точности обеспечивается средней квадратной погрешностью (MSE):

1 N 2

М8Е = ^[у{,)-МРСЕ(^))\ .

(7)

Другой распространенной оценкой является коэффициент детерминации Я2:

9 хх N ■ ,

^>2 _ ^__Ге _ ^ __г=1

1 N г-

(8)

N 2 1 N

*=Ъ [у") - у], у=1 1уи

г=1 ^ г=1

2

Однако ориентация на увеличение R2 может привести к переобу-ченности модели, и, следовательно, к необходимости ее корректировки. В последнее время для оценки эффективности алгоритма обучения предпочтение отдается методу скользящего контроля или кросс-валидации (Leave-One-Out Cross Validation) Q2 :

где Ь представляет собой г - й диагональный элемент матрицы

н = Т)-1 Т.

Планирование эксперимента. При выборе алгоритма отбора проб предпочтение принято отдавать такой процедуре, которая обеспечивает равномерное заполнение пространства входных признаков. Среди множества схем наиболее известными являются: выборка латинского гиперкуба, стратифицированная выборка, методы типа Монте Карло [8], генерирующие квази-случайные последовательности. Однако равномерная конструкция заполнения пространства может быть далеко не оптимальной с точки зрения максимального учета всех особенностей системы. В работе [9] показано, что схемы, ориентированные на равномерное заполнение пространства признаков, хорошо работают в ситуациях, когда градиент (относительно случайных параметров) медленно меняется (т.е. линеен или слабо нелинеен), в то время как для сильно нелинейных случаев, стратегии отбора проб должны быть разработаны таким образом, чтобы концентрировать пробы в тех областях пространства, которые одновременно обладают и значительной вероятностью и большой дисперсией [10, 11]. В данной работе исследуются именно такие методы генерации выборки.

Выборка латинского гиперкуба. Выборка латинского гиперкуба является одним из самых известных методов заполнения пространства.

Для получения выборки х = [х1;х2;...;хм] размера 5 , подчиняющейся закону распределения р(£), р2(£), ..., рм(£), диапазон изменения каждой переменной х. делится на 5 непересекающиеся интервалов равной вероятности и из каждого интервала случайным образом выбирается одно значение. Полученные таким образом 5 значений первой переменной х1 случайным образом комбинируются без замены с 5 значениями, полученными для х2, затем аналогично добавляем 5 значений х3 для образования 5 троек. Этот процесс продолжается до тех пор, пока не образуется набор 5 М -кортежей [12].

2

Q2 -1

(9)

Проиллюстрируем получение выборки латинского гиперкуба для примера: х = [£/; V], 5* = 5, II ~ 7£[0; 10], а случайная величина V распределена по треугольному закону. Выберем Яи (1), ЯУ (1) равномерно на интервале [0;0,2), Яи (2), ЯУ(2) равномерно на [0,2;0,4] и т.д. Затем, используя соответствующие кумулятивные функции распределения, можно определить значения наборов и, У. Генерация выборки латинского гиперкуба завершается случайным комбинированием (без замены) результирующих значений для и, У . Процесс формирования и два результирующих варианта выборки приведены на рис. 1.

яи 1,0

0,9 0,8 0,7 0,6 0,5 0,4

Яи (1) = 0,14 0,3

и (1) = 0,14

0,2 0,1 0,0

1—'—I—1—I—1—I ' I—■—I—1—I—■—I—1—г

Яи (5) = 0,91

/

Яи ( 4) = 0,68

Яи (3) = 0,56

Яи (2) =

= 0,27 2

СП

1-

_1_

0,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 и

а

ЯУ 1,0 0,9 0,8 0,7 0,6 0,5 0,4

ЯУ (1) = 0,17 03 У (1) = 3,65

-,—,-,—-|—,—|—,—,—,—|—,—г-

ЯУ (5) = 0,93

ЯУ ( 4) = 0,72

ЯУ (3) = 0,56

ЯУ ( 2) = 0,35

г-

2

<м _ь

00

«1

0,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 V б

V 10,0 9,0 8,0 7,0 6,0 5,0 4,0 3,0 2,0 1,0 0,0

■ 1 1 -■—1—"— ' 1 ' [ ' т ' © 6,76;8,84 -'1—г-1- ]

© [1,39; 7,5 7]

_ (ф) ©

[ © 2,69;5,27 ] [9 ,12;5,78]

- . 1 . © 5,64;3,65 . 1 . . 1 . . 1 .

0,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 и в

V 10,0 9,0 8,0 7,0 6,0 5,0 4,0 3,0 2,0 1,0 0,0

■ 1 • © [1,39;8,8 —1—1—1— 4] ■ г , . 1 ' • 1 '

[ © б,76;7,57 ]

© _

- [5,64;5,78 [9 © ,12;5,27]

[ . 1 . © 2,69;3,65 . 1 . ] . 1 . . 1 , . 1 .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 и г

Рис 1. Пример выборки латинского гиперкуба для получения набора размера Л' = 5 из х = [С/;Г], где II ~ 7^[0;10], V распределена по треугольному закону распределения на интервале [0;10] с модой с = 8 : а — выборка для кумулятивного распределения для и ; б — выборка для кумулятивного распределения для V ; в — выборка латинского гиперкуба, 1 с; г — выборка латинского гиперкуба, 2 с

Когерентно оптимальная выборка. Рассмотрим множество ортогональных полиномов как базис данного пространства и определим Б(^)

в(%)=^1 ^, ($ )|2- (10)

Величина (10) представляет собой равномерную наименьшую верхнюю границу суммы квадратов базисных полиномов усеченного базиса и используется для оценки стабильности в случаях, когда размерность признаков М близка к размеру выборки N .

Также рассмотрим вычислительно удобную функцию О(^), удовлетворяющую

ОД>В© ^ еП, (11)

которая для конечного Р представляет собой (П, р) — интегрируемую верхнюю границу В(^) для всех \ еП . Определим плотность вновь создаваемой выборки следующим образом:

1

Л-Г

(12)

где р^ — исходная совместная плотность признаков, усечен-

ное множество изменения признаков. При этом важно, чтобы после выбора множеств с? выполнялось неравенство

I с2Р^

<е,, ,Р. (13)

То есть чтобы есть е.. было снижено до необходимого уровня. Очевидно, что если £ = то с = 0 из-за ортогональности

{Ч^.(С)}^ . После выбора множества Я для сохранения свойства ортогональности системы полиномов {^ (^)}р_! относительно новой плотности трансформируем эти функции с помощью веса

= (14)

Полученная система (тЧ^)^^)}^, очевидно, будет ортогональна относительно . При этом такая трансформация РПХ сводит исходную задачу оптимизации к вычислению:

а^ттЦWУ - WТр|| , (15)

в

где W = (Wa = vvfc^1) диагональная положительно-определенная матрица весов, а оценки параметров регрессии в могут быть вычислены из формулы

(W¥)((WF)p - (W¥fW7. (16)

Введем параметр когерентности следующим образом

p 2

Ms(%s) - sup £|, . (17)

В [13] было доказана теорема: Если выборки получаются из распределения, пропорционального а полиномы берутся с весом iv(^) = 1 / В(^), то параметр когерентности //s достигает минимума по всем схемам выборки на множестве S. Кроме того, /л8=Р.

Параметр когерентности (17) при S = Q особенно удобно использовать при анализе полиномов Лежандра, ограниченных на [—1;1]м .

p 2

Однако, если sup X w(^ )¥. (^) бесконечен, как в случае эрми-

j-1 1

товых полиномов с весом w(=1, в формуле (17) нужно использовать усечение Q до поддающегося измерению подмножества 5ci). В этом случае получаем задачу:

P 2

minisizesup X;

P(SC)<—' (18)

NP

k-1

1

XМ (|w()¥k (k )Isc |)< ^ P 2

Для нахождения S используются эвристические методы, нацеленные на то, чтобы с одной стороны охватить области наибольших значений р^ , а с другой удовлетворить указанным условиям.

Описанная процедура генерации когерентно оптимальной выборки (Coherence-optimal sampling) таким образом нацелена на минимизацию параметра когерентности, связанного со стабильностью и сходимостью РПХ, найденного с помощью МНК [11].

Использование марковской цепи. Рассмотрим алгоритм генерации когерентно оптимальной выборки с использованием свойства инвариантности безусловной плотности марковской цепи (Markov Chain

Monte Carlo - MCMC). Как известно [14], вероятность перехода неприводимой и апериодической марковской цепи из состояния % в состояние %' с использованием инвариантного распределения пропорционального /Я(С)В (С) и переходной плотности g(^) может быть найдена по следующей формуле:

Формулу (19) применяют при вычислении вероятности принятия пробы %' в соответствии с алгоритмом, приведенным на рис. 2.

Algorithm 1 MCMC sampler for coherence-optimal sampling_

Select a proposal distribution, dented g(%), based on distribution of S

Draw % from g(%).

for A number of burn-in samples do

Draw %', independently, from the proposal distribution.

end if

end for

% is approximately drawn

Рис. 2. MCMC набор для когерентно оптимальной выборки

Также в случае p < M применяем стандартный нормальный отбор для полиномов Эрмита и равномерный на [-1;1]M для Лежандра. Если же p > M, то используем равномерный отбор на M -мерном

шаре радиуса -n/2^2p +1 для полиномов Эрмита и M -мерный отбор Чебышева для Лежандра [13]. Предложенное значение %' добавляется в выборку с вероятностью р . Смысл переменной burn-in, использующейся как количество циклов, заключается в обеспечении независимости выборки в цепи.

Критерии алфавитной оптимальности. Оптимальность пространства признаков для МНК может также измеряться по так называемым алфавитным критериям (alphabetic criteria) информационной матрицы

(19)

Draw U , independently, from [0;1]. if U < p then

Set % = %'.

I = —Wr4/

N

1

(20)

Эти критерии принимают точки выборки таким образом, чтобы некоторые функционалы ф(Т) минимизировались. Мы используем наиболее простой и хорошо известный D -критерий (D -opt), оторый ориентирован на точную оценку в и минимизирует детерминант обратной информационной матрицы.

Для того, чтобы понизить вычислительную сложность построения D -оптимальных конструкций, были разработаны последовательные (жадные) алгоритмы [14], принципиальная схема которых приведена на рис. 3.

Algorithm 2 A sequential algorithm to construct alphabetic designs_

1: • Input: Number for samples in the design N > P, number of samples in the candidate design Nc, optimality criterion ф , type, dimension d , and order р of PC basics.

2: • Output: N x P optimal measurement matrix ¥ and the corresponding optimal sample set {^(,)}ni based on the smallest optimally criterion ф .

3: Generate Nc realizations {^(,)}ni and the corresponding N x P candidate measurement matrix ¥.

4: Initialize I - {0}. Let T (1. J) be the sub-matrix of T with row and column indices in T and J, respectively.

5: for n = 1 :N do

6: Grow the column set while n<P by setting J = { 1;....; min («./')}.

7: for ie{l;...;Nc}\I do

8: ф1=ф(ч'с(Тии}^)).

9: end for

10: Include the row corresponding to largest reduction in ф , i.e., set I = Iu{argmiii( i/л j.

11: end for

12: Return 4f = 4!c(l,J).

Рис. 3. Последовательный алгоритм построения алфавитных

I -1 i1/p

оптимальных конструкции для ф = Т

Результаты моделирования выборки разными способами приведены на рис. 4 — 6.

Как видно на рис. 4 выборка латинского гиперкуба равномерно распределяет точки по всему пространству случайных переменных. На рис. 5 выборка формируется по принципу когерентной оптимальности с использованием MCMC. Рис. 6 отражает результат применения комбинированного метода: пул кандидатов формируется в соответствии с когерентно-оптимальным подходом и дополнительно сокращается за счет использования критерия D-оптимальности. В этом случае пробы более плотно концентрируются в областях большой дисперсии, что должно привести к созданию стабильного и корректного решения МНК [15].

1,00 0,75 0,50 0,25 0,00 -0,25 -0,50 -0,75 -1,00

1,00 0, 75 0,50 0, 25 0,00 -0, 25 -0,50 -0,75 -1,00

-1,00 - 0,50 0,00 0,50 1,00

а

1,00 0, 75 0,50 0,25 0,00 -0,25 -0,50 -0,75 -1,00

-1,00 - 0,50 0,00 0,50 1,00

б

-1,00 -0,50 0,00 0,50 1,00

Рис. 4. Моделирование методов планирования экспериментов в [-1;1]2

для выборки латинского гиперкуба с объемом: а — 50; б — 100; в — 50

1,00 0,75 0,50 0, 25 0,00 -0, 25 -0,50 -0,75 -1,00

1,00 0,75 0,50 0, 25 0,00 -0, 25 -0,50 -0,75 -1,00

-1,00 - 0,50 0,00 0,50 1,00

-1,00 - 0,50 0,00 0,50 1,00

б

-0,25 -0,50 -0,75 -1,00

-1,00 - 0,50 0,00 0,50 1,00

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 5. Моделирование методов планирования экспериментов в [-1;1]2 для когерентно оптимальной выборки с объемом: а — 50; б — 100; в — 50

в

а

в

1,00 0,75 0,50 0,25 0,00 -0,25 -0,50 -0,75 -1,00

1,00 0, 75 0,50 0, 25 0,00 -0, 25 -0,50 -0,75 -1,00

-1,00 - 0,50 0,00 0,50 1,00

а

1,00 0, 75 0,50 0,25 0,00 -0,25 -0,50 -0, 75 -1,00

-1,00 - 0,50 0,00

б

0,50 1,00

-1,00 - 0,50 0,00 0,50 1,00

в

Рис. 6. Моделирование методов планирования экспериментов в [—1;1]2 для когерентно оптимальной с помощью В — критерия выборки с объемом:

а — 50; б — 100; в — 50

Исследование чувствительности методов на функции Иши-гами. На рис. 7, 8 приведены результаты моделирования функции Ишигами для указанных значений параметров:

/(х) = sin(x1) + asin2(x2) + z>x3 sin(Xj); < xj,x2,x3 ~ 1Z(-7T,я-); (21)

а = 7,6 = 0,1.

Рассмотрены модели РПХ степени 3 и 5, реализованные на основе следующих методов заполнения пространства: выборка латинского гиперкуба (LHS), когерентно оптимальная выборка с помощью марковской цепи (MCMC), и когерентная D-оптимальная выборка (D-opt). Выборка, генерируемая каждым методом, разделяется на обучающий и контролирующий наборы в соотношении 8:2. Эффективность методов сравнивается по значениям ошибки MSE и значению скользящего контроля Q. В качестве результатов на рис. 7, 8 приведены среднее значения и диапазон его изменения для 5 независимых прогонов каждого метода при увеличении объема выборки.

Модели реализованы в программе, написанной на языке Python, для компьютера со следующей конфигурацией: процессор Intel(R) Core i5-9600KF; оперативная память RAM 16Gb; видеокарта NVIDIA GeForce RTX 2060.

(Ы 0,0 -0,1 -0,2 -0,3 -0,4 -0,5 -0,6

200

300

400

500

600 и.

(1 - Я2)- 0,10

-0,15 -0,20 -0,25 -0,30 -0,35 -0, 40 -0,45

200

300

б

400

500

600и.

Рис. 7. Сравнение эффективности методов планирования экспериментов при моделировании функции Ишигами при увеличении объема выборки ия>л для порядка полиномов р = 3 ; — — выборка латинского гиперкуба (ШБ); — — когерентно оптимальная выборка с помощью марковской цепи (МСМС); — — когерентная ^-оптимальная выборка ф-ор1); а — значение ошибки MSE; б — значение скользящего контроля Я2

а

^(г) 0,0

-0,2

-0,4

-0,6

-0,8

-1,0

-1,2

300

400

а

500

600 и.

^ (1 - б2) 0,0

-0,2

-0,4

-0,6

-0,8

-1,0

200

300 400

б

500

600 и

Рис. 8. Сравнение эффективности методов планирования экспериментов при моделировании функции Ишигами при увеличении объема выборки ия>л для порядка полиномов р = 5 ; — — выборка латинского гиперкуба (ШБ); — — когерентно оптимальная выборка с помощью марковской цепи (МСМС); — — когерентная ^-оптимальная выборка ф-ор1); а — значение ошибки MSE; б — значение скользящего контроля б2

Как видно, аппроксимация ошибки моделей убывает при увеличении объема выборки и порядка полиномов разложения. Кроме того, все модели испытают неустойчивость, пока объем выборок не приближается к необходимому числу 0(Р 1п Р). Аппроксимация скользящего

контроля начинается сходиться при > 300 для порядка 3 и пт > 200 для порядка 5.

Ферменная конструкция. Рассмотрим задачу вычисления прогиба ферменной конструкции, изображенной на рис. 9.

4,4,4 тУ 4 4 4 м к*--»+«-»+•-н-<-Нч-н

Рис. 9. Конструкция стропильной фермы, построенная из двух наклонных брусьев

Теоретически расчет можно произвести методом единичной нагрузки, согласно которому прогиб в середине пролета согласно [14] составит

У = ^

^ 552 50,9117Л

V ЛЕ ¿Е* ,

(22)

Будем считать, что входной случайный вектор модели X состоит из пяти независимых компонент, задающих следующие характеристики: Е ~ Ьо^огта1(0,21;0,\), [ТПа] — модуль Юнга поперечного сечения горизонтальных стержней; Д ~ £о£погта/(0,002;0,1), [м2] — площадь поперечного сечения горизонтальных стержней;

Е ~Ьо^огта1(0,21;0,1), [ТПа] — модуль Юнга поперечного сечения диагональных стержней; Ас1 ~ Ьо&югта1(0,001; 0,1), [м2] — площадь поперечного сечения диагональных стержней; /■' ~ ОитЬе1{0,005; 0,15), [МН] — сила нагрузки на верхних соединениях.

Исследованы модели РПХ степени 3, реализованные на основе тех же трех методов заполнения пространства. Генерация выборок и процедура вычисления MSE и проведена так же, как в предыдущем примере.

Результаты расчета, приведенные на рис. 10, показывают, что в случае малого интервала изменения случайных параметров (градиенты медленно меняются) конструкция латинского гиперкуба показывает наименьшую ошибку и наименьшее значение скользящего контроля. Критерий О-оптимальности делает когерентно оптимальную конструкцию более стабильной и эффективной. Фактически, алгоритм когерентно О-оптимальности является самым устойчивым методом.

^ 1,0 -1,1 -1,2 -1,3 -1,4 -1,5 -1,6

200 300 400 500 600 700 800 900 1000 ия.

а

-0,725 -0,750 -0,775 -0,800 -0,825 -0,850 -0,875 -0,900 -0,925

200 300 400 500 600 700 800 900 1000 ия.

б

Рис. 10. Сравнение эффективности методов планирования экспериментов при моделировании ферменной конструкции; — — выборка латинского гиперкуба (КИЕ); — — когерентно оптимальная выборка с помощью марковской цепи (МСМС); — — когерентная ^-оптимальная выборка ф-ор1); а — значение ошибки МЕЕ; б — значение скользящего контроля б2

Выводы. Разложение полиномиального хаоса дает лучший результат, т.е. меньшую и более стабильную аппроксимацию ошибки, когда случайные переменные моделируются на основе когерентно оптимальной выборки с использованием D-критерия. При малом диапазоне изменения случайных параметров конструкция латинского гиперкуба является более эффективной, в то время как когерентная D-оптимальная выборка приводит к большей устойчивости.

ЛИТЕРАТУРА

[1] Xiu D., Karniadakis G. The Wiener-Askey Polynomial Chaos for Stochastic Differential Equations. SIAM Journal on Scientific Computing, 2002, vol. 24, iss. 2, pp. 619-644. DOI: 10.1137/S1064827501387826

[2] Novak L. On distribution-based global sensitivity analysis by polynomial chaos expansion. Computers & Structures, 2022, vol. 65, iss. 15, art. no. 106808. DOI: 10.1016/j.compstruc.2022.106808

[3] Petterson M.P., Iaccarino G., Nordstrom J. Polynomial Chaos Methods for Hyperbolic Partial Differential Equations: Numerical Techniques for Fluid Dynamics Problems in the Presence of Uncertainties. Springer International Publishing Switzerland, 2015, 379 p.

[4] Luthen N., Marelli S., Sudret B. Sparse Polynomial Chaos Expansions: Literature Survey and Benchmark. SIAM/ASA Journal on Uncertainty Quantification, 2021, vol. 9, iss. 2, pp. 593-649. DOI: 10.1137/20M1315774

[5] Nataf A. Détermination des distributions de probabilité dont les marges sont données, Comptes Rendus de l'Académie des Sciences, 1962, vol. 225, pp. 42-43.

[6] Облакова Т.В., Фам Куок В. Сравнительное моделирование на основе многочленов Колмогорова-Габора в задачах полиномиального хаоса и регрессии. Математическое моделирование и численные методы, 2023, № 4, с. 93-108.

[7] Cohen A., Migliorati G. Optimal weighted least-squares methods. SMAI Journal of Computational Mathematics, 2017, vol. 3, pp. 181-203.

[8] Тимонин В.И., Тянникова Н.Д. Сравнение прогрессивно цензурированных выборок - численные методы табулирования распределений статистик однородности и исследование оценки параметров связи их распределений методом Монте-Карло. Математическое моделирование и численные методы, 2015, № 3, c. 89-100.

[9] Shields M.D. Adaptive Monte Carlo analysis for strongly nonlinear stochastic systems. Reliability Engineering & System Safety, 2018, vol. 175, pp. 207-224. DOI: 10.1016/j.ress.2018.03.018

[10] Hampton J., Doostan A. Compressive sampling of polynomial chaos expansions: Convergence analysis and sampling strategies. Journal of Computational Physics, 2015, vol. 280, pp. 363-386. DOI: 10.1016/j.jcp.2014.09.019

[11] Novak L., Vorechovsky M., Sadilek V., Shields M.D. Variance-based adaptive sequential sampling for Polynomial Chaos Expansion. Computer Methods in Applied Mechanics and Engineering, 2021, vol. 386, art. no. 114105. DOI: 10.1016/j.cma.2021.114105

[12] Helton J.C., Davis F.J. Latin hypercube sampling and the propagation of uncertainty in analyses of complex systems. Reliability Engineering & System Safety, 2003, vol. 81, iss. 1, pp. 23-69. DOI: 10.1016/S0951-8320(03)00058-9

[13] Hampton J., Doostan A. Coherence motivated sampling and convergence analysis of least squares polynomial Chaos regression. Computer Methods in Applied Mechanics and Engineering, 2015, vol. 290, iss. 15, pp. 73-97. DOI: 10.1016/j.cma.2015.02.006

[14] Andrieu C., Freitas N.E., Doucet A., Jordan M.I. An Introduction to MCMC for Machine Learning. Machine Learning, 2003, vol. 50, pp. 5-43. DOI: 10.1023/A:1020281327116

[15] Hadigol M., Doostan A. Least squares polynomial chaos expansion: A review of sampling strategies. Computer Methods in Applied Mechanics and Engineering, 2018, vol. 332, pp. 382-407. DOI: 10.1016/j.cma.2017.12.019

Статья поступила в редакцию 22.02.2024

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ссылку на эту статью просим оформлять следующим образом: Облакова Т.В., Фам Куок Вьет. Об оптимальной конструкции моделирования разложения полиномиального хаоса в задачах количественной оценки неопределенности.

Математическое моделирование и численные методы, 2024, № 3, с. 120-139.

Облакова Татьяна Васильевна — канд. физ.-мат. наук, доцент кафедры «Вычислительная математика и математическая физика» МГТУ им. Н.Э. Баумана. e-mail: obltvu@bmstu.ru

Фам Куок Вьет — студент кафедры «Вычислительная математика и математическая физика» МГТУ им. Н.Э. Баумана. e-mail: phamquocviet22082001@gmail.com

On the optimal modeling design polynomial chaos expansion in problems of quantitative assessment of uncertainty

© T.V. Oblakova, Pham Quoc Viet Bauman Moscow State Technical University, Moscow, 105005, Russia

Application of generalized decomposition of polynomial chaos (RPH) in problems of quantitative estimation of uncertainty is considered. A pro-gram code has been implemented to study the influence of the input data generation scheme on the quality of the model whose coefficients are calculated by the least squares method. Standard error and sliding control values were used as quality criteria. Along with the classical method of filling the space of the input features on the scheme of the Latin hyper-cube, two variants of modelling coherent-optimal sample are considered: using the Markov chain and with additional thinning on the D-criterion. While the Latin hypercube sample evenly distributes points across the whole space of random variables, coherent optimum methods aim to distribute samples more densely in areas with greater variance and more rarely in areas with small variance. This approach allows for a better integration of information about the real model, which leads to a reduction in the number of samples in the planning of the experiment and as a result save costly CPU time. The implemented methods were compared on the Ishigami model function and the farm design with random values ofphys-ical characteristics. As a result of comparative modeling, it is established that in case of small range of change of random parameters, when their gradients slowly change, the design of the Latin hypercube shows the lowest values of error and sliding control. At the same time, in the case of strong non-linearity, the application of coherent-optimal design leads to a more stable and efficient model, and additional thinning according to the criterion of D-optimality gives the best result and is the most sustainable. It has also been shown that both the planning algorithms of the experiment are unstable and incorrect if there are insufficient samples.

Keywords: polynomial chaos expansion, Latin hypercube sampling, coherence-optimal sampling, D-optimal criterion, Ishigami function, truss function

REFERENCES

[1] Xiu D., Karniadakis G. The Wiener-Askey Polynomial Chaos for Stochastic Differential Equations. SIAM Journal on Scientific Computing, 2002, vol. 24, iss. 2, pp. 619-644. DOI: 10.1137/S1064827501387826

[2] Novak L. On distribution-based global sensitivity analysis by polynomial chaos expansion. Computers & Structures, 2022, vol. 65, iss. 15, art. no. 106808. DOI: 10.1016/j.compstruc.2022.106808

[3] Petterson M.P., Iaccarino G., Nordstrom J. Polynomial Chaos Methods for Hyperbolic Partial Differential Equations: Numerical Techniques for Fluid Dynamics Problems in the Presence of Uncertainties. Springer International Publishing Switzerland, 2015, 379 p.

[4] Luthen N., Marelli S., Sudret B. Sparse Polynomial Chaos Expansions: Literature Survey and Benchmark. SIAM/ASA Journal on Uncertainty Quantification, 2021, vol. 9, iss. 2, pp. 593-649. DOI: 10.1137/20M1315774

[5] Nataf A. Détermination des distributions de probabilité dont les marges sont données, Comptes Rendus de l'Académie des Sciences, 1962, vol. 225, pp. 42-43.

[6] Oblakova T.V., Pham Quoc V. Polynomial chaos and regression based on Kol-mogorov-Gabor polynomials: comparative modeling. Mathematical Modeling and Computational Methods, 2023, no. 4, pp. 93-108.

[7] Cohen A., Migliorati G. Optimal weighted least-squares methods. SMAI Journal of Computational Mathematics, 2017, vol. 3, pp. 181-203.

[8] Timonin V.I., Tyannikova N.D. Comparison of progressively censored samples -numerical methods for tabulating distribution of homogeneity statistics and study of estimation of relation parameters of their distribution by Monte Carlo method. Mathematical Modeling and Computational Methods, 2015, no. 3, pp. 89-100.

[9] Shields M.D. Adaptive Monte Carlo analysis for strongly nonlinear stochastic systems. Reliability Engineering & System Safety, 2018, vol. 175, pp. 207-224. DOI: 10.1016/j.ress.2018.03.018

[10] Hampton J., Doostan A. Compressive sampling of polynomial chaos expansions: Convergence analysis and sampling strategies. Journal of Computational Physics, 2015, vol. 280, pp. 363-386. DOI: 10.1016/j.jcp.2014.09.019

[11] Novak L., Vorechovsky M., Sadilek V., Shields M.D. Variance-based adaptive sequential sampling for Polynomial Chaos Expansion. Computer Methods in Applied Mechanics and Engineering, 2021, vol. 386, art. no. 114105. DOI: 10.1016/j.cma.2021.114105

[12] Helton J.C., Davis F.J. Latin hypercube sampling and the propagation of uncertainty in analyses of complex systems. Reliability Engineering & System Safety, 2003, vol. 81, iss. 1, pp. 23-69. DOI: 10.1016/S0951-8320(03)00058-9

[13] Hampton J., Doostan A. Coherence motivated sampling and convergence analysis of least squares polynomial Chaos regression. Computer Methods in Applied Mechanics and Engineering, 2015, vol. 290, iss. 15, pp. 73-97. DOI: 10.1016/j.cma.2015.02.006

[14] Andrieu C., Freitas N.E., Doucet A., Jordan M.I. An Introduction to MCMC for Machine Learning. Machine Learning, 2003, vol. 50, pp. 5-43. DOI: 10.1023/A:1020281327116

[15] Hadigol M., Doostan A. Least squares polynomial chaos expansion: A review of sampling strategies. Computer Methods in Applied Mechanics and Engineering, 2018, vol. 332, pp. 382-407. DOI: 10.1016/j.cma.2017.12.019

Oblakova T.V., Cand. Sc. (Phys.-Math.), Assoc. professor of the Computational Mathematics and Mathematical Physics Department, Bauman Moscow State Technical University. e-mail: obltvu@bmstu.ru

Pham Quoc Viet, Student of the Computational Mathematics and Mathematical Physics Department, Bauman Moscow State Technical University. e-mail: phamquocviet22082001@gmail.com

i Надоели баннеры? Вы всегда можете отключить рекламу.