Научная статья на тему 'Применение ЛПТ равномерно распределенных последовательностей для решения прикладных задач моделирования'

Применение ЛПТ равномерно распределенных последовательностей для решения прикладных задач моделирования Текст научной статьи по специальности «Математика»

CC BY
857
115
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАВНОМЕРНО РАСПРЕДЕЛЕННЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ / ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА / КОРРЕЛЯЦИЯ / UNIFORMLY DISTRIBUTED SEQUENCES / EXPERIMENT DESIGNS / CORRELATION

Аннотация научной статьи по математике, автор научной работы — Радченко С. Г., Козырь О. В.

Рассмотрено использование QUOTE QUOTE QUOTE равномерно распределенных последовательностей для решения прикладных задач моделирования. Сформулированы проблемы построения многофакторных планов экспериментов на основе этих последовательностей. Показано, что использование QUOTE QUOTE QUOTE последовательностей в качестве планов экспериментов без специального исследования не представляется возможным.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The article deals with the use of QUOTE QUOTE QUOTE QUOTE QUOTE QUOTE uniformly distributed sequences designed to solve applied simulation problems. The problems of constructing of multifactor experiment designs on the base of these sequences are formulated as well. It is shown that the use of QUOTE QUOTE sequences as experiment designs without special research is impossible.

Текст научной работы на тему «Применение ЛПТ равномерно распределенных последовательностей для решения прикладных задач моделирования»

УДК 519.242:519.6

С.Г. РАДЧЕНКО*, О.В. КОЗЫРЬ*

ПРИМЕНЕНИЕ ЛПТ РАВНОМЕРНО РАСПРЕДЕЛЕННЫХ

ПОСЛЕДОВАТЕЛЬНОСТЕЙ ДЛЯ РЕШЕНИЯ ПРИКЛАДНЫХ ЗАДАЧ МОДЕЛИРОВАНИЯ

Национальный технический университет Украины "Киевский политехнический институт", Киев, Украина

Анотація. Розглянуто застосування ЛПТ рівномірно розподілених послідовностей для рішення прикладних задач моделювання. Сформульовані проблеми побудови багатофакторних планів експериментів на основі цих послідовностей. Показано, що застосування ЛПТ послідовностей як планів експериментів без спеціального дослідження неможливо.

Ключові слова: ЛПТ рівномірно розподілені послідовності, планування експерименту, кореляція.

Аннотация. Рассмотрено использование ЛПТ равномерно распределенных последовательностей

для решения прикладных задач моделирования. Сформулированы проблемы построения многофакторных планов экспериментов на основе этих последовательностей. Показано, что использование ЛПТ последовательностей в качестве планов экспериментов без специального исследования не представляется возможным.

Ключевые слова: ЛПТ равномерно распределенные последовательности, планирование эксперимента, корреляция.

Abstract. The article deals with the use of LPT uniformly distributed sequences designed to solve applied simulation problems. The problems of constructing of multifactor experiment designs on the base of these sequences are formulated as well. It is shown that the use of LPT sequences as experiment designs without special research is impossible.

Keywords: LPT uniformly distributed sequences, experiment designs, correlation.

1. Введение. Постановка проблемы

Научное исследование реальной действительности предполагает создание и использование математических моделей, которые формализованно описывают связь комплекса начальных условий с группой критериев качества изучаемого объекта, системы или процесса. Большинство научных исследований связано с экспериментом. Он проводится в лабораториях, на производстве, в клиниках и т.д. Планирование эксперимента входит составной частью в общее планирование исследования, представляющее один из этапов исследовательского процесса, предшествующий непосредственному проведению опытов. Суть его заключается в составлении набора экспериментальных условий с определенными комбинациями независимых и зависимых переменных.

Основой любого эксперимента является план эксперимента. Правильно выбранный план эксперимента позволяет получить многофакторные статистические модели с наилучшими возможными критериями качества.

Последовательное планирование многофакторных экспериментов с использованием планов экспериментов на основе ЛП t равномерно распределенных последовательностей -необходимое условие получения искомой структуры многофакторной статистической модели.

© Радченко С.Г., Козырь О.В., 2014

ISSN 1028-9763. Математичні машини і системи, 2014, № 1

Последовательность точек Р,..., Р,... называется равномерно распределенной [3, с. 20] в п -мерном кубе Кп, если для любого параллелепипеда П

Уп - объем (п-мерный) параллелепипеда П.

Последовательность точек Р р,..., Р ,...Р0, п -мерного куба Кп называется ЛПх

чек, представляет собойП -сетку [3, с. 134-135]. Название «ЛПх последовательность» образовано как сокращение фразы «последовательность, любой двоичный участок которой представляет собой П -сетку».

Цель статьи

Обзор существующих областей использования ЛПх последовательностей; исследование свойств и применения ЛП х равномерно распределенных последовательностей при планировании многофакторных экспериментов для получения регрессионных моделей.

Анализ публикаций по теме исследования

ЛП х последовательности имеют широкую область применения: вычисление многомерных

интегралов, случайный поиск, задачи многокритериальной оптимизации, моделирование физических и экономических процессов.

Разработанные И.М. Соболем ЛПх последовательности, предназначенные изначально для расчета многомерных интегралов, стали позже применяться и для реализации поисковых процедур. Планируемый ЛП-поиск - это метод рационального проектирования объектов искусственной природы. Он сконструирован на основе планирования ЛПх последовательностей и принадлежит семейству методов Монте-Карло [1]. Метод используется для анализа математических моделей функционирования проектируемых объектов. Структура указанных в [1, 2] ЛПх последовательностей позволяет строить сетки в к -

мерном пространстве параметров исследуемых функций. Эти сетки позволяют определить:

• какие из варьируемых параметров с заданной вероятностью оказывают существенное влияние на значения функции - критерия качества;

• области концентрации наилучших значений критериев по заданной метрике между текущим значением критерия качества и его экстремальным значением;

• построить в многомерном пространстве критериев качества множество Парето. Использование точек ЛПх последовательностей обеспечивает более высокую точность вычислений по некоторым алгоритмам Монте-Карло и более равномерный просмотр пространства параметров при решении задач многофакторной оптимизации для поиска экстремальных значений критериев качества. При решении некоторых задач методом Монте-Карло требуется, чтобы при генерации равномерного распределения обеспечивалось более равномерное покрытие области значений, частично жертвуя при этом «случайностью».

Метод исследования пространства параметров на основе ЛПх последовательностей изложен в работах [3, 4]. Он используется для постановки и решения прикладных задач

N

где SN (П) - количество точек р с номерами 1 £ I £ N, принадлежащих П;

последовательностью, если любой ее двоичный участок, содержащий не менее чем 2х+1 то-

оптимизации со многими критериями качества. В основе метода лежит построение допустимого и Парето-оптимального множества решений. Приведены многочисленные результаты по теории метода. Рассматриваются такие важные классы задач: проектирование, идентификация, проектирование с управлением, поиск в базе данных. Описан программный комплекс MOVI, реализующий метод исследования пространства параметров. Комплекс позволяет находить решения многих реальных оптимизационных задач в параллельном режиме, что значительно экономит затраты машинного времени.

При экономическом моделировании для достижения высокой точности оценок производных функций необходимо провести большое количество испытаний, для этого необходимо много времени. ЛП t последовательности позволяют уменьшить дисперсию оценок и значительно сэкономить время проведения испытаний[5, с. 576]. Их свойства позволяют снизить величину стандартной ошибки оценки так, что она становится пропорциональна величине 1/M, а не l/4M, где M - объем выборки [5, с. 576]. Целью их использования является извлечение репрезентативных величин для базовых переменных.

Генераторы ЛПt последовательностей активно используются в экономических исследованиях. В работе [6] анализируется влияние свойств равномерности A и A' [3] на характеристики генератора ЛПt последовательностей при решении многомерных задач. В статье [6] отмечается, что эти свойства обеспечивают добавочные гарантии равномерности для многомерных задач даже при малом количестве пробных точек. Наложение дополнительных свойств равномерности на маломерные проекции ЛП t последовательностей, вдобавок к свойствам равномерности d -мерных последовательностей, может увеличить эффективность ЛП t последовательностей. Генератор ЛП t последовательностей

SobolSeq16384 удовлетворяет дополнительные свойства равномерности.

Более широкое описание различных методов применения ЛПt последовательностей в экономическом моделировании приведено в работе [7].

Проблема применения квазислучайных последовательностей в имитационном моделировании рассматривается в статье [8]. Рассмотрены некоторые статистические свойства ЛП t последовательностей. Показано отличие между квазислучайными и псевдослучайными последовательностями. Псевдослучайные последовательности - это числа из интервала (0,1), полученные с помощью некоторого детерминированного алгоритма, но имеют все свойства случайной последовательности чисел в рамках решаемой задачи [8]. Квазис-лучайной называют последовательность n -мерных точек P1, Р2, ... в единичном кубе, отклонения которых [1, с. 152]

£>(Pi,..., Ря )£ C (n)(ln N )n.

Квазислучайные последовательности, в отличие от псевдослучайных, это равномерно распределенные последовательности, элементы которых не обладают свойством независимости [9].

В работе [9] указывается о возможности построения планов экспериментов на основе ЛП t последовательностей. В [10] изложено оптимальное планирование эксперимента в системе «план эксперимента - структура модели». Приведены статистические свойства планов на основе ЛПt равномерно распределенных последовательностей. Предложены рекомендации по использованию планов экспериментов.

Детальное описание способов построения, теоретических сведений и свойств ЛПt последовательностей можно найти в работах [3, 6, 11-15]. В работе [13] представлены направляющие числа (двоично-рациональные дроби в двоичной системе [1, с. 139], позво-

ляющие генерировать ЛПt последовательности для аппроксимирования интегралов размерностью до 1111. Данные направляющие числа генерируют ЛПt последовательности,

удовлетворяющие свойству А. Однако двумерные проекции этих последовательностей могут иметь неудовлетворительные характеристики равномерности [14]. Приведенные в работе [14] ЛП t последовательности позволяют решить эту проблему. Полученная размерность - 21201. Компания BRODA [15], занимающаяся разработкой и распространением многомерных LDS генераторов, предлагает разработанный проф. И. Соболем SobolSeq370 генератор, который генерирует последовательности для размерности - 370 [15]. Недавно компания BRODA разработала SobolSeq32000 генератор, обладающий лучшими характеристиками и эффективностью, чем предыдущий, с размерностью ЛПГ последовательностей - 32000 [15].

Нерешенные вопросы

Разработка качественных математических моделей без планирования эксперимента невозможна. Поэтому актуальным являются постановка и использование многофакторного эксперимента на основе ЛПt равномерно распределенных последовательностей. Имеются единичные упоминания о применении их для получения математических моделей. В большинстве статей не приводятся конкретные планы экспериментов. Не проведены статистические исследования ЛПt последовательностей для выявления коррелированности между ними и последующего их ранжирования. Использование ЛП t последовательностей

при последовательном планировании экспериментов не разработано. Статистические свойства планов, использующих квазислучайное размещение точек в многофакторном пространстве (по известным публикациям), разработаны слабо.

2. Статистические свойства ЛПТ последовательностей

Планы экспериментов должны соответствовать различным критериям качества. Критерии, позволяющие выбрать структуру математической модели, практически не используются. При выборе структуры математической модели главные эффекты и эффекты взаимодействий должны быть ортогональными или слабо коррелированными.

Величину коррелированности последовательностей будем характеризовать парным коэффициентом корреляции:

вующее размерности исследуемого пространства, N - общее число строк в таблице последовательностей :

N

I йш -X/ )(X¡и -Xj )

и =1

где Хш, Xуи - значение /-той, у-той последовательности в и-той строке таблицы последовательностей, 1 £ / < у £ к, 1 £ и £ N, к - общее число последовательностей, соответст-

N

и=1

_ N

^ Х}п / •

и= 1

Это требование достигается путем равномерного распределения точек плана эксперимента в многофакторном пространстве. ЛП х последовательности в настоящее время являются наиболее равномерно распределенными последовательностями (рис. 1). Исследования показали, что последовательности точек распределены равномерно в диапазонах: N = 1...7; N = 1...15; N = 1...31; N = 1...63 и т.д.

1П*12 1 Р1

- 29

0,875 * 4 29

26 *11 0,75 * 26 *3 „

- 23

■ *14 2*.

0,625 ^ 6

■ 16 9

- 24

Х2 20 1 ,3

МИ-Г ---------------*5 ^19

• 10

- 27 ^ * 2 22 15

30

0,125 - 7

8 * 17 8 25

0 ■■■ 111 111 111 111 1м 111 М1

0 0,125 0,25 0,375 0,5 0,625 0,75 0,875 1

х 1

• 1 2 • 21 • 29

• 18 • 26 • 1 1

• 1 4 • 23 •3

• 16 : • 24 • 9

• 20 • 28 • 1 3

• 1 0 • 19 • 27

2 • 22 • 30 • 1

• 8 • 17 ,,, 25

3

• 1 2 • 38 • 46 • 21 • 29 «( • 55

: 4 1 4! 5о • 18 • 26 • 33 • 41 • 1

■ 36 • 44 • 4 4 • 5 61 • 23 •: 1

• 16 : • 24 4 • 5( 568 I • • 35 • 43

• 20 ■ 28 4 • 5 62 • 3 • 39 • 7

• 32 Е Ю • 1 0 4 • 4 5-7 • 19 • 27

• 5 60 • 22 • 30 • 37 • 45 • 1 5

= 8 • 34 • 17 „и* 25.... 4 • 5 59

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0,1 25 0, 25 0,3 75 0 х ,5 0,6 1 25 0, 75 0,8 75 1

в) °ПЫТ°в - 31 г) опытов - 63

Рис. 1. Распределение точек ЛП х последовательностей Х1 и Х2 в двумерном пространстве

ЛП х последовательности И. М. Соболя обладают лучшими свойствами равномерности распределения, чем любые другие последовательности точек в многомерном единичном кубе. Свойства ЛП х последовательностей [1, 10]:

1. Проекция любой ЛПх последовательности из N точек в к -мерном пространстве на (к - ]) -мерную грань (1 < у < к -1) многомерного единичного куба образует также равномерно распределенную последовательность из N проекций точек.

2. Выбор в качестве точек плана эксперимента в многомерном пространстве ЛПх

равномерно распределеннык последовательностей позволяет получить сравнительно слабо коррелированные главные эффекты и эффекты взаимодействий факторов (| Гу (X, Xу) |< 0,4) при выборе структуры математической модели.

3. Планы экспериментов на основе ЛПх равномерно распределеннык последовательностей позволяют, по сравнению с регулярными планами, получить расположение точек, более близкое к экстремальным значениям поверхности отклика [10, с. 104]. Число уровней si для непрерывных факторов равно числу опытов Nлпх , что позволяет более точно определить структуру получаемой статистической модели.

4. С увеличением числа опытов вероятность получения в плане эксперимента точек, достаточно близких к точкам экстремума и перегиба поверхности отклика, стремится к единице, а коэффициент корреляции Гу между различными эффектами стремится к нулю

[10, с. 104].

Математическое моделирование сложных систем, как правило, осуществляется на основе многофакторный статистических моделей (уравнений регрессии), полученных путем аппроксимации даннык экспериментов, статистических испытаний, экспертный оценок, трудоемких вычислений на ЭВМ. Математические модели особенно необходимы в тех случаях, когда возможности конструирования, производства и эксплуатации, основанные на традиционного физических принципах, исчерпаны или приводят к нецелесообразно большим затратам. Планирование эксперимента на основе ЛП х равномерно распределеннык последовательностей позволяет найти неизвестную структуру математической модели полиномиального вида, практически произвольной сложности, а также решить задачу многокритериальной оптимизации.

Коррелированность факторов весьма типична во множественном регрессионном анализе. При коррелированности факторов главные эффекты и взаимодействия факторов также коррелированы между собой. В таких условиях коэффициенты математической модели полиномиального вида определяются со значительными погрешностями и становятся смещенными. Найденная структура математической модели является неустойчивой, выделение истиннык эффектов становится трудным, решение таких задач неустойчиво. С ростом коррелированности эффектов найденная модель теряет свою прикладную пригодность.

Исследование коррелированности последовательностей проводилось для 51 равномерно распределенной последовательности для диапазонов точек с равномерным распределением: N = 1. 7; N = 1.15; N = 1.31; N = 1.63. Была выявлена значительная коррелированность некоторык последовательностей (рис. 2). Например, для семи опытов коэффициенты парной корреляции (по модулю) последовательностей Х1 и Х6, Х2 и ^20 равны

Гу = 1. Эта коррелированность убывает с ростом количества опытов.

Поэтому применение ЛП х равномерно распределеннык последовательностей в качестве планов экспериментов без специального исследования не представляется возможным. Необходимо найти последовательности, близкие к ортогональным друг относительно друга.

0^гіЛ<1,0 0.8<|гу|<0,9 0,7<|гу|<0,8 З 0.6<|гу|<0,7 я 0,5^гу|<0,6 0.О.4<|гу|<О.5 £ 0,3<|гу|<0,4 2 0.2<|гу|<0.3 0.1 <|гу|<0.2 0.0<|гу|<0,1 |гі)|=0.0

■ 1? )9%

0%

■ 13 41%

0% 0%

0% 0%

0% 0%

7.57«

36,63»/

0 10 20 30 40 50 60 70 80 90

Доли коэффициентов корреляции, % Среднее абсолютных величин коэффициентов корреляции 0,4331. Среднее квадратичное отклонение 0,2852. Опытов - 7

20 30 40 50 60 70 80 90

Доли коэффициентов корреляции, % Среднее абсолютных величин коэффициентов корреляции 0,2350. Среднее квадратичное отклонение 0,2371. Опытов - 15

Среднее абсолютных величин коэффициентов корреляции 0,1623. Среднее квадратичное отклонение 0,2271. Опытов - 31

20 30 40 50 60 70 80 90

Доли коэффициентов корреляции, ®/в

Среднее абсолютных величин коэффициентов корреляции 0,0844. Среднее квадратичное отклонение 0,1755. Опытов - 63

Рис. 2. Распределение коэффициентов корреляции 51 последовательности

С разработанными методами решения регрессионных задач и полученными результатами можно ознакомиться в [16].

3. Выводы

Проведенное исследование показало, что абсолютно не коррелированных последовательностей, на основе ЛП х последовательностей, нет. Однако присутствует значительное количество слабо коррелированных последовательностей. Поэтому построение планов экспериментов может проводиться только после определения всех слабо коррелированных последовательностей и их ранжирования. Построенные таким образом планы экспериментов будут обладать наименьшей коррелированностью эффектов, а полученные на их основе математические модели - соответствовать реальной действительности.

СПИСОК ЛИТЕРАТУРЫ

1. Соболь И.М. Многомерные квадратурные формулы и функции Хаара / Соболь И.М. - М.: Физ-матлит, 1969. - 288 с.

2. Соболь И.М. ЛП-поиск и задачи оптимального проектирования / И.М. Соболь, Р.Б. Статников // Проблемы случайного поиска: сб. статей. — Рига: Зинатне, 1972. - С. 117 — 135.

3. Соболь И.М. Выбор оптимальных параметров в задачах со многими критериями / И.М. Соболь, Р.Б. Статников. - [2-е изд., перераб. и доп.]. - М.: Дрофа, 2006. - 175 с.

4. Statnikov R.B. The Parameter Space Investigation Method Toolkit [with DVD] / R.B. Statnikov, A. Statnikov. - Boston/London: Artech House Publishers, 2011. - 214 p.

5. Халл К. Д. Опционы, фьючерсы и другие производные финансовые инструменты / К. Д. Халл. -[6-е изд.]; пер. с англ. - М.: ООО «И.Д. Вильямс», 2007. - 1056 с.

6. Construction and Comparison of High-Dimensional Sobol’ Generators / I.M. Sobol’, D. Asotsky,

A. Kreinin [et al.] // Wilmott Journal. - 2012. - Vol. 2011, Is.56. - P. 64 - 79.

7. Brotherton-Ratcliffe R. Monte Carlo motoring / R. Brotherton-Ratcliffe // Risk. - 1994. - Vol. 7, N 12. - P. 53 - 57.

8. Ermakov S. On the Quasi-Random Sequence in the Random Processes Modeling Algorithms //

S. Ermakov, T. Tovstik // Focus on Applied Statistics. Nova Science Publishers. - 2003. - P. 91 - 102.

9. Орлов В.А. Новое семейство квазислучайных последовательностей / В.А. Орлов, В.И. Рейзлин // Известия Томского политехнического университета. - 2012. - Т. 320, № 2. - C. 24 - 26.

10. Радченко С.Г. Методология регрессионного анализа / Радченко С.Г. - К.: Корнійчук, 2011. -376 с.

11. Numerical recipes in C: The art of Scientific computing / W.H. Press, S.A. Teukolsky, W.T. Vetterling [et al.]. - [2nd ed.]. - Cambridge University Press, 1992. - 1018 p.

12. Антонов Я.А. Экономичный способ вычисления ЛПГ последовательностей / Я.А. Антонов,

B.М. Салеев // Журн. вычисл. мат. и мат. физ. - 1979. - Т. 19, № 1. - С. 243 - 245.

13. Joe S. Remark on Algorithm 659: Implementing Sobol's quasirandom sequence generator / S. Joe // ACM Trans. Math. Softw. - 2003. - Vol. 29. - P. 49 - 57.

14. Joe S. Constructing Sobol sequences with better two-dimensional projections / S. Joe, F.Y. Kuo // SIAM J. Sci. Comput. - 2008. - Vol. 30. - P. 2635 - 2654.

15. Broda [Електронний ресурс]. - Режим доступу: http: //www.broda. co.uk.

16. Лаборатория экспериментально-статистических методов исследований (ЛЭСМИ) [Электронный ресурс]. - Режим доступа: http://www.n-t.org/sp/lesmi.

Стаття надійшла до редакції 27.09.2013

i Надоели баннеры? Вы всегда можете отключить рекламу.