Научная статья на тему 'Использование эвристики в планировании эксперимента и регрессионном анализе'

Использование эвристики в планировании эксперимента и регрессионном анализе Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
221
47
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
евристика / планування експерименту / регресійний аналіз / эвристика / планирование эксперимента / регрессионный анализ / heuristics / experiment design / regression analysis

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — С.Г. Радченко

Показана необходимость использования эвристических решений в статистических задачах. Приведены разработанные эвристики в планировании эксперимента, регрессионном ана-лизе и получены результаты.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A necessity of using heuristic decisions in stochastic problems has been shown. The developed heuristics in experiment design and regression analysis are given; obtained results are presented.

Текст научной работы на тему «Использование эвристики в планировании эксперимента и регрессионном анализе»

УДК 519.233.5:001.8 С.Г. РАДЧЕНКО*

ИСПОЛЬЗОВАНИЕ ЭВРИСТИКИ В ПЛАНИРОВАНИИ ЭКСПЕРИМЕНТА И РЕГРЕССИОННОМ АНАЛИЗЕ

Национальный технический университет Украины «Киевский политехнический институт», Киев, Украина

Анотація. Показана необхідність використання евристичних рішень у статистичних задачах. Наведено розроблені евристики у плануванні експерименту, регресійному аналізі і отримані результати.

Ключові слова: евристика, планування експерименту, регресійний аналіз.

Аннотация. Показана необходимость использования эвристических решений в статистических задачах. Приведены разработанные эвристики в планировании эксперимента, регрессионном анализе и получены результаты.

Ключевые слова: эвристика, планирование эксперимента, регрессионный анализ.

Abstract. A necessity of using heuristic decisions in stochastic problems has been shown. The developed heuristics in experiment design and regression analysis are given; obtained results are presented. Keywords: heuristics, experiment design, regression analysis.

1. Введение. Постановка задачи

Моделирование сложных систем - технических, технологических, измерительных - в большинстве случаев проводится с использованием экспериментально-статистического подхода, не отрывая изучаемую систему от определенных рамок времени и места, то есть применяется идиографическое описание. В качестве математических методов используется планирование эксперимента и регрессионный анализ.

Необходимая для описания информация - закон распределения случайных погрешностей, статистически значимо влияющие факторы, структура математической модели -часто отсутствует. Получение моделей проводится в условиях неопределенности. С возрастанием сложности систем, их новизны успешное решение задачи усложняется.

Размерно-геометрические и функциональные параметры систем могут быть корре-лированы между собой. Форма факторного пространства может отличаться от многомерного прямоугольного параллелепипеда, сферы, симплекса. В этих случаях приходится применять нестандартные подходы.

Использование традиционных методов планирования эксперимента и регрессионного анализа может быть неэффективным, так как принятые предпосылки могут не выполняться. Приходится разрабатывать новые методы или модифицировать известные. Однако использовать для этого формализованные (математические) решения не всегда возможно ввиду их отсутствия, а разработка новых затруднена.

Цель статьи

В работах автора [1, 2] были разработаны новые методы планирования эксперимента и регрессионного анализа с элементами эвристики, обеспечивающие получение устойчивых решений.

Целью статьи является краткое изложение сути этих методов и представление результатов вычислительного эксперимента.

© Радченко С.Г., 2015

ISSN 1028-9763. Математичні машини і системи, 2015, № 3

87

2. Эвристические решения в планировании эксперимента

Эвристика (с греч. отыскиваю, открываю) - специальные методы решения задач. Под эвристикой понимают организацию процесса продуктивного творческого мышления путем использования интуиции, опыта решения определенного класса задач [3, с. 4-6]. Специалисты, изучающие эвристические методы решения задач, считают, что при этом используется интуитивное мышление. В нем отсутствует четкая структура. Ответ получается без осознания процесса его получения. При аналитическом мышлении отдельные его этапы могут быть сформулированы, приведены в виде алгоритма и формализованы.

Практика решения реальных прикладных задач по моделированию сложных систем показала, что для некоторых сочетаний уровней факторов экономные планы экспериментов в доступных каталогах отсутствуют. При сильном ограничении на число проводимых опытов разработан алгоритм RASTA1 генерирования плана эксперимента с минимально возможной коррелированностью факторов между собой [4, с. 113-115]. За основу плана необходимо взять регулярный план с минимальным числом опытов N , в котором факторы Х^_\ и Х^л будут изменяться на числе уровней s^_i и Эвристическое решение состоит в том, что в каждом из блоков вычеркивается опыт с различным значением уровней фактора Х^_\. В полученном плане эксперимента с числом опытов N - sqr коррелиро-ванность факторов будет минимально возможной. Необходимо рассчитать коррелирован-ность факторов в полученном плане и сделать вывод о его возможном использовании.

В случае отсутствия необходимого плана эксперимента для определенного числа уровней фактора разработан алгоритм RASTA2 [4, с. 114-115]. В качестве базового плана используется многофакторный регулярный план эксперимента с блоковым фактором X бл на ^бл уровнях. Эвристика заключается в том, что для фактора Xф! выбирается фактор Хф2 с числом уровней £ф2, близким к числу уровней 5фі фактора ХФ1 (Аф2 <£ф1), для которого построение многофакторного регулярного плана возможно. По фактору Xбл план эксперимента разбивается на ябл ортогональных блоков. Для фактора X ф 2 в каждом из блоков заменяются различные не одноименные значения уровней на большее значение уровня, отсутствующего у фактора Xф2 и имеющегося у фактора Xф!. Вычисляются коэффициенты парной корреляции rj для всех факторов Xj, Xj полученного плана эксперимента (!</'< j <к;к- число факторов). Анализируется корреляционная матрица, и де-

лается вывод о возможном использовании плана.

Приведенные алгоритмы были использованы при получении планов экспериментов 33х42х91х41//32 (из плана 33х42х81х41//32) и 33х41х51х81х41//32 (из плана 33х41х41х81х41//32) для математического моделирования испытаний летательных аппаратов в естественных уело-виях. Для плана 3 х4 х9 х4 //32 среднее абсолютных величин парных коэффициентов корре-

ляции коррелированных столбцов составляет = 0,236. Для плана 33х41х51х81х41//32

= 0,066, максимальная абсолютная величина

max

= 0,107, max

r,

= 0,392. Все значения следу-

r

V

r

ет считать хорошими.

Для генерирования квазирегулярных квазиравномерных многофакторных планов экспериментов разработан алгоритм RASTA8 [4, с. 115-120]. В качестве исходного плана эксперимента используются ЛПТ равномерно распределенные последовательности [5].

Эвристика генерирования плана эксперимента заключается в отображении определенного подмножества точек по каждой ЛП т равномерно распределенной последовательности £,i в определенный уровень Fj фактора. Генерирование плана эксперимента основа-

88

ISSN 1028-9763. Математичні машини і системи, 2015, № 3

но на гипотезе о равномерном распределении ЛПТ последовательности в многомерном пространстве и равномерном распределении точек различных £,друг относительно друга. Для непрерывных факторов значения уровней определяются по формуле

Хш ~ ^Oniin "І" ^ііи Climax — ^/min ) ,

где Ь,іи - значение ЛПТ равномерно распределенной последовательности для г-го фактора и и -го опыта; 1 < / < А;; 1 <и< Алпт; 0 <^и < 1;

X(min, Ximax - минимальное и максимальное значения i -го фактора в эксперименте.

Для дискретных и качественных факторов интервал изменения ЛПТ равномерно распределенных последовательностей (0, 1) разобьем на Si подынтервалов: 0,1/Si;

1 / £г-, 2 / s,-;...; (Sj -1) / Sj, 1. Каждому подынтервалу присвоим уровни 0,1,..st -1 фактора Xt. В матрице плана ЛП т равномерно распределенных последовательностей каждое значение заменим уровнем 0 или 1, или —1 в зависимости оттого, в какой подынтервал попало значение £, iu.

Проведенный вычислительный эксперимент по полученному плану

12 3 11

2 х3 х4 х5 х7 //32 дал следующие результаты: среднее значение абсолютных величин коэффициентов парной корреляции факторов = 0,06434; максимальная абсолютная величина коэффициента парной корреляции факторов max rij = 0,2000. Коэффициенты парной

корреляции факторов Fi плана эксперимента приведены в табл. 1. Полученные результаты следует считать хорошими.

12 3 11

Таблица 1. Коэффициенты парной корреляции факторов Fi плана 2 х3 х4 х5 х7 //32

Факторы Fi F2 F3 Fa F5 Fe F7 Fg

Fi 1

F2 -0,03626 1

F3 -0,03626 0,0462 1

Fa -0,05929 -0,12293 -0,19382 1

F5 -0,08402 -0,01726 -0,01726 -0,03849 1

Fe -0,08402 0,051793 0,051793 -0,03849 0,2 1

F7 -0,02127 0,055062 0,027094 -0,09288 -0,03037 -0,03037 1

Fg -0,10636 -0,05955 0,132934 -0,06303 0,034841 0,034841 -0,03492 1

В реальных технических и технологических системах факторы могут быть коррели-рованы друг с другом. Одним из разработанных методов устойчивого оценивания статистических моделей является алгоритм RASTA13 [4, с. 187-189]. Он заключается в представлении уровней варьирования фактора, коррелированного с другими факторами, в виде двух факторов: физического и фиктивного. Оба фактора должны быть такими по числу уровней, чтобы с ними можно было оптимально планировать эксперимент.

Один из двух факторов может быть взят как реальный фактор, который имеет физический смысл и исследуется в эксперименте. Второй - как фиктивный (формальный) и не

ISSN 1028-9763. Математичні машини і системи, 2015, № 3

89

имеющий физического смысла. Сочетание двух факторов позволяет функционально представить уровни коррелированного фактора в соответствии с требованиями матрицы плана эксперимента. В рабочей матрице эксперимента коррелированный фактор представляется заданными условиями значений уровней, которые он имеет в исходной постановке задачи.

В матрице плана эксперимента факторы представляются в виде физического Xi и фиктивного Хгф. В рабочей матрице проведения эксперимента коррелированный фактор Xj представляется своими уровнями.

Алгоритм RASTA13 был использован в плане эксперимента 3 *4 *7 *8 //64 при математическом моделировании конструкторских и технологических факторов, влияющих на прочность болтовых соединений из композиционных материалов типа углепластиков [6]. С основным (главным) фактором - номинальное значение диаметра болта X 2(d) = 6; 8; 10; 12 (мм) - коррелированы два фактора: толщина пластин болтового соединения с усилением А^(8С) (мм) и количество прослоек усиления, распределенных равномерно по всей толщине пластины, X 7 (и) (шт).

rij(,X2(d), Х1(8С))= 0,6141, rij(X2(d), X7(и)) = 0,4804.

Уровни варьирования коррелированных факторов А^(5С) и Х7(п) с основным (главным) фактором представляются следующими зависимостями:

Al (8С ) = Х2 (d) + [2 + (1 / 6)Х2 (ё)]Х1ф,

Х7(п) = 2 + [[Х2т/2-2\Х7ф.

Для факторов X2(d), Xіф и X2(d), X7ф области совместного существования -

прямоугольники, и коэффициенты парной корреляции между этими факторами равны нулю, так как факторы в парах ортогональны друг к другу.

По полученной многофакторной модели были найдены оптимальные значения конструкторских и технологических факторов и результаты использованы при производстве самолетов Авиационного научно-технического комплекса им. О.К. Антонова [6].

3. Эвристические решения в регрессионном анализе

Одна из проблем регрессионного анализа - выбор структуры многофакторной модели. В большинстве случаев структура модели исследователю заранее не известна.

За множество структурных элементов - главных эффектов и взаимодействий - принята структура полного факторного эксперимента. В полном факторном эксперименте все эффекты ортогональны друг к другу и их число равно числу опытов полного факторного эксперимента [4, с. 88].

В дробном факторном эксперименте при использовании многофакторного регулярного плана все главные эффекты ортогональны друг к другу. Если выбран план не близкий к насыщенному, то некоторые взаимодействия будут ортогональны к эффектам, введенным в структуру модели, или слабо коррелированы. Предполагается, что все эффекты нормированы. Тогда множество структурных элементов по количеству будет достаточным для адекватной аппроксимации результатов эксперимента, так как план по статистическим свойствам будет близким к плану полного факторного эксперимента.

Эвристичность предложенной структуры модели заключается в том, что любой дробный факторный эксперимент является определенной частью полного факторного экс-

90

ISSN 1028-9763. Математичні машини і системи, 2015, № 3

перимента и структура модели для дробного плана является определенной частью структуры модели для полного факторного эксперимента.

Эвристический подход использовался при получении структуры модели в алгоритме RASTA3 [4, с. 81-82]. Число структурных составляющих Nп , из которых выбирают необходимые элементы, всегда больше числа независимых результатов дробного факторного эксперимента Nд . Выбор подмножества структурных составляющих для получения

модели в общем случае не может быть выполнен однозначно. Однозначному выбору должно способствовать использование соответствующего дробного плана эксперимента и числа его опытов Nд . Если эффекты не коррелированы, то для выбора структуры модели

необходимо использовать алгоритм RASTA3 и программное средство «Планирование, регрессия и анализ моделей» (ПС ПРИАМ).

Принципиальное отличие выбора и введения в структуру модели структурных элементов по алгоритму RASTA3 от опубликованных пошаговых методов заключается в том, что элементы ортогональны или близки к ортогональным и, будучи введенными в модель, не выводятся из нее на последующих шагах формирования модели.

Примеры успешного использования алгоритма RASTA3 при решении реальных прикладных задач по сложным системам приведены в [4, с. 211-290; 7].

4. Выводы

Анализ примеров использования эвристики в планировании эксперимента и регрессионном анализе подтвердил гипотезу о целесообразности подхода в решении неструктурированных (качественно сформулированных) задач.

1. При построении многофакторных статистических моделей реальных сложных систем используются как формализованные математические решения, когда исходная информация о системе известна, так и эвристические неформализованные решения, если необходимая информация отсутствует. Последние получают исходя из содержательного анализа данных с учетом опыта работы исследователя в статистическом моделировании.

2. Эвристические методы должны обеспечивать устойчивое решение множества задач определенного класса. Правильность получения моделей оценивается по их критериям качества.

3. С использованием эвристических методов успешно реализован системный подход в получении многофакторных статистических моделей, который позволяет создавать надежную и устойчивую систему постановки эксперимента и обработки его результатов и получать корректное решение задач.

СПИСОК ЛИТЕРАТУРЫ

1. Лаборатория экспериментально-статистических методов исследований (ЛЭСМИ) [Электронный ресурс]. - Режим доступа: http://www.n-t.org/sp/lesmi.

2. Сайт кафедры «Технология машиностроения» Механико-машиностроительного института Национального технического университета Украины «Киевский политехнический институт» [Электронный ресурс]. - Режим доступа: http://tm-mmi.kpi .ua/index.php/ru/1/publications.

3. Пушкин В.Н. Эвристика - наука о творческом мышлении / Пушкин В.Н. - М.: Политиздат, 1967. - 272 с.

4. Радченко С.Г. Методология регрессионного анализа: монография / Радченко С.Г. - К.: «Корнійчук», 2011. - 376 с.

5. Соболь И.М. Выбор оптимальных параметров в задачах со многими критериями / И.М. Соболь, Р.Б. Статников. - М.: Наука, 1981. - 111 с.

6. Математическое моделирование прочности болтовых соединений композиционных материалов типа углепластиков / С.Г. Радченко, С.Н. Лапач, А.З. Двейрин [и др.] // Открытые информационные

ISSN 1028-9763. Математичні машини і системи, 2015, № 3

91

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

к и

компьютерные интегрированные технологии: сб. научн. тр. - Харьков: «ХАИ», 2014. - Вып. 63. -. 61 - 71.

7. Радченко С.Г. Формализованные и эвристические решения в регрессионном анализе / Радченко С.Г. - К.: «Корнійчук», 2015. - 236 с.

Стаття надійшла до редакції 16.02.2015

92

ISSN 1028-9763. Математичні машини і системи, 2015, № 3

i Надоели баннеры? Вы всегда можете отключить рекламу.