УДК515.127:519.242
С. Г. Радченко
ИНВАРИАНТНО-ГРУППОВОЙ ПОДХОД В ТЕОРИИ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА
Впервые предложен и разработан метод топологического отображения плана эксперимента из хорошо обусловленного факторного пространства в плохо обусловленное, имеющее произвольную форму с определенными условиями ограничения. На основе понятий теории групп и инвариантности показано сохранение статистических (информационных) свойств плана эксперимента в факторном пространстве произвольной формы в собственной кодированной системе координат.
Ключевые слова: регрессионный анализ, некорректно вание эксперимента, топологическое отображение.
Получение многофакторных статистических моделей с использованием регрессионного анализа в общем случае связано с решением некорректно поставленных задач. Для того чтобы построить статистические модели с наилучшими критериями качества, необходимо применение методов теории планирования эксперимента [1; 2].
В основу классической концепции теории планирования эксперимента положена декартова ортогональная система координат и форма факторного пространства в виде многомерного прямоугольного параллелепипеда.
В его вершинах сочетаются минимальные Х . и макси-
А *Ш1П
мальные Х. уровни варьирования факторов Х при их задании на отрезках Х . < Х < Х . Однако в сложных
.шт I .шах
технических и технологических системах такие сочетания не всегда возможны. Реальные формы факторного пространства нередко не соответствуют стандартным, например кубу, сфере или симплексу, при этом различные факторы Х, X (1 < . <у < к) будут мультиколлинеарны (сопряжены) в многофакторной статистической модели как близкие к линейной зависимости [3]. В этом случае задача становится некорректно поставленной, а основным методом ее решения будет регуляризация [4-6].
Многие исследователи обращают внимание на проблему мультиколлинеарности факторов (эффектов) в регрессионном анализе.
Так, профессор Дж. Райс приходит к следующему выводу: «Если задача плохо обусловлена, то никакие усилия, потраченные на организацию изощренных вычислений, не могут дать правильных ответов, исключая случайности» [7].
По мнению Э. Фёрстера и Б. Ренца, с возрастанием коррелированности факторов вычисленные коэффициенты уравнения регрессии теряют прикладной смысл в попытке их интерпретации, так как их среднеквадратичные ошибки существенно возрастают, а сами коэффициенты становятся очень чувствительными к выборочным наблюдениям, и тогда даже незначительное изменение исходных данных «может привести к очень сильным сдвигам в значениях оценок» [8].
Если решение прикладных задач отягощено исходной мультиколлинеарностью факторов, то использование известных методов планирования эксперимента, дающих наилучшие критерии качества определяемых моделей, невозможно. Необходима разработка метода и алгоритмов устойчивого оценивания коэффициентов статистических моделей в условиях мультиколлинеарности факторов.
поставленные задачи, устойчивое оценивание, планиро-
В данной статье впервые предложены и исследованы методы получения устойчивых структур моделей и устойчивых коэффициентов при исходных некорректных условиях, которые используют топологическое отображение (гомеоморфизм) хорошо обусловленного факторного пространства - прообраза - в плохо обусловленное факторное пространство - образ [9].
Разработаны следующие методы отображения прообраза в образ [10]:
- получения функций отображения прообраза в образ с линейными (рис. 1) и криволинейными (рис. 2, 3) ограничениями факторного пространства в образе. Отображение проводится с использованием алгоритмов ИАБТА4, КАБТА5.1 для линейного ограничения образа [9] и алгоритма ИАБТА4К для криволинейного ограничения [9];
- установления собственной кодированной системы координат в области образа (рис. 4, 5), для чего применяется алгоритм ЯАБТАЮ [9].
На рис. 1.. .3 приведены коэффициенты парной корреляции гдля натуральных значений факторов Хо воб-ласти образа и для собственной кодированной системы координат х . образа, а также для факторов прообраза в натуральной Х и собственной кодированной х системах координат; на рис. 4 натуральная х;пр и кодированная хгпр системы координат эквивалентны друг другу; на рис. 5 х;о является натуральной системой координат образа, а кодированная система координат показана линиями внутри фигуры образа.
Области образа и прообраза факторного пространства с матрицами натуральных и кодированных значений факторов для отображения области прообраза (фигуры Фпр) в область образа (фигуру Фо) (см. рис. 1) приведены в таблице. Функции отображения прообраза /отоб в образ факторного пространства следующие:
Г Х1о = 5,2 + 1,9х1пр - 2,6х2пр - 1,3х1пр Х2пр ,
[Х2о = 5,35 + 1 05х1пр + 2 45Х2пр - 0 85х1прХ2пр .
Однозначность обратного отображения для функций /отоб была установлена с использованием якобиана отображения. В области прообраза якобиан отличен от нуля и, следовательно, обратное отображение является однозначным. Для этого отображения используются алгоритмы ИАБТА4 и ЯАБТА5.1.
Представив область образа факторного пространства в кодированных значениях факторов (см. таблицу), мож-
Рис. 1. Системы натуральных и собственных кодированных координат областей образа и прообраза при линейном ограничении образа (к = 2)
Рис. 2. Системы натуральных и собственных кодированных координат областей образа и прообраза при криволинейном ограничении образа (к = 2)
Рабочие матрицы и планы экспериментов областей образа и прообраза факторного пространства
Области факторного пространства
прообраза образа
Номер точки в натуральных значениях факторов в кодированных значениях факторов Номер точки в натуральных значениях факторов в кодированных значениях факторов
Х1пр Х2пр х1пр х2пр Хю Х2о Х1о Х2о
1пр 3,3 2,9 -1 -1 1о 4,6 1,0 -1 -1
2 •^пр 7,1 2,9 1 -1 2о 11,0 4,8 1 -1
3 -'пр 3,3 7,8 -1 1 3о 2,0 7,6 -1 1
4 пр 7,1 7,8 1 1 4о 3,2 8,0 1 1
5пр 5,2 5,35 0 0 5о 5,2 5,35 0 0
но получить в численном виде функции отображения, связывающие образ с прообразом факторного пространства в натуральных значениях факторов X :
Х1пр = 5,2 + 1,9 Х1о>
Х2пр = 5,35 + 2,45х2о-
(2)
Функции отображения для прообраза факторного пространства в кодированных значениях факторов в численном виде для точки М будут следующими:
(3)
Как в прямом (1), так и в обратном (2), (3) отображениях наблюдается взаимно однозначное соответствие между отображаемыми топологическими пространствами прообраза и образа. Кроме того, в функциях отображения
(1).(3) наглядно представлено взаимно однозначное соответствие между прообразом и образом и наоборот.
Ограничительные линии 1 2 , 3 4 , 1 3 , 2 4 в области
о о о о о о о о
образа (см. рис. 1) топологически эквивалентны ограничительным линиям 1 2 , 3 4, 1 3, 2 4 в области про-
пр пр пр пр пр пр пр пр
образа факторного пространства.
В основу изучения общих свойств геометрических преобразований в виде топологического отображения прообраза факторного пространства в образ независимо от вида ограничения факторного пространства и метода отображения следует положить понятия группы преобразований и их инвариантов.
Группа преобразований - это геометрическое преобразование фигур, удовлетворяющее следующим условиям:
- каждая фигура Ф равна сама себе (свойство рефлексивности). Фигура Ф представляется как фигура Ф0 или Фпр, и каждая из них равна сама себе;
- если фигура Фпр равна фигуре Ф0 (преобразование П), то Ф0 равна Фпр (преобразование П-1) (свойство симметричности). Фигура Фпр получается из заданной фигуры Ф0 по алгоритмам ЯАБТА4 или ЯАБТА4К. Посредством системы функций отображения (1) фигура Фпр отображается в фигуру Ф0. Используя собственную кодированную систему координат для образа (фигуры Ф0), которую можно построить путем отображения собственной кодированной системы координат прообраза (фигуры Фпр) в образ (аналогично таблице), по выражению (2) можно отобразить Ф0 в Фпр;
- если фигура Фпр равна фигуре Фпр (преобразование П1), а Фпр равна Ф0 (преобразование П2), то и Фпр равна Ф0 (свойство транзитивности). Преобразование п2п1 состоит в том, что сначала производится преобразование П1, а затем П2.
Если эти условия выполняются, то геометрические преобразования представляют группу преобразований
[11]. Ее геометрические свойства будут заключаться в сохраняющихся при преобразованиях свойствах фигур образа Ф0 и прообраза Фпр.
Другой вариант областей образа и прообраза факторного пространства с линейным ограничением образа представлен ниже (рис. 6).
Ортогональность факторов друг к другу в прообразе при указанных преобразованиях сохраняется и в нестандартном факторном пространстве образа в собственной кодированной системе координат (см. рис. 1). Это свой-
Рис. 3. Области образа и прообраза при криволинейном ограничении образа (к = 3)
Х1«пр Х
2ипр Х
ство ортогональности является инвариантнымсвойством по отношению к используемому преобразованию. Рассматриваемые преобразования фигур Фпр и Ф0 относятся к теории непрерывных групп преобразований.
Введем понятие инвариантов в исследование отображения прообраза в образ.
Инварианты - это числа или алгебраические выражения, связанные с определенным математическим объектом и остающиеся неизменными при преобразованиях этого объекта или системы отсчета, в которой описывается объект. Характеристика геометрической фигуры и ее свойств осуществляется с помощью чисел и системы координат (или вспомогательной системы отсчета). Величины, описывающие определенную геометрическую фигуру, характеризуют и их отношение к системе координат. Свойства фигуры не должны зависеть от системы координат, т. е. должно выполняться равенство
/(х
1ипр’
кипр
) =/(Х1и
о)?
где X
1 ипр
кипр
- координаты точек плана эксперимента
в собственной кодированной системе координат для фигуры Фпр области прообраза; х1ио, хкио - координаты
точек плана эксперимента в собственной кодированной системе координат для фигуры Фо области образа, которая является отображением фигуры Фпр области прооб-
хк о
раза; f- определенная функция от значений х1(.
1(0 >
координат точек плана эксперимента в собственной кодированной системе координат для фигур Ф.
Изучаемым свойством геометрии факторного пространства в данном исследовании является ортогональность факторов друг к другу. В этом случае функциями f (•) от координат точек фигур Фпр и Фо являются парные коэффициенты корреляции г „(х , х^р) и г (х.о, х ), 1 J і < / < к. В различных формах факторного пространства - прообраза и образа - при использовании в прообразе регулярного плана эксперимента коэффициенты парной корреляции факторов Г(хі( . ),х, ( . )) равняются нулю и в прообразе, и в образе. Рассматриваемая геометрия факторных пространств тесно связана с теорией инвариантов. По Ф. Клейну, каждая геометрия является
теорией инвариантов соответствующей группы преобразований [12].
Разработка теории непрерывных групп преобразований геометрических фигур прообраза Фпр иобраза Ф0, представляющих собой геометрическое выражение плана эксперимента и сохраняющихся при этом их статистических характеристик - инвариантов - в собственных кодированных системах координат, приводит к созданию инвариантно-группового подхода в теории планирования эксперимента. Этот подход позволяет получать многофакторные статистические модели с наилучшими возможными характеристиками для нестандартных областей факторного пространства в именованной системе координат в условиях исходной мультиколлинеарности факторов в образе.
Таким образом, впервые разработана и исследована концепция инвариантно-группового подхода в теории планирования эксперимента. Данный подход ориентирован на использование для произвольных форм факторного пространства планов экспериментов, разработанных для областей в виде прямоугольных параллелепипедов.
Статистические свойства планов экспериментов для стандартных форм факторного пространства прообраза (фигуры Фпр): ортогональность факторов и их главных эффектов друг к другу в группе преобразований в собственных кодированных системах координат прообраза и образа - сохраняются и в нестандартном факторном пространстве образа (фигуры Фо).
Дальнейшее развитие инвариантно-группового подхода в теории планирования эксперимента будет связано с понятием структуры плана эксперимента и сохранением его статистических (информационных) свойств при отображениях прообраза в образ факторных пространств (ЦЕЬ: http://www.n-t.0rg/sp/lesmi/).
Библиографические ссылки
1. Налимов В. В. Теория эксперимента. М. : Наука, 1971.
Рис. 4. Расположение в квадрате точек ЛПт равномерно распределенных последовательностей х1пр = ^5, х2пр = ^7 прообраза факторного пространства
Рис. 5. Произвольная область образа факторного пространства с криволинейными ограничительными линиями и натуральной и собственной системами координат
х
2. Налимов В. В., Голикова Т. И. Логические основания планирования эксперимента. 2-е изд., перераб. и доп. М. : Металлургия, 1981.
3. Половинкин А. И. Основы инженерного творчества : учеб. пособие для студентов втузов. М. : Машиностроение, 1988.
4. Тихонов А. Н., Арсенин В. Я. Методы решения некорректных задач. 3-е изд. М. : Наука, 1986.
5. Лаврентьев М. М., Романов В. Г., Шишатский С. П. Некорректные задачи математической физики и анализа. М. : Наука, 1980.
6. Жуковский Е. Л. Статистическая регуляризация решений обратных некорректно поставленных задач обработки и интерпретации результатов эксперимента // Методы математического моделирования, автоматизация обработки наблюдений и их применения : сборник / под ред. А. Н. Тихонова, А. А. Самарского. М., 1986. С. 47-72.
7. Райс Дж. Матричные вычисления и математическое обеспечение / пер. с англ. О. Б. Арушаняна ; под ред. В. В. Воеводина. М. : Мир, 1984.
8. Фёрстер Э., Ренц Б. Методы корреляционного и регрессионного анализа. Руководство для экономистов / пер. с нем. и предисл. В. М. Ивановой. М. : Финансы и статистика, 1983.
9. Радченко С. Г. Устойчивые методы оценивания статистических моделей : монография. Киев : Санспарель, 2005.
10. Радченко С. Г. Устойчивые методы оценивания статистических моделей // Матеріали ІХ-ої Міжнар. наук. конф. ім. акад. М. Кравчука. Київ, 2002. С. 451-452.
11. Радченко С. Г. Теория групп преобразований в устойчивом статистическом моделировании // Системний аналіз та інформаційні технології : матеріали VII Міжнар. наук.-техн. конф. /НТУУ «КПІ». Київ, 2005. С. 150.
12. Кованцов М. І. Проективна геометрія. 2-е вид., пе-рероб. і доп. Київ : Вищашк, 1985.
Рис. 6. Области образа и прообраза факторного пространства при линейных ограничениях образа
S. G. Radchenko
INVARIANT GROUPAPPROACH IN THE EXPERIMENT DESIGN THEORY
The article for the first time presents method, developedfor topological mapping of the experiment design from a well-conditioned factor space into the ill-conditioned one being of arbitrary shape with certain conditions of its restriction. Basing on such notions as the group theory and invariance the author has shown the preservation ofstatistical properties of the experiment design in the factor space of arbitrary form in its own proper coded coordinate system.
Keywords: regression analysis, ill-posed problems, stable estimation, experiment design, topologic mapping.
©Радченко С. Г., 2011