УДК 519.23: 658.562.3
ОСОБЕННОСТИ ПОСТРОЕНИЯ РЕГРЕССИОННЫХ МОДЕЛЕЙ ПРИ МНОГОМЕРНОМ КОНТРОЛЕ ТЕХНОЛОГИЧЕСКОГО ПРОЦЕССА
С.Г.Валеев, В.Н.Клячкин
Рассматриваются методы построения регрессионных моделей для подмножества показателей качества при многомерном статистическом контроле технологического процесса.
This article presents the regression modeling methods for subset of quality variables in multivariate statistical process control (SPC).
ВВЕДЕНИЕ
Статистический контроль технологического процесса -одно из важных направлений сертификации предприятия на соответствие международным стандартам качества ИСО-9000. Основной инструмент такого контроля -контрольная карта процесса. В ситуации, когда качество изготавливаемого изделия определяется множеством показателей, используются многомерные карты [1]. Часто управление технологическим процессом осуществляется таким образом, что управляющее воздействие может быть оказано как на всю совокупность показателей качества, так и отдельно на некоторую группу, являющуюся подмножеством этой совокупности. При этом возникает вопрос о построении регрессионных зависимостей между показателями отдельно управляемой группы и совокупностью остальных показателей качества.
ПОСТАНОВКА ЗАДАЧИ
Рассматривается технологический процесс, статистический контроль которого осуществляется по множеству показателей качества Х1,Х2,...,Хр изготавливаемого изделия. Обычно такой контроль проводится лишь по одному, наиболее важному показателю, с использованием контрольных карт Шухарта: проверяется гипотеза о том, что средние значения этого показателя в мгновенных выборках и размахи (или стандартные отклонения) находятся в допустимых пределах - внутри контрольных границ. Если корреляции между показателями качества невелики, возможен независимый контроль каждого показателя по картам Шухарта.
Использование карт Шухарта при многомерном контроле процесса со значительными корреляциями приводит к погрешностям, связанным с различием доверительных областей и невозможностью достаточно точной оценки вероятности ложной тревоги; результат контроля часто оказывается неадекватным реальной ситуации: возможны как пропуски фактической разладки процесса, так и необоснованные остановки при выходе используемых статистик за пределы контрольных границ. Применение современной компьютерной техники и соответствующего программного обеспечения позволяют проводить многомерный контроль
технологического процесса с коррелированными показателями качества гораздо более эффективными средствами, например, по многомерной контрольной карте Хотеллинга [1].
Если управление технологическим процессом осуществляется таким образом, что управляющее воздействие может быть оказано как на всю совокупность из р показателей качества, так и отдельно на некоторую группу из р0<р показателей, являющуюся подмножеством этой совокупности, то независимый контроль группы этих р0 показателей может привести к тем же погрешностям, что и при использовании карт Шухарта. Возможен многомерный контроль с использованием регрессионных зависимостей между показателями этой группы и подмножеством всех остальных показателей: мониторинг процесса осуществляется по регрессионным остаткам. При этом для диагностики процесса в зависимости от конкретной ситуации могут использоваться как карты Шухарта на регрессионных остатках, так и многомерные карты Хотеллинга. Основная проблема при такой постановке задачи состоит в построении достаточно качественных регрессионных моделей.
Случай многомерного контроля процесса по регрессионным остаткам, когда отдельное управляющее воздействие осуществляется по одному из множества показателей, разработан Д.Хаукинсом [2]. Обзор различных подходов к диагностике случайных процессов на базе регрессионных зависимостей рассмотрен в статье [3].
При контроле подмножества показателей на этапе предварительного анализа процесса по результатам П0 наблюдений строятся регрессионные зависимости между р0 отдельно управляемыми показателями и остальными (р-Р0) показателями технологического процесса
Xj 0 = XP,0 + « 0,
(1)
где Х^ - вектор из щ результатов наблюдений за показателем у^; 70 = 1_____Р0 ; X - регрессионная матрица размерности <И0*Р-Р0+1>, построенная по показателям, не вошедшим в левые части регрессионных моделей; ву 0 -вектор оцениваемых параметров для каждой из р0 моделей; е^ - вектор ошибок наблюдений.
В процессе контроля определяются регрессионные остатки как разности между фактическими (измеренными) значениями показателей Ху0 { в 1-й мгновенной выборке и расчетными значениями, найденными из регрессионной зависимости. Нарушения процесса, связанные с влиянием подмножества из р0 показателей качества, диаг-
48
ISSN 1607-3274 "Радюелектрошка. 1нформатика. Управл1ння" № 2, 2001
ностируются с использованием специальных средств - как правило, многомерных контрольных карт Хотеллинга, кумулятивных сумм или экспоненциально взвешенных скользящих средних. При наличии нарушений технологического процесса соответствующие значения статистики оказываются вне контрольной границы, что свидетельствует о необходимости управляющего воздействия именно по этой группе показателей. Одновременно предполагается ведение и многомерных карт по всем показателям, что позволит при необходимости обеспечить вмешательство в процесс в целом.
МЕТОДОЛОГИЯ АДАПТИВНОГО РЕГРЕССИОННОГО МОДЕЛИРОВАНИЯ [4]
В соответствии с этой концепцией на начальном этапе предусматривается применение линейной по оцениваемым параметрам модели и вычислительной схемы метода наименьших квадратов (МНК); на последующих этапах: проверка предположений соблюдения гипотез регрессионного анализа (РА) - МНК, ранжирование нарушений по степени искажения свойств наилучших линейных оценок (НЛО) параметров или прогноза в зависимости от назначения модели (прогноз, описание или описание и прогноз), последовательную адаптацию к нарушениям путем применения соответствующих вычислительных процедур, повторные проверки нарушений и ранжирование при необходимости. Основными элементами подхода регрессионного моделирования, формирующими НЛО-оценки параметров и прогноза, являются выборка, функция, методы оценивания и структурной идентификации, а также вычислительные сценарии адаптации.
Выделяется пять основных групп возможных нарушений. Проанализируем, в какой степени эти нарушения возможны при многомерном контроле.
Первая группа - это предположения о выборке. Предполагается, что объем наблюдений достаточен, при организации наблюдений обеспечивается случайный отбор, ряды наблюдений однородны и грубые промахи отсутствуют. Соблюдение этих предположений по возможности обеспечивается при проведении испытаний. Заметим, что объем наблюдений в нашей постановке всегда можно обеспечить достаточно большим: измерения проводятся не в рамках специально поставленного эксперимента, а по ходу реального отлаженного технологического процесса: нет смысла приступать к многомерному статистическому контролю, пока не собран достаточный объем данных о его особенностях. Это тем более важно, что и параметры карты Хотеллинга для контроля всей совокупности показателей процесса также оцениваются по обучающей выборке, полученной при отлаженном процессе.
Вторая группа предположений - о векторе оцениваемых параметров в . Предполагается, что регрессионная модель линейна по параметрам, на этот вектор не наложено ограничений, вектор содержит аддитивную постоянную во ,
элементы вектора вычисляются с пренебрежимо малой компьютерной погрешностью. Все предположения этой группы, кроме первого, как правило, справедливы в рассматриваемой задаче. Предположение о линейности моде-
ли по параметрам выполняется при использовании аддитивных линейных, полиномиальных и ряда других моделей. При использовании степенных (мультипликативных) моделей линейность по параметрам обеспечивается логарифмированием левой и правой части зависимости. Однако иногда имеется априорная информация о физической нелинейности, не позволяющей линеаризовать модель, и в этих случаях используются специальные методы нелинейного регрессионного анализа. Предполагается, что в постулируемой линейной модели полностью включены все значимые члены; при пропуске какого-либо фактора оценка параметров окажется смещенной, но эффективной. При избытке факторов вектор параметров останется несмещенным, но эффективность его понизится. Оба эти предположения на практике нарушаются.
Два предположения касаются регрессионной матрицы X: регрессоры являются линейно независимыми векторами этой матрицы (отсутствует мультиколлинеарность), и элементы матрицы X не являются случайными величинами. В рассматриваемой ситуации контроля технологического процесса оба этим предположения могут нарушаться. Мультиколлинеарность имеет место в связи с заведомо предполагаемой коррелированностью показателей качества. Однако, учитывая, что модели в данном случае не предполагают интерпретации, мультиколлинеарность можно исключить путем перехода от реальных значений факторов к их главным компонентам. Использование случайных значений факторов вместо детерминированных приводит к снижению эффективности оценок; для адаптации прибегают к специальным методам оценивания [5].
Предположения о векторе ошибок £ : ошибки являются случайными и входят в регрессионную модель аддитивно; они распределены по нормальному закону, не содержат систематического смещения, имеют постоянную дисперсию и некоррелированы между собой. Очевидно, что при использовании степенной модели ошибка входит в уравнение мультипликативно, а после логарифмирования имеет логнормальное распределение. Нарушение нормальности приводит к некоторому снижению устойчивости Е и ?-кри-териев (при проверке значимости модели в целом и каждого регрессора в отдельности). При рассмотрении нескольких конкурирующих структур ненормальность будет примерно в одинаковой степени влиять на все Е-статисти-ки. Иногда нарушение этого предположения можно компенсировать использованием робастных методов [6]. При непостоянстве дисперсии (и известных весах каждого наблюдения) может быть использован взвешенный МНК, а при наличии корреляционных связей между ошибками -обобщенный МНК.
Два предположения относятся к вектору откликов У. Предполагается, что метод идентификации оптимального набора независимых переменных является точным для этого вектора. Избыточность структуры модели может быть устранена использованием метода полного перебора, или, в меньшей степени, использованием пошаговой регрессии. Также предполагается, что для многооткликовой задачи правомерно использование МНК к каждой из регрессий в отдельности. Нарушение этого предположения снижает эффективность оценок параметров при сохранении
свойства несмещенности. При малых корреляциях между откликами отдельное использование МНК к каждому уравнению (псевдонезависимые регрессии) приемлемо. При значительных корреляциях может возникнуть необходимость перехода к специальным методам - регрессиям на откликах - главных компонентах или двухшаговому методу наименьших квадратов, что рассматривается ниже.
ПСЕВДОНЕЗАВИСИМЫЕ РЕГРЕССИИ
На первом шаге постулируется форма зависимости; в отсутствии априорной информации о физическом характере зависимости целесообразно опробовать несколько вариантов, например, линейную по ву и х у
хо = во+ Ев/у , Уо = 1-, Ро, у = (Ро + 1 )'•••' р ,(2)
(здесь предполагается, что показатели процесса пронумерованы таким образом, что первые - ро показателей входят в состав отдельно управляемого подмножества); квадратичную по Ху
ху о = во+Щху+т^х,, (3)
степенную ("внутренне" линейную по ву) модели
Хуо = воПхв. (4)
При небольших корреляциях между откликами хуо (например, до о,5) результаты могут оказаться вполне удовлетворительными, если рассматривать многоотклико-вые модели как независимые регрессии. При идентификации параметров каждого из ро уравнений целесообразно, учитывая, что модели не предназначены для интерпретации, перейти от действительных значений факторов ху, у=(Ро+1),", Р, вначале к стандартизованным значениям
2у = (ху -ху)/'у , (5)
('у - стандартное отклонение), а затем, с целью исключения мультиколлинеарности, к главным компонентам, матрица которых
Е = ZЛ-1 /2 Ут, (6)
где Ъ - матрица стандартизованных значений факторов, Л -диагональная матрица собственных чисел, V - матрица нормированных собственных векторов, то есть строить регрессии в зависимости от главных компонент
ху о = /(¥,ву о) . (7)
После оценки параметров по МНК
у = ()-1ЕтХ,о , (8)
(Ьуо - вектор оценок параметров вуо) и проверки
значимости модели по Е-критерию проводится идентификация структур для зависимостей (2) - (4). При небольшом количестве регрессоров наиболее точный метод структурной идентификации - полный перебор. На практике чаще используются методы пошаговой регрессии, наиболее эффективным из которых является метод включения с исключением: на каждом этапе включения проверяется, не появляется ли в связи с этим в модели незначимые члены, подлежащие исключению.
ДВУХШАГОВЫЙ МЕТОД
НАИМЕНЬШИХ КВАДРАТОВ
При значительных корреляциях между откликами более эффективным методом оценивания системы регрессионных уравнений (1) может оказаться двухшаговый МНК [5], при котором вместо модели (7) рассматривается модель
хуо = А р, Хко, р,. о); у о, ко = 1 •••> Ро; ко *Уо. (9)
На первом шаге оцениваются параметры модели (7), с их помощью рассчитываются прогнозируемые отклики Хко . Для получения качественных результатов важно выбрать наилучшую из рассмотренных выше моделей (2)-(4). При структурно-параметрической идентификации параметров уравнений (9) значения Хко рассматриваются как обычные регрессоры.
РЕГРЕССИИ НА ОТКЛИКАХ - ГЛАВНЫХ
КОМПОНЕНТАХ
Иногда при значительных корреляциях между откликами целесообразно перейти от фактически наблюдаемых откликов к их главным компонентам. По аналогии с (6) имеем
Ео = ^оЛ-о172УJ0, к = 1>->Ро, (1о)
где матрицы собственных чисел Л о и нормированных собственных векторов У о определяются по корреляционной матрице для откликов Х о .
Такой подход часто позволяет снизить размерность задачи по откликам с Ро до единицы, то есть вести контроль лишь по одной главной компоненте. В этом случае рассматриваемая отдельно управляемая группа показателей процесса будет контролироваться по регрессионным остаткам с использованием обычной карты Шухарта (вместо многомерной карты Хотеллинга).
ВЫБОР НАИЛУЧШЕЙ МОДЕЛИ
Предполагается, что при получении однооткликовых регрессий выполняются соответствующие процедуры анализа соблюдений применения РА-МНК и адаптация при их существенном нарушении.
50
1бо7-3274 "Радюелектрошка. 1нформатика. Управл1ння" № 2, 2оо1
Рассмотрим подробнее ситуацию по псевдонезависимым регрессиям. Пусть получены оптимальные структуры для каждой из трех моделей - линейной, полиномиальной и степенной (например, на факторах - главных компонентах). Возникает вопрос о выборе одной из них. Наиболее распространенной является оценка качества модели по внутренним критериям - ^-статистике, коэффициенту детерминации и другим. Если же, как в нашем случае, модель предназначена для прогноза, то более объективную информацию дают внешние критерии, когда качество модели определяется по результатам исследования части выборки, не использованной для построения модели (контрольная выборка).
Предположим, что всего сделано п наблюдений; для построения регрессионных моделей использовано П0 их них. Внешней мерой качества может служить внешняя стандартная ошибка для регрессии по показателю с номером у
Од = [ХЛг2/(п - п0)]1 /2, I = 1,_,(п - п0), (11)
где 1-е расхождение
Д xj0, i - x'j0, i,
(12)
этот результат можно было бы сравнить с моделями, полученными на измеренных откликах, предлагается преобразовать результат г-го наблюдения в контрольной выборке Ху0 г и результат, прогнозируемый по оцениваемой модели Х'70, г в главные компоненты с использованием формулы (10). Полученное значение Од2 - внешняя стандартная ошибка для моделей, полученных на измеренных откликах, приведенная к главным компонентам. Для принятия решения о качестве всей совокупности моделей может быть использована средняя ошибка
о = Ео
Д/0/p0 •
(13)
(Ху0 г - результат г-го наблюдения в контрольной выборке; Х70, г - результат, прогнозируемый по оцениваемой модели).
Этот результат может быть уточнен путем использования нескольких разбиений опытных данных на обучающую и контрольную выборки (и усреднения полученных данных), или с помощью процедуры скользящего экзамена, когда в обучающую выборку последовательно включаются все наблюдения, кроме одного, используемого для контроля.
Подобным образом, используя зависимости (11)-(12), можно выбрать оптимальную модель и среди совокупности двух типов наборов, полученных по псевдонезависимым регрессиям и моделям, найденным с помощью двухшагового метода наименьших квадратов (общим в этих наборах является то обстоятельство, что откликами являются измеренные значения р0 показателей качества). Заметим, что для разных откликов это могут быть совершенно разные модели: например, для первого из р0 откликов оптимальной может оказаться степенная модель, полученная на базе псевдонезависимых регрессий, а для второго - линейная по двухшаговому методу наименьших квадратов, и т.д.
Сложнее обстоит вопрос с принятием решения, когда делается выбор между моделями, полученными на измеренных откликах и откликах - главных компонентах. Предположим, что отобрано р0 моделей на измеренных откликах и р0 — Р0 на откликах - главных компонентах. Какую из двух совокупностей предпочесть?
Непосредственно внешняя стандартная ошибка для регрессий с откликами - главными компонентами Од1 оценивается по той же формуле (11), где г-е расхождение определяется по величинам /у0 { и у ^. Для того, чтобы
ОЦЕНКА ХАРАКТЕРИСТИК РЕГРЕССИОННЫХ ОСТАТКОВ
При выборе регрессионной модели необходимо убедиться в том, что остатки е1 у0 г = (1, _, п0 ;
70 =1, _,Р0) имеют нормальное распределение по каждому из показателей, и оценить элементы Яф^ (0, ¿0=1,...,Р0) ковариационную матрицу 5е остатков
Яеу0к0 = ЕЕег,у0ег, к0/(п0 - 1) •
Проверка качества оценивания ковариационной матрицы остатков также может быть проведена с использованием контрольной выборки.
Предположим, что регрессионная модель найдена в виде Ху0 = /(Р, ву0) . Для диагностики процесса в 1-й
мгновенной выборке определяются стандартизованные остатки для каждого из Р0 показателей
еу0, г = (Ху0, г-Р'Ру0))ХЯу0,
из которых строится вектор остатков ег используемый в качестве исходных данных для построения карты Хотеллинга.
ПЕРЕЧЕНЬ ССЫЛОК
1. Клячкин В.Н. Контроль технологического процесса с использованием карты Хотеллинга // Радиоэлектроника. Информатика. Управление. 2001. №1. С.92-94
2. Hawkins D.M. Regression adjustment for Variables in Multivariate Quality Control // Journal of Quality Technology, 1994, 26(3), pp.197-208.
3. Быховский Б.E., Дарховский Б.С. Проблемы и методы вероятностной диагностики // Автоматика и телемеханика. 1999. №8. С. 3-50.
4. Валеев С.Г. Регрессионное моделирование при обработке наблюдений. - М.: Наука, 1991. - 272 с. (2-е изд.: Казань: ФЭН, 2001. - 296 с.)
5. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. - М.: ЮНИТИ, 1998. - 1022 с.
6. Валеев С.Г., Клячкин В.Н. Численное исследование эффективности применения робастных методов при обработке аэрокосмических снимков // Известия вузов. Геодезия и аэрофотосъемка. 1995. №3. С.92-101
7. Валеев С.Г., Клячкин В.Н. Регрессионное моделирование технологического процесса с коррелированными показателями качества // "Качество". Материалы научно-технической конференции. - М.: Фонд "Качество", 2001. С.119-121.