Научная статья на тему 'Планирование и первичная обработка результатов статистического машинного эксперимента на основе множественного корреляционно-регрессионного анализа'

Планирование и первичная обработка результатов статистического машинного эксперимента на основе множественного корреляционно-регрессионного анализа Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
312
137
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТАТИСТИЧЕСКИЙ МАШИННЫЙ ЭКСПЕРИМЕНТ / ДЕТЕРМИНИРОВАННАЯ МОДЕЛЬ / АНАЛИЗ ОДНОМЕРНЫХ МАССИВОВ / СТАТИСТИЧЕСКОЕ ПРОГНОЗИРОВАНИЕ ВЕРОЯТНОСТИ БРАКА / STATISTICAL MACHINE EXPERIMENT / THE DETERMINED MODEL / THE ANALYSIS OF ONE-DIMENSIONAL MASSIFS / STATISTICAL FORECASTING OF PROBABILITY OF DEFECTS

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Панфилов Геннадий Васильевич, Недошивин Сергей Владимирович, Калинин Сергей Сергеевич

Предложена методика проведения статистического машинного эксперимента при анализе исследуемой технологической системы с детерминированной моделью. В основу методики положен алгоритм обработки модельных экспериментальных результатов с помощью математического аппарата анализа одномерных числовых массивов, статистического прогнозирования вероятности бракам. Подробно обоснованы начальные этапы методики.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Панфилов Геннадий Васильевич, Недошивин Сергей Владимирович, Калинин Сергей Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PLANNING AND PREPROCESSING OF RESULTS OF STATISTICAL MACHINE EXPERIMENTON THE BASIS OF THE MULTIPLE CORRELATION AND REGRESSION ANALYSIS

The technique of carrying out statistical machine experiment is offered in the analysis of the studied technological system with the determined model. The algorithm of processing of model experimental results by means of mathematical apparatus of the analysis of one-dimensional numerical massifs, statistical forecasting of probability of defects is the basis for a technique. The initial stages of a technique are in detail proved.

Текст научной работы на тему «Планирование и первичная обработка результатов статистического машинного эксперимента на основе множественного корреляционно-регрессионного анализа»

УДК 004.021

ПЛАНИРОВАНИЕ И ПЕРВИЧНАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ СТАТИСТИЧЕСКОГО МАШИННОГО ЭКСПЕРИМЕНТА НА ОСНОВЕ МНОЖЕСТВЕННОГО КОРРЕЛЯЦИОННО-РЕГРЕССИОННОГО АНАЛИЗА

Г.В. Панфилов, С.В. Недотивин, С.С. Калинин

Предложена методика проведения статистического машинного эксперимента при анализе исследуемой технологической системы с детерминированной моделью. В основу методики положен алгоритм обработки модельных экспериментальных результатов с помощью математического аппарата анализа одномерных числовых массивов, статистического прогнозирования вероятности бракам. Подробно обоснованы начальные этапы методики.

Ключевые слова: статистический машинный эксперимент, детерминированная модель, анализ одномерных массивов, статистическое прогнозирование вероятности брака.

В работе [1] рассмотрен вариант планирования, проведения и обработки результатов статистического машинного эксперимента (СМЭ) для углубленного анализа различных исходных исследуемых систем (ИИС) с детерминированными моделями (ДМ), например, технологических операций пластического формообразования. Алгоритм реализации такого СМЭ базируется на математическом аппарате планируемого многофакторного эксперимента. Использование указанного активного СМЭ для изучения предельных технологических возможностей холодной штамповки сердечников пуль разъемным инструментом представлено в работе [2]. Однако в ряде случаев анализа ИИС с детерминированными моделями более эффективный результат может дать статистический машинный эксперимент, в котором обработка модельных результатов проводится на основе математического аппарата классического множественного корреляционнорегрессионного анализа.

Следует отметить, что данный тип СМЭ с ДМ возможно и целесообразно использовать, когда исследуемая детерминированная модель позволяет за относительно непродолжительное время осуществить необходимое большое количество вычислительных циклов, присущих разработанной методике статистического моделирования. Ее преимущества по отношению к прочим алгоритмам статистического машинного эксперимента выявляются, если:

- известно, что варьируемые факторы имеют специфические законы распределения частных значений в выборках и эта особенность должна быть учтена при получении модельных результатов, т. е. при выводе и статистическом обосновании (с помощью соответствующих критериев) иско-

мых выборочных уравнений регрессии;

- требуется высокий уровень достоверности получаемых результатов, что обеспечивается большим количеством модельных опытов, проводимых через малые шаги счета, на которые разбиваются интервалы варьирования каждого фактора;

- в исследуемой детерминированной модели (системе исходных функциональных уравнений, подлежащих совместному решению) нет констант, которые также целесообразно варьировать, но в небольших диапазонах, превращая их в «плавающие контрольные факторы» [1], а саму детерминированную модель — в стохастическую, что позволяет при обработке результатов условных опытов использовать алгоритм планируемого многофакторного эксперимента.

Разработанная методика подготовки и проведения СМЭ с ДМ на основе использования математического аппарата множественного корреляционно-регрессионного анализа содержит следующие основные этапы.

1. Составление плана эксперимента и получение первичной модельной информации. Как и в альтернативных вариантах статистического машинного эксперимента, первый этап предлагаемого варианта [1] заключается в выборе результативных признаков (выходных параметров), установлении комплекса (факторов-признаков) варьируемых факторов хI (I = 1...п) и обосновании возможных диапазонов их изменения. Область факторного пространства целесообразно оформлять в виде следующей таблицы (табл. 1).

Таблица 1

Область факторного пространства

№ п/п Наименование варьируемого фактора Обозн. фактора Един. изм. Возможный диапазон изменения

1 Наименование первого фактора X1 мм Xmin max •Л-1 • • • «д1

2 Наименование второго фактора х2 °С min max X2 • •• X2

• • • • • • • • •

n Наименование п-го фактора Xn кг Xmin max Xn ••• Xn

Аналогично использованию математического аппарата планируемого многофакторного эксперимента [1] на этом этапе с помощью генератора случайных чисел (метод Монте-Карло) по присущему каждому фактору закону распределения в обоснованных предварительно возможных

диапазонах варьирования получают числовые массивы частных значений этих факторов х/ (у = 1...т). Данные выборки каждого фактора оформляют в виде отдельных столбцов таблицы исходных данных (табл. 2), в которой каждая строка представляет собой условия проведения каждого модельного опыта, и соответственно количество строк соответствует объему указанных частных выборок и общему количеству модельных опытов. При этом, учитывая состоятельность выборочных оценок, для получения более достоверных результатов в отличие от варианта с использованием методики планируемого многофакторного эксперимента и независимо от числа варьируемых факторов количество модельных опытов (вычислительных циклов) целесообразно делать большим (до т = 500...1000).

Таблица 2

Таблица модельных опытов_________________________

№ Варьируемые факторы х/ Выходные параметры ук

опыта Хі Х2 Хп У1 У2 У1

1 1 1 1 1 1 1

1 Хі Х2 Хп У У2 У1

о 2 2 2 2 2 2

2 Хі Х2 Хп У1 У2 У1

• • • • • • • • • • •

т т т т т т

т Хі Х2 Хп У1 У2 Уі

Числовые данные каждой строки подставляют в детерминированную теоретическую модель и рассчитывают соответствующие частные

значения выходных параметров ук (к = 1...1), которые оформляют в виде

последних столбцов указанной табл. 2.

Если детерминированная модель содержит величины, представленные в виде некоторых констант при физической постановке (т. е. при введении определенных допущений и упрощений, позволяющих получить решение системы уравнений, составляющих эту детерминированную модель), то они в предлагаемой методике в случае необходимости включаются в расчетные циклы, как обычные факторы со своими столбцами, но варьируются в относительно малых диапазонах.

Если таких констант нет или их нецелесообразно варьировать, то в отличие от СМЭ на базе планируемого многофакторного эксперимента в предлагаемой методике не требуется проведения каких-либо искусственных действий для превращения результатов статистического машинного эксперимента с детерминированной моделью в случайные величины, и сформированная указанным образом таблица исходных данных формально является аналогом результатов натурного многофакторного экспе-

римента.

2. Статистический анализ полученных одномерных массивов.

В случае, когда представляют интерес количественные параметры распределения числового массива какого-либо модельного выходного параметра, то они определяются путем проведения классического анализа этого одномерного массива с установлением гистограммы, полигона распределения и коробчатой диаграммы (рисунок), сглаживаниям полученного эмпирического распределения по какому-либо известному теоретическому закону и расчета количественных параметров (описательных статистик) этого распределения [3].

Г истограмма распределения

Диаграмма нормального распределения

Наблюдаемые значения

Наблюдаемые значения

Коробчатая диаграмма

350,

300,

250,

200,

Пример графического оформления диаграмм по итогам статистического моделирования

Таблица 3

Результаты проверки эмпирического распределения на соответствие нормальному закону по критерию Колмогорова - Смирнова (у)

Объем выборки N 500

Параметры нормального распределения Среднее значение, мкм 222,209

Стд.* отклонение, мкм 39,332

Разности экстремумов Модуль 0,032

Положительные 0,023

Отрицательные - 0,032

Статистика 2 Колмогорова-Смирнова 0,396

Двухсторонняя статистическая значимость (вероятность ошибки р ) 0,998

* Стд. - средняя квадратичесская (стандартная) ошибка вычисленной точной оценки, в данном случае выборочного среднего.

Таблица 4

Пример оформления описательных статистикраспределения(У1)

Объем выборки N Валидные 500

Пропущенные 0

Среднее модельной выборки, мкм 222,2093

Стд. * ошибка средней выборки, мкм 3,2114

Медиана, мкм 222,25

95%-ный доверительный интервал для среднего Нижняя граница, мкм 215,8636

Верхняя граница, мкм 228,5551

Мода, мкм 171,0

Стд. * отклонение, мкм 39,33151

Дисперсия, мкм2 1546,968

Асимметрия - 0,152

Стд. * ошибка асимметрии 0,198

Эксцесс 0,58

Стд. * ошибка эксцесса 0,394

Размах, мкм 258,4

Минимум, мкм 79,6

Максимум, мкм 338,

Квартили, мкм

01 25 195,8

02 50 222,25

0з 75 250,1

Межквартильный размах, мкм 55,28

* Стд. - средняя квадратичесская (стандартная) ошибка вычисленной точной оценки, в данном случае выборочного среднего.

Если, например, выходной параметр у1 измеряется в микрометрах,

а в результате проверки полученного эмпирического распределения на соответствие нормальному закону с помощью критерия Колмогорова -Смирнова получен утвердительный результат, то результаты этой проверки целесообразно оформить в виде табл. 3. Расчет количественных параметров распределения удобно представлять в форме табл. 4.

3. Прогнозирование параметров качества и уровня вероятности брака. Расчет типовых количественных параметров распределения и, в частности, центра группирования частных значений модельной совокупности каждого из выходных параметров Уk (среднего модельной выборки) и

основного показателя рассеивания частных значений выходных параметров указанной модельной совокупности вокруг своего центра группирования Syk (дисперсии модельной выборки) не позволяет оценить соответствие результатов моделирования ИИС (например, проектируемого технологического процесса) чертежу изготавливаемой детали или техническим условиям на ее изготовление. Поэтому рассчитывают дополнительные показатели, характеризующие индексы способности моделируемого технологического процесса. В соответствии с государственными стандартами на статистические методы управления качеством продукции [4] такими показателями в случае нормального закона распределения, являются: показатели рассеивания

ВКГ - НКГ 6&

где ВКГ и НКГ - соответственно верхняя и нижняя контрольная границы; показатели настроенности технологической системы

Cpk =(1 - k )• Cp, (2)

где

(ВКГ + НКГ) /2 - ~Уь

Ср =———, (1)

k =

(3)

( ВКГ - НКГ ) / 2

Показатели рассеивания характеризуют отношение допустимого диапазона рассеивания действительных значений исследуемого признака к возможному диапазону его рассеивания, определяемому по результатам проводимого модельного или натурного эксперимента. Показатели настроенности технологической системы характеризуют величину смещения вершины кривой эмпирического нормального распределения относительно середины поля допуска.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Значениям ВКГ и НКГ могут соответствовать контролируемый наибольший предельный размер и наименьший предельный размер, верхнее отклонение и нижнее отклонение номинального размера. Разность любых этих значений дает величину допуска на признак качества. Принимать

в зависимости (1) знаменатель равным размаху выборки, в данном случае модельной Ry , нельзя, поскольку в общем случае предельное поле рассеивания практически никогда не равно размаху. Однако если, как в зависимости (1), за величину возможного модельного поля рассеивания (по правилу 3 сигм) принять 6s, то границы этого поля будут колебаться от одной выборки к другой, и в одних случаях они будут охватывать больше 99,73 % всей площади, ограниченной кривой модельного распределения, а в других - меньше, поскольку yk и s сами являются случайными величинами.

Задача качественного прогнозирования возможностей исследуемого технологического процесса заключается в том, чтобы устанавливаемое экспериментальное поле допуска охватывало не менее 99,73 % всей площади, охватываемой генеральной кривой, или другой процент, позволяющий определить доверительные границы этой генеральной кривой. Таким важным статистическим параметром является величина условного допуска, которая характерна для данного технологического процесса.

При использовании статистического приемочного контроля потребитель и поставщик договариваются о двух уровнях качества [5]: p^ pp.

Партии с уровнем качества p £ pa считаются заведомо хорошими, а партии с уровнем качества p > p p- заведомо плохими. Интервал pa £ p £ p p

считается зоной неопределенности. Партии с таким уровнем качества считаются еще допустимыми. Величину pa называют приемлемым уровнем качества (в переводной литературе и международных стандартах можно встретить обозначение AQL - Acceptable Quality Level), а величину p p-

браковочным уровнем качества (RQL - Rejectable Quality Level).

К плану контроля предъявляются требования, состоящие в том, что хорошие партии должны по возможности приниматься, а плохие - брако-ваться.Количественно эти требования выражаются в том, что вероятность принятия партии с уровнем p £ pa должна быть не меньше величины 1 - а, а вероятность приемки партий, у которых p > pp, не должна превышать величины p.Величины а и p называются соответственно рисками поставщика (производителя) и потребителя и представляют собой вероятности ошибок первого и второго рода. Другими словами, риск поставщика a- это вероятность того, что хорошая партия будет забракована, а риск потребителя p- это вероятность того, что плохая партия будет принята. На практике величины а и p выбираются равными 0,1; 0,05; 0,01.

Пример расчета условных допусков для различных значений рисков производителя и потребителя с последующим вычислением показателей рассеивания и настроенности технологической системы (в несколько ином математическом представлении), сопоставления их с соответствующими

предельными значениями и прогнозирования процентного уровня вероятности брака приведен в работе [6].

На последующих заключительных этапах разработанной методики планирования, проведения и обработки результатов статистического машинного эксперимента предполагается непосредственная реализация множественного корреляционно-регрессионного анализа, а также выявление из значительной совокупности именно тех варьируемых факторов, целенаправленная корректировка численных значений которых позволит повысить качество изготавливаемых деталей и уменьшить уровень вероятности брака.

Список литературы

1. Панфилов Г.В., Недошивин С.В., Лазарев А.А. Активный статистический анализ систем с теоретическими моделями проведения машинного эксперимента // Известия ТулГУ. Технические науки. Тула: Изд-во ТулГУ. 2014. Вып. 5. С. 98-113.

2. Панфилов Г.В., Недошивин С.В., Перминов Д.А. Применение статистического машинного эксперимента для исследования теоретической модели штамповки сердечников пуль // Известия ТулГУ. Технические науки. Тула: Изд-во ТулГУ. 2011. Вып. 6. С. 61-74.

3. Кухарь В. Д., Панфилов Р.Г., Панов А.А. Статистическое моделирование качества двухоперационного пластического формообразования сферической шайбы // Известия ТулГУ. Технические науки. Тула: Изд-во ТулГУ. 2009. Вып. 3. С. 19-27.

4. ГОСТ Р50779.44-2001. Статистические методы. Показатели возможностей процессов. Основные методы расчета.

5. ГОСТ Р 50779.10-2000. Статистические методы. Вероятность и основы статистики. Термины и определения. Введ. 29.12.2000. М.: Стан-дартинформ, 2005. 46 с.

6. Кухарь В. Д., Парамонов Р. А., Панов А.А. Статистическое прогнозирование точности эксцентриситета сферических шайб // Известия ТулГУ. Технические науки. Тула: Изд-во ТулГУ. 2009. Вып. 1. С. 181-189.

7. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики: учебник. М.: ИНФРА-М, 2009. 416 с.

8. Четыркин Е.М., Калихман И.Л. Вероятность и статистика. М.: Финансы и статистика, 1982. 319 с.

Панфилов Геннадий Васильевич, д-р техн. наук, проф., tulpan.2000@yandex.т, Россия, Тула, Тульский государственный университет,

Недошивин Сергей Владимирович, канд. техн. наук, доц., Archon80@mail.т, Россия, Тула, Тульский государственный университет,

Калинин Сергей Сергеевич, асп., [email protected]. Россия, Тула, Тульский государственный университет

PLANNING AND PREPROCESSING OF RESULTSOF STATISTICAL MACHINE EXPERIMENTON THE BASIS OF THE MULTIPLE CORRELATION AND REGRESSION ANALYSIS

G.V. Panfilov, S.V. Nedoshivin, S.S. Kalinin

The technique of carrying out statistical machine experiment is offered in the analysis of the studied technological system with the determined model. The algorithm of processing of model experimental results by means of mathematical apparatus of the analysis of one-dimensional numerical massifs, statistical forecasting of probability of defects is the basis for a technique. The initial stages of a technique are in detail proved.

Key words: statistical machine experiment, the determined model, the analysis of one-dimensional massifs, statistical forecasting ofprobability of defects.

Panfilov Gennady Vasilyevich, doctor of technical sciences, professor, [email protected], Russia, Tula, Tula State University,

Nedoshivin Sergey Vladimirovich, candidate of technical sciences, docent, archon80@mail. ru, Russia, Tula, Tula State University,

Kalinin Sergey Sergeyevich, postgraduate, Metril_k@,mail. ru, Russia, Tula, Tula State University

i Надоели баннеры? Вы всегда можете отключить рекламу.