УДК 519.233.22 DOI: 10.17213/0321-2653-2017-3-105-111
ИСПОЛЬЗОВАНИЕ МАЛЫХ ВЫБОРОК ДЛЯ ПОЛУЧЕНИЯ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ ТЕХНОЛОГИЧЕСКИХ ПРОЦЕССОВ
© 2017 г. О.В. Шестопал
Южно-Российский государственный политехнический университет (НПИ) имени М.И. Платова, г. Новочеркасск, Россия
USE OF SMALL SELECTIONS FOR OBTAINING MATHEMATICAL MODELS OF TECHNOLOGICAL PROCESSES
O. V. Shestopal
Platov South-Russian State Polytechnic University (NPI), Novocherkassk, Russia
Шестопал Оксана Викторовна - аспирант, ЮжноРоссийский государственный политехнический университет (НПИ) имени М.И. Платова, г. Новочеркасск, Россия. E-mail: oksanashes@gmail.com
Shestopal Oksana Viktorovna - post-graduate student, Platov South-Russian State Polytechnic University (NPI), Novocherkassk, Russia. E-mail: oksanashes@gmail.com
Освещены вопросы, связанные с моделированием технологических процессов на основе данных пассивного эксперимента. Рассмотрен алгоритм получения виртуальной выборки нормального объема из малой выборки методом многомерных точечных распределений. Сравнение интервальных оценок параметров позволило оценить выигрыш виртуальной выборки для среднего арифметического и выборочной дисперсии. Итоговая выборка позволила получить адекватную математическую модель, обладающую сходными характеристиками по сравнению с моделью, полученной на основе большой выборки экспериментальных данных.
Ключевые слова: метод многомерных точечных распределений; малые выборки; пассивный эксперимент; многофакторность; технологический процесс; оценки.
The article covers issues related to modeling of technological processes on the basis of passive experiment data. An algorithm for obtaining a virtual sample of a normal volume from a small sample by the method of multidimensional point distributions is considered. Comparison of interval estimations ofparameters allowed to estimate the gain of the virtual sample for the arithmetic mean and sample variance. The final sample made it possible to obtain an adequate mathematical model with similar characteristics in comparison with the model obtained on the basis of a large sample of experimental data.
Keywords: method of multidimensional point distributions; small samples; passive experiment; multifactority; technological process; estimations.
Введение
ва обычно не допускают активных эксперимен-Необходимость пассивного наблюдения тов с ними. Для пассивного эксперимента необ-связана с тем, что сложные объекты производст- ходимо очень длительное время, чтобы накопить
исходные данные, в других случаях увеличение выборок в силу различных причин бывает невозможным, поэтому часто приходится иметь дело с малыми выборками. Однако при оценке параметров распределения, точности результатов и выявляемых зависимостей возникает вопрос о достоверности получаемых данных. В этих случаях могут быть применены методы размножения выборок.
Постановка задачи
Пусть дана исходная таблица экспериментальных данных, содержащая результаты пассивного эксперимента технологического процесса большой размерности факторного пространства. Она представляет собой многомерную выборку из 36 факторов (Раг1-Раг36). Каждый столбец исходной таблицы содержит малую одномерную выборку из 11 случайных независимых измерений пассивного эксперимента.
Необходимо на основе обработки данных в условиях малых выборок получить виртуальную выборку, достаточную для построения адекватной математической модели, и сравнить полученные оценки с оценками модели по большой выборке.
Анализ методов решения проблемы
Наиболее распространенными методами размножения выборки являются: метод Монте-Карло, метод бутстрепа, метод складного ножа, имитационное моделирование, датчики псевдослучайных чисел. Рассмотрим некоторые методы подробнее.
Процедура бутстрепа позволяет произвести оценку достоверности вычисляемых параметров по данным единственной выборки небольшого объема. Идея состоит в имитации процесса получения многих выборок того же объема, что и исходная, чтобы определить, с какой вероятностью значения оцениваемых характеристик попадают в тот или иной интервал. Применение метода бутстрепа дает гарантию того, что в случае выборок малого объема статистическая оценка параметров, вычисленная по такой выборке, с большей вероятностью совпадет с истинным значением параметра для всей совокупности.
Идея, которую предложил в М. Кенуй (метод складного ножа), состоит в том, чтобы из одной выборки сделать много, исключая из нее по одному наблюдению (и возвращая ранее
исключенные). Полученные значения статистики позволяют судить о ее распределении и о характеристиках распределения. Значения статистики, построенные по размноженным подвыборкам, не являются независимыми. Сам М. Кенуй и его последователи использовали размножение выборок в основном для построения оценок с уменьшенным смещением. Б. Эфрон предложил новый способ размножения выборок, существенно использующий датчики псевдослучайных чисел. А именно, он предложил строить новые выборки, моделируя выборки из эмпирического распределения, с помощью датчика псевдослучайных чисел сформировать любое число размноженных выборок. По сравнению с описанной выше процедурой М. Кенуя появляются новые недостатки - неизбежные совпадения элементов размноженных выборок и зависимость от качества датчиков псевдослучайных чисел. Есть другие способы размножения выборок. По исходной выборке построить эмпирическую функцию распределения, а затем каким-либо образом от кусочно-постоянной функции перейти к непрерывной функции распределения. Другой вариант -перейти к непрерывному распределению, построив непараметрическую оценку плотности. После этого рекомендуется брать размноженные выборки из этого непрерывного распределения (являющегося состоятельной оценкой исходного), непрерывность защитит от совпадений элементов в этих выборках. Другой вариант построения размноженных выборок - более прямой. Исходные данные не могут быть определены совершенно точно и однозначно. Поэтому предлагается к исходным данным добавлять малые независимые одинаково распределенные погрешности. При таком подходе соединяются идеи устойчивости и бутстрепа. При росте числа испытаний методом Монте-Карло бутстреп-оценка приближается к классической оценке -среднему арифметическому результатов наблюдений. Другими словами, бутстреп-оценка отличается от классической оценки только шумом псевдослучайных чисел [1].
Практические методы статистической обработки любой выборки, основанные на классической идее группировки данных, вызывают уменьшение извлекаемой информации. Малый объем выборки снижает ее точность по сравнению с выборкой большого объема. Однако доказано, что результаты, полученные при использовании малых выборок, можно распространять на генеральную совокупность.
ISSN 0321-2653 IZVESTIYA VUZOV. SEVERO-KAVKAZSKIIREGION.
Исследования Ю.А. Долгова, А.Ю. Долгова, Ю.А. Столяренко [2, 3] показали, что применение виртуального увеличения таблицы исходных данных, основанного на методе точечных распределений, позволяет избежать ошибочного определения слабой отрицательной вместо слабой положительной линейной корреляционной связи при анализе многомерных выборок малого объема. Кроме того, предложенная методика дает возможность сузить разброс оценки значений коэффициентов корреляции Пирсона, что может быть применено для дополнительной оценки величины линейной корреляционной связи при построении математических моделей по пассивным данным на ранних этапах исследования. Суть подхода состоит в использовании информации о каждой отдельной реализации малой выборки, опираясь на знания о видах законов распределения одномерных случайных величин. Для устранения потерь информации при обработке малой выборки необходимо от группировки данных перейти к методу, основанному на использовании каждой отдельной реализации и считать каждое такое измерение центром распределения с известным законом (метод точечных распределений).
TECHNICAL SCIENCE. 2017. No 3
Практическая часть
Для получения модели по малым выборкам применен метод многомерных точечных распределений (ММТР) преобразования исходной выборки небольшого объема в выборку, достаточную для адекватного моделирования [4]. Рассмотрим практическую реализацию метода обработки выборки малого объема [4, 5], основанного на экспериментальных данных металлургического производства.
Исходные данные представлены нижеприведенной выборкой объемом строк (n = 11), предположительно распределенной по нормальному закону (табл. 1).
По исходным данным рассчитаны интервальные оценки математического ожидания для всех факторов при табличном значении критерия Стьюдента t (q = 5 %; v = 11 - 1) = 2,2281, интервальные оценки дисперсии и СКО при X2 (q/2 = 0,025; v = 11 - 1) = 20,48, X2 (1- q/2 = 0,975; v = 11 - 1) = 3,247. Определен интервал изменения (а, b) контролируемой величины X в абсолютных единицах (табл. 2), для нормального закона распределения границы интервала рассчитываются по формулам: a = Xcp - 2,4 S; b = Xcp + 2,4 S.
Таблица 1 / Table 1
Исходные данные технологического процесса / Process input data
№ плавки Первород ный лом, т Итого завалка, т Вес годного, т Температура выпуска, С Окислен-ность, ppm Температура разливки, °С Средняя скорость разливки, м/мин Расход смазки, мл/мин Расход воды на кристаллизатор, л/мин
3 4 5 6 7 52 54 55 56
Par1 Par2 Par3 Par4 Par5 Par33 Par34 Par35 Par36
1 9,16 135,00 117,40 1482 1142 1566 3,31 17,25 1750,51
2 11,72 137,08 116,10 1467 1153 1560 3,33 17,6 1727,35
3 13,31 134,01 111,65 1448 1110 1560 3,3 15,63 1763,01
4 13,55 138,95 119,75 1504 1140 1558 3,41 18,00 1764,64
5 12,71 140,47 114,57 1490 1114 1552 3,4 17,51 1771,60
6 11,31 139,36 115,49 1478 1115 1560 3,36 17,23 1740,31
7 11,58 140,67 113,32 1482 1141 1564 3,36 17,81 1714,11
8 11,97 139,19 117,13 1468 1132 1557 3,44 24,02 1725,66
9 10,65 138,26 114,64 1462 1115 1555 3,55 21,05 1796,92
10 13,09 140,99 115,89 1483 1136 1555 3,41 21,86 1733,88
11 9,74 139,18 114,73 1468 1134 1559 3,38 17,4 1728,81
Параметры выборки, рассчитанные по классическим формулам, равны:
Х 11,71 138,47 115,52 1475,58 1130,12 1558,73 3,39 18,67 1746,98
S2 2,06 5,12 4,66 225,95 200,82 16,22 0,005 6,31 614,76
S 1,43 2,26 2,16 15,03 14,17 4,03 0,07 2,51 24,79
ISSN 0321-2653 IZVESTIYA VUZOV. SEVERO-KAVKAZSKIIREGION.
Таблица 2 / Table 2
TECHNICAL SCIENCE. 2017. No 3
Расчетные значения интервала / The calculated values of the interval
Par1 Par2 Par3 Par4 Par5 Par33 Par34 Par35 Par36
a 6,77 126,19 104,32 933,30 648,16 1519,80 3,38 3,53 271,55
b 16,65 150,75 126,71 2017,86 1612,09 1597,65 3,40 33,81 3222,42
Par1 Par2 Par3 Par4 Par5 Par33 Par34 Par35 Par36
р 3,62 9,00 8,20 397,54 353,32 28,53 0,01 11,10 1081,63
Элементы каждой выборки Х1 ,..., Х7,..., Хп упорядочены по возрастанию их значений. Для каждого элемента отдельной выборки X7 определены верхняя Хв и нижняя Х7н границы интервала определения 7-го ядра:
XiH -
X„ -
fa, если Xi - р < а;
[Xi - р, в остальных случаях;
Сb, если Xi + р > b;
\Xt + р, в остальных случаях.
Для каждого элемента выборки Х7 определен корректировочный коэффициент Д, который
для нормального закона распределения равен 1.
Интервал (а, Ь) разбит на к интервалов дискретности (к = 20 - 30), где центры разрядов вычисляются по формуле
Х'= а + (2 7 -1) • Ь~а . Значения нормированной ' 2 ) 2к плотности / *(Х-) вычислены (табл. 4) на интервале с центром в точке X,:
к Г(х1)
f *( X,) -
b - а
I f'(X,)
j -1
(1)
где / (X,) - значения ненормированной оценки плотности в центре ,-го интервала дискретности.
Эмпирическое распределение (1) и его компоненты могут быть использованы для получения оценок параметров распределения повышенной эффективности, если воспользоваться процедурой формального определения математического ожидания тХ и дисперсии ц,2. Оценки соответствующих величин равны:
Рассчитаны вспомогательные коэффициенты по аппроксимационным формулам [5, 6]. Для нормального закона распределения и дель-таобразной формы ядра расчеты производятся по формуле р=р'(Ь - а) (табл. 3), где вспомогательный коэффициент р' определяем эмпирически для каждого класса распределения fx) и объема выборки п.
Таблица 3 / Table 3 Расчетные значения р / The calculated values р
IlPi •Xj • exP
*
mX -
j -1 i-1
-4,5
(Xj - X ^
v
IlPji • exP
j -1 i-1
-4,5
( X j - X,. ^
j_
v р
(2)
I IPji • (Xj)2 • exp j-1 i-1
M-2 = "
-4,5
( X' - X, ^
j_
v р
-(mX )2 .(3)
к n
IlPji • exP j-1i-1
-4,5
( X' - X, ^
j
В табл. 4 представлены расчетные значения плотности и оценок среднего и дисперсии выборки Х1. На гистограмме (рис. 1) представлен график плотности распределения этой же выборки.
18,00 16,00 14,00 12,00 10,00 8,00 6,00 4,00 2,00 0,00
y = -0,0692x2 + 2,0362x + 0,0647 R2 = 0,9241
vo ^ in C5 тг, тг, oo rn ^ vo
oo" as aС <o <o <о iS <ч <ч со rn ^
Рис. 1. Гистограмма распределения Х[ / Fig. 1. Distribution histogram Х[
Расчет оценок математического ожидания
* * ~ 1 m2 и дисперсии ц,2 , проведенный по формулам
(2) и (3), приводит к существенному сокращению
их доверительного интервала, что соответствует
увеличению размера выборки.
Интервальная оценка параметров виртуальной выборки может быть определена по классическим формулам с учетом поправки на объем полученной виртуальной выборки N=98,91.
ISSN 0321-2653 IZVESTIYA VUZOV. SEVERO-KAVKAZSKIIREGION. TECHNICAL SCIENCE. 2017. No 3
Таблица 4 / Table 4
Расчет плотности и оценок для Х1 / Calculation of the density and estimates for Х1
J X 9,16 9,74 10,65 11,31 11,58 11,72 11,97 12,71 13,09 13,31 13,55 2 * mX
1 8,4 0,64 0,26 0,026 0,002 0,001 3,83 7,9 66,5
2 8,6 0,80 0,40 0,053 0,006 0,002 0,001 10,9 94,2
3 8,8 0,92 0,56 0,099 0,013 0,005 0,003 0,001 14,2 125,8
4 9,1 0,99 0,72 0,172 0,029 0,011 0,007 0,003 6 67 17,6 159,5
5 9,3 0,98 0,86 0,276 0,058 0,025 0,016 0,007 20,8 193,4
6 9,5 0,91 0,96 0,412 0,107 0,050 0,034 0,015 0,001 23,8 226,6
7 9,8 0,77 1,00 0,571 0,183 0,095 0,067 0,032 0,002 8,91 26,6 259,8
8 10 0,61 0,96 0,735 0,291 0,165 0,121 0,063 0,005 0,001 29,6 295,2
29 14,8 0,000 0,000 0,000 0,000 0,001 0,003 0,045 0,125 0,206 0,328 0,71 2,24 10,5 155,4
30 15,0 0,001 0,022 0,069 0,122 0,210 0,43 6,40 96,1
Сумма 98,91
Для Х\ сравним начальные значения математического ожидания и дисперсии 10,33<М[Х]<13,9; 1,11<с2<6,98 с полученными после преобразования выборки П,41<М[Х]<12Д; 2,14<с2<4,17. По этим показателям можно оценить выигрыш виртуальной выборки для среднего арифметического - 5,17 раза; для выборочной дисперсии - 2,9 раза.
Выполнив расчет для всех параметров, необходимо состыковать полученные расчетные таблицы по максимальному уровню плотности вероятности. На рис. 2 выведен результат работы приложения в виде готовых Ехсе1-листов.
После стыковки удаляются частично заполненные строки и объединяются в единую выборку (табл. 5).
Ш В *~> • С* - сводная та6лица_ге! - Eitel ? Э - Э X
Щ ГЛАВНАЯ ВСТАВКА РАЗМЕТКА СТРАНИЦЫ ФОРМУЛЫ ДАННЫЕ РЕЦЕНЗИРОВАНИЕ ВИД 1
R40 ' Jr -'□:\!оксана\Аспирантура\Практика_1циссерт\2016\подматлаб\[МАЛЫЕвыб1>рки.)с|5к]кЭ|!Е17 V
a a с d e f g h 1 j elm N о p R 5 t и v w x
18 rar2 Par5 0,06
19 139,186 1133,883 0,0
20 0,000 133,461 0,000 1097,244 0,0
?1 0,000 133,810 0,000 1099,512 p ГЁ 0,0
22 0,000 134,159 РагЗ 0,000 1101,779 Par7 693,000 ParlO 0,0
23 0,001 134,509 114,734 Par4 0,001 1104,046 44,000 0,001 575,363 0,043 Parll 0,0
24 0,002 134,858 0,030 110,506 1465,312 0,002 1106,314 Pa гБ 0,004 41,311 0,002 587,466 0,002 0,023 0,027 0,0
74 0,005 135,207 0,052 110,851 0,005 1440,710 0,006 1108,581 54,000 0,009 41,540 0,006 596,570 0,005 0,025 0,010 0,015 0,0
76 11 Pari 0,012 135,556 0,086 111,197 0,011 1443,115 0,015 1110 848 0,024 43,551 0,021 41,770 0,015 605,673 par9 0,013 0,027 0,024 0,016 0,0
0,027 135,905 0,135 111,542 0,026 1445,520 0,032 1113,116 0,049 44,642 0,045 41,999 0,033 614,777 4422,000 0.029 0,029 0,050 0,017 0,0
111 583
29 9,745 0,107 136,603 0,293 112,233 0,102 1450,330 0,123 1117,650 0,170 46,823 0,158 42,453 0,124 632,934 0,139 4112,034 0,114 0,033 0,172 0,019 0,1
30 0,236 8,379935 0,135 136,953 0,402 112,579 0,130 1452,735 0,212 1119,913 0,280 47,913 0,262 42,687 0,214 642,037 0,236 4156,665 0,199 0,035 0,232 0,020 0,1
31 0,368 8,609466 0,304 137,302 0,526 112,924 0,294 1455,140 0,337 1122,185 0,424 49,004 0,402 42,916 0,340 651,191 0,368 4201,295 0,319 0,037 0,427 0,021 0,2
32 0,529 8,838994 0,454 137,651 0,656 113,270 0,441 1457,545 0,493 1124,453 0,592 50,094 0,567 43,146 0,496 660,294 0,530 4245,926 0,472 0,039 0,595 0,023 0,4
33 0,701 г 0,624 138,000 0,782 113,615 0,610 1459,950 0,665 1126,720 0,762 51,185 0,738 43,375 0,668 669,398 0,702 4290,556 0,643 0,041 0,764 0,024 0,6
u 0,857 9,258051 0,791 135,349 0,859 113,961 0,775 1462,355 0,827 1128,987 0,903 52,275 0,856 43,604 0,529 675,501 0,857 4335,157 0,507 0,043 0,905 0,025 0,7
0,964 9,527579 0,923 138,698 0,965 114,306 0,915 1464,760 0,947 1131,255 0,986 53,366 0,979 43,334 0,945 687,605 0,964 4379,317 0,934 0,045 0,937 0,026 0,9
к 1.000 9,757107 0,994 139,048 0,999 114,652 0,991 1467,165 0,999 1133,522 0,993 54,456 0,997 44,063 0,999 696,705 1,000 4424,448 0,997 0,043 0,992 0,027 0,9
37 0,955 9,9s6635 0,935 139,397 0,956 114,997 0,939 1469,570 0,972 1135,789 0,921 55,547 0,936 44,292 0,970 705,812 0,956 4469,078 0,980 0,050 0,919 0,028 0,9
w 0,842 10,21616 0,900 139,746 0,930 115,343 0,910 1471,975 0,871 1138,057 0,787 56,637 0,809 44,522 0,868 714,915 0,842 4513,708 0,887 0,052 0,785 0,029 0,9
34 0.SS3 10,44569 0,758 140,095 0,836 115,688 0,771 1474,380 0,719 1140,324 0,620 57,728 0,645 44,751 0,716 724,019 0,683 4558,339 0,741 0,054 0,617 0,031 0,7
do 0,511 10,67522 0,588 140,444 0,717 116,034 0,602 1476,785 0,547 1142,592 0,450 58,818 0,474 44,980 0,544 733,122| 0,511 4602,969 0,570 0,056 0,448 0,032 0,5
41 0,352 10,90475 0,421 140,793 0,557 116,379 0,434 1479,191 0,354 1144,859 0,301 59,909 0,321 45,210 0.3S1 742,226 0,352 4647,6<X) 0,404 0,055 0,299 0,033 0,4
42 0,224 11,13425 0,277 141,142 0,459 116,725 0,235 1431,596 0,248 1147,126 0,186 60,999 0,200 45,439 0,246 751,329 0,224 4692,230 0,264 0,060 0,134 0,034 0,2
43 0Д31 11,3635 0,165 141,492 0,342 117,070 0,176 1434,001 0,148 1149,394 0,106 62,090 0,115 45,663 0,146 760,433 0,131 4736,361 0,159 0,062 0,104 0,035 0,1
44 0,071 11,59333 0,094 141,841 0,243 117,416 0,099 1436,406 0,051 1151,661 0,055 63,130 0,061 45,393 0,080 769,536 0,071 4751,491 0,083 0,064 0,055 0,036 0,0
45 0,035 11,82286 0,049 142,190 0,165 117,761 0,051 1488,811 0,041 1153,928 0,027 64,271 0,030 46,127 0,041 778,640 0,035 4826,122 0,045 0,066 0,026 0,038 0,0
4fi 0,016 12,05239 0,023 142,539 0,107 118,107 0,025 1491,216 0,019 1156,196 0,012 65,362 0,013 46,356 0,019 787,743 0,016 4870,752 0,021 0,068 0,012 0,039 0,0
47 0,007 12,28192 0,010 142 888 0,066 118,452 0,011 1493,621 0,008 1158,463 0,005 66,452 0,006 46,586 0,008 796,847 0,007 4915,382 0,009 0,070 0,005 0,040 0,0
4Я 0,003 12,51145 0,004 143,237 0,039 118,793 0,004 1496,026 0,003 1160,731 0,002 67,543 0,002 46,815 0,003 505,950 0,003 4960,013 0,004 0,072 0,002 0,041 0,0
49 И 51 0,001 0,000 0,000 12,74097 0,002 143,557 0,022 0,012 0,006 119,143 0,002 0,001 0,000 1498,431 1500,836 1503,241 0,001 1162,993 0,001 0,000 0,000 65,633 69,724 70,814 0,001 0,000 0,000 47,044 47,274 47,503 0,001 0,000 0,000 515,054 524,157 533,261 0,001 0,000 0,000 50m,643 0,001 0,000 0,000 0,074 0,001 0,000 0,000 0,042
13,20003 119,534 5093,904 0,075 0,044
V 0,000 13,42956 0,003 120,180 0,000 1505,646 0,000 71,905 0,000 47,732 0,000 842,364 0,000 5138,535 0,000 0,080 0,000 0,046
5? 0,000 13,65909 0,001 120,525 0,000 1508,051 0,000 72,995 0,000 47,962 0,000 5183,165 0.000 0,082 0,000 0,047
54 0,000 13,88861 0,000 1510,456 0,000 74,086 0,000 5227,796 0,000 0,048
... 1 Лист4 1 Лист5 1 Листб 1 Лисг7 ЛИСГ8 1 Лист9 1 ЛисгЮ Лист11 rez 1 1 1 rez 2 ... i II 1 ►
Рис. 2. Пример стыковки таблиц виртуальных данных по первому фактору / Fig. 2. An example of docking tables of
virtual data by the first factor
Таблица 5 / Table 5
Итоговая таблица / Final table
№ плавки Первородный лом, т Итого завалка, т Вес годного, т Температура выпуска, С Окислен-ность, PPm Температура разливки, С Средняя скорость разливки, м/мин Расход смазки, мл/мин Расход воды на кристаллизатор, л/мин
3 4 5 6 7 52 54 55 56
Par1 Par2 Par3 Par4 Par5 Par33 Par34 Par35 Par36
1 8,38 133,81 116,38 1474,38 1135,7 1564,20 3,29 16,06 1737,06
2 8,61 134,16 116,72 1476,79 1138,0 1564,85 3,30 16,46 1741,03
3 8,84 134,51 117,07 1479,19 1140,3 1565,49 3,31 16,86 1745,00
4 9,07 134,86 117,42 1481,60 1142,5 1566,14 3,32 17,27 1748,96
5 9,30 135,21 117,76 1484,00 1144,8 1566,78 3,33 17,67 1752,93
6 9,53 135,56 118,11 1486,41 1147,1 1567,43 3,34 18,07 1756,90
7 9,76 135,91 118,45 1488,81 1149,3 1568,07 3,35 18,47 1760,87
8 10,45 134,86 113,96 1452,73 1138,0 1555,83 3,26 15,26 1705,33
77 11,13 141,14 116,72 1481,60 1147,1 1562,91 3,45 19,67 1752,93
78 11,36 141,49 117,07 1484,00 1149,3 1563,56 3,46 20,07 1756,89
Параметры выборки, рассчитанные по классическим формулам, равны:
X 11,61 138,98 115,42 1476,48 1131,75 1559,00 3,38 18,39 1740,76
S2 2,17 6,05 4,11 216,65 2,17 15,55 0,0049 3,93 804,21
S 1,47 2,46 2,03 14,72 11,67 3,94 0,07 1,98 28,36
Таблица может быть использована для построения новой модели. В данном исследовании использовался тот же метод, что и для большой выборки - модифицированный метод случайного баланса [2]. Полученная по малой выборке модель имеет вид
У = 77,8 + 2,43 Х1- 2,16 Ххг + 0,99 - 1,18 Х16+ + 1,07Х23+ 2,13Х26+1,18Х28+1,5Х29-1,4ХЗ1+2,97ХЗ5.
При сравнении с моделью, полученной на основе большой выборки (7=78,03-0,42^--0,29 Х12 + 0,22 Х15 + 0,55 Х16 + 0,23 Х2З+0,44 Х26-0,31Х28-0,62Х29+0,21Хз1-0,48Хз5 [3]) следует отметить идентичное множество факторов, вошедших в модель, и незначительное отклонение значений коэффициентов при этих факторах. В табл. 6 проведено сравнение моделей по индексу
корреляции, среднеквадратической ошибке, информационной емкости [7]:
i -
N
I (Y - Y )2
1 -
i-1
N -1
N
I (Y - Y)
i-1
N - m \
S 2
1 - ^ • 1 S 2'
SY =
N I (Y i-1 - Y )2
N - m
где Yj, Yt - экспериментальное и соответствующее ему по модели расчетное значение для конкретных величин X Y - среднее арифметическое выборки Y-; N - объем выборки; m - количество параметров модели (коэффициентов a, b, c).
Таблица 6 / Table 6
Сравнительная таблица моделей / Comparison table of models
*
Выборка Модель Среднеквадратическая ошибка Индекс корреляции Инф. емкость
Большая Y = 78,03-0,42 Xi-0,29 Х12+0,22 Х15+0,55 Х16 +0,23 Х23+0,44 Х26--0,31 Х28 -0,62 Х29 +0,21 Х31-0,48 Х35 2,96 0,52 4,22
Малая Y = 77,8+2,43 Х-2,16 Х12+0,99 Х15-1,18 Х16+1,07 Х23+2,13 Х26+ +1,18 Х28 +1,5 Х29-1,4 Х31+2,97 Х35 4,43 0,73 4,7
ISSN 0321-2653 IZVESTIYA VUZOV. SEVERO-KAVKAZSKIIREGION.
Заключение
В статье использован метод создания модели на основе малых выборок, полученных в результате пассивного эксперимента. Рассмотрен пример реализации метода на данных технологического процесса металлургического производства. Выполнен сравнительный анализ моделей, построенных на основе многомерного измерения технологического процесса в условиях больших и малых выборок. Необходимо отметить совпадение множества факторов, вошедших в модели, полученные в разных выборочных условиях. При анализе сравнительных характеристик следует отметить увеличение всех оценок модели по малой выборке. Это обусловлено лучшими оценками исходной малой выборки по сравнению с большой: стандартное отклонение в полученной на основе малой выборки по сравнению с исходной большой выборкой меньше в среднем в 2,6 раза (на 28,15 %), среднее больше в 1,024 (на 1,4 %)
На основании результатов исследования можно утверждать, что этот метод может быть использован для обработки данных многомерных технологических объектов. Таким образом, в практической деятельности можно применять ММТР для увеличения объема малой
TECHNICAL SCIENCE. 2017. No 3
выборки с целью получения в последующем моделей, пригодных для оптимизации производственных процессов.
Литература
1. Орлов А.И. Компьютерно-статистические методы: состояние и перспективы. // Науч. журн. КубГАУ [Электронный ресурс]. Краснодар: КубГАУ, 2014. № 103(09). URL: http://ej.kubagro.ru/2014/09/pdf/12.pdf (дата обращения 14.04.2017).
2. Долгов Ю.А. Статистическое моделирование: учебник для
вузов; 2-е изд., доп. Тирасполь: Изд-во Приднестр.ун-та, 2011. 349 с.
3. Столяренко Ю.А., Долгов А.Ю. Исследование границ выборок малого и среднего объема // Сб. тр. междунар. науч.-техн. конф. «Информационные технологии в науке, технике и образовании». Севастополь, май-сентябрь, 2004. М.: МГАПИ, 2004. С. 119 - 121.
4. Нейман Ю. Вводный курс теории вероятностей и математической статистики. М.: Наука, 1968, 448 с.
5. Вальд А. Последовательный анализ: пер. с англ. М.: Физ-матлит, 1960. 328 с.
6. Колмогоров А.Н. Определение центра рассеивания и меры точности по ограниченному числу наблюдений // роль русской науки в развитии теории вероятностей: учен. зап. МНУ. 1947. № 91. С. 53 - 64.
7. Королев А.А. Методы и средства повышения эффективности контроля качества микросхем в процессе производства: автореф. дис. ... канд. техн. наук. М., 2005. 18 с.
References
1. Orlov A.I. Komp'yuterno-statisticheskie metody: sostoyanie i perspektivy [Computer-statistical methods: state and prospects]. Nauchnyi zhurnal KubGAU, 2014, no. 103 (09). Available at: http://ej.kubagro.ru/2014/09/pdf/12.pdf (accessed 14.04.2017)
2. Dolgov Yu.A. Statisticheskoe modelirovanie [Statistical modeling]. Tiraspol', Izd-vo Pridnestr.un-ta, 2011. 349 p.
3. Stolyarenko Yu.A., Dolgov A.Yu. [Investigation of the boundaries of samples of small and medium volume]. Sb. tr. MNTK Informatsionnye tekhnologii v nauke, tekhnike i obrazovanii [Tr. MNTK Information technologies in science, technology and education]. Moscow, MGAPI, 2004. pp. 119-121.
4. Neiman Yu. Vvodnyi kurs teorii veroyatnostei i matematicheskoi statistiki [Introductory course in probability theory and mathematical statistics]. Moscow, Nauka Publ., 1968, 448 p.
5. Val'd A. Posledovatel'nyi analiz [Sequential analysis]. Moscow, FM, 1960, 328 p.
6. Kolmogorov A.N. Opredelenie tsentra rasseivaniya i mery tochnosti po ogranichennomu chislu nablyudenii [Determination of the center of dispersion and measure of accuracy for a limited number of observations]. Moscow, IAN SSSR, 1947, no. 91, pp. 53-64.
7. Korolev A.A. Metody i sredstva povysheniya effektivnosti kontrolya kachestva mikroskhem v protsesse proizvodstva. Diss. kand. tekhn. nauk [Methods for improving the efficiency of crystal chip monitoring in the production process. Cand. tech. sci. diss.]. Moscow, 2005, 18 p.
Поступила в редакцию /Received 24 апреля 2017 г. /April 24, 2017