Научная статья на тему 'Ризики застосування коефіцієнта кореляції при конкретній специфікації регресійної моделі'

Ризики застосування коефіцієнта кореляції при конкретній специфікації регресійної моделі Текст научной статьи по специальности «Математика»

CC BY
96
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕГРЕССИОННЫЙ АНАЛИЗ / ВЫБОРОЧНЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ / МЕТОД "СКЛАДНОГО НОЖА" / ЧАСТНАЯ СТРУКТУРА РЕГРЕССИОННОЙ МОДЕЛИ / REGRESSIVE ANALYSIS / SELECTIVE COEFFICIENT OF CORRELATION / METHOD OF "FOLDING KNIFE" / PRIVATE STRUCTURE OF REGRESSIVE MODEL

Аннотация научной статьи по математике, автор научной работы — Лапач С.М.

Рассматривается проблема надежности выборочного коэффициента корреляции для определения конкретной спецификации регрессионной модели. При конкретной спецификации определяется список членов модели, которые обеспечивают желательное множество выбранных характеристик модели. Чаще всего для этого используется только обучающая выборка, но возможны варианты с обучающей и экзаменационной. В предыдущих работах показано, что наиболее надежным для определения спецификации есть использование коэффициента корреляции Пирсона. Вместе с тем вопрос о границах его надежного использования не рассматривался. Необходимость такого исследования вызвана использованием во множественном регрессионном анализе малых по абсолютному значению коэффициентов корреляции, которые формально могут быть незначимыми. При этом возникают два вопроса. Во-первых, какая абсолютная величина коэффициента корреляции может считаться надежной для принятия решения о включении регрессора в модель. Во-вторых, каким должен быть размер экзаменационной выборки, чтобы коэффициенты корреляции обучающей и экзаменационной можно было отнести к одной генеральной совокупности. Показано, что выделение по коэффициенту меньше 0,2 сомнительное и необоснованное. В этой ситуации, во-первых, нужны дополнительные проверки обоснованности включения регрессоров в модель, а, во-вторых, учет этого факта при анализе и использовании модели. Первое, как правило, выполняется, поскольку процедуры формирования структуры, как правило, многоступенчатые. Второе фактически обеспечивается тем, что при экспоненциальной форме распределения силы влияния регрессоров на «хвост» модели падает незначительная часть доли влияния, которая объясняется моделью. В том случае, когда матрица эксперимента является случайной, результатом пассивного эксперимента, то при использовании экзаменационной выборки, желательно для принятия решения использовать медиану коэффициента корреляции, рассчитанную методом «складного ножа» или путем формирования множества случайных выборок из исходной. Размер экзаменационной выборки при использовании её для спецификации может быть равен 0,25 от обучающей только в случае, когда она не меньше 30 экспериментов. В противном случае её размер необходимо устанавливать не менее 0,5.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The reliability problem of the selective correlation coefficient is considered to determine a certain specification of the regression model. With a certain specification, a list of model members is determined that provide the desired set of selected characteristics of the model. Most often, only a training sample is used for this, but variants with training and examinations are possible. In previous works it was shown that the use of the Pearson correlation coefficient is the most reliable for determining the specification. At the same time, the question of the limits of its reliable usage was not considered. The need for such an investigation is caused by the use of multiple correlations in multiple regression analysis, which can formally be insignificant. This raises two questions. First, which absolute value of the correlation coefficient can be considered reliable for making a decision to include a regressor in the model. Secondly, what should be the size of the examination sample, so that the correlation coefficients of the teaching and examination can be attributed to one general population. It is shown that the selection at a coefficient of less than 0,2 is doubtful and unreasonable. In this situation, firstly, additional checks are needed for the validity of the inclusion of regressors in the model, and, secondly, consideration of this fact in the analysis and use of the model. The first, as a rule, is carried out, as the procedures for the formation of the structure, as a rule, are multistage. The second is actually ensured by the fact that with an exponential form of distribution of the force of influence of the regressors, an insignificant part of the influence of the influence falls on the “tail” of the model, which is explained by the model. In the case where the experimental matrix is random, the result of a passive experiment or using an examination sample is desirable for making a decision to use the median of the correlation coefficient calculated by the «folding knife» method or by forming a set of random samples from the original one. The size of the examination sample when using it for the specification can be equal to 0,25 from the training sample only if it is not less than 30 experiments. Otherwise, its size should be set at least 0,5.

Текст научной работы на тему «Ризики застосування коефіцієнта кореляції при конкретній специфікації регресійної моделі»

УДК 519.237.5: 621.9 С.М. ЛАПАЧ*

РИЗИКИ ЗАСТОСУВАННЯ КОЕФЩ1СНТА КОРЕЛЯЦП ПРИ КОНКРЕТН1Й СПЕЦИФ1КАЦП РЕГРЕС1ЙНО1 МОДЕЛ1

Нацiональний техшчний унiверситет Украши «КП1», м. Кшв, Украша

Анотаця. Розглядаеться проблема надтност1 виб1ркового коефщента кореляцИ при викорис-таннг його для визначення конкретног специфжацп регреайног модел1. При конкретмй специф1ка-цп визначаеться список члемв модел1, якг забезпечують найкращий бажаний наб1р вибраних характеристик модел1. Найчаст1ше для цього використовуеться одна навчальна виб1рка, але можли-вий вар1ант 7з навчальною 7 екзаменацтною виб1рками. В попередшх роботах показано, що най-быьш надтним для визначення специфгкацИ е використання коефщента кореляцИ Шрсона. Разом з тим питання про меж1 його надтного застосування не розглядались. Необх1дтсть такого дос-л!дження викликана використанням у множинному регресШному аналгзг малих коефгцгентгв кореляцп, якг формально можуть бути статистично не значимими. При цьому виникае два питання. Перше: яка абсолютна величина коефщента кореляцп може вважатись над1йною для прийняття ршення про включення регресора в модель. Друге: який розм1р мае бути для екзаменацтног виб1рки для того, щоб коефгцгенти кореляцгг в навчальнгй г екзаменацгйнгй виб1рках можна було в1днести до однгег генеральной сукупност1. Показано, що видыення за коефщентом кореляцгг при значенм менше 0,2 сумнгвне 7 необгрунтоване. В такт ситуацгг, по-перше, необх1дт додатков1 перев1рки обгрунтованост1 включення таких регресор1в у модель, а, по-друге, урахування цього факту при анал1з1 7 використанш модел1. Перше, як правило, виконуеться, так як процедури вибору окремог структури зазвичай багатоступгнчастг. Друге фактично забезпечуеться тим, що при експоненц1-альнгй форм1 розподшу сили впливу регресор1в на «хв1ст» модел1 припадае незначна частина част-ки впливу, яка пояснюеться моделлю. В тому випадку, коли матриця експерименту ерезультатом пасивного експерименту або випадковою, то при використанм екзаменацтног виб1рки бажано використовувати для прийняття ршення мед1ану коефщента кореляцгг, яка розрахована методом «складного ножа» або шляхом формування випадкових тдвиб1рок з вих1дног. Розм1р екзаменацтног виб1рки при застосувант для конкретног специфгкацгг двох виб1рок може бути 0,25 в1д на-вчальног тыьки в тому випадку, коли вона не менше 30 експеримент1в. В гнших випадках необх1дно приймати не менше, нгж 0,5.

Ключовг слова: регрестний анал1з, виб1рковий коефщент кореляцгг, метод «складного ножа», конкретна спецификация регреайног модел1.

Аннотация. Рассматривается проблема надежности выборочного коэффициента корреляции для определения конкретной спецификации регрессионной модели. При конкретной спецификации определяется список членов модели, которые обеспечивают желательное множество выбранных характеристик модели. Чаще всего для этого используется только обучающая выборка, но возможны варианты с обучающей и экзаменационной. В предыдущих работах показано, что наиболее надежным для определения спецификации есть использование коэффициента корреляции Пирсона. Вместе с тем вопрос о границах его надежного использования не рассматривался. Необходимость такого исследования вызвана использованием во множественном регрессионном анализе малых по абсолютному значению коэффициентов корреляции, которые формально могут быть незначимыми. При этом возникают два вопроса. Во-первых, какая абсолютная величина коэффициента корреляции может считаться надежной для принятия решения о включении регрессора в модель. Во-вторых, каким должен быть размер экзаменационной выборки, чтобы коэффициенты корреляции обучающей и экзаменационной можно было отнести к одной генеральной совокупности. Показано, что выделение по коэффициенту меньше 0,2 сомнительное и необоснованное. В этой ситуации, во-первых, нужны дополнительные проверки обоснованности включения регрессо-ров в модель, а, во-вторых, учет этого факта при анализе и использовании модели. Первое, как правило, выполняется, поскольку процедуры формирования структуры, как правило, многоступенчатые. Второе фактически обеспечивается тем, что при экспоненциальной форме распределения силы влияния регрессоров на «хвост» модели падает незначительная часть доли влияния, которая

© Лапач С.М., 2018

1028-9763. Математичш машини i системи, 2018, № 3

объясняется моделью. В том случае, когда матрица эксперимента является случайной, результатом пассивного эксперимента, то при использовании экзаменационной выборки, желательно для принятия решения использовать медиану коэффициента корреляции, рассчитанную методом «складного ножа» или путем формирования множества случайных выборок из исходной. Размер экзаменационной выборки при использовании её для спецификации может быть равен 0,25 от обучающей только в случае, когда она не меньше 30 экспериментов. В противном случае её размер необходимо устанавливать не менее 0,5.

Ключевые слова: регрессионный анализ, выборочный коэффициент корреляции, метод «складного ножа», частная структура регрессионной модели.

Abstract. The reliability problem of the selective correlation coefficient is considered to determine a certain specification of the regression model. With a certain specification, a list of model members is determined that provide the desired set of selected characteristics of the model. Most often, only a training sample is used for this, but variants with training and examinations are possible. In previous works it was shown that the use of the Pearson correlation coefficient is the most reliable for determining the specification. At the same time, the question of the limits of its reliable usage was not considered. The need for such an investigation is caused by the use of multiple correlations in multiple regression analysis, which can formally be insignificant. This raises two questions. First, which absolute value of the correlation coefficient can be considered reliable for making a decision to include a regressor in the model. Secondly, what should be the size of the examination sample, so that the correlation coefficients of the teaching and examination can be attributed to one general population. It is shown that the selection at a coefficient of less than 0,2 is doubtful and unreasonable. In this situation, firstly, additional checks are needed for the validity of the inclusion of regressors in the model, and, secondly, consideration of this fact in the analysis and use of the model. The first, as a rule, is carried out, as the procedures for the formation of the structure, as a rule, are multistage. The second is actually ensured by the fact that with an exponential form of distribution of the force of influence of the regressors, an insignificant part of the influence of the influence falls on the "tail" of the model, which is explained by the model. In the case where the experimental matrix is random, the result of a passive experiment or using an examination sample is desirable for making a decision to use the median of the correlation coefficient calculated by the «folding knife» method or by forming a set of random samples from the original one. The size of the examination sample when using it for the specification can be equal to 0,25 from the training sample only if it is not less than 30 experiments. Otherwise, its size should be set at least 0,5.

Keywords: regressive analysis, selective coefficient of correlation, method of «folding knife», private structure of regressive model.

1. Вступ

Традицшно в регресшному аналiзi (РА) використовуються двi вибiрки: навчальна i контрольна. За навчальною вибiркою виконуеться щентифшащя модел^ а за контрольною -незмщена перевiрка моделi на адекватшсть. Ц вибiрки не повинш перетинатись. Фактич-но, на навчальнш вибiрцi також виконуеться i остаточна специфшащя моделi - визначення конкретно! структури моделi (перелшу регресорiв, яю входять у модель) [1, 2]. За контрольною визначаеться незмщена ощнка залишково! дисперси для перевiрки адекватносп моделi за критерiем Фшера i оцшюються i'l прогностичш властивосп.

О.Г. 1вахненком у [3] висунута щея трьох вибiрок. Третьою е екзаменацшна, яка сумюно з навчальною використовуеться для специфшацп модел^ що повинно тдвищити надшшсть вибору елементсв структури модель

Як показник для формування структури моделi будемо розглядати коефщент парно! кореляцп Шрсона, використання якого обгрунтовано в [2, 4].

Малi значення коефщента кореляцп при звичайних статистичних дослщженнях вважаються статистично не значимими i не розглядаеться, але це не так в регресшному аналiзi. В ньому часто в модель включаються фактори, коефщент кореляцп якого з вщгу-ком досягае всього-на-всього 0,05 [1, 5]. Це пов'язано з цшим рядом особливостей регре-

сшного аналiзу щодо формування структури рiвняння регресп, розгляд якого виходить за меж дано! роботи.

2. Основна частина

Виникае питання, який розмiр повиннi мати екзаменацiйна i контрольна вибiрки порiвняно з навчальною. У прикладниюв склалась емпiрична традицiя, за якою екзаменацiйна мае розмiр, який не перевищуе 0,25, а контрольна - 0,1 вщ розмiру навчальною Якщо врахува-ти типовий розмiр навчально! в 27-32 експерименти, то реально екзаменацшна мае розмiр 7-8 експериментсв, а контрольна 3-5. А чи достатнш такий розмiр для надшного (обгрун-тованого) прийняття ршення про структуру моделi чи п адекватнiсть.

Крiм того, незрозумiло, наскiльки обгрунтованим е вибiр конкретно! специфшацп моделi при малих значеннях коефщента кореляцп.

Мета статтг: дослiдити надшшсть прийняття рiшень вiдносно структури моделi при рiзних рiвнях залежностi мiж регресорами i вiдгуком i визначити необхщний розмiр екзаменацшно! вибiрки.

Вважаеться, що передумова гомоскедастичностi виконуеться, а викиди вщсутш.

Тi експериментатори, яю приймають вказанi вище розмiри для екзаменацшно! вибь рки, не враховують той факт, що чим менше розмiр вибiрки, тим бiльша ймовiрнiсть вщ-хилення емпiричних характеристик випадково! величини, визначених за цiею вибiркою, вiд теоретичних [6]. Особливо це стосуеться таких малих вибiрок, яю розглядаються в да-нiй робот i використовуються в регресiйному аналiзi. Отриманий на випадковiй вибiрцi з генерально! сукупностi коефiцiент кореляцп е випадковою величиною, яка може вiдрiзня-тись вiд значення його в генеральнш сукупностi. А при прийнятп рiшень у регресiйному аналiзi використовуеться просто вибiркове значення без будь-яких шших характеристик (довiрчий iнтервал, значимють тощо). У зв'язку з цим виникае питання про надшшсть прийняття ршень з приводу конкретно'1 специфшацп при вiдсутностi екзаменацшно! вибi-рки.

Розглянемо, як може змшюватись фактичне розраховане значення коефщента кореляцп при змЫ розмiру вибiрки i тюноти зв'язку.

Довiрчий iнтервал для коефщента кореляцп визначаеться за формулою (1)

На рис. 1 показан значення довiрчих iнтервалiв для коефщента кореляцп при рiз-них розмiрах вибiрки в порiвняннi з можливим значенням цього коефщента.

Рисунок 1 - Дов1рч1 штервали для коефщента кореляцп при р1зному розм1р1 виб1рки 144 ТББМ 1028-9763. Математичт машини 1 системи, 2018, № 3

Можна зробити висновок, що при зазначених вище малих коефiцieнтах кореляцп зв'язок таких регресорiв з вiдгуком е статистично не значимим i 1'х не потрiбно включати в модель. Але в [5] зазначаеться, що окремi регресори можуть бути не значимими, але 1'х су-купшсть значима i повинна входити в регресшну модель. В [7] показано, що «ютинш» фа-ктори мають бiльший коефiцiент кореляцп з вщгуком, нiж мультиколiнеарнi з ними «хиб-нi». Це викликае необхiднiсть у порiвняннi величин закорельованостi регресорiв з вщгуком мiж собою для виконання вибору, незалежно вщ 1'х статистично'1 значимостi. Практика по-будови регресшних моделей дае приклад i шших ситуацiй, коли в модель включають фак-тично статистично не значимi фактори. В [8] незначимi фактори включають у модель, тому що у теорп i практицi дано! галузi знань вони вважаються впливаючими на вiдгук.

Для дослiдження було проведено обчислювальний експеримент. Використовуеться спещально створений приклад, в якому як фактори служать рiвномiрно розподiленi в бага-тофакторному простор! псевдовипадков1 ЛПТ числа [9]. Вщгуком е лшшна залежшсть р1з-но'1 тiсноти зв'язку, «зашумлена» випадковими числами з нормальним законом розподшу. Вибiрка мае розмiр 64. З не! випадковим чином вибираються по 50 пiдвибiрок розмiром 32, 18 i 8 вщповщно, для яких проводиться аналiз варiацii емпiричного коефiцiента кореляцп. Табл. 1-3 мютять результати цього аналiзу при рiзних рiвнях залежностi мiж змшними. Велика змiна значення кореляцп свщчить про те, що цей експеримент належить до шшо! генерально'1 сукупносп. Таке може бути як з одним експериментом, так i з пщмножиною. Цей випадок у робот не розглядаеться.

Добре видно, що для сильно! залежностi (табл. 1) при зменшенш розмiру вибiрки розмах можливих значень збшьшуеться, але знак розрахованих вибiркових коефiцiентiв кореляцii не змшюеться.

Таблиця 1 - Характеристики варiацii коефiцiента кореляцii при сильнш залежностi

Ощнюваний параметр Розмiр вибiрки

32 16 8

Мiнiмiм 0,766612 0,680296 0,282838

Максимум 0,908861 0,945325 0,974052

Середне 0,837239 0,848741 0,821998

Медiана 0,838949 0,861168 0,847246

Коефiцiент кореляцii на сукупносп 0,843617

При помiрнiй залежностi (табл. 2) при зменшенш розмiру вибiрки можлива змiна знаку вибiркових коефщешив.

Таблиця 2 - Характеристики варiацii коефiцiента кореляцii при помiрнiй залежносп

Ощнюваний параметр Розмiр вибiрки

32 16 8

Мiнiмiм 0,139179 -0,15465 -0,3269

Максимум 0,538873 0,731417 0,891748

Середне 0,34313 0,309219 0,34723

Медiана 0,351032 0,339717 0,338006

Коефщент кореляцп на сукупносп 0,354508

Таблиця 3 - Характеристики варiацii коефiцiента кореляцп при слабкш залежностi

Оцiнюваний параметр Розмiр вибiрки

32 16 8

Мiнiмiм -0,34711 -0,61938 -0,86307

Максимум 0,265146 0,391063 0,50781

Середне -0,06067 -0,09445 -0,12498

Продовж. табл. 3

М^ана -0,07199 -0,06099 -0,06883

Коефщент кореляцп на сукупностi -0,04736

Характер змши розкиду коефщенпв кореляцп i вiдповiдних параметрiв положення для слабко'1 залежностi добре видно на рис. 2. У цшому характер змши для рiзноi сили ко-реляцшно'1 залежностi подiбний i тому не приводиться.

З проведеного обчислювального експерименту можна зробити таю висновки.

При високш тюнот зв'язку зберiгаeться стiйкiсть середнього значення коефщента кореляцп незалежно вiд розмiру вибiрки. Розсiяння вибiркових значень збшьшуеться при зменшеннi розмiру вибiрки.

При помiрнiй тiснотi зв'язку зi зменшенням розмiру вибiрки збiльшуeться розмах можливих вiдхилень. Можлива навiть змiна знаку.

Для високо! i помiрноi тюноти зв'язку стiйкiсть середнього значення коефщента кореляцп i медiани зберiгаeться незалежно вщ розмiру вибiрки.

При слабкому зв'язку стшюсть вiдсутня аж до можливо! змiни знаку незалежно вщ розмiру вибiрки. Середне значення сильно змшюеться, але перевiрка приналежностi значень кореляцп для вибiрок 32 i 8 пiдтверджуе !х належшсть до одше'1 сукупностi. Медiана збер^ае стiйкiсть.

Крiм того, з приведених результат можна зробити висновок, що встановлювати розмiр екзаменацшно'1 просто в частках вщ навчально! (незалежно вщ Г! розмiру i величини зв'язку регресорiв з вiдгуком) у загальному випадку не дае можливосп порiвняння значень вибiркових коефiцiентiв кореляцп для обгрунтованого формування структури моделi.

Таким чином, при малих розмiрах вибiрок i слабкому зв'язку окреме значення кое-фiцiента кореляцп не може бути обгрунтовано прийнято для визначення специфшацп.

Виникае питання, чи можливе використання визначення за вибiркою середнього значення коефщента кореляцп для оцшки, яка бiльш обгрунтована для прийняття рiшень. Оскiльки в реальному експеримент ми маемо тiльки одну вибiрку, то виникае питання у способах формування деяких пiдвибiрок для визначення середнього чи медiани. Розгляне-мо два способи формування пiдвибiрок для тако'1 оцiнки.

У табл. 4 приведет розрахунки для попередньо'1 задачi методом «складного ножа». При цьому вся вибiрка виступае як генеральна сукупшсть, а першi 32 рядки - як експери-

ментальна вибiрка. В табл. 5 характеристики отримаш за результатами розрахунюв за 50 пiдвибiрок розмiром 16 з перших 16 рядюв.

Видно, що, по-перше, отриманi результати мало вiдрiзняються мiж собою, а, подруге, вони ближчi до значення вибiрки, а не до генерально!' сукупностг

Таблиця 4 - Характеристики визначення коефвдента кореляцп для «складного ножа»

Номер змшно!' 1 2 3 4

Коефщент кореляцп на сукупносп 0,843617 0,354508 -0,04736 -0,06843

Коефiцiент кореляцп на вибiрцi 0,848508 0,260155 -0,08454 -0,1664

Медiана 0,849543 0,269019 -0,0854 -0,16038

Середне квадратичне 0,006478 0,024187 0,033173 0,029202

Мiнiмум 0,835397 0,197461 -0,1758 -0,2272

Максимум 0,861366 0,304945 -0,00187 -0,10628

У табл. 6 представлено розрахунки коефщента кореляцп, виконанi за методом «складного ножа» для реально!' задач^ описано!' в [1, 8], з ортогональною матрицею плану експеримента.

Таблиця 5 - Характеристики визначення коефщента кореляцп для множини випадкових

пiдвибiрок

Номер змшно!' 1 2 3 4

Коефщент кореляцп на сукупносп 0,843617 0,354508 -0,04736 -0,06843

Коефщент кореляцп на вибiрцi 0,848508 0,260155 -0,08454 -0,1664

Медiана 0,838435 0,269288 -0,10797 -0,1673

Середне значення 0,84413 0,263974 -0,06761 -0,18882

Мшмум 0,753475 -0,07872 -0,40104 -0,6503

Максимум 0,928319 0,60517 0,257844 0,265488

Таблиця 6 - Характеристики розрахунюв для методу «складного ножа» для реально!' задачi

Номер змшно!' Коефщент кореляцп Медiана Середне квадратичне Мшмум Максимум

Х1 1 0,548932 0,574522 0,029453 0,54034 0,62234

21 2 -0,00983 -0,0143 0,035844 -0,05665 0,052414

Х2 3 0,736251 0,763383 0,031097 0,753704 0,795211

22 4 -0,0295 -0,04497 0,033518 -0,08396 0,022383

Х3 5 -0,00287 -0,01597 0,045503 -0,08409 0,089527

23 6 0,021653 0,023607 0,044325 -0,04383 0,149796

Х1Х2 7 0,288952 0,294381 0,047677 0,198973 0,389873

Х1Х3 8 0,000993 0,00306 0,046595 -0,12977 0,149704

Х2Х2 9 -0,00806 -0,01515 0,061019 -0,15031 0,128829

Х1Х2Х3 10 0,004787 -0,00375 0,057829 -0,17151 0,179035

2122 11 0,003797 0,010691 0,028866 -0,03299 0,047001

2123 12 0,011087 0,016728 0,038013 -0,05422 0,092625

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2223 13 -0,00473 9,24Е-06 0,032088 -0,06004 0,030103

3. Висновки

1. Видшення за коефщентом кореляцп при значенш менше 0,2 сумшвне i необгрунтоване. Оскiльки в реальних задачах по побудовi регресiйних моделей для значно!' кiлькостi регре-сорiв мають мюце саме такi коефiцiенти кореляцп, то, вщповщно, по-перше, необхiднi до-

датковi nepeBipm обгрунтованосп включення таких perpecopiB у модель, а, по-друге, ура-хування цього факту при аналiзi i використаннi моделi. Слiд вщзначити, що правило вико-нуеться, так як процедури вибору окремо'1 структури (конкретна специфшащя) зазвичай 6агатостyпiнчастi, а також це фактично забезпечусться тим, що, як правило, при експонен-щальнш формi розподiлy сили впливу регресорiв [2, 10] на «хвют» моделi припадае незна-чна частина частки впливу, яка пояснюеться моделлю.

2. У тому випадку, коли матриця експерименту е пасивною або випадковою, бажано вико-ристовувати для прийняття рiшення не значення коефщента, розрахованого за даною ви-бiркою, а медiанy, яка розрахована методом «складного ножа» або методом формування випадкових пiдви6iрок з ще'1 вибiрки.

3. Розмiр екзаменуючо'1 ви6iрки при застосуванш для конкретно!' специфшацп двох вибiрок може бути 0,25 вщ навчально'1 тiльки в тому випадку, коли вона складае не менше 30 екс-периментiв. В шших випадках нео6хiдно приймати не менше, шж 0,5.

4. При використанш екзаменуючо'1 ви6iрки для прийняття ршення рекомендуеться вико-ристовувати не значення коефщента, розрахованого за даною вибiркою, а медiанy, розра-ховану методом «складного ножа» або формування випадкових пiдвибiрок з цих ви6iрок.

СПИСОК ДЖЕРЕЛ

1. Лапач С.М. Проблемы побудови регресшних моделей процешв р1зання метал1в. В1сник НТУУ «КП1». Машинобудування. Кив. 2014. № 3 (72). С. 40-47.

2. Лапач С.Н., Чубенко А.В., Бабич П.Н. Статистика в науке и бизнесе. К.: Морион, 2002. 640 с.

3. Ивахненко А.Г., Мюллер Й.А. Самоорганизация прогнозирующих моделей. К.: Техшка, 1984; Берлин: ФЕБ Ферлаб Техник, 1984. 223 с.

4. 1вашв П.В., Лапач С.М. Застосування кореляцшного анал1зу для конкретноi специфшаци регре-сiйноi модель 36iprn тез donoeideü загальноумверситетськог наук.-техн. конф. молодих вчених та студент1в, присвяченог дню науки. Машинобудування. Технологiя машинобудування. К.: НТУУ «КП1», 2015. С. 75-77.

5. Pardoux C. Sur la selection de variables en regression multiple. Cah. Bur. Univ. rech. oper. 1982. N 39-40. P.101-133.

6. Вентцель Е.С. Теория вероятностей. М.: Высшая школа, 2000. 576 с.

7. Лапач С.Н., Пасечник М.Ф., Чубенко А.В. Статистические методы в фармакологии и маркетинге фармацевтического рынка. К.: ЗАТ «Укрспецмонтаж», 1999. 312 с.

8. Кацев П.Г. Статистические методы исследования режущего инструмента. 2-е изд., перераб. и доп. М.: Машиностроение, 1974. 231 с.

9. Соболь И.М., Статников Р.Б. Выбор оптимальных параметров в задачах со многими критериями. М.: Наука, 1981. 111 с.

10. Satterthwaite F.E. Random Balance Experimentation. Technometrics. 1959. Vol. 1, N 2. P. 111-137.

Стаття надтшла до редакцп 28.06.2018

i Надоели баннеры? Вы всегда можете отключить рекламу.