Научная статья на тему 'ПРИБЛИЖЕННОЕ ОЦЕНИВАНИЕ С ПОМОЩЬЮ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ ОДНОЙ ФОРМЫ НЕЭЛЕМЕНТАРНЫХ МОДУЛЬНЫХ ЛИНЕЙНЫХ РЕГРЕССИЙ'

ПРИБЛИЖЕННОЕ ОЦЕНИВАНИЕ С ПОМОЩЬЮ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ ОДНОЙ ФОРМЫ НЕЭЛЕМЕНТАРНЫХ МОДУЛЬНЫХ ЛИНЕЙНЫХ РЕГРЕССИЙ Текст научной статьи по специальности «Математика»

CC BY
7
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
линейная регрессия / неэлементарная регрессия / модульная регрессия / функция Леонтьева / метод наименьших квадратов / мультиколлинеарность / индекс потребительских цен / linear regression / non-elementary regression / modular regression / Leontief function / ordinary least squares method / multicollinearity / consumer price index

Аннотация научной статьи по математике, автор научной работы — Михаил Павлович Базилевский

Актуальность и цели. Проблема поиска новых структурных спецификаций регрессионных моделей с интересными интерпретационными свойствами является актуальной в настоящее время. Цель исследования состоит в формализации на основе симбиоза предложенных ранее неэлементарных и модульных линейных регрессий новой структурной спецификации, разработке алгоритма ее приближенного оценивания с помощью метода наименьших квадратов и демонстрации ее эффективности на примере моделирования индекса потребительских цен в Республике Алтай. Материалы и методы. Для оценивания регрессионных моделей применялся метод наименьших квадратов в сочетании с методом «всех возможных регрессий». Результаты. Сформулирована новая структурная спецификация регрессионных моделей – неэлементарная модульная линейная регрессия, обобщающая многие известные модели. Предложен алгоритм ее приближенного оценивания. Построенная с помощью него неэлементарная модульная линейная регрессия оказалась на 39,3 % лучше по качеству аппроксимации неэлементарной регрессии без модулей и на 63,7 % лучше линейной регрессии. Выводы. С помощью предложенных моделей неэлементарной модульной линейной регрессии можно успешно решать задачи прогнозирования, а также задачи выявления новых знаний об объекте исследования.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPROXIMATE LEAST SQUARES ESTIMATION OF ONE FORM OF NON-ELEMENTARY MODULAR LINEAR REGRESSIONS

Background. The problem of finding new structural specifications of regression models with interesting interpretive properties is currently relevant. The purpose of the study is to formalize a new structural specification,based on a symbiosis of previously proposed non-elementary and modular linear regressions, to develop an algorithm for its approximate estimation using the ordinary least squares method and to demonstrate its effectiveness using the example of modeling the consumer price index in the Altai Republic. Materials and methods. To estimate the regression models, the ordinary least squares method was used in combination with the «all possible regressions» method. Results. A new structural specification of regression models is formulated – non-elementary modular linear regression, which generalizes many well-known models. An algorithm for its approximate estimation is proposed. The non-elementary modular linear regression constructed using it turned out to be 39.3 % better in terms of the approximation quality of non-elementary regression without modules, and 63.7 % better than linear regression. Conclusions. Using the proposed models of non-elementary modular linear regression, one can successfully solve forecasting problems, as well as the problem of identifying new knowledge about the object of study.

Текст научной работы на тему «ПРИБЛИЖЕННОЕ ОЦЕНИВАНИЕ С ПОМОЩЬЮ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ ОДНОЙ ФОРМЫ НЕЭЛЕМЕНТАРНЫХ МОДУЛЬНЫХ ЛИНЕЙНЫХ РЕГРЕССИЙ»

УДК 519.862.6

doi: 10.21685/2227-8486-2024-2-8

ПРИБЛИЖЕННОЕ ОЦЕНИВАНИЕ С ПОМОЩЬЮ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ ОДНОЙ ФОРМЫ НЕЭЛЕМЕНТАРНЫХ МОДУЛЬНЫХ ЛИНЕЙНЫХ РЕГРЕССИЙ

М. П. Базилевский

Иркутский государственный университет путей сообщения, Иркутск, Россия

[email protected]

Аннотация. Актуальность и цели. Проблема поиска новых структурных спецификаций регрессионных моделей с интересными интерпретационными свойствами является актуальной в настоящее время. Цель исследования состоит в формализации на основе симбиоза предложенных ранее неэлементарных и модульных линейных регрессий новой структурной спецификации, разработке алгоритма ее приближенного оценивания с помощью метода наименьших квадратов и демонстрации ее эффективности на примере моделирования индекса потребительских цен в Республике Алтай. Материалы и методы. Для оценивания регрессионных моделей применялся метод наименьших квадратов в сочетании с методом «всех возможных регрессий». Результаты. Сформулирована новая структурная спецификация регрессионных моделей -неэлементарная модульная линейная регрессия, обобщающая многие известные модели. Предложен алгоритм ее приближенного оценивания. Построенная с помощью него неэлементарная модульная линейная регрессия оказалась на 39,3 % лучше по качеству аппроксимации неэлементарной регрессии без модулей и на 63,7 % лучше линейной регрессии. Выводы. С помощью предложенных моделей неэлементарной модульной линейной регрессии можно успешно решать задачи прогнозирования, а также задачи выявления новых знаний об объекте исследования.

Ключевые слова: линейная регрессия, неэлементарная регрессия, модульная регрессия, функция Леонтьева, метод наименьших квадратов, мультиколлинеарность, индекс потребительских цен

Для цитирования: Базилевский М. П. Приближенное оценивание с помощью метода наименьших квадратов одной формы неэлементарных модульных линейных регрессий // Модели, системы, сети в экономике, технике, природе и обществе. 2024. № 2. С. 119-129. doi: 10.21685/2227-8486-2024-2-8

APPROXIMATE LEAST SQUARES ESTIMATION OF ONE FORM OF NON-ELEMENTARY MODULAR LINEAR REGRESSIONS

M.P. Bazilevskiy

Irkutsk State Transport University, Irkutsk, Russia [email protected]

Abstract. Background. The problem of finding new structural specifications of regression models with interesting interpretive properties is currently relevant. The purpose of the study is to formalize a new structural specification,based on a symbiosis of previously pro© Базилевский М. П., 2024. Контент доступен по лицензии Creative Commons Attribution 4.0 License / This work is licensed under a Creative Commons Attribution 4.0 License.

posed non-elementary and modular linear regressions, to develop an algorithm for its approximate estimation using the ordinary least squares method and to demonstrate its effectiveness using the example of modeling the consumer price index in the Altai Republic. Materials and methods. To estimate the regression models, the ordinary least squares method was used in combination with the «all possible regressions» method. Results. A new structural specification of regression models is formulated - non-elementary modular linear regression, which generalizes many well-known models. An algorithm for its approximate estimation is proposed. The non-elementary modular linear regression constructed using it turned out to be 39.3 % better in terms of the approximation quality of non-elementary regression without modules, and 63.7 % better than linear regression. Conclusions. Using the proposed models of non-elementary modular linear regression, one can successfully solve forecasting problems, as well as the problem of identifying new knowledge about the object of study.

Keywords: linear regression, non-elementary regression, modular regression, Leontief function, ordinary least squares method, multicollinearity, consumer price index

For citation: Bazilevskiy M.P. Approximate least squares estimation of one form of non-elementary modular linear regressions. Modeli, sistemy, seti v ekonomike, tekhnike, prirode i obshchestve = Models, systems, networks in economics, technology, nature and society. 2024;(2):119-129. (In Russ.). doi: 10.21685/2227-8486-2024-2-8

Введение

Весьма актуальной научной проблемой является поиск скрытых и практически полезных знаний в статистических данных. Для решения этой проблемы все чаще применяются методы Data mining [1, 2]. Эффективным инструментом методологии Data mining считается регрессионный анализ [3, 4], конечным продуктом которого выступает регрессионная модель, которую можно использовать либо для прогнозирования, либо для интерпретации исследуемого процесса или явления. Ежегодно с помощью регрессионного анализа во всем мире решается множество прикладных задач различного характера. Например, в работе [5] построены регрессионные модели для прогнозирования масс фюзеляжа, крыла и оперения самолета, в работе [6] проведен регрессионный анализ влияния климатических факторов на электропотребление объектов нефтедобычи, в работе [7] регрессионный анализ применен для оптимизации содержания пищевых волокон в рецептуре хлебобулочного изделия, а в работе [8] - для обоснования рациональных параметров двухлетнего сошника.

Как отмечено в работе [9], спецификация модели, т.е. выбор ее общего вида, это первый и, быть может, важнейший шаг регрессионного анализа. Структурных спецификаций регрессионных моделей существует великое множество. Описание многих из них можно найти в работах [10, 11], а процесс выявления, изучения и внедрения в существующую практику регрессионного анализа новых хорошо интерпретируемых моделей продолжается и по сей день. Так, например, в статье [12] введена в рассмотрение кусочно-линейная регрессия на основе симбиоза функции Леонтьева и регрессии с максимальным вкладом переменных. Чуть позже были разработаны хорошо зарекомендовавшие себя неэлементарные линейные регрессии (НЛР) [13], включающие в свое уравнение как объясняющие переменные, так и преобразованные с помощью бинарных операций min или max все возможные комбинации их пар. В работе [14] для снижения временных издержек при моде-

лировании были предложены некоторые стратегии построения НЛР известным методом «всех возможных регрессий» [9]. В работе [15] на основе аппарата математического программирования разработана эффективная технология построения НЛР, включающих в себя регрессоры с бинарными операциями min и max. В работе [16] НЛР обобщены с использованием не только бинарных, но и тернарных, кватернарных, ..., /-арных операций min и max. Параллельно были введены модели модульной линейной регрессии [17, 18].

Цель данной работы заключается в следующем: формализовать на основе симбиоза НЛР и модульной регрессии новую регрессионную спецификацию, разработать алгоритм нахождения ее приближенных оценок с помощью метода наименьших квадратов (МНК) и продемонстрировать ее эффективность на примере моделирования индекса потребительских цен (ИПЦ) в Республике Алтай.

Материалы и методы

Рассмотрим ранее предложенную и исследованную в статье [16] НЛР с бинарными, ..., / -арными неэлементарными операциями min (max):

/ Д г

^аm щ2 min {

ijr j '^ j 2

j, =а0 + X ах +1 am-2mrn { x j^x^} + j=1 j=1

«max" max {x^,кГ2 x^ } + £ a mmin3 min { x^,, j* x^, j* x,j } + j «max3 max {x^, x,,^«, кГ x^,} + К +

+amin'/ min { x,1, krJxt 2,..., кГ'Ч/} +

+amax,/max{xn,k^x,,,...,k^'x,} + e,, i = M, (1)

где n - объем исходной выборки данных; / - общее число имеющихся объясняющих переменных; у. - значение с индексом , выбранной объясняемой переменной; xj - значение под номером , объясняющей переменной с индексом j; min (max) - неэлементарные операции, определяющие минимум

( s_1)

(максимум) двух, ..., / чисел; p.jh (s = 2,/, j = 1,ps-1, h = 1,s) - элемент строки с индексом j и столбца с номером h массива Мs-1 размерности ps_1 х s (ps_ = С/), содержащего по строкам все комбинации сочетаний без повторений из / переменных по s ; a j , j = 0, / - неизвестные коэффициенты

линейной комбинации переменных; a™m's, а™ax's (s = 2, /, j = 1, ps-1) - неизвестные коэффициенты при s -арных неэлементарных операциях min и max,

г • г " 1 min,s i max,s

преобразующих j -ю комбинацию сочетаний переменных; k jh , k jh

(s = 2, /, j = 1, ps-1, h = 1, s _ 1) - неизвестные коэффициенты с номером h в операциях min и max s -й арности, преобразующих комбинацию сочетаний входных переменных под номером j; e, - ошибка аппроксимации под номером ,.

Используя математическую операцию модуль, впервые введем следующее обобщение НЛР (1):

y =а0 + £а, -Ixj-AJ + £

а;;m-2 -min

J=1

J=1

x - >mm.2 ij Ji

km'""2 •

+£ аmax'2 - max

+

f2

I а;

min,3 j

j=1

- min

л • ..(1) v

Vi

7 max,2 kj

x

(1) V 2

x „-Am*2

12

+

+

j =1

x - Amm-3 ji

k"iin'3 -

x _Л min>3

j 2

j min,3

<kJ 2 -

x _ Л mn,3

i,J j3

+

+£ а^1ax'3 - max

j=1

vj 2

+K +

+аГ' - min II x,i - АГ'|, kr' -I x, 2 - Af-'|,..., ^ -| xa -А)Г}

+

, -..max,' iL,. Л max,Л j max,' L„ Л max,' 7 max,' L„ Л max,' 1 , • i

+а1 -- max||xii-Ai ki |x,2-A2 k,-i' -|xi'|] + е,, i =1, и , (2)

где А ., у = 1,1, А,™""5, АЦ3*'5, 5 = 2,1, у = 1, р5-1, А = 1,5 - неизвестные параметры.

Будем называть спецификацию (2) моделью неэлементарной модульной линейной регрессии (НМЛР). Очевидно, что если значения всех объясняющих переменных неотрицательны, т.е. Ху > 0, то НЛР (1) является частным случаем НМЛР (2) при А = 0, у = 1,7, АТ"5 = 0, А™*-5 = 0, 5 = 2,7,

у = 1, р5-1, А = 1,5 . Скорее всего, аналогичный вывод можно получить для ситуации, когда переменные принимают любые значения. Рассмотрим еще частные случаи НМЛР (2):

1) если а™11""5 = 0, а™ах'5 = 0 (5 = 2,1, у = 1, р5-1), то имеем модульную линейную регрессию [18] вида

У =ао + £а

j=i

■jI xj-A,+£,, i =1n,

(3)

которая при Aj = 0, j = 1,' вырождается в линейную регрессию ' _

У =ао + Ij + е,-, i = 1,n ;

j=i

2) если а™= 0, а"^ = 0 (s = 3,7, j = 1, ), то имеем НМЛР только с бинарными операциями min и max вида

У, =а0 +1 аJ-1 xp - Aj I + £ j^2 • min

j=i j=i

+£ аmax'2 - max

j=i

max,2 xi, j - A ji

x -An™

i, j Ji

x -Amax

i, j J 2

7 min,2

■kJ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

x ..(1) A ,-2 J 2

+

+ £I , i = 1, n ,

(4)

которая при A j = 0, j = 1,', A-2 = 0, Am^2 = 0, j = 1, , h = 1,2 вырождается в обычную НЛР с бинарными операциями min и max [15] вида

я =a0 + ± a • xp + ± a™in-2 • mm { x, , ,, km• x( ,, } +

t J i2

j=1 J=1 '

±am3"'2 • max{km*2 • x^} + e,, i = 1,n ; (5)

Л J=i

3) если aj = 0 (J = 0,l), aj^ = 0, aj^ = 0 (s = 2,l-1, J = 1,Ач),

amax, =о, т0 имеем модульную функцию Леонтьева вида

-..min,/ iL,. Л min,/ j min,/ L„ Л min,/ j min,/ L„ Л min,/ 1 , - л

y =a ■ mm {|хя^ kl • -\xt2-Л2 kl_i' -\xü-Л/-/ } + e, г = 1, n

4) которая при А™in'1 = 0, j = 1, / — 1 вырождается в обычную функцию Леонтьева [10] y t = a"^ • min{xt1,k1min,/ • xt2,...,k"^ • xü} + e,., t = In ;

5) если aj = 0 (j = 0,l), J* = 0, aj^ = 0 (s = 2,l-1, j = 1,Ач), то имеем модульную НМЛР вида

я=ari •mm {| x,1 -^mini, ¿rl • x 2 -Amin,l|¿г • xa -Amf |}+

+amax>l • max{|xn - Am^,Jx,2 -K? \xtl - Amf1} + e,, i = ~n ,

которая при A^j = 0, А™ ах'г = 0, j = 1, / — 1 вырождается в кусочно-линейную регрессию [12].

Для разработки нового алгоритма нахождения оценок НМЛР рассмотрим сначала уже известный и исследованный ранее алгоритм приближенного МНК-оценивания линейной регрессии с модулями (3) [18].

Шаг 1. Вычисляется минимальное xj. и максимальное xj значения

min max

каждой входной переменной под номером j .

Шаг 2. На каждом отрезке [xmin, xj^ ] равномерно выбирается p точек.

Шаг 3. Методом «всех возможных регрессий», используя (p + 2)/ комбинаций точек с отрезков [ x"m, xJmax ] вместо параметров Аj , с помощью

МНК находятся оценки параметров aj, j = 1, /.

Шаг 4. Выбирается модель с минимальной величиной суммы квадратов остатков.

Чем больше число p разбиений отрезков, тем ближе МНК-оценки модульной регрессии к оптимальным.

Аналогичный алгоритм приближенного оценивания известен для НЛР (5) [13]. Разница в том, что для перебора параметров к™11x2 и к™3x2

необходимо формировать интервалы (к н™н, к верхн ), где

x

k™ = min\ ^,,...,^ J, j™ = maxj-^,,...,^^ x1,^j 2 x2,^j2 ^j 2 J J x1,nj2 x2,^j 2 Vj2

Точки на концах этих интервалов нельзя использовать из-за возникновения совершенной мультиколлинеарности факторов.

Разработать алгоритм оценивания сразу для всей конструкции (2), обеспечивающий близость решения к оптимальному, пока затруднительно, поэтому была сформулирована следующая упрощенная форма НМЛР (4) при

а;-2=о, ^т2=о, j=и = 1,2:

*=«0+1 а • | - X I+1 «:т2 • mm {x , ij* ■ x.j}}+

+1«Г* •max{^ • v} + e<. ' = M . (6)

Тогда алгоритм приближенного оценивания НМЛР (6) аналогичен двум предыдущим лишь с разницей в том, что необходимо формировать и отрезки [x;in,xJmax J для перебора параметров Xj , и интервалы (kj™,kjерхн) для пере-

г 1 min,2 1 max,2 -т-r г

бора параметров kj и kj . Причем между модульными и бинарными ре-

грессорами в (6) возможно наличие мультиколлинеарности, что необходимо учитывать при реализации алгоритма.

Результаты и обсуждение

Актуальной в настоящее время задачей является совершенствование механизмов прогнозирования инфляции [19, 20] в Российской Федерации и в ее субъектах. Было принято решение апробировать предложенный в данной статье математический аппарат на примере моделирования ИПЦ в Республике Алтай. Для этого использовались ежегодные статистические данные (https://rosstat.gov.ru/) за период 2000-2022 гг. по следующим переменным: у - индекс потребительских цен (%); xi - индекс цен производителей на строительную продукцию (%); Х2 - индекс цен производителей сельскохозяйственной продукции (%); хз - индекс цен приобретения промышленных товаров и услуг (%); Х4 - индекс тарифов на грузовые перевозки (%). Эти данные для воспроизводимости экспериментов представлены в табл. 1.

Таблица 1

Статистические данные по Республике Алтай

у Х1 Х2 Х3 х4

1 2 3 4 5

123,6 133,9 116,3 130,8 125,1

113,7 97 128,6 116,7 132,9

116,4 113,8 114,3 111,3 109

113,5 108,1 110,9 112,8 103,8

112,1 122,8 106,9 125 100

111,1 96,9 127 127,3 104,4

107,9 118,2 127,8 117,6 108,1

111,3 112,6 111,1 109 107,5

111,8 125 112,4 112,5 115,2

111,2 96 102,5 106,1 92,5

Окончание табл. 1

1 2 3 4 5

108,6 115,8 107,1 106,6 100

106,4 100,6 125,5 109,3 100

107 120,1 110,1 108,7 110,4

106,4 91,8 107,5 112,9 100,2

110,1 102,5 107,8 106,8 100

112,5 105,4 118 104,3 107,1

103,8 88,3 100,8 107,9 100

101,6 103,3 104,2 104,5 100,3

102,9 109,3 105,9 117,8 103,9

102 104,5 108,7 95,9 100,6

104,2 102,4 99,7 103,4 100

108,3 113,4 102,3 114,4 95,9

113,9 111,1 107,7 110,1 100

Уравнение оцененной по этим статистическим данным с помощью МНК линейной регрессии имеет вид

% 54,622 + 0,118х1 + 0,023х2 + 0,2 х3 + 0,163x4, (7)

(1,303) (0,175) (1,526) (1,247)

где в круглых скобках под коэффициентами при переменных указаны наблюдаемые статистики ¿-критерия Стьюдента. Коэффициент детерминации регрессии (7) R2 = 0,471361, т.е. модель объясняет примерно 47 % вариации переменной y, поэтому качество ее аппроксимации следует признать ниже среднего уровня. К тому же абсолютно все МНК-оценки построенной модели незначимы по ¿-критерию Стьюдента для выбранного уровня значимости а = 0,05 (критическое значение ¿-критерия составляет 2,101).

Затем с помощью МНК оценивались следующие разновидности обычной НЛР (5):

y = а0 + а1 х1 + а2 х2 + а™11,2 min {х3, k™11,2 х4} + а^2 max {х3, к™8*'2 х4} + е, y = а0 + а1х1 + а2 х3 + а)11"1,2 min {х2, к,1™1,2 х4} + атахД max {х2, к,™*'2 х4} + е, y = а0 + а1х1 + а2 х4 + а™1'2 min {х2, к™1,2 х3} + amax'2 max {х2, к,™*'2 х3} + е, y = а0 + а, х2 + а2 х3 + am11,2 min { х,, к™11,2 х4} + am^2 max { х,, к™"*'2 х4} + е, y = а0 + а, х2 + а2 х4 + аmm,2 min {х,, к™11,2 х3} + amax,2 max {х,, к,™*'2 х3} + е, y = а0 + а,х3 + а2х4 + аmin,2 min { х,, к™11,2х2} + amax,2 max { х,, к™8*'2х2} + е .

Их оценивание проводилось с использованием специально созданного скрипта на языке эконометрического пакета Gretl. Поскольку при оценивании любой линейной регрессии Gretl автоматически обнаруживает мультиколлине-арность и исключает факторы ее возникновения, то было решено для перебора

параметров kj11x2 и kj"ах'2 формировать отрезки [^k™, к*ерхн ] . Каждый из

этих отрезков равномерно разбивался десятью точками. Это значит, что для приближенного оценивания каждой из шести НЛР с учетом точек на концах отрезков приходилось оценивать 144 линейных регрессий.

Лучшей из оцененных моделей по величине R2 оказалась следующая

НЛР:

%= 38,304 + 0,096 x1 + 0,247 x3 + 0,637min{x2,1.107 x4} - 0,331 x2, (8)

(1,159) (2,050) (2,272) (-1,498)

для которой R2 = 0,553682 . Как видно, в этой модели появился один значимый по ¿-критерию регрессор min{x2,1.107x4} . Заметим, что последний ре-грессор x2 равносилен преобразованию max{x2,0.9296x4}.

После чего с помощью МНК оценивались следующие разновидности НМЛР (6):

y = а0 + а1 |x1 -Aj + а2 |x2 -A2| + ajin,2min { x3, k1min,2 x4} + аmax,2 max {x3, k1max,2 x4 } + e, y = a0 + a1 |x1 -Aj + a2 |x3 -A21 + a jln,2 min {x2, кjin,2 x4} + amax,2 max {x2, кjax,2 x4} + e, y = a0 + a1 |x1 -Aj + a2 |x4 -A2| + a5nin,2min { x2, k1mln,2 x3} + amax,2 max {x2, кjax,2 x3} + e, y = a0 + a1 |x2 -A 11 + a2 |x3 -A21 + am"1,2 min {x1, k1mln,2 x4} + amаx,2 max { x1, k1max,2 x4} + e, y = a0 + a1 |x2 -Aj + a2 |x4 -A2| + a5nin,2min { x1, k^2 x3} + amax,2max { x1, k1max,2 x3} + e, y = a0 + a1 |x3 -Aj + a2 |x4 -A2| + amin,2 min{x1,k^2x2} + amax,2 max{x1,k1max,2x2} + e .

Их оценивание также проводилось в Gretl. Для перебора параметров kp2 и kp2 формировались отрезки [k™x*,k^ ] , а для Aj - [x^, xJmx ] .

Каждый из отрезков также равномерно разбивался десятью точками. Но теперь задача существенно усложнилась - для приближенного оценивания каждой из шести НМЛР приходилось оценивать уже 20 736 линейных регрессий.

Лучшей из оцененных моделей по величине R2 оказалась следующая НМЛР:

%= 93,568 - 0,728- |x2 -115.464 + 0,317- |x4 -103.518 +

(-5,074) (3,485)

+1,166x3 - 0,67 -max{x1,1.047x3}, (9)

(2,998) (-2,237)

для которой R2 = 0,77156. В этом уравнении абсолютно все коэффициенты значимы по ¿-критерию. Регрессор x3 равносилен преобразованию min{xj,0.761x3j.

Заключение

Впервые сформулирована относящаяся к нелинейным по оцениваемым параметрам спецификациям модель неэлементарной модульной линейной регрессии. Она обобщает разработанные и исследованные ранее модели линейной, неэлементарной, модульной, кусочно-линейной регрессии, функции Леонтьева. Она служит стойким фундаментом для введения в рассмотрение в будущем новых форм регрессионных моделей. Предложен алгоритм приближенного МНК-оценивания одной из упрощенных возможных форм неэлементарной модульной регрессии. Построенная с помощью него модель оказалась на 39,3 % лучше по качеству аппроксимации неэлементарной регрессии без модулей и на 63,7 % лучше линейной регрессии. При этом построенная модель одержала абсолютную победу по количеству значимых по t-критерию регрессоров. Дальнейшие исследования планируется посвятить поиску алгоритмов эффективного оценивания и интерпретации [21] предложенных регрессий.

Список литературы

1. Tsui K. L., Chen V., Jiang W. [et al.]. Data mining methods and applications // Springer handbook of engineering statistics. London : Springer London, 2023. P. 797816.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Dogan A., Birant D. Machine learning and data mining in manufacturing // Expert Systems with Applications. 2021. Vol. 166. P. 114060.

3. Montgomery D. C., Peck E. A., Vining G. G. Introduction to linear regression analysis. John Wiley & Sons, 2021.

4. Fox J. Regression diagnostics: An introduction. Sage publications, 2019.

5. Ресулкулыева Г., Серебрянский С. А. Весовая модель конструкции фюзеляжа, крыла и оперения самолета на основе регрессионного анализа // Управление развитием крупномасштабных систем (MLSD'2022). 2022. С. 918-924.

6. Гилев Д. В., Елтышев Д. К. Регрессионный анализ влияния климатических факторов на электропотребление объектов нефтедобычи // Вестник Пермского национального исследовательского политехнического университета. Электротехника, информационные технологии, системы управления. 2020. № 35. С. 152-168.

7. Садыгова М. К., Кириллова Т. В., Каневская И. Ю. Оптимизация содержания пищевых волокон в рецептуре хлебобулочного изделия методом регрессионного анализа // XXI век: итоги прошлого и проблемы настоящего плюс. 2020. Т. 9, № 1. С. 135-140.

8. Демчук Е. В., Мяло В. В., Браулик Р. А., Бардола А. С. Обоснование рациональных параметров двухленточного сошника методом регрессионного анализа // Вестник Омского государственного аграрного университета. 2020. № 4 (40). С. 125-131.

9. Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики. М. : ЮНИТИ, 1998. 1005 с.

10. Клейнер Г. Б. Производственные функции: теория, методы, применение. М. : Финансы и статистика, 1986. 239 с.

11. Хацкевич Г. А., Проневич А. Ф., Чайковский М. В. Двухфакторные производственные функции с заданной предельной нормой замещения // Экономическая наука сегодня. 2019. № 10. С. 169-181.

12. Носков С. И., Хоняков А. А. Программный комплекс построения некоторых типов кусочно-линейных регрессий // Информационные технологии и математическое моделирование в управлении сложными системами. 2019. № 3 (4). С. 47-55.

13. Базилевский М. П. Оценивание линейно-неэлементарных регрессионных моделей с помощью метода наименьших квадратов // Моделирование, оптимизация и информационные технологии. 2020. Т. 8, № 4 (31).

14. Базилевский М. П. Отбор информативных операций при построении линейно-неэлементарных регрессионных моделей // International Journal of Open Information Technologies. 2021. Т. 9, № 5. С. 30-35.

15. Базилевский М. П. Метод построения неэлементарных линейных регрессий на основе аппарата математического программирования // Проблемы управления. 2022. № 4. С. 3-14.

16. Базилевский М. П. Обобщение неэлементарных линейных регрессий // Моделирование и анализ данных. 2023. Т. 13, № 2. С. 85-98.

17. Базилевский М. П., Ойдопова А. Б. Оценивание модульных линейных регрессионных моделей с помощью метода наименьших модулей // Вестник Пермского национального исследовательского политехнического университета. Электротехника, информационные технологии, системы управления. 2023. № 45. С. 130-146.

18. Базилевский М. П. Программное обеспечение для оценивания модульных линейных регрессий // Информационные и математические технологии в науке и управлении. 2023. № 3 (31). С. 136-146.

19. Юревич М. А. Инфляционные ожидания и инфляция: наукастинг и прогнозирование // Journal of Economic Regulation (Вопросы регулирования экономики). 2021. Т. 12, № 2. С. 22-35.

20. Карабутов Н. Н. Взаимосвязь индексов, определяющих уровень инфляции // Экономика. Налоги. Право. 2020. Т. 13, № 1. С. 42-48.

21. Molnar C. Interpretable machine learning // Lulu.com. 2020.

References

1. Tsui K.L., Chen V., Jiang W. et al. Data mining methods and applications. Springer handbook of engineering statistics. London: Springer London, 2023:797-816.

2. Dogan A., Birant D. Machine learning and data mining in manufacturing. Expert Systems with Applications. 2021;166:114060.

3. Montgomery D.C., Peck E.A., Vining G.G. Introduction to linear regression analysis. John Wiley & Sons, 2021.

4. Fox J. Regression diagnostics: an introduction. Sage publications, 2019.

5. Resulkulyeva G., Serebiyanskiy S.A. A weight model of the fuselage, wing and tail structure of an aircraft based on regression analysis. Upravlenie razvitiem krupno-masshtabnykh sistem (MLSD'2022) = Management of the development of large-scale systems (MLSD'2022). 2022:918-924. (In Russ.)

6. Gilev D.V., Eltyshev D.K. Regression analysis of the influence of climatic factors on the power consumption of oil production facilities. Vestnik Permskogo natsion-al'nogo issledovatel'skogo politekhnicheskogo universiteta. Elektrotekhnika, infor-matsionnye tekhnologii, sistemy upravleniya = Bulletin of the Perm National Research Polytechnic University. Electrical engineering, information technology, control systems. 2020;(35):152-168. (In Russ.)

7. Sadygova M.K., Kirillova T.V., Kanevskaya I.Yu. Optimization of the content of dietary fibers in the formulation of a bakery product by regression analysis. XXI vek: itogi proshlogo i problemy nastoyashchego plyus = XXI century: results of the past and problems of the present plus. 2020;9(1):135-140. (In Russ.)

8. Demchuk E.V., Myalo V.V., Braulik R.A., Bardola A.S. Substantiation of rational parameters of a two-tape coulter by regression analysis. Vestnik Omskogo gosudar-stvennogo agrarnogo universiteta = Bulletin of Omsk State Agrarian University. 2020;(4):125-131. (In Russ.)

9. Ayvazyan S.A., Mkhitaryan V.S. Prikladnaya statistika i osnovy ekonometriki = Applied statistics and fundamentals of econometrics. Moscow: YuNITI, 1998:1005. (In Russ.)

10. Kleyner G.B. Proizvodstvennye funktsii: teoriya, metody, primenenie = Production functions: theory, methods, application. Moscow: Finansy i statistika, 1986:239. (In Russ.)

11. Khatskevich G.A., Pronevich A.F., Chaykovskiy M.V. Two-factor production functions with a given marginal rate of substitution. Ekonomicheskaya nauka segod-nya = Economics today. 2019;(10):169-181. (In Russ.)

12. Noskov S.I., Khonyakov A.A. A software package for constructing some types of piecewise linear regressions. Informatsionnye tekhnologii i matematicheskoe mod-elirovanie v upravlenii slozhnymi sistemami = Information technologies and mathematical modeling in the management of complex systems. 2019;(3):47-55. (In Russ.)

13. Bazilevskiy M.P. Estimation of linear non-elementary regression models using the least squares method. Modelirovanie, optimizatsiya i informatsionnye tekhnologii = Modeling, optimization and information technologies. 2020;8(4).

14. Bazilevskiy M.P. Selection of informative operations in the construction of linear non-elementary regression models. International Journal of Open Information Technologies. 2021;9(5):30-35. (In Russ.)

15. Bazilevskiy M.P. Method of constructing non-elementary linear regressions based on mathematical programming apparatus. Problemy upravleniya = Management problems. 2022;(4):3-14. (In Russ.)

16. Bazilevskiy M.P. Generalization of non-elementary linear regressions. Modelirovanie i analiz dannykh = Modeling and data analysis. 2023;13(2):85-98. (In Russ.)

17. Bazilevskiy M.P., Oydopova A.B. Estimation of modular linear regression models using the method of least modules. Vestnik Permskogo natsional'nogo issle-dovatel'skogo politekhnicheskogo universiteta. Elektrotekhnika, informatsionnye tekhnologii, sistemy upravleniya = Bulletin of the Perm National Research Polytechnic University. Electrical engineering, information technology, control systems. 2023;(45):130-146. (In Russ.)

18. Bazilevskiy M.P. Software for estimating modular linear regressions. Informatsionnye i matematicheskie tekhnologii v nauke i upravlenii = Information and mathematical technologies in science and management. 2023;(3):136-146. (In Russ.)

19. Yurevich M.A. Inflationary expectations and inflation: science and forecasting. Journal of Economic Regulation (Voprosy regulirovaniya ekonomiki) = Journal ofEconomic Regulation (Issues of economic regulation). 2021;12(2):22-35. (In Russ.)

20. Karabutov N.N. The relationship of indices determining the level of inflation. Ekonomika. Nalogi. Pravo = Economy. Taxes. Right. 2020;13(1):42-48. (In Russ.)

21. Molnar C. Interpretable machine learning. Lulu.com. 2020.

Информация об авторах /Information about the authors

Михаил Павлович Базилевский

кандидат технических наук, доцент, доцент кафедры математики, Иркутский государственный университет путей сообщения

(Россия, г. Иркутск, ул. Чернышевского, 15) E-mail: [email protected]

Mikhail P. Bazilevskiy

Candidate of technical sciences, associate professor, associate professor of the sub-department of mathematics, Irkutsk State Transport University (15 Chernyshevskogo street, Irkutsk, Russia)

Автор заявляет об отсутствии конфликта интересов / The author declares no conflicts of interests.

Поступила в редакцию/Received 12.02.2024 Поступила после рецензирования/Revised 02.05.2024 Принята к публикации/Accepted 17.06.2024

i Надоели баннеры? Вы всегда можете отключить рекламу.