Научная статья на тему 'ПОСТРОЕНИЕ СТЕПЕННО-ПОКАЗАТЕЛЬНЫХ И ЛИНЕЙНО-ЛОГАРИФМИЧЕСКИХ РЕГРЕССИОННЫХ МОДЕЛЕЙ'

ПОСТРОЕНИЕ СТЕПЕННО-ПОКАЗАТЕЛЬНЫХ И ЛИНЕЙНО-ЛОГАРИФМИЧЕСКИХ РЕГРЕССИОННЫХ МОДЕЛЕЙ Текст научной статьи по специальности «Математика»

CC BY
322
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Проблемы управления
ВАК
Область наук
Ключевые слова
РЕГРЕССИОННАЯ МОДЕЛЬ / ИНТЕРПРЕТАЦИЯ / МУЛЬТИПЛИКАТИВНАЯ СТЕПЕННО-ПОКАЗАТЕЛЬНАЯ РЕГРЕССИЯ / ЛИНЕЙНО-ЛОГАРИФМИЧЕСКАЯ РЕГРЕССИЯ / ОТБОР "ИНФОРМАТИВНЫХ" РЕГРЕССОРОВ / МЕТОД НАИМЕНЬШИХ МОДУЛЕЙ / ЖЕЛЕЗНОДОРОЖНЫЕ ГРУЗОПЕРЕВОЗКИ

Аннотация научной статьи по математике, автор научной работы — Базилевский М. П.

Часто при использовании нелинейных регрессионных моделей оценки полученной зависимости затруднительно или вовсе невозможно интерпретировать. С целью создания таких нелинейных спецификаций регрессий, в которых любому оцененному параметру, за исключением свободного члена, всегда может быть дана какая-либо содержательная интерпретация, разработаны мультипликативная степенно-показательная регрессия, представляющая собой обобщение производственной функции Кобба - Дугласа, и аддитивная линейно-логарифмическая регрессия. Для каждой из них сформулированы три стратегии построения и подробно рассмотрены вопросы интерпретации их оценок. Стратегии построения предложенных моделей с помощью метода наименьших модулей формализованы в виде задач линейного и частично-булевого линейного программирования. Для демонстрации разработанного в настоящей работе математического аппарата решена задача моделирования железнодорожных грузоперевозок в Иркутской области.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Базилевский М. П.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CONSTRUCTING POWER-EXPONENTIAL AND LINEAR-LOGARITHMIC REGRESSION MODELS

When using nonlinear regression models, the estimates of the resulting dependence are often difficult or even impossible to interpret. This paper develops nonlinear regression specifications in which any estimated parameter, except the free term, can always be given some practical interpretation. A multiplicative power-exponential regression generalizing the Cobb-Douglas production function and an additive linear-logarithmic regression are constructed. Three construction strategies are formulated for each of them, and the issues of interpreting their estimates are considered in detail. The construction strategies based on the least absolute deviations method are formalized as linear and partially Boolean linear programming problems. The mathematical apparatus developed in this paper is illustrated by modeling rail freight traffic in Irkutsk oblast.

Текст научной работы на тему «ПОСТРОЕНИЕ СТЕПЕННО-ПОКАЗАТЕЛЬНЫХ И ЛИНЕЙНО-ЛОГАРИФМИЧЕСКИХ РЕГРЕССИОННЫХ МОДЕЛЕЙ»

атематические проблемы управления

УДК 519.862.6 РС!: http://doi.org/10.25728/pu.2021.3.3

ПОСТРОЕНИЕ СТЕПЕННО-ПОКАЗАТЕЛЬНЫХ И ЛИНЕЙНО-ЛОГАРИФМИЧЕСКИХ РЕГРЕССИОННЫХ МОДЕЛЕЙ

М.П. Базилевский

Аннотация. Часто при использовании нелинейных регрессионных моделей оценки полученной зависимости затруднительно или вовсе невозможно интерпретировать. С целью создания таких нелинейных спецификаций регрессий, в которых любому оцененному параметру, за исключением свободного члена, всегда может быть дана какая-либо содержательная интерпретация, разработаны мультипликативная степенно-показательная регрессия, представляющая собой обобщение производственной функции Кобба — Дугласа, и аддитивная линейно-логарифмическая регрессия. Для каждой из них сформулированы три стратегии построения и подробно рассмотрены вопросы интерпретации их оценок. Стратегии построения предложенных моделей с помощью метода наименьших модулей формализованы в виде задач линейного и частично--булевого линейного программирования. Для демонстрации разработанного в настоящей работе математического аппарата решена задача моделирования железнодорожных грузоперевозок в Иркутской области.

Ключевые слова: регрессионная модель, интерпретация, мультипликативная степенно-показательная регрессия, линейно-логарифмическая регрессия, отбор «информативных» регрессоров, метод наименьших модулей, железнодорожные грузоперевозки.

ВВЕДЕНИЕ

Регрессионный анализ представляет собой признанный во всем мире инструмент построения м а-тематических м оделей статистического типа [1, 2]. Одним из первых и, возможно, самым важным этапом построения регрессионной модели является ее спецификация, т. е. выбор состава переменных и математической формы связи между ними. К настоящему времени разработано значительное количество таких спецификаций, большинство из которых можно найти в работах [3—6]. Самой простой спецификацией является модель множественной линейной регрессии:

— а +

у — а

г

Ъ

у = 1

+ в.

I — 1, п ,

(1)

где у, I — 1, п, — наблюдаемые значения объясняемой (выходной) переменной у; ху, I — 1, п,

у — 1,1, — наблюдаемые значения объясняющих

(входных) переменных х1, х2, ..., хг; е, I — 1, п, — ошибки аппроксимации; а0, ар а2, ..., аг — неизвестные параметры.

Линейная регрессия (1) легко оценивается, например, с помощью метода наименьших квадратов (МНК). Пусть ее оцененное уравнение имеет вид:

+ Ъ а ¡х,

1 = 1

у — а0 ■ Ъ

(2)

где у — рассчитываемое по модели значение объясняемой переменной; а 0, а а 2, ..., а г — оценки неизвестных параметров.

Коэффициент уравнения (2) а 5 при объясняющей переменной ха интерпретируется так: если значение объясняющей переменной х изменится на одну единицу, то значение объясняемой переменной у изменится в среднем на а5 единиц.

Отметим, что разработка новых спецификаций регрессионных моделей продолжается и по сей день. Так, в работе [7] предложена линейно-мультипликативная регрессия (ЛМР), в работе [8] — регрессия, противоположная по смыслу производственной функции Леонтьева, в работе [9] рассмотрен их симбиоз, а в работе [10] — индексная регрессия.

Для решения проблемы спецификации разработана технология организации «конкурса» регрессионных моделей, подробно описанная в монографии [6]. Суть конкурса состоит в формировании множества альтернативных вариантов регрессий и многокритериальном выборе лучшей из них. В работе [6] рассмотрен следующий алгоритм формирования альтернатив. Сначала набор исходных объясняющих переменных расширяется с помощью преобразований, в качестве которых могут выступать, например, элементарные функции 1пх,

ех, х 1, х2, х3, 4х и т. д. Затем полным перебором комбинаций решается задача отбора т информативных регрессоров (ОИР) [11]. К сожалению, полученное таким образом уравнение регрессии может оказаться значительно нелинейным, что затруднит или вовсе сделает невозможной интерпретацию найденных оценок.

Целью настоящей работы является разработка таких нелинейных спецификаций, для которых априори было бы известно, что в результате проведения «конкурса» моделей любому коэффициенту полученной регрессии, за исключением свободного члена, всегда можно будет дать какую-либо содержательную интерпретацию.

1. МУЛЬТИПЛИКАТИВНАЯ СТЕПЕННО-ПОКАЗАТЕЛЬНАЯ РЕГРЕССИЯ

Однофакторная показательная регрессия [12, 13] имеет вид:

y, = а0e г., i = 1, n .

(3)

Модель (3) является нелинейной по оцениваемым параметрам, но может быть линеаризована с помощью логарифмирования:

lny,. = с0 + a1xi + u, i = 1, n, (4)

где c0 = lna0, u{ = lner

Линейную по параметрам модель (4) называют полулогарифмической (левой логарифмической, логарифмически-линейной) регрессией [13].

В работе [13] можно найти такую интерпретацию оцененного коэффициента а 1 моделей (3) и (4): если значение объясняющей переменной x из-

менится на одну единицу, то значение объясняемой переменной у изменится в среднем на 100а 1 %.

Но, к сожалению, как отмечено в работе [13], такая интерпретация коэффициента а 1 моделей (3) и (4) правомерна лишь для малых а

Рассмотрим обобщение модели (3) — аддитивную многофакторную показательную регрессию:

= аА +

yt = а

X a,e j = 1

ßjxij , + e.,

i = 1, n .

(5)

где в, } = 1,1 — неизвестные параметры.

Линеаризовать модель (5) не представляется возможным. Но даже если бы были найдены ее оценки, то затруднительно было бы дать им какую-либо содержательную интерпретацию. Поэтому рассмотрим мультипликативную многофакторную показательную регрессию:

yt = а0 П e

J = 1

i = 1, n .

(6)

Модель (6) линеаризуется с помощью логарифмирования и все ее коэффициенты можно интерпретировать так, как показано выше.

Регрессия (6) по своим свойствам очень напоминает производственную функцию (ПФ) Кобба — Дугласа (степенную регрессию):

т—г J -

yt = а0 П xij ep i = 1 n.

J = 1

(7)

Модель (7) тоже линеаризуется с помощью логарифмирования, а оцененный коэффициент а 5 при объясняющей переменной ха интерпретируется так: если значение объясняющей переменной х изменится на 1 %, то значение объясняемой переменной у изменится в среднем на а5 %. Иными словами, ах представляет собой коэффициент эластичности переменной у по ха.

Тогда составим мультипликативную конструкцию моделей (6) и (7):

1 а, X РДи

yi = а0 П xij П e

J = 1 J = 1

i = 1, n .

(8)

Будем называть выражение (8) мультипликативной степенно-показательной регрессией (МСПР).

Отметим, что симбиоз степенных и показательных регрессий вводится не впервые. Так, например, в статье [14] рассмотрена модификация ПФ Кобба — Дугласа, в которую труд и капитал входят в виде степенных функций, а научно-техническая информация — в виде показательной. Нельзя так-

же не упомянуть о ПФ Тинбергена [6], представляющей собой произведение степенной регрессии

(7) и множителя в'\ учитывающего влияние «нейтрального» технического прогресса. Однако МСПР обобщает все эти известные модификации.

Прологарифмированная МСПР (8) имеет вид:

гг

1пу, — Со + Ъ а/Щу + Ъ в1ху + ир 1 = 1 1 = 1

I — 1, п .

(9)

Как видно, с оцениванием МСПР проблем нет. Но возникает проблема с интерпретацией ее коэффициентов, поскольку в модель (9) каждая объясняющая переменная входит и линейно, и логарифмически. Поэтому для того, чтобы иметь возможность интерпретировать любой коэффициент МСПР, при ее построении обязательно нужно проводить ОИР.

Для дальнейшего изложения введем булевы переменные:

ст СТ1 —

пок СТ1 —

1, если х1 входит в МСПР

в степенном виде, 0, если не входит,

1, если х1 входит в МСПР

в показательном виде, 0, если не входит.

Тогда можно ввести линейные ограничения на коэффициенты моделей (8) и (9):

-Мстуст < ау < Ма;ст ,

1 — 1,1,

(10)

Стратегия 2. Каждая объясняющая переменная входит в модель либо в степенном виде, либо в показательном. На формальном языке эта стратегия имеет вид:

пок + а1

— 1, 1 — 1, г.

(12)

В этом случае нужно оценить 2г линейных регрессий (9) с (I + 1) параметром, выбрать из них наилучшую и перейти к МСПР (8). В полученном уравнении гарантированно можно дать интерпретацию любому коэффициенту (если его знак соответствует содержательному смыслу задачи), за исключением, быть может, свободного члена. Также полученное уравнение можно использовать для прогнозирования. Но если число переменных г велико, то возникает задача отбора заданного числа наиболее информативных из них. • Стратегия 3. Каждая объясняющая переменная входит в модель либо в степенном виде, либо в показательном, а общее количество регрессо-ров равно т. На формальном языке эта стратегия имеет вид:

ст , пок , 1 . —,

Ст1 + Ст1 < 1,1 — 1, г,

г

Е, ст , пок ч

(СТ1 + СТ1 ) — т.

1 = 1

(13)

(14)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

этом случае нужно оценить С1 -2 линейных регрессий (9) с (т + 1) параметром, выбрать из них наилучшую и перейти к МСПР (8). Полученное уравнение можно использовать как для прогнозирования, так и для интерпретации.

2. ЛИНЕЙНО-ЛОГАРИФМИЧЕСКАЯ РЕГРЕССИЯ

ст

а

-Ма;пок < р1 < Ма,пок, 1 — 1Гг, (11)

где М — большое положительное число.

Понятно, что если а;ст — 1, а"ок — 0,1 — 1,1, то МСПР (8) трансформируется в степенную регрес-

/п\ ст Г\ пок л . 1 /

сию (7), а если а,- — 0, а,- — 1,1 — 1,1, — в показательную (6).

Сформулируем три стратегии построения МСПР:

• Стратегия 1. Нет никаких ограничений на то, в каком виде переменные входят в модель. В этом случае нужно просто оценить линейную регрессию (9) с (21 + 1) параметром и перейти к МСПР (8). Оцененное уравнение можно использовать для прогнозирования, но интерпретировать коэффициенты невозможно.

Однофакторная логарифмическая [12] (правая логарифмическая, линейно-логарифмическая) регрессия имеет вид:

у1 — а0 + а11ихг. + е., I — 1, п . (15)

На сайте [15] можно найти такую интерпретацию оцененного коэффициента а 1 модели (15): если значение объясняющей переменной х изменится на 1 %, то значение объясняемой переменной у изменится в среднем на ах/100 единиц.

На наш взгляд, оценку а ^ логарифмической модели (15) можно интерпретировать и так: если значение объясняющей переменной х изменится в е раз, то значение объясняемой переменной у изменится в среднем на а 1 единиц.

Рассмотрим обобщение м одели (15) — аддитивную многофакторную логарифмическую регрессию:

i

I

1 = 1

y. = a0 + I a.lnx., + е., i = 1, n . (16)

I U J IJ I

Модель (16) является линейной по параметрам и любой ее оцененный коэффициент при логарифме объясняющей переменной можно интерпретировать вышеуказанными способами.

Стоит отметить, что нет смысла использовать в выражении (16) логарифмы с различными основаниями. Рассмотрим, например, двухфакторную модель

yi = ao + ajlogjXj + a2log3X2 + е., i = 1, n .

Используя известное свойство логарифма logcx

log х = ,—— , эту модель можно представить в виде: a log a

ln x1 ln x2 , . -л—

Уi = ao + a1 m"2 + a2Шз + 1 = 1 n.

Если в полученном выражении переобозначить

а1 а2

параметры ------1-- и ------2-- , то получим частный случай

1п2 1п3

регрессии (16).

Составим аддитивную конструкцию моделей

(1) и (16):

I I _

У1 = Уо + Е У]ха + Е §}пхц + I = 1 п . (17) 1 = 1 1 = 1

Будем называть выражение (17) линейно-логарифмической регрессией (ЛЛР).

При попытке интерпретировать ЛЛР возникает та же проблема, что и при интерпретации МСПР, связанная с тем, что в уравнение (17) каждая объясняющая переменная входит и линейно, и логарифмически.

Введем булевы переменные:

Тогда можно ввести линейные ограничения на коэффициенты модели (17):

-Ma

,

< у. < Ma

лин ,,

1 г лог ^ ^ ^ 1 г лог

-MaJ < б, < Ma J ,

J = 1, l,

1 = 1, l.

(18) (19)

лин л лог Г. . /

Очевидно, что если а, = 1, а, = 0,1 = 1,1, то ЛЛР (17) трансформируется в л инейную регрес-

лин г, лог л . 1 7

сию (1), а если а, = 0, а, = 1,1 = 1,1 — в логарифмическую (16).

По аналогии с МСПР, сформулируем три стратегии построения ЛЛР.

• Стратегия 1. Нет никаких ограничений на то, в каком виде переменные входят в м од ель. В этом случае нужно просто оценить линейную регрессию (17) с (21 + 1) параметром. Оцененное уравнение нельзя использовать для интерпретации, но можно использовать для прогнозирования.

• Стратегия 2. Каждая объясняющая переменная входит в модель либо в линейном виде, либо в логарифмическом. На формальном языке эта стратегия имеет вид:

лин лог

aJ + aJ

= 1, J = 1, l.

(20)

В этом случае нужно оценить 21 линейных регрессий (17) с (/ + 1) параметром и выбрать из них наилучшую. Ее можно использовать как для интерпретации, так и для прогнозирования. • Стратегия 3. Каждая объясняющая переменная входит в модель либо в линейном виде, либо в логарифмическом, а общее количество регрес-соров равно т. На формальном языке эта стратегия имеет вид:

лин | лог , 1 . ~л-,

a.- + a.- < 1, J = 1, l,

Z, лин лог ч

(aJ + aj ) = m.

1 = 1

(21) (22)

Вг^т

этом случае нужно оценить С1 -2 линейных регрессий (17) с (т + 1) параметром и выбрать из них наилучшую.

лин

aJ =

1, если х, входит в ЛЛР в линейном виде, Д если не входит,

лог

aJ =

1, если х, входит в ЛЛР

в логарифмическом виде, 0, если не входит.

3. ФОРМАЛИЗАЦИЯ ЗАДАЧИ ПОСТРОЕНИЯ МСПР И ЛЛР В ВИДЕ ЗАДАЧИ ЧАСТИЧНО-БУЛЕВОГО ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ

Аппарат математического программирования находит широкое применение в регрессионном анализе (см., например, работы [16—18]).

Пусть прологарифмированная МСПР (9) оценивается с помощью метода наименьших модулей (МНМ). Тогда, как показано в монографии [6],

МНМ-оценки этой регрессии могут быть найдены в результате решения задачи линейного программирования (ЛП):

где ^ — 1nx;;í,

Хх + Хх ^ ш1п,

гг

V — С0 + Ъ11 + Ъ в1хц + Х+ - Х-1 = 1 1 = 1

X — 1, п ,

Х+ , Х- > 0,

(23)

(24)

(25)

где V — 1nyг, — 1пх1

Х+ —

гг

V - С0 - Ъ11- Ъ 1 = 1 1 = 1

гг если V. - С0 - Ъ а 11ц - Ъ Рх > 0, 1 = 1 1 = 1

0, в противном случае,

Х- —

г

г

С0 + Ъ11 + Ъ Р^-1 = 1 1 = 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

если С0 + Ъ а^ц + Ъ в^ц - V. > 0, 1 = 1 1 = 1

0, в противном случае.

Тогда в зависимости от выбранной стратегии построения МСПР необходимо решить такие задачи:

• для первой стратегии — задачу ЛП с целевой функцией (23) и с линейными ограничениями (24), (25);

• для второй стратегии — задачу частично-буле-вого линейного программирования (ЧБЛП) с целевой функцией (23) и с линейными ограничениями (24), (25), (10)—(12);

• для третьей стратегии — задачу ЧБЛП с целевой функцией (23) и с линейными ограничениями (24), (25), (10), (11), (13), (14). Аналогично формализуется задача построения

ЛЛР. При этом МНМ-оценки ЛЛР (17) могут быть найдены на основе решения задачи ЛП:

0+ + 0- ^ шш,

у. — У0 + ЪуЛ + ¿8^ + 0+ - 0., 1 = 1 1 = 1

X — 1, п ,

0+ , 0,- > 0,

(26)

(27)

(28)

0+ — ^

г

г

у- У0- - Ъ51%,

.

1= 1 1= 1

гг

если

уХ - У0 - Ъ ^1хх1- Ц

817х. > 0,

.

0,- —

= 1 = 1 0, в противном случае,

гг

У0 + ЪъхХ1 + Ъ 1х1- ух , = 1 = 1

гг

если У0 + Ъ Ух.1 + Ъ 81гх1- у1 > 0 = 1 = 1

0, в противном случае.

Тогда в зависимости от выбранной стратегии построения ЛЛР необходимо решить такие задачи:

• для первой стратегии — задачу ЛП с целевой функцией (26) и с линейными ограничениями (27), (28);

• для второй стратегии — задачу ЧБЛП с целевой функцией (26) и с линейными ограничениями (27), (28), (18)—(20);

• для третьей стратегии — задачу ЧБЛП с целевой функцией (26) и с линейными ограничениями (27), (28), (18), (19), (21), (22).

4. МОДЕЛИРОВАНИЕ ЖЕЛЕЗНОДОРОЖНЫХ ГРУЗОПЕРЕВОЗОК ИРКУТСКОЙ ОБЛАСТИ

Актуальной на сегодняшний день является задача моделирования объемов железнодорожных перевозок (см., например, работы [19, 20]). Для демонстрации предложенного в настоящей работе математического аппарата решалась задача моделирования железнодорожных грузоперевозок в Иркутской области. Для построения моделей на официальном сайте Федеральной службы государственной статистики были собраны годовые данные за период 2000—2018 гг. по показателям:

— отправление грузов железнодорожным транс -портом общего пользования (млн т) у;

— численность рабочей силы (тыс. чел.) х3;

— валовой региональный продукт (млн руб.) х14;

— число предприятий и организаций х18;

— объем промышленной продукции (млн руб.);

— производство электроэнергии (млрд кВт/ч) х22;

— среднегодовая номинальная начисленная заработная плата работников в области добычи полезных ископаемых (руб.) х23;

— среднегодовая номинальная начисленная заработная плата работников в области обрабатывающих производств (руб.) х24;

— продукция сельского хозяйства (млн руб.) х25;

— среднегодовая номинальная начисленная заработная плата работников сельского хозяйства, охоты и лесного хозяйства (руб.);

— число действующих строительных организаций;

— оборот розничной торговли (млн руб.) х31.

Для построения МСПР и ЛЛР на языке Ьаш1 эконометрического пакета ОгеИ был разработан специальный скрипт.

Сначала по исходным данным осуществлялось построение МСПР по третьей стратегии. Задача решалась методом перебора, оценивание производилось с помощью МНК, число отбираемых рег-рессоров т задавалось равным 3. В результате перебора С31 • 23 = 1320 альтернатив была выбрана наилучшая по величине коэффициента детерминации Я . В прологарифмированном виде эта регрессия имеет вид

1пу = -1,2502 + 8,431 • 10-6х23 - 3,3 8 8 • 10-5х25 +

(2,972) (-6,098)

+ 0,51761п х

(11,13)

31

(29)

а ее коэффициент детерминации Я2 = 0,9334. В уравнении (29) под коэффициентами при объясняющих переменных указаны значения ¿-критерия Стьюдента. С их помощью можно сделать вывод, что для уровня значимости а = 0,05 все коэффициенты значимы.

К сожалению, из-за эффекта мультиколлинеар-ности исказился знак коэффициента при переменной х25, поэтому попытка интерпретации уравнения (29) приводит к абсурдному выводу: чтобы увеличить объемы железнодорожных перевозок, нужно снижать объемы продукции сельского хозяйства. Этот противоречивый результат указывает на то, что в процессе перебора моделей нужно организовывать проверку соответствия знаков коэффициентов уравнения регрессии содержательному смыслу факторов. Если хотя бы один коэффициент не соответствует смыслу, то такая модель исключается из д альнейшего рассмотрения. Эту известную рекомендацию можно найти в монографии [6]. Поэтому было принято решение перестроить МСПР. Группой экспертов было установлено, что все вышеперечисленные объясняющие переменные должны влиять на у со знаком «+». После корректировки разработанного скрипта и запуска его с теми же настройками оказалось, что из 1320 альтернатив только 64 удовлетворяют содержательно-

му смыслу задачи. Лучшей из них в прологарифмированном виде является модель

1п у = -6,4889 + 0,00127х3 + 0,5331п х18 +

(2,812) (3,555)

+ 0,7541п х

(3,447)

22

(30)

в которой значимы все коэффициенты при объясняющих переменных, а критерий Я2 = 0,7437. Уравнению (30) соответствует МСПР вида

у = 0,00152- е

0,00127х

0,533

0,754

х18 ' х22

(31)

Сумма квадратов остатков для модели (31) составляет 229,598.

Интерпретация модели (31): с увеличением численности рабочей силы х3 на 1 тыс. чел. перевозки грузов у возрастают в среднем на 0,127 %; с увеличением числа предприятий и организаций х18 на 1 % перевозки грузов у возрастают в среднем на 0,533 %; с увеличением производства электроэнергии х22 на 1 % перевозки грузов у возрастают в среднем на 0,754 %.

Затем по исходным данным осуществлялось построение ЛЛР по третьей стратегии. Настройки задавались те же, что и для МСПР. В результате перебора из 1320 альтернатив была выбрана модель

у = -267,173 + 0,000639х24 - 0,00193х25 +

(2,55) (-6,185)

+ 29,1241п х14, (32)

(12,87)

в которой все коэффициенты при регрессорах значимы, а критерий Я2 = 0,9328.

В модели (32) коэффициент при переменной х25 снова не удовлетворяет содержательному смыслу задачи. Поэтому эта модель была перестроена с учетом контроля соответствия знаков коэффициентов. Оказалось, что из 1320 альтернатив только 64 удовлетворяют смыслу задачи. Лучшей из них оказалась регрессия

у = -552,38 + 0,0746х3 + 31,13521пх18 +

(2,764) (3,489)

+ 42,70131п х22,

(3,282)

(33)

в которой все коэффициенты при объясняющих переменных значимы, критерий Я2 = 0,7312, а сумма квадратов остатков составляет 233,236.

Как видно, по величине суммы квадратов остатков ЛЛР (33) оказалась несколько хуже, чем МСПР (31). При этом ЛЛР (33) имеет в своем составе те же регрессоры, что и МСПР (31).

Интерпретация модели (33): с увеличением численности рабочей силы х3 на 1 тыс. чел. перевозки грузов у возрастают в среднем на 0,0746 млн т; с

30

СОМТЯОЬ Б^ЕМСЕБ № 3 • 2021

увеличением числа предприятий и организаций х18 на 1 % перевозки грузов у возрастают в среднем на 0,3113 млн т; с увеличением производства электроэнергии х22 на 1 % перевозки грузов у возрастают в среднем на 0,427 млн т. Также можно сделать вывод: если число предприятий и организаций х18 увеличится в е раз, то перевозки грузов у вырастут в среднем на 31,1352 млн т; если производство электроэнергии х22 увеличится в е раз, то перевозки грузов у вырастут в среднем на 42,7013 млн т.

Таким образом, если целью исследователя является получение только прогнозных значений объемов перевозок грузов у, то для этого лучше воспользоваться моделями (29) и (32). А если исследователя интересует еще и интерпретация влияния факторов на у, то нужно использовать примерно одинаковые по качеству, но разные по смыслу МСПР (31) и ЛЛР (33).

ЗАКЛЮЧЕНИЕ

В настоящей работе введены две новые спецификации регрессионных моделей — мультипликативная степенно-показательная регрессия (МСПР) и линейно-логарифмическая регрессия (ЛЛР). Рассмотрены вопросы их оценивания и интерпретации. Главным достоинством предложенных спецификаций является то, что в результате их построения каждому коэффициенту регрессии, за исключением свободного члена, гарантированно можно дать некоторую содержательную интерпретацию. Спецификации МСПР и ЛЛР позволяют выявлять и анализировать новые нелинейные закономерности функционирования исследуемых процессов или объектов, поэтому в целом повышают ценность регрессионного анализа.

ЛИТЕРАТУРА

1. Pardoe, I. Applied Regression Modeling. — Wiley, 2020. — 336 p.

2. Westfall, P.H., Arias, A.L. Understanding Regression Analysis: a Conditional Distribution Approach. — Chapman and Hall/ CRC, 2020. — 514 p.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Клейнер Г.Б. Производственные функции: теория, методы, применение. — М.: Финансы и статистика, 1986. — 239 с. [Kleiner, G.B. Production Functions: Theory, Methods, Application. — Moscow: Finance and Statistics, 1986. — 239 s. (In Russian)]

4. Клейнер Г.Б. Экономика. Моделирование. Математика. Избранные труды. — М.: ЦЭМИ РАН, 2016. — 856 с. [Kleiner, G.B. Economy. Modeling. Maths. Selected Works. — Moscow: TsEMI RAN, 2016. — 856 s. (In Russian)]

5. Хацкевич Г.А., Проневич А.Ф., Чайковский М.В. Двухфак-торные производственные функции с заданной предельной нормой замещения // Экономическая наука сегодня. — 2019. — № 10. — С. 169—181. [Khatskevich, G.A., Prone-vich, A.F., Chaikovskii, M.V. Dvukhfaktornye proizvodstvennye

funktsii s zadannoi predel'noi normoi zameshcheniya // Eko-nomicheskaya nauka segodnya. — 2019. — No. 10. — P. 169—181. (In Russian)]

6. Носков С.И. Технология моделирования объектов с нестабильным функционированием и неопределенностью в данных. — Иркутск: Облинформпечать, 1996. — 320 с. [Noskov, S.I. Tekhnologiya modelirovaniya ob'ektov s nesta-bil'nym funktsionirovaniem i neopredelennost'yu v dannykh. — Irkutsk: Oblinformpechat', 1996. — 320 s. (In Russian)]

7. Базилевский М.П., Носков С.И. Формализация задачи построения линейно-мультипликативной регрессии в виде задачи частично-булевого линейного программирования // Современные технологии. Системный анализ. Моделирование. — 2017. — № 3 (55). — С. 101—105. [Bazilevskii, M.P, Noskov, S.I. Formalizatsiya zadachi postroeniya lineino-mul'tiplikativnoi regressii v vide zadachi chastichno-bulevogo lineinogo programmirovaniya // Sovremennye tekhnologii. Sis-temnyi analiz. Modelirovanie. — 2017. — Vol. 55, No. 3. — P. 101—105. (In Russian)]

8. Иванова Н.К., Лебедева С.А., Носков С.И. Идентификация параметров некоторых негладких регрессий // Информационные технологии и проблемы математического моделирования сложных систем. — 2016. — № 17. — С. 107—110. [Ivanova, N.K., Lebedeva, S.A., Noskov, S.I. Identifikatsiya parametrov nekotorykh negladkikh regressii // Informatsionnye tekhnologii i problemy matematicheskogo modelirovaniya sloz-hnykh sistem. — 2016. — No. 17. — P. 107—110. (In Russian)]

9. Носков С.И., Хоняков А.А. Программный комплекс построения некоторых типов кусочно-линейных регрессий // Информационные технологии и математическое моделирование в управлении сложными системами. — 2019. — № 3 (4). — С. 47—55. [Noskov, S.I., Khonyakov, A.A. Programmnyi kompleks postroeniya nekotorykh tipov kusoch-no-lineinykh regressii // Informatsionnye tekhnologii i matem-aticheskoe modelirovanie v upravlenii slozhnymi sistemami. —

2019. — Vol. 4, No. 3. — P. 47—55. (In Russian)]

10. Базилевский М.П., Носков С.И. Оценивание индексных моделей регрессии с помощью метода наименьших модулей // Вестник Российского нового университета. Серия: Сложные системы: модели, анализ и управление. — 2020. — № 1. — С. 17—23. [Bazilevskii, M.P, Noskov, S.I. Otsenivanie indeksnykh modelei regressii s pomoshch'yu metoda naimen'shikh modulei // Vestnik Rossiiskogo novogo univer-siteta. Seriya: Slozhnye sistemy: modeli, analiz i upravlenie. —

2020. — No. 1. — P. 17—23. (In Russian)]

11. Базилевский М.П., Вергасов А. С., Носков С.И. Групповой отбор информативных переменных в регрессионных моделях // Южно-Сибирский научный вестник. — 2019. — № 4-1 (28). — С. 36—39. [Bazilevskii, M.P, Vergasov, A.S., Noskov, S.I. Gruppovoi otbor informativnykh peremennykh v regressionnykh modelyakh // Yuzhno-Sibirskii nauchnyi vestnik. — 2019. — Vol. 28, No. 4-1. — P. 36—39. (In Russian)]

12. Елисеева И.И., Курышева С.В., Костеева Т.В. и др. Эконометрика. — М.: Финансы и статистика, 2007. — 576 с. [Eliseeva, I.I, Kurysheva, S.V, Kosteeva, T.V., et al. Econometrics. — Moscow: Finance and statistics, 2007. — 576 p. (In Russian)]

13. Доугерти К. Введение в эконометрику. — М.: ИНФРА-М, 2009. — 465 с. [Dougherti, K. Introduction to Econometrics. — Moscow: INFRA-M, 2009. — 465 p. (In Russian)]

14. Горидько Н.П., Нижегородцев Р.М. Построение лаговых регрессионных моделей типа Кобба-Дугласа на долгосрочных временных горизонтах // Проблемы управления. — 2012. — № 3. — С. 55—63. [Goridko, N.P., Nizhegorodtsev, R.M. Elaborating of Long-Run Lag Regressional Models of Cobb-Douglas Type // Control Sciences. — 2012. — No. 3. — P. 55—63. (In Russian)]

15. URL: https://ru.coursera.org/lecture/ekonometrika/3-1-3-inti-erprietatsiia-koeffitsiienta-pri-logharifmirovanii-DdROH.

16. Park, Y.W., Klabjan, Y.W. Subset selection for multiple linear regression via optimization // Journal of Global Optimization. — 2020. — Vol. 77. — P. 543—574.

17. Chung, S., Park, Y.W., Cheong, T. A mathematical programming approach for integrated multiple linear regression subset selection and validation // Pattern Recognition. — 2020. — Vol. 108. — Article no. 107565.

18. Bertsimas, D, Li, M.L. Scalable holistic linear regression // Operations Research Letters. — 2020. — Vol. 48, no. 3. — P. 203—208.

19. Базилевский М.П., Врублевский И.П., Носков С.И. и др. Среднесрочное прогнозирование эксплуатационных показателей функционирования Красноярской железной дороги // Фундаментальные исследования. — 2016. — № 10-3. — С. 471—476. [Bazilevskii, M.P., Vrublevskii, I.P, Noskov, S.I., et al. Srednesrochnoe prognozirovanie ekspluatatsionnykh pokazatelei funktsionirovaniya Krasnoyarskoi zheleznoi dorogi // Fundamental'nye issledovaniya. — 2016. — No. 10-3. — P. 471—476. (In Russian)]

20. Носков С.И., Врублевский И.П. Регрессионная модель динамики эксплуатационных показателей функционирования железнодорожного транспорта // Современные технологии. Системный анализ. Моделирование. — 2016. — № 2 (50). — С. 192—197. [Noskov, S.I, Vrublevskii, I.P. Re-gressionnaya model' dinamiki ekspluatatsionnykh pokazatelei funktsionirovaniya zheleznodorozhnogo transporta // Sovre-mennye tekhnologii. Sistemnyi analiz. Modelirovanie. — 2016. — Vol. 50, no. 2. — P. 192—197. (In Russian)]

Статья представлена к публикации членом редколлегии Н.Н. Бахтадзе.

Поступила в редакцию 11.01.2021, после доработки 04.03.2020.

Принята к публикации 10.03.2020.

Базилевский Михаил Павлович — канд. техн. наук, Иркутский государственный университет путей сообщения, И [email protected].

CONSTRUCTING POWER-EXPONENTIAL AND LINEAR-LOGARITHMIC

REGRESSION MODELS

M.P. Bazilevskiy

Irkutsk State Transport University, Irkutsk, Russia [email protected]

Abstract. When using nonlinear regression models, the estimates of the resulting dependence are often difficult or even impossible to interpret. This paper develops nonlinear regression specifications in which any estimated parameter, except the free term, can always be given some practical interpretation. A multiplicative power-exponential regression generalizing the Cobb—Douglas production function and an additive linear-logarithmic regression are constructed. Three construction strategies are formulated for each of them, and the issues of interpreting their estimates are considered in detail. The construction strategies based on the least absolute deviations method are formalized as linear and partially Boolean linear programming problems. The mathematical apparatus developed in this paper is illustrated by modeling rail freight traffic in Irkutsk oblast.

Keywords: regression model, interpretation, multiplicative power-exponential regression, linear-logarithmic regression, feature selection, least absolute deviations, rail freight traffic.

Читайте в ближайших номерах

S Широкий А.А., Калашников А.О. Применение методов естественных вычислений для управления рисками сложных систем

Краснов Д.В., Антипов А.С. Синтез двухконтурного наблюдателя в задаче управления однозвенным манипулятором в условиях неопределенности

Барабанова Е.А., Вытовтов К.А., Подлазов В.С. Неблокируемые отказоустойчивые двухкаскадные дуальные фотонные коммутаторы

i Надоели баннеры? Вы всегда можете отключить рекламу.