Научная статья на тему 'ПОСТРОЕНИЕ ВПОЛНЕ ИНТЕРПРЕТИРУЕМЫХ НЕЭЛЕМЕНТАРНЫХ ЛИНЕЙНЫХ РЕГРЕССИОННЫХ МОДЕЛЕЙ'

ПОСТРОЕНИЕ ВПОЛНЕ ИНТЕРПРЕТИРУЕМЫХ НЕЭЛЕМЕНТАРНЫХ ЛИНЕЙНЫХ РЕГРЕССИОННЫХ МОДЕЛЕЙ Текст научной статьи по специальности «Математика»

CC BY
28
6
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЭЛЕМЕНТАРНАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ / ВПОЛНЕ ИНТЕРПРЕТИРУЕМАЯ РЕГРЕССИЯ / ЗАДАЧА ЧАСТИЧНО-БУЛЕВОГО ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ / МЕТОД НАИМЕНЬШИХ КВАДРАТОВ / МУЛЬТИКОЛЛИНЕАРНОСТЬ / АБСОЛЮТНЫЕ ВКЛАДЫ ПЕРЕМЕННЫХ В ОБЩУЮ ДЕТЕРМИНАЦИЮ / ЖЕЛЕЗНОДОРОЖНЫЕ ГРУЗОПЕРЕВОЗКИ ТЮМЕНСКОЙ ОБЛАСТИ

Аннотация научной статьи по математике, автор научной работы — Базилевский Михаил Павлович

Предмет исследования: задача частично-булевого линейного программирования, предназначенная для выбора оптимальных структур неэлементарных линейных регрессионных моделей. Цель исследования: интегрировать в задачу частично-булевого линейного программирования дополнительные ограничения, которые будут гарантировать построение вполне интерпретируемых неэлементарных линейных регрессий. Методы исследования: регрессионный анализ, математическое программирование, метод последовательного повышения абсолютных вкладов переменных в общую детерминацию. Объект исследования: неэлементарные линейные регрессионные модели. Основные результаты исследования: в задачу частично-булевого линейного программирования, предназначенную для построения неэлементарных регрессий, интегрированы дополнительные линейные ограничения на абсолютные вклады переменных в общую детерминацию, позволяющие контролировать в модели как сами вклады, так и мультиколлинеарность. Показано, каким образом необходимо регулировать эти ограничения, чтобы полученная в результате решения задачи неэлементарная линейная регрессия была вполне интерпретируемой. Предложенный математический аппарат был использован для моделирования железнодорожных грузоперевозок Тюменской области. Дана интерпретация полученной высокоточной и вполне интерпретируемой неэлементарной линейной регрессии.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Базилевский Михаил Павлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CONSTRUCTION OF QUITE INTERPRETABLE NON-ELEMENTARY LINEAR REGRESSION MODELS

Subject of research: mixed-integer 0-1 linear programming problem for choosing optimal structures for non-elementary linear regression models. Purpose of research: integrate into the mixed-integer 0-1 linear programming problem additional constraints that will guarantee the construction of quite interpretable non-elementary linear regressions. Methods of research: regression analysis, mathematical programming, method of successive increase the absolute contributions of variables to the general determination. Object of research: non-elementary linear regression models. Main results of research: in the mixed-integer 0-1 linear programming problem, designed to construct non-elementary regressions, additional linear constraints on the absolute contributions of variables to the general determination are integrated, allowing you to control both the contributions themselves and multicollinearity in the model. It is shown how it is necessary to regulate these constraints so that the non-elementary linear regression obtained as a result of solving the problem is quite interpretable. The proposed mathematical apparatus was used to model railroad freight transportation in the Tyumen region. An interpretation of the obtained high-precision and quite interpretable non-elementary linear regression is given.

Текст научной работы на тему «ПОСТРОЕНИЕ ВПОЛНЕ ИНТЕРПРЕТИРУЕМЫХ НЕЭЛЕМЕНТАРНЫХ ЛИНЕЙНЫХ РЕГРЕССИОННЫХ МОДЕЛЕЙ»

ВЕСТНИК ЮГОРСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА

_2022 г. Выпуск 4 (67). С. 105-114_

УДК 519.862.6 DOI: 10.18822/byusu202204105-114

ПОСТРОЕНИЕ ВПОЛНЕ ИНТЕРПРЕТИРУЕМЫХ НЕЭЛЕМЕНТАРНЫХ ЛИНЕЙНЫХ РЕГРЕССИОННЫХ МОДЕЛЕЙ

Базилевский Михаил Павлович

кандидат технических наук, доцент кафедры «Математика», ФГБОУ ВО «Иркутский государственный университет путей сообщения»

Иркутск, Россия E-mail: [email protected]

Предмет исследования: задача частично-булевого линейного программирования, предназначенная для выбора оптимальных структур неэлементарных линейных регрессионных моделей.

Цель исследования: интегрировать в задачу частично-булевого линейного программирования дополнительные ограничения, которые будут гарантировать построение вполне интерпретируемых неэлементарных линейных регрессий.

Методы исследования: регрессионный анализ, математическое программирование, метод последовательного повышения абсолютных вкладов переменных в общую детерминацию.

Объект исследования: неэлементарные линейные регрессионные модели.

Основные результаты исследования: в задачу частично-булевого линейного программирования, предназначенную для построения неэлементарных регрессий, интегрированы дополнительные линейные ограничения на абсолютные вклады переменных в общую детерминацию, позволяющие контролировать в модели как сами вклады, так и мультиколлинеар-ность. Показано, каким образом необходимо регулировать эти ограничения, чтобы полученная в результате решения задачи неэлементарная линейная регрессия была вполне интерпретируемой. Предложенный математический аппарат был использован для моделирования железнодорожных грузоперевозок Тюменской области. Дана интерпретация полученной высокоточной и вполне интерпретируемой неэлементарной линейной регрессии.

Ключевые слова: неэлементарная линейная регрессия, вполне интерпретируемая регрессия, задача частично-булевого линейного программирования, метод наименьших квадратов, мультиколлинеарность, абсолютные вклады переменных в общую детерминацию, железнодорожные грузоперевозки Тюменской области.

CONSTRUCTION OF QUITE INTERPRETABLE NON-ELEMENTARY LINEAR REGRESSION MODELS

Mikhail P. Bazilevskiy

Candidate of Technical Sciences, Associate Professor of the Department of Mathematics, Irkutsk State Transport University Irkutsk, Russia E-mail: [email protected]

Subject of research: mixed-integer 0-1 linear programming problem for choosing optimal structures for non-elementary linear regression models.

Purpose of research: integrate into the mixed-integer 0-1 linear programming problem additional constraints that will guarantee the construction of quite interpretable non-elementary linear regressions.

Methods of research: regression analysis, mathematical programming, method of successive increase the absolute contributions of variables to the general determination.

Object of research: non-elementary linear regression models.

Main results of research: in the mixed-integer 0-1 linear programming problem, designed to construct non-elementary regressions, additional linear constraints on the absolute contributions of variables to the general determination are integrated, allowing you to control both the contributions themselves and multicollinearity in the model. It is shown how it is necessary to regulate these constraints so that the non-elementary linear regression obtained as a result of solving the problem is quite interpretable. The proposed mathematical apparatus was used to model railroad freight transportation in the Tyumen region. An interpretation of the obtained high-precision and quite interpretable non-elementary linear regression is given.

Keywords: non-elementary linear regression, quite interpretable regression, mixed-integer 0-1 linear programming problem, ordinary least squares method, multicollinearity, absolute contributions of variables to the general determination, railway freight transportation in the Tyumen region.

Введение

Актуальным в настоящее время направлением в науке считается интерпретируемое машинное обучение [1-4]. Как отмечено в [2], со ссылкой на [3], интерпретируемость дает возможность моделям машинного обучения представлять свое поведение в понятных людям терминах. С точки зрения конечных пользователей, интерпретируемость повышает доверие к модели машинного обучения, поскольку им становится ясно и понятно, как именно она работает. С точки зрения разработчиков, интерпретируемость помогает лучше понять проблему, как устроены данные и причины неточной работы модели, что в конечном итоге приводит к повышению её точности.

Среди моделей машинного обучения высокой степенью интерпретируемости обладают регрессионные модели [5, 6]. Среди них самыми простыми закономерно следует считать линейные регрессии, в которых каждый коэффициент трактуется как величина изменения зависимой переменной при изменении соответствующей ему объясняющей переменной на одну условную единицу. Однако даже при построении линейной регрессии может оказаться так, что у неё будут искажены знаки коэффициентов при объясняющих переменных. Причина такого искажения - мультиколлинеарность, означающая наличие сильной корреляционной связи между объясняющими переменными. Таким образом, мультиколлинеарность негативно сказывается на интерпретируемости регрессионных моделей.

На сегодняшний день ведется активная работа по созданию новых эффективных форм связи между переменными в регрессионных моделях. Так, например, в работах [7-10] исследуются так называемые кусочно-линейные регрессии, для оценки неизвестных параметров которых авторы используют метод наименьших модулей. В то же время в работах [11-14] предложены неэлементарные регрессионные модели, являющиеся обобщением линейных регрессий и содержащие в своем составе помимо объясняющих переменных все возможные комбинации их пар, преобразованных с помощью бинарных операций min и max. Для оценки таких моделей используется метод наименьших квадратов (МНК). В [14] предложен метод построения неэлементарных линейных регрессий (НЛР) на основе аппарата математического программирования и продемонстрированы их высокие интерпретационные свойства. Однако вопрос о том, каким образом следует контролировать мультиколлинеарность в НЛР, а значит, и их интерпретируемость, решен не был.

Работа [15] посвящена построению вполне интерпретируемых линейных регрессионных моделей. Вполне интерпретируемая регрессия удовлетворяет трем условиям:

1) её спецификация изначально выбрана так, что после оценивания можно объяснить любой коэффициент модели или некоторый его аналог, за исключением, быть может, свободного члена;

2) все знаки коэффициентов модели соответствуют содержательному смыслу решаемой задачи;

3) эффект мультиколлинеарности незначителен.

Для построения вполне интерпретируемых линейных регрессий в работе [15] был предложен метод последовательного повышения абсолютных вкладов переменных в общую детерминацию. Целью данной работы является интеграция в задачу построения НЛР дополнительных ограничений, позволяющих контролировать абсолютные вклады и мультиколлине-арность, что позволит сформулировать алгоритм, гарантирующий получение вполне интерпретируемых НЛР.

Результаты и обсуждение

НЛР [14] имеет вид

I с2

Уг = «0 + £«7X7 + £«7+1 Щ , ЛА,2 } +

7=1 7=1

с

тах(Х^>Л;2Хц} + ег

7=1 _ , (1) г = 1, п,

где п - объем выборки; I - количество объясняющих переменных; у - г -е значение объясняемой переменной у; Х- > 0 - г -е значение 7 -й объясняющей переменной; £1 - г -я ошибка аппроксимации; «0, «, ..., «+2сг, Л, Л\, • ••, \' Лг, Лг, •••' Л2 2 неизвестные параметры; ц х, ц.2 - элементы 7 -й строки индексной матрицы М размера Сг2 х 2, содержащей в строках всевозможные комбинации пар индексов переменных.

Придавая каждому из параметров Л, Л\ , •••, Л21 , Л, Лг, •••, Л^ р значений так, как это сделано в [14], можно перейти к регрессии

I С1 р С1 р

У = «0 + + ХХ«^ + ХХ«^ + Ъ

7=1 7=1 к=1 7=1 к=1 , (2)

г = 1, п,

где CCk , C , j = 1, Cf , к = 1, ^ - параметры для регрессоров с бинарной операцией min

и

тах соответственно

; ^ = т!п {Хг, ^ ^ 2}, 4 = тах {х, ^ ^ 2}, / =1,п, 7 = 1, С72, к = 1, р •

Проведя нормирование всех переменных в (2) по известному правилу [14], вместо (2) можно получить стандартизованную регрессию с неизвестными коэффициентами ( ,

7 = 1,1 и (¡jk, ((к, 7 = 1, СI , к = 1, р . А с помощью неё можно сформулировать следую-

щую задачу частично-булевого линейного программирования (ЧБЛП) построения модели НЛР:

1 С1 Р С1 р

Я = Е ^ ■ Р + ЕЕ ^ ■ 3 + ЕЕ ^ ^ тах.

3=1 3=1 к=1 3 3=1 к=1 3

л=1 к=1

С1 Р

(1 )м < Егх^к'р+ЕЕ^»' Дл +

5=1 =1 =1

С1 Р

Г

, , ^ ^к ' ^ У^к 51 =1 ^2 =1

1 С2 р

-(1" 8) м <Е г, Р+Е Е ^, Р+

^^ ' ' 3 1 2

5=1 =1 52 =1

С1 Р

5 =1 5 г. =1

1_1 52

-1

0<рР <(V,)-8• (3к)е{(51,52)1'У,;,2 >0}•

(3)

(1 83 ) ^ < ^^ ^Х3Хк Рк ^ ^^^^ ^Х:2-к Р*к ^ к=1 5=1 к=1 3

С1 Р _

+ЕЕ^-Рк-Гх, < с1-8 ж. з=и. (4)

+ЕЕ>;+ •р- ^ <а- 8ж. ,=1,с. к=1,р. (5)

+ЕЕ^• р - Гу4 <(1 - 88)м. 3 = 1,С • к = 1,Р. (6)

0 <Р, <( % )-8 • , Ч* I ^ >0} • (7)

(У8, <Р, < 0 • 3 ^ I Гух5 < 0}. (8)

0 <Рк <( ^ )- 8 • ( 3,к )-{( 51,52 > 0} •

(9)

(^ )Ч <Р < 0 . (3,к)-{(51,52 < 0} • (10)

(11)

)- 8 <Р < 0 . (Л к )е{( 51,52 < 0} • (12)

8} е {0,1}. 3 = й ;8"к е {0,1}. 8, е {0,1}. 3 = 1С. к = ~Р. (13)

где Я2 - коэффициент детерминации модели; символом ГХ7 обозначены коэффициенты

парной корреляции между переменными X и У; 8.. 3 = 1? 1 - булевы переменные, заданные по правилу

[1, если j-я переменная входит в регрессию,

10, в противном случае;

8-, 7 = 1, С2 , к = 1, р - булевы переменные, заданные по правилу

1, если j-я бинарная операция минимум с к-м преобразованием 8- = < входит в регрессию,

0, в противном случае;

8*к, 7 = 1,С72 , к = 1, р - булевы переменные, заданные по правилу

1, если j-я бинарная операция максимум с к-м преобразованием

8++ = ) входит в регрессию,

0, в противном случае;

М - большое положительное число, возможный способ выбора которого подробно описан в [14].

Решение задачи ЧБЛП с целевой функцией (3) и с линейными ограничениями (4)-(13) приводит к выбору оптимальной структуры модели (2), в которой знаки оценок параметров будут согласованы со знаками соответствующих коэффициентов корреляции. В этой связи в полученной регрессии о значимости регрессоров можно судить по величинам абсолютных

вкладов переменных в общую детерминацию Я2 :

Сабс = г в 7 =1'1 • Сабс = Г ■ в~ Сабс = Г ■ в+ 7 = ^С1 к =1'Р

СХ7 = Гух] в7 , • Ч- % в7к, 4+ Гу2+к в7к, , •

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для того чтобы каждая объясняющая переменная входила в модель не более одного раза, необходимо ввести в задачу (3)-(13) следующие линейные ограничения:

/ С/ р С/ р _

X V 87+XX V- ,/+к+л-8+XX п,/+рС/+к+р о- -8 ^1, *=1,1, (14) 7=1 7=1 к=1 7=1 к=1

где V] - элементы бинарной матрицы V размера (/ + 2р ■ С2 ) х /, заданные по правилу

Г1, если j-я переменная входит в ьй регрессор модели (2),

[0, в противном случае.

В полученной в результате решения задачи ЧБЛП (3) - (14) НЛР может присутствовать мультиколлинеарность, а коэффициенты модели могут оказаться незначимыми. Для решения

.^абс /^габс

этой проблемы введем в задачу ограничения на абсолютные вклады переменных С , С - , Сабс в общую детерминацию Я2 :

27к

ух.

в >0-81,7 = 1,1, (15)

г - -в-к >08, 7 = 1, С2, к = 1, р, (16)

>0-8+к, 7= 1, С2, к = 1, р, (17)

где 0 > 0 - заданное минимальное значение вклада каждого регрессора в общую детерминацию. Очевидно, что с ростом числа 0 будут увеличиваться вклады регрессоров в общую детерминацию и параллельно будет уменьшаться их количество, что приведет к снижению мультиколлинеарности.

Построение НЛР рекомендуется проводить методом последовательного повышения вкладов (МППВ) регрессоров по следующему алгоритму. Решить задачу (3) - (14). Для полученной НЛР вычислить абсолютные вклады регрессоров и оценить степень мультиколли-

неарности любым известным методом, например с помощью коэффициентов вздутия дисперсии. Если вклады достаточно высоки, а мультиколлинеарность слабая, то НЛР получена. В противном случае назначается величина 6, чуть большая, чем минимальный из текущих абсолютных вкладов, и решается задача (3) - (17). И так до тех пор, пока не будет получена НЛР со слабой мультиколлинеарностью и необходимыми абсолютными вкладами регрессо-ров в детерминацию. МППВ гарантирует построение вполне интерпретируемой НЛР.

Для решения сформулированных весьма трудоемких задач была разработана специальная программа «ВИнтер-2». Решателем задач ЧБЛП в этой программе выступает пакет ЬРБо1уе. Для того чтобы полученная структура НЛР гарантированно была интерпретируемой, «ВИнтер-2» по умолчанию исключает все регрессоры, не удовлетворяющие содержательному смыслу решаемой задачи (подробно эти условия описаны в [14]). Также в программе предусмотрена возможность контролировать число преобразованных переменных, исключая те из них, у которых коэффициент корреляции с у по абсолютной величине не

превосходит некоторого числа г е [0,1), т. е. для которых не выполняются условия:

г

У2 ]к

> г,

г +

У2+к

> г, ] = 1, С2, к = 1, р. (18)

Тюменская область, имеющая в своем составе Ханты-Мансийский автономный округ -Югру и Ямало-Ненецкий автономный округ, занимает третье место по площади среди субъектов Российской Федерации. Она представляет собой крупнейший нефтегазовый регион России, поэтому актуальной задачей является создание в Тюменской области современной и эффективной транспортной инфраструктуры. При этом с научной точки зрения актуальна задача моделирования железнодорожных грузовых перевозок в Тюменской области. Одно из решений этой задачи можно найти в работах [16, 17], в которых построена линейная регрессия

у = 31,6346 + 0,00072 - 0,000 Ц - 0,0003г3

где у - грузовые перевозки железнодорожного транспорта юга Тюменской области (млн тонн); 2 - среднемесячная заработная плата работников магистрального ж/д транспорта (руб.); - экспорт в страны дальнего зарубежья минеральных продуктов (млрд долл. США); 2 - среднесписочная численность работников (человек). Коэффициент детерминации Я2 этой линейной регрессии составил всего 0,67, поэтому вряд ли можно считать её адекватной.

Для построения вполне интерпретируемой НЛР железнодорожных грузоперевозок Тюменской области были использованы годовые статистические данные за период с 2000 по 2020 г. по следующим переменным:

у - отправление грузов железнодорожным транспортом общего пользования (миллионов тонн); x1 - численность рабочей силы (тысяч человек); x2 - число предприятий и организаций;

XJ - производство электроэнергии (миллиард киловатт-часов);

x4 - удельный вес автомобильных дорог с твердым покрытием в общей протяженности автомобильных дорог общего пользования (%);

x5 - удельный вес автомобильных дорог с усовершенствованным покрытием в протяженности автомобильных дорог с твердым покрытием общего пользования (%); x6 - продукция сельского хозяйства (миллионов рублей);

x7 - объем работ, выполненных по виду экономической деятельности «Строительство» (миллионов рублей);

x8 - валовой региональный продукт (ВРП) (миллионов рублей).

Коэффициенты корреляции объясняющих переменных с у составляют:

г = 0,840 г = 0,339 г = 0,896 г =-0,549

УХ1 Ух2 Ух3 УХ4

r^ =-0,725 ^ = 0'946 ^ = = 0'926

Как видно, знаки всех коэффициентов корреляции удовлетворяют содержательному смыслу задачи. Так, рост численности рабочей силы x1, числа предприятий и организаций x2, производства электроэнергии xj, продукции сельского хозяйства x6, объемов работ по виду «Строительство» Х7 и ВРП x8 приводит к увеличению грузовых ж/д перевозок Тюменской области. А увеличение удельного веса автодорог с твердым покрытием x4 и с усовершенствованным покрытием x5 приводит, по логике, к повышению спроса на перевозки грузов автотранспортом, а следовательно, к снижению спроса на ж/д перевозки. Самая слабая корреляция наблюдается между y и x2 (0,339), однако было принято решение не исключать

переменную Х2 из рассмотрения, поскольку степень её влияния на y в НЛР может вырасти.

Сначала в программе «ВИнтер-2» были заданы следующие параметры построения НЛР: p = 4, r = 0,2. В результате было сформировано p • С2 = 112 пар переменных, преобразованных с помощью бинарной операции min, и столько же пар переменных, преобразованных с помощью max. Итого 224 преобразования. Затем из них были исключены те, для которых не выполнились условия (18). В итоге сформировался набор, содержащий 8 объясняющих переменных и 128 преобразований. По этому набору программа автоматически сформировала задачу ЧБЛП (3) - (14) на языке пакета LPSolve. Решение этой задачи было найдено за 153 секунды. В результате решения была выбрана следующая оптимальная структура НЛР:

(0,0701) (0,0293)

у = 13,8072 + 0,000167 min {х2,0.9545х7} + 0,017 min {х3,0.0000709х8} +

(1,146) (0,128)

(0,7854) (0,0666)

+0,0105 max {x, 0.04633x6} - 0,403 max {x4,0.9475x5}. (19)

(4,229) (-1,706)

Как видно, все восемь объясняющих переменных вошли в состав полученного уравнения. При этом для пар Х2 и x7, Х3 и x8 была идентифицирована бинарная операция min, а для пар x1 и x<5, x4 и x5 - max.

Коэффициент детерминации R2 НЛР (19) составил 0,951423, что подтверждает адекватность модели.

В скобках под коэффициентами регрессии (19) указаны значения t-критерия Стьюдента, по которым можно сделать вывод, что значимым для уровня значимости X = 0,1 оказался

только один регрессор - max{xr ,0.04633x6} . В скобках над коэффициентами модели (19) указаны абсолютные вклады переменных в общую детерминацию, показывающие, что ре-грессор min(x3,0.0000709x8 } вносит слишком низкий вклад (0,0293), не превышающий 0,05.

Коэффициенты вздутия дисперсии регрессоров НЛР (19) составили 8,912, 23,039, 12,596 и 1,435 соответственно. Двое из этих коэффициентов превысили пороговое значение 10, из чего можно сделать вывод о присутствии в полученной модели мультиколлинеарности.

Перечисленные обстоятельства не позволяют отнести НЛР (19) к вполне интерпретируемым. Поэтому было принято решение перестроить модель, дополнив задачу ЧБЛП (3) - (14) ограничениями (15) - (17) на абсолютные вклады переменных. Поскольку минимальный из абсолютных вкладов регрессии (19) равен 0,0293, то величина параметра 0 была выбрана равной 0,03. Начальные параметры p и r не менялись. Решение задачи (3) - (17) в LPSolve было найдено за 136 секунд. В результате автоматически определилась следующая структура НЛР:

(0,0774) (0,8078)

у = 12,7415+ 0,0001866 min{;c2,0.09879jc8 } + 0,01083 тах{^, 0.04633.х6} -

(3,827) (13,14)

(0,0661)

0,4005max{x4,0.9475x5}. (20)

(-1,751)

Как видно, переменные x3 и x7 не вошли в состав регрессии (20). При этом регрессоры max{^,0.04633x6} и max{x4,0.9475x5} сохранились в уравнении, а регрессоры min jx2,0.9545x7} и min j x3,0.0000709x8} из (19) перегруппировались в модели (20) в регрессор min{x2,0.09879x8} .

Коэффициент детерминации R НЛР (20) составил 0,951374, что меньше, чем у модели (19), всего лишь на 0,00005. Иными словами, исключение переменных x3 и x7 практически не изменило высокого качества аппроксимации НЛР.

Все коэффициенты регрессии (20) значимы по t-критерию Стьюдента для уровня значимости X = 0,1, а минимальный абсолютный вклад в R2 составляет 0,0661 для регрессора max{x4,0.9475x5} ,что довольно существенно.

Коэффициенты вздутия дисперсии регрессоров НЛР (20) составили 1,035, 1,466 и 1,425 соответственно, откуда следует, что в модели мультиколлинеарности нет.

Таким образом, выполняются все необходимые условия, чтобы считать НЛР (20) вполне интерпретируемой регрессионной моделью.

Представим модель (20) в кусочно-заданной форме:

x x x

12,7415 + 0,00001843xg + 0,01083- - 0,4005x4, при -L > 0,09879, -L > 0,04633, > 0,9475;

X8 x6 x5

x x x

12,7415 + 0,00001843x + 0,01083x - 0,3795x5, при x2 > 0,09879, -1- > 0,04633, x4 < 0,9475;

x8 x6 x5

x x x

12,7415 + 0,00001843x + 0,000502x6 - 0,4005x4, при x2 > 0,09879, < 0,04633, x4 > 0,9475;

x8 x6 x5

x x x

12,7415 + 0,00001843x + 0,000502x6 - 0,3795x5, при x2 > 0,09879, - < 0,04633, x4 < 0,9475;

У =

x x x

12,7415 + 0,0001866x2 + 0,01083x - 0,4005x4, при -L < 0,09879, -L > 0,04633, > 0,9475;

x8 x6 x5

x x x

12,7415 + 0,0001866x2 + 0,01083x - 0,3795x5, при x2 < 0,09879, -1- > 0,04633, x4 < 0,9475;

x8 x6 x5

x x x

12,7415 + 0,0001866x2 + 0,000502x6 - 0,4005x4, при x2 < 0,09879, < 0,04633, x4 > 0,9475;

x8 x6 x5

x x x

12,7415 + 0,0001866- + 0,000502- - 0,3795-, при -L < 0,09879, -L < 0,04633, < 0,9475.

x8 x6 x5

Тогда НЛР (20) можно интерпретировать следующим образом.

1. Если показатель x2/x8 не меньше, чем 0,09879, то на отправление грузов ж/д транспортом y влияет ВРП x8, а число предприятий и организаций x2 не влияет. При этом с увеличением ВРП x8 на 1 млн руб. (при неизменных значениях остальных переменных) y возрастает в среднем на 18,43 тонны. А если показатель x2/x8 меньше, чем 0,09879, то на y влияет число предприятий и организаций x2, а ВРП x8 не влияет. При этом с увеличением числа предприятий и организаций x2 на 1 единицу (при неизменных значениях остальных переменных) y возрастает в среднем на 186,6 тонны.

2. Если показатель x1/x6 не меньше, чем 0,04633, то на отправление грузов ж/д транспортом y влияет численность рабочей силы x1, а продукция сельского хозяйства x6 не влияет. При этом с увеличением численности рабочей силы x1 на 1 тыс. человек (при неизменных значениях остальных переменных) y возрастает в среднем на 10830 тонн. А если показатель x1/x6 меньше, чем 0,04633, то на y влияет продукция сельского хозяйства x6, а численность рабочей

силы x¡ не влияет. При этом с увеличением продукции сельского хозяйства x6 на 1 млн руб. (при неизменных значениях остальных переменных)y возрастает в среднем на 502 тонны.

Если показатель x4/x5 не меньше, чем 0,9475, то на отправление грузов ж/д транспортом y влияет удельный вес автодорог с твердым покрытием x4, а удельный вес автодорог с усовершенствованным покрытием x5 не влияет. При этом с увеличением удельного веса автодорог с твердым покрытием x4 на 1 % (при неизменных значениях остальных переменных) y убывает в среднем на 0,4005 млн тонн. А если показатель x4/x5 меньше, чем 0,9475, то на y влияет удельный вес автодорог с усовершенствованным покрытием x5, а удельный вес автодорог с твердым покрытием x4 не влияет. При этом с увеличением удельного веса автодорог с усовершенствованным покрытием x5 на 1 % (при неизменных значениях остальных переменных) y убывает в среднем на 0,3795 млн тонн.

Заключение и выводы

Таким образом, для построения НЛР в данной работе сформулирована задача ЧБЛП, позволяющая регулировать абсолютные вклады регрессоров в общую детерминацию и эффект мультиколлинеарности. Показано, что реализация метода последовательного повышения вкладов регрессоров гарантирует построение вполне интерпретируемых НЛР. С помощью предложенного математического аппарата решена задача моделирования ж/д грузовых перевозок Тюменской области. Автоматически полученная НЛР оптимальной структуры является адекватной по всем основным показателям, а также вполне интерпретируемой. Интерпретация модели позволила выявить новые закономерности функционирования ж/д транспорта Тюменской области, недоступные при использовании классических линейных регрессий. Построенная модель также может применяться для прогнозирования.

Литература

1. Molnar, C. Interpretable machine learning / C. Molnar. - Lulu. com, 2020.

2. Du, M. Techniques for interpretable machine learning / M. Du, N. Liu, X. Hu // Communications of the ACM. - 2019. - Vol. 63, №. 1. - P. 68-77.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Doshi-Velez, F. Towards a rigorous science of interpretable machine learning / F. Doshi-Velez, B. Kim // arXiv preprint arXiv:1702.08608. - 2017.

4. Definitions, methods, and applications in interpretable machine learning / W. J. Murdoch, C. Singh, K. Kumbier, R. Abbasi-Asl, B. Yu // Proceedings of the National Academy of Sciences. -2019. - Vol. 116, №. 44. - P. 22071-22080.

5. Montgomery, D. C. Introduction to linear regression analysis / D. C. Montgomery, E. A. Peck, G. G. Vining. - John Wiley & Sons, 2021.

6. Fox, J. Applied regression analysis and generalized linear models / J. Fox. - Sage Publications, 2015.

7. Носков, С. И. Программный комплекс построения некоторых типов кусочно-линейных регрессий / С. И. Носков, А. А. Хоняков. - Текст : непосредственный // Информационные технологии и математическое моделирование в управлении сложными системами. -2019. - № 3 (4). - С. 47-55.

8. Носков, С. И. Кусочно-линейная производственная функция погрузки на железнодорожном транспорте / С. И. Носков. - Текст : непосредственный // Научные труды КубГТУ. -2022. - № 4. - С. 72-79.

9. Носков, С. И. Построение кусочно-линейной регрессии с интервальной неопределенностью в данных для зависимой переменной / С. И. Носков. - Текст : непосредственный // Вестник кибернетики. - 2022. - № 2 (46). - С. 61-65.

10. Носков, С. И. Построение кусочно-линейной авторегрессионной модели произвольного порядка / С. И. Носков. - Текст : непосредственный // Вестник Югорского государственного университета. - 2022. - № 2 (65). - С. 89-94.

11. Базилевский, М. П. МНК-оценивание параметров специфицированных на основе функций Леонтьева двухфакторных моделей регрессии / М. П. Базилевский. - Текст : непосредственный // Южно-Сибирский научный вестник. - 2019. - № 2 (26). - С. 66-70.

12. Базилевский, М. П. Оценивание линейно-неэлементарных регрессионных моделей с помощью метода наименьших квадратов / М. П. Базилевский. - Текст : непосредственный // Моделирование, оптимизация и информационные технологии. - 2020. - Т. 8, № 4 (31). - С. 26-27.

13. Базилевский, М. П. Отбор информативных операций при построении линейно-неэлементарных регрессионных моделей / М. П. Базилевский. - Текст : непосредственный // International Journal of Open Information Technologies. - 2021. - Т. 9, № 5. - С. 30-35.

14. Базилевский, М. П. Метод построения неэлементарных линейных регрессий на основе аппарата математического программирования / М. П. Базилевский. - Текст : непосредственный // Проблемы управления. - 2022. - № 4. - С. 3-14.

15. Базилевский, М. П. Построение вполне интерпретируемых линейных регрессионных моделей с помощью метода последовательного повышения абсолютных вкладов переменных в общую детерминацию / М. П. Базилевский. - Текст : непосредственный // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии. - 2022. - № 2. - С. 5-16.

16. Филимонова, Л. А. Особенности применения стохастических моделей в оценке и прогнозах уровня конкурентоспособности транспортно-логистической системы обслуживания грузопотоков на примере юга Тюменской области / Л. А. Филимонова, Д. А. Буткова, А В. Носырева. - Текст : непосредственный // Московский экономический журнал. - 2019. -№ 1. - С. 354-364.

17. Мильчакова, Н. Н. Формирование системы оценки и прогноза эффективности транс-портно-логистической системы обслуживания грузопотоков Тюменской области / Н. Н. Мильчакова, А. В. Носырева. - Текст : непосредственный // Вестник Сургутского государственного университета. - 2018. - № 2 (20). - С. 71-77.

i Надоели баннеры? Вы всегда можете отключить рекламу.