DOI 10.36622/VSTU.2021.17.4.008 УДК 628.171
ПРИМЕНЕНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ И АЛГОРИТМОВ ПРИ ПЛАНИРОВАНИИ И ПРОГНОЗИРОВАНИИ ПОТРЕБЛЕНИЯ ВОДНЫХ РЕСУРСОВ
В.В. Мокшин1, А.В. Спиридонова2, Г.В. Спиридонов1
'Казанский национальный исследовательский технический университет
им. А.Н. Туполева, г. Казань, Россия 2Казанский (Приволжский) федеральный университет, г. Казань, Россия
Аннотация: рассматриваются математические и информационные методы эффективного прогнозирования потребления водных ресурсов. Произведены расчёты водопотребления по типовому административному зданию. Предложенные материалы представляют интерес для широкого круга специалистов, занимающихся разработкой экономико-математических моделей и повышением эффективности при планировании водных ресурсов в сфере жилищно-коммунального хозяйства. Прогнозирование осуществлялось с помощью регрессионных методов Forward Regression и Backward Elimination, включающих в себя как линейные, так и множественные нелинейные подходы анализа данных. Отдельное внимание было уделено сравнению действительных и прогнозируемых показаний. В ходе работы были выявлены наиболее релевантные алгоритмы, которые позволили произвести достаточно точную оценку водопотребле-ния, что считается одной из основных задач водоснабжения и управления водопроводными сетями. В ходе исследования было установлено, что корректность прогнозируемых результатов в равной степени зависит как от количества исходных данных, на основе которых производится построение моделей, так и от количества дней, на которое производится прогнозирование. В случае выборки данных в 255 исходных и 116 прогнозируемых дней наиболее вероятные значения были получены регрессионными методами прямого и обратного отбора переменных. Проведённый анализ позволил указать причины появления ошибок при использовании данных методов. На основе достоверности расчётных показаний можно говорить о востребованности и пригодности изученных методов среди информационных систем на промышленных и жилищно-коммунальных объектах. Комплексный подход оптимизирует процесс планирования и повышает точность прогнозируемых значений суточного водопотребления в пределах жилищных микрорайонов, что сегодня является исключительно важным аспектом в сфере водоснабжения и управления водопроводными сетями
Ключевые слова: регрессия, прогнозирование, расчёт водопотребления, корреляция
Введение
Сегодня грамотное и эффективное управление водоснабжающими компаниями является одной из наиболее важных и в то же время непростых задач. В ходе работы сотрудники таких компаний сталкиваются с большим количеством проблем, среди которых особенно злободневными являются низкий уровень планирования потребления воды и нерелевантное прогнозирование расходов. Причинами неэффективного планирования и прогнозирования является устаревание существующих технических систем, отчасти - использование не в полной мере объёма информации и недостаточный общий уровень квалификации персонала предприятий. В связи с этим численное прогнозирование объёмов потребления воды становится исключительно важной задачей, позволяющей разрешить несколько проблем. В частности, качественное прогнозирование потребления будет являться основой для эффективного планирования подачи и распределения воды [1].
Численное прогнозирование базируется на использовании математических методов с их последующей реализацией в различных информационных системах. Большое количество существующих и активно применяющихся сегодня методов прогнозирования описано в исследованиях В.Е. Снитюка [2]. Среди всех математических методов наиболее достоверными являются статистические методы, которые популярны во всех сферах жизни [3-5]. Можно выделить работу А.И. Новикова «Эконометрика», в которой приводится подробное описание проведения статистического анализа для динамических моделей и способов выявления тенденций [6]. Особую роль среди статистических методов играют методы корреляционного и регрессионного анализа. В частности, Э. Ферстер и Б. Ренц [7] рассматривают модели множественной регрессии. Данным моделям стоит отдать предпочтение при планировании и прогнозировании, так как они позволяют учесть все существенные факторы. Группой под руководством S.L. 2^иа было произведено прогнозирование потребления воды в Мельбурне (Австралия) на основе множественных
© Мокшин В.В., Спиридонова А.В., Спиридонов Г.В., 2021
корреляций и автокорреляций [8]. Также зарубежными авторами приводится прогноз для потребления горячей воды на основе метода авторегрессии со скользящим средним, который также является корреляционным [9].
Прогнозирование потребления воды осуществлялось и другими методами. Например, G.Chen совместно со своей группой спрогнозировали потребление воды в городской местности с помощью так называемого метода «случайных лесов» [10]. А среди российских авторов В.М. Задачиным была разработана система водопотребления города на основе экстраполяции [11].
Базовым понятием в системе мероприятий является план, который рассматривается как вариант наиболее оптимального использования ресурсов предприятия, обеспечивающий достижение целей и выполнение задач производства. Основу прогнозирования составляет предвидение развития производства и нахождение решений, которые обеспечивают наилучший вариант дальнейшей деятельности предприятия. Следует отметить, что в сферу ответственности любого водоснабжающего предприятия входит поставка воды потребителям, учёт потребления водных ресурсов, а также эксплуатация и надлежащее содержание водопроводной сети.
Принимая во внимание указанные обстоятельства, было решено рассмотреть несколько математических моделей анализа имеющихся данных и численного прогнозирования суточного водопотребления. При постановке задачи ключевым аспектом являлось выявление оптимального метода обработки большого количества данных с достаточной точностью для последующего использования полученных результатов для планирования водопотребления административным сектором.
В ходе построения моделей использовались статистические и корреляционные методы с возможностью автоматического расчёта в специализированных программах. Предлагаемые методы могут не только повысить эффективность прогнозирования объёмов водопо-требления, но и за счёт грамотно спланированной подачи воды увеличить прибыль снабжающего предприятия.
Теория
Прогнозирование потребления водных ресурсов и определение наиболее подходящих методов для их включения в автоматизирован-
ную информационную систему осуществлялось на примере реальных данных водопо-требления по городу Казани. В качестве исходных статистических данных были выбраны показания за период с 01.01.2019 по 31.12.2019 (366 значений). 250 показаний использовались в качестве базовых для построения прогноза, а по 116 оставшимся реальным показаниям производилось сравнение.
При анализе данных и составлении прогноза было решено придерживаться следующей методической конструкции:
1. Сбор статистических данных с мест учёта.
2. Проверка статистических данных на достоверность.
3. Расчёт статистических характеристик параметров.
4. Проведение парного корреляционного анализа.
5. Осуществление линейного и нелинейного регрессионного анализа данных методом прямого отбора переменных Forward Regression.
6. Осуществление линейного и нелинейного регрессионного анализа данных методом обратного отбора переменных Backward Elimination.
7. Формирование и анализ прогноза водо-потребления.
В качестве объективных факторов объёма ежедневного потребления воды отдельным административным зданием были выбраны следующие величины:
xi - среднее значение температуры воздуха (К);
x2 - среднее значение атмосферного давления (мм.рт.ст.);
Хз - среднее значение относительной влажности воздуха (%);
x4 - среднее значение скорости ветра (м/с); x5 - уровень облачности (%); x6 - минимальное значение температуры воздуха за сутки (К);
x7 - максимальное значение температуры воздуха за сутки (К);
x8 - количество осадков за сутки (мм); x9 - длительность рабочего дня (ч). За результативный показатель принята переменная y - суммарное водопотребление за сутки (м3).
Для выяснения распределения переменных исходных статистических данных (ИСД) было необходимо оценить их основные статистические характеристики такие, как среднее значение, медиана, стандартное отклонение,
стандартная ошибка среднего, максимум и минимум переменных, асимметрия, стандартная ошибка асимметрии, эксцесс, средняя ошибка эксцесса, отношение стандартной ошибки среднего к среднему значению, разница между медианой и средним значением. Формулы, которые использовались для их расчёта, приведены ниже.
Среднее арифметическое значение:
- 1 "
= -Е V
П 7=1 ■
(1)
где п - количество учитываемых временных интервалов;
т - количество изменяемых факторов; k - количество результативных показателей состояния;
Уу - значение у'-й переменной на 7-м временном интервале;
V] - среднее арифметическое значение у'-й
переменной по п учитываемым интервалам времени; 7 = 1, т + к - номер строки в таблице
ИСД; _'
у'=1, т + к - номер столбца в таблице ИСД. Медиана:
Р(Vу < Мв]) = Р(V' > Мв]) = 0.5 . (2) Стандартное отклонение:
*
='
пЕ- (X V')2
7=1
СТ.
Л =Т.
V«
Асимметрия:
п
(п -1) • (п - 2) У
- Vi
СТ..
Стандартная ошибка асимметрии: Эксцесс:
б(п - 1)п
(п - 2)(п + 1)(п + 3) п(п +1)
-У
(п - 1)(п - 2)(п - 3) 1=1
3(п -1)2
V.. - V.
у у
СТ .
(п - 2)(п - 3)
Средняя ошибка эксцесса:
24п (п -1)2
п - 3)(п - 2)(п + 3)(п + 5)
(4)
(5)
(6)
(7)
(8)
Отношение стандартной ошибки среднего к среднему значению:
Л.
Данные и методы
(9)
(3)
Стандартная ошибка среднего:
В табл. 1 приведены рассчитанные значения некоторых характеристик для показателя и факторов суточного потребления воды.
Таблица 1
Статистические параметры объективных переменных объёма ежедневного потребления воды
отдельным административным зданием
4
СТ =
ЭКС
V
у Х1 Х2 Хз Х4 Х5 Х6 Х7 Х8 Хд
Среднее значение 40,231 279,678 747,426 74,508 1,549 0,789 276,566 282,954 4,805 -
Медиана 53,122 278,344 746,850 77,563 1,000 0,950 275,375 282,000 0,600 9,000
Стандартное отклонение 24,410 10,652 6,818 13,705 0,781 0,304 9,584 12,140 12,253 -
Стандартная ошибка 1,276 0,557 0,356 0,716 0,041 0,016 0,501 0,635 0,640 0,220
среднего
Минимум переменной 1,764 255,688 727,063 31,750 0,000 0,000 253,150 256,000 0,000 0,000
Максимум переменной 79,504 299,725 771,838 96,250 5,000 1,000 294,900 306,600 179,000 9,000
Асимметрия -0,642 -0,088 0,400 -0,754 0,669 -0,390 -0,254 0,043 8,786 -0,763
Эксцесс -1,409 -0,938 0,773 -0,077 1,040 0,725 -0,665 -1,088 112,881 -1,426
Отношение
стандартной ошибки к 0,607 0,038 0,009 0,184 0,504 0,385 0,035 0,043 2,550 0,691
среднему значению
Продолжение табл. 1
Разница
между ме-
дианой и 12,891 1,334 0,576 3,055 0,549 0,161 1,191 0,954 4,205 2,904
средним
значением
После проверки ИСД на достоверность и расчёта статистических параметров основной задачей являлось выявление тесноты связи результативного показателя у с каждым отдельным объективным фактором х, - проведение парного корреляционного анализа.
У = / (Х1, Х2,...ХМ ^ (10)
где М - количество объективных факторов.
Взаимосвязь переменных оценивалась по формуле парных коэффициентов линейной корреляции Пирсона:
— > v v--
néi gi g n
-1 z
v^i • — ng
(11)
i
(
I V 2 I 1 V
II Zv2-l n Zvg
=1
2Л
(
1 V 2 I 1 V n Z^ -| n Z^
V
=1
2
где v L ) - значение i-й (j-й) переменной на
jg/
интервале g.
Для наглядности корреляционные зависимости между показателем и факторами водопотребления отображены в виде гистограммы на рис. 1.
Рис. 1. Зависимость коэффициентов корреляции Пирсона между показателем у и факторами xi
Все коэффициенты линейной корреляции лежат в интервале от -1 до +1. Если значение коэффициента близко к +1 или -1, то имеет место сильная, почти линейная, положительная или отрицательная зависимость между переменными. Если значение коэффициента близко к 0, то это означает, что переменные практически не зависят друг от друга.
Наиболее сильной оказалась парная корреляционная связь между показателем потребления воды и девятым фактором - типом дня недели. Влияние данного фактора составило
46% (см. рис. 2) с коэффициентом корреляции 0,981. Вторым по степени корреляционной связи с показателем водопотребления оказалось максимальное значение температуры воздуха за сутки x7, вклад которого составляет 20%, а коэффициент корреляции равен -0,426.
Рис. 2. Доля влияния соотвествующих факторов на водопотребление
Очень близкий по уровню значимости вклад с долей 19% вносит фактор xi - среднее значение температуры воздуха. Его парный коэффициент корреляции составил 0,407.
Остальные факторы, как видно из рис. 1 и рис. 2, не обладали существенной положительной и отрицательной связью с показателем суточного потребления воды.
На основе данных, полученных в результате корреляционного анализа, стало возможно установить регрессионные зависимости для показателей водопотребления. Построение моделей множественных регрессий осуществлялось с помощью пакета прикладных программ SPSS Statistic v26 [12].
Уравнения множественной регрессии для переменной y были получены двумя способами: методом прямого отбора переменных Forward Regression и методом обратного отбора переменных Backward Elimination.
Регрессионный анализ позволил исследовать влияние регрессоров (независимых переменных) на зависимую переменную y, основываясь на методе наименьших квадратов (МНК). МНК - это метод, требующий минимизации суммы квадратов отклонений искомых функций от имеющихся переменных.
1
v
т„ =
п
У (У у - I, (Х 2 Хгт ))2 ^ т1П (12)
7 =1
у = 1к
где у, - экспериментальное значение ,'-го показателя на 7-м интервале времени;
I, (х71, х72,..., Х7т ) - значение ,'-го показателя состояния на 7-м интервале времени, вычисленное по аппроксимирующей регрессионной зависимости;
т - количество факторов; к - количество показателей. В алгоритме метода прямого отбора переменных из списка регрессоров выбирался тот, который имеет наибольший коэффициент корреляции с зависимой переменной. Далее модель, состоящая из одного регрессора, проходила проверку на значимость при помощи F-критерия Фишера. Если значимость модели не подтверждалась, то алгоритм прерывался из-за отсутствия входных переменных. В противном случае этот регрессор вводился в модель.
По всем оставшимся переменным на основании формулы (15) рассчитывалось значение у, а именно отношение прироста суммы квадратов SSR регрессии к сумме квадратов ошибок МЛЕ.
= £?=1(уг-у)2, (13)
где п - объем выборки;
Уг - оценка, полученная на основе регрессионной модели;
у - среднее всех наблюдений показателя.
МБЕ = , (14)
п—к—2 ' у '
где п - объем выборки;
к - количество регрессоров исходной модели без учёта регрессора, проходящего проверку.
Далее из списка регрессоров заново выбирался тот, у которого оказывался наибольший критерий у.
Выбранный таким образом регрессор также проверялся на значимость F-критерия Фишера. Если регрессор оказывался значимым, то он включался в модель, после чего осуществлялся возврат к пункту расчёта критерия у. Если значимость регрессора не подтверждалась, то алгоритм прерывался.
Итоговое регрессионное уравнение для показателя суточного водопотребления у, полученное методом прямого отбора, приняло следующий вид:
у = - 38,509 + 5,541*7 + 0,159-Хд . (16)
Таким образом, значимыми факторами оказались x9 - длительность рабочего дня и x7 - максимальное значение температуры воздуха за сутки.
Кроме того, в ходе работы был проведён множественный нелинейный регрессионный анализ методом прямого отбора переменных, в результате уравнение было дополнено квадратными членами:
y = - 12,4846 + 0,6163*/ +
+ 0,0003*72 - 0,0003 . (17) В данном случае наиболее существенными стали также факторы x9 - длительность рабочего дня, x7 - максимальное значение температуры воздуха за сутки и xi - среднее значение температуры воздуха.
Алгоритм обратного отбора переменных был основан на противоположном подходе: в данном методе изначально в модель добавлялись все существующие регрессоры. Для каждого регрессора высчитывалась разность между получаемой суммой квадратов регрессии и показателем, рассчитанным без данного регрессо-ра, для которого был вычислен показатель у.
Первым выбирался регрессор с наименьшим значением у. Данный регрессор проходил проверку на значимость. Если проверка была пройдена, то он удалялся из анализа и снова рассчитывалась разность без данного регрес-сора. Иначе алгоритм прерывался.
С помощью метода обратного отбора переменных было получено следующее регрессионное уравнение: y = - 31,781 - 0,04*i - 0,145*7 + 5,545*9 . (18) Как и в случае применения метода прямого отбора переменных, наиболее существенными оказались факторы xi , x7 и x9.
При построении множественной нелинейной регрессии методом обратного отбора переменных регрессионное уравнение приняло следующий вид:
y = - 16,3405 + 0,0003*72 + 0,616 •Хд . (19) В соответствии с полученными регрессионными уравнениями стандартная ошибка оказалась равной 4,4474 м3 для линейной модели и 4,4196 м3 для нелинейной множественной модели алгоритма Forward Regression, 4,2212 м3 для линейной модели и 4,4473 м3 для нелинейной множественной модели алгоритма Backward Elimination.
Полученные результаты
Реальные и спрогнозированные различными методами зависимости суточного водопо-требления изображены на рис. 3.
70 -
"X
lg u
I
è
.У
40 -
20 -
10 -
Ill
щ
1 i
tîi
А
«s
д.
«с
i.
Дата
0
Реальные значения водопотребления Линейный прогноз Forward Regression Нелинейный прогноз Forward Regression Линейный прогноз Backward Elimination Нелинейный прогноз Backward Elimination
Рис. 3. Зависимости суточного потребления воды
Как можно видеть из рисунка, все предложенные регрессионные методы производят хороший количественный прогноз потребления воды в рамках соответствующих доверительных интервалов. Во всех алгоритмах явно прослеживаются периодические скачкообразные изменения в объёмах суточного потребления.
В табл. 2 приведены значения важных статистических характеристик таких, как ^ -доля объяснённой дисперсии, отношение стандартной ошибки к среднему и значение F-фактора.
Для всех методов доля объяснённой дисперсии оказалась очень высокой, а ошибка прогнозирования составила всего 11%. При этом включение абсолютно всех факторов от х1 до х9 не позволит уточнить прогноз, так как в указанных методах регрессионный анализ основан на установлении наиболее сильной связи и проведении наиболее точных вычислений.
Таблица 2 Результативные статистические характеристики для соответствующих регрессионных алгоритмов
Заключение
Обобщая полученные результаты, стоит отметить, что качество спрогнозированных значений очень сильно зависит от исходной выборки, на основе которой производится само прогнозирование. Потребление воды в определённые дни может иметь случайный скачкообразный характер, для которого установить закономерность зависимости водопо-требления от влияющих факторов будет намного сложнее [13-18]. Таким образом, логично предположить, что для каждой конкретной выборки любой из рассмотренных алгоритмов может оказаться более точным. В связи с этим целесообразность технико-экономического подхода доказывает, что предпочтительнее проводить анализ данных несколькими методами.
Значительно упростить процедуру прогнозирования может автоматизированная информационная система. На основе комплексной обработки данных информационной системой возможно формирование прогноза наиболее релевантным способом, расчёт которого принесёт экономический результат и небольшой срок окупаемости оборудования.
В условиях необходимости эффективного планирования и прогнозирования водопотреб-ления современное программное обеспечение
R2 S.
__ F
v. j
Прям. лин 0,96 0,02 3580
Прям. мн 0,95 0,02 2419
Обрат. лин 0,94 0,03 2416
Обратн. мн 0,97 0,02 3581
позволит осуществить желаемую оценку, за-действуя имеющиеся человеческие и технические ресурсы и существенно улучшая качество обработки информации.
Литература
1. Шушкевич Е.В. Эффективное управление системой подачи и распределения воды // Журнал ВСТ. 2011. Т. 1. C. 24-30.
2. Снитюк В.Е. Прогнозирование. Модели, методы, алгоритмы. Киев: Маклаут, 2008. 367 с.
3. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. Множественная регрессия. М.: Вильямс, 2007. 912 с.
4. Радченко С.Г. Устойчивые методы оценивания статистических моделей: монография. Киев: Санспарель, 2005. 504 с.
5. Радченко С.Г. Методология регрессионного анализа: монография. Киев: Корнийчук, 2011. 376 с.
6. Новиков А.И. Эконометрика. М.: Инфра, 2007.
144 с.
7. Ферстер Э., Ренц Б. Методы корреляционного и регрессионного анализа. М.: Финансы и статистика, 1983. 304 с.
8. Forecasting daily urban water demand: a case study of melbourne / S.L. Zhoua, T.A. McMahon, A. Walton, J. Lewis // Hydrology, 2000. 236 (3). Р. 153-164.
9. Lomet A., Suard Fr., Cheze D. Statistical modeling for real domestic hot water consumption forecasting // Energy Procedia, 2015. 70. С. 379-387.
10. Multiple random forests modelling for urban water consumption forecasting / G. Chen, T. Long, J. Xiong, Y.Bai // Water Resour. Manag., 2017. 31 (15). Р. 4715-4729.
11. Задачин В.М. Система прогнозирования водо-потребления города // Системи обробки шформаци. 2010. Т. 7. № 88. С. 95-98.
12. Бююль А., Цёфель П. SPSS: Искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. СПб.: Диа-СофтЮП., 2005. 608 с.
13. Параллельный генетический алгоритм отбора значимых признаков в задаче формирования мероприятий для нефтяных скважин / И.М. Якимов, П.И. Тутуба-лин, В.А. Суздальцев, И.А. Зарайский, Э.Г. Тахавова // Международная конференция по мягким вычислениям и измерениям: тезисы. СПб., 2018. Т. 1. С. 720-723.
14. Кирпичников А.П., Сайфудинов И.Р., Мокшин В.В. Разработка комплекса программ для анализа технического состояния грузоподъемных механизмов // Вестник Технологического университета. 2017. Т. 20. № 9. С. 112-116.
15. Mokshin A.V., Mokshin V.V., Sharnin L.M. Adaptive genetic algorithms used to analyze behavior of complex system. Comm // Nonlinear Science and Num. Simulation. 2019. 71. Р. 174-186.
16. Тутубалин П.И., Шафигуллин Р.Р., Моисеев В.С. Оптимизация состава вычислительного кластера мобильной распределенной интегрированной информационной системы // Вестник Казанского государственного технологического университета им. А.Н. Туполева. 2012. Т. 1. С. 120-128.
17. Мокшин В.В. Параллельный генетический алгоритм отбора значимых факторов, влияющих на эволюцию сложной системы // Вестник Казанского государственного технологического университета им. А.Н. Туполева. 2009. Т. 3. С. 89-93.
18. Parallel genetic algorithm of feature selection for complex system analysis IOP / I.R. Saifutdinov, L.M. Sharnin, V.V. Mokshin, M.V. Trusfus, P.I. Tutubalin // Conf. Series: Journal of Physics: Conf. Series. 2018. 1096. 012089. DOI: 10.1088/1742-6596/1096/1/012089
Поступила 21.04.2021; принята к публикации 23.08.2021
Информация об авторах
Мокшин Владимир Васильевич - канд. техн. наук, доцент, Казанский национальный исследовательский технический университет им. А.Н. Туполева (420124, Россия, Республика Татарстан, г. Казань, ул. Большая Красная, д. 55), e-mail: Vladimir. [email protected]
Спиридонова Ангелина Вячеславовна - магистр, Казанский (Приволжский) федеральный университет (420008, Россия, Республика Татарстан, г. Казань, ул. Кремлевская, д.18), e-mail: [email protected]
Спиридонов Григорий Вячеславович - аспирант, исследовательский Казанский национальный технический университет им. А.Н. Туполева (420124, Россия, Республика Татарстан, г. Казань, ул. Большая Красная, д. 55), e-mail: [email protected]
APPLICATION OF MATHEMATICAL MODELS AND ALGORYTHMS FOR THE WATER SOURCES CONSUMPTION PLANNING AND FORECASTING
V.V. Mokshin1, A.V. Spiridonova2, G.V. Spiridonov1
xKazan National Research Technical University named after A.N. Tupolev, Kazan, Russia
2Kazan Federal University, Kazan, Russia
Abstract: this article discusses mathematical and informational methods for effective forecasting of water consumption. We calculated the water consumption for a typical administrative building. The materials proposed in the article are of interest to a wide range of specialists working on the development of economic and mathematical models and increasing the efficiency of housing and communal companies. We carried out the prediction using regression methods - Forward Regression and Backward Elimination, which include both linear and multiple nonlinear approaches to data analysis. We paid special attention to the comparison of actual and predicted readings. In the course of the work, we identified the most relevant algorithms, which allowed us to
make a fairly accurate assessment of water consumption, which is an extremely important aspect in the field of water supply and management of water supply networks. In the course of the study, we found that the correctness of the predicted results equally depends both on the amount of initial data, on the basis of which the models are built, and on the number of days for which the forecast is made. In the case of a sample of data of 255 baseline and 116 forecast days, we obtained the most probable values by regression methods of direct and inverse selection of variables. The analysis made it possible to indicate the reasons for the appearance of errors when using these methods. Based on the reliability of the calculated readings, we can talk about the relevance and suitability of the studied methods among information systems at industrial and housing and communal facilities. An integrated approach optimizes the planning process and increases the accuracy of the predicted values of daily water consumption within residential areas, which today is an extremely important aspect in the field of water supply and management of water supply networks
Key words: regression, forecasting, water sources consumption calculations, correlation
References
1. Shushkevich E.V. "Effective management of water supply and distribution", J. Water and Sanitation Equipment (Zhurnal VST), 2011, vol. 1, pp. 24-30
2. Snityuk V.E. "Forecasting. Models, methods, algorithms" ("Prognozirovanie. Modeli, metody, algoritmy"), Kiev, Macklaut, 2008, 367 p.
3. Dreiper N., Smith G. "Applied regression analysis. Multiple regression", Moscow, Williams, 2007, 912 p.
4. Radchenko S.G. "Sustainable methods of statistical models' estimation" ("Ustoychivye metody otsenivaniya statisticheskikh modeley"), monograph, Kiev, Sansparel, 2005, 504 p.
5. Radchenko S.G. "Methodology of regression models" ("Metodologiya regressionnogo analiza"), monograph, Kiev, Khorni-ychuk, 2011, 376 p.
6. Novikov A.I. "Econometry", Moscow, Infra, 2007, 144 p.
7. Frester E., Renz B. "Methods of correlation and regression analysis", Moscow, Finansy i Statistika, 1983, 304 p.
8. Zhoua S.L., McMahon T.A., Walton A., Lewis J. "Forecasting daily urban water demand: a case study of Melbourne", Hydrology J., 2000, no. 236 (3), pp. 153-164.
9. Lomet A., Suard Fr., Cheze D. "Statistical modeling for real domestic hot water consumption forecasting", Energy Procedia, 2015, no. 70, pp. 379-387.
10. Chen G., Long T., Xiong J., Bai Y. "Multiple random forests modelling for urban water consumption forecasting", Water Resour. Manag, 2017, no. 31 (15), pp. 4715-4729.
11. Zadachin V.M. " System of the city water consumption forecasting", Information Processing Systems (Sistemy obrobki in-formatsii), 2010, no. 7 (88), pp. 95-98
12. Bühl A., Zöfel P. "SPSS: the data processing skill. Analysis of the statistical data and restoration of hidden regularity", St. Petersburg, DiaSoftYuP, 2005, 608 p.
13. Yakimov I.M., Tutubalin P.I., Suzdaltsev V.A., Zarayskiy I.A., Takhavova E.G. "Parallel genetic algorithm of significant indicators selection in case of oil wells sessions planning", Int. Conf. on the Soft Calculations and Measurements (Mezhdunarodnaya konferentsiya po myagkim vychisleniyam i izmereniyam), St. Petersburg, 2018, vol. 1, pp. 720-723
14. Kirpichnikov A.P., Sayfutdinov I.R., Mokshin V.V. "The development of program complex for the weightlifting mechanisms analysis", Technological University Bulletin (Vestnik Technologicheskogo Universiteta), 2017, no. 20 (9), pp. 112-116
15. Mokshin A.V., Mokshin V.V., Sharnin L.M. "Adaptive genetic algorithms used to analyze behavior of complex system", Comm. in Nonlinear Science and Num. Simulation, 2019, vol. 71, pp. 174-186.
16. Tutubalin P.I., Shafigullin R.R., Moiseev V.S. "The mobile disturbed integrated information systems compute clusters content optimization", Kazan State Technological University named after A.N. Tupolev Bulletin (Vestnik Kazanskogo gosudarstvennogo technologicheskogo universiteta im. A.N. Tupoleva), 2012, vol. 1, pp. 120-128.
17. Mokshin V.V. "Parallel genetic algorithm of significant indicators selection affecting on the complex system evolution", Kazan State Technological University named after A.N. Tupolev Bulletin (Vestnik Kazanskogo gosudarstvennogo technolog-icheskogo universiteta im. A.N. Tupoleva), 2009, vol. 3, pp. 89-93.
18. Saifutdinov I.R., Sharnin L.M., Mokshin V.V., Trusfus M.V., Tutubalin P.I. "Parallel genetic algorithm of feature selection for complex system analysis", IOP Conf. Series: Journal of Physics, 2018, vol. 1096, pp. 012089, DOI: 10.1088/17426596/1096/1/012089
Submitted 21.04.2021; revised 23.08.2021 Information about the authors
Vladimir V. Mokshin, Cand. Sc. (Technical), Associate Professor, Kazan National Research Technical University named after A.N. Tupolev (55 Bol'shaya Krasnaya str., Kazan 420124, Republic of Tatarstan, Russia), e-mail: [email protected] Angelina V. Spiridonova, MA, Kazan Federal University (420008, Russia, Republic of Tatarstan, Kazan, 18 Kremlyovskaya Street), e-mail: [email protected]
Grigoriy V. Spiridonov, graduate student, Kazan National Research Technical University named after A.N. Tupolev (55 Bol'shaya Krasnaya str., Kazan 420124, Republic of Tatarstan, Russia), e-mail: [email protected]