УДК 004.738
А. А. Атаян, Д.Ю. Tum,oe, В.Н. Логинов
Московский физико-технический институт (национальный исследовательский университет)
Ои и
построении нейронных сетей для решения задачи дезагрегации данных о потреблении электроэнергии
в домохозяйствах
В данной работе рассматриваются архитектуры нейронных сетей в задаче дезагрегации данных о потреблении электроэнергии. Проведен сравнительный анализ методов выбора порога активации энергопотребляющих устройств. Получены оценки метрик качества для каждого подхода.
Ключевые слова: дезагрегация данных о потреблении энергии, регрессия, классификации, кластеризация
A. A. Atayan, D. Y. Titov, V. N. Loginov Moscow Institute of Physics and Technology
On construction of neural networks for solving the problem of data disaggregation on electricity consumption
in households
In this paper, architectures of neural networks are considered in the problem of data disaggregation on electricity consumption. A comparative analysis of methods for selecting the activation threshold for energy consuming devices is carried out. Estimates of quality-metrics for each approach are obtained.
Key words: energy consumption data disaggregation, regression, classifications, clustering
1. Введение
Одной из важных задач в рамках решения стоящей перед современной цивилизацией проблемы повышения энергоэффективности является мониторинг данных об энергопотреблении в домохозяйствах. Как правило, в таких системах применяются счетчики, передающие показания в соответствующие центры обработки информации. Эти данные в первую очередь используются для выставления счетов за потребляемые ресурсы, но, как показано в работе [1], при достаточной степени их детализации могут быть использованы для подробного анализа поведения потребителя и формирования рекомендаций об улучшении модели потребления.
В ходе этого анализа решается задача формирования данных об энергопотреблении отдельных устройств на основании данных одного счетчика, установленного в домохозяйстве, который измеряет совокупное потребления всех устройств, - задача дезагрегации данных. В литературе данный подход называют неинвазивным мониторингом нагрузки или XII.М (англ. Non-Intrusive Load Monitoring).
Одно из наиболее активно развивающихся направлений в разработке NILM-методов связано с применением методов машинного обучения и нейронных сетей. При этом для
© Атаян А. А., Титов Д. Ю., Логинов В. Н., 2023
(с) Федеральное государственное автономное образовательное учреждение высшего образования
«Московский физико-технический институт (национальный исследовательский университет)», 2023
оценки эффективности разрабатываемых методов, как правило, используются некие общепринятые и ранее опубликованные в научной печати эталонные типовые модели потребления отдельных устройств, таких, как стиральная машина, холодильник и посудомоечная машина.
Наборы данных XII.М обычно включают в себя как совокупную мощность нагрузки, так и нагрузку каждого исследуемого устройства, но не состояние устройства (т. е. включено оно или выключено). Следовательно, естественным образом можно сформулировать задачу регрессии как прогнозирование потребления мощности отдельным устройством по суммарной нагрузке. А задача классификации заключается в прогнозировании состояния устройства. В работе [1], предложены две архитектуры на основе рекуррентных и сверточных сетей для предсказания потребления мощности, а также исследованы методы нахождения порогов активации устройств, то есть минимального значения мощности, при достижении которого прибор переходит из выключенного состояния во включенное. Однако рассмотренные архитектуры нельзя назвать универсальными, так как для различных устройств оптимальными оказываются разные модели, а один из способов для поиска порогов активации требует подбора наилучших временных границ, о чем было упомянуто, но не реализовано авторами.
В данной работе предлагается более универсальная архитектура нейронной сети, сочетающая в себе преимущества и рекуррентных, и сверточных моделей, а также исследована возможность оптимизации временных порогов, то есть значений промежутков времени, в течение которых устройство не переходит из одного состояния в другое.
2. Постановка задачи
В задаче регрессии прогнозируемые величины представляют собой мощность нагрузки 1-го устройства в момент времени Входная мощность нагрузки измеряется счетчиком с постоянной скоростью т, который производит серию измерений мощности Р^ на каждом временном интервале. Суммарная мощность Р., в момент ] представляет собой СУММУ
Р, — Е р("+<*,
1=1
где Ь — общее количество электроприборов в доме, Р^ ) — мощность электроприбора I в момент времени а е^ — неопределенная остаточная нагрузка. Все эти величины выражаются в ваттах.
На вход модели поступают п последовательных измерений:
Pj — (Р]П7 Р]п+17 ... 7 Р]п+п— 1) ;
где ] — индекс сегмента последовательности. Выходом модели являются последовательности Р(1) для каждого наблюдаемог целевой метрики используется МАЕ:
ности Р(1) для каждого наблюдаемого устройства в те же моменты времени. В качестве
МАЕ(1) — ^ £ -А £ К1) - 7
где ^гат — размер обучающей выборки, Ьопх — длина выходной последовательности, а
о(1) о(1) " - о
^ 7 — истинная и предсказанное значение мощности для устройства I.
В задаче классификации мы предполагаем, что устройство I может находиться в одном
из двух состояния в момент времени ^которые равны «I — 0 (состояние ВЫКЛ) и «I — 1
(состояние ВКЛ). Таким образом, критерием, в каком состоянии находится устройство,
является установление порога
для каждого прибора, то есть ^ — I (Р(£) > А^) 7
где I(х > а) — индикаторная функция. В этой работе мы использовали набор даннных UK-DALE, который является эталоном для NILM. В обучающую выборку вошли данные только по 1, 2 и 5 дому. Исходные данные были поделены на обучающую, тестовую и валидационную выборки по времени в соотношении 80/10/10 соответственно.
3. Выбор порога активации
Для выбора порогового значения мощности активации с целью определения состояния устройства наиболее часто применяются три различных способа: Middle-Point Thresholding (MP), Variance-Sensitive Thresholding (VS), Activation-Time Thresholding (AT).
3.1. Middle-Point Thresholding
В этом методе учитывается набор всех значений мощности каждого устройства, затем применяется алгоритм кластеризации k-means, чтобы разделить этот набор значений на два кластера, центроиды которых обозначаются через m0l) и m^ для выключенного и включенного состояния каждого устройства соответственно. Затем находится центр тяжести каждого кластера. После чего значение порога активации Xе каждого устройства рассчитывается как среднее значение между центроидами данных кластеров
(I) , (I) x(i) = ™о) +
2 '
3.2. Variance-Sensitive Thresholding
В методе VS также используется алгоритм кластеризации k-means с целью нахождения центроидов для каждого класса, но в определении порога активации Xе учитывается не только среднее, но и стандартное отклонение а^ для точек в каждом кластере по следующей формуле:
d =
^ +
дМ = (1 - Л)т0) + йт^,
где — стандартное отклонение, посчитанное для значений мощности 1-го устройства, отнесенного к кластеру к.
3.3. Activation-Time Thresholding
В описанных выше методах для определения пороговых значений активации устройств используются только данные распределения мощности, но часто бывает так, что из-за за-шумления некоторые измерения в короткие промежутки времени либо отсутствуют во время работы устройства, либо дают аномальные пики в выключенном состоянии. По этой причине в [2] предложили, помимо порога мощности, рассматривать также и порог времени. При этом порог мощности фиксируется с помощью вышеизложенных методов или выбирается эмпирически вручную, как это сделано в [1], а под порогом времени понимается минимальное время, в течение которого устройство I должно находиться в
заданном состоянии. Например, если последовательность измерений мощности ниже Xе в
( )
течение времени t < ц.) , то считается, что эта последовательность находится в предыдущем состоянии (включено в данном случае).
3.4. Нахождение порога времени
В работе [1] порог времени ) подбирался эмперически вручную и фикси-
ровался, но также указывалось на возможность его оптимизации с помощью минимза-ции среднеквадратичного отклонения между исходным сигналом р и восстановленным. Восстановленный сигнал по порогам определялся следующим образом:
Nt
rain -t Lout
PON = 1 ¿ — ¿ sfiPji,
Ntrain Lout • '
]=1 г=1
Nt
rain -t Lout
p(l) = 1 V — Vn - ¿e))pe
tram , ^out . -.
=1 =1
BP(l) _ p(l) s(l) + p(l) (1 ч(1)л BPj = ^O Wsi + ^O FF (1 - sj ),
( l)
где BP^ — восстановленный сигнал для сегмента j .£-го устройства, Ntrain — размер обучающей выборки, Lout — длина выходной последовательности, a s^, Р^ — определены выше.
Обоснование выбора такого функционала приведено в [1]. Порог времени (^[,l),^1l)) можно рассматривать как некоторый гиперпараметр и использовать соответствующие инструменты для его оптимизации. Одним из наиболее современных фреймворков для автоматического подбора гиперпараметров является Optuna. Она оказывается эффективнее полного перебора, а также подобных по функционалу библиотек. В данной статье используется фреймворк Optuna [4]. Параметры перебора указаны в табл. 1.
Таблица 1
Параметры перебора временного порога
Устройство № Количество запусков
Стиральная машина [1; 10] [10; 50] 100
Посудомоечная машина [10; 50] [10; 50] 200
Холодильник [1; 10] [1; 10] 50
4. Нейросетевые модели
В статье [1] используются две модели, одна из которых основана исключительно на сверточных слоях (CONV), а в другой применяются рекуррентные слои после сверток (GRU). Недостатком предложенных моделей является необходимость подбора типа модели для каждого типа устройств. Другими словами, для разных устройств лучшими оказываются различные модели. Так, например, для посудомоечной машины модель на основе рекуррентных слоев показывает наилучшие результаты, в то время как для холодильника наилучшие результаты показывает модель на основе сверточных слоев.
Предлагаемая архитектура основана на модели из работы [5]. Подробная схема изображена на рис. 1. Используются два параллельных блока на основе сверточных и рекуррентных нейронных сетей. В сверточном блоке используются временные свертки с размерами фильтров 64 х 128 х 64. Рекуррентный блок и декодер повторяет полностью архитектуру из работы [1], однако вместо ячейки GRU используется LSTM [3]. Модель получает в качестве входных данных вектор с размером Lin = 510, который представляет совокупную мощность домовладения за интервал 8,5 часов. Поскольку в моделях используются свертки без Padding'а, первая и последняя записи каждой серии отбрасываются в выходных данных, что приводит к выходной последовательности, имеющей Lout = 480 записей, т. е. восемь часов. Процесс предобработки данных, включая разделение на обучающую, вали-дационную и тестовую части, полностью совпадает с предложенным в работе [1] способом.
Для каждсих) эксперимента модели обучались пять раз до сходимости на валидационной выборке. Результаты на тестовоый части усреднялись.
Рис. 1. Предложенная архитектура
5. Сравнение результатов
Полученные в ходе экспериментов с предложенной архитектурой нейроеети результаты пред ставлены в табл. 2 4.
В табл. 2 приведены результаты сравнения метрики МАЕ между исходным и восстановленным сигналом для разных устройств и методов нахождения порога. Можно заметить, что подбор временжнх) порога позволил улучшить значение целевой метрики.
Таблица 2
Сравнение метрики качества МАЕ между исходным и восстановленным
сигналом
Методы вычисления норох'ов Посудомоечная машина Холодильник Стиральная машина
МР 3.48 4.67 3.96
УБ 4.39 4.71 6.60
АТ 26.37 4.66 7.42
АТ с подобранными 19.48 4.66 6.79
В табл. 3 приведены результаты применения разработанной модели для задачи классификации. В целом она дает значительно более хорошие результаты по сравнению с моделью СтЫи и результаты близкие к данным модели СОКУ.
Таблица 3
Сравнение метрики качества для различных моделей
Порог активации Модель Посудомоечная машина Холодильник Стиральная машина
МР СОМУ 0.93 0.87 0.93
0.84 0.87 0.87
Предложенная модель 0.90 0.86 0.96
УБ СОМУ 0.93 0.87 0.88
оыи 0.84 0.87 0.82
Предложенная модель 0.90 0.86 0.89
АТ СОМУ 0.91 0.86 0.97
оыи 0.90 0.86 0.96
Предложенная модель 0.90 0.89 0.93
АТ с подобранными СОМУ 0.93 0.86 0.97
0.91 0.86 0.97
Предложенная модель 0.94 0.89 0.94
В табл. 4 приведены результаты работы предложенной модели в задаче регрессии. Блочная архитектура на основе рекуррентных и сверточных нейронных сетей позволила улучшить результаты целевых метрик независимо от типа устройства.
Таблица 4
Значение метрики МАЕ для задачи регрессии
Модель Посудомоечная машина Холодильник Стиральная машина
СОМУ 11.59 26.95 18.25
сии 8.07 28.68 15.00
Предложенная модель 7.78 26.06 14.43
6. Заключение
В данной работе предложена новая архитектура нейронной сети, включающая параллельные блоки на основе рекуррентных и сверточных сетей, для решения задачи дезагрегации данных об энергопотреблении типовых приборов домохозяйств, которая оказалась более универсальной и эффективной по сравнению с архитектурами СОМУ и СИП при решении задачи регрессии и близкой по результатам к уже известной архитектуре СОМУ по метрике
Была также исследована возможность оптимизации временных порогов для последующего использования найденных параметров для выбора порогов активации. Найденные параметры оказались оптимальными с точки зрения сравнения среднеквадратичного риска между исходным и восстановленным временным рядом.
При проведении дальнейших исследований планируется изучение возможности применения разработанных методов и архитектуры нейронной сети для других типов энергопотребителей, включая промышленные энергоустановки.
Список литературы
1. Логинов В.Н.,Бычковский И.А., Сурнов Г.С., Сурпов С. И. Smart Monitoring - технология дистанционного мониторинга потребления электроэнергии, воды, тепловой энергии и газа в Smart City // Труды МФТИ. 2020. Т. 12, № 1. С. 90-99.
2. Garcelan D.P., Gomez-Ullate D. NILM as a regression versus classification problem: the importance of thresholding [Электронный ресурс]. 2020. https://www.researchgate.net/publication/345152793_NILM_as_a_regression_versus_ classification_problem_the_importance_of_thresholding (дата обр. 17.01.2023).
3. Kelly J., Knottenbelt W. Neural nilm: Deep neural networks applied to energy disaggregation 11 arXiv:1507.06594. 2015.
4. Hochreiter S., Schmidhuber J. Long short-term memory // Neural Computation. 1997. V. 9, I. 8. P. 1735-1780.
5. Takuya A., Shotaro S., Toshihiko Y., Takeru O., Masanori K. Optuna: A Next-generation Hvperparameter Optimization Framework // arXiv:1907.10902. 2019.
6. Fazle K., Somshubra M., Houshang D., Shun C. LSTM Fully Convolutional Networks for Time Series Classification 11 arXiv:1709.05206. 2017.
References
1. Loginov V.N., Bychkovskiy I.A., Surnov G.S., Surnov S.I. Smart Monitoring technology for the remote monitoring of power, gas, water and thermal energy consumption in Smart City. Proceedings of MIPT. 2020. V. 12, N 1. P. 90-99.
2. Garcelan D.P., Gomez-Ullate D. NILM as a regression versus classification problem: the importance of thresholding [Electronic resource]. 2020. https://www.researchgate.net/publication/345152793_NILM_as_a_regression_versus_ classification_problem_the_importance_of_thresholding (date of the appl. 17.01.2023).
3. Kelly J., Knottenbelt W. Neural nilm: Deep neural networks applied to energy disaggregation. arXiv:1507.06594. 2015.
4. Hochreiter S., Schmidhuber J. Long short-term memory. Neural Computation. 1997. V. 9, I. 8. P. 1735-1780.
5. Takuya A., Shotaro S., Toshihiko Y., Takeru O., Masanori K. Optuna: A Next-generation Hvperparameter Optimization Framework. arXiv:1907.10902. 2019.
6. Fazle K., Somshubra M., Houshang D., Shun C. LSTM Fully Convolutional Networks for Time Series Classification. arXiv:1709.05206. 2017.
Поступим в редакцию 01.03.2023