Научная статья на тему 'ПРИМЕНЕНИЕ МЕТОДА ПОЛНОЙ ВАРИАЦИИ РАСПОЗНАВАНИЯ ОШИБОК К ИССЛЕДОВАНИЮ ДАННЫХ КОММЕРЧЕСКОГО УЧЕТА ТЕПЛОВОЙ ЭНЕРГИИ'

ПРИМЕНЕНИЕ МЕТОДА ПОЛНОЙ ВАРИАЦИИ РАСПОЗНАВАНИЯ ОШИБОК К ИССЛЕДОВАНИЮ ДАННЫХ КОММЕРЧЕСКОГО УЧЕТА ТЕПЛОВОЙ ЭНЕРГИИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
18
3
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕПЛОСБЕРЕЖЕНИЕ / ЭНЕРГОЭФФЕКТИВНОСТЬ / МОДЕЛЬ ПОТРЕБЛЕНИЯ ТЕПЛА / РАСПРЕДЕЛЕНИЕ С ТЯЖЁЛЫМ ХВОСТОМ / МЕРА ЗАВИСИМОСТИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Стукач Олег Владимирович, Попов Илья Юрьевич, Зорин Павел Александрович

Используя реальные данные учёта тепловой энергии в многоэтажных жилых домах города Томска, методом полной вариации распознавания ошибок сделаны оценки метрики общей дискретной вариации. Отобраны данные по домам с закрытой схемой теплопотребления, где под учётом стоит только отопление. Для сравнения выбраны два кластера жилых зданий: до пяти этажей и выше пяти этажей. Результаты моделирования показывают сложность в интерпретации получившихся зависимостей для применяемого метода и необходимость уточнения его ограничений из-за не симметрии выборок, что является главным препятствием для широкого внедрения в практику моделирования метода полной вариации. Подтверждена большая экономичность домов с малой этажностью и малый разброс в значениях теплопотребления, что неочевидно для практики коммерческого учёта тепла.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Стукач Олег Владимирович, Попов Илья Юрьевич, Зорин Павел Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE USE OF TOTAL VARIATION OUTLIER RECOGNIZER METHOD TO THE STUDY OF COMMERCIAL THERMAL ENERGY ACCOUNTING DATASET

Estimates of the metric of general discrete variation by the method of total variation outlier recognizerwas made using actual data of thermal energy accounting in multi-storey residential buildings of the city of Tomsk.Data were selected for houses with a closed heat consumption scheme only where heating is taken into account.Two clusters of residential buildings were selected for comparison: up to five floors and above five floors. Thesimulation results show the difficulty in interpreting the resulting dependencies for this method due to the non-symmetry of the samples. It is necessary to clarify its limitations, and it is the main obstacle to the widespreadintroduction of the method into practice. The high efficiency of houses with low floors and a small variation in theheat consumption has been confirmed, which is not obvious for the practice of commercial heat accounting.

Текст научной работы на тему «ПРИМЕНЕНИЕ МЕТОДА ПОЛНОЙ ВАРИАЦИИ РАСПОЗНАВАНИЯ ОШИБОК К ИССЛЕДОВАНИЮ ДАННЫХ КОММЕРЧЕСКОГО УЧЕТА ТЕПЛОВОЙ ЭНЕРГИИ»

Применение метода полной вариации распознавания ошибок к исследованию данных коммерческого учета

тепловой энергии

И.Ю. Попов1, О. В. Стукач1'1, П.А. Зорин3

Национальный исследовательский университет "Высшая школа экономики", Москва, Россия 2Новосибирский государственный технический университет, Новосибирск, Россия

3ООО "ЦСО", Томск, Россия

Аннотация: Используя реальные данные учёта тепловой энергии в многоэтажных жилых домах города Томска, методом полной вариации распознавания ошибок сделаны оценки метрики общей дискретной вариации. Отобраны данные по домам с закрытой схемой теплопотребления, где под учётом стоит только отопление. Для сравнения выбраны два кластера жилых зданий: до пяти этажей и выше пяти этажей. Результаты моделирования показывают сложность в интерпретации получившихся зависимостей для применяемого метода и необходимость уточнения его ограничений из-за не симметрии выборок, что является главным препятствием для широкого внедрения в практику моделирования метода полной вариации. Подтверждена большая экономичность домов с малой этажностью и малый разброс в значениях теплопотребления, что неочевидно для практики коммерческого учёта тепла.

Ключевые слова: теплосбережение, энергоэффективность, модель потребления тепла, распределение с тяжёлым хвостом, мера зависимости.

ВВЕДЕНИЕ

Коммерческий учёт тепловой энергии, потребляемой в жилых домах, стимулирует потребителей к экономии энергоресурсов и важен для энергосбережения [1-2]. Компании, занимающиеся коммерческим учётом, накопили большой объём таких данных и могут оказывать услуги по их интеллектуальному анализу, если он будет востребован рынком теплоэнергетики [3]. Анализ данных теплоучёта может выявить определённые закономерности, позволяющие принимать доказательные управленческие решения [4-6].

Для статистического моделирования потребления тепловой энергии в многоэтажных жилых зданиях необходимо иметь набор методов, учитывающий основную динамику теплопотребления и закономерности в данных. Ряд методов должен выявлять ошибки в данных, вызванных неисправностью приборов учёта и технологическими нарушениями в

теплоснабжении. И если вопросы качества данных достаточно полно проработаны в плане исключения грубых ошибок измерения [6-10], то менее заметные выбросы остаются в данных и влияют на коммерческий учёт и в конечном итоге влияют на принимаемые решения.

В недавнем исследовании [11] был предложен очередной метод оценки данных на наличие выбросов, названный авторами как метод полной вариации распознавания ошибок (Total Variation Outlier Recognizer, TVOR). Метод направлен на поиск выбросов в гистограммах путем вычисления оценки для нескольких гистограмм в терминах дискретной общей вариации. Неочевидность предложенного

авторами [11] метода обусловливает малое число тестовых исследований в актуальных предметных областях. А в статье [12] на реальных данных показано, что использование метода TVOR нецелесообразно и концептуально неверно. Эта критика заставляет протестировать метод TVOR на датасете по теплоучёту. Мы применяем вышеописанный метод на имеющихся данных коммерческого учёта тепла в г. Томске за 2013-2020 г.г. [13-14] и определяем возможности метода в выявлении и исключении грубых ошибок измерений по гистограммным оценкам. Сначала в разделе 1 кратко рассмотрим сущность метода, затем в разделе 2 проведём анализ реальных данных, выводы по результатам сделаем в разделе 3, и в заключение предложим новое направление для нашей предметной области.

1. ОПИСАНИЕ МЕТОДА

Исходные данные представляют собой гистограммы случайных выборок из набора данных. Все гистограммы должны иметь любое, но одинаковое количество столбцов (bins) любой ширины. Считается, что все выборки взяты из одного и того же распределения. Цель состоит в том, чтобы проверить, какие из них с наибольшей вероятностью окажутся выбросами с точки зрения дискретной общей вариации TVOR - меры отклонения исследуемой гистограммы от соответствующей

теоретической, нормированной к квадратному корню из числа наблюдений. Гистограммы, для которых были получены самые высокие значения TVOR, содержат выбросы с

наибольшей вероятностью с точки зрения общей вариации.

Гистограммы, описывающие наборы выборок из одного и того же распределения вероятностей, после нормализации по размеру должны быть одинаково гладкими. Метод формально определяет гладкость гистограммы как сумму различий между количеством выборок в соседних столбцах, то есть общую дискретную вариацию гистограммы. Руководствуясь асимптотическими оценками, метод TVOR подгоняет значения общей дискретной вариации по гистограммам к комбинации функции линейного и квадратного корня количества данных в каждой гистограмме. Разница между фактическим и ожидаемым значением общей вариации гистограммы, рассчитанным на основе наилучшего соответствия всему набору данных, после нормализации рассматривается как оценка выбросов гистограммы.

Продемонстрируем идею метода на численных примерах. Моделирование проводилось на основе кода из статьи [11]. С помощью модуля NumPy языка Python сгенерируем 50 нормально распределённых случайных переменных с 10000 наблюдениями со средним значением ^=3,3 и среднеквадратическим отклонением о=3. Количество столбцов в гистограммах равно 50 (Рис. 1).

Рис. 1. Пример нормально распределённых данных

Для таких данных значения ТУОЯ-оценки лежат в интервале [0, 2] и в очень редких случаях превышают 2 (Рис. 2 а, б).

К нескольким переменным были добавлены дополнительно 300 значений в случайно выбираемые столбцы. Одновременно проверялась чувствительность метода к количеству выбросов:

(а)

(б)

Рис. 2. Пример гистограмм сгенерированных данных с максимальной (а) и минимальной (б) оценкой ТУОЯ в разных выборках 300 значений распределялись по разному количеству столбцов (1, 3, 5, 10, 20). По проведённым тестам можно сделать вывод, что для малого количества зашумленных столбцов оценочные коэффициенты с большей вероятностью будут выше у зашумленного ряда (Рис. 3). В связи со случайностью выбора столбца для внесения шума, для большого количества столбцов добавленные шумы могут компенсировать различия в высоте столбцов, тем самым изменяя дискретную общую вариацию. Вследствие этого коэффициенты изменённых рядов могут получаться ниже. Другой очевидный вывод состоит в том, что при добавлении шума к рядам с малыми значениями ТУОЯ изменённые ряды с большой вероятностью будут иметь более высокую оценку ТУОЯ. В то же время при зашумлении рядов с высокими значениями ТУОЯ получаемые ряды скорее будут иметь более низкую оценку, особенно при большом количестве столбцов для зашумления. В приведенном на Рис. 3 тесте метод терпимо справляется с распознаванием выбросов. Оценки ТУОЯ зашумленных рядов выше, чем для оригинальных рядов.

Рис. 3. Пример работы программы при 300 и 1000 выбросах - ТУОЯ (300): до 5 зашумленных столбцов для выборок 1-10, до 10-20 столбцов для остальных выборок. ТУОЯ (1000): от 50 до 100 зашумленных столбцов

Для большого количества выбросов, до 1000, зашумленные ряды имеют самые высокие оценки ТУОЯ. Даже при большом количестве столбцов (50, 100) для зашумления получаемые выбросы в гистограммах обнаруживаются методом (Рис. 3, 4 а, б).

Итак, метод хорошо работает на данных с большим количеством выбросов. Для малого количества выбросов метод не даёт стабильного результата, зашумление может изменять дискретную общую вариацию так, что разность между ожидаемым и наблюдаемым значением может уменьшаться, следовательно, оценка конкретного ряда может уменьшаться. Более того, для малого количества выбросов метод чувствителен к исходной оценке не зашумлённого ряда. Если она высока, то с большой вероятностью добавленный шум улучшит оценку, то есть уменьшит её по модулю. На большом количестве выбросов метод лишается вышеописанных недостатков.

2. АНАЛИЗ ДАННЫХ ТЕПЛОУЧЕТА

Из полных данных [14] выбраны наблюдения с устройств сбора и передачи данных (УСПД) домов с закрытой схемой и стоящим под учётом отоплением, без горячего водоснабжения. Это сделано для минимизации общей вариации данных. Набор данных соответствует требованиям метода ТУОЯ, поскольку гистограммы берутся из одного распределения. Затем данные поделены на два класса: для домов с этажностью до пяти и больше пяти. Из этих классов берутся случайные выборки, и проводится оценка полной вариации ТУОЯ. На Рис. 5 приведён пример гистограмм для двух характерных выборок этих классов. Гистограммы построены в системе 81а1181;1са 8.0. Ввиду того, что у многоэтажных домов площадь и количество жителей больше, чем в домах менее пяти этажей, потребление тепла в многоэтажках естественно больше, чем в малоэтажных зданиях.

Рис. 4. Пример исходной (а) и зашумленной (б) гистограммы при 1000 выбросах. Зашумление гистограмм с высокой оценкой TVOR (выборки 1-10 на Рис. 3) при большом количестве столбцов для зашумления, от 50 до 100

Рис. 5. Гистограммы двух выборок из классов с этажностью меньше пяти (синяя) и больше (красная)

Наблюдается различие в форме гистограмм в значениях чуть больше среднего. Обе выборки отличаются длинным тяжёлым правым хвостом [15]. С большой вероятностью он как раз и содержат ошибки измерения, так как при

случайно действующих факторах на теплопотребление стоит ожидать

распределения, приближённого к нормальному.

По идее метода полной вариации распознавания ошибок результат не должен зависеть от количества столбцов гистограмм. На самом деле это конечно не так. На Рис. 6 приведены графики рассеяния полной вариации для многоэтажных домов при bins = {20, 30, 40, 50}. Графики статистически подобны друг другу, но далеко не всегда: вариация для bins = {20, 30, 50} в среднем больше, чем при bins = 40. Из практики гистограммного оценивания известно, что уменьшение количества столбцов постепенно приводит к пропускам в гистограммах и, как следствие, это будет опознано как дополнительная вариация ошибки. Следовательно, работоспособность метода ограничена необходимостью правильного выбора настраиваемого параметра bins. Была рассчитана полная вариация для bins=[20;60] с шагом 5 для двух классов домов (Рис. 7).

Рис. 6. Зависимость метрики ТУОЯ от условного номера выборки для различного количества столбцов гистограмм

Минимальное значение полной вариации ошибок и меньший её разброс наблюдается для домов менее пяти этажей. В многоэтажных домах значение полной вариации ошибок существенно различно как для малого количества столбцов гистограмм, так и для разных выборок. Это весьма затрудняет интерпретацию результатов и не позволяет правильно оценить вариацию для каждого отдельного дома.

3. ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Больший разброс полной вариации для класса многоэтажных домов по сравнению с классом пятиэтажных обусловлен более тяжёлым хвостом распределения. Метод полной вариации распознавания ошибок основан на оценках средних арифметических значений, а не медиан, следовательно, результат чувствителен к данным с несимметричными распределениями вероятностей. Поэтому результаты

моделирования показывают сложность в интерпретации получившихся зависимостей для применяемого метода и необходимость уточнения его ограничений в части учёта асимметрии распределения случайных величин.

Разделение выборки на классы зданий с кирпичными и панельными стенами приводит к следующему результату (Рис. 8).

Рис. 8. Гистограммы двух выборок из классов домов с кирпичными и панельными стенами

Как и в предыдущем случае (Рис. 5), наблюдается различие в форме гистограмм в значениях чуть больше среднего. Обе выборки отличаются длинным тяжёлым правым хвостом. Можно сделать вывод о том, что более перспективным, чем TVOR, может оказаться исследование данных специальными методами для выборок с тяжёлыми хвостами [15-16].

ЗАКЛЮЧЕНИЕ

Метод полной вариации распознавания ошибок не позволяет оценивать энергоэффективность теплоснабжения

отдельных зданий, хотя позволяет сравнивать

Рис. 7. Боксплоты полной вариации ошибок для классов домов при Ьгш=[20;60], построенные для медианы

определённые классы зданий по изменчивости величины теплопотребления. Метрика полной вариации не даёт явного преимущества перед обычными гистограммными оценками из-за относительно малого количества наблюдений. Это следует из того, что при уменьшении количества наблюдений неизбежно сокращается число столбцов гистограмм, а общая вариация становится менее выраженной. Также метод TVOR требует тщательного выбора данных для сравнения. Тем не менее, метод TVOR может успешно использоваться как дополнение к гистограммному анализу распределения тепловой энергии. Он позволяет идентифицировать потенциально проблемные классы зданий и обратить внимание на распределение теплопотребления, особенно в многоэтажных зданиях. Авторы считают перспективным исследование статистических характеристик потребления тепловой энергии не только для Томска, но и других городов и приглашают к совместной работе.

БЛАГОДАРНОСТИ

Авторы благодарят ООО «ЦСО» (г. Томск) за предоставленные данные. Работа выполнена по результатам проекта МИЭМ НИУ ВШЭ 526 (https://cabinet.miem.hse.ru/#/proiect/526).

ЛИТЕРАТУРА

[1] Мукашев А.М., Абрамчук С.И., Пуговкин А.В., Бойченко А.В., Купреков С.В., Абушкин Д.В. Аппаратно-программный комплекс учета потребляемой тепловой энергии // Известия вузов. Строительство. - 2017. - № 3. - ISSN 0536-1052. - С. 84-90.

[2] Зорин П.А., Стукач О.В. Анализ влияния погодных условий на динамику тепловой энергии в жилом фонде города Томск / Инновационные, информационные и коммуникационные технологии: сборник трудов XVII Межд. научно-практической конференции / под. ред. С.У. Увайсова. - М.: Ассоциация выпускников и сотрудников ВВИА им. проф. Жуковского. - 2020. - С. 365-368. - ISSN 25001248. -http://info.diag.ru/uploads/swfupload/files/INFO-2020.pdf.

[3] Зорин П.А., Стукач О.В. Дисперсионный анализ данных коммерческого учёта тепловой энергии в жилом фонде города Томска / Наука. Технологии. Инновации. Сборник научных трудов в 9 ч. - Новосибирск: Изд-во НГТУ. -2019. - ISBN 978-5-7782-4007-0. - С. 72-75. -https://www.elibrary.ru/item.asp?id=41847032.

[4] Зорин П.А., Стукач О.В. Статистическое моделирование тепловых характеристик жилых домов на основе данных теплосчетчиков / Новые информационные технологии в исследовании сложных структур: материалы Тринадцатой Международной конференции. Томский государственный университет. Томск, 07-09

сентября 2020. - С. 11. -https://www.elibrary.ru/item.asp?id=44189681.

[5] Стукач О.В., Зорин П.А., Чашкин Л.Б., Семенюк А.В. Решение проблем редукции данных в автоматизированных системах коммерческого учёта потребления тепловой энергии для создания робастной модели // Автоматика и программная инженерия. - 2021. - N 2(36). - С. 11-19. - ISSN 2618-7558 (электрон.), ISSN 23124997 (печ.) http://www.jurnal.nips.ru/ru/node/135.

[6] Зорин П.А., Купреков С.В., Пуговкин А.В., Стукач О.В. Контроль энергоэффективности теплоснабжения зданий типовой застройки // Электронные средства и системы управления / Томский государственный университет систем управления и радиоэлектроники (Томск). - 2018. - N 1-2. - С. 302-305. -https://elibrary.ru/item.asp?id=37384589.

[7] Федосин А.С., Федосин С.А. Очистка входных данных в автоматизированных системах контроля и учета энергоресурсов // Инфокоммуникационные технологии. - 2016. -Т. 14. - № 2. - С. 162-168.

[8] Клевакин Е.А., Казанцев В.В. Анализ алгоритмов расчета тепловой энергии, потребленной в открытых системах теплоснабжения. Разработка модели оценки точности измерительных систем тепловой энергии // Законодательная и прикладная метрология. - 2007. - № 5. - С. 21-27.

[9] Савкина А.В., Федосин А.С. Проблемы качества данных в автоматизированных системах коммерческого учета потребления энергоресурсов // Прикаспийский журнал: управление и высокие технологии. - 2014. - № 2(26). - С. 158-164.

[10] Seo S. A Review and Comparison of Methods for Detecting Outliers in Univariate Data Sets / MS thesis, 2006. - http://d-scholarship.pitt.edu/7948/1/Seo.pdf.

[11] Banic N. and Elezovic N. TVOR: Finding discrete total variation outliers among histograms // IEEE Access. - 2021. - Т. 9. - С. 1807-1832. -https://ieeexplore.ieee.org/document/9306761.

[12] Ornik M. Comment on ''TVOR: Finding Discrete Total Variation Outliers Among Histograms" // IEEE Access. - 2021. - Т. 9. - С. 78586-78594. -https://ieeexplore.ieee.org/document/9442768.

[13] Zorin P., Stukach O. "Data of heating meters from residential buildings in Tomsk (Russia) for statistical modeling of the thermal characteristics of buildings // IEEE Dataport. - 2020. [Online]. - Available: http://dx.doi.org/10.21227/3r4e-ch18. - Accessed: May. 10, 2020. - http://ieee-dataport.org/2301.

[14] Stukach O., Zorin P. Long-Term Data from the Heat Meters in Residential Buildings Depending on the Outside Temperature and Characteristics of Buildings // IEEE Dataport. - April 13. - 2021. -doi: 10.21227/cw53-rr81. - http://ieee-dataport.org/4034.

[15] Jiang J., Li S. On complexity of multistage stochastic programs under heavy tailed distributions // Operations Research Letters. - 2021. - Vol. 49. -

Issue 2. - March. - P. 265-269. -https://doi.org/10.1016/j .orl.2021.01.016.

[16] Mittnik S., Rachev S.T., Samorodnitsky G. The distribution of test statistics for outlier detection in heavy-tailed samples // Mathematical and Computer Modelling. - 2001. - Vol. 34. - Issues 9-11 (November). - P. 1171-1183. -https://doi.org/10.1016/S0895-7177(01)00125-X.

Попов Илья Юрьевич - студент Московского института

электроники и математики Национального исследовательского университета «Высшая школа экономики», г. Москва. E-mail: iyupopov@edu.hse.ru .

Стукач Олег Владимирович -

доктор технических наук, профессор Московского института электроники и математики Национального исследовательского университета «Высшая школа экономики» и Новосибирского государственного технического университета, основатель Томской группы Института инженеров по электротехнике и радиоэлектронике IEEE.

E-mail: tomsk@ieee.org.

Зорин Павел Александрович -

главный метролог, заместитель директора ООО «Центр сервисного обслуживания», г. Томск,

cso.tom.ru.

E-mail: zpa@cso.tom.ru .

Статья поступила 03.12.2021

The Use of Total Variation Outlier Recognizer Method to the Study of Commercial Thermal Energy Accounting Dataset

I.YU. POPOV1, O.V. STUKACH1'2, P.A. ZORIN3

1National Research University Higher School of Economics, Moscow, Russia 2Novosibirsk State Technical University, Novosibirsk, Russia 3LLC "CSO", Tomsk, Russia

Abstract: Estimates of the metric of general discrete variation by the method of total variation outlier recognizer was made using actual data of thermal energy accounting in multi-storey residential buildings of the city of Tomsk. Data were selected for houses with a closed heat consumption scheme only where heating is taken into account. Two clusters of residential buildings were selected for comparison: up to five floors and above five floors. The simulation results show the difficulty in interpreting the resulting dependencies for this method due to the non-symmetry of the samples. It is necessary to clarify its limitations, and it is the main obstacle to the widespread introduction of the method into practice. The high efficiency of houses with low floors and a small variation in the heat consumption has been confirmed, which is not obvious for the practice of commercial heat accounting.

Keywords: heat saving, energy efficiency, heat consumption model, heavy-tail distribution, dependence measure.

REFERENCES 2500-1248. -

http://info.diag.ru/uploads/swfupload/files/INFO-

[1] Mukashev A.M., Abramchuk S.I., Pugovkin A.V., 2020.pdf

Boichenko A.V., Kuprekov S.V., Abushkin D.V. . _TT . .

. • tit u t |3| Zorin P.A., Stukach O.V. Dispersionnyi analiz

Apparatno-programmnyi kompleks ucheta , r .

dannykh kommercheskogo ucheta teplovoi energii v

potreblyaemoi teplovoi energii (Hardware and

г. т f f 1 ,1 т zhilom fonde goroda Tomsk (Dispersion analysis of

software complex of accounting for consumed thermal ,

the data of commercial accounting of thermal energy energy) // Izvestiya vuzov. Stroitelstvo. - 2017. - N 3. . . е .

in the residential fund of the city of Tomsk) / Science. - ISSN 0536-1052. - P. 84-90. .

Technologies. Innovation. Proceedings in 9 vol. -

[2] Zorin P A., Stukach O.V. Analiz vliyaniya pogodnykh Novosibirsk: NSTU. - 2019. - ISBN 978-5-7782-uslovii na dinamiku teplovoi energii v zhilom fonde 4007-0 - P 72-75 -

goroda Tomsk (Analysis of the influence of weather https://www.elibrary.ru/item.asp?id=41847032.

conditions on the dynamics of thermal energy in the [4] Zorin P.A., Stukach O.V. Statisticheskoe

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

residential fund of the city of Tomsk) / Innovative, modelirovanie teplovikh kharakteristik zhilikh domov

information and communication technologies:

na osnove dannykh teploschetchikov (Statistical

proceedings of the XVII International Scientific and

Practical Conference / Ed. S.U. Uvaysov. - Moscow: modeling of thermal characteristics of residential

Association of Graduates and employees of the Prof. buildings based on heat meters data) / New

Zhukovsky VVIA. - 2020. - P. 365-368. - ISSN Information Technologies in the Study of Complex

Structures: Proceedings of the Thirteenth International Conference. Tomsk State University. Tomsk. September 07-09, 2020. - P. 11. -https://www.elibrary.ru/item.asp?id=44189681.

[5] Stukach O.V., Zorin P.A., Chashkin L.B., Semenyuk A.V. Reshenie problem reduktsii dannykh v avtomatizirovannykh sistemakh kommercheskogo ucheta potrebleniya teplovoi energii dlya sozdaniya robastnoi modeli (Reduction of Dataset in the Automated Systems for Commercial Metering of the Thermal Energy Consumption to Create a Robust Model) // Automatics & Software Enginery. - 2021. -N 2(36). - P. 11-19. - ISSN 2618-7558 (el.), ISSN 2312-4997 (print) http://www.iurnal.nips.ru/ru/node/135.

[6] Zorin P.A., Kuprekov S.V., Pugovkin A.V., Stukach O.V. Kontrol energoeffektivnosti teplosnabzheniya zdanii tipovoi zastroiki (Control of energy efficiency of heat supply of standard buildings) // Electronic means and Control Systems / Tomsk State University of Control Systems and Radioelectronics (Tomsk). -2018. - N 1-2. - P. 302-305. -https://elibrary.ru/item.asp?id=37384589.

[7] Fedosin A.S., Fedosin S.A. Ochistka vhodnykh dannykh v avtomatizirovannykh sistemakh kontrolya i ucheta energoresursov (Purification of input data in automated systems of control and accounting of energy resources) // Infocommunication technologies. - 2016. - Vol. 14. - N 2. - P. 162-168.

[8] Klevakin E.A., Kazantsev V.V. Analiz algoritmov rascheta teplovoi energii potreblennoi v otkritikh sistemakh teplosnabzheniya. Razrabotka modeli otsenki tochnosti izmeritelnykh sistem teplovoi energii (Analysis of algorithms for calculating thermal energy consumed in open heat supply systems. Design of a model for evaluation accuracy of measuring systems of thermal energy) // Legislative and applied metrology. - 2007. - N 5. - P. 21-27.

[9] Savkina A.V., Fedosin A.S. Problemi kachestva dannykh v avtomatizirovannykh sistemakh kommercheskogo ucheta potrebleniya energoresursov (Problems of data quality in automated systems of commercial accounting of energy consumption) // Caspian Journal: Control and High Technologies. -2014. - N 2(26). - P. 158-164.

[10] Seo S. A Review and Comparison of Methods for Detecting Outliers in Univariate Data Sets / MS thesis, 2006. - http://d-scholarship.pitt.edu/7948/1/Seo.pdf.

[11] Banic N. and Elezovic N. TVOR: Finding discrete total variation outliers among histograms // IEEE Access. - 2021. - T. 9. - C. 1807-1832. -https://ieeexplore.ieee.org/document/9306761.

[12] Ornik M. Comment on ''TVOR: Finding Discrete Total Variation Outliers Among Histograms" // IEEE

Access. - 2021. - T. 9. - C. 78586-78594. -https://ieeexplore.ieee.org/document/9442768.

[13] Zorin P., Stukach O. "Data of heating meters from residential buildings in Tomsk (Russia) for statistical modeling of the thermal characteristics of buildings // IEEE Dataport. - 2020. [Online]. - Available: http://dx.doi.org/10.21227/3r4e-ch18. - Accessed: May. 10, 2020. - http://ieee-dataport.org/2301.

[14] Stukach O., Zorin P. Long-Term Data from the Heat Meters in Residential Buildings Depending on the Outside Temperature and Characteristics of Buildings // IEEE Dataport. - April 13. - 2021. - doi: 10.21227/cw53-rr81. - http://ieee-dataport.org/4034.

[15] Jiang J., Li S. On complexity of multistage stochastic programs under heavy tailed distributions // Operations Research Letters. - 2021. - Vol. 49. -Issue 2. - March. - P. 265-269. -https://doi.org/10.1016/i.orl.2021.01.016.

[16] Mittnik S., Rachev S.T., Samorodnitsky G. The distribution of test statistics for outlier detection in heavy-tailed samples // Mathematical and Computer Modelling. - 2001. - Vol. 34. - Issues 9-11 (November). - P. 1171-1183. -https://doi.org/10.1016/S0895-7177(01)00125-X.

Popov Ilya Yu. is student at Moscow Institute Electronics and Mathematics of National Research University Higher School of Economics, Moscow, E-mail: iyupopov@edu.hse.ru

Stukach Oleg V. is the founder of the Tomsk IEEE Chapter, Dr. of Sci., Professor of Moscow Institute Electronics and Mathematics of National Research University Higher School of Economics and Novosibirsk State Technical University.

E-mail: tomsk@ieee.org

Zorin Pavel A. is general metrologist, vice-director of LLC "CSO", Tomsk cso.tom.ru. E-mail: zpa@cso.tom.ru

The paper has been received on 03/12/2021

i Надоели баннеры? Вы всегда можете отключить рекламу.