Научная статья на тему 'Механизмы вычислительного интеллекта при решении задачи автоматизации прогнозирования электроэнергии'

Механизмы вычислительного интеллекта при решении задачи автоматизации прогнозирования электроэнергии Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
204
48
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОТРЕБЛЕНИЕ ЭЛЕКТРОЭНЕРГИИ / АВТОМАТИЗАЦИЯ ПРОГНОЗИРОВАНИЯ / ВЫЧИСЛИТЕЛЬНЫЙ ИНТЕЛЛЕКТ / ИДЕНТИФИКАЦИЯ ВЫБРОСОВ / КОННЕКТИВИСТСКИЕ МОДЕЛИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кузнецов Роман Сергеевич, Тимофеев Юрий Вячеславович, Смирнов Николай Александрович, Тютяев Максим Сергеевич, Черкис Андрей Павлович

В статье рассматривается проблема эффективного прогнозирования потребления электроэнергии для множества объектов, в автоматическом режиме. Предлагается подход к автоматизации процесса прогнозирования основанный на CRISP-DM. Рассматриваются методы вычислительного интеллекта для предварительной обработки данных заполнение пропусков и идентификация выбросов, методы построения и настройки моделей прогнозирования. В качестве вычислительного базиса используются коннективистские модели на основе нейронных сетей и конструктивных нейронных сетей. Показана архитектура системы, реализующая механизмы вычислительного интеллекта и представлены результаты испытания.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кузнецов Роман Сергеевич, Тимофеев Юрий Вячеславович, Смирнов Николай Александрович, Тютяев Максим Сергеевич, Черкис Андрей Павлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Механизмы вычислительного интеллекта при решении задачи автоматизации прогнозирования электроэнергии»

Механизмы вычислительного интеллекта при решении задачи автоматизации прогнозирования электроэнергии Р.С.Кузнецов, Ю.В.Тимофеев, Н.А. Смирнов, М.С. Тютяев, А.П.Черкис,

Н.Л.Щербакова

Волгоградский государственный технический университет, Волгоград

Введение

В данной статье рассматривается решение проблемы автоматического прогнозирования потребления электроэнергии. Такая постановка задачи обусловлена следующими тенденциями: 1) удешевление процесса сбора информации о потреблении электроэнергии; 2) невозможности решения задач для большого количества объектов с привлечением экспертов в заданные (относительно короткие) сроки. Все это привело к необходимости разработки механизмов интеллектуальной обработки большого количества информации [1]. В статье предлагается подход основанный на инвариантном процессе интеллектуальной обработки данных (CrossIndustryStandardProcessforDataMining, CRISP DM) [2, 3]. Для реализации подходов разработана концепция интеллектуальной системы управления энергосбережением и реализован прототип [1, 4].

1. Прогнозирование потребления электроэнергии в автоматическом режиме

Предлагаемый подход автоматизации процесса прогнозирования потребления электроэнергииоснован на CRISP DM и на оригинальных подходах применения коннективистских систем для прогнозирования потребления электроэнергии. В качестве объектов прогнозирования рассматривается широкий класс потребителей электроэнергии: жилые и нежилые помещения и здания различных типов. Данные о потреблении электроэнергии собираются и передаются на сервер сбора данных (система EcoSCADA, разработанная Бельгийско-Польской компанией Порта Капена) [5]. Фиксация информации о потреблении осуществляется в режиме реального времени каждые 15 минут. Дадим общее описание подхода.

Шаг 1. Добавление объекта потребителя. Данная процедура включает следующие основные шаги: 1) указание название объекта; 2) позиционирование объекта на карте и 3) загрузка данных о потреблении электроэнергии (исторические значения). Позиционирование на карте позволяет использовать информацию о месторасположении и получать информацию о погоде, которая используется для построения более точных и полных моделей прогнозирования. Для этого используются API погодных сервисов http://www.worldweatheronline.com , http://www.noaa.gov/ и других.

Шаг 2. Предварительная обработка информации. Можно выделить две основные процедуры, связанные с оценкой качества данных. Первая процедура выявление и заполнение пропусков в данных, вторая выявление выбросов и аномалий.

Шаг 3. Автоматическое построение семейства прогнозирующих моделей, параметрическая оптимизация и выбор наиболее точной модели.

Шаг 4. Оценка качества прогнозирующих моделей и выбор наиболее адекватной модели.

Шаг 5. Реализация и визуализация результатов прогноза.

Рассмотрим метод более подробно, с выделением процедур обработки данных. Пусть в системе фиксируется информация о m зданиях, для каждого из которых необходимо сформировать прогноз на h значений вперед с таким же дискретным интервалом (15 минут). Формально информация о здании имеет представление

где - информация о расположении здания, - информация о потреблении электроэнергии, - информация о погоде (температура, влажность, давление).

На первом шаге реализуются следующие процедуры. Процедура позиционирования здания на карте ВР. Для упрощения будем считать, что пользователь формирует отметку на карте (MicrosoftBing) и в содержатся значения широты и долготы. Для получения

значений для произвольного здания на основании используется процедура веб-

майнинга

WMdxll (2)

Процедура работает с погодными сервисами.

На втором шаге реализована процедура выявления и заполнения пропусков в данных

GF({yl{ (3)

Регрессионные модели и интерполяция кубическим сплайном используются в качестве базовых, реализованных в процедуре.

Процедура выявления выбросов и аномалий

04D({y},{z}) (4)

использует подход AD и ADAM [6].

Процедура

}) (5)

синтеза и настройки моделей {использует обработанные на предыдущих этапах данные

! '■ \. !. Исходя из предыдущих исследований [3, 4] входными переменными являются: 1)

потребление электроэнергии в предыдущие моменты времени, 2) информация о погоде (для обучения) и о прогнозе погоды (для расчета прогнозирования) и 3) календарные данные. В качестве вычислительного базиса используются коннективистские системы: конструктивные многослойные нейронные сети и эволюционные коннективистские системы Касабова на базе многослойных нейронных сетей. [7].

Сформированы 2 модели прогнозирования, отличающиеся набором входных переменных. Модель 1 включает 4 входные авторегрессионные переменные:

yi(t - i*672), i = 1,.. 4. (6)

Модель 2, помимо авторегрессионных, включает еще 3 входные переменные: режим работы здания (бинарная переменная, 0 - не работает, 1 - работает), день недели {1,...,7}, и номер квартала {1, 2, 3, 4}.

Для оценки качества и выбора реализована процедура

(7)

оценки качества моделей на основе множества оценок [8]. Для расчета прогноза реализована процедура

CF{[ (8)

2. Концепция интеллектуальной системы

Общее описание. Для реализации предложенного подхода и рассмотренных механизмов вычислительного интеллекта разработан прототип интеллектуальной системы.

Рис 1. Архитектура интеллектуальной системы

Система имеет следующие компоненты (рис 1): 1) семантический слой для выбора (описания) проблемы; 2) диспетчер загрузки и определения качества данных (процедуры ВР, ï, , О); 3) диспетчер запросов; 4) хранилище данных со структурой OLAP с

диспетчером загрузки информации со внешних источников данных и с прослойкой, обеспечивающей доступ к хранилищу (например, объектная схема данных, linq);5) компоненты библиотек моделей и методов;6) компоненты библиотек процессов (процесс -последовательность вызовов методов для решения проблемы, процедуры F,

);метаданные или база знаний;компонента интеллектуального формирования и управления процессами и потоками потока метаданных.

Реализация в виде веб приложения и облачного приложения.

Облачная реализация представляет собой SaaS-систему, состоящую из хранилища данных со статистикой измерений и рассчитанными прогнозными значениями иоблачной интернет-службы WorkerCloudService, развернутых в облаке WindowsAzure, а также, непосредственно, системы автоматического прогнозирования, развернутой на обыкновенном хостинге и обращающейся к данным развернутого в облаке хранилища.

Приложения-клиенты, собирающие статистику измерений с датчиков в зданиях и помещениях, в автоматическом режиме с определенной периодичностью отправляют данные облачному сервису в виде ХМЬ-пакетов.

Структура ХМЬ-пакета представлена ниже:

<data>

<userid>1875</userid>

<num>148</num>

<measures>

<measure>

<datetime> 10:06:41 01.06.2008</datetime>

<value>0,2</value>

</measure>

<measure>

<date>10:26:41 01.06.2008</date>

<value>0,8</value>

</measure>

</measures>

</data>

Пакет данных содержит в себе идентификатор пользователяв тегеuserid, число измерений в тегеnum и, непосредственно, массив измеренных значений, заключенный в тегmeasures. Каждое измерение в массиве содержит в себе дату и время произведения измерения, а также полученное значение.

После отправки XML-пакет обрабатывается сервисом, который добавляет вновь полученные данные в хранилище, а также передает системе автоматического прогнозирования команду на обновление значений прогноза с учетом вновь загруженных данных.

Полученные прогнозные значения загружаются системой в хранилище данных, откуда, в свою очередь, их выгружает сервис и возвращает клиенту XML-пакет с результатами прогноза (структура XML с данными прогноза идентична структуре пакета с данными измерений).

Выводы

Для апробации предложенного подхода были проведены эксперименты с использованием информации за 2009 - 2010 годы о 17 комерческих зданиях. Выборка данных была разделена на обучающую и тестовую. Все процедуры были реализованы в атоматическом режиме, средняя ошибка составила 11% (средняя относительная ошибка, MAPE).

Одним из направлений развития данной работы является формирование записей в таблицу метаданных для выявления закономерностей между данными и структурами наиболее точных моделей.

Литература:

1. Камаев, В.А. Интеллектуальные системы автоматизации управления энергосбережением / В.А. Камаев, М.В. Щербаков, А. Бребельс // Открытое образование. - 2011. - № 2. - C. 227-231.

2. Larose, D. T. Discovering knowledge in data: an introduction to data mining / Daniel T. Larose // John Wiley & Sons, Inc. ISBN 0-471-66657-2 (cloth). - 2005.

3. Камаев В. А., Щербаков М. В., Панченко Д. П., Щербакова Н. Л., Бребельс А. Применение коннективистских систем для прогнозирования потребления электроэнергии в торговых центрах / Управление большими системами. Выпуск 31. М.: ИПУ РАН, 2010. С.92-109.

4. Щербаков, М.В. Методика выявления потенциала энергосбережения на основе интеллектуального анализа данных / М.В. Щербаков, Т.А. Яновский, А. Бребельс, Н.Л. Щербакова // Прикаспийский журнал: управление и высокие технологии. - 2011. - № 2. - C. 51-55.

5. Hill, D.J., Minsker, B.S., Anomaly detection in streaming environmental sensor data: A data-driven modeling approach, Environ. Model. Softw. (2009), doi:10.1016/j.envsoft.2009.08.010

6. Коннективистские модели идентификации динамики систем на коротких интервалахнаблюдения с заданным множеством классов поведения / М.В. Щербаков, Н.Л. Щербакова, И.П. Козлов, В.А. Камаев // Известия ЮФУ. Технические науки. -2012. - № 1. - C. 83-91.

7. Brebels A., Shcherbakov M. (2011) Calculation method for the selection of the best scale-

and domain- independent forecast model In The 31st Annual International Symposium on Forecasting (ISF 2011), 26-29 June, 2011, Prague, ISSN 1997-4, pp. 157.

http://www.forecasters.org/isf/pdfs/ISF11 Proceedings.pdf

i Надоели баннеры? Вы всегда можете отключить рекламу.