Раздел IV. Интеллектуальные системы, автоматика,
управление
УДК 681.5.015: 004.032.26
М.В. Щербаков, В.А. Камаев, Н.Л. Щербакова МЕТОДИКА РЕШЕНИЯ ЗАДАЧИ ИДЕНТИФИКАЦИИ ДИНАМИКИ СИСТЕМ НА КОРОТКИХ ИНТЕРВАЛАХ НАБЛЮДЕНИЯ С ПРИМЕНЕНИЕМ КОННЕКТИВИСТСКИХ МОДЕЛЕЙ*
Рассматривается методика решения задачи идентификации динамики систем на коротких интервалах наблюдения с применением коннективистских моделей. Описан класс объектов идентификации, приводится математическая постановка задачи и представлена модифицированная схема вычислительной процедуры. Предлагается критерий качества идентификации динамики систем на коротких интервалах наблюдения. Дается понятие коннективистской системы и соответствующая формализация. Дано описание методики с процедурами синтеза и настройки моделей идентификации на основе коннективистских .
Идентификация; короткий интервал наблюдения; коннективистская система; интеллектуальный анализ данных.
M.V. Shcherbakov, V.A. Kamaev, N.L. Shcherbakova CONNECTIONISTS SYSTEMS FRAMEWORK FOR DYNAMICS IDENTIFICATION ON THE SHORT OBSERVED PERIOD
The paper has deal with connectionists systems framework for dynamics identification on the short observed period. Class of observed objects is described here. Paper discovers the statement of the identification problem and the modified scheme of the computational procedure. The criteria for estimating of quality for dynamics identification procedure on the short observed period is suggested. Connectionists systems formalization and overview are represented. The steps of the models generation and optimization included in framework are described.
Identification; short observation period connectionists system; data mining.
Введение. Задача идентификации динамики систем возникает в связи с высокой потребностью в прогнозировании и управлении процессами в различных предметных областях: экономике, медицине, социальном управлении, управлении энергосбережением [1, 2]. Ее решение позволит определить, каким образом система будет развиваться в дальнейшем и что следует предпринять для снижения риска неблагоприятного развития ситуации. Например, в медицине: проблема идентификации групп риска пациентов по профилю изменения функциональных со, -века от его нормы. В экономике: анализ групп клиентов - потенциальных дебиторов для разработки превентивных мер по профилактики дебиторской задолженности; управления взаимоотношениями с клиентами на различных этапах жизненного цикла; моделирование развития кластеров муниципальных образований - выделение этапов жизненного цикла и идентификация. В энергетике: определение по.
*
Работа выполнена при финансовой поддержке РФФИ (проект № 10-07-97008-р_поволжье_а). 72
Особый интерес вызывает класс задач идентификации на коротких интервалах наблюдения. В этом случае весь интервал наблюдения разбивается на L равных интервалов - короткие интервалы наблюдения (КИН). Например, в задаче прогнозирования потребления электроэнергии такой интервал определяется числом временных отсчетов в течение одного дня. Рассматриваемая задача относится к задаче классификации и выделяют 2 постановки задачи: 1) когда множество элементов, характеризующих поведение на КИН, задано и 2) когда нет (т.е. множество должно определяться автоматически и решается задача кластеризации [3]).
, , к решению задачи идентификации динамики, так как классифицируют состояния объектов в конкретный момент времени [3-5]. Более того следует отметить, что задача усложняется отсутствием аналитической модели объекта идентификации.
, -ваемой модели объекта [6].
В статье предлагается методика решения задач: 1) идентификация объекта (построение модели Мг(А)); 2) идентификация динамики объекта на КИН (построение модели М2(В)) с использованием коннективистских систем [7, 8].
Постановка задачи идентификации динамической системы выделенного класса на коротких интервалах наблюдения.
1)
коротком интервале наблюдения.
Пусть объект характеризуется кортежем
(1)
где Y - множество переменных СОСТОЯНИЯ , Y = {уi}, i=1, ...|У|, U - множество управляющих воздействий, U = {Uj}, j=1, - множество возмущающих воз-
, k=1, ., . n=1, 2, ., T объекта приложены внешние управляющие воздействия U(n), возмущения Е(п) и регистрируются значения состояний Y(n). Задана W(yu,Qn - матрица значений Y, U, ( ) T.
Отметим следующие особенности объекта идентификации (ограничения на
).
а) |F|=1;
б) Задана область изменения переменных {yj, {Uj}, {ffc}, т.е. для каждой переменной существует верхнее и нижнее значения;
) .
2) .
Соответствие настраиваемой модели объекту, т.е. качество идентификации, оценивается критерием качества идентификации ]г(А) и /2(В), зависящего от не-
e . .
,
e(W(y,u,f),n<n) = (Y(n) - Y*(n))2, (2)
а общая невязка по всем интервалам наблюдения
Е(Щу,и,ап. А) = г- JzLt(Yi(n)- ВД)2. (3)
Определим оценку ]2 (В) соответствия поведения объекта на коротком интервале наблюдения тому или иному классу, т.е. качество модели М2(В). Тогда невязка примет вид
еЧЩум-в) = (с(р)- с*(р))2, (4)
тогда, на основании (4), общая невязка по всем интервалам наблюдения
£p(w(y,u,an,B) = - q(p))2. (5)
Отметим особенность, связанную с оценкой на основе среднеквадратичного
C .
Рассмотрим модификацию (4). Так, есть некоторая окрестность е, причем е < АС, где АС - абсолютная величина шага кодирования, для которой выполняется следующее условие:
E»(W(„,0,„.B) = ((ад- C-WI < е (6)
0, если |С(р)- С*(р)| > е
3) Математическая постановка задачи идентификации с определенным множеством классов поведения.
Даны значения векторов Y, U и Е в интервале наблюдения n = 0, ..., T, где T
- , вида
Ti(to) - Ут(«о) «i(t0) - um(t0) fiCto) - f|S|(to)-
-yi(7) - Ум (7) «!(T) - U|y|(T) &(Т) - f|S|(T).
Y, U .
наблюдения T разделяется на L однородных КИН размером т. Число дискретных отчетов в интервале p = const для VI, I €L и р = l-х, 1-х +1,1-х +2,...,1-х + х.
Каждому столбцу матрицы Yy p определено значение ст-, ст- 6 С, где ст- -элемент множества классов, определяющих поведение на КИН. Существует ото.
Настраиваемую модель идентификации Мг(А), в соответствии с (1), представим в виде
y*(t,y,u,,f,A) =
= fy (a*, y(t - 1),..., y(t - my), u(t + au),..., u(t - mj, £(t + а^),... ,^(t- )), (7)
где A* - вектор настраиваемых параметров модели Мг(А), ту,ти,т^ - параметры, определяющие глубину погружения, аи, - параметры горизонта прогнози-
.
(1) -
вим в виде
c*(t,p,y, В) = fc(B*,y(t - 1),у(£ - 2),...,y(t -ШуУ), (8)
где В* - вектор настраиваемых параметров модели М2(В) , ту - параметр, опреде-
. , (8)
перепишется в виде
c*(t,p,y,B) =/c(B*,y*(t-l),y*(t-2)..........y*(t-my)). (9)
:
1) (7) (9) -
рез отыскание вида функций fy и /с;
2) задачу параметрической идентификации математических моделей Мг(А) и М2(В) по наблюдениям W как отыскание таких зн ачений векторов А* и В, при
(3) (5) .
4) .
Схема вычислительной процедуры [6] сводится к решению следующих задач:
1. Очертить класс объектов 0.
2. Определить множество {ст}.
3. Выбрать для объекта О 6 © настраиваемую модель идентификации объек-
.
4. Выбрать для объекта О 6 © настраиваемую модель идентификации динамики объекта М2 (В) для классификации принадлежности вектора состояний объекта на КИН определенному классу поведения C.
5. Выбрать критерии качества идентификации моделей, согласно (3) и (5).
6. Сформировать алгоритмы идентификации, использующие наблюдения за значениями выходных и входных величин, выбранные критерии качества
, -чения параметров настраиваемых моделей так, чтобы средние потери с ростом п достигали минимума.
Методика решения идентификации динамики систем на коротких ин-.
Мг(А) и М2(В) предлагается использовать базис коннективистских систем. Кон-нективистская система представляется в виде
С5 = (иЫ, ЯЕ, 1У, Р, РЯ, Ф>, (10)
где UN - множество элементов, КБ - множество связей, ЬУ - множество групп элементов (слоев), Б - множество функций преобразования информации и^ РИ -процедура настройки значений связей ИБ для минимизации функционала Ф.
Формально коннективистская система (10) при данной формализации обобщает в себе различные модели (например, скользящего среднего, линейной регрес, ).
Выделим фреймовую модель коннективистской системы
РС5 = (РН,С5,АС, Ф>, (11)
где БИ - множество слотов (фреймов), объединяющих подмножество систем СБ, АО - множество КС, выполняющих агрегацию выходной информации систем СБ. Такое обобщение позволяет автоматизировать процесс подбора прогнозных моде, .
Рассмотрим процедуру синтеза структуры FCS.
1.
а) очистка матрицы W от выбросов и заполнение пропусков средними значениями (или медианами);
б) определение параметра L - числа КИН и т - размерности КИН;
)
)
д) определение для каждого столбца матрицы элемента ст класса О;
) . основе клеточной матрицы и ^ п происходит определение параметров глубины
погружения ту,ти,т^ и параметров горизонта прогнозирования аи, и форми-
рование векторов входных 11^ и выходных параметров Ои^ . Вектор входных параметров включает значения переменных Y, U, Е в соответствии с параметрами m и а. Вектор выходных параметров включает одну компоненту Y.
Определение глубины погружения осуществляется посредством построения автокорреляционных функций:
) . Определение параметра ту = т и формирование векторов входных 1п2 и выходных параметров Ои1:2;
з) число элементов выборки равно ^
2. Выполнить формирование входного фрейма FRinput, состоящего из однослойной CSinput. Число элементов C5input соответствует числу входных переменных как для Мъ так и для М2. Функция преобразования элементов CSinput линейная:
.
3. Выполнить формирование фрейма FRM1, состоящего из m-спойной CSM1. Число элементов СЛОЯ LYi соответствует числу входных переменных, определенных для Мъ число элементов слоя LYm= 1. Число элементов слоев определяется в процессе оптимизации [8]. Функция преобразования элементов CSM1 - адаптивный сумматор с логистической активационной функцией.
4. Выполнить формирование фрейма FRM2, состоящего из n-слойной CSM2.
LY1 , -
, LYn= 1.
. CSM2 -
сумматор с логистической активационной функцией.
, -
- .
Процедура настройки моделей включает следующие шаги.
1. : ,
min, т.е. E(Wj,jUj^n,A*) < £. Если коннективистская система, входящая во фрейм FCS1, - , - -
го распространения ошибки.
2. :
min, т.е. Ep(Wy,uj,n. В*) < £. Если коннективистская система, входящая во фрейм FCS2, - , - -
го распространения ошибки.
Результаты и выводы.
1.
объекта на коротких интервалах наблюдения с применением коннективистских систем. Методика позволяет учитывать не только значения в прошлом, но и прогнозированные значения управляющего воздействия или внешних возмущений. Данный подход может быть модифицирован на уровне синтеза структуры систе-, .
2.
вычислительная модель, описываемая (10) с заданной процедурой настройки.
, . -но формировать совокупность вычислительных моделей, результаты которых бу-AG , . Элементы этого фрейма осуществляют формирование взвешенного выхода значения состояния системы.
3. -дель управляющих и возмущающих воздействий. Это позволит учитывать так называемые артефакты [8, 9], влияющие на поведение системы.
4. -требления электроэнергии НИР № 39/267-10 «Р^работка подходов к минимизации потребления электроэнергии на основе статистического и интеллектуального анализа временных рядов потребления электроэнергии» (Компания Порта Капена,
).
составляла от 2 % до 10 %.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Кам аев В А., Щербаков М.В., Скоробогатченко ДМ. Автоматизированная система прогнозирования транспортно-эксплуатационного состояния дорог // Вестник компьютерных и информационных технологий. - 2004. - № 4. - С. 2-6.
2. . ., - . . -
//
Проблемы управления и моделирования в сложных системах: Тезисы докл. XII Между-нар. конф. (Самара, 22-24 июня 2009 г.). - 2009. - С. 532-535.
3. Larose D.T. Discovering knowledge in data: an introduction to data mining. - John Wiley & Sons Inc, 2005. - P. 222.
4. Frawley W.J., Patetsky-Shapiro G., Mathews C.J. Knowledge discovery in databases: an overview // Ai Magazine, 1992. - Vol. 13. - P. 57-70.
5. Zhao H.T., MacLennan J. Data Mining with SQL Server. - Wiley Publishing Inc, 2005. - P. 460.
6. Цыпкин ЯЗ. Информационная теория идентификации. - М.: Наука, 1995. - 336 с.
7. Kasabov N. Evolving connectionists systems. The Knowledge Engineering Approach.
- Softcover, 2007. - P. 451.
8. Щербаков M.B. ICDMS - программное обеспечение как сервис для решения задач иден-
// -венного технического университета. - 2009. - № 7. - С. 88-91.
9. . ., . . -
// -
вестия Волгоградского государственного технического университета. - 2007. - №. 2.
- С. 32-33.
10. - . ., . .
//
университета. - 2007. - №. 9 (35). - С. 49-53.
. . ., . . .
Щербаков Максим Владимирович - Волгоградский государственный технический университет; e-mail: vstu@gebeus.ru; 400131, г. Волгоград, пр. Ленина, 28; тел.: 88442248100; кафедра САПР и ПК; к.т.н.; доцент.
Камаев Валерий Анатольевич - e-mail: kamaev@cad.vstu.ru; кафедра САПР и ПК; заве; . . .; .
Щербакова Наталия Львовна - e-mail: snl@gebeus.ru; кафедра экспериментальной физики; к.т.н.; доцент.
Shcherbakov Maksim Vladimirovich - Volgograd State Technical University; e-mail: vstu@gebeus.ru; 28, Lenin avenue, 400131, Volgograd, Russia; phone: +78442248100; CAD department; cand. of eng. sc.; associate professor.
Kamaev Valery Anatolyevich - e-mail: kamaev@cad.vstu.ru; CAD department; dr. of eng. sc.; head of department; professor.
Shcherbakova Natalia L’vovna - e-mail: snl@gebeus.ru; experimental physics department; cand. of eng. sc.; associate professor.