УДК 519.7;519.81
МЕТОДЫ РАСПОЗНАВАНИЯ СОСТОЯНИЙ ДИНАМИЧЕСКИХ СИСТЕМ
С.И. Колесникова
Томский политехнический университет Томский государственный университет систем управления и радиоэлектроники E-mail: [email protected]
Рассматриваются подходы и реализующие их методы к распознаванию состояний стохастических динамических систем. Дается процедура корректного учета значимости динамических наборов информативных признаков при решении задачи распознавания. Приводятся данные численного моделирования и апробации методов при решении прикладной задачи.
Ключевые слова:
Состояние динамической системы, методы распознавания образов, эффективность распознавания, модифицированный метод анализа иерархий, интеллектуальная система, весовые коэффициенты, временной ряд.
Key words:
Dynamical system state, methods of pattern recognition, effectiveness of recognition, modified analytic hierarchy process, weight coefficients, intelligence system, time series.
Основные методы исследования сложных стохастических динамических систем (ДС) в существующих обзорах (например, [1-4]) систематизированы относительно двух подходов: безмодельные исследования или непосредственный анализ, куда относят спектральный анализ (разложение в ряды Фурье, Карунена-Лоэва, по базовым вейвлет-функциям), получение некоторых числовых (средние значения, корреляционные размерности, показатели Ляпунова и т. д.) и моделирование ДС (реконструкция).
Реальные временные ряды (ВР), являясь дискретной моделью поведения динамических систем, как правило, содержат параметрическую неопределенность, нестационарны и зашумлены. Обработка таких ВР требует разработки и использования различных методик и технологий, которые бы были свободны от предположений классических методов, а именно, стационарность процесса, эргодичность и пр.
Целью работы является постановка задачи распознавания состояний сложной динамической системы как сегментов нелинейных и нестационарных временных рядов, образованных в результате измерения наблюдаемых характеристик сложной ДС, а также решение поставленной задачи посредством создания новых методов оценки закономерностей признакового пространства с последующим применением известных подходов (распознавания образов, теории информации, тестового распознавания), позволяющих применять известные подходы к решению задачи распознавания состояний сложных ДС в реальном времени с приемлемым качеством.
Прежде чем рассмотреть особенности базовых подходов применительно к решению поставленной задачи, реализованных в информационной интеллектуальной системе, кратко остановимся на используемых определениях и понятиях и формализуем задачу распознавания состояний ДС.
Основные определения и понятия.
Постановка задачи
Под системой реального времени будем понимать систему, гарантирующую время реакции (отклика) на измерение контролируемой реализации ДС при протекании процессов в системе (например, оперативное обнаружение разладки ДС).
Под состоянием ДС будем понимать совокупность элементов (подмножество) фазового пространства ДС (скаляр, точка многомерного пространства, вектор), наделенное характерными свойствами (например, определенными экспертом, согласно физической природе ДС).
Под системой градаций квантования будем понимать мультимножество: уникальные значения уровней квантования (целое число шагов квантования, кодирующих значение реализации ДС) и их кратности.
Общая постановка задачи. Пусть задан случайный процесс (СП) (X,7} = (X(г),7(г), г„ < Г < Т}, 7() = / (X (г)), (1)
характеризующий состояние ДС, где Х(/) - вектор ненаблюдаемых переменных состояния системы; У(/) - случайная наблюдаемая векторная функция; 4(0 - шум достаточно общей природы с нулевым средним и конечной дисперсией. Относительно динамики поведения СП (1) на [/0, Т] выдвинуто 1>1 альтернативных гипотез 0={01,02,...,0/|, составляющих полную группу событий и интерпретируемых как классы состояний ДС. Другими словами, фрагмент реализации СП (1) может находиться только в одной из заданных (экспертом, или по обучающей выборке) областей (классов) 1=1,1. Наблюдение осуществляется в соответствии с дискретным планом /е^,^,...,^}, /=/0+/Д, ]'=0,И, по реальной ДС иди ее модели (реализация СП Уе{у0,уь...,уя}, у= У(^) - временной ряд). Задача состоит в отнесении наблюдаемых в момент / или на некотором фиксированном интервале (/', реализаций У к классу /=!,/.
Формализация задачи распознавания состояний
ДС. Обозначим через О0 - множество реальных состояний ДС; О¥- множество реализаций состояний ДС, отражающих математическую (или иную) модель; - подмножество дискретных наблюдений реализаций состояний ДС, ОТ5сО7; О=(Оь ..., О/)-множество образов (классов) состояний ДС, ОсОг. Предполагается выполнение следующих положений: 1) существует отображение / 2) существует (неизвестное, однозначное) отображение - модель состояний ДС.
По заданной обучающей выборке - множеству значений пар объект-метка состояний ДС где 1=1,к - число серий наблюдений (реализаций) одной ДС, требуется: 1) построить алгоритм распознавания (АлР) Л(0Г): ОТ^/а (возможно, множество АлР), осуществляющему оценку метки состояний ДС й&/а={1,...,/\ по совокупности новых наблюдений (Х-окну) ^=(№1,^-1), Х>1, УеТХ={1,...,Т-Х+1};
2) оценить вектор апостериорных вероятностей принадлежности к каждому из состояний ДС {р(й/ух), 3) синтезировать итоговое решаю-
щее правило, согласующее частные решения пп. 1, 2 и минимизирующее критерий качества распознавания, под которым понимают средний риск потерь, среднее число ошибок на полном скользящем контроле, вероятность неправильного распознавания; 4) оценить обобщающую способность АлР (и решающего правила) в смысле минимума информационного критерия качества. Решение задач 1-4) должно обеспечиваться в режиме реального времени на реальных размерностях данных при ограничениях на вычислительные ресурсы ПЭВМ. Заметим, что при /=Тзадача распознавания переходит в задачу идентификации.
Прежде чем перейти к решению задачи, кратко охарактеризуем наиболее типичные методы идентификации (распознавания) состояний ДС и укажем границы их применимости [1-12].
Методы решения задачи
распознавания состояний ДС
Методы на основе спектрального анализа. В работе [6] в качестве исходных признаков для определения состояния ДС брались случайные величины значимых (превышающих заданный порог) амплитуд гармоник спектрограммы в разложении в ряд Фурье временного ряда. Исследования проводились в предположении, что в зависимости от состояния исследуемой ДС математическое ожидание исходного вектора признаков будет различным.
Перечислим ограничения спектрального подхода [7]: 1) процедура распознавания годна при условии различия выборочных средних векторов групп, соответствующих разным состояниям ДС, что для ряда технических процессов [7, 8] мало приемлемо; 2) преобразование Фурье корректно только для стационарных ВР, т. к. непериодиче-
ский СП нельзя представить в виде ряда Фурье с взаимно независимыми коэффициентами. Поскольку периодических функций в природе не существует, то пользоваться спектральными методами рекомендуется в следующих случаях [7]:
• интервал наблюдений содержит большое число колебаний (в теории сигналов |/1-/0|>30Гс наибольшим периодом Т);
• форма колебаний на каждом периоде неизменна на всем интервале наблюдения;
• период Т и периоды гармоник постоянны на интервале наблюдения.
Следует учитывать, что при неизвестной природе сигнала нет оптимального спектрального окна.
Вейвлет-анализ полезен для исследования нестационарных сигналов, содержащих сегменты с различным характером поведения, для существенно неоднородных сигналов (импульсного типа), сигналов с особенностями (разрывами функций, производных), поскольку позволяет локализовать особенности и выявить их характер. Базис состоит из функций, локализованных по времени и по частоте.
Метод сингулярного спектрального анализа имеет определённые аналогии с вейвлет- и динамическим Фурье-анализом. Однако, во-первых, вопрос о размерности самой матрицы и количественной зависимости числа базисных векторов от размерности остается открытым; во-вторых, время анализа весьма велико.
Метод на основе анализа корреллограмм для нестационарных ВР. Трудности метода связаны с необходимостью отличать эффекты «внешней» существующей периодичности, связанной с естественно-физическими циклами, и внутренне обусловленной зависимости между членами ряда. Увеличение промежутка усреднения (оптимальное окно усреднения неизвестно) не приводит к успеху [2], поскольку зависимость, наблюдавшаяся в одной выборке, может исчезнуть в другой того же объема, но отнесенной к иному моменту времени. Показано [2], что переход к средней корреллограм-ме за период наблюдений увеличивает неточность прогноза состояний ДС даже на короткий промежуток времени.
Методы нелинейной фильтрации. Процедура фильтрации нелинейных и нестационарных процессов [9] требует при нахождении оптимальных параметров проводить многомерную оптимизацию в смысле критерия полного скользящего контроля, на которую, несмотря на оптимизирующие преобразования, упрощающие вычисления, затрачиваются значительные вычислительные и временные ресурсы. При этом необходимо (субъективное) знание ядерных функций.
За пределами рассмотрения остались методы анализа нестационарных рядов (бутстреп, адаптивный и др.), нейросетевой метод. К недостаткам последнего отнесем относительность выдаваемых от-
ветов, высокую вычислительную трудоемкость, отсутствие теоретических оценок гарантий применения метода, существенное уменьшение обобщающей способности и высокую вычислительную трудоемкость (более чем в 2 раза) в условиях нестационарности ВР [4].
Методы на основе распознавания образов [5]. Принципиальная сложность задачи распознавания состояний ДС методами распознавания образов вызвана следующими факторами [8, 10]:
1) необходимостью анализа обучающей выборки большого размера (для технических систем порядка более 104—106 значений временного ряда, а, как известно, задача поиска информативных наборов признаков является АР-полной [5]);
2) обучением алгоритма распознавания и построением решающего правила на одной реализации СП, а принятием решения - на другой (возможно с другим уровнем и типом шумов);
3) реальностью времени, оцениваемой малыми порядками (10 мкс для электронно-механических систем);
4) нелинейностью и нестационарностью зашу-мленного СП (1);
5) возможным пересечением граничных состояний ДС.
Ниже будет показано, что перечисленные трудности частично разрешимы за счет более полного учета информативных и дискриминирующих свойств характеристических и классификационных признаков состояний ДС.
Метод на основе теории информации [10, 11]. Подход является математической основой многих методов (критерий релевантности; ROC-анализ (Receiver Operator Characteristic) и др.). Энтропия системы может рассматриваться как мера «структурированности» некоторого состояния или мера «удаленности» структуры одного состояния от структуры другого. Именно этот подход и положен в основу рассмотренного в [11] метода распознавания состояния ДС на основе специальной информационной метрики. Там же отмечено, что время и эффективность решения задачи распознавания существенно зависит от способа учета градаций квантования ВР (как признаков). Ниже излагается метод оптимального выбора системы градаций квантования, приводящий к существенному выигрышу во времени без потери в качестве распознавания состояния ДС по наблюдаемым данным.
Методы оценки закономерностей признакового пространства
Метод формирования мета-эталонов. Известно, что недостаточная информативность признаков не может гарантировать высокого качества классификации объектов из генеральной совокупности даже коллективом правил. Поэтому акцент в подходе к распознаванию состояний ДС в информационной
системе [12, 13] смещен в сторону выбора информативных признаков и согласованности оценок их разделяющей способности, приводящих к качественному распознаванию состояний ДС в реальном времени.
Для сравнения в качестве диагностических признаков для 1-го состояния 1=1,1, принимался набор эталонов состояния ДС, построение которых осуществлялось по одной из следующих схем [8]: 1) выбор по обучающей выборке диагностических фрагментов соответствующего ВР и интервалов между ними с последующим усреднением по выборке; 2) построение мета-эталонов, суть которого - в замене исходного множества близкорасположенных (в определенном смысле [14]) в признаковом пространстве объектов одним мета-эталоном. Решение принималось в пользу того класса, где значение функции конкурентного сходства ^Ш8-функции [15]) максимально. Экспериментально показано [8, 11], что применение FRiS-функции существенно повышает качество распознавания для случая пересекающихся состояний, а метод формирования мета-эталонов дает лучшее качество распознавания в условиях высокого уровня зашумленности ВР (таблица 1). Результаты являются средними по 100 экспериментам для обучающей выборки размером 1000 объектов. В приложении приведен алгоритм формирования мета-эталонов.
Таблица 1. Зависимость эффективности решающих правил от способа формирования эталонов
Площадь пересечения состояний Эффективность распознавания состояний с применением разных эталонов, % Время распознавания по обычным/мета-эталонам, мкс
Обычные эталоны Мета-эталоны
0 100 100 0,24/0,86
10 99,33 99,80 0,26/0,87
20 97,02 98,13 0,53/4,36
30 86,46 97,41 0,75/6,97
40 74,15 96,52 1,11/22,58
50 71,72 95,24 1,51/27,77
Метод оптимизации системы градаций квантования ВР. Определим систему градаций квантования О, как стохастическое мультимножество из п элементов, которое задается основанием и - кортежем уникальных элементов (градаций) из универсального домена и кортежем кратностей [О] элементов основания (первичная спецификация О). Суть адаптивного подхода к решению проблемы оптимального квантования заключается в выборе системы градаций минимальной размерности (мощности домена и, |Ц|=Жи), которая сохраняла бы информативность исходной «частотной картины» состояния с заданной точностью и обладала бы желательными свойствами (меньшее время распознавания без потери его качества). Здесь под информативностью понимается качественное свойство, характеризующее долю полезной информации в
общем объеме системы признаков и количественно выраженное определенной мерой (энтропией, дивергенцией информации и др.).
Обоснование существования оптимальной системы градаций, обеспечивающей статистически достоверные зависимости между признаками и состояниями, может быть следующим. Чем больше бит информации принесет каждая градация (признак), тем эффективнее система. Известно, что из всех статистических функций распределения, определенных на конечном интервале, максимальной энтропией обладает равномерное распределение. Задача состоит в том, чтобы найти такое разбиение исходной системы градаций на новые градации, которое наилучшим образом выделяет их дискриминирующую суть как признаков распознавания состояний ДС.
Обозначим через дйу условные вероятности попадания значения градации у&П в й-й новый диапазон (карман) (й=1,2,...,к, к>к0, к0 задано) при условии ее «проявления» в состояниях П1 и П2, соответственно. Тогда для двух состояний в качестве наилучшего разбиения диапазона [0, |Ц|] на к отрезков выбирается такое, которое максимизирует значение дивергенции Кульбака: к
О(П: П2; С) = ££ (рА - ) МРь/ъь).
¿=1 У = 1
В случае 1>2 состояний максимизируется величина:
О(С) = Цо(П1 : Пу;С).
1=1 У=1
При проверке гипотезы Б(О1)=Б(О2) (две системы градаций О1 и О2 обладают одинаковой информативностью) на основе статистики
т = О(ф - О(С2)
7< 5 (О(С,)) > + < 5 (О (С,)) >
принимается альтернативная гипотеза Б(О1)фБ(О2), если выполнится условие \Т^а, где gа - пороговое значение по уровню значимости а, доверительный интервал (по доверительному уровню 1- а) для —(О,) определяется по формуле Б^Б^^ф), где Б,и S(Б|), 1=1, 2, оценки дивергенции и дисперсии, соответственно.
Метод на основе тестового распознавания и модифицированного метода анализа иерархии (МАИ). Прежде чем изложить общую схему тестового распознавания [5, 16, 17] применительно к решению задачи идентификации состояний сложной ДС, дадим постановку задачи в удобной для исследования форме.
Пусть имеется некоторая динамическая система, которая может находиться в одном из 1>1 состояний, информация о которых содержится в амплитудах сигналов, измеряемых g датчиками в дискретные моменты времени / и являющихся случайными значениями временного ряда. Задача состоит
в том, чтобы, имея обучающую выборку (экспериментальные данные показаний периодически опрашиваемых датчиков при разных состояниях ДС в виде набора ВР, характеризующих развитие процесса) и анализируя экспериментальные показания датчиков в реальном времени, определить метку состояния ДС.
Выходом каждого т-го датчика 1т (т=1^) являются дискретные значения индикаторных показателей, косвенно характеризующих состояния ДС. Сформируем из исходных данных, полученных наблюдением за поведением ДС в разных состояниях, обучающую матрицу типа объект-признак О объектов в пространстве характеристических признаков (показаний датчиков) и матрицу различений Я объектов в пространстве классификационных признаков [16]. По матрицам О и Я каким-либо из методов [5, 16] построим все или часть безызбыточных тестов, представленных матрицей Т, строки которой сопоставлены тестам, а столбцы - характеристическим признакам, и определим число различающих пар «образ-образ» по каждому признаку, где под образом будем понимать состояние ДС. Для корректного принятия решения в тестовом распознавании используется понятие весовых коэффициентов признаков (ВКП) и тестов, под которыми понимается числовая оценка его различающей способности [5]. Приведение исходной прикладной задачи к стандартной задаче распознавания образов заключается в следующем.
Исследуется некоторое множество объектов П (фрагментов реализаций СП, фазовых траекторий сигналов, временных рядов). Объекты этого множества описываются системой признаков (датчиков) Z={zm, т=1^}. Известно, что множество П предста-вимо в виде объединения непересекающихся подмножеств-классов (состояний) П=(П1, ..., П). Имеется конечный набор объектов (Уь ..., У„) из П, о которых известно, каким классам они принадлежат (это прецеденты или обучающие объекты - реализации СП). Предполагается, что описания объектов из разных классов (состояний) различаются.
Требуется по предъявленному набору значений признаков У=(а1, ..., а) (ат - значение признака 1т, т=1^), т. е. описанию некоторого объекта У из П (не входящего в обучающее множество), определить этот класс (состояние ДС). В случае Уе{У1,...,Ут} фрагмент {а;1,...,а;} будем называть элементарным классификатором (ЭК) и обозначать через (У, 7).
Пусть величины и7 - множество всех ЭК, и={(У, 7)\Уе{У1,...,Ут}}1 и0 (МПЬ ...А)) - множество всех ЭК из и7, порождаемых обучающими объектами из класса и, ии={(У, 7) \ Уе{Уь...,Ут}}, Уеи}, соответственно. Поскольку более информативными считаются тупиковые тесты [5], т. е. минимальные наборы признаков, позволяющие безошибочно разделять обучающий материал на классы, то далее в качестве ЭК будем рассматривать короткие тупиковые наборы (тесты), алгоритмы для
выбора которых, изложены во многих работах, например, в [5, 16].
Близость объектов У'=(а1',а2',...,а1) и Г'=(а1",а2",...,аг') из О по набору признаков 2будем оценивать величиной:
, |1, а' = а- , г е (1,2,..., £}
5(7', 7", г) = ' " "
0,
иначе
если признаки целочисленные, и величиной: |1, |а'; - а"\< , г е{1,2,..., £} иначе
В(7 ',7- г) = ■
а- - а- < е.
| 'г "г | Jt
0,
если признаки вещественнозначные (параметр ет -точность измерения признака 1т).
Пример. Пусть обучающая выборка состоит из дискретизованных (перекодированных веществен-нозначных) показаний 4-х датчиков для шести наблюдений (объектов) ^=(0,1,1,0), У2=(1,2,0,1), У3=(0,1,0,1), У4=(1,2,1,0), У5=(1,1,0,1), У6=(1,1,1,2), представленных матрицей 2, при этом элементы матрицы Я указывают на принадлежность объектов У1, У2 и У3 первому классу-состоянию, а объектов У4, У5 и У6 — второму. В данном примере в качестве ЭК взяты тупиковые тесты (матрица Т) - наборы признаков Т={1Ъ 1Ъ ¿з}, Т>={г1, ^2, ¿4} и Тз={^2, £з, 14), безошибочно разделяющие объекты-наблюдения из обучающей выборки. Матрицы описаний 2, различений Я и тестов Тдля данного примера имеют вид:
^2 23
б = '
1 " 0 1 1 0" 1 ' 1"
2 1 2 0 1 2 1
3 0 1 0 1 3 1
; к =
4 1 2 1 0 4 2
5 1 1 0 1 5 2
6 1 1 1 2 6 2
22 23 24
" 1 1 1 0
1 1 0 1
0 1 1 1
1. Формируем совокупности всех различимых пар объектов из разных образов для каждого признака 1т, т=1^, в виде мультимножества (допускающего кратность элементов). Введем весовые коэффициенты мер относительной важности признаков, обозначенные через с„
V
яе{1,2,...,у}, причем X С = 1.
2. Значения ВКП считаем с помощью процедуры модифицированного МАИ [18] по следующей схеме.
Этап 1. Строим матрицу парных сравнений на каждом из V этапов (по числу V мер относительной важности одного признака над другим, учитывающих особенности мультимножеств, сопоставленных состояниям ДС [17]). Результатом з-го этапа (^=1, V) является вектор нормализованных значений ВКП -
Этап 2. Формируем всевозможные векторы ™§=(Щ] \ локальных ВКП уровня 1:
< =
м>,
ж + ж
]
ж
ж2 = —
" ж + ж
• "
я е{1, 2, ... , V}, " е (1, 2, ... , ,§}. Этап 3. Формируем матрицу №=Щ-||=||(му, ^г/)||,
где
и" + и."
", ж" =
и" + и"
=х
csж¡, и
= Х 'Я2
Этап 4. Глобальные значения ВКП считаем по
формуле: V =Х ж", • = ^
"=1
3
Т =
Известно [5, 16-18], что весовые коэффициенты признаков, являющиеся числовой характеристикой закономерностей в данных, оказывают существенное влияние на эффективность принятия решения. Изложим процедуру принятия решения о номере состояния ДС на основе нового метода корректного учета взаимозависимости сравниваемых признаков, образующих динамически изменяющиеся наборы.
Процедура принятия решения о состоянии ДС
Изложим одну из возможных процедур [16, 17], учитывающую взаимозависимость признаков, по шагам применительно к поставленной задаче.
Строим множества решающих правил (число способов распознавания равно числу используемых для распознавания тестов).
4. Распознаем исследуемый объект одним из тестовых методов [5].
Распознаваемый объект У сравнивается с каждым обучающим объектом У по каждому тесту. Считается, что объект Уполучает голос за принадлежность классу и, если Уе и и описания объектов У и У совпадают по множеству признаков 2 (в этом случае В(У, У, 2)=1). Для каждого класса ис(Оь ...,О) вычисляется оценка принадлежности О(У, и) объекта У классу и, которая имеет вид
О(7,и) = -1-, ХХгж2В(7,7,т),
I ' и I 7еи теТ
где ¥3=ип{Уь...,Ут}, Х - мощность множества Х, у - параметр, характеризующий представительность объекта У; - параметр, характеризующий представительность тестов т, те Г, Т={Т1, ]=1,ЫТ}, Ыт - количество найденных тестов (ЭК).
5. Осуществляется процедура голосования по оценкам принадлежности О(У,и). Объект У относится к тому классу, который имеет наибольшую оценку. Принимаем итоговое решение по результатам голосования на множестве тестов. Замечание. Преимущество модифицированного МАИ [18] перед классическим методом Т. Саати заключается в корректности учета динамических наборов признаков. Как известно, недостатком классического метода, отмеченным и самим автором метода, является противоречие, связанное с эффектом единичной нормировки, приводящей к тому, что предпочтения, выявленные на всем множестве альтернатив (признаков, объектов и пр.), могут не совпадать с «частными» предпочтениями на подмножестве альтернатив. Модифицированный МАИ свободен от этого недостатка.
Моделирование на ПЭВМ
Моделирование преследовало цель показать приемлемое качество алгоритмов и реальное время принятия решения о номере состояния ДС, разработанных с применением предложенных оценок закономерностей признакового пространства (весовых коэффициентов и целенаправленным выбором системы градаций квантования). Под эффективностью распознавания состояний ДС понималась доля правильно распознанных объектов (табл. 2).
Численное экспериментирование проведено на примере модели асинхронного двигателя, разработанной в среде МаНаЬ, для которой по выходному сигналу модели было выделено (экспертом) 4 класса-состояния различной длительности.
На сигналы модели были наложены различные шумы уровня, не превышающего 30 % от максимального значения полезного сигнала: равномерный шум на интервалах [-5;5], [-10;10], для сигнала тока и [-150;150], [-300;300] для сигнала напряжения, соответственно; гауссовский шум с параметрами N(0, 10), N(0, 50) для сигнала тока и N(0, 10000), N(0, 50000) для сигнала напряжения, соответственно. В качестве показателя уровня шума использована относительная погрешность
вычисленная по следующей формуле:
1
Уг - У г
Уу
100 %, где у - значение сигнала,
уровень шума в котором измеряется, у - истинное значение сигнала (п=15000 - размер ряда). По полученным данным (реализациям модели как временным рядам) были построены эталоны состояний [8]. По другим реализациям модели построены объекты, под которыми понимались «окна», или сегменты временного ряда, случайного размера в 5-10 отсчетов (длительностью А>0) измеряемых сигналов тока и напряжения в условиях шума порядка 30...90 % от максимальной амплитуды полезного сигнала.
В таблице 2 и на рисунке использованы аббревиатуры: ЕМ - Евклида метрика; ХМ - Хемминга метрика; ИнфОМ - метрика на основе информационного расстояния Кульбака; СК и АК - стандартный способ квантования и адаптивный, соответственно. Статистическая значимость указанных данных (точности распознавания) проверялась по ?-тесту с уровнем значимости 0,05.
Сравнительный анализ вышеизложенных подходов к решению задачи распознавания состояний ДС на основе моделирования позволяет сделать следующие выводы:
а) ведущая роль в успешном решении задачи распознавания состояний динамических объектов принадлежит не алгоритмам распознавания, а методам выбора информативных признаков и используемых метрик. Весьма обширные экспериментальные исследования, проведенные при различных вариациях интенсивностей шумов и величин параметров оптимизации, показали, что применение разных алгоритмов, реализующих принципиально отличающиеся подходы, а также коллектив алгоритмов приводят в среднем одному и тому же уровню ошибок для заданной системы признаков. Так, в условиях высокой зашумленности эффект от использования мета-эталонов [8] выше обычных эталонов (полученных усреднением по интервалу наблюдения, или усреднением по реализациям, см. табл. 1);
Рисунок. Точность распознавания (а) состояний ДС, в зависимости от уровня квантования по одной реализации 30 %-го шума и (б) - время распознавания
Таблица 2. Эффективность и время распознавания состояний ЭМС для стандартного способа квантования и адаптивного (СК/АК)
Число градаций Эффективность распознавания, % Время распознавания, мкс
ИнфОМ ЕМ ХМ ИнфОМ ЕМ ХМ
10 94,86/90,41 93,76/93,16 90,2/85,26 324/9,624 2,221/0,141 1,062/0,076
20 98,85/97,88 97,62/97,41 99,06/96,25 399/19,197 4,407/0,137 2,058/0,090
30 100/97,96 99,83/97,78 100/95,85 409/28,503 6,407/0,144 2,895/0,065
40 100/100 100/100 100/100 601/38,198 8,728/0,181 4,096/0,083
б) увеличение числа градаций квантования приводит в среднем к повышению точности распознавания до определенного уровня с последующим возможным снижением точности, связанным со структурой сигнала и переобучением, что свидетельствует о существовании некоторой оптимальной системы градаций (признаков), подбор которой осуществляется на этапе обучения;
в) оптимизированная на обучающем множестве система градаций приводит к существенному выигрышу (в 3...50 и более раз) (табл. 2, рис.) в принятии решения относительно определения состояния ДС без ущерба в точности.
Расчеты проводились на ПЭВМ: процессор Intel Core2Duo T8100, 2,1 ГГц; оперативная память 2 Гб; операционная система: Windows Vista Professional SP1.
Выводы
Рассмотрены три подхода к решению проблемы распознавания состояний сложных стохастических динамических систем, адаптированные к реальному времени за счет новых методов оценки закономерностей признакового пространства, образованного на основе временных рядов измеряемых данных. Первый подход основан на модификации выбора мета-эталонов состояний и методах распознавания образов; второй - на сравнении условных
распределений признаков со специальной информационной метрикой, и оптимизации системы градаций квантования в смысле достижения равномерности распределения признаков по состояниям и максимума дивергенции информации; третий - на методе тестового распознавания с новым способом учета весовых коэффициентов динамических наборов признаков и тестов.
Изложенные подходы и реализующие их методы являются базовыми в новой информационной интеллектуальной системе, предназначенной для апробации и тестирования алгоритмов распознавания состояний динамических объектов за реальное время с большой размерностью исходного признакового пространства.
Предложенная процедура корректного учета значимости динамических наборов информативных признаков представляет самостоятельный интерес и может быть использована при решении многокритериальных задач.
Разработанные алгоритмы применимы при организации робастного и адаптивного управления сложными динамическими системами.
Автор благодарит сотрудников ТПУ: профессора В.Г. Бу-креева за постановку задачи и полезные обсуждения; доцента Ю.Р. Цоя и аспиранта А.Н. Мертвецова за проведение вычислительных экспериментов.
Работа выполнена при финансовой поддержке гранта РФФИ № 09- 09-99014-р_офи.
СПИСОК ЛИТЕРАТУРЫ
1. Глухов В.В. Техническое диагностирование динамических систем. - М.: Транспорт, 2000. - 96 с.
2. Орлов Ю.Н., Осминин К.П. Анализ нестационарных временных рядов / Препринт Института прикладной математики им. М.В. Келдыша РАН. - 2007. - № 36. - 24 с.
3. Безручко Б.П., Смирнов Д.А., Сысоев И.В. Оценка параметров динамических систем по хаотическим временным рядам при наличии скрытых переменных // Известия вузов. Прикладная нелинейная динамика. - 2004. - Т. 12. - № 6. - С. 93-104.
4. Тюкин И.Ю., Терехов В.А. Адаптация в нелинейных динамических системах. - СПб.: Изд-во ЛКИ, 2008. - 384 с.
5. Журавлев Ю.И., Гуревич И.Б. Распознавание образов и анализ изображений // Искусственный интеллект в 3-х кн. Кн. 2. Модели и методы: Справочник / под ред. Д.А. Поспелова. - М.: Радио и связь, 1990. - С. 149-190.
6. Кук Ю.В., Лаврикова Е.И. Спектральный метод распознавания состояний динамических систем // Комп'ютерш засоби, мереж1 та системи. - 2007. - № 6. - С. 133-140.
7. Журбенко И.Г., Кожевникова И.А. Стохастическое моделирование процессов. - M.: Изд-во МГУ, 1990. - 147 с.
8. Колесникова С.И., Букреев В.Г. Распознавание состояний динамической системы // Цифровая обработка сигналов и ее применение: Сб. докл. XI Междунар. научно-техн. конф. - М., 2009. - С. 619-622.
9. Васильев В.А., Добровидов А.В., Кошкин Г.М. Непараметрическое оценивание функционалов от распределений стационарных последовательностей. - М.: Наука, 2004. - 508 с.
10. Клир Дж. Системология: автоматизация решения системных задач. - М.: Радио и связь, 1990. - 538 с.
11. Колесникова С.И., Букреев В.Г. Информационный подход к распознаванию состояний динамической системы // Кибернетика и высокие технологии XXI века: Сб. докл. X Междунар. научно-практ. конф. - Воронеж: НПФ «Саквоее» ООО, 2009. -Т. 1. - С. 54-64.
12. Букреев В.Г., Колесникова С.И., Цой Ю.Р Информационная и программная поддержка распознавания состояний динамического объекта в условиях неопределенности // Интегрирован-
ные модели и мягкие вычисления в искусственном интеллекте: Сб. научных трудов V Междунар. научно-практ. конф. - Коломна. - М.: Физматлит, 2009. - Т. 2. - С. 720-727.
13. Программный комплекс ReDSS. 2009. URL: http://redss.tom.ru (дата обращения: 01.12.2009).
14. Волченко Е.В. Модифицированный метод потенциальных функций // Бионика интеллекта. - 2006. - № 1 (64). - С. 86-92.
15. Zagoruiko N.G., Borisova I.A., Dyubanov V.V., Kutnenko O.A. Methods of Recognition Based on the Function of Rival Similarity // Pattern Recognition and Image Analysis. - 2008. - V. 18. -№1.- P. 1-6.
16. Янковская А.Е. Логические тесты и средства когнитивной графики в интеллектуальной системе // Новые информационные технологии в исследовании дискретных структур: Докл. III Всерос. конф. с междунар. участием. - Томск: Изд-во СО РАН, 2000. - С. 163-168.
17. Колесникова С.И., Янковская А.Е. Оценка значимости признаков для тестов в интеллектуальных системах // Известия РАН. Теория и системы управления. - 2008. - № 6. - С. 135-148.
18. Колесникова С.И. Системный подход к оцениванию взаимного влияния признаков в тестовом распознавании // Кибернетика и системный анализ. - 2009. - № 3. - С. 127-135.
Приложение
Алгоритм формирования мета-эталонов
Вход: множество исходных объектов
и = (7,, 72,..., 7и}, 7" = (а-,..., ат-}
{значения т градаций признаков для каждого объекта У}.
Выход: множество мета-эталонов
и; = % 7-,..., 7-}, 7", = (а;-,..., а'т- },
где а'ц- усредненные значения признаков для каждого обобщенного объекта У;. 1: для всех /=1,...,п, для всех у=1,...,п найти расстояние между всеми парами исходных объектов г1=й(аьа); 2: пока выборка не пуста и^0; 3: найти начальную точку формирования мета-эталона
р = arg max £ гу;
j=1.1 nil J
4: найти точку формирования конкурирующего мета-эталона
pc = arg min^р; 5: сформировать множество объектов
UP = {Yj | rpj < rpCj . rpj < ГрСр . rpj < ГрСр
6: создать новый мета-эталон Yp, для которого,
a'pj = w_1 £ aj.w=Kl; i=i
7: удалить из множества Uобъекты Up: U:=U\Up. Вернуть U'=[Yl',Y2',...,Yn}.
Поступила 28.12.2009 г.