МЕТОДЫ АДАПТИВНОЙ ОБРАБОТКИ ДАННЫХ НА ОСНОВЕ МЕХАНИЗМОВ ГИБРИДНОЙ ИДЕНТИФИКАЦИИ С НАСТРОЙКОЙ ПАРАМЕТРОВ МОДЕЛЕЙ НЕСТАЦИОНАРНЫХ ОБЪЕКТОВ
О. И. Джуманов
Самаркандский государственный университет, 140104, г, Самарканд, Узбекистан
УДК 658.512.011
Сформулирована задача и разработаны методы оптимизации обработки данных на основе гибридной идентификации путем синтеза статистических, динамических, нейросетевых моделей нестационарных объектов с механизмами настройки параметров. Реализован подход, направленный на обучение нейронной сети с настройкой вычислительных схем структурных компонентов на основе адаптации весов нейронов, синаптических связей, функций активации, архитектуры сети, функциональных зависимостей „входы-выходы". Доказана эффективность вычислительных процедур с упрощенной настройкой параметров синтезированных динамических и нейросетевых моделей для оптимизации и обеспечения точности обработки данных при априорной недостаточности и параметрической неопределенности.
Ключевые слова: нестационарный объект, обработка данных, оптимизация, синтез, статистические, динамические, эталонные модели, нейронная сеть, настройка параметров.
In the paper author is formulated the task and is developed the methods of optimization of data processing on the basis of hybrid identification by synthesis the statistical, dynamic, neuronetworking models of non-stationary objects with mechanisms of parameters adjustment. The realized approach is directed to neural network training with adjustment of computing circuits of structural components on the basis of adaptation of neurons weights, synaptic connections, activation functions, networks architecture, functional dependences „inputs-outputs". The efficiency is proved for computing procedures with the simplified adjustment of parameters of synthesized dynamic and neuronetworking models for optimization and ensures the accuracy of data processing at insufficiency of a priory information and parametrical uncertainty.
Key words: non-stationary object, data processing, optimization, synthesis, statistical, dynamic, reference models, neural network, adjustment of parameters.
Актуальность темы. Создание эффективных систем обработки информации нестационарной природы для решения задач медицинских, экологических, химико-биологических исследований и управления технологическими процессами обеспечивается за счет разработки и реализации методов адаптации и интеллектуального анализа данных. Современные методы и технологии интеллектуального анализа и адаптивной обработки данных, в которых реализуются возможности обобщения, совмещения и использования свойств нейронных сетей, нечетких множеств и логических выводов, особенно актуальны при идентификации нестационарных и слабоформализуемых процессов в условиях ограниченности априорных сведений [1, 2].
Традиционные подходы к построению методов адаптивной обработки данных основываются на широком применении математических и программных средств моделирования процессов на основе статистической и динамической идентификации с процедурами регулирования и настройки параметров моделей в реальном режиме времени. Однако, сложность реализации механизмов адаптации на основе регулирования и настройки параметров моделей, встроенных в системы обработки данных, обусловливается требованиями достаточности априорных сведений, отсутствия неопределенности и уменьшения привлекаемых объемов вычислительных ресурсов [3, 4]. Следовательно, разработка методов и систем адаптивной обработки данных, функционирующих в условиях ограниченной априорной информации, изменения характеристик вероятностных воздействий и неопределенности параметров при меньших вычислительных затратах является актуальной и востребованной темой научного исследования.
Одним из предлагаемых подходов к построению методов адаптивной обработки данных с упрощенными алгоритмами вычисления является синтез динамических моделей идентификации с методами интеллектуального анализа для регулирования параметров и перенастройки моделей идентификации нестационарных и елабоформализуемых процессов.
Настоящее исследование посвящено разработке методов адаптивной обработки данных на основе гибридной идентификации с механизмами настройки параметров с использованием нейронных сетей (НС), которые позволяют получить простые, прозрачные и эффективные идентификаторы и аппрокеиматоры нестационарных процессов [5, 6], Реализуются методы адаптивного обучения НС, модифицированные вычислительные схемы определения весов нейронов, сннаптических связей, функций активации, архитектуры сети, функциональных зависимостей „входы-выходы".
Ниже излагаются результаты разработки и реализации методов адаптивной обработки данных с алгоритмами настройки параметров на основе НС,
Методы и алгоритмы адаптивной обработки данных на основе гибридной идентификации. Традиционные алгоритмы обучения НС с прямонаправленным и обратным распространением ошибок базируются на методах наименьших квадратов, градиентных методах и их модификациях, которым присущи серьезные недостатки, В них требуется вычисление точных значений градиента, которые не всегда доступны, а алгоритмы обучения НС в условиях большой размерности задач, характерных анализу и обработке данных нестационарных процессов, представляемых в виде случайных временных рядов (СВР), будут связаны со значительными вычислительными затратами. При этом оптимизация обработки данных осуществляется на основе следующих методов: вероятностного поиска со случайным перебором; отжига; поиска с запретами; стохастического моделирования; формирования обучающих наборов с преобладанием избыточных и неинформативных признаков объекта [7],
В предлагаемом подходе к оптимизации обработки данных используются модели обучения, основанные на уникальных свойствах НС, механизмы настройки вычислительных схем таких структурных компонентов сети, как веса нейронов, синоптические связи, функции активации, архитектура сети с уточнением числа слоев и нейронов в слоях для определения адекватных линейных и нелинейных функциональных зависимостей „входы-выходы", Модифицированные алгоритмы обучения НС, синтезированные с методами настройки параметров моделей идентификации, открывают широкие возможности при оптимизации обработки данных за счет поиска „лучшего" набора параметров по всем ком-
понентам НС при изменчивой динамике нестационарного процесса, В результате система становится значительно эффективней по точности обработки данных, алгоритмы становятся устойчивыми, малочувствительными к росту размерности задач и выполняются при меньших вычислительных затратах.
Для развития методов адаптивной обработки данных на основе НС представляют большой интерес решения следующих задач:
- нахождение субоптимального набора параметров с помощью эталонной модели;
- формирование рациональных обучающих наборов и базы данных (БД);
- формирование базы знаний (БЗ), включающей свойства, специфические характеристики объекта, правила извлечения скрытых закономерностей распределения в данных;
- проектирование методов использования статистических и других полезных характеристик, динамических свойств, закономерностей распределения данных.
Результаты решения отмеченных задач позволяют существенно повысить устойчивость обучения НС и требуемое качество идентификации, аппроксимация СВР достигается при значительно меньших ошибках и небольших временных затратах.
Функционирование программных комплексов идентификации СВР и оптимизации обработки данных обеспечивается алгоритмами предварительной обработки данных, поиска рациональных параметров структурных компонентов НС, настройки параметров НС и моделей описания СВР и обучения НС,
В общем виде выход идентификаторов СВР в реальном режиме времени вычисляется по выражению
гт _ ^ та=лт-т\
j=i
количество предъявляемых на вход сети обучающих наборов СВР; число измерений в обучающем наборе СВР;
— значение выхода по эталонным примерам для соответствующих входов;
— расчетное выходное значение, полученное по реальным данным;
t е [tQ,T].
Для повышения качества идентификации обучение НС организуется на основе реализованных модифицированных вычислительных схем структурных компонентов и сформированных обучающих наборов, статистические параметры которых настраиваются на изменение динамических свойств СВР, При этом также варьируется число входов, слоев и нейронов в слоях. Для адаптируемых параметров сети приняты следующие обозначения:
КВх — количество входов НС;
КВых — количество выходов НС;
Слои — количество слоев НС;
T/S — тип функции активации;
Alpha — коэффициенты сннаптическнх связей нейронов;
СО — скорость обучения;
ПУ — пороговый уровень для весовых коэффициентов нейронов;
00 — ошибка обучения НС,
где к — т — Vit) №
Возможности адаптивных алгоритмов дополняются реализацией методов извлечения и использования полезных свойств, характеристик, знаний из БЗ по модели сверхбольшой выборки, которая предполагает разбиение многокомпонентных СВР на однородные сегменты. Важным моментом задачи идентификации является выявление свойств нестационарности СВР, для чего каждый однородный сегмент формализуется кортежами М(А, а, Оп), где А — весовые коэффициенты сегментов, ег — ошибки сегментации, £)„ — дисперсия ошибки сегментации. Решение о наличии скачка в нестационарном процессе в момент I принимается по величине Оп. когда наблюдается превышение заданного порогового значения. Разработаны и реализованы алгоритмы сегментации СВР на основе синтеза многошаговой регрессионной модели и алгоритмов линейной фильтрации, совмещение возможностей которых позволяет представить полезные знания для модификации обучения НС, формирования субоптимальных наборов настройки параметров модели идентификации для устранения случайных всплесков в контурах сегментов СВР,
При реализации модифицированного алгоритма обучения НС и формирования субоптимальных наборов настройки параметров модели идентификации использованы следующие обозначения:
щ — начало сегмента; то — длина опорного сегмента; ко — длина тестового сегмента; — обозначения опорного и тестового сегмента;
ед. е1 ошибки идентификации для соответствующего сегмента;
[/¿Пр, 11ыс1; иоиг — количество нейронов по слоям в сети;
Нш{п, Ншах — минимальная и максимальная логарифмические оценки правдоподобия для тестовых сегментов;
й — оценка сравнения выхода НС с характеристиками эталонного примера.
Алгоритм обучения НС, синтезированный с алгоритмом сегментации СВР, выполняется со следующими условиями:
- если величина /7тах ^ (I ^ Пт\п. тогда обучение НС производится с принятыми границами сегментов;
- если (I ^ Нтах, то производится регулирование длины тестового сегмента;
- процедуры адаптации набора сегментов при обучении НС продолжаются до тех пор, пока не будут обработаны все участки СВР,
При проектировании алгоритма обучения НС использованы следующие обозначения:
СН — субоптимальные наборы по параметрам структурных компонентов НС;
АО — тип алгоритма обучения НС с прямонаправленным и обратным распространением ошибки;
РС — размер сегмента;
О](Яг), j = 1 ,...,К — активность нейронов в выходных слоях НС; г = 1,...,ЛГ — индексы наборов тестовых сегментов;
Рт — вектор регулируемого параметра для интерпретации выхода НС в наборе 8{.
Целью реализации разработанных алгоритмов адаптивной обработки данных для повышения качества идентификации являются устранение излишней сегментации многокомпонентных СВР за счет обнаружения скачкообразных состояний нестационарных процессов, выработка альтернативных решений с оценкой и ранжированием каждого из выходов НС, а также выбор НС с наиболее сильным откликом, позволяющей минимизировать оценку сравнения выхода НС с характеристиками эталонного примера.
Ниже излагаются результаты экспериментальных исследований, которые позволили установить, что за счет дополнительных функциональных блоков, алгоритмов извлечения
18 20
б)
Рис. 1. Графики аппроксиматора СВР: а) по статистической модели; б) па основе НС
и использования свойств, особенностей данных, адекватной идентификации и аппроксимации СВР, алгоритмов обучения НС, регулирования и настройки параметров НС и моделей описания нестационарных объектов достигается существенное повышение эффективности систем обработки данных.
Результаты реализации программно-алгоритмических комплексов адаптивной обработки данных на основе гибридной идентификации. Решение задач гибридной идентификации СВР выполняется на основе учета условий наличия неопределенности в параметрах модели. Для гибридной идентификации характерна настройка параметров идентифицирующей модели нестационарного объекта под характеристик и модальных примеров. При этом эталонная модель представляет собой стационарное динамическое звено, выбранное заранее на основе априорной информации, которая используется для самонастройки.
Эксперименты проведены для реализации статистических моделей идентификации и идентификации на основе НС. Эффективность идентификации СВР исследована для условий обработки данных с настройкой параметров и без механизмов регулирования параметров используемых моделей.
Проведен сравнительный анализ основных параметров модели идентификации СВР с целью выявления их преимуществ и недостатков. Моделирование осуществлено в среде ППП \latlab БшшИпк. Стандартный блок пакета 5г,ер генерирует задающий сигнал, позволяющий изменять свои величины в заданный момент времени. На рис. 1 показаны графики выходных значений аппроксиматора нестационарного объекта без использова-
1 1 1 1 1 1 1
1 J J-
- . 1 1 1 1 1
________i______!
1 1 1
1 1 г 1
1 1 1 1 1 1
10
12
14
16
18
20
а)
б)
Рис. 2. Графики аппроксиматора СВР с алгоритмом настройки параметров модели: а) по статистической
модели; б) па основе НС
ния механизмов регулирования и настройки параметров на скачки задаваемого входного сигнала и полученного выходного результата по статистической и нейросетевой моделям.
Результаты аппроксимации динамической и нейросетевой моделей нестационарного объекта с алгоритмом настройки для выходного процесса проиллюстрированы на рис. 2.
Доказана эффективность синтеза динамических и нейросетевых моделей для повышения качества работы аппроксима тора в зависимости от настраиваемых параметров.
Программный комплекс апробирован на примере идентификации переходных процессов производственного оборудования для прогнозирования производительности по следующим технологическим параметрам: ¿рег — время регулирования параметров; о — степень влияния на качество идентификации настраиваемого параметра в %; си — частота перенастройки модели идентификации; п — число альтернативных решений; ¿maxi — время достижения первого локального оптимума показателя качества идентификации; tu —
время адаптации параметров при идентификации переходного процесса: х .......................декремент
устранения случайных вариаций в нестационарном процессе.
Алгоритмы идентификации СВР нестационарного процесса с настройкой параметров реализованы в следующих режимах: по динамическим моделям нестационарных объектов (режим 1), по моделям НС (режим 2), по синтезированным динамическим и нейросетевым моделям (режим 3).
В таблице приведены результаты сравнения по различным моделям.
Установлены следующие результаты экспериментальных исследований:
Таблица
Сравнение качества идентификации нестационарных процессов по различным моделям
Базовая модель Режим 1 Режим 2 Режим 3
Динамическая Динамическая,
Параметры Статистическая модель с НС с модель НС с
настройкой настройкой настройкой
параметров параметров параметров
£рег) С 4 1,50 1,20 2
(Т. % 62,30 40 10,40 1,53
ы 9,37 7,85 7,39 5,97
п 5 3 2 1
¿тах 1) С 0,60 0,50 0,27 0,14
¿е, С 0,50 0,35 0,18 0,13
X 19,30 8 4 3,23
- для первого режима при запуске динамических моделей идентификации нестационарных объектов с алгоритмами регулирования и настройки параметров обеспечивается лучшее качество идентификации и обработки данных по сравнению со статистическими моделями. При этом алгоритмы обработки данных отличаются меньшими значениями величины перерегулирования £рег, частоты и, степени а и большей величиной х;
- для второго режима при запуске моделей НС с алгоритмами настройки параметров при скачке статистических параметров нестационарного процесса качество идентификации повышается намного сильнее, чем при статистических и динамических моделях. При этом время регулирования уменьшается почти в два раза, и число альтернативных решений за время регулирования — наполовину;
- для третьего режима при запуске синтезированных моделей качество идентификации повышается на 45-50 %, чем при динамической модели, время перерегулирования параметров уменьшается на 33 %, а число альтернативных решений — на 40 %.
Таким образом, гибридные модели идентификации СВР, реализованные на основе НС и алгоритма регулирования и настройки параметров, существенно повышают эффективность комплекса идентификации и обработки данных нестационарных объектов по сравнению с идентификаторами на основе статистических моделей.
Заключение, Исследованные и разработанные методики гибридной идентификации нестационарных объектов и СВР на основе синтеза статистических, динамических, ней-росетевых и эталонных моделей образуют методические основы оптимизации обработки данных с механизмами настройки параметров.
Вычислительные процедуры, полученные для настройки параметров моделей идентификации, способствуют существенному повышению точности обработки данных с меньшими вычислительными затратами в системах управления нестационарными объектами, функционирующих при недостаточных априорных сведениях и большой неопределенности параметров. Установлено, что программные инструменты идентификации с сегментацией на базе динамических и нейросетевых обучающих моделей с настройкой параметров по сравнению со статистическими моделями позволяют повысить точность обработки данных до 50 %.
Список литературы
1. Мирошник И. В., Никифоров В. О., Фрадков А. Л. Нелинейное и адаптивное управление сложными динамическими системами. СПб.: Наука, 2000.
2. Розов А. К. Обнаружение, классификация и оценивание сигналов. Изд-во: Политехника, 2000.
3. Джуманов О. И. Адаптивные алгоритмы контроля погрешностей при обучении нейросе-тевых систем обработки данных нестационарной природы // Проблемы информатики. 2010. № 1. С. 61-71.
4. Ядыкин И. В., Шуйский В. М.. Овсепян Т. А. Адаптивное управление непрерывными процессами. М.: Энергоатомиздат, 1985.
5. Нейросетевая модель анализа технологических временных рядов в рамках методологии Data Mining / А. М. Вульфин, А. И. Фрид // Информационно-управляющие системы. 2011. № 5. С. 31-38.
6. Нейросетевая модель выявления и распознавания технологических ситуаций в рамках методологии Data Mining / А. М. Вульфин, А. И. Фрид // Нейроинформатика-2010. Матер. XII Всерос. науч.-техн. конф. М.: МИФИ, 2010. С. 129-137.
7. Чипига А. Ф., Воронкин Р. А. Обучение искусственных нейронных сетей путем совместного использования методов локальной оптимизации и генетических алгоритмов // Известия ТРТУ. Т. 33. № 4. С. 172-174.
Джуманов Олимжон Исраилович — канд. техн. наук, доцент, зав. кафедрой информационных технологий Саммркандского государственного университета,
e-mail: [email protected].
Дата поступления — 29.10.2015