Научная статья на тему 'Адаптивные алгоритмы контроля погрешностей при обучении нейросетевых систем обработки данных нестационарной природы'

Адаптивные алгоритмы контроля погрешностей при обучении нейросетевых систем обработки данных нестационарной природы Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
98
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОННАЯ СЕТЬ / МИКРООБЪЕКТЫ / РАСПОЗНАВАНИЕ / ПРОГНОЗИРОВАНИЕ / АЛГОРИТМ / ОБУЧЕНИЕ / ПОГРЕШНОСТЬ / АДАПТАЦИЯ / КОНТРОЛЬ / СГЛАЖИВАНИЕ / СПЛАЙН-ФУНКЦИЯ / АДАПТИВНЫЙ ФИЛЬТР / НЕСТАЦИОНАРНЫЙ ПРОЦЕСС

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Джуманов Олимжан Исраилович

Разработаны принципы образования обучающих подмножеств нейросетевой системы адаптивной обработки информации нестационарной природы. Предложены правила и модели оценки погрешностей выходных величин нейронных сетей, разработаны адаптивные алгоритмы контроля данных: по оптимальным границам и приращениям при стационарном процессе; путем линейной фильтрации при квазистационарном процессе; аппроксимацией кубическими базисными сплайн-функциями при нестационарном процессе. Определены оптимальные параметры сглаживания данных обучающего подмножества.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Джуманов Олимжан Исраилович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Адаптивные алгоритмы контроля погрешностей при обучении нейросетевых систем обработки данных нестационарной природы»

УДК 004.032.26

Адаптивные алгоритмы контроля погрешностей при обучении нейросетевых систем обработки данных нестационарной природы

О. И. Джуманов

Самаркандский государственный университет им. А. Навои, 140104, Самарканд, Узбекистан

Разработаны принципы образования обучающих подмножеств нейросетевой системы адаптивной обработки информации нестационарной природы. Предложены правила и модели оценки погрешностей выходных величин нейронных сетей, разработаны адаптивные алгоритмы контроля данных: по оптимальным границам и приращениям при стационарном процессе; путем линейной фильтрации при квазистационарном процессе; аппроксимацией кубическими базисными сплайн-функциями при нестационарном процессе. Определены оптимальные параметры сглаживания данных обучающего подмножества.

Ключевые слова: нейронная сеть, микрообъекты, распознавание, прогнозирование, алгоритм, обучение, погрешность, адаптация, контроль, сглаживание, сплайн-функция, адаптивный фильтр, нестационарный процесс.

The principles of forming training subsets of neuronetworking system for adaptive processing of the information by non-stationary nature are developed. The rules and models for estimation the errors of neural networks target sizes are offered. The adaptive algorithms of the data control are developed: by optimum borders and incrementation at stationary process; by linear filtration at quasi-stationary process; by approximation to cubic basic spline-functions at non-stationary process. The optimum parameters of smoothing the training subset data are determined.

Key words: neural network, microobjects, recognition, forecasting, algorithm, training, inaccuracy, adaptation, monitoring, smoothing, spline-function, adaptive filter, non-stationary process.

1. Постановка задачи. Оптимальное функционирование современных систем управления сложными процессами в существенной степени зависит от качества адаптивной обработки информации нестационарной природы при решении задач распознавания, классификации, кластеризации, анализа и прогнозирования, эффективность которых обеспечивается применением методов и систем интеллектуальных вычислений в рамках концепций Data Mining на основе нейронных сетей (НС), деревьев решений, нечеткой логики, генетических алгоритмов, эволюционного программирования [1, 2]. Однако решения многих научно-технических проблем на основе таких высокоинформативных и перспективных методов находятся на стадии изучения и требуют проведения исследований с целью обоснования их применения для получения новых моделей, разработки методов, алгоритмов и систем интеллектуальной обработки данных нестационарной природы.

Известно, что традиционные, в преобладающих случаях статистические подходы к решению задач распознавания, анализа и прогнозирования, не всегда дают необходимую гибкость, поэтому многие приложения выигрывают от использования НС. Однако, несмотря на простоту применения, существующий математический аппарат НС пока не позволяет получить желаемых результатов. Хотя и разработано большое количество моделей и алгоритмов обучения НС, наиболее уязвимые вопросы, связанные с контролем погрешностей обучения, являющихся определяющими при оценке качества работы нейросетевой системы адаптированной обработки данных, остаются актуальной темой специфических исследований [3, 4].

Применение существующего математического аппарата для обучения НС основано на задании контрольных, тестовых и обучающих выборок эвристическими и интуитивными способами [5, 6]. Однако при таком подходе не применяются механизмы учета изменения статистических и динамических характеристик информации, условий ее передачи и обработки, а также погрешностей работы основных компонентов НС, что, в свою очередь, не позво-

ляет проводить эффективную обработку информации нестационарной природы. Следовательно, в качестве основной меры повышения эффективности формирования обучающего подмножества НС можно принять исследования по созданию способов, алгоритмов и программно-инструментальных средств идентификации и сглаживания с целью минимизации погрешностей обработки информации динамического процесса [7].

2. Методика контроля погрешности обучения на основе модели идентификации и сглаживания данных нестационарной природы. При решении задач идентификации и сглаживания динамического процесса строится идентификационная модель Р , аппроксимирующая параметры объекта Р, для которых задается условие

||У - у|| = ||Р(и) - Р(и)|| <е, и £ и , (1)

при некотором заданном е < 0 и определенной норме Ц. В (1) у = Р(и) - выход идентификационной модели; и - допустимое множество адаптации; Р - оператор, неявно определенный парами сигналов вход-выход {и, у}.

Основным требованием, предъявляемым к качеству идентификации и сглаживания, является обеспечение адекватности представления Р с помощью Р , возможность ее расширения и дополнения, а также возможность использования представленной модели в реальном масштабе времени для обучения НС.

Дискретную идентификационную модель обучающего подмножества НС представим в виде нелинейного уравнения [8]

у(к +1) = Ш(у(к), у(к -1),..., у(к -11), и (к), и(к -1),..., и(к - /2)), где NN(.) - преобразование вход-выход; 11 - глубина задержки обратной связи по выходу; 12 - глубина задержки по входу.

Для решения поставленной задачи контроля погрешности обучающего подмножества НС представляет интерес включение одношаговых и краткосрочных предсказателей случайного процесса. В силу этого модель предсказания выходного вектора сглаживаемого объекта с учетом предыстории на один шаг записывается в виде

у(к +1) = NN (у(к), у(к -1),..., у(к - /,), и( к), и (к -1),..., и(к - 12)), (2)

и по результатам расчета в ней формируются тестовые данные обучающего подмножества НС. Обозначив у(к +1) через функционал ^ (у), выражение оценки качества выхода У идентификатора подсистемы предварительной обработки данных представим в виде:

у = ^ (у) ±аР),

где а в - погрешность получения выходного вектора в виде случайной величины Pj, причем

ав ^ шт. (3)

в}

Будем считать, что условие (3) агрегирует также погрешности при адаптивном подборе активационных функций, моделей коррекции весовых коэффициентов и рациональной архитектуры НС, причем каждый из компонентов НС вносит долю в общую погрешность получения выходной величины СВ . Тогда условием обучения НС на основе предлагаемого механизма идентификации и сглаживания является

||Уобуч ± Ц = аР] ^ ш1п , причем ав] < едоп . (4)

Здесь Уобуч - значения обучающих, т. е. тестовых или контрольных выборок, построенных по традиционному подходу; едоп - допустимая погрешность для оценки качества работы НС.

Следует отметить, что адаптивное обучение НС продолжается до выполнения условия (4), однако его проверка затруднена вследствие большого числа варьируемости а р . В силу этого, в отличие от стратегии проверки условия (4), представляет интерес задача нахождения более гибких границ контроля погрешности выходной величины

НС, в которых бы учитывались погрешности обработки информации как в основных компонентах НС (активиза-торе, преобразователе, адаптере), так и в обучающих подмножествах с учетом результатов идентификации и сглаживания динамического процесса при свойствах стационарности, квазистационарности и нестационарности.

3. Методы контроля погрешностей с учетом условий передачи и обработки информации. Линейная модель предсказания (2) позволяет получить последовательность приращений в значениях случайного временного ряда, соответствующую закону распределения вероятностей исходного процесса. Вместе с тем приращение при стационарном процессе отличается, как правило, небольшими размахами от центра по сравнению с исходным процессом а(/), т. е. быстрые и большие изменения происходят редко. Данные свойства последовательности приращений позволяют предложить алгоритм контроля погрешностей путем установления стабилизирующих границ для контроля случайного процесса, а также фильтрации случайных "всплесков" по граничным значениям стабилизации при формировании результатов для дальнейшей обработки. Такой подход контроля информации используется при решении многих задач управления, например для диагностики надежности производственного оборудования или слежения за технологическими процессами, в которых, как правило, используются приемы статистического контроля по известным статистическим критериям Пирсона, Колмогорова, правилу трех сигм, а также широко применяются методы точечной, интервальной оценки, байесовские решения, границы разрешенных значений и др. Однако данные статистические приемы контроля непрерывной по природе информации, кажущиеся простыми и эффективными, не учитывают условий ввода, передачи и обработки информации и динамику ее изменений при нестационарном поведении процесса и становятся непригодными для эффективного контроля случайных всплесков и исправления обнаруженных ошибок в обучающем подмножестве НС [9, 10]. Использование ней-росетевой системы обработки данных создает дополнительные условия для развития программных методов и адаптивных алгоритмов контроля погрешности сглаженной информации нестационарного процесса. В работе [4] исследована эффективность разработанных адаптивных алгоритмов контроля точности передачи и обработки информации стационарного, кусочно-стационарного и нестационарного процессов по порогам, приращениям, различным моделям предсказания на основе критерия минимальной среднеквадратичной погрешности. В настоящей работе ограничимся представлением результатов решения задачи контроля погрешности НС на основе методов предсказания.

3.1. Контроль погрешности НС на основе методов предсказания ошибок идентификации и сглаживания стационарного процесса. Пусть исходные данные описываются случайным процессом а(/) с двумерной функцией

плотности распределения вероятностей ю(а1,а2,г), математическим ожиданием аа, дисперсией и2а и коэффициентом корреляции Я(т) (т = tк -tk-1 - шаг квантования по времени).

Обозначим через Дак (0 <Дак < В) разность (приращение) ак -ак-1 между к -м и (к -1)-м дискретными уровнями в последовательности исходных данных на входе, через ДД - разность (приращение) /Зк - Рк-Х (0 < Дрк < В) на выходе идентификатора. По оси множества {Дв} установим отрицательную (-Дх) и положительную (Ду) границы контроля, которые разделяют множество приращений {Дв} на разрешенное {Двр} (-Дх < Двр < Ду) и запрещенное {Дв3} (- В < -Дв3 < -Дх , Ду < Дв3 < В) подмножества.

Принцип контроля данных основан на том, что информация ак считается допус- „/ \

На основе предложенного принципа составлен алгоритм контроля информации, в котором недопустимые данные сглаживаются по правилу

тимой, если Двк е{Двр}, и недопустимой, если Дрк е{ДД}.

На рис. 1 показан графически принцип контроля информации по приращениям.

к-2 к-1 к

п

Рис. 1. Принцип контроля информации по приращениям: 1 - допустимые значения информации, 2 - недопустимые значения

Г к =

в, если Дв е {вр}, в если ДД е{в},

где ук - обработанное выходное значение СВ ак, т. е. недопустимая информация сглаживается путем отождествления с предыдущим вк _1 значением исходного процесса.

Вводимый алгоритм контроля информации не позволяет обнаружить ошибки двух родов. Ошибки первого рода возникают, когда искаженное значение в, исходной информации а1 попадает в подмножество {вр} разрешенных значений. Вероятность ошибки первого рода, называемая вероятностью ошибок типа "пропуска ошибок", обозначается через Р1:

Р = Р{а ;Дв* е{Двр}} = Р

Дх +Ду В _5

Ошибки второго рода возникают, когда истинное значение исходной информации а1 находится за пределами подмножества разрешенных значений. Вероятность ошибки второго рода назовем вероятностью ошибок типа "ложной тревоги" и обозначим через Р2:

р2 = Р{а ; Дв* е {Дв,*}} = (1 _ Р)

Ду

1 _ X /(в')

в*, =_Дх

Аналогично рассмотренному алгоритму контроля информации по приращениям построены алгоритмы контроля на основе статистических предсказаний по одной, двум предыдущим точкам на основе алгебраических многочленов, модели Лагранжа и выбора оптимальных предысторий. Особенностью рассмотренных алгоритмов контроля информации с предсказаниями является то, что в них значения недопустимых данных сглаживаются по правилу

Гк ='

\вк, если Дв'к евр}, [вк*, если Двк* е {вз*}.

(5)

Решение задач контроля погрешностей обучения заключается в получении оптимальных границ контроля и оценки минимальной среднеквадратичной ошибки, допускаемых предложенными алгоритмами. В силу этого запишем общее выражение для оценки минимальной среднеквадратичной ошибки:

аи2 = М[0^ _вк)2] = М

^ ^в;ДД*е{ДвР}[(ак вк )2] +

+М а, в ;Дв;е{Дв*,[(ак _ + М а, в к _вкТ].

(6)

Заметим, что первое слагаемое правой части выражения (6) дает оценки погрешностей, обусловленных вероятностью ошибок первого рода, во второй и третьей частях учитываются вероятности ошибок второго рода. Запишем выражение (5) в соответствии с правилами (6):

р в у В (-+»)

а- =

$а(а) в

| (а_а а)2йв + \(а_в)2йв + { (а_аа)2йв

,0(_»)

йа +

+(1 _ Р)

| (а _ аа)2ю(а) йа_| (а _ аа)2 ю(а)йа

где |(а_аа)2ю(а)йа = а2а .

Определение экстремальных значений среднеквадратичной погрешности не представляет особых трудностей:

а- =

ВаН + -Н 3

„ . 4-паН

_2аН 1п--и

Н 1 _ Р

+ (1 _ Р)

а

_ | (а_аи)2^(а)йа

(7)

а

X

0

где стН , ан - обозначения дисперсии и математического ожидания при нормальном законе распределения вероятностей.

Используем способ вычисления интеграла вида

ан + У

/1 = 1" (а-ан)2 * е-(а-ан)2/2-н¿а. (8)

аН-х -41Ж7Н

При t = (а-ан)/\/2стн с1а = \12анЖ, а нижний и верхний пределы интеграла соответственно равны

0 0

х У t =--• t =_-_.

Теперь для вычисления интеграла (8) используем функцию аппроксимации Лапласа и получим

II - 1п

2СТ , \[лстн ( 42лоН л \¡2ли ^

4П V 1 - Р

1 - - 1п_

н

V 1 - Р 1 - Р

V у

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Подставив значение интеграла (8) в выражение (7) и проведя несложные преобразования, определим минимальное значение среднеквадратичной погрешности алгоритма.

При частном решении задач рассмотрены различные законы распределения вероятностей данных. В качестве примера приведем полученные оптимальные границы контроля при нормальном законе распределения:

_ 1

кУ=±2„; ¡-ц - В(г>]1п^Д>К}„)

где а'н - погрешность предсказания; В(т) - автокорреляционная функция предсказываемой последовательности; т - предыстория предсказания.

Подставляя значение границ контроля (9) в исходное выражение (6), находим экстремальное значение погрешности:

СТ = 2[1 -ВТСТ }1 + ^-

>п(1 - В(т))стн + 1^4п(1 - В(т))стн -1

1 - Р 1 - Р

На основе изложенной методики проанализирована эффективность алгоритмов также при логнормальном, экспоненциальном законах распределений и законах Вейбула и Рэлея, в результате чего получены трансцендентные уравнения и сложные выражения, требующие привлечения численных методов решений.

4. Снижение погрешностей контроля информации квазистационарного процесса. Представим результаты решений задач по оценке погрешностей алгоритмов контроля информации квазистационарного процесса на основе применения адаптивного сглаживающего фильтра, расчета границ контроля информации и минимальной среднеквадратичной погрешности.

4.1. Модель сглаживания на основе адаптивного фильтра. Поведение квазистационарных временных рядов представляется в виде х = х±е, где х = (х1,...,хп) - измеренные с некоторой случайной ошибкой значения наблюдаемых данных в равномерные отсчеты времени; х = (х1,..., хп) - реальные данные, подлежащие передаче, восстановлению и сглаживанию; е = (еи..., еп) - аддитивные несмещенные случайные ошибки, т. е. измеренный шум, в результате которого происходит частичная потеря информации. Вследствие этого наряду с выбором моделей для качественного сглаживания возникают задачи контроля погрешности сглаженных временных рядов с целью уменьшения среднеквадратичной погрешности алгоритма обучения НС.

Будем считать, что сглаживающий фильтр РЛ [ х ] строит временной ряд, который является наиболее гладким среди всех временных рядов, находящихся в некоторой заданной окрестности наблюдаемого ряда х. Величина окрестности, а следовательно, степень сглаживания, регулируются параметром Л = (-да, да). При Л — -да временной ряд РЛ [х] стремится к х, а при Л — да этот ряд РЛ [х] превращается в сильно сглаженный тренд. На практике диапазон изменения параметра X выбирается экспериментальным путем.

Для решения задачи зададим убывающую последовательность чисел Л0,Л1,Л2,... по формулеЛк =Я0 -АЛ к (к = 0,1,2,..., Я0 - достаточно большое число, АЛ - небольшой шаг (например, Я0 = 20, АЯ = 0,5)). Обозначим через хк = РЛ [х] (к = 0,1,2,..., РЛ [х] - сглаживающий фильтр). Заметим, что сглаживающий фильтр контролирует погрешность влияния шума или ошибок в информации в виде величины разброса шума ||е||, которая задается

заранее или вычисляется на основе методики, полученной в [8] с учетом параметров контролируемой информации и свойств динамического процесса. Процесс контроля считается удовлетворительным, когда взаимное отклонение ||х-хк\ достигает заданной величины разброса. Однако на практике информацию подобного рода трудно получить для нестационарных временных рядов, поэтому в работе [8] предлагается использовать методику исследований оптимальных границ контроля, минимизирующих среднеквадратичную погрешность, в которых учитываются вероятность ошибок, точность измерения параметров, а также статистические и динамические характеристики информации. В связи с этим разработан другой способ оптимизации процессов контроля случайных всплесков во временном ряду, основанный, главным образом, на учете высокочастотности шума, т. е. изменении направления шума в среднем каждые 2-3 отсчета времени. При данном способе влияние шума, даже при его небольших относительных погрешностях, легко обнаружить по большому количеству точек перегиба у наблюдаемого временного ряда. Поэтому процесс последовательного сглаживания можно остановить, когда количество точек перегиба вре-

к о

менного ряда х достигнет величины, соответствующей одной точке на каждые 3 отсчета, т. е. когда

К(хк) > П

(К(хк) - количество точек перегиба временного ряда хк).

Численные эксперименты показали хорошую практическую обоснованность предлагаемого способа сглаживания. Соотношение К (хк) > З служит условием определения начала лавинообразного роста точек перегиба и

адаптации границ контроля точности информации.

4.2. Результаты экспериментов. Обозначим через р номер шага, на котором процесс последовательного

сглаживания остановлен, т. е. временной ряд хр становится приближенной оценкой истинного ряда х. На рис. 2 приведены примеры графического анализа результатов проведенных экспериментальных исследований для двух характерных ситуаций сглаживаемого процесса. Аналогичным образом можно проиллюстрировать промежуточные результаты, когда:

а б

Рис. 2. Метод избавления от шума (п = 120): а - х0 и х , (х - исходная кривая, х0 - сглаженная кривая (х0 = РЛ [х]) имеет 3 точки перегиба);

б -х37 и х К(х37) = 47 (остановка - обнаружено влияние шума: К(х37) >п/3, кривая х37 принимается

как очищенный от шума сигнал)

- х24 и х К (х24) = 7 ; кривая х24 имеет 7 точек перегиба, степень сглаживания все еще велика, пики не достигаются;

34 ~ тт- / 34 \ л 34

- х их К(х ) = 9; кривая х - наилучшая оценка, но это трудно распознать, не располагая истинным сигналом х ;

34

- та же кривая х , но в сравнении с истинным сигналом х.

В качестве модели поведения динамического временного ряда используем характерную для исследуемых данных затухающую колебательную модель с коэффициентом затухания (вязкости) / и частотой а , описываемую дифференциальным уравнением

2" (Г) + / (Г) +а 2(0 = 0. (10)

Используя разложение (10), можно моделировать поведение колебательной составляющей хк(к е 1, р), а точнее, его конечно-разностную аппроксимацию

(2,+1 - 2 21 + 2--Х + /(21 - 2(-1) +а2 2, = 0, , = П, П + 1,...,

или в рекуррентной форме

2,+1 = 221 - 2,,! - /(21 - 2,,!) - а 221 = 0, , = п, п + 1,...,

с начальными условиями

2п

Частота колебаний определяется как осредненная частота колебаний составляющей 2к на участке наблюдения, т. е. а = — (г - среднее расстояние между соседними корнями кривой 2к). Коэффициент затухания / выбира-

ется таким образом, чтобы амплитуда колебаний уменьшалась в четыре раза за каждый период: / = а1п4 . Такое

быстрое затухание выбрано потому, что амплитуда колебаний составляющей 2к на участке наблюдения непостоянна, частота колебаний также имеет некоторую изменчивость.

Заметим, что разработанная модель адаптивного сглаживания на основе оптимального фильтра используется при расчете выражения минимальной среднеквадратичной погрешности данных квазистационарного процесса.

Ниже приводятся результаты исследований по решению задач минимизации погрешностей контроля выходного параметра НС при нестационарном процессе на основе сглаживающих сплайн-функций.

5. Снижение погрешностей контроля информации нестационарного процесса на основе сплайн-функций. По способу приближения к динамике нестационарного процесса используются интерполяционные и сглаживающие сплайны, которые по виду представления могут быть полиномиальными или базисными. Построение математических моделей с использованием полиномиальных сплайнов обусловлено решением систем уравнений, и алгоритмы, полученные на их основе, требуют сложных вычислительных процедур. Базисные сплайны являются эффективным средством локального приближения в тех случаях, когда оно строится на фиксированном отрезке и зависит только от значений аппроксимируемой функции на этом отрезке.

5.1. Модель сглаживания на основе базисных сплайн-функций. Важное свойство базисных, т. е. В-сплайнов заключается в том, что величины их носителей подвергаются растяжению при повышении их степени: область ненулевых значений одной базисной функции степени т представляет собой отрезок длиной (т+1) И, где И - шаг между двумя соседними узлами В-сплайна. Другим важным свойством является то, что базисные функции преобразуются друг в друга посредством операции сдвига вдоль оси на целое число шагов. Наиболее простые аналитические выражения В-сплайнов получаются для случаев равномерного задания сеток, причем наиболее распространены базисные сплайны нулевой, первой, второй и третьей степеней. При этом кубические сплайны являются единственной функцией, обладающей свойством минимальной кривизны, среди всех функций, интерполирующих заданные точки и имеющих вторую производную, интегрируемую с квадратом [7].

Для приближения функции /(х) кубические базисные сплайны представляются в виде сумм четырех парных произведений, и формула приближения функции / (х) В-сплайнами записывается в виде суммы

П+1

/ (х) = ^ (х) = £ Ь . (/) Бт, (х).

/=-1

Например, /(х) = £3 (х) = Ь-1В-1 (х) + Ь0В0 (х) + Ь1В1 (х) + Ь2В2 (х), где 8т (х) - сплайн-функция степени т; Ь1 (/) - последовательность линейных функционалов; В/т (х) - текущий В-сплайн степени т.

5.2. Сглаживание на основе кубических базисных сплайнов. На практике для восстановления данных с помощью сплайн-функций используется система кубических базисных сплайнов, состоящая из четырех базисных сплайнов В3-1( х), В30( х), В31( х), В32( х). В интервале [0,1] находится часть значений каждого сплайна, которая будет служить базисом для остальных интервалов.

Задача интерполяции функции / (х) совокупностью базисных сплайнов сводится к отысканию коэффициентов

Ь в формуле

п+1

/ ( х) = 8т ( х) = Х Ь/ ( / ) Вт/ (х), /=-1

принимающих такие значения, чтобы на отрезке [а,Ь] удовлетворялись равенства

1^ЬРт(х) = /(х,). /=0

В свою очередь, нахождение Ь-коэффициентов сводится к решению системы линейных алгебраических уравнений.

Для решения систем алгебраических уравнений с матрицами коэффициентов традиционно применяется метод прогонки, однако решение уравнений с его использованием нельзя считать эффективным, т. к. оно связано с большим объемом вычислений. Наряду с этим можно находить коэффициенты аппроксимации В-сплайнами по методу наименьших квадратов. В этом случае необходимо составить и решить квазидиагональную систему линейных алгебраических уравнений вида

Ё(В/,Вк)Ьк = (Вк,/), / = 1,2,...,п,

к=1

где (В1, Вк) (Вк, /) - скалярные произведения. Данная система уравнений применима для определения коэффициентов Ь внутри локальной области, на ее границах и за ее пределами. Для нахождения коэффициентов в близкой окрестности области должна быть использована дополнительная информация, которую можно извлечь с помощью либо расширения сетки путем введения дополнительных узлов, либо построения сплайна степени т, интерполирующей значения функции /(х 1) = / в начале и конце отрезка.

5.3. Алгоритмы вычисления коэффициентов систем базисных сплайнов. Разработаны алгоритмы вычисления коэффициентов аппроксимации системами базисных сплайнов, которые не требуют решения систем алгебраических уравнений, т. е. носят явный характер, поэтому необходимый в этих случаях объем вычислений не зависит от числа узлов сетки, а определяется лишь степенью сплайна и получается значительно меньшим, чем при построении интерполяционных сплайнов.

Для сплайнов третьей степени при различном количестве точек предысторий получены сглаживающие формулы вычисления коэффициентов:

- 3-точечная формула

Ь1 = 1(-/,-, + 8/ - /+,), 6

- 5-точечная формула

Ь< = ¿(/-2 -10/-1 + 54/ -10/.+, + /+2),

- 7-точечная формула

Ь' 3 +12/'-2 -75^-1 + 344/ -75/+1 + 12/+2 -/+3).

216

Точечные формулы вычисления коэффициентов могут быть распространены на случаи многомерной аппроксимации. Эти формулы сохраняют свойства гладкости приближений, а значения коэффициентов не зависят от отсчетов в точках, достаточно удаленных от текущей точки, и эффективно используются при сглаживании нестационарного процесса.

5.4. Анализ результатов. Экспериментальное исследование заключается в получении среднеквадратичной ошибки восстановления при различных функциональных зависимостях, характерных для исследуемых экспериментальных данных.

В таблице приведены результаты сравнения возможностей классических полиномов и кубических базисных сплайнов по критерию среднеквадратичной ошибки сглаживания. Установлено, что точность сглаживания базисными сплайнами с использованием точечных формул вычисления коэффициентов зависит от количества точек применяемой формулы: при увеличении количества используемых точек значение ошибки уменьшается, а количество вычислительных операций увеличивается.

Результаты экспериментальных исследований показывают, что при использовании кубических базисных сплайнов для сглаживания данных нестационарного процесса погрешность округления в 1,39 раза меньше, чем при использовании классических полиномов, а их методическая погрешность меньше в 1,8 раза. Время аппроксимации значения функции в одной точке кубическими сплайнами в 2,33 раза меньше, чем время аппроксимации классическими полиномами третьей степени.

В задачах сглаживания нестационарного процесса с сильно меняющейся дисперсией переход к сплайнам приводит к значительному повышению точности результатов, в задачах учета вариации автокорреляционной функции процесса сплайн-методы сокращают вычислительные затраты. В случае если учитываются условия изменения среднего значения, дисперсии и автокорреляционной функции, оба эффекта достигаются одновременно.

6. Реализация результатов теоретических исследований. На рис. 3 представлены зависимости относитель-

а2

ной среднеквадратичной погрешности 2 = —^ алгоритмов контроля информации от вероятности ошибок Р и

В

Показатели Классические полиномы третьей степени Базисные сплайны третьей степени Преимущества базисных сплайнов

Командный цикл Погрешность округления Методическая погрешность приближения Алгоритм вычисления коэффициентов 7 е < 25 - 2-1 "3 е < —тах|/У1(х)| - к4 Требует решения систем уравнений 3 е < 18 - 2-1 е<—тах| / У1( х)| - к4 384 1 1 Не требует решения систем уравнений в 2,33 раза меньше в 1,39 раза меньше в 1,80 раза меньше Не требует решения систем уравнений

относительной дисперсии сН / В случайного процесса, построенные при статистическом предсказании (график С1) стационарного процесса, предсказании на основе сглаживающего фильтра квазистационарного процесса (график С2), предсказании на основе кубических сплайн-функций нестационарного процесса (график С3). Предсказание случайного процесса осуществлялось при различных значениях параметра колоколообразной функции автокорреляции. Для наглядности функция ¥12 показана только для значений параметра 8 / а = 0,7, Р =10-3.

Из рис. 3 следует, что в условиях, близких к практическим, когда сга(1) < 0,1, Р = 3,7 -10-3, точность контроля информации по разработанным алгоритмам нестационарного процесса повышается на два-три порядка.

10"

10 10"

10

10

10

10

Он-О,3 — — 0,7 со Щ

,0,9 0,1^ Яс^/.'

с, ЛОУ^ —

//' А

/у /' У!

о;, в

Рис. 3. Зависимость относительной среднеквадратичной погрешности от вероятности ошибок Р и относительной дисперсии сН / В

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для реализации других теоретических результатов исследований разработаны алгоритмы и нейросетевая система адаптивной обработки данных нестационарной природы, представляемых при решении задач распознавания изображений микрообъектов, анализа и прогнозирования технико-экономических показателей, интерпретации и аппроксимации данных технологических процессов пищевого производства.

При разработке программной системы для создания интерфейса использован объектно-ориентированный язык программирования Delphi 8.0, а для обработки сигналов - специальная среда разработки VisualDSP++, поддерживающая оптимизированные компиляторы С и C++ для цифровых процессоров сигналов. Программный комплекс оформлен в виде единого программного пакета, состоящего из взаимосвязанных программ с определенными параметрами и включает следующие программы: восстановления и сглаживания одномерных данных; оценки погрешности восстановления на основе реализации сплайн-метода; контроля погрешности сглаживания системами базисных сплайнов. Программа оценки погрешности восстановления позволяет вычислить среднеквадратичные ошибки и оценки точности восстановления одномерных экспериментальных данных. В программном комплексе предусмотрено несколько методов обработки сигналов, позволяющих использовать его во многих разделах наук, таких как обработка результатов стендовых испытаний, геофизика, экология, сейсмология, радиолокация, обработка изображений, фильтрация и др.

При установке пакета все программные модули реализуются одновременно. Это позволяет ему быть полноценным продуктом и использовать всевозможные функции комплекса. Программный комплекс ориентирован на использование в компьютерах типа IBM PC, совместимых с операционной системой Windows XP и выше, занимает 731 Кбайт внешней памяти, при загрузке в оперативную память занимает 10 Кбайт.

Список литературы

1. Венкатеш Ганти, Йоханнес Герке, Раджу Рамакришнан. Добыча данных в сверхбольших базах данных // Открытые сис-

темы. 1999. № 9/10. С. 45-53.

2. Джуманов О. И. Адаптивная нейросетевая система визуализации изображений, распознавания и классификации микро-

объектов // Вестн. Сибир. гос. ун-та телекоммуникаций и информатики. 2008. № 2. С. 76-86.

3. Джуманов О. И. Нейросетевая система адаптивной обработки информации нестационарной природы при управлении ву-

зом // Материалы Х Междунар. науч.-метод. конф. вузов и факультетов телекоммуникаций. Ростов-на-Дону, 16-19 июня 2008. Таганрог: изд-во Технология. ин-та Южн. федер. ун-та, 2008. С. 81-85.

4. Джуманов О. И. Основные подходы к созданию интеллектуальной системы адаптивной обработки и анализа информации

для прогнозирования нестационарных процессов // Естественные и техн. науки. 2008. № 3. С. 318-325.

5. Осовский С. Нейронные сети для обработки информации. М.: Финансы и статистика, 2002.

6. Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика / Перев. Ю. А. Зуев, В. А. Точенов. М.: Новые технологии,

1992.

7. Маланин В. В. Методы и практика анализа случайных процессов в динамических системах / В. В. Маланин, И. Е. Полосков.

Москва, Ижевск: НИЦ "Регулярная и хаотическкая динамика", 2005.

8. Djumanov O. System of processing the continuous nature data for forecasting the basic parameters of organizing-technical systems

activity // Proc. of the 4th World Conference on Intelligent Systems for Industrial Automation- WCIS2008, Tashkent (Uzbekistan), 2008, b-Quadrat Verlag-86916 Kaufering. 2008. P. 133-140.

9. Djumanov O. Programmed system for the adaptive monitoring of the continuous nature information on the basis of supervised learn-

ing of neural network // Proc. of the Intern. conf. IT Promotion in Asia, Tashkent (Uzbekistan), 24-26 Sept. 2007. TUIT, Tashkent, Information Technology Internationalization Research Center, 2007. P. 181-190.

10. Djumanov O. The system of image recognition for dynamic processes objects on a basis of neural technologies // Proc. of the 9th Intern. conf. on electronics, information and communication, Tashkent (Uzbekistan), 24-27 June, 2008. Tashkent University of Information Technologies and IEE of Korea, 2008. P. 286-290.

Джуманов Олимжан Исраилович - канд. техн. наук, доц. Самаркандского гос. ун-та;

тел. (8366) 373-2155; e-mail: [email protected].

Дата поступления - 29.10.2009 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.