АЛГОРИТМ ФОРМИРОВАНИЯ ВХОДНОГО ОБРАЗА ПРИ ПРОГНОЗИРОВАНИИ ПОКАЗАТЕЛЕЙ РИСКОВ ДЛЯ СЛОЖНЫХ
ТЕХНИЧЕСКИХ СИСТЕМ
В.Е. Белоусов, заведующий кафедрой, к.т.н., доцент,
Нгуен Вьет Туан, аспирант, Воронежский государственный архитектурно-строительный университет, г. Воронеж А.В. Кочегаров, профессор, д.т.н., доцент, Воронежский институт ГПС МЧС России, г. Воронеж
При решении задачи построения системы комплексного динамического прогнозирования, возникает задача выделения особенностей характера течения некоего социально-экономического процесса. Для обучения нейросети (НС) выбору метода, наиболее эффективного на данном этапе прогнозирования временного ряда, необходимо сформировать некий образ текущего отрезка временного ряда. В настоящее время стандартным подходом при совместном использовании методов распознавания образов и прогнозирования является использование в качестве входного параметра для обоих методов одного и того же набора значений. В прогнозировании временных рядов используется отрезок временного ряда с оптимальным для данного метода прогнозирования количеством отсчетов.
Использование в качестве входного образа метода распознавания того же набора значений, что и для метода прогнозирования, представляется авторам неэффективным. В общем случае, входные значения для разных методов прогнозирования могут иметь значительные различия: по количеству временных отсчетов, по условиям, накладываемым на качество значений величины. Имеется в виду тот факт, что перед использованием некоторых методов, значения временного ряда необходимо подготовить: например, применить сглаживание, избавления от «шума» и т.д.
К методу формирования образа предъявляется ряд требований:
1) Требование полноты. Образ должен нести в закодированном виде информацию о характере течения социально-экономического процесса.
2) Требование чистоты. Образ должен быть максимально возможно «очищен» от информации, характеризующей количественные показатели течения процесса.
3) Требование сжатия. Метод должен преобразовывать любое количество временных отсчетов процесса в образ фиксированного размера.
Требования полноты и чистоты вызваны тем, что НС обучается на основе только информации, получаемой ей из образа. А применимость того или иного механизма прогнозирования (МП) зависит только от характера течения процесса, а не от его абсолютных величин.
Алгоритм основан на методе формирования образа входного ряда для НС, выполняющей роль классификатора входных данных в комплексной
системе прогнозирования [1]. Причем задача классификации прогнозируемого участка временного ряда сводится к задаче распознавания образов. Для двух принципиально разных ситуаций используются модификации одного и того же подхода. В первом случае мы рассматриваем случай, когда исследуемая величина меняется быстро, и прогноз строится на малом количестве входных данных. Эта ситуация близка случаю применения метода Японских свечей. В данном случае преобразование проводится во временной области. Образ будет видоизмененным изображением отрезка самого процесса. Поэтому первый подход обозначим построением временного образа.
Для того чтобы привести одномерный ряд к виду, подходящему для использования системой распознавания образов, основанной на НС, авторы предлагают следующее решение. Ряд последовательных отсчетов преобразуется в 2-мерную матрицу так, как если бы она отображала набор значений, используемый для построения точечного графика в декартовых координатах. Причем, при построении этого графика используются дискретные целочисленные значения. При построении образа применяется так же масштабирование и нормализация входного ряда значений. Поясним описанную технику на примере таблицы 1.
Таблица 1
_Значения исследуемого процесса_
278 296 299 291 269 283 270
1 2 3 4 5 6 7
В данном примере используется 16 значений входного ряда. Для каждых 4 значений были сформированы образы. В графиках образов умышленно опущены шкалы значений, оставлены только линии сетки. Это сделано для иллюстрации нормализации данных и их масштабирования. Различное количество линий сетки по вертикали указывает на то, что изначально диапазоны значений последовательностей были различны. Но так как нас интересует только характер изменения значения, а не его количественная составляющая, то все количественные различия между образами мы убираем. Так же можно заметить, что полученные последовательности начинаются «от нуля», то есть так же убрано и различие сдвига.
При обучении нейронной сети распознаванию образов используется подготовленный описанным способом образ [2], к нему добавляется шум, проводится сопоставление зашумленного сигнала конкретному номеру выхода сети.
В случаях, когда прогнозирование требует анализа большого отрезка значений, а характер изменения процесса достаточно динамичный, набор значений процесса не может быть выбран в качестве образа для распознавания. Другими словами, НС не сможет обучиться распознавать процессы, если характер изменения значения не сможет быть ассоциирован с некоей «картинкой». Тогда необходимо использовать какой-то другой метод, выделяющий закономерности изменения процесса.
Предлагается использовать быстрое преобразование Фурье (БПФ) выборки значений процесса для получения его распознаваемого образа. Полученную спектральную характеристику можно преобразовать в двухмерный образ и масштабировать к размеру, оптимальному для работы НС. Мы нуждаемся в алгоритме, «свертывающем» большой набор значений процесса в набор фиксированного размера, при этом «свертывание» не должно приводить к потере полезной информации о динамике изменения процесса.
Как известно, преобразование Фурье лежит в основе статистического анализа случайных процессов. Получаемый на выходе ПФ образ является ни чем иным как спектром (парой АЧХ и ФЧХ) подаваемого на вход сигнала. Зачастую для анализа статистических свойств стационарных случайных процессов используется спектр мощности (квадрат модуля АЧХ). Одним из важных преимуществ такого математического инструмента как ПФ является математическая реализация БПФ (быстрого преобразования Фурье) и ОБПФ (обратного БПФ), предназначенная для операций с дискретными отсчетами.
Предлагается использовать БПФ в качестве образа, с которым НС сможет ассоциировать оптимальный метод. Результат БПФ дает нам отображение нашей временной последовательности - но в частотную область (табл. 2).
Таблица 2
Значения участков исследуемого процесса (X) и значения БПФ-образов _этих участков (У)_
X У X У
278 2255,50 275,6 2272,60
296 64,67 293,5 50,09
298,8 35,98 299,2 30,07
291,4 18,72 296 15,87
269,2 24,10 277,5 23,20
259,4 18,72 268,6 15,87
269,7 35,98 272,4 30,07
293 64,67 289,8 50,09
После выделения наиболее важной информации, образы четырех существенно различных по форме во временной области отрезков, стали определенно близки. Если же применить дополнительные техники (масштабирование, нормировка, сдвиг по частоте), графики фактически будут образовывать похожие фигуры и сформируют отдельную область компетенции того или иного МП. Так как исследуемый нами процесс - это синусоида, умышленно видоизмененная в незначительной степени, то на всем участке анализ этой величины должен максимально эффективно производиться каким-то одним из принципиально разных методов прогнозирования, подключенных в комплексную систему. Это значит, что образы должны быть близкими. При обработке этих же временных последовательностей во временной области, мы
получали существенно различные изображения, тогда как частотный подход дал более верный результат.
После вычисления абсолютной величины значений полученного комплексного ряда, мы получаем набор значений, характеризующих статистические свойства ряда. Если в поведении ряда можно выявить закономерности, то они проявятся при таком переходе. Полученный образ будет обладать гораздо большей стабильностью, нежели просто отрезок временного ряда. Согласно обоснованию БПФ, наборы значений БПФ и исходных значений могут быть однозначно получены друг из друга. Значит, применение БПФ удовлетворяет требованию однозначности. Таким образом, можно использовать только АЧХ, так как для финансовых рядов фазовая составляющая не несет информации об основных элементах характера изменения процесса.
Нормирование. После получения спектральной характеристики некой выборки, мы преобразовываем ее к виду 2-мерной матрицы, самой близкой аналогией которой может служить матрица для вывода графика спектра на экран компьютера. График имеет фиксированное количество ячеек по ширине и высоте. Если ячейка содержит точку - значение матрицы 1, иначе - 0. Выделение главных компонент. После получения АЧХ, мы избавляемся от шумовых составляющих, убирая слабые гармоники стандартным фильтрованием. Масштабирование. После очистки от шума, из изображения убирается «пустая рамка». Имеется в виду, что сохраняется только та часть изображения, которая не имеет полностью нулевых строк или столбцов, примыкающих к краю. После этого символ масштабируется к общему размеру, отвечающему требованиям НС.
При нормировании и масштабировании возможны достаточно большие искажения. Это означает потерю части информации. Авторы считают это допустимым, поскольку: одинаковому преобразованию будут подвержены все образы, при настройке НС используется метод обучения на зашумленных образах (что вызывает искажения того же рода).
При масштабировании возникает так же искажение сдвига по частотной шкале. Такой сдвиг аналогичен «сжатию/растяжению» исходного процесса во времени. Форма сигнала при этом не меняется. Возникающее сжатие и растяжение в вертикальной плоскости аналогично такому же изменению исходного сигнала, что так же не меняет принципиального характера его изменения. А значит, не повлияет на результат выбора подходящего метода прогнозирования. Для проверки теоретических рассуждений были проведены проверки на различных данных.
Анализируя результат работы методов можно сделать вывод, что для анализа медленно меняющихся трендов временной анализ подходит гораздо лучше. Однако в каждом отдельном случае преимущества и недостатки каждого из подходов необходимо рассматривать индивидуально.
В данной статье описаны алгоритмы формирования входного образа для системы распознавания, входящей в комплексную систему прогнозирования. К
методу формирования образа предъявляются требования, исходя из потребностей комплексной системы. Разработанный алгоритм отвечает требованиям, предъявленным к методу формирования образа для обучения системы комплексного динамического прогнозирования.
Список использованной литературы
1. Белоусов В.Е. Прогнозирование контингента аспирантов с использованием многокритериального анализа временных рядов /Белоусов В.Е., Крахт Л.Н.// Управление в организационных системах РОССИЯ, Воронеж, май 2009, Изд-во ВГУ, 2009 - С. 140-144.
2. Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов и прогнозирование. - М.: Финансы и статистика, 2001.
ВЫЯВЛЕНИЕ ИСТОЧНИКОВ ФОРМИРОВАНИЯ ЭКОЛОГИЧЕСКОЙ ОПАСНОСТИ С ИСПОЛЬЗОВАНИЕМ ГЕОИНФОРМАЦИОННЫХ
СИСТЕМ
С.А. Вамболь, заведующий кафедрой, д.т.н., профессор, Национальный университет гражданской защиты Украины,
г. Харьков
В.В. Вамболь, доцент, к.т.н., доцент, Национальный аэрокосмический университет им. Н.Е. Жуковского,
г. Харьков С.С. Зинченко, магистр, Казанский государственный энергетический университет,
г. Казань
Несанкционированные полигоны и свалки создают значительную нагрузку на окружающую природную среду [1]. Отходы, накопленные на стихийных свалках, являются источниками формирования экологической опасности. Одним из основных принципов государственной политики в сфере обращения с отходами (ст. 5 [2]) является приоритетная защита окружающей среды и здоровья человека от негативного воздействия отходов.
На сегодняшний день в стране существует огромное количество населенных пунктов (особенно в сельской местности), где образуются нелегальные свалки, ввиду безответственного отношения жителей и отсутствия средств для ликвидации свалок отходов. Сложность работ по выявлению мест несанкционированного скопления отходов и идентификации источников формирования экологической опасности объясняется их многочисленностью при малой площади, пространственным и временным распределением. Как правило, обнаружение подобных мест скопления отходов происходит случайно либо при специальном обходе (объезде) определенной территории [3-5], что