УДК 004.855.3
АЛГОРИТМ ФОРМИРОВАНИЯ ВХОДНОГО ОБРАЗА ПРИ ПРОГНОЗИРОВАНИИ ПОКАЗАТЕЛЕЙ СИСТЕМ ОРГАНИЗАЦИОННОГО УПРАВЛЕНИЯ
Э.А. Арутюнян, В.Е. Белоусов, Л.Н. Крахт
В статье описаны алгоритмы формирования входного образа для системы распознавания, входящей в комплексную систему прогнозирования
Ключевые слова: алгоритм, образ, обучение, прогнозирование, эффективность
Введение
При решении задачи построения системы комплексного динамического прогнозирования, возникает задача выделения особенностей характера течения некоего социально-экономического процесса. Для обучения нейросети (НС) выбору метода, наиболее эффективного на данном этапе прогнозирования временного ряда, необходимо сформировать некий образ текущего отрезка временного ряда.
В настоящее время стандартным подходом при совместном использовании методов распознавания образов и прогнозирования является использование в качестве входного параметра для обоих методов одного и того же набора значений.
В прогнозировании временных рядов используется отрезок временного ряда с оптимальным для данного метода прогнозирования количеством отсчетов.
В качестве примера можно привести метод японских свечей, который представляет некий синтез метода прогнозирования и распознавания. После классификации короткого отрезка временного ряда (то есть - распознавания его), эксперт делает некий вывод о следующем значении.
Постановка задачи
Использование в качестве входного образа метода распознавания того же набора значений, что и для метода прогнозирования, представляется авторам неэффективным. В общем случае, входные значения для разных методов прогнозирования могут иметь значительные различия: по количеству временных отсчетов, по условиям, накладываемым на качество значений величины. Имеется в виду тот факт, что перед использованием некоторых методов, значения временного ряда необходимо подготовить: например, применить сглаживание, избавления от "шума", и т.д.
К методу формирования образа предъявляется ряд требований:
Арутюнян Эдуард Артурович - ВГАСУ, аспирант, тел. (4732) 76-40-07
Белоусов Вадим Евгеньевич - ВГАСУ, канд. техн. наук, доцент, тел. (4732) 76-40-07
Крахт Людмила Николаевна - СТИ МИСИС, канд. техн. наук, докторант, тел. 8(920) 202-37-68
1)Требование полноты. Образ должен нести в закодированном виде информацию о характере течения социально-экономического процесса.
2)Требование чистоты. Образ должен быть максимально возможно "очищен" от информации, характеризующей количественные показатели течения процесса.
3) Требование сжатия. Метод должен преобразовывать любое количество временных отсчетов процесса в образ фиксированного размера.
Требования полноты и чистоты вызваны тем, что НС обучается на основе только информации, получаемой ей из образа. А применимость того или иного механизма прогнозирования (МП) зависит только от характера течения процесса, а не от его абсолютных величин.
Требование сжатия связано с тем фактом, что в качестве активного элемента системы используется НС, а число входов сконфигурированной и обученной НС это величина фиксированная. Напротив, число входных отсчетов методов прогнозирования будет зависеть от типа прогноза (долго-, средне- или кратковременный) и характера течения процесса. Значит, метод формирования образа должен преобразовывать произвольный набор значений временных отсчетов в фиксированный по количеству значений набор, представляющий собой образ.
Описание алгоритма
Алгоритм основан на методе формирования образа входного ряда для НС, выполняющей роль классификатора входных данных в комплексной системе прогнозирования. Причем задача классификации прогнозируемого участка временного ряда сводится к задаче распознавания образов.
Для двух принципиально разных ситуаций используются модификации одного и того же подхода.
В первом случае мы рассматриваем случай, когда исследуемая величина меняется быстро, и прогноз строится на малом количестве входных данных. Эта ситуация близка случаю применения метода Японских свечей. В данном случае преобразование проводится во временной области. Образ будет видоизмененным изображением отрезка самого процесса. Поэтому первый подход обозначим построением временного образа.
Для того, чтобы привести одномерный ряд к виду, подходящему для использования системой распознавания образов, основанной на НС, авторы предлагают следующее решение. Ряд последовательных отсчетов преобразуется в 2-мерную матрицу так, как если бы она отображала набор значений, используемый для построения точечного графика в декартовых координатах. Причем, при построении этого графика используются дискретные целочисленные значения. При построении образа применяется так же масштабирование и нормализация входного ряда значений. Поясним описанную технику на примере (табл. 1).
Таблица 1 Значения исследуемого процесса
278 296 299 291 269 283 270
1 2 3 4 5 6 7
310
3Х
20
280
270
260
250
240
Рис. 1. График исследуемого процесса (сверху) и временные образы отдельных участков (снизу)
В данном примере используется 16 значений входного ряда. Для каждых 4 значений были сформированы образы. В графиках образов умышленно опущены шкалы значений, оставлены только линии сетки. Это сделано для иллюстрации нормализации данных и их масштабирования. Различное количество линий сетки по вертикали указывает на то, что изначально диапазоны значений последовательностей были различны. Но так как нас интересует только характер изменения значения, а не его количественная составляющая, то все количественные различия между образами мы убираем. Так же можно заметить, что полученные последовательности начинаются "от нуля", то есть так же убрано и различие сдвига.
При обучении нейронной сети распознаванию образов используется подготовленный описанным способом образ, к нему добавляется шум, проводится сопоставление зашумленного сигнала конкретному номеру выхода сети.
При обучении нейронной сети распознаванию образов используется подготовленный описанным способом образ, к нему добавляется шум, проводится сопоставление зашумленного сигнала конкретному номеру выхода сети. Предполагается,
что предпочтение того или иного метода однозначно связано с некоей "фигурой" на входном образе.
Использование некоего преобразования для формирования образа
В случаях, когда прогнозирование требует анализа большого отрезка значений, а характер изменения процесса достаточно динамичный, набор значений процесса не может быть выбран в качестве образа для распознавания.
Другими словами, НС не сможет обучиться распознавать процессы, если характер изменения значения не сможет быть ассоциирован с некоей "картинкой". Тогда необходимо использовать какой-то другой метод, выделяющий закономерности изменения процесса.
В качестве образа может применяться результат любого из множества преобразований, примерами которых могут служить разложения на функциональные ряды: Тейлора, Вольтерры, Мак-лорена, Лоренца, Фурье и т.д. Основным полезным для нашей задачи свойством функционального преобразования является его устойчивость. То есть, получаемый на выходе преобразования продукт должен отражать только постоянные (характерные именно для данного характера течения процесса) свойства входа.
Как альтернативную возможность авторы рассматривают использование в качестве образов наборов значений различных финансовых показателей. В их числе волатильность, нормальное отклонение и др. С математической точки зрения, все эти производные исходного значения являются однозначным преобразованием наборов данных исследуемого процесса.
Авторы предлагают использовать БПФ выборки значений процесса для получения его распознаваемого образа. Полученную спектральную характеристику можно преобразовать в двухмерный образ и масштабировать к размеру, оптимальному для работы НС.
Мы нуждаемся в алгоритме, "свертывающем" большой набор значений процесса в набор фиксированного размера, при этом "свертывание" не должно приводить к потере полезной информации о динамике изменения процесса. Например, если некоторый индекс рынка формирует производную последовательность значений, при этом последние 10 значений формируются с учетом 100 значений исходного процесса, то можно использовать его как входной сигнал для НС.
Авторы ставят своей целью более детальную проверку это гипотезы на реальных данных и сравнение качества получаемых результатов. В настоящий момент разработка велась с использованием БПФ.
Приближения при формировании образа с использованием БПФ
Как известно, преобразование Фурье лежит в основе статистического анализа случайных процессов. Получаемый на выходе ПФ образ является ни чем иным как спектром (парой АЧХ и ФЧХ) подаваемого на вход сигнала. Зачастую для анализа ста-
тистических свойств стационарных случайных процессов используется спектр мощности (квадрат модуля АЧХ).
Одним из важных преимуществ такого математического инструмента как ПФ является математическая реализация БПФ (быстрого преобразования Фурье) и ОБПФ (обратного БПФ), предназначенная для операций с дискретными отсчетами (а именно с ними как правило и приходится иметь дело исследователю экономических процессов).
Авторы предлагают использовать БПФ в качестве образа, с которым НС сможет ассоциировать оптимальный метод. Результат БПФ дает нам отображение нашей временной последовательности - но в частотную область (табл.2).
Таблица 2
Значения участков исследуемого процесса
(X) и значения БПФ-об разов этих участков (У)
X У X У
278 2255,50 275,6 2272,60
296 64,67 293,5 50,09
298,8 35,98 299,2 30,07
291,4 18,72 296 15,87
269,2 24,10 277,5 23,20
259,4 18,72 268,6 15,87
269,7 35,98 272,4 30,07
293 64,67 289,8 50,09
Рис. 2. График процесса, поделенный на 4 участка (снизу) и графики частотных образов участков процесса (сверху)
Как видно из рис. 2, после выделения наиболее важной информации, образы четырех существенно различных по форме во временной области отрезков, стали определенно близки. Если же применить дополнительные техники (масштабирование, нормировка, сдвиг по частоте), графики фак-
тически будут образовывать похожие фигуры и сформируют отдельную область компетенции того или иного МП.
Так как исследуемый нами процесс - это синусоида, умышленно видоизмененная в незначительной степени, то на всем участке анализ этой величины должен максимально эффективно производиться каким-то одним из принципиально разных методов прогнозирования, подключенных в комплексную систему. Это значит, что образы должны быть близкими. При обработке этих же временных последовательностей во временной области, мы получали существенно различные изображения, тогда как частотный подход дал более верный результат.
После вычисления абсолютной величины значений полученного комплексного ряда, мы получаем набор значений, характеризующих статистические свойства ряда. Если в поведении ряда можно выявить закономерности, то они проявятся при таком переходе. Полученный образ будет обладать гораздо большей стабильностью, нежели просто отрезок временного ряда.
Согласно обоснованию БПФ, наборы значений БПФ и исходных значений могут быть однозначно получены друг из друга. Значит, применение БПФ удовлетворяет требованию однозначности.
Таким образом, можно использовать только АЧХ, так как для финансовых рядов фазовая составляющая не несет информации об основных элементах характера изменения процесса.
Нормирование. После получения спектральной характеристики некой выборки, мы преобразовываем ее к виду 2-мерной матрицы, самой близкой аналогией которой может служить матрица для вывода графика спектра на экран компьютера. График имеет фиксированное количество ячеек по ширине и высоте. Если ячейка содержит точку -значение матрицы 1, иначе - 0.
Для этого использована процедура, аналогичную стандартной при построении графиков: каждое значение мощности нормируется на максимальное, умножается на высоту "окна графика" и приводится к целым числам. После чего создается матрица, каждый из столбцов которой содержит одну единицу на высоте, соответствующей значению целочисленной мощности.
Выделение главных компонент. После получения АЧХ, мы избавляемся от шумовых составляющих, убирая слабые гармоники стандартным фильтрованием.
Масштабирование. После очистки от шума, из изображения убирается "пустая рамка". Имеется в виду, что сохраняется только та часть изображения, которая не имеет полностью нулевых строк или столбцов, примыкающих к краю. После этого символ масштабируется к общему размеру, отвечающему требованиям НС.
При нормировании и масштабировании возможны достаточно большие искажения. Это означает потерю части информации. Авторы считают это допустимым, поскольку
1)одинаковому преобразованию будут подвержены все образы,
2)при настройке НС используется метод обучения на зашумленных образах (что вызывает искажения того же рода).
При масштабировании возникает так же искажение сдвига по частотной шкале. Такой сдвиг аналогичен "сжатию/растяжению" исходного процесса во времени. Форма сигнала при этом не меняется.
Возникающее сжатие и растяжение в вертикальной плоскости аналогично такому же изменению исходного сигнала, что так же не меняет принципиального характера его изменения. А значит, не повлияет на результат выбора подходящего метода прогнозирования.
Для проверки теоретических рассуждений были проведены проверки на различных данных.
Анализируя результат работы методов можно сделать вывод, что для анализа медленно меняющихся трендов временной анализ подходит гораздо лучше. Однако в каждом отдельном случае
преимущества и недостатки каждого из подходов необходимо рассматривать индивидуально.
Заключение
В данной статье описаны алгоритмы формирования входного образа для системы распознавания, входящей в комплексную систему прогнозирования. К методу формирования образа предъявляются требования, исходя из потребностей комплексной системы. Разработанный алгоритм отвечает требованиям, предъявленным к методу формирования образа для обучения системы комплексного динамического прогнозирования.
Литература
1. Белоусов В.Е. Прогнозирование контингента аспирантов с использованием многокритериального анализа временных рядов / В.Е. Белоусов, Л.Н. Крахт // Управление в организационных системах. Воронеж: Изд-во ВГУ, 2009 - С. 140-144.
2.Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов и прогнозирование. - М.: Финансы и статистика, 2001.
Воронежский государственный архитектурно-строительный университет
Старооскольский технологический институт (филиал) ГОУВПО «Московский институт стали и сплавов (государственный технологический университет)»
ALGORITHM OF FORMATION OF THE ENTRANCE IMAGE AT FORECASTING OF INDICATORS OF SYSTEMS OF ORGANIZATIONAL MANAGEMENT
E.A. Arutyunyan, V.E. Belousov, L.N. Kraht
In article algorithms of formation of an entrance image for recognition system, vho-djashchej in complex system of forecasting are described
Key words: algorithm, an image, training, forecasting, efficiency