Научная статья на тему 'МЕТОД ПРОГНОЗИРОВАНИЯ С ПОМОЩЬЮ УЧЕТА РАЗНОГО РОДА ОДНОРОДНОСТЕЙ НАБЛЮДЕНИЙ'

МЕТОД ПРОГНОЗИРОВАНИЯ С ПОМОЩЬЮ УЧЕТА РАЗНОГО РОДА ОДНОРОДНОСТЕЙ НАБЛЮДЕНИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
53
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОГНОЗИРОВАНИЕ ПОКАЗАТЕЛЕЙ / ТЕНЗОРНАЯ НЕПОЛНОСВЯЗНАЯ НЕЙРОННАЯ СЕТЬ / ПАНЕЛЬНЫЕ ДАННЫЕ / ОШИБКА ПРОГНОЗА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гусев А. Л., Окунев А. А.

В настоящей статье описан авторский метод прогнозирования статистических показателей с помощью тензорных неполносвязных нейронных сетей. Для реализации этого метода описывается необходимая принципиальная структура неполносвязной нейронной сети, учитывающая разного рода однородности наблюдений. На конкретных примерах приведено сравнение результатов прогнозирования статистических показателей с применением и без применения метода сжатия-расширения информационного пространства полносвязными нейронными сетями и результатов полученных методом учета однородностей наблюдений тензорными неполносвязными нейронными сетями. На основании сравнения результатов прогнозирования авторы приходят к выводу о перспективности использования тензорных неполносвязных нейронных сетей для прогнозирования различного рода показателей, случайных величин и переменных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «МЕТОД ПРОГНОЗИРОВАНИЯ С ПОМОЩЬЮ УЧЕТА РАЗНОГО РОДА ОДНОРОДНОСТЕЙ НАБЛЮДЕНИЙ»

финансового инструмента с некой погрешностью. Также трейдеры чаще всего используют данный индикатор для определения линии тренда по тому или иному финансовому инструменту.

Таким образом, анализ и прогнозирование движение ценных бумаг на фондовом рынке открывает большой спектр возможностей для инвестора, как в плане прогнозирования доходности, так и в её увеличении, поэтому владение математическим аппаратом для работы на фондовом рынке открывает новые возможности для бизнеса.

Список использованной литературы:

1. "Теоретические основы анализа фондового рынка: система

показателей и классификации методов" Научный журнал КубГАУ, №129(05), 2017 года. Автор: Малышенко Константин Анатолиевич, к. э. н. доцент кафедры экономики и финансов

2. https://utmagazine.ru/posts/ 1104-matematicheskie-metody-na-fondovom-rynke.html

3. ДИССЕРТАЦИЯ на соискание степени магистра экономики по магистерской программе «Финансовые рынки и финансовый инжиниринг» на тему: «Использование математических методов при анализе, оценке и прогнозировании на финансовом рынке». Автор: Фахретинова Диляра Наилевна

4. "ФАКТОРНАЯ МОДЕЛЬ КАК ИНСТРУМЕНТ ПРОГНОЗИРОВАНИЯ КУРСА ФОНДОВОГО ИНДЕКСА" Научный журнал ФБГОУ ВПО «Норильский индустриальный институт»

5. http://www.grandars.ru/student/statistika/korrelyacionno-regressionnyy-analiz.html

© Бенгина Т.А., Сковородин А.С., 2020

УДК 519.2

Гусев А.Л.

док. тех. наук, профессор ФГБОУ ВО ПГНИУ, г. Пермь, РФ Окунев А.А. аспирант ФГБОУ ВО ПГНИУ, г. Пермь, РФ

МЕТОД ПРОГНОЗИРОВАНИЯ С ПОМОЩЬЮ УЧЕТА РАЗНОГО РОДА ОДНОРОДНОСТЕЙ НАБЛЮДЕНИЙ

Аннотация

В настоящей статье описан авторский метод прогнозирования статистических показателей с помощью тензорных неполносвязных нейронных сетей. Для реализации этого метода описывается необходимая принципиальная структура неполносвязной нейронной сети, учитывающая разного рода однородности наблюдений. На конкретных примерах приведено сравнение результатов прогнозирования статистических показателей с применением и без применения метода сжатия-расширения информационного пространства полносвязными нейронными сетями и результатов полученных методом учета однородностей наблюдений тензорными неполносвязными нейронными сетями. На основании сравнения результатов прогнозирования авторы приходят к выводу о перспективности использования тензорных неполносвязных нейронных сетей для прогнозирования различного рода показателей, случайных величин и переменных.

Ключевые слова:

прогнозирование показателей, тензорная неполносвязная нейронная сеть, панельные данные, ошибка прогноза.

Введение

На практике очень часто приходится прогнозировать одни и те же показатели по различным территориям (объектам). Например, показатели качества среды обитания или показатели здоровья (показатели заболеваемости и показатели смертности) по совокупности территорий, из которых состоит субъект РФ, или по субъектам РФ, которые составляют Российскую Федерацию. При этом показатели (переменные, случайные величины), благодаря которым производится прогноз, называют определяющими показателями, а тот показатель, который прогнозируют, называют прогнозируемым показателем (переменной, фактором, случайной величиной и так далее). Квант времени (год, месяц, день, час и так далее), по которому осуществляется прогноз, определяется предметной областью и существом поставленной задачи. Наблюдение составляют определяющие показатели за квант времени предшествующий кванту времени, за который фиксируется прогнозируемый показатель, и сам прогнозируемый показатель. Такие статистические данные называют панельными данными. Решением подобных задач посвящены работы [1-4], в которых реализуются различные методы.

1. Общая постановка задачи Задача состоит в том, чтобы по наблюдениям за последние кванты времени, по нескольким территориям, суметь спрогнозировать (средняя ошибка прогноза по всем территориям не должна превышать заранее заданного уровня) прогнозируемый показатель по всем территориям на будущий квант времени. Если наблюдения велись по N территориям Т квантов времени, то для обучения нейронной сети имеется п=^Т наблюдений.

При использовании нейросетевых технологий обычно на вход нейронной сети для обучения подают К-мерные вектора (размерность вектора К определяется по количеству определяющих показателей) поочередно по одной из территорий, а на выходе нейронной сети прогнозируемый показатель по этой же территории с лагом в один квант времени. Таким образом, в обучении нейронной сети равноправно участвуют п наблюдений без учета того на какой территории и в какой квант времени было зарегистрировано то или иное наблюдение. То есть используется только одного вида однородность наблюдений - их общая структура. При таком подходе не используются однородность наблюдений по кванту времени и по территории.

Для того чтобы учесть однородность наблюдений по кванту времени или однородность наблюдений по территории, можно использовать тензорные нейронные сети. На входе таких нейронных сетей будут не вектора-наблюдения, а матрицы-наблюдения. Чтобы учесть квант времени, на вход нейронной сети будут подаваться матрицы-наблюдения (всего Т матриц) размером К на N (К определяющих показателей по N территориям). Чтобы учесть принадлежность к территории, на вход нейронной сети будут подаваться матрицы-наблюдения (всего N матриц) размером К на Т (К определяющих показателей по Т квантам времени). Заметим, что структура информации может быть более сложной. Только что был рассмотрен случай «квант времени - территория». Представим, что на каждой территории есть объекты, по которым ведется статистический мониторинг показателей. Тогда такой случай можно обозначить «квант времени -территория - объект». Здесь информация может рассматриваться в виде куба (кубическая) при равном количестве объектов на каждой территории и виде не полного куба в случае разного количества объектов по территориям (неполная кубическая). Метод, который учитывает однородность наблюдений по кванту времени или однородность наблюдений по территории, можно назвать методом учета различного рода однородностей наблюдений при построении нейросетевой прогнозной модели.

2. Структура тензорной неполносвязной нейронной сети Чтобы понимать необходимую структуру нейросети для реализации метода однородностей наблюдений рассмотрим простой пример. Пусть для двух территорий для построения прогнозируемого показателя фиксируются три определяющих показателя Т квантов времени. Чтобы учесть однородность наблюдений по кванту времени, на вход нейронной сети будут подаваться матрицы-наблюдения (всего Т матриц) размером 2 на 3 (3 определяющих показателя по 2 территориям). Такие матрицы можно анализировать тремя блоками тензорной неполносвязной нейронной сети.

Первый блок будет снимать «слепок» с каждой территории. У этого блока число входов будет равно

числу территорий. Схематично его входы можно изобразить, как показано на рисунке 1. После входа в блок можно использовать скрытые слои с произвольным числом нейронов. Важным для этого блока правильно подобрать число нейронов на последнем скрытом слое - это будет число выходов из первого блока. Если не использовать скрытые слои, то число выходов из блока будет равно числу входов в блок.

Рисунок 1 - Блок 1

Второй блок будет снимать «слепок» с каждого определяющего показателя. У этого блока число входов будет равно числу определяющих показателей. Схематично его входы можно изобразить, как показано на рисунке 2. После входа в блок можно использовать скрытые слои с произвольным числом нейронов. Важным для этого блока, как и в первом блоке, правильно подобрать число нейронов на последнем скрытом слое - это будет число выходов из первого блока. Если не использовать скрытые слои, то число выходов из блока будет равно числу входов в блок.

Рисунок 2 - Блок 2

Третий блок будет построен по типу полносвязных нейронных сетей с произвольным числом входов и выходов, а также числом скрытых слоёв и числом нейронов на них. Схематично его входы можно изобразить, как показано на рисунке 3. Если не использовать скрытые слои, то число выходов из блока будет равно числу территорий, умноженному на число определяющих показателей, то есть числу входов в блок.

Рисунок 3 - Блок 3

При необходимости исследователь для решения своей задачи может использовать одновременно все блоки, может отключать любой блок. Таким образом, у исследователя есть возможность использовать следующие комбинации работы блоков: индивидуальные: 1, 2 и 3, по парные: 1-2, 1-3 и 2-3, а также одновременную работу блоков: 1-2-3.

Матрица статистических данных на входе ранее описанной тензорной неполносвязной нейронной сети обрабатывается по схеме согласно рисунке 4.

Рисунок 4 - Схема обработки матрицы статистических данных на входе тензорной

неполносвязной нейронной сети

Четвертый блок (обобщающий блок) будет построен по типу полносвязных нейронных сетей с произвольным числом скрытых слоёв и числом нейронов на них. Число входов у четвертого блока равно сумме выходов с первых трёх блоков, а число выходов равно числу территорий. В виде блоков общая схема ранее описанной тензорной неполносвязной нейронной сети может быть представлена как на рисунке 5.

Рисунок 5 - Общая схема

Таким образом, используя описанную тензорную неполносвязную нейронную сеть, исследователь имеет более вариативные возможности построения прогнозной нейросетевой модели, в отличие от полносвязных нейронных сетей.

3. Сравнение методов прогнозирования на конкретных примерах После создания пробной версии программного продукта нейросимулятора ТННС (тензорная неполносвязная нейронная сеть) было решено проверить её прогностические свойства на конкретных примерах в сравнении с ПНС (полносвязная нейронная сеть) и МСРИП (полносвязная нейронная сеть с применением метода сжатия-расширения информационного пространства) [5]. Для этого из электронного справочника «Регионы России. Социально-экономические показатели» Федеральной службы государственной статистики были выбраны некоторые показатели заболеваемости и показатели, которые, по мнению медицинских работников, могут оказывать существенное влияние на показатели заболеваемости. По 77 регионам России за 2004-2018 годы статистические данные оказались пригодными для дальнейшего анализа (не содержали пропусков). Было решено, что по 2004-2017 годам будут построены прогностические модели ПНС, МСРИП и ТННС. Далее, используя эти модели, нужно было сделать прогноз на 2018 год и сравнить его с реальным значением. Ошибка по территории определялась как отношение

-( " )-

модуля разности между реальным и прогнозным показателем к реальному показателю. Далее умножением этого отношения на 100, получалась ошибка в процентах. Средняя ошибка по 77 территориям - это ошибка метода, которая может выступать мерой сравнения между методами. Учитывая тот факт, что прогностические свойства нейронной сети иногда сильно зависят от конкретного наблюдения, с которого началось обучение, то среднюю ошибку метода рассчитывали как среднее значение ошибки при 10 экспериментах обучения (каждый эксперимент имел равные стартовые условия). Результаты построения прогностических моделей приведены в таблице 1.

Таблица 1

Средняя ошибка методов по результатам 10 экспериментов

Метод Заболеваемость на Врожденные Болезни Болезни Болезни уха Болезни

1000 человек аномалии крови органов дыхания эндокринной системы

ПНС 2,9 55,6 35,7 8,9 8,9 16,9

МСРИП 6,6 44,2 32,1 8,5 8,7 14,6

ТННС 3,4 11,8 13,1 1,9 6,9 11,7

Из шести прогнозов - пять оказались лучшими у метода учёта однородностей наблюдений. То есть ТННС показывают перспективные прогностические свойства. Особенно впечатляет результаты для «Врожденных аномалий» и «Болезней органов дыхания». Важно отметить, что все результаты были получены на одних и тех же статистических данных, причем среднее квадратическое отклонение ошибки у ТННС было меньше, чем у ПНС и МСРИП.

Заключение

В статье приведено описание метода учета разного рода однородностей наблюдений с помощью ТННС при прогнозе. Изначально этот метод разрабатывался для панельных данных. Однако этот метод может иметь более широкое применение. Например, если имеется временной ряд определяющих показателей и прогнозируемого показателя, который фиксирует состояния процесса или явления в последовательные кванты времени, то из этого временного ряда можно легко получить «панельные» данные путем их объединения по несколько штук. Допустим, что наблюдается явление с фиксацией его состояний: А1, А2,...,Ак. Каждое состояние - это определяющие показатели и прогнозируемый показатель. Номер состояния указывает на порядковый номер появления этого состояния в процессе развития явления. Тогда «панельные» данные могут быть получены путём объединения состояний, например, можно объединять по три состояния. Таким образом, получим следующие матрицы-наблюдения: (А1.А2,А3), (А2,А3,А4), (А3,А4,А5) и так далее. И это не единственный пример для использования метода учёта однородностей наблюдений с помощью ТННС.

Список использованной литературы:

1. Longhi S., Nijkamp P. Forecasting Regional Labor Market Developments under Spatial Heterogeneity and Spatial Correlation // Serie Research Memoranda 0015, VU University Amsterdam, Faculty of Economics, Business Administration and Econometrics. 2006.

2. Badi Batalgi H. Prediction in the Panel Data Model with Spatial Correlation: The Case of Liquor // Syracuse University. Center for Policy Research. 2006.

3. Higgins P., Zha T., Zhong K., Forecasting China's Economic Growth and Inflation // NBER Working Paper No. 22402.2016.

4. Patuelli R., Reggiani A., Nijkamp P., Blien U. New Neural Network Methods for Forecasting Regional Employment: Analysis of German Labour Markets // Tinbergen Institute Discussion Paper, TI 2006-020/3. 2006.

5. Gusev A. L., Okunev A. A. Forecasting with Incomplete Set of Factors Determining the Predicted Factor. Neural Network Error Extrapolation Method // International Journal of Applied Mathematics and Statistics. - 2017. - Vol. 56, №5. - Р.48-52.

© Гусев А.Л., Окунев А.А., 2020

i Надоели баннеры? Вы всегда можете отключить рекламу.