Научная статья на тему 'Методика прогнозирования изменения состава парка воздушных судов авиации общего назначения России'

Методика прогнозирования изменения состава парка воздушных судов авиации общего назначения России Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
95
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЫБОРКА ПРЕДИКТОРОВ / МЕТОД ЭКСПЕРТНЫХ ОЦЕНОК / JUDGEMENT METHOD / КОРРЕЛЯЦИОННЫЙ АНАЛИЗ / CORRELATION ANALYSIS / ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ / РЕГРЕССИОННЫЙ АНАЛИЗ / REGRESSION ANALYSIS / PREDICTOR SAMPLING / ADAPTIVE LINEAR ELEMENT

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Никитенко Дмитрий Олегович

В статье произведено формирование выборки входных данных для разработки прогноза изменения парка воздушных судов авиации общего назначения России. Построен краткосрочный прогноз изменения парка воздушных судов авиации общего назначения России на 2013-2015 годы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE METHODOLOGY OF FORECASTING OF RUSSIA GENERAL-PURPOSE AVIATION AIRCRAFT PARK STRUCTURE CHANGING

In the article the forming of input data sampling for Russia general-purpose aviation aircraft park changing forecast elaboration is carried out. Short-term forecast of Russia general-purpose aviation aircraft park changing for the period from 2013 to 2015 is constructed.

Текст научной работы на тему «Методика прогнозирования изменения состава парка воздушных судов авиации общего назначения России»

УДК 656.7:338; 656.7:658

МЕТОДИКА ПРОГНОЗИРОВАНИЯ ИЗМЕНЕНИЯ СОСТАВА ПАРКА ВОЗДУШНЫХ СУДОВ АВИАЦИИ ОБЩЕГО НАЗНАЧЕНИЯ РОССИИ

Д.О. Никитенко

Санкт-Петербургский государственный университет гражданской авиации

В статье произведено формирование выборки входных данных для разработки прогноза изменения парка воздушных судов авиации общего назначения России. Построен краткосрочный прогноз изменения парка воздушных судов авиации общего назначения России на 2013-2015 годы.

Ключевые слова: выборка предикторов, метод экспертных оценок, корреляционный анализ, искусственные нейронные сети, регрессионный анализ.

О ПРОБЛЕМЕ АВИАЦИИ ОБЩЕГО НАЗНАЧЕНИЯ РОССИИ

Авиация общего назначения (АОН) -интереснейший и перспективный сектор гражданской авиации России.

В СССР масштабы развития АОН впечатляли. Однако после распада СССР вся налаженная структура АОН рассыпалась. Сегодня АОН в России зарождается заново, и состояние ее плачевно по сравнению с АОН развитых стран Запада. Потенциал АОН как транспортной системы для России огромен в силу огромной площади страны и наличия большого количества труднодоступных регионов.

Прогнозирование развития АОН в России - сложнейшая проблема, решением которой в настоящее время занимаются лишь заинтересованные данной проблемой единичные специалисты.

Наиболее интересным, с точки зрения авиационной техники, параметром для прогнозирования является парк воздушных судов (ВС) АОН. ФОРМИРОВАНИЕ ВЫБОРКИ ПРЕДИКТОРОВ ПАРКА ВОЗДУШНЫХ СУДОВ АВИАЦИИ ОБЩЕГО НАЗНАЧЕНИЯ РОССИИ

Прогнозирование изменения значений какого-либо параметра может быть осуществлено как по его известным предыдущим значениям (возможности и точность такого прогнозирования ограничены), так и по известным значениям других параметров (независимых переменных),

влияющих на его изменение. Такие параметры называются предикторами [1].

В статье [2] в качестве предикторов изменения парка воздушных судов авиации общего назначения России были использованы экономико-географические показатели (ЭГП) России.

Существует множество ЭГП, однако, степень влияния на парк ВС АОН каждого из них различна. Формирование выборки предикторов, оказывающих наибольшее влияние на изменение парка ВС АОН России - сложная задача. Для ее решения применен метод экспертных оценок.

Для сокращения временных и машинных затрат на проведение экспертного анализа вместо отдельных ЭГП взяты группы ЭГП по направлениям, приведенные в [3, 4], всего 35 групп, в каждую из которых входит до ста ЭГП.

Экспертный опрос проведен с использованием метода непосредственной оценки по интервальной шкале. Количество экспертов составило 12 человек, представителей различных уровней и отделов управления сферы АОН.

При обработке результатов опроса использованы методы математической статистики.

Чтобы определить, насколько та или иная группа показателей важна (существенна) с точки зрения степени влияния на изменения парка воздушных судов авиации общего назначения России, необходимо рассчитать вес каждого фактора [5].

Один из методов определения весов состоит в следующем.

Пусть Ху - оценка фактора г, даннаяу-

ым экспертом, г = 1, п, у = 1, то , п - число сравниваемых объектов, т - число экспертов. Тогда вес г-го объекта, подсчитанный

по оценкам всех экспертов (и^), равен:

Ет

w

1=1

w. =

г, 3

г = 1, п,

т

(1)

где - вес г-го объекта, подсчитанный по оценкам у-го эксперта, равен:

х, .

, г = 1, п, у = 1, т.

=

I

г, 3

п

г =1 Х, 3

Результаты расчета по формуле (1) с максимальными значениями приведены в табл. 1.

Таблица 1

Веса групп факторов по оценкам всех

Веса групп факторов

Группа ЭГП Wi

Уровень жизни 0,07

Финансы 0,06

Для формирования обобщенной оценки группы экспертов чаще всего используются средние величины. Например, точечная оценка для группы экспертов, вычисляемая как среднее арифметическое [5]:

Х, = 1

Ет

х3 _

3=1 3 • 1

3 = 1, т,

т

(2)

где ху - оценка у-го эксперта; т - число экспертов.

Результаты расчета по формуле (2) с максимальными значениями приведены в табл. 2.

Таблица 2 Среднее арифметическое по оценкам

Среднее арифметическое оценок экс-

пертов

Группа ЭГП Хэ

Уровень жизни 7,59

Финансы 7,55

Т.к. в опросе участвовал не один эксперт, расхождения в их оценках неизбежны, однако величина этого расхождения имеет важное значение. Групповая оценка может считаться достаточно надежной только при условии хорошей согласованности ответов отдельных специалистов.

Для анализа разброса и согласованности оценок применяются статистические характеристики - меры разброса [5].

Вариационный размах(К):

К = Хшах — Хшп, (3)

где Хшах - максимальная оценка объекта; хшт - минимальная оценка объекта.

Результаты расчета по формуле (3) приведены в табл. 3.

Среднеквадратическое отклонение (СКО)— это мера того, насколько широко разбросаны точки данных относительно их среднего [6].

Среднеквадратическое отклонении евычисляется по формуле:

а =

I ■ Х -х, у

т -1

(4)

где ху - оценка, данная у -ым экспертом;

т - количество экспертов.

Результаты расчета по формуле (4) приведены в табл. 3.

Коэффициент вариации — мера относительного разброса случайной величины; показывает, какую долю среднего значения этой величины составляет её средний разброс [7].

Коэффициент вариации (V), обычно выражается в процентах и вычисляется по формуле:

V = а • 100%, х„

(5)

Результаты расчета по формуле (5) приведены в табл. 3.

Таблица 3

Результаты расчета вариационного размаха, среднеквадратического отклонения _и коэффициента вариации_

Результаты анализа экспертного опроса

Группа показателей Вариационный размах СКО результатов Коэффициент вариации

Уровень жизни 9,50 3,08 40,58%

Финансы 8,00 2,49 32,98%

Для проведения расчетов использовалась программа Microsoft Excel 2007.

Из таблиц весов групп факторов по оценкам всех экспертов точечных оценок (средних арифметических) видно, что, по мнению группы экспертов, наибольшее влияние на изменение парка воздушных судов авиации общего назначения России оказывают следующие группы экономико-

географических показателей (предикторов):

— уровень жизни (вес группы 0,07, точечная оценка 7,59);

— финансы (вес группы 0,06, точечная оценка 7,55).

В данных двух группах экономико-географических показателей (предикторов) содержится в сумме 118 предикторов. Поставленная задача формирования выборки групп предикторов развития парка воздушных судов авиации общего назначения России решена, но результат ее решения требует проверки каким-либо другим методом.

Задача такой проверки сводится к определению того, влияют ли предикторы из данной выборки на изменение парка ВС АОН России, и, если влияют, то насколько степень их влияния значительна. Чтобы определить силу статистической взаимосвязи, применен метод корреляционного анализа.

Для успешного применения данного метода требуется сформировать выборку, содержащую, как минимум, 7 значений каждого предиктора и парка воздушных судов авиации общего назначения России по годам. Данному условию удовлетворяют лишь 39 предикторов из 118. Данные по остальным - неполные. Они исключены из

выборки, это один из способов повышения точности дальнейшего расчета.

Статистические данные об изменении парка воздушных судов авиации общего назначения России были любезно предоставлены сотрудниками ФАВТ.

Были получены значения парка за 7 лет. В исследовании используются данные по воздушным судам иностранного производства.

После соблюдения всех условий применения корреляционного анализа и всех условий использования его результатов были однозначно выявлены именно те предикторы, степень влияния которых на изменение парка воздушных судов авиации общего назначения России максимальна, следовательно, их можно использовать для дальнейших расчетов. К ним относятся: среднедушевые денежные доходы населения, покупка товаров и оплата услуг, прирост денег на руках у населения. Все они относятся к группе предикторов под названием «Уровень жизни». Т.о., задача проверки результатов экспертного анализа выполнена успешно, его результаты уточнены, а выборка предикторов изменения парка воздушных судов авиации общего назначения России окончательно сформирована.

АНАЛИЗ ЦЕЛЕСООБРАЗНОСТИ ПРИМЕНЕНИЯ МЕТОДА ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ПРОГНОЗИРОВАНИЯ РАЗВИТИЯ АВИАЦИИ ОБЩЕГО НАЗНАЧЕНИЯ В РОССИИ

Построение прогноза неизвестного значения зависимой переменной по известному значению предиктора может

быть реализовано с использованием различных методов. Новым методом, гибким, современным и нестандартным, является метод искусственных нейронных сетей (ИНС).

Решение задач с использованием метода нейронных сетей состоит из следующих этапов:

1) отбор входных данных;

2) подготовка и нормализация входных данных;

3) экспериментальный подбор структуры сети и параметров обучения;

4) обучение сети;

5) тестирование сети, проверка адекватности обучения;

6) корректировка параметров, окончательное обучение сети;

7) производство результатов обученной сетью [8].

Наиболее простым и информативным методом проверки точности прогноза, по-

строенного с использованием метода ИНС, является построение пробного прогноза за уже прошедший год и сравнение его результатов с известными значениями.

Выборка входных данных для построения пробного прогноза с помощью метода ИНС представляет собой значения парка ВС АОН России иностранного производства и его предикторов (отобранных ранее) за 7 лет, с 2006 по 2012 год. При этом, данные с 2006 по 2011 год являются обучающей выборкой, за 2012 год - тестовой.

Результаты этапа обучения показали высокую точность аппроксимации входных данных методом ИНС (табл. 4).

Точность аппроксимации выходных значений сети после обучения составляет 0,47 % по модулю.

Тестирование показало, что точность обучения нейронной сети в достаточной степени высока (табл. 5).

Таблица 4

Результаты этапа обучения нейронной сети

Год Парк ВС АОН РФ иностранного производства, штук (фактическое значение) Парк ВС АОН РФ иностранного производства, штук (этап обучения ИНС) Относительная ошибка аппроксимации, %

2006 73 73,74 1,01%

2007 157 156,22 0,50%

2008 258 257,79 0,08%

2009 324 326,1 0,65%

2010 387 384,93 0,53%

2011 541 541,34 0,06%

Средняя ошибка аппроксимации - - 0,47%

Таблица 5

Результаты этапа тестирования нейронной сети

Год Парк ВС АОН РФ иностранного производства, штук (фактическое значение) Парк ВС АОН РФ иностранного производства, штук (тестирование ИНС) Относительная ошибка аппроксимации, %

2012 640 630 1,56%

Относительная ошибка аппроксимации выходных значений сети на этапе тестирования составляет 1,56 % по модулю.

Для анализа целесообразности использования нейронных сетей для аппроксимации статистических данных, необходимо провести аналогичную аппроксимацию, но традиционным методом, и сравнить полученные результаты с результатами работы нейронной сети. Для этого применен метод регрессионного анализа.

При проведении регрессионного анализа необходимо выполнить, по крайней мере, четыре следующих этапа:

1) выбрать функцию для построения уравнения регрессии;

2) рассчитать коэффициенты (параметры) уравнения регрессии;

Результаты аппроксимации входных

3) оценить надежность рассчитанных коэффициентов уравнения регрессии;

4) проверить качество уравнения регрессии [9].

Т.к. для исследования используется выборка за 7 лет, с 2006 по 2012 год, целесообразно для построения регрессионной модели использовать лишь измерения с 2006 по 2011 год. Данные за 2012 год используются для проверки точности работы полученной регрессионной модели (уравнения) [10] и ее сравнения с точностью работы примененной нейронной сети (табл. 6).

Точность аппроксимации выходных значений регрессионной модели составляет 7,67 % по модулю.

На этапе предсказания регрессионная модель показала результаты, приведенные в табл. 7.

Таблица 6

Год Парк ВС АОН РФ иностранного производства, штук (фактическое значение) Парк ВС АОН РФ иностранного производства, штук (аппроксимация методом регрессионного анализа) Относительная ошибка аппроксимации, %

2006 73 57,89 20,70%

2007 157 164,56 4,81%

2008 258 275,13 6,64%

2009 324 311,99 3,70%

2010 387 410,89 6,18%

2011 541 519,52 3,97%

Средняя ошибка аппроксимации - - 7,67%

Таблица 7

Результаты предсказания, показанные регрессионной моделью

Год Парк ВС АОН РФ иностранного производства, штук (фактическое значение) Парк ВС АОН РФ иностранного производства, штук (предсказание регрессионной модели) Относительная ошибка аппроксимации, %

2012 640 598 6,56%

Относительная ошибка аппроксимации выходных значений регрессионной модели на этапе предсказания составляет 6,56 % по модулю.

Таким образом, точность аппроксимации нейронной сети (0,47%) выше, чем точность аппроксимации регрессионной модели (7,67%).

При сравнении точности аппроксимации нейронной сети на этапе тестирования (1,56%) с точностью аппроксимации регрессионной модели на этапе предсказания (6,56%) видно, что результаты, показанные нейронной сетью, гораздо более близки к желаемому значению, чем результаты, показанные уравнением регрессии.

Сравнение показало, что целесообразно применять метод ИНС для построения прогноза изменения парка ВС АОН России по причине его более высокой точности аппроксимации входных данных и предсказания изменения зависимой переменной, чем у метода регрессионного анализа. ПОСТРОЕНИЕ ПРОГНОЗА ИЗМЕНЕНИЯ ПАРКА ВОЗДУШНЫХ СУДОВ АВИАЦИИ ОБЩЕГО НАЗНАЧЕНИЯ С ИСПОЛЬЗОВАНИЕМ МЕТОДА ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ

Для построения краткосрочного прогноза изменения парка ВС АОН России необходимо, прежде всего, сформи-

Объективно оценить точность результатов, полученных на этапе производства, можно будет лишь при их срав-

ровать новую выборку предикторов. Для этого, использован метод корреляционного анализа, но используются расширенные допуски на значения коэффициентов корреляции. Для расчетов используется выборка с 2006 по 2012 год.

По результатам корреляционного анализа отобраны следующие предикторы: среднедушевые денежные доходы населения, покупка товаров и оплата услуг, прирост денег на руках у населения, источники средств от приватизации государственного и муниципального имущества, исполнение бюджета Фонда обязательного медицинского страхования Российской Федерации.

В качестве прогнозируемых величин используются: парк самолетов АОН бизнес-класса иностранного производства (КШ), парк легких самолетов АОН иностранного производства (ЫФАА), парк вертолетов АОН иностранного производства с газотурбинными двигателями (NGAHGT), парк вертолетов АОН иностранного производства с поршневыми двигателями (NGAHP).

Для обучения сети используется выборка предикторов и параметров КШ, ШАА, ШАШТ, ^АНР с 2006 по 2012 год. Для построения прогноза - прогнозные значения предикторов с 2013 по 2015 год.

Результаты производства сети приведены в табл. 8.

Таблица 8

нении с реальными данными, пока недоступными.

Результаты производства нейронной сети

Производство

Фактический выход

NBJ NGAA NGAHGT NGAHP

2013 42,52 195,56 171,06 295,97

2014 45,96 232,79 196,13 336,42

2015 49 270,05 219,17 381,11

ЗАКЛЮЧЕНИЕ О ПРОВЕДЕННОМ ИССЛЕДОВАНИИ

По завершении исследования можно заключить, что применение комбинации из двух различных методов позволяет проверить и уточнить состав выборки предикторов. Использование современных принципиально новых методов аппроксимации, таких как метод обратного распространения ошибки (применяется при обучении нейронной сети и заключается в использовании значений ошибок при аппроксимации входных данных для постепенной подстройки сети), дает возможность получить выходные данные более высокой точности, чем при применении традиционных методов аппроксимации, таких как метод регрессионного анализа. Нейросетевая модель лучше адаптируется к каждому отдельному значению зависимой переменной, чем регрессионная модель, которая способна отразить лишь общую тенденцию в значениях зависимой переменной.

ЛИТЕРАТУРА

1. Регрессионный анализ. Сайт"Wikipedia.org" [Электронный ресурс] //URL: http://m.wikipedia.org/wiki/Регpессионный анализ (дата обращения: 09.09.2013).

2. Арасланов С.А. Нетуманные перспективы // Авиация общего назначения. 2010. №7. С. 4-19.

3. Вкладка "Официальная статистика". Сайт "Федеральная служба государственной статистики" [Электронный ресурс]// URL: https://gks.ru (дата обращения: 04.07.2013).

4. Вкладка "Indicators". Сайт "WorldBank" [Электронный ресурс]//ШЬ: http://data.worldbank.org/indicator/all (дата обращения: 04.07.2013).

5. Методы экспертных оценок. Сайт "Emm.ostu.ru" [Электронный ресурсу/URL: http://emm.ostu.ru/lect/lect7.html (дата обращения: 02.05.2013).

6. Функция СТАНДОТКЛОН. Сайт"Office.microsoft. com" [Электронный ресурса/URL: http://office.microsoft. com/ru-ru/excel-

help/HP010062541.aspx?CTT=5&origin=HP010079 190(дата обращения: 03.09.2013).

7. Вариация (Статистика). Сайт "Wikipedia.org" [Электронный ресурс]//ШЬ: http://ru.wikipedia.org/wiki/Вариация_(статистика) (дата обращения: 03.09.2013).

8. Этапы решения задач при помощи искусственных нейронных сетей. Сайт "LiveInternet.ru" [Электронный ресурсу/URL: http://www.liveinternet.ru/users/tsisa/post202199919/ (дата обращения: 09.09.2013).

9. Регрессионный анализ. Сайт"Sde.ru" [Электронный ресурс] // URL: http://www.sde.ru/files/t/Kazakov/Book/section3.pdf (дата обращения: 10.09.2013).

10. Проверка адекватности регрессионной модели. Сайт "Helpstat.ru" [Электронный ресурс]//URL:http://helpstat.ru/2012/01/proverka-adekvsionnoj-modeli/ (дата обращения: 10.09.2013).

Рукопись поступила в редакцию 19.11.13..

THE METHODOLOGY OF FORECASTING OF RUSSIA GENERAL-PURPOSE AVIATION AIRCRAFT

PARK STRUCTURE CHANGING

D. Nikitenko

In the article the forming of input data sampling for Russia general-purpose aviation aircraft park changing forecast elaboration is carried out. Short-term forecast of Russia general-purpose aviation aircraft park changing for the period from 2013 to 2015 is constructed.

Key words: predictor sampling, judgement method, correlation analysis, adaptive linear element, regression anal-

ysis.

i Надоели баннеры? Вы всегда можете отключить рекламу.