Научная статья на тему 'Формирование нечёткой нейросетевой модели "условий существования" внутрироссийских магистральных авиалиний'

Формирование нечёткой нейросетевой модели "условий существования" внутрироссийских магистральных авиалиний Текст научной статьи по специальности «Математика»

CC BY
131
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕТЬ АВИАЛИНИЙ / УСЛОВИЯ СУЩЕСТВОВАНИЯ / ПРЯМОЕ СООБЩЕНИЕ / НЕЧЕТКОЕ МОДЕЛИРОВАНИЕ

Аннотация научной статьи по математике, автор научной работы — Балашов Виктор Васильевич, Смирнов Андрей Валентинович, Цейтлина Татьяна Олеговна

Рассмотрены принципы формирования нечёткой нейросетевой модели "условий существования" авиалиний – правил, в соответствии с которыми происходит появление, существование и исчезновение внутрироссийских магистральных авиалиний.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

BUILDING OF THE FUZZY NEURAL NETWORK-BASED MODEL OF “EXISTENCE CONDITIONS” FOR RUSSIA’S DOMESTIC TRUNK AIR ROUTES

Considered in this paper are principles of building a fuzzy neural network-based model of “existence conditions” for air routes, i.e. rules underlying emergence, existence and elimination of Russia’s domestic trunk air routes.

Текст научной работы на тему «Формирование нечёткой нейросетевой модели "условий существования" внутрироссийских магистральных авиалиний»

УДК 656.7

ФОРМИРОВАНИЕ НЕЧЁТКОЙ НЕЙРОСЕТЕВОЙ МОДЕЛИ "УСЛОВИЙ СУЩЕСТВОВАНИЯ" ВНУТРИРОССИЙСКИХ МАГИСТРАЛЬНЫХ АВИАЛИНИЙ

В.В. БАЛАШОВ, А.В. СМИРНОВ, Т.О. ЦЕЙТЛИНА

Статья представлена доктором экономических наук, профессором Артамоновым Б.В.

Рассмотрены принципы формирования нечёткой нейросетевой модели "условий существования" авиалиний -правил, в соответствии с которыми происходит появление, существование и исчезновение внутрироссийских магистральных авиалиний.

Ключевые слова: сеть авиалиний, условия существования, прямое сообщение, нечеткое моделирование.

Основным направлением стратегии развития транспорта в России является обеспечение доступности транспортных услуг для населения страны. Исследование тенденций развития пассажирских авиаперевозок является актуальной задачей для формирования стратегии развития авиационной отрасли. Объёмы авиаперевозок определяют потребности авиакомпаний в поставках воздушных судов (ВС) различного типа. Модели, используемые для оценки потребного в будущем количества ВС, должны опираться на прогнозные значения показателей авиаперевозок в заданном сегменте рынка ВС. При прогнозировании структуры перспективного парка ВС следует ориентироваться на уровни пассажиропотоков на отдельных авиалиниях. Такой подход используется в последних прогнозах специалистов Boeing и Airbus. В традиционно используемых методах прогнозирования рассматриваются пассажиропотоки на заданной (как правило, реально существующей) сети авиалиний. Для развивающихся (таких, как российский) рынков пассажирских авиаперевозок чрезвычайно важно учитывать изменения, происходящие в топологии сети авиалиний. Решение этой задачи позволит дать ответ на вопрос о том, какие пары городов в будущем будут связаны прямым авиасообщением (авиалинией). При этом могут не рассматриваться предполагаемые уровни пассажиропотоков на авиалиниях, а лишь решаться вопрос о существовании либо отсутствии этих авиалиний.

Модель развития авиатранспортной сети должна включать в свой состав статистическую гипотезу - "условия существования" авиалиний (УСА) - правила, в соответствии с которыми происходит появление, существование и исчезновение авиалиний, связывающих между собой города/аэропорты. Возможность создания информационной модели универсальных УСА базируется на предположении, что факт существования или отсутствия авиалинии определяется с большой долей вероятности влиянием ограниченного количества измеряемых параметров. Предпосылками для разработки такой модели являются: наличие и достаточная доступность большого числа параметров, характеризующих процессы, происходящие как внутри авиатранспортной системы, так и во внешней среде; высокий уровень современных информационных технологий; наличие высокоэффективных методов обработки данных.

Задача формирования модели УСА характеризуется рядом аспектов неопределённости, в том числе - неопределенностью правил, в соответствии с которыми делается вывод о существовании или отсутствии прямого авиасообщения между данными городами. Это определяет целесообразность использования технологии нечёткого моделирования [1], которая ориентирована на работу в условиях неопределённости. Модели систем, анализ которых базируется на положениях теории нечётких множеств и нечёткой логики, называют нечёткими моделями. Нечёткие модели удобно представлять в виде нечётких сетей. Основу технологии нечёткого моделирования составляет система нечёткого вывода. Неопределённость правил (УСА) делает не-

возможным непосредственное применение процедур системы нечёткого вывода. Создание этого набора правил осуществляется на основе имеющихся исходных данных в процессе генерации структуры и обучения нейронной сети (НС) в рамках адаптивной системы нейро-нечёткого вывода [2]. На вход НС подаётся набор исходных данных, на выходе сети формируется ответ, должна ли существовать прямая авиасвязь между двумя городами при этих входных данных. Подходы к исследованию сложных систем на основе нечётких и нейросетевых моделей взаимно дополняют друг друга, поэтому целесообразна их интеграция на основе принципа "мягких" вычислений (Soft Calculation). Нечёткие продукционные модели являются наиболее общим видом нечётких моделей, используемых для описания, анализа и моделирования сложных слабо формализуемых систем и процессов [1]. В настоящей работе проектирование системы нечёткого вывода (Fuzzy Inference System - FIS) осуществляется с помощью графических средств, входящих в состав пакета Fuzzy Logic Toolbox вычислительной среды MatLab фирмы Math Works Inc [3].

Важнейшим этапом разработки НС является процесс её обучения. Качество обучения и, следовательно, качество нейросетевой модели определяются информативностью обучающей выборки. Обучающая выборка формируется в результате целенаправленного отбора данных из общей совокупности исходных данных. Для формирования обучающей выборки была разработана методика с использованием самоорганизующихся карт Кохонена (далее - сетей Кохонена) [4]. Сеть Кохонена распознаёт кластеры в обучающих данных и относит все данные к тем или иным кластерам. Априори невозможно установить, какие из измеряемых параметров являются наиболее значимыми при формировании УСА. Для этого необходимо проведение численных экспериментов и анализ их результатов. Предполагается, что существование авиалинии определяется тремя группами параметров, характеризующих каждый из пары городов и саму транспортную связь. Параметры, характеризующие каждый город, можно разделить на две группы, характеризующие город (с прилегающей к нему территорией) как "центр спроса" и как "цель поездки". Каждая поездка авиапассажира осуществляется под воздействием некоторого "главного фактора". Предполагается, что основным фактором, определяющим направление пассажиропотока, является "цель поездки".

Для описания системы авиасвязей между городами, существующей в определённый момент времени, удобно использовать OD-матрицу ||A|| (origin/destination - отправитель/получатель). Матрица является квадратной размера n х n, где n - число городов в рассматриваемой сети авиалиний. Строки матрицы i = 1, 2, ..., n соответствуют пунктам вылета ВС, столбцы матрицы j = 1, 2, ..., n - пунктам прилёта. Слева от диагонали матрицы расположены ячейки ij, соответствующие полётам "туда" (из i-го пункта вылета в j-й пункт прилёта). Справа от диагонали расположены ячейки ji, соответствующие полётам "обратно" (из j-го пункта вылета в i-й пункт прилёта). Каждая ячейка матрицы (за исключением диагональных ячеек) соответствует потенциальной авиалинии. Для подавляющей части OD-пар прямое авиасообщение между городами отсутствует. На основании сравнительного анализа последовательности OD-матриц, построенных на основании расписаний полётов для ряда лет, можно судить о направлениях развития исследуемой сети авиалиний. В процессе моделирования ячейки OD-матрицы заполняются значениями параметров, характеризующих данную транспортную связь: это "генерационные" параметры для пункта отправления, "целевые" параметры для пункта прибытия и параметры самой транспортной связи. В качестве "главного" города в каждой OD-паре выбирается город с более высокими "целевыми" параметрами. В качестве основного "целевого" параметра рассматривается "число мест размещения" (в гостиницах, санаториях и др.), т.е. в качестве "главного" города выбирается город с большим числом мест размещения. При совпадении значений этого показателя для обоих городов в качестве "главного" города принимается город с более высоким статусом. Осуществляется "десимметризация" OD-матрицы: в качестве элементов, заполняющих её ячейки, принимаются "целевые" параметры "главного" города и "генерационные" параметры другого города рассматриваемой OD-пары (с меньшими целевыми возможностями). После "десимметризации" исходная выборка содержит 6963 элемента из 15006, а каж-

дый элемент исходной выборки содержит 8 параметров: класс авиалинии (по типам ВС, принимаемых в аэропортах вылета и прилёта); длина авиалинии, наличие ж/д сообщения между городами вылета и прилёта; валовый региональный продукт субъекта Федерации города вылета; численность населения, отнесённая к городу вылета; число мест размещения, отнесённое к городу прилёта; статус города прилёта; направление авиалинии (по статусам городов вылета и прилёта, Федеральным округам и субъектам Федерации).

Определён рациональный (близкий к оптимальному) состав входных параметров модели УСА. Для понижения размерности задачи был использован генетический алгоритм отбора входных параметров, реализованный в пакете STATISTICA Neural Networks. Цель применения генетического алгоритма - количественная оценка различных вариантов состава входных параметров при формировании модели. Генетический алгоритм применяется после формирования обучающей и тестовой выборок. Он позволяет оценить продуктивность комбинаций параметров и принять к рассмотрению наилучшие.

Рекомендуется [1] создавать нечёткие продукционные модели адаптивными (с коррекцией в процессе и по результатам их функционирования как состава правил в базе, так и параметров функции принадлежности), а также реализовывать различные компоненты этих моделей на основе нейросетевых технологий. Такие сети называются нечеткими нейронными продукционными сетями. Нечёткие сети типа ANFIS (Adaptive Network-based Fuzzy Inference System -адаптивная сетевая нечёткая система вывода) [1; 2] обучаются на основе классических градиентных методов. При создании структуры гибридной системы нечёткого вывода используется процедура субтрактивной кластеризации (Sub. clustering) [3]. Данная процедура позволяет создать достаточно компактную структуру НС, требующую приемлемых вычислительных ресурсов. В результате субтрактивной кластеризации было определено, что оптимальная структура НС включает 6 нейронов в скрытом слое, что соответствует 6 нечётким кластерам.

С использованием разработанной модели УСА проведено моделирование сети внутрирос-сийских магистральных авиалиний для данных 2006 г. Этот год рассматривается потому, что к началу исследований для него имелись необходимые статистические данные. Для обеспечения возможности численной обработки информации о существовании авиалинии в рассмотрение вводится параметр "Авиасвязь в 2006 г." В качестве базы для определения значений этого параметра использовано расписание полётов на внутрироссийских магистральных авиалиниях 2006 г. (рассматриваются 123 города, имеющие аэропорты магистральных авиалиний). В целях "очистки" исходных данных от разного рода "зашумлений" из расписания был исключён ряд авиалиний (и соответственно OD-пар городов): авиалинии, на которых в течение года совершалось менее 12 рейсов (такие авиалинии считаются "эпизодическими"); авиалинии, которые были заявлены в расписании полётов, но полеты, по которым не осуществлялись (согласно данным о числе перевезённых в 2006 г. авиапассажиров, приведенным в сборнике "Информация об объёмах перевозок между пунктами полёта за 2000-2007 гг.", подготовленном ЗАО "Транспортная клиринговая палата"); чисто транзитные авиалинии, которые в течение года существуют только в качестве начального, промежуточного или конечного участка маршрута ВС, но не существуют в виде одноступенчатого маршрута ВС; из рассмотрения исключаются OD-пары городов (потенциальные авиалинии), имеющих низший статус и расположенных в различных Федеральных округах.

Принято, что наличие в расписании полётов авиалинии хотя бы в одном направлении (без обратного) свидетельствует о наличии авиасвязи между данными городами. Для обоих направлений выбирается единое (наибольшее из двух) значение параметра "Авиасвязь в 2006 г." При формальном использовании "целевой" концепции к определению основного направления пассажиропотока из рассмотрения автоматически исключаются некоторые пассажиропотоки, которые в обоих направлениях можно считать равноправными, в частности, авиалинии между Москвой и Санкт-Петербургом, между Москвой и федеральными курортами: Анапа, Гелен-

джик, Сочи. При формировании исходной выборки в указанных случаях учитываются оба направления пассажиропотока ("туда" и "обратно").

При определении параметра "Авиасвязь в 2006 г." учитывается стабильность полётов на данной авиалинии в течение трёх лет - 2005 - 2007 гг. С учётом этих данных формируется функция принадлежности для нечёткого параметра "Авиасвязь в 2006 г.". Рассматриваемая функция принадлежности имеет кусочно-постоянный вид со значениями от 0 до 1. Значения от 0.6 до 1.0 соответствуют "существующим" авиалиниям. Значения 1.0, 0.9 и 0.8 соответствуют авиалиниям, на которых полёты осуществлялись в каждом из рассмотренных трёх лет (с уменьшающейся степенью стабильности полёта), а значение 0.6 - к авиалиниям, на которых полёты осуществлялись лишь в течение двух из трёх рассмотренных лет. Значения функции принадлежности 0.4 и 0.0 соответствуют "несуществующим" авиалиниям: первое - авиалиниям, полёты на которых совершались только в одном из трёх лет, второе - авиалинии, полёты по которым не осуществлялись в течение всех трёх лет. Указанные значения функции принадлежности характеризуют значения параметра "Авиасвязь в 2006 г.", входящего в состав обучающей выборки НС.

На основе расписания полётов 2006 г. с учётом указанных выше изменений формируется ОБ-матрица авиалиний. Города/аэропорты объединяются в соответствии с их принадлежностью к определённому Федеральному округу (ФО). Анализ результатов моделирования сети авиалиний 2006 г. показал, что некоторая часть авиалиний моделируется неоднозначно: для них значение выходного параметра НС близко к 0.5, что не позволяет уверенно отнести эти авиалинии к "существующим" (1) или "отсутствующим" (0). Поэтому в рассмотрение вводится категория "неоднозначно моделируемых" авиалиний, для которых выходной параметр НС находится в диапазоне 0.3 - 0.7. Полученная в результате моделирования (для исходных данных 2006 г.) ОБ-матрица поэлементно (для каждой ОБ-пары) сравнивается с исходной ОБ-матрицей. По результатам этого сравнения выделяется ещё 4 категории авиалиний. Для их обозначения в рассмотрение вводится двузначный индекс, в котором первая цифра относится к существовавшей авиалинии, а вторая - к моделируемой: 11 - авиалиния существует и моделируется; 00 - авиалиния не существует и не моделируется; 10 - авиалиния существует, но не моделируется; 01 -авиалиния не существует, но моделируется. Первые две категории авиалиний соответствуют совпадению результатов моделирования с реальной сетью авиалиний, третья и четвертая категории - свидетельствуют об отличии моделируемой сети от реальной. На рис. 1 представлены результаты моделирования сети авиалиний (для исходных данных 2006 г.) в сравнении с сетью авиалиний 2006 г. В каждой ячейке этой матрицы указаны числа, соответствующие количеству авиалиний, относящихся к соответствующей категории. Категория "-/?" соответствует авиалиниям не рассматриваемым, либо моделируемым неоднозначно. В правой колонке матрицы приведены суммарные данные для городов/аэропортов вылета, расположенных в данном ФО. В нижней строке матрицы - суммарные данные для городов/аэропортов прилёта, расположенных в данном ФО. В правой нижней ячейке матрицы приведены суммарные данные для всех ФО. Диагональные элементы матрицы соответствуют полётам внутри одного ФО, внедиагональные - полётам между различными ФО. Для внутрирегиональных авиалиний Дальневосточного ФО значительная часть (20 из 25) авиалиний 2006 г. не моделируется, что указывает на специфику данного ФО, определяемую его малой населённостью. Для городов/аэропортов вылета, расположенных в Приволжском, Южном и Северо-Кавказском ФО, отсутствуют авиалинии категории 10 (т.е. существовавшие в 2006 г., но немоделируемые), а в Центральном ФО такая авиалиния лишь одна. Это указывает на то, что для перечисленных ФО сформированная модель УСА является адекватной по отношению к реальной ситуации.

Рис. 1. Сравнение результатов моделирования и сети авиалиний 2006 г.

Из общего числа моделируемых авиалиний (6963) неоднозначно моделируются 32% авиалиний. Среди однозначно моделируемых авиалиний правильно моделируются 83% существовавших и 96% отсутствовавших в 2006 г. авиалиний. Таким образом, модель адекватно отображает структуру "коммуникационного ядра" сети магистральных авиалиний России. Под "коммуникационным ядром" понимается часть сети, развиваемая в соответствии с определёнными законами и демонстрирующая устойчивое развитие. "Неосновные" и случайные факторы не

оказывают существенного влияния на развитие "коммуникационного ядра", время их действия ограничено, а распространённость невелика. На авиалинии "коммуникационного ядра" приходится основная часть объёма авиаперевозок. Понятие универсальных (не зависящих явно от времени и конкретной пары городов) УСА корректно применительно к авиалиниям, входящим в состав "коммуникационного ядра". Результаты проведенных исследований могут быть использованы в трёх основных направлениях: прогнозирование развития рынков пассажирских самолётов для решения различных задач экономики авиационной промышленности; прогнозирование экологической обстановки по трассам полётов и в районах аэропортов; разработка системы управления воздушным движением и её элементов.

ЛИТЕРАТУРА

1. Борисов В.В., Круглов В.В., Федулов А.С. Нечёткие модели и сети. - М.: "Горячая линия - Телеком", 2007.

2. Jang, J.-S.R. ANFIS: adaptive-network-based fuzzy inference system // IEEE Transactions on Systems, Man, and Cybernetics. - 1993, Vol. 23, p. 663-685.

3. Леоненков А.В. Нечёткое моделирование в среде MATLAB и fuzzyTECH. - СПб.: "БХВ - Петербург", 2005.

4. Кохонен Т. Самоорганизующиеся карты. - М.: Бином. Лаборатория знаний, 2008.

BUILDING OF THE FUZZY NEURAL NETWORK-BASED MODEL OF "EXISTENCE CONDITIONS" FOR RUSSIA'S DOMESTIC TRUNK AIR ROUTES

Balashov V.V., Smirnov A.V., Tseytlina T.O.

Considered in this paper are principles of building a fuzzy neural network-based model of "existence conditions" for air routes, i.e. rules underlying emergence, existence and elimination of Russia's domestic trunk air routes.

Key words: air route network, existence conditions for air routes, direct link, fuzzy modelling.

Сведения об авторах

Балашов Виктор Васильевич, 1940 г.р., окончил МАИ (1963), кандидат технических наук, доцент, ведущий научный сотрудник НИ0-10 ЦАГИ им. проф. Н.Е. Жуковского, автор более 200 научных работ, область научных интересов - исследование и прогнозирование развития авиационной транспортной системы России и внутрироссийских пассажирских авиаперевозок.

Смирнов Андрей Валентинович, 1961 г.р., окончил МФТИ (1984), кандидат технических наук, доцент, начальник отдела НИ0-10 ЦАГИ им. проф. Н.Е. Жуковского, автор более 150 научных работ, область научных интересов - стратегия развития авиационной отрасли России, исследование и прогнозирование развития авиационной транспортной системы страны.

Цейтлина Татьяна Олеговна, окончила МФТИ (2008), младший научный сотрудник НИ0-10 ЦАГИ им. проф. Н.Е. Жуковского, автор более 50 научных работ, область научных интересов - исследование и прогнозирование развития сети внутрироссийских авиалиний.

i Надоели баннеры? Вы всегда можете отключить рекламу.