Научная статья на тему 'Прогнозирование контейнеропотока интермодального оператора с использованием теории нечетких множеств'

Прогнозирование контейнеропотока интермодального оператора с использованием теории нечетких множеств Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
403
136
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОГНОЗУВАННЯ / КОНТЕЙНЕРОПОТОК / іНТЕРМОДАЛЬНИЙ ОПЕРАТОР / ТЕОРіЯ НЕЧіТКИХ МНОЖИН / ПРОГНОЗИРОВАНИЕ / ИНТЕРМОДАЛЬНЫЙ ОПЕРАТОР / ТЕОРИЯ НЕЧЕТКИХ МНОЖЕСТВ / INTERMODAL OPERATOR / THEORY OF FUZZY SETS / FORECASTING / CONTAINER FLOWS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Швец А. В.

В статье поставлена задача прогнозирования контейнеропотока, освоенного интермодальным оператором, для определения в дальнейшем момента времени, когда приобретение новой единицы подвижного состава будет наиболее экономически эффективным. Проведен анализ существующих методов прогнозирования и соответствующего программного обеспечения, а также предложена собственная методика прогнозирования контейнеропотока интермодального оператора, которая использует теорию нечетких множеств и методы нелинейного программирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Швец А. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE PREDICTION OF INTERMODAL CONTAINER TRAFFIC OPERATOR WITH USING THE THEORY OF FUZZY SETS

The task of this article is to make a forecast of the container flow (which is being mastered by intermodal transport operator) in order to determine in future such moment when the purchase of new transport unit will be most cost-effective. Here the analysis of existing forecast methods and appropriate software products is done as well as the own methods for forecasting the containers flow of intermodal transport operator which use fuzzy sets theory and methods of non-linear programming are offered.

Текст научной работы на тему «Прогнозирование контейнеропотока интермодального оператора с использованием теории нечетких множеств»

УДК 656.614.3.073.235:519.216.3

А. В. ШВЕЦ (Одесский национальный морской университет)

ПРОГНОЗИРОВАНИЕ КОНТЕЙНЕРОПОТОКА ИНТЕРМОДАЛЬНОГО ОПЕРАТОРА С ИСПОЛЬЗОВАНИЕМ ТЕОРИИ НЕЧЕТКИХ МНОЖЕСТВ

У статп поставлено задачу прогнозування контейнеропотока, що освоюеться штермодальним оператором, для визначення надалi моменту часу, коли придбання ново! одинищ рухомого складу буде найбшьш економiчно ефективним. Проведено аналiз iснуючих методiв прогнозування та вщповвдного програмного забезпечення, а також запропоновано власну методику прогнозування контейнеропотока штермодального оператора, яка використовуе теорш нечггких множин та методи нелiнiйного програмування.

В статье поставлена задача прогнозирования контейнеропотока, освоенного интермодальным оператором, для определения в дальнейшем момента времени, когда приобретение новой единицы подвижного состава будет наиболее экономически эффективным. Проведен анализ существующих методов прогнозирования и соответствующего программного обеспечения, а также предложена собственная методика прогнозирования контейнеропотока интермодального оператора, которая использует теорию нечетких множеств и методы нелинейного программирования.

The task of this article is to make a forecast of the container flow (which is being mastered by intermodal transport operator) in order to determine in future such moment when the purchase of new transport unit will be most cost-effective. Here the analysis of existing forecast methods and appropriate software products is done as well as the own methods for forecasting the containers flow of intermodal transport operator which use fuzzy sets theory and methods of non-linear programming are offered.

1. Постановка задачи

Согласно документу «Терминология комбинированных перевозок», подготовленному в 2001 г. тремя межправительственными организациями (Европейский союз, Европейская конференция министров транспорта, Европейская экономическая комиссия ООН), интермодальная перевозка - это последовательная перевозка грузов двумя или более видами транспорта в одной и той же грузовой единице или автотранспортном средстве без перегрузки самого груза при смене вида транспорта. Интермодальными операторами (ИО) в Украине являются транспортно-экспедиторские организации. До середины 2008 г. (до наступившего мирового экономического кризиса) наблюдался стремительный рост перевозок контейнеров, как в мире, так и в Украине. В связи с этим у многих ИО возникла потребность в приобретении новых единиц собственного подвижного состава (автомобильного, железнодорожного или внутреннего водного транспорта) для перевозок на наземном участке пути (вместо использования услуг сторонних перевозчиков). Первым этапом решения поставленной задачи является прогнозирование контейнеропотока ИО. Следует отметить, что для контейнеропо-тока свойственна сезонность, т.е. значительное расхождение значений за различные кварталы

года. В данной статье приводится обзор существующих методов прогнозирования и программного обеспечения, реализующего эти методы, а также предлагается разработанная автором методика прогнозирования контейнеропотока ИО.

Целью данной статьи является разработка методики прогнозирования контейнеропотока, освоенного интермодальным оператором. При этом получение прогнозных данных не должно требовать значительных затрат времени для учета всех или основных факторов, воздействующих на изменение контейнеропотока (т.е. подразумевается использование лишь данных о ретроспективном контейнеропотоке ИО).

2. ОБЗОР МЕТОДОВ ПРОГНОЗИРОВАНИЯ

В источнике [1] приводится информация, что на данный момент разработано более 150 методов прогнозирования [1, с. 58]. По степени формализации методы экономического прогнозирования можно подразделить на интуитивные и формализованные.

К интуитивным методам относятся методы экспертных оценок и методы исторических аналогий и прогнозирования по образцу.

К формализованным методам относятся следующие группы методов:

© Швец А. В., 2009

- методы, выявляющие функциональную зависимость прогнозируемого показателя от воздействующих факторов;

- нейросетевое прогнозирование;

- методы на базе теории нечетких множеств.

Рассмотрим подробнее формализованные методы прогнозирования.

2.1. Методы, выявляющие функциональную зависимость прогнозируемого показателя от воздействующих факторов

Основная идея рассматриваемой группы методов состоит в выявлении функциональной зависимости фактических уровней временного ряда рассматриваемого показателя от воздействующих на него факторов с тем, чтобы использовать эту зависимость для расчета прогнозных значений рассматриваемого показателя.

В соответствии с источниками [1, 2], рассматриваемую группу методов можно разделить на 3 подгруппы:

- методы аппроксимации;

- общие статистические методы по выявлению тренда;

- методы регрессионного анализа.

К методам аппроксимации автор монографии [2] относит, в частности, следующие:

- полиномиальная аппроксимация (методы Лагранжа и Ньютона);

- сплайн-аппроксимация.

Основная идея метода (интерполяционной формулы [3, с.527]) Лагранжа заключается в том, чтобы найти многочлен, который принимает значение 1 в одной узловой точке и 0 во всех остальных. Для определения коэффициентов при переменных многочлена используют интерполяционные многочлены специального вида, к которым, в частности, относится полином Лагранжа. Метод Ньютона (интерполяционная формула Ньютона для неравноотстоящих значений аргумента [3, с. 544]) использует определенную форму полинома, который аппроксимирует искомую функцию, соответствующую всем наблюдениям рассматриваемого временного ряда. В целом, методы Лагранжа и Ньютона отыскивают один и тот же полином.

Сплайн-аппроксимация отличается от полиномиальной аппроксимации. Сплайном называется функция, которая вместе с несколькими производными непрерывна на рассматриваемом отрезке, а на каждом отдельном интервале этого отрезка является некоторым многочленом невысокой степени.

Рассмотренные выше интерполяционные формулы сплайн-аппроксимации, Лагранжа и Ньютона, а также нерассмотренные формулы Гаусса, Стерлинга, Бесселя, первая и вторая интерполяционные формулы Ньютона непригодны для прогнозирования, что исходит из задачи интерполирования [3, с. 507], для решения которой эти формулы были выведены. Так, на практике функции, полученные при использовании методов Лагранжа и Ньютона, оказываются очень чувствительными к ошибкам, особенно на границах рассматриваемого интервала. При использовании сплайн-аппроксимации вычисляется функция, которая со временем (при экстраполировании) будет только возрастать или убывать, в зависимости от значений нескольких последних наблюдений [2, с. 53-56].

К общим статистическим методам по выявлению тренда можно отнести следующие [2, с. 58-62; 4, с. 82-88]:

- сглаживание способом скользящей средней;

- экспоненциальное сглаживание;

- аналитическое выравнивание (методом наименьших квадратов).

Сглаживание способом скользящей средней состоит в том, что каждый уровень из уровней ряда динамики заменяется средней данного уровня и соседних с ним. Применение такого метода на практике себя не оправдывает, поскольку не дает возможности выявить тренд с учетом хотя бы одного воздействующего на прогнозируемый показатель фактора.

В соответствии с методом экспоненциального сглаживания, все значения временного ряда y(t) из выбранной выборки, которая состоит из m последних показателей, рассчитываются следующим образом:

М0 = y(t)Pr"t , (t = T - m + 1, ..., T),

где P - коэффициент экспоненциального сглаживания, в = const, 0 << в < 1;

m - глубина выборки временного ряда,

1 << m < T.

При прогнозировании показателей с большим разбросом значений методом экспоненциального сглаживания линия тренда проходит достаточно близко к фактическим данным, но повторяет их с некоторым запаздыванием, а полученные остатки имеют достаточно большую величину.

Метод наименьших квадратов представляет собой определение такой функциональной зависимости, при которой сумма квадратов от-

клонений фактических уровней от рассчитанных по формуле этой зависимости минимальна. Как будет показано ниже, этот метод в классическом виде непригоден для регрессионного анализа динамических рядов для прогнозирования в силу нарушения одной из предпосылок регрессионного анализа. Пренебрежение таким нарушением может повлечь к очень большим ошибкам прогноза.

Таким образом, все рассмотренные выше методы, хоть и описаны в литературе, как методы прогнозирования, не могут на практике гарантировать необходимую точность прогноза.

2.2. Методы регрессионного анализа

Отправной точкой во всех методах регрессионного анализа является регрессионная модель, имеющая в общем случае следующий вид:

Л = £&/(хи1 ) + ви, (и = 1^), (1)

1=1

где N - количество наблюдений (уровней) временного ряда;

к - количество независимых переменных (факторов), заложенных в модель; уи - зависимая переменная; хи1 - независимая (объясняющая) переменная (фактор);

рг- - коэффициент;

£и - случайная составляющая, называемая также случайным возмущением [5, с. 17] или ошибкой [6, с. 24-25].

Классический регрессионный анализ опирается на следующие основные предпосылки [5, с. 23-26; 7, с. 61]:

Возмущение (еи) и зависимая переменная есть величины случайные с распределением одного и того же вида, а объясняющая переменная хи1 - величина не случайная.

Математическое ожидание возмущения равно нулю.

Дисперсия возмущения (или зависимой переменной) постоянная для всех наблюдений.

Возмущение (еи) имеет нормальное распределение.

Матрица Б, представленная ниже, не случайна:

'/(хи ) /(% ) ... /(% Г

р = / (х21) / (х22) ... / (х2к) (2)

ч / (%1) / (xN2) ... / (хт

На значения параметров рг- не налагается никаких ограничений, т.е. предварительно об их значениях ничего неизвестно, и при вычислениях они могут получаться какими угодно.

Ранг матрицы р, представленной ранее в выражении (2), равен числу коэффициентов в модели к, т.е. гапк(р) = к.

В регрессионном анализе можно выделить 2 группы моделей:

- Модели, основанные на данных пространственных выборок. В экономике под пространственной выборкой понимают набор показателей экономических переменных, полученных в данный момент времени. Другими словами, все наблюдения получают примерно в неизменных условиях, т. е. представляют собой набор независимых выборочных данных из некоторой генеральной совокупности.

- Модели, основанные на данных временных рядов. Временной (динамический) ряд - выборка наблюдений, в которой важны не только сами наблюдаемые значения, но и порядок их следования друг за другом.

Модели первой группы представляют собой классические модели регрессии, в то время как модели из второй группы таковыми не являются и нарушают третью из перечисленных выше основных предпосылок регрессионного анализа. Этим обуславливается появление специфических методов регрессионного анализа временных рядов, приведенных ниже, которые могут быть использованы для прогнозирования:

- обобщенный метод наименьших квадратов;

- взвешенный метод наименьших квадратов;

- двухшаговый метод наименьших квадратов (метод инструментальных переменных);

- нелинейный метод наименьших квадратов;

- метод максимального правдоподобия.

При всем многообразии линейных и нелинейных регрессионных моделей все же предпочтение отдается линейным моделям исходя из следующих соображений:

- Уравнения регрессии линейны при нормальном распределении случайной величины, что, в свою очередь, является одной из принятых предпосылок.

- Ожидаемое значение ошибки прогноза, т.е. математическое ожидание квадрата отклонения наблюдаемых значений от сглаженных (или теоретических) оказывается меньше в том

случае, если уравнение регрессии выбрано линейным.

Также стоит отметить, что линейную модель можно привести к такой форме, чтобы учесть специфику прогнозируемого показателя. Так, например, для интермодального оператора специфичным свойством является сезонность грузопотока. Методы для учета сезонных временных рядов для линейных регрессионных моделей изложены в книге [6, с. 330].

При использовании однофакторных моделей трудно составить такую модель, которая бы правильно выявляла тенденцию изменения прогнозируемого показателя и учитывала бы его колебания с достаточным уровнем точности, поскольку такая модель не учитывает влияние факторов соответствующей предметной области явно. По этой же причине нельзя быть уверенным в какой-либо точности прогнозов вообще.

Использование многофакторных моделей может дать очень точный прогноз. Но точность в данном случае тем выше, чем точнее учтены все факторы, влияющие на зависимую переменную. Такой учет факторов представляется очень сложной задачей, особенно если в рамках какого-то проекта необходимо произвести несколько прогнозов (для разных показателей, имеющих абсолютно разную природу). В этом случае потери времени на выработку модели с достаточным уровнем точности могут себя не оправдать.

2.3. Нейросетевое прогнозирование

Искусственные нейронные сети (ИНС) — совокупность моделей биологических нейронных сетей. Они представляют собой сеть элементов - искусственных нейронов - связанных между собой синаптическими соединениями. Сеть обрабатывает входную информацию и в процессе изменения своего состояния во времени формирует совокупность выходных сигналов. Работа сети состоит в преобразовании входных сигналов во времени, в результате чего меняется внутреннее состояние сети и формируются выходные воздействия. Обычно ИНС оперирует цифровыми, а не символьными величинами.

Важнейшим понятием в теории нейронных сетей является персептрон. Толкование термина «персептрон» претерпело изменения с развитием теории нейронных сетей, и сейчас в литературе приводятся различные его трактования. В данной работе для персептрона будем использовать определение, данное многослой-

ному персептрону Хайкином С.: «сеть, состоящая из множества сенсорных элементов (входных узлов или узлов источника), которые образуют входной слой; одного или нескольких скрытых слоев вычислительных нейронов и одного выходного слоя нейронов» [8, с. 219] (рис. 1).

Рис. 1. Логическая схема элементарного персептрона

Для прогнозирования возможно использование моделей ИНС следующих видов:

- Однослойный персептрон - это персеп-трон, у которого только один вычислительный (обучаемый или скрытый) слой.

- Многослойный персептрон - это пер-септрон, у которого количество вычислительных слоев превышает 1.

Раньше ученые ставили под сомнение эффективность использования многослойных персептронов в сравнении с однослойными. Так, например, американские ученые Минский М. и Пейперт С. придерживались следующей точки зрения: «Проблема расширения идеи персептрона не просто техническая, она также и стратегическая. Однослойный персеп-трон уже показал, что его стоит изучать, несмотря на строгие ограничения (и даже благодаря им!). Он обладает многими свойствами, привлекающими внимание: линейность, интригующая способность к обучению, очевидная простота персептрона как разновидности устройства для параллельных вычислений. Нет никаких оснований предполагать, что любое из этих достоинств распространяется на многослойный вариант» [9, с.230]. Действительно, при использовании однослойного персептрона и, например, базы данных легко получить работающую систему прогнозирования, исследовав зависимость прогнозируемой величины от независимых переменных. Причем учет или неучет системой внешних параметров будет определяться включением или исключением соответствующего входа в нейронную сеть. Простую систему проще настраивать для полу-

чения более точных прогнозов. В то же время, другой американский ученый, Уоссермен Ф., считает, что «многослойные сети обладают большими возможностями, чем однослойные, и в последние годы были разработаны алгоритмы для их обучения» [10].

В монографии [2] автор использовал в своих расчетах при прогнозировании развития финансовых временных рядов, для которых характерен большой разброс значений, двухслойный персептрон; и полученные результаты превзошли результаты, полученные при использовании методов, выявляющих функциональную зависимость прогнозируемого показателя от воздействующих факторов. Но были также отмечены и недостатки. Так, прогноз, который получается при использовании нейронных сетей, с наибольшей вероятностью повторяет предыдущее значение временного ряда. Точность прогноза может быть увеличена путем включения в модель разных факторов или за счет эффективной предварительной обработки данных и поиска оптимальной конфигурации сети. При прогнозировании изменения курсов удается исключить общую тенденцию развития финансового показателя и зависимость от предыдущего значения курса. Но при этом точность угаданных знаков изменения курса оказывается очень низкой - немногим более 50 % [2, с. 84].

Построение нейронной сети на основе множественной регрессии нецелесообразно, поскольку усложняет модель, увеличивает субъективность выбора модели и уменьшает ее гибкость, настраиваемость и масштабируемость.

Преимущество нейронных сетей состоит в том, что исследователь не является заложником выбора математической модели поведения временного ряда. Построение нейросетевой модели происходит адаптивно во время обучения, без участия исследователя. При этом в общем случае нейронной сети предъявляются примеры из базы данных, и она сама подстраивается под эти данные. Однако исследователь может с самого начала воспользоваться каким-либо алгоритмом определения важности (например, используя нейронную сеть с общей регрессией и генетической подстройкой) и сразу определить значимость входных переменных, чтобы потом исключить из рассмотрения мало влияющие факторы.

Недостатком нейронных сетей является их недетерминированность. Имеется в виду то, что после обучения имеется «черный ящик», который каким-то образом работает, но логика при-

нятия решений нейросетью совершенно скрыта от исследователя. В принципе, существуют алгоритмы «извлечения знаний из нейронной сети», которые формализуют обученную нейронную сеть до списка логических правил, тем самым создавая на основе сети экспертную систему. К сожалению, эти алгоритмы не встраиваются в нейросетевые пакеты программного обеспечения, к тому же наборы правил, которые генерируются такими алгоритмами, достаточно объемные.

Существенным недостатком нейронных сетей является потребность в большом массиве ретроспективной информации для качественного обучения разработанной нейросистемы.

2.4. Методы на базе теории нечетких множеств

За последнее время (с 1975 г.) появились различные методы, основанные на теории нечетких множеств. Отличие их состоит в используемом алгоритме нечеткого вывода. Так, в книге [11] рассмотрены 4 из них: алгоритмы Мамдани, Цукамото, Ларсена и Сугено. В целом, суть их сводится к следующим этапам:

- фаззификация;

- построение базы нечетких знаний;

- агрегирование подусловий в нечетких правилах;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- активизация подзаключений в нечетких правилах;

- аккумуляция заключений нечетких правил;

- формирование нечеткого логического вывода (дефаззификация).

Фаззификация представляет собой процедуру нахождения значений функций принадлежности входных лингвистических переменных на основе обычных (не нечетких) исходных данных. Другими словами, выбирается вид функции принадлежности и определяются промежутки, на которых входная лингвистическая переменная ассоциируется с заданными на этом этапе лингвистическими оценками, например: «низкий», «ниже среднего», «средний», «выше среднего» и «высокий».

Построение нечеткой базы знаний представляет собой запись набора нечетких правил (экспертных высказываний) вида «ЕСЛИ-ТО», описывающих изменение уровней временного ряда и факторов, воздействующих на прогнозируемый показатель. База правил систем нечеткого вывода предназначена для формального представления эмпирических знаний и знаний

экспертов в той или иной проблемной области [11, с. 187].

Агрегирование представляет собой процедуру определения степени истинности условий по каждому из правил системы нечеткого вывода.

Активизация в системах нечеткого вывода -это процедура нахождения степени истинности каждого из подзаключений правил нечетких продукций.

Аккумуляция (аккумулирование) в системах нечеткого вывода представляет собой процедуру или процесс нахождения функции принадлежности для каждой из выходных лингвистических переменных.

Дефаззификация представляет собой процедуру или процесс нахождения обычного (не нечеткого) значения для каждой из выходных лингвистических переменных множества. Для дефаззификации могут использоваться следующие методы: метод центра тяжести, метод центра тяжести для одноточечных множеств, метод центра площади (медиана), метод левого модального значения (наименьший из максимумов), метод правого модального значения (наибольший из максимумов), центр максимумов [11, с. 197; 12, с. 12].

Для увеличения точности прогнозов необходимо использовать механизм настройки модели. В книге [13] при прогнозировании количества заболеваний аппендикулярным перитонитом у детей в Виннице автором для настройки модели использовался метод наименьших квадратов.

В литературе по регрессионному анализу не рекомендуется использовать в качестве уравнения регрессии полином, при котором значения зависимой переменной точно совпадают с уровнями временного ряда, поскольку такая «подгонка» модели может привести к тому, что тенденция, необходимая для прогнозирования, не будет выявлена. При использовании же теории нечетких множеств такое ограничение отсутствует. И при использовании механизма настройки модели прогнозные значения будут максимально точно приближены к фактическим.

Использование методов нечеткой логики на практике позволяет сделать тем более точный прогноз, чем точнее отражают действительность экспертные высказывания, заложенные в модель. Следует отметить, что учет факторов в методах прогнозирования на базе нечеткой логики не настолько трудоемок по сравнению с методами регрессионного анализа.0

В отличие от нейронных сетей, нечеткие множества обладают следующими преимуществами:

- Логика принятия решений не скрыта от исследователя, поскольку она основана на высказываниях (базе нечетких знаний), сформулированных на естественном языке;

- Для точного прогноза при использовании нечетких множеств можно использовать ретроспективные данные за более короткие сроки, чем при использовании нейронных сетей. Другими словами, нечеткие множества «обучаются» быстрее, чем нейронные сети.

- При долгосрочном прогнозировании нельзя полагаться на результаты, полученные при использовании одного метода прогнозирования. Но после проведенного анализа становится ясным, что основным методом прогнозирования, используемым при решении поставленной задачи в исследовательской работе, должен быть метод на базе теории нечетких множеств. Дополнять этот метод прогнозирования следует методами, базирующимися на искусственных нейронных сетях и/или регрессионном анализе.

3. Обзор программных средств, реализующих рассмотренные методы прогнозирования

Для проведения расчетов с использованием рассмотренных методов на данный момент разработано большое количество программных средств. Так, методы регрессионного анализа и нейронных сетей получили свою реализацию в таких программных продуктах, как MATLAB (компоненты Statistics Toolbox, Neural Network Toolbox), SPSS, STATISTICA. Несмотря на то, что теория нечетких множеств является самой «молодой» из вышеизложенных, для реализации ее алгоритмов разработан ряд программных продуктов, обзор наиболее распространенных из которых приведен ниже.

Программное средство FuziCalc, разработанное компанией Fuziware (США), поддерживает нечеткие вычисления в среде электронных таблиц, позволяющий вводить в ячейки таблиц диапазоны возможных значений исходных данных и составлять на их основе прогнозы. Однако возможности данного программного средства как электронных таблиц весьма ограничены - программа предлагает лишь базовые средства от мощных универсальных электронных таблиц. Главный недостаток - наличие и необходимость одновременного использования двух электронных таблиц: обычной универ-

сальной (например, MS Excel) и специализированной типа FuziCalc.

Программа FExcel, разработанная компанией ИНЭКС, работает непосредственно в среде популярных электронных таблиц MS Excel. FExcel выполнен в виде обычной надстройки MS Excel. Таким образом, эта программа расширяет стандартный Excel возможностями по обработке нечетких чисел. Однако FExcel реализует лишь основные операции над нечеткими числами (арифметические операции, несколько известных методов дефаззификации).

Пакет нечеткой логики CubiCalc, разработанный компанией Hyperlogics (США), снабжен модулем RuleMaker и позволяет извлекать знания из числовых данных и преобразовывать их в систему нечетких правил, на основе которых делаются выводы в зависимости от задаваемых значений входных параметров. Основными недостатками этого программного средства являются сложный интерфейс и плохая адаптиро-ванность к решению задач прогнозирования.

Аналогично программа fuzzy TECH, разработанная компанией INFORM GmbH (Германия), является специализированным средством, которое позволяет разрабатывать нечетко-логические модели в графическом режиме, а также преобразовывать их в программный код на одном из языков программирования с возможностью последующей реализации в программируемых микроконтроллерах [14].

Программная среда MATLAB позволяет решать широкий спектр задач, требующих применение нечетких множеств (компонент Fuzzy Logic Toolbox) и нейронных сетей (компонент Neural Network Toolbox). Большое разнообразие задач обуславливается тем, что их модели описываются в среде MATLAB собственным языком программирования высокого уровня, ориентированным на математические вычисления, что снимает рамки возможностей графического интерфейса, по сравнению с выше рассмотренными программными средствами.

Все вышеперечисленные программные продукты, реализующие методы прогнозирования, как на базе теории нечетких множеств, так и использующие регрессионный анализ и нейронные сети, имеют один основной недостаток - достаточно сложный для понимания графический интерфейс. Это обусловлено стремительным наращиванием функциональности программных продуктов их разработчиками от версии к версии без пересмотра графического интерфейса. В подтверждение этому служат многочисленные семинары и тренинги, ини-

циируемые разработчиками некоторых из вышеперечисленных программных средств для обучения своих потенциальных пользователей.

Среди рассмотренных программных средств наиболее универсальным и функциональным является система МАТЬАБ.

4. ИЗЛОЖЕНИЕ МЕТОДИКИ ПРОГНОЗИРОВАНИЯ

КОНТЕЙНЕРОПОТОКА ИО

Предлагается методика прогноза контейне-ропотока интермодального оператора (ИО) на базе теории нечетких множеств, которая состоит из следующих основных этапов:

Анализ ретроспективных данных и выделение термов (например: объем перевозок «малый», «средний», «большой») и их границ.

Формирование нечеткой базы знаний Мам-дани (составление нечетких правил, основываясь на данных о совершенных перевозках контейнеров интермодальным оператором).

Формирование модели нечеткого логического вывода на базе сформированных правил (определение типа и параметров функций принадлежности для каждого терма, определение метода дефаззификации).

Настройка модели нечеткого логического вывода при помощи метода наименьших квадратов.

Рассмотрим каждый из вышеперечисленных этапов подробнее.

4.1. Анализ ретроспективных данных и выделение термов

Для иллюстрации методики будут использованы данные о перевозках контейнеров в ТЕи-эквиваленте, совершенных одним из транспортно-экспедиторских предприятий Украины. Динамика перевозок за 2002 - 2007 гг.

представлена на рис. 2. & 6300

£ 5800

| 5300

2 4800

| 4300

3

~ 3800 -г-т--т-,-,-т-т--1

2002 2003 2004 2005 2006 2007 2008

I Ъды

Рис. 2. Количество перевезенных контейнеров интермодальным оператором в ТЕИ-эквиваленте по годам

Для контейнерных перевозок, как было отмечено ранее, свойственна сезонность. Это проиллюстрировано на рис. 3, где на графике изображена динамика изменения контейнеропото-ка ИО по кварталам за 2002-2007 гг. и первый квартал 2008 г.

Рис. 3. Количество перевезенных контейнеров интермодальным оператором в TEU-эквиваленте по кварталам

Проанализировав ретроспективные данные, для лингвистической переменной «уровень перевозок контейнеров» можно выделить 5 термов: «низкий» (Н), «ниже среднего» (нС), «средний» (С), «выше среднего» (вС), «высокий» (В). Границы этих термов отображены на рис. 3. Термы должны задаваться экспертом таким образом, чтобы количество сформированных нечетких правил было минимально и, в то же время, максимально полно описывало изменение уровней динамического ряда.

4.2. Формирование нечеткой базы знаний Мамдани

При поквартальном прогнозировании кон-тейнеропотока использованы 4 лингвистические переменные на входе и 4 переменные на выходе системы нечеткого логического вывода. Перечислим эти переменные. Переменные на входе:

х1 - уровень перевозок контейнеров ИО в

1-м квартале текущего года;

Х2 - уровень перевозок контейнеров ИО во

2-м квартале текущего года;

Х3 - уровень перевозок контейнеров ИО в

3-м квартале текущего года;

Х4 - уровень перевозок контейнеров ИО в

4-м квартале текущего года. Переменные на выходе:

у2 - уровень перевозок контейнеров ИО во

2-м квартале текущего года;

у3 - уровень перевозок контейнеров ИО в

3-м квартале текущего года;

у4 - уровень перевозок контейнеров ИО в

4-м квартале текущего года;

у1 - уровень перевозок контейнеров ИО в 1-м квартале следующего года.

Сформулируем правила на естественном языке.

ЕСЛИ х1 = «низкий» И х2 = «ниже среднего», ТО у4 = «высокий».

ЕСЛИ х1 = «ниже среднего» И х2 = «средний», ТО у4 = «выше среднего».

ЕСЛИ х1 = «низкий», ТО у2 = «ниже среднего».

ЕСЛИ х1 = «ниже среднего»,ТО у2 = «средний».

ЕСЛИ х2 = «ниже среднего» И х4 = «высокий», ТО у3 = «срдний».

ЕСЛИ х2 = «средний» И х4 = «выше среднего», ТО у3 = «выше среднего».

ЕСЛИ х2 = «средний» И х4 = «выше среднего», ТО у3 = «высокий».

ЕСЛИ х3 = «выше среднего», ТО у1' = «ниже среднего».

ЕСЛИ х3 = «высокий», ТО у у = «низкий».

Подобный принцип формирования правил нечеткой базы знаний описан в главе 8.3 книги [1].

4.3. Формирование модели нечеткого логического вывода

4.3.1. Определение типа функции принадлежности

Существует несколько типов функций принадлежности, которые получили широкое применение [2, с. 15-19; 12, с. 20]: треугольная, трапециевидная, гауссова, квазиколоколооб-разная, сигмоидная и синглтонная. Треугольная и трапециевидная функции просты в использовании и доступны для понимания, но они не имеют простых производных, вследствие чего их настройка возможна только с использованием генетических алгоритмов. Такие функции принадлежности, как гауссова, квазиколоколо-образная и сигмоидная имеют простую производную, и их настройка может производиться с использованием точных методов оптимизации, в частности градиентных методов. Синглтонная функция принадлежности используется для синглтонной модели нечеткого логического вывода и неприменима в рассматриваемой модели Мамдани. Так, для обеспечения возможности использования в расчетах точных методов нелинейного программирования (вместо генетических алгоритмов) используется гауссова функция принадлежности. Она имеет следующий вид:

ц(и) = e 2c2 ,

где и - элемент нечеткого множества; b - координата максимума функции; с - коэффициент концентрации функции.

4.3.2. Определение параметров функций принадлежности для каждого терма

Определение параметров функций принадлежности для каждого терма задается таким образом, чтобы абсциссы точек пересечения функций принадлежности каждого из термов были равны границам между ними, заданными на этапе анализа ретроспективных данных. На рис. 4 показано окончание редактирования функций принадлежности в системе MATLAB (подпрограмма Fuzzy Logic Toolbox). Как видно из рисунка, абсциссы точек пересечений функций принадлежности соответствуют ранее заданным границам термов; редактируемая функция принадлежности терма «ниже среднего» имеет параметры b = 1127 и c = 116. Полученные таким образом параметры функций принадлежности всех термов сведены в табл. 1.

Рис. 4. Изображение функций принадлежности термов в окне MATLAB, а также параметров b и c для терма «ниже среднего»

4.3.3. Выбор метода дефаззификации

В настоящих расчетах использовался наиболее популярный из используемых методов -метод центра тяжести (Centre of Gravity - COG [15, с. 111]), который выражается формулой:

к /к COG = £ щ ц a (щ) / £ и ц A (щ)

i=1 / i=1

для нечеткого множества

A = (Ца (u1)/ul,...,Ца (ик)/ик) .

Таблица 1

Параметры функций принадлежности каждого из термов

Название терма Параметры функции принадлежности

b c

Низкий 1000 140

Ниже среднего 1127 116

Средний 1415 112

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Выше среднего 1610 144, 6

Высокий 1900 169

4.4. Настройка модели нечеткого логического вывода

Потребность в настройке модели нечеткого логического вывода обуславливается низкой степенью вероятности того, что лицо, определяющее термы, их границы и функции принадлежности для них, сделает это настолько точно, что сформированная им нечеткая модель будет максимально полно описывать закономерности рассматриваемой системы. В подтверждение этому рассмотрим прогноз, выполненный на базе сформированной ранее нечеткой модели. Результаты прогноза представлены в графическом виде на рис. 5.

Рис. 5. Прогноз контейнеропотока на 1 год вперед при использовании модели нечеткого логического вывода до ее настройки

Для настройки модели нечеткого логического вывода Мамдани в [12, с. 53-58, с. 239-244] С. Д. Штовба предлагает использовать нижеизложенный метод. Формулируется задача нелинейного программирования, в которой целевая

функция (Root Mean Square Error - RMSE) в общем случае имеет следующий вид:

RMSE =

V

M - F (PW, Xr ))2

M r=lM

• min

предложенной методике. Прогнозирование кризисных явлений в мировой экономике является отдельной задачей, и дальнейшие исследования в этом направлении будут востребованы не только в решении задач, описанных в данной статье.

где M - количество уровней динамического ряда, относящихся к обучающей выборке;

yr - значение прогнозируемого показателя на r-том уровне ряда;

Xr - вектор входных переменных для прогнозирования значения показателя на r-том уровне ряда;

P - вектор параметров функций принадлежности термов входных и выходных переменных;

W - вектор весовых коэффициентов правил базы знаний;

F(P, W, Xr) - результат вывода по нечеткой базе знаний Мамдани с параметрами (P, W) при значении входов Xr.

Фактически, целевая функция реализует метод наименьших квадратов. Структурными ограничениями данной математической модели являются следующие:

- ограничения на вектор P, обеспечивающие соответствие нечетких множеств своим термам;

- координаты вектора W должны находиться в диапазоне [0, 1].

После настройки рассматриваемой системы нечеткого логического вывода с помощью подпрограммы Optimization Toolbox системы MATLAB значение оценки RMSE уменьшилось с 82,9826 до 30,8864 (по сравнению с ненастроенной системой). Результаты прогноза представлены на рис. 6, а измененные параметры функций принадлежности сведены в табл. 2.

5. ВЫВОДЫ И ПЕРСПЕКТИВЫ

ДАЛЬНЕЙШИХ ИССЛЕДОВАНИЙ

Как видно из прогноза, объемы освоенного интермодальным оператором контейнеропото-ка продолжали бы расти со свойственными им сезонными колебаниями, если бы не кризисные явления, данные о которых не получили своего отражения в анализируемом динамическом ряду. Данная методика предполагает, что прогноз выполняется на микроэкономическом уровне интермодального оператора. Кризисные явления должны прогнозироваться отдельно, а результаты такого прогноза должны переноситься на результаты прогноза, выполненного по

Рис. 6. Прогноз контейнеропотока на 2 года вперед при использовании настроенной модели нечеткого логического вивода

Таблица 2

Параметры настроенных функций принадлежности каждого из термов

Название терма Параметры функции принадлежности

b c

Низкий 935,0782 60,2321

Ниже среднего 1119,3052 60,0000

Средний 1432,6950 115,1655

Выше среднего 1560,6198 126,6369

Высокий 1983,3384 93,3588

Для более точного прогноза возможен перебор различных типов функций принадлежности и методов дефаззификации. В результате этого перебора может быть отобрана такая модель, для которой после ее настройки значение показателя ЯМБЕ будет минимальным.

В дальнейшем возможна разработка методики прогнозирования освоенного контейнеро-потока ИО с использованием нейро-нечетких сетей.

Дальнейшие исследования могут быть проведены в направлении выработки методики прогнозирования, объединяющей несколько прогнозов, выполненных с использованием разных математических методов и моделей, в один.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Прогнозирование и планирование эконономики [Текст] : учеб. пособие / В. И. Борисевич и др.;

под общ. ред. В. И. Борисевича, Г. А. Кандау-ровой. - Мн.: Интерпрессервис; Экоперспекти-ва, 2001. - 380 с.

2. Матвiйчук, А. В. Аналiз та прогнозування роз-витку фiнансово-економiчних систем iз викори-станням теорп нечетко! лопки [Текст] : моно-графiя / А. В. Матвшчук. - К.: Центр навчаль-но! лiтератури, 2005. - 206 с.

3. Демидович, Б. П. Основы вычислительной математики [Текст] / Б. П. Демидович, И. А. Марон . - 3-е изд. - М.: Наука, 1966. - 664 с.

4. Статистика [Текст] : учеб. пособие / Е. И. Тес-люк и др. - 2-е изд. - Мн.: Ураджай, 2000. -360 с.

5. Вучков, И. Прикладной линейный регрессионный аналiз [Текст] / И. Вучков, Л. Бояджиева, Е. Солаков [пер. с болг. Ю. П. Адлера]. - М.: Финансы и статистика, 1987. - 239 с.

6. Бокс, Дж. Анализ временных рядов, прогноз и управление [Текст] / Дж. Бокс, Г. Дженкинс. -М.: Мир, 1974. - Т. 1. - 406 с.

7. Кремер, Н. Ш. Эконометрика [Текст] : учеб. для вузов / Н. Ш. Кремер, Б. А. Путко; под ред. проф. Н. Ш. Кремера. - М.: ЮНИТИ-ДАНА, 2002. - 311 с.

8. Хайкин, С. Нейронные сети: полный курс [Текст] / С. Хайкин. - 2-е изд. [пер. с англ.] -М.: Изд. дом «Вильямс», 2006. - 1104 с.

9. Минский, М. Персептроны [Текст] / М. Минский, С. Пейперт [пер. с англ. Г. Л. Гимельфарба,

В. М. Шарыпанова / под ред. В. А. Ковалевского]. - М.: Мир, 1971. - 261 с.

10. Уоссермен, Ф. Нейрокомпьютерная техника: Теория и практика [Текст] / Ф. Уоссермен [пер. с англ. Ю. А. Зуева, В. А. Точенова]. - М.: Мир, 1992. - 240 с.

11. Леоненков, А. В. Нечеткое моделирование в среде MATLAB и fuzzy TECH [Текст] / А. В. Леоненков. - СПб.: БХВ-Петербург, 2005. - 736 с.

12. Штовба, С. Д. Проектирование нечетких систем средствами MATLAB [Текст] / С. Д. Штовба. -М.: Горячая линия - Телеком, 2007. - 288 с.

13. Ротштейн, А. П. Интеллектуальные технологии идентификации: нечеткие множества, генетические алгоритмы, нейронные сети [Текст] / А. П. Ротштейн. - Винница: УНИВЕРСУМ-Вшниця, 1999. - 320 с.

14. Деревянко, П. М. Модели и методы принятия стратегических решений по распределению реальных инвестиций предприятия с применением теории нечетких множеств [Текст] : дисс. ... канд. экон. наук. - СПб., 2006. - 224 с.

15. Negnevitsky, M. Artificial intelligence: a guide to intelligent systems [Текст] / Michael Negnevitsky. - Harlow: Pearson Education Ltd., 2005. -415 p.

Поступила в редколлегию 04.06.2009.

Принята к печати 10.06.2009.

i Надоели баннеры? Вы всегда можете отключить рекламу.