МОДЕЛЬ ПРОГНОЗИРОВАНИЯ НЕЧЕТКИХ ДАННЫХ ДЛЯ РЕШЕНИЯ БИЗНЕС ЗАДАЧ ПРЕДПРИЯТИЙ ТЭК
Тукаева Зульфия Масгутовна соискатель ученой степени к.э.н. кафедры «Математические методы в
экономике»
Башкирский государственный университет
Мухаметзянов Ирик Зирягович д-р физ.-мат. наук, профессор кафедры математики Уфимский государственный нефтяной технический университет
Аннотация: Предложена методология нечетких временных рядов для прогноза показателей развития территориально-производственных комплексов. Дана методика построения нечеткой структуры факторов и нечеткой базы знаний прогнозирования. Проведена оценка вероятности достоверности прогноза и анализ доверительных интервалов прогноза. Показана эффективность методов нечеткой логики по сравнению с эвристическими методами.
Abstract: We used the methodology of fuzzy time series for forecasting performance of regional production cluster. Given the method of construction of the structure of fuzzy factors and the fuzzy knowledge base predictions. Given the estimation of the probability of reliability of the forecast and analysis of the confidence intervals of the forecast. The effectiveness of fuzzy logic compared with heuristics methods.
Ключевые слова: прогнозирование, территориально-производственный комплекс, нечеткие временные ряды
Keywords: forecast, regional production cluster, fuzzy time series
Введение Процессы стратегического управления неразрывно связаны с рассмотрением и планированием деятельности предприятия ТЭК на отрезке времени в 5-10 лет. Определение эффективных прогнозов различных финансово-экономических показателей необходимо менеджменту компании для принятия правильных решений по стратегическому и операционному управлению, расчету производства и материальных затрат, т.д. Это позволяет получить конкурентные преимущества в постоянно меняющихся условиях.
При составлении такого рода прогнозов необходимо учитывать взаимодействие предприятия с внешней средой - с потребителями, товарными и финансовыми рынками, экономической ситуацией, законами и политическими факторами. Перечень решаемых задач включает: анализ и прогноз цен и состояния рынков нефти, газа и нефтепродуктов в стране и за рубежом; прогноз состояния потребителей; прогноз добычи; прогноз затрат и себестоимости; прогноз инвестиций и капитальных вложений; прогноз дохода и прибыли и др.
Часть макроэкономических показателей представлены количественными данными, для других определены количественные оценки (что уменьшает достоверность прогнозов), а часть данных представлена в вербальной (словесной) форме с неопределенными значениями. Например, высказывания: «рост», «небольшой рост», «падение», «замедление» являются нечеткими и неопределенными. Для такого рода нечетких данных имеются значительные трудности при использовании фундаментального (например, экстраполяции тренда) или технического анализа (отслеживание формальных закономерностей). Обычная практика в таких случаях - применение метода экспертных оценок. Однако, методы нечеткой логики в сочетании с нечеткими временными рядами, в отличие от экспертных оценок и других эвристических методов, позволяют получить количественный результат [1, 2]. Поэтому для оценки нечеткой части информации целесообразно применять методологию идентификация нечетких систем, с последующей интеграцией результатов в общую структуру принятия решений.
Целью настоящей статьи является приложение теории нечетких множеств и нечетких временных рядов (НВР) для прогноза ряда показателей территориально-производственных комплексов и интегрирование данных методов в общую структуру принятия решений.
Модель прогнозирования на основе нечетких множеств Пусть входные параметры представляют собой нечеткие переменные. Обозначим их как вектор X (?г.) = { ), x2(ti),..., хк (?г.)} в момент времени . Как правило,
это комбинации большого числа частных разнотипных показателей, разных единиц измерения, некоторые из которых качественные, некоторые оцениваются в бальной шкале или не измеряются количественно.
Прогнозные параметры обозначим как вектор У(^.) = {у^г),...,ут(7г)} -
количественные, но в силу невозможности применения детерминированных моделей по нечетким входным данным, их также лучше рассмотреть как нечеткие переменные с терм-множеством по каждой компоненте.
Пусть Т = ^^t2,...,tn} - дискретная временная шкала, на которой задан временной ряд (ВР) в виде упорядоченной последовательности числовых значений X(^.) = {х1^і),х2(^.),...,хк(^.)} . Под моделью ВР будем понимать
формализованную процедуру, позволяющую по прошлым значениям ряда прогнозировать его будущие значения для любого произвольного момента времени 1
Механизм функционирования нечеткой модели реализован на основе процедур нечеткого вывода темпоральной модели [2], т.е. модели, учитывающей причинно-следственные связи во времени. Элементарной единицей представления информации о поведении ВР на временном интервале [(н, tк ] является нечетко-темпоральное высказывание вида:
Ф(Х, К ) = (х(Х, К ) = а)&([К, К] = т), (1)
имеющее смысл описания “на временном интервале [^, tк ] с нечеткой продолжительностью т наблюдается тренд ВР с нечетким значением а ”.
Высказывание вида (1) имеет геометрическую интерпретацию в виде нечеткого множества векторов, характеризующего тренд ВР на интервале высказывания.
Основными единицами представления знаний в модели являются нечетко-темпоральные правила вида:
Если Ф^т,tn),затем Ф2(^,tk),затем...Ф1 (^,^, то затем Ф(^tk) (2) где Ф. - нечетко-темпоральные высказывания вида (1).
В наиболее простом случае нечетко-темпоральная структура задается последовательностью интегральных признаков, описывающих поведение ВР на нескольких, следующих друг за другом фрагментах. Нечеткие правила, образующие базу знаний модели, в этом случае имеют вид выражений:
” Если в течение At = х1 наблюдается признак X = X(х1) и У = У(х1),
затем в течение At = х2 наблюдается признак X = X(х2) и У = У(х2) (3)
затем . . ., то в последующем в течение At = хп будет У = У(хп)”
где У1 - интегральные нечеткие признаки, характеризующие поведение ВР на его отдельных фрагментах; т^^ - нечеткие темпоральные признаки,
характеризующие продолжительность этих фрагментов.
В частном случае нечеткие признаки qi описывают величину тренда ВР на участках его монотонного убывания или возрастания. Для формирования таких признаков осуществляется разбиение ВР на интервалы одинаковой монотонности с последующей их аппроксимацией прямыми линиями. Угол наклона прямой характеризует величину тренда ВР на соответствующем интервале ВР, а длительность - временную продолжительность тренда. Для формализации интегральных признаков в рассмотрение вводится нечеткая переменная “ТРЕНД”, определенная вместе со своими нечеткими термами а,/3,...,у на шкале тангенсов углов наклона, и нечеткая переменная “ПРОДОЛЖИТЕЛЬНОСТЬ”, определенная вместе со своими нечеткими термами т1,т2,... на целочисленной шкале дискретных отсчетов N = {п / п = j - /}.
Для получения верхней и нижней границы прогноза были
использованы преобразования в соответствии с [2] :
1
К =\ (с11л (а) +сяЯл (а)) Р(аМа
0
Ца) = а - Ь(\ -а) ,
Я(а) = а + с(1 - а)
где Сь и Сл - веса левой и правой сторон нечеткого числа соответственно; Ьл(а), Ял(а) - лево- и правосторонние нечеткие числа
соответственно (не убывающие функции от а); р(а) - функция
распределения уровней весов; a, b, с - границы треугольного нечеткого числа. Для вычисления весов CL и cR использовали следующие соотношения:
b с
CL =7-, CR = 7- , (CL > О, CR > О, CL + CR = 1).
b + C b + C
Функцию распределения весов р(а) определяли следующим образом:
р(а) :[0;1] ^ [0; + х], р(а) = (k + 1)аk, k > 0, (Jр(а)dа = 1).
0
Мы рассчитываются взвешенные оценки левой и правой границы
нечетких множеств по формулам
i i
ZL =|La (а)р(а^а, ZR = J RA (а)p(а)dа, IW (Z) = CLZL + CRZR.
0 0
Тогда ширина доверительного интервала нечеткого числа равна
D( Z ) = IR ( Z ) — IL ( Z ) с доверительной вероятностью р(а), что важно для
оценки рисков при принятии решений.
Результаты расчетов на модельных примерах и обсуждение.
Описанная выше методология и прогнозирование реализованы на данных
нефтехимического комплекса республики Башкортостан, образованного на
базе крупных корпоративных структур и широкой сети предприятий
сервисного обслуживания и вспомогательного производства. Прогнозный
параметр - прирост объема отгруженных товаров собственного производства,
выполненных работ и услуг собственными силами всего по
нефтехимическому комплексу РБ (Difference Gross domestic product, AGDP).
В качестве определяющих факторов рассматриваются следующие нечеткие
входные факторы:
1) цена за 1 баррель нефти на мировом рынке (WDP);
2) уровень инфляции (INF);
3) темпы роста мировой экономики (WOE)
4) конкурентоспособность (CON);
5) инвестиции (FIN).
Для упрощения рассмотрим для всех входных переменных терм-множество, образуемое следующими значениями: низкое (L, Low), среднее (A, Average), высокое (H, High). Независимо от выбора шкал, границы терм-множества являются размытыми. Для выбранных выше индикаторов прогнозирования определим нечеткую шкалу понятий “низкое”, “среднее” и “высокое” (табл. 1). Для этого используем либо обще употребляемые шкалы (в том числе балльные), либо экспертные оценки.
Таблица 1
Нечеткая шкала терм-значений индикаторов прогнозирования
Индикатор Low Average High
1. Цена за 1 баррель нефти марки Urals на мировом рынке (WDP, $) 40 - 60 55 - 85 80 - 110
2. Уровень инфляции (INF, %); 0 - 9 2 1 .5 8. 11.5 ^
3. Темпы роста мировой экономики (WOE, %) 0 - 0.5 0.3 - 3 2.5 ^
4. Конкурентоспособность (CON, %); 0 - 40 30 - 70 60 - 100
5. Инвестиции (FIN, %) 0 - 2 1.5 - 4 3.5 ^
Конкурентоспособность предприятия моделировали по агрегированным показателям цены, качества, бренда и сервиса с использованием нечеткой идентификации [3]. Единицы измерения -проценты по отношению к лидеру. Объем инвестиций оценивали в процентах к основным фондам.
Для выходного параметра использовали пятиуровневую градацию (табл. 2), со следующим терм-множеством значений: УЪ (значительное уменьшение), Ъ (уменьшение), F (без изменения), Н (увеличение), УН (значительное увеличение). Пятиуровневая градация выходного параметра обусловлена требованием повышенной дифференциации прогноза и подавления шумов.
Ядром модели прогнозирования является темпоральная адаптивная база знаний, получаемая на основе сбора, сортировки, анализа и обработки
Нечеткая шкала терм-значений для прогнозных показателей
Индикатор VL L F H VH
1. Difference Gross domestic Product - A GDP (-15; -6) (-7; -1) (-1,5; 1,5) (1; 7) (6; 15)
2. Прирост объема переработки нефти, % год (-5; -2) (-3; -0,4) (-0,5; 0,5) (0,4; 3) (2; 5)
временных данных для исследуемого прогноза. База знаний формируется по временным промежуткам, пополняется и адаптируется, с применением методов интеллектуальной обработки информации и гибридизацией с методами нечеткой логики (нечеткая кластеризация, нечеткие ассоциативные правила). В таблице 3 приведен фрагмент такой базы знаний, полученный для определенного временного промежутка.
Таблица 3
Фрагмент темпоральной базы знаний для параметра прирост объема отгруженных ___________________________________товаров_____________________________________
Нечеткие входные переменные WDP L L L L L L A A A A A A H H H H H H
INF L A H L L A L A H L L A L A H L L A
WOE L L A A A A A A A A A A A H H A H H
CON A A A A A A A A A H H H H H H H H H
FIN L A H A H H L A H A H H L A H A H H
Output Рч Q 0 < VL L F L F F L F F H F F H H H F H VH
Для ВР X(ґ) нечеткий вывод в момент времени ґ є Т начинается с интерпретации нечетко-темпоральных правил, входящих в базу знаний (БЗ), значениями интегральных признаков, вычисленных на участках его монотонного возрастания или убывания, предшествующих моменту времени 1 В результате интерпретации определяются истинностные значения предусловий нечетко-темпоральных правил, используемые в дальнейшем при выводе заключений. Нечеткий вывод по каждому из правил осуществляется путем умножения нечеткого вектора, указанного в
заключение правила и характеризующего прогнозируемый тренд ВР, на скаляр, соответствующий значению истинности предусловия правила. Агрегирование результатов осуществляется путем объединения нечетких векторов по правилам нечеткого сложения векторов, а дефаззификация -путем дефаззификации каждой координаты нечеткого вектора одним из известных методов.
Для реализации описанной выше методики нами разработан программный продукт, позволяющий формировать и вести базу знаний в среде MS Excel и проводить расчеты, используя Fuzzy Toolbox системы MatLab.
Фактические и прогнозные значения параметров конкурентоспособности (CON) и объема отгруженных товаров собственного производства (GDP), полученные экстраполяцией линии тренда и методом прогноза по нечеткому временному ряду приведены на рис. 1 и рис. 2.
Прогноз конкурентоспособности
--♦--Наблюдения ----■--Прогноз НВР —— Нижняя граница
Верхняя граница--Линейный тренд
Рис. 1 Фактические и прогнозные значения параметра конкурентоспособности (CON), полученные экстраполяцией линии тренда и методом прогноза по нечеткому временному ряду
Конкурентоспособность предприятия моделировали с учетом трех типов сбыта, когда для потребителя показатели цены, качества, имиджа
(бренда) и сервиса являются плохими, средними и хорошими. Предполагается, что при каждом типе сбыта эластичность конкурентоспособности по агрегированным факторам постоянна. Границы областей с постоянными эластичностями конкурентоспособности - нечеткие, что обусловлено плавным переходом одного типа сбыта в другой. Для моделирования конкурентоспособности формируем экспертные нечеткие базы знаний. Доверительный интервал для параметра конкурентоспособность составляет порядка 10% от расчетного значения.
Рис. 2 Фактические и прогнозные значения параметра GDP, полученные экстраполяцией линии тренда и методом прогноза по нечеткому временному ряду
Прогноз для объемов отгрузки, полученный методом нечетких временных рядов (НВР), отличается от прогноза методом экстраполяции тренда, порядка на 3-8 %, что существенно в денежном выражении, и составляет 1,2-4 млрд. руб. Это обусловлено многофакторностью модели НВР и чувствительностью результата к каждому фактору. Результат прогноза в значительной степени определяется качеством базы знаний. Следует отметить, что факторы модели относятся к классу макроэкономических параметров для оценки мировой экономики, и по данным факторам имеются, как правило, достаточно надежные аналитические прогнозы, которые можно использовать на практике.
Например, процесс дефаззификации позволяет получить количественную оценку значения «высокий прирост». Кроме этого получаем еще и степень выходного значения, который можно трактовать как вероятность. Например, прирост переработки сырья «Н» - со значением функции принадлежности 0,8 будет означать, что вероятность высокого значения объемов переработки равна 0,8.
Заключение
Обычная практика получения прогноза для нечетких данных -применение метода экспертных оценок. Применение теории нечетких временных рядов для прогноза данных, представленных в вербальной форме, в отличие от экспертных оценок и других эвристических методов, позволяет получить количественную оценку прогноза, а также значения доверительного интервала и доверительной вероятности прогноза.
Таким образом, для сложно организованных систем, таких как, например, крупных территориальных комплексов, значительная часть информации имеет нечеткую структуру и построение прогнозов на основе нечетких временных рядов должно быть составной частью комплексной системы прогнозирования и принятия решений.
Библиографический список:
1. Прикладные нечеткие системы / Под ред. Т. Тэрано, К. Асаи, М. Сугэно. - М.: Мир, 1993.- 368 с.
2. Chen S.M. Forecasting enrollments based on fuzzy time series // Fuzzy Sets Systems, 1996, vol. 81, no. 3, pp. 311-319.
3. Тукаева З.М Методология нечеткой идентификации при
прогнозировании показателей территориально-производственных
комплексов // Промышленное развитие России: проблемы, перспективы: сб. трудов X Междунар. науч.- практ. конф. - Нижний Новгород: изд-во НГПУ, 2012. - С.125-128.