Электронный журнал Cloud of Science. 2014. T. 1. № 2
http://cloudofscience.ru
УДК 004.942
Формализация временного ряда методом двойного сглаживания1
В. Н. Петрушин1,2, Г. О. Рытиков2 1 Финансовый университет при Правительстве РФ 125993, Москва, Ленинградский проспект, 49
2Московский государственный университет печати имени Ивана Федорова 127550, Москва, ул. Прянишникова, 2А, e-mail: [email protected]; [email protected]
Аннотация. В работе рассматриваются актуальные вопросы моделирования динамики валового продукта социально-экономических систем, не в полной мере поддающихся типовым эконометрическим методам статистического анализа. Приводится пример соответствующего временного ряда и схема его анализа, излагается концепция метода двойного сглаживания, описывается его применение к рассматриваемому примеру и обсуждается возможность его применения к моделированию динамики некоторых процессов в организационных системах.
Ключевые слова: управление социально-экономическими системами, методы экономико-статистического и эконометрического анализа временных рядов, сглаживание временных рядов.
1. Введение
Основным звеном современной рыночной экономики является производственное предприятие — сложная социально-экономическая система с элементами самоорганизации, результаты хозяйственной деятельности которой являются потребляемыми общественными благами. Целью управления социально-экономическими (так называемыми организационными [1]) системами является повышение эффективности управленческой деятельности, обеспечивающее улучшение качества или степень доступности соответствующего общественного блага. Комплекс методов достижения этой цели включает в себя построение прогноза развития исследуемой системы в целом или отдельных ее компонент.
В редчайших случаях подобные предсказания могут быть построены на основании изученных ранее формализованных законов развития исследуемых систем, однако в основном они носят вероятностный характер и являются результатами анализа исследуемого процесса методами прикладной математической статисти-
1 Работа выполнена при поддержке РФФИ (грант № 13-07-00516).
СИСТЕМНЫМ АНАЛИЗ И СИСТЕМЫ УПРАВЛЕНИЯ
ки [3-5]. Организационные системы априори страдают большей неопределенностью, чем системы технические, так как результат их деятельности зависит не только от технических решений, но и от антропогенных, природных, биологических факторов, влияние которых известно, в лучшем случае, оценочно. Более того, даже точное количество факторов, влияющих на социально-экономическую систему, неизвестно: часть из них может находиться в так называемом спящем состоянии, т. е. не оказывать существенного влияния на производственный процесс в одних условиях, но становиться определяющими в случае значительных изменений каких-либо внешних условий.
При экономическом анализе производства основной интерес представляет исследование динамики валового продукта [2]. Целью данной работы является выработка некоторых самых общих рекомендаций по статистическому моделированию динамики валового продукта в случаях, когда применение типовых эконометрических методов [3] оказывается недостаточным.
Как известно, для обеспечения наилучшей управляемости производственными процессами желательно минимизировать влияние случайных антропогенных и природных факторов на производственные процессы. Важнейшим направлением в решении этой задачи является повышение уровня автоматизации производства. Однако полное исключение влияния некоторых факторов внешней среды зачастую оказывается невозможным или экономически нецелесообразным. Таким образом, возникает необходимость построения математических моделей, учитывающих изменчивость значений факторов внешней среды и обеспечивающих возможность получения количественных прогнозов результатов производственных процессов. Чем выше уровень понимания производственного процесса, тем более точная математическая модель может быть построена [см., например, 6, 7], и тем более высоким оказывается уровень управляемости соответствующим процессом. Таким образом, необходимо учитывать специфику выбранной для моделирования системы, хотя применяемые при моделировании математические методы могут быть стандартизованы [2, 8].
2. Метод двойного сглаживания
для прогнозирования временных рядов
Исходной информацией для построения прогностических закономерностей обычно являются временные ряды, которые представлены в виде упорядоченного множества точек многомерного пространства (х1, х2,..., хп, у}, где х1 — аргументы
исследуемой функции у, (/ = 1, п). Дополнительные сложности при моделировании организационных систем возникают из-за того, что даже количество аргументов, от которых зависит исследуемая функция, известно лишь приблизительно. В качестве исходных данных для демонстрации проблем применения стандартных методов прикладной статистики был использован временной ряд, полученный в 80-е годы прошлого столетия одним из авторов статьи в рамках моделирования урожайности
крупных садоводческих хозяйств средней полосы России [5, 10]. На основании обработки результатов экспериментов им был произведен анализ продукционных процессов отдельных компонент рассматриваемой системы (садов) и изучена зависимость динамики суммарной урожайности садоводческого хозяйства от агрометеорологических условий при фиксированных значениях агрохимических, агрофизических и агротехнических факторов. Все численные значения урожайностей садов были предоставлены кафедрой плодоводства Мичуринского госагроуниверси-тета, а данные агрометеорологических наблюдений — Мичуринской агрометеостанцией. Аргументами функции урожайности в рассматриваемом случае являлись: X — сумма среднесуточных температур воздуха за все время развития репродуктивных органов; х2— сумма среднесуточных температур почвы на глубине 20 см, являющейся верхней границей корнеобитаемого слоя; х3 — сумма среднедекадных запасов продуктивной влаги в метровом слое почвы; х4 — продолжительность развития репродуктивных органов в сутках от срока закладки цветковых почек до съема плодов, исключая период перезимовки; х5 — суммарный приход фотосинтетически активной радиации; х6— сумма среднесуточных относительных влажностей воздуха; х7 — урожайность предшествующего года; х8 — возраст сада в годах.
Известно [11], что выбор конкретной функции, описывающей зависимость урожайности от агрометеорологических факторов, основывается на наличии у любого растения оптимального режима внешней среды и симметричности продукционного процесса яблони относительно оптимальных значений агрометеорологических параметров. Зависимость урожая следующего года от урожая предшествующего года представляет собой убывающую функцию, что обусловлено конкуренцией роста плодов в текущем году и развитием цветковых почек урожая следующего года. Скорость нарастания урожайности сада с его взрослением превышает скорость спада в процессе старения. По мере роста садов их влияние на собственный микроклимат усиливается, особенно при большой плотности насаждений [9], т. е. присутствует эффект сглаживания резких колебаний агрометеорологических показателей.
Исходя из вышесказанного и учитывая мультипликативноть воздействия факторов, при формализации производственной функции в [10] была выбрана следующая зависимость:
Уп = А/1( х8) /1( ^ х2, ^ х4, х5 , хб) /з( х7\
/3 (х7 = Уп-1 ) = еХР (-^7 • х7 ) ,
СИСТЕМНЫМ АНАЛИЗ И СИСТЕМЫ УПРАВЛЕНИЯ
где уп — урожай текущего года; у0 = 0; х00 — оптимальное значение параметра, I = 1,6; а, р, А, а, В — константы. Коэффициенты а, р, а, В вычислялись по трендовой кривой, критерием построения которой являлась минимизация дисперсии для выбранной формы задания последовательности.
Построение подобного рода зависимостей требует либо наблюдения «длинных» временных рядов, либо наблюдения ансамбля «сдвинутых» во времени друг относительно друга аналогичных процессов. В рассматриваемом примере присутствовал второй вариант — наличие данных по урожайности и агрометеоусловиям для садов разных лет посадки. Проверка оценочной функции производства валовой продукции сада на независимых экспериментальных данных с учетом микроклиматических поправок дала хорошее совпадение с экспериментальными данными в пределах статистических ошибок оценок средних [10].
Применение относительно современных информационных технологий позволяет построить приблизительное описание динамики значений производственной функции для крупных предприятий аналогичного генезиса при наличии меньшего количества информации об исследуемых процессах. Например, для рассмотренного выше примера ценой небольшой потери качества аппроксимации возможен статистический анализ временного ряда без прямого учета влияния агрометеорологических факторов.
Для построения статистической вероятностной модели процесса сначала необходимо выделить главные компоненты — факторы или их комбинации, оказывающие определяющее воздействие на целевую функцию. Для садоводческой проблематики главными компонентами, сильно влияющими на плодоношение, оказываются генетически заложенные зависимости урожайности яблони от ее возраста и урожая предшествующего года. В общем случае для объема продаж любого продукта, характеризующегося относительно стабильным потреблением, с существенной долей вероятности главными компонентами окажутся, соответственно, количество отчетных периодов с момента начала продаж и суммарный объем продаж за период, предшествующий отчетному.
Рассмотрим, соответственно, временной ряд фактических ежегодных урожайностей, наблюдавшихся в исследованиях [9, 10], приведенные в табл. 1.
Следующим этапом является построение тренда. Как видно из анализа экспериментальных данных (рис. 1), непосредственное построение тренда часто не может дать положительных результатов (табл. 2) — значения коэффициентов детерминации недостаточны для того, чтобы модель могла применяться на практике (Я2 < 0.8).
В подобных случаях предлагается осуществить первичное сглаживание — перейти от моделирования динамики объема годового валового продукта к моделированию динамики суммарного объема валового продукта за все годы, начиная с первого года реализации продукта. Для рассмотренного примера урожайность сада не является монотонно возрастающей, она весьма вариабельна, а суммарный урожай за время плодоношения представляет собой монотонно возрастающую последова-
тельность, которая к тому же имеет предел в силу конечности жизни любого биологического субъекта. Для произвольного предприятия накопительный объем продаж также является монотонно возрастающей последовательностью, а наличие предела связано с конечностью потребительского интереса к почти любому виду продукции и с конечностью времени существования любого предприятия.
350 -300 -л 250 -
L
^ 200 ->S
03 . _ _
* 150 -о
> 100 -50 -0 -
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Возраст сада, год
Рисунок 1. Динамика ежегодной урожайности
Таблица 1. Данные по ежегодной урожайности
T, год 1 2 3 4 5 6 7 8 9 10
Уф , ц/га 1.7 2.9 5.2 8.5 49.1 29.1 46.6 43.3 101.6 190
T, год 11 12 13 14 15 16 17 18 19 20
Уф , ц/га 318.2 225.7 141.6 318.2 183.3 304.8 252.3 134 232.4 204.9
Таблица 2. Результаты аппроксимации ежегодной урожайности
типовыми трендами MS Excel
Название тренда Формула Коэффициент детерминации
Линейный у = 15.006x -17.888 0.6206
Квадратичный у = -0.9621x2 + 35.21x - 91.973 0.6879
Логарифмический у = 107.38Ln( x) - 87.638 0.5998
Экспоненциальный у = 5.4882e0 2386x 0.7313
Суммарная урожайность сада аппроксимируется и, следовательно, прогнозируется гораздо лучше (рис. 2, табл. 3).
Динамика ежегодной урожайности исследуемого экспериментального хозяйства
СИСТЕМНЫМ АНАЛИЗ И СИСТЕМЫ УПРАВЛЕНИЯ
Рисунок 2. Динамика накопительной урожайности
Таблица 3. Результаты аппроксимации накопительной урожайности
типовыми трендами MS Excel
Название тренда Формула Коэффициент детерминации
Линейный у = 159.87x - 711.07 0.9174
Квадратичный у = 8.7034x2 - 22.898x - 40.907 0.9891
Логарифмический у = 969.39Ln(x) -1084.4 0.6365
Экспоненциальный у = 5.9362e0 3651x 0.8926
Однако средняя относительная погрешность прогноза даже по лучшему из этих трендов (начиная с четвертого года наблюдений) составляет не менее 20%, в отличие от прогноза с учетом влияния агрометеорологических факторов, где средняя относительная погрешность прогноза, начиная со второго года наблюдения, не превышала 4%.
Для дальнейшего улучшения качества прогноза необходимо применить какую-либо из техник вторичного сглаживания. Пробная аппроксимация экспериментальных данных была произведена с помощью нескольких соответствующих нелинейных трендов с использованием программы Microcal Origin
(http://www.microcal.com). Наилучшие результаты прогноза при допустимом снижении качества аппроксимации (средняя относительная погрешность прогноза ~6%, коэффициент детерминации R2 ~0,87) были достигнуты с помощью обеспечивающей вторичное сглаживание, за счет операции
показательно-степенной последовательности
_( Т2 + А • Т + В Ут _ [ Т2 + С • Т + Б у
где уТ — суммарная урожайность сада возраста Т за период времени Т; Т —возраст насаждений в годах; А, В, С, Б — коэффициенты, оцениваемые по экспериментальным данным стандартными эконометрическими методами.
Рисунок 3. Моделирование накопительной урожайности
3. Заключение
За счет допустимого незначительного увеличения относительной погрешности прогноза (в данном случае с 4 до 6%) возможным оказывается прогнозирование урожайности без прямого учета агрометеорологических факторов (т. е. даже в условиях отсутствия штатной метеорологической службы). При этом качество полученной нелинейной статистической модели остается на уровне, обеспечивающем ее практическую применимость (Я2 > 0.8).
Яблоневый сад в данном случае является лишь примером, для которого осуществляется статистическое моделирование временных рядов. Производительность труда на конкретном рабочем месте, функция спроса потребителей промышленной продукции, количественно оцениваемый интерес населения к социальным явлениям, потребление человеком продовольствия, запросы на лекарства и т. д. обладают временными рядами, похожими на рассмотренный.
Первичное сглаживание (переход к интегральным характеристикам) позволяет применять для аппроксимации временных рядов монотонные функции или последовательности, хотя сам процесс монотонным не является. Ряд таких интегральных
СИСТЕМНЫМ АНАЛИЗ И СИСТЕМЫ УПРАВЛЕНИЯ
характеристик заведомо обладает доминирующей главной компонентой, т. е. легко формализуется с помощью стандартных эконометрических методов, а повышение точности аппроксимации и прогноза может быть достигнуто с помощью процедур вторичного сглаживания («нелинейное» усреднение аппроксимируемых величин).
Литература
[1] Бурков В. Н., Коргин Н. А., Новиков Д. А. Введение в теорию управления организационными системами. — М. : ИЯ^, 2008.
[2] Андреев М. Ю., Поспелов И. Г., Поспелова И. И., Хохлов М. А. Технология моделирования экономики и модель современной экономики России. — М. :
МИФИ, 2007.
[3] Елисеева И. И. Эконометрика. — М. : Финансы и статистика, 2003.
[4] Голинков Ю. П. Экономико-математическое моделирование производственных систем полиграфии. — М. : МГУП, 2006.
[5] Голинков Ю. П., Марголин Л. Н., Рудяк Ю. В. База данных эконометрического анализа книжного рынка // Известия высших учебных заведений. Проблемы полиграфии и издательского дела. 2007. № 1. С. 181-189.
[6] Рытикова А. М. Элементы моделирования металлографского формного процесса // Известия высших учебных заведений. Проблемы полиграфии и издательского дела. 2007. № 2. С. 22-27.
[7] Голинков Ю. П., Рудяк Ю. В. Оптимизация загрузки производственного оборудования // Известия высших учебных заведений. Проблемы полиграфии и издательского дела. 2007. № 2. С. 111-116.
[8] Александрова И. А., Гончаренко В. М., Денежкина И. Е., Киселев В. В., Набато-ва Д. С., Попов В. Ю., Шандра И. Г., Шаповал А. Б. Методы оптимальных решений в экономике и финансах. — М. : КНОРУС, 2013.
[9] Чирков Ю. Н., Петрушин В. Н. // Метеорология и гидрология. 1987. № 8.
С. 103-109.
[10] Петрушин В. Н., Чирков Ю. Н. // Метеорология и гидрология. 1988. № 5.
С. 103-111.
[11] Потапов В. А., Завражнов А. И., Бобрович Л. В., Петрушин В. Н. Биометрия
плодовых культур. — Мичуринск : МичГАУ, 2004.
Авторы:
Петрушин Владимир Николаевич — кандидат физико-математических наук, доцент, доцент кафедры прикладной математики Финансового университета при Правительстве России
Рытиков Георгий Олегович — кандидат физико-математических наук, заведующий кафедрой прикладной математики и моделирования систем Московского государственного университета печати имени Ивана Федорова
Double Smoothing in Time Series Formalization
V. N. Petrushin, G. O. Rytikov
Finance University under the Government of the Russian Federation,
49, Leningradsky avenue, Moscow, 125993
Moscow State University of printig atr,
2A, Prynishnikova st., Moscow, 127550, e-mail: [email protected]; [email protected]
Abstract. Relevant questions of social-economy systems, total product, nontrivial dynamics modeling are discussed. We give the description of the illustrative example and its analysis of typical procedures, and perform the concept of double smoothing and its application to organizational systems time series approximation.
Key words: social-economic systems management, methods of economic statistics, time series econometric analysis, time series smoothing.
Reference
[1] Burkov V. N., Korgin N. A., Novikov D. A. (2008) Vvedenie v teoriju upravlenija or-ga-nizacionnymi sistemami. Moscow, URSS. (rus)
[2] Andreev M. J., Pospelov I. G., Pospelova I. I., Hohlov M. A. (2007) Tehnologija modelirovanija jekonomiki i model sovremennoj jekonomiki Rossii. Moscow, MIFI. (rus)
[3] Eliseeva 1.1. (2003) Jekonometrika. Moscow, Finansy i statistika. (rus)
[4] Golinkov J. P. (2006) Jekonomiko-matematicheskoe modelirovanie proizvodstven-nyh sistem poligrafii. Moscow: MGUP. (rus)
[5] Golinkov J. P., Margolin L. N., Rudjak J. V. (2007) Baza dannyh jekonometrich-eskogo analiza knizhnogo rynka. Izvestija vysshih uchebnyh zavedenij. Problemy poligrafii i izdatelskogo dela, 1, 181-189. (rus)
[6] Rytikova A. M. (2007) Jelementy modelirovanija metallografskogo formnogo pro-cessa. Izvestija vysshih uchebnyh zavedenij. Problemy poligrafii i izdatelskogo dela,
2, 22-27. (rus)
[7] Golinkov J. P., Rudjak J. V. (2007) Optimizacija zagruzki proizvodstvennogo oboru-dovanija. Izvestija vysshih uchebnyh zavedenij. Problemy poligrafii i izdatelskogo dela, 2, 111-116. (rus)
[8] Aleksandrova I. A., Goncharenko V. M., Denezhkina I .E., etc. (2013) Metody opti-malnyh reshenij v jekonomike i finansah. Moscow, KNORUS. (rus)
[9] Chirkov J. N., Petrushin V. N. (1987) Meteorologija i gidrologija, 8, 103-109. (rus)
[10] Petrushin V. N., Chirkov J. N. (1988) Meteorologija i gidrologija, 5, 103-111. (rus)
[11]Potapov V. A., Zavrazhnov A. I., Bobrovich L. V., Petrushin V. N. (2004) Biometrija plodovyh kultur. Michurinsk: MichGAU. (rus)