УДК 656.1:51.001.8
ПРОГНОЗУВАННЯ КІЛЬКОСТІ ДОРОЖНЬО-ТРАНСПОРТНИХ ПРИГОД
Л.С. Абрамова, к. т.н., доцент,
М.С. Чорнобаєв, аспірант, ХНАДУ
Анотація. Досліджено модель прогнозу зміни кількості дорожньо-транспортних пригод, що може бути застосована при вирішенні питань організації безпеки дорожнього руху з метою розробки заходів, які дозволять знизити рівень аварійності на транспортній мережі. Наведено порівняльний аналіз прогнозування методом лінійної регресії й апроксимації даних та часових рядів.
Ключові слова: модель, прогноз, дорожньо-транспортна пригода, аварійність, аналіз часових рядів, лінійна регресія, апроксимація.
Вступ
Головною метою функціонування транспортної системи є забезпечення безпеки учасників транспортного процесу. Загальним показником рівня безпеки на транспортній мережі є кількість дорожньо-транспортних пригод (ДТП). Але сьогодні цей показник є тільки звітним чинником у відповідних органах управління та регулювання дорожнім рухом.
Відмінною рисою сучасного етапу розвитку наукових напрямків у галузі транспортних систем є застосування статистичних методів для перевірки гіпотез, обґрунтованого формування статистичних вибірок, побудови математичних моделей транспортних процесів.
Відомі теоретичні дослідження дозволяють розв’язують практичні задачі статистичної оцінки кількості ДТП [1].
Аналіз публікацій
Розглянемо основні умови побудови моделі прогнозу [1]:
- при побудові залежностей і подальшому прогнозі на їх підставі передбачається, що сукупність чинників, які діють на досліджувану характеристику, не зміниться в прогнозований період;
- зі збільшенням періоду зменшується точність прогнозу. При дослідженні часових рядів слід пам’ятати, що у багатьох випадках час не є змінною, від якої залежить досліджуваний процес. Насправді існує один або декілька чинників, залежних від часу, але ми не можемо їх знайти або виміряти.
Побудова залежності відбувається у декілька етапів:
- виділення тренда й отримання його математичної моделі;
- виключення тренда з даних;
- побудова математичної моделі сезонної складової для даних, в яких виключено тренд;
- виключення сезонної складової з даних;
- побудова математичної моделі циклічної складової для даних, в яких виключено тренд і сезонну складову;
- отримання підсумкової моделі як суми двох моделей тренда і періодичних складових.
Вибір форми тренда є неформальною задачею. Необхідно застосовувати різні варіанти виду тренда і використати для побудови моделі прогнозу різні фрагменти ряду даних. Найбільш розповсюдженим є застосування експонен-ціального або лінійного наближення, основаного на положенні, що статистичний ряд у своїх окремих частинах має форму, близьку до експоненти.
Мета і постановка задачі
При сучасному рості автомобілізації великих міст виникає потреба передбачати можливу зміну рівня безпеки на транспортній мережі за допомогою визначення очікуваної кількості ДТП у майбутньому.
Задача прогнозу при проведенні досліджень у даному напрямку достатньо типова. За інформацією за попередній період часу, необхідно передбачити поведінку системи у наступний період. Частіше за все для цього може бути застосований аналіз часових рядів або регресійний аналіз.
Розв’язання задачі
При побудові моделі прогнозу необхідно визначити характер розподілу статистичного ряду і зале-жно від властивостей ряду обрати метод прогнозу. В нашому випадку буде застосовано методи, що враховують та ігнорують періодичну складову ряду.
Розглянемо ситуацію, коли при побудові моделі прогнозу враховується періодична складова. Побудову моделі і прогноз у таких випадках виконують за такою схемою [1]:
- будують графік залежності досліджуваної величини, від часу;
- за видом графіка обирають вид тренда;
- будують регресійну модель тренда;
- з отриманих відгуків виключають значення, одержані по регресійній моделі;
- для отриманої похибки будують періодичну модель;
- підсумкову модель одержують як суму відповідних моделей, регресійної та періодичної;
- за одержаною моделлю виконують прогноз.
За допомогою аналізу часових рядів можна дослідити процеси, відгуки яких визначені через рівні проміжки часу. Ці відгуки безпосередньо або побічно залежать від часу. Модель має такий загальний вигляд [1, 2]:
у( ) = їг ( ) + 5 () + С ( ) + £, (1)
де ґг(ґ) - тренд є складовою, що плавно змінюється та відображає вплив показників, що надають довготривалу дію. Зміна значень може мати тривалу тенденцію до зниження або підвищення та відображає зміну зовнішніх факторів; Б(ґ) - сезонна складова, що відображає регулярну повторюваність процесів у часі; З(ї) - циклічна складова, що описує тривалі періоди відносного спаду або підйому. Зміна рівня показників залежить від багаторічних циклів тощо.
Теоретично до цих складових додаються так звані інтервенції, тобто різкі зміни під впливом непередбачених обставин, які неминучі, але їх практично не можна визначити і локалізувати в часі з точки зору можливості передбачення.
Тренд апроксимують із застосуванням одновимі-рної поліноміальної регресії.
Число к підбирають експериментальним шляхом для забезпечення найкращої апроксимації. Значення ґ - це номери часових періодів (місяць, квартал, година, рік). У гармонійному аналізі к позначає так звану гармоніку. Тоді її значення і відповідно кількість членів моделі може бути від
1 до п/2. Значення п визначає кількість часових
інтервалів.
Значення коефіцієнтів а§, аг- , Ьг- розраховують за формулами [2]
а0 =
Z ytj j=1
n
ai =
2 -Z ytjcos it
j=1
n
2-Z yj
sin it
bi =■
j=1
n
(3)
(4)
(5)
На підставі розглянутого методу було визначено функціональну залежність зміни кількості дорожньо-транспортних пригод залежно від року, що дозволяє провести прогнозування майбутніх рівнів аварійності по місяцях наступного року.
На основі статистичних даних, отриманих нами при аналізі аварійності у великих містах, була визначено модель прогнозу зміни кількості ДТП.
Лінійна складова моделі має вигляд
Ул (ґ) = 10,8 +15,2-ґ.
Загальний вигляд моделі, з урахуванням періодичної складової, буде таким:
у(ґ + Аґ) = 10,8 + 15,2(ґ + Аґ) + 2 - п - (ґ - Аґ -1)
+ 22,6 - cosí
-16,5-sin
At
'2-n-(t-At -l)
At
Для апроксимації періодичної складової використовують регресійну модель такого вигляду [1]:
к
yt = a0 + ^ (ai cos it + b sin it). (2)
i=1
На підставі отриманих значень (звітні дані щодо ДТП за 2004 рік) побудовано графік, який
ДТП
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Умовні позначення:
-----Лінійна залежність - - - ■ Функція часових рядів -------------------Статистика
Рис. 1. Процес розвитку часового ряду
Місяць
відображає процес розвитку тенденції зміни ДТП у часі на 2005 рік (рис. 1). Відсутність періодичності у досліджуваному процесі дозволяє застосовувати під час прогнозу одномірний регресій-ний аналіз.
Для таких випадків будується одновимірна регресія та досліджується залежність відгуку від однієї змінної, якою є час. Слід зазначити, що однови-мірна регресія не означає, що в моделі тільки один регресор - у ній може бути декілька ступенів для полінома або декілька членів періодичної функції.
Найбільшу частину прогнозів складають прості короткострокові прогнози, у більшості випадків лінійні. Цец прогноз виконують таким чином [3]:
- будують графік залежності досліджуваної величини від часу;
- відповідно до характеру поведінки графіку обирають інтервал даних, які будуть застосовані при апроксимації;
- відповідно до характеру графіка на обраному інтервалі визначають ступінь залежності;
-при необхідності застосування залежності другого ступеня і вище дані відповідно перетворюють;
- будують регресійну модель;
- за одержаною моделлю виконують прогноз.
У зв'язку з певними обмеженнями можна сформулювати загальні рекомендації до застосування при прогнозі зміни часового ряду одномірного регресійного аналізу:
- вид апроксимуючої функції необхідно обирати,
виходячи з теоретичних положень;
- при виборі моделі слід віддавати перевагу більш простій і грубій моделі перед складною і точною;
- використовувати непараметричну регресію, в якій коефіцієнт визначається як медіана розрахованих коефіцієнтів для різних точок прогнозу;
- якщо це можливо, частину точок потрібно виділяти в контрольну вибірку, за якою слід перевіряти одержану модель.
Лінійна регресійна модель пронозу має такий вигляд [3]:
у(і) = а0 + ах-і, (6)
де а0, ах - коефіцієнти регресійної моделі.
У рамках дослідження нами пропонується визначити прогнозне значення кількості дорожньо-транспортних пригод по місяцях на 2005 рік на підставі відповідних значень за попередні чотири роки.
У табл. 1 наведено загальний вигляд отриманих моделей зміни кількості дорожньо-транспортних пригод по місяцях.
Інтерполяційна модель дозволяє оцінити значення функціональної залежності даних в інтервалах між її вузловими точками. Для цього застосовують функції, значення яких у вузлових точках збігаються з координатами цих точок. Модель такого виду являє собою кусково-гладку функцію. Застосування функцій такого виду ускладнює процес подальших досліджень.
Таблиця 1 Результати моделювання
Місяць Тренд
Січень у() —17686 - 8,8- і
Лютий у (і) — 25296,5 -12,6-і
Березень у (і) — 37923 -18,9-1
Квітень у (і) — 31317,5 -15,6-1
Травень у (і) — 29106,5 -14,5-1
Червень у (і) — 31526,5 -15,7- і
Липень у (і) — 15110 - 7,5-і
Серпень у(і) — 4883,5 - 2,4- і
Вересень у (і) —-38936,5 +19,5-і
Жовтень у (і) —-38936,5 +19,5-і
Листопад у (і) —-30522 +15,3- і
Грудень у (і) —-18327,5 + 9,2- і
¥ (і) — а0 + а^і + а2І +... + апі
(7)
При цьому альтернативою є метод апроксимації даних, що дозволяє одержувати опис деякого набору значень параметра у вузлових точках безперервною залежністю.
Графік апроксимуючої функції може не проходити через вузлові точки, але наближати їх з деяким середньоквадратичним відхиленням. Отримана функція безперервна на інтервалі дослідження та дає більш широкі можливості для подальших досліджень порівняно з інтерполяційною залежністю.
Для підвищення точності апроксимації застосовують поліноми високих ступенів вигляду [4]
де а0, аь...аи - коефіцієнти полінома при відповідних ступенях змінної і .
У рівнянні (7) при моделюванні зміни ДТП у часі значення Г (і) визначаємо як кількість ДТП, а змінну і - як час.
Визначення коефіцієнтів апроксимуючого полінома проводили в середовищі МаНаЬ із застосуванням розробленої програми, що дозволяє дослідити зміну ДТП у часі з використанням апрок-симуючих поліномів до дев’ятого степеня. Результатом моделювання є поліном і відповідний йому графік функції, що найбільш точно описують вихідні дані за критерієм середньоквадратич-ного відхилення.
Отримані лінійні функції прогнозу на 2005 рік дозволяють визначити поліноміальну залежність зміни кількості ДТП.
Аналітичний вид функції досліджуваної залежності має вигляд
у — -0,018392-х5 + 0,33077-х4-1,6635-х3 + + 4,0174-х2 -7,2783-х + 40.601.
Отримані результати моделювання у вигляді графіка функції полінома наведено на рис. 2.
Рис. 2. Поліноміальна залежність зміни ДТП у 2005 році
Процедура оцінки адекватності отриманої моделі, основана на порівнянні вимірювань на реальній системі і результатів прогнозування, може проводитися різними способами.
Найбільш відомими є такі [1, 2]:
- за середніми значеннями відгуків моделі і системи;
- за дисперсіями відхилень відгуків моделі від середнього значення відгуків системи;
- за максимальними значенням відносних відхилень відгуків моделі від відгуків системи.
Розглянуті способи оцінки достатньо близькі між собою по суті, тому в рамках даних досліджень обмежимося аналізом на підставі першого методу.
Розрахункове значення кількості дорожньо-транспотних пригод розраховується за двома моделями часових рядів та поліноміальної залежності. Результати визначення прогнозу на 2005 рік наведено у табл. 2.
Таблиця 2 Значення кількості ДТП у 2005 році
Місяць Натурні вимірю- вання Модель часових рядів Поліномі-альна модель
Січень 46 181 42
Лютий 31 206 34
Березень 26 207 29
Квітень 41 213 40
Травень 30 226 34
Червень 45 247 48
Липень 72 273 73
Серпень 74 303 72
Вересень 164 331 161
Жовтень 180 356 185
Листопад 159 373 155
Грудень 117 383 119
Для порівняння результатів будується діаграма, на якій відображено відповідні значення дорожньо-транспортних пригод у 2005 році статистичні та розрахункові (рис. 3).
Умовні позначення:
□ Статистичні дані Ш Модель часових рядів □ Поліноміальна модель
Рис. 3. Порівняльний аналіз отриманих результатів
Висновки
Аналіз результатів моделювання і порівняння їх зі статистичними даними державної автоінспекції дозволив зробити висновок, що модель поліномі-альної регресії є більш адекватною і може бути застосована при моделюванні зміни кількості дорожньо-транспортних пригод у часі.
Запропонований підхід при прогнозуванні зміни кількості ДТП у часі може мати практичне значення для відповідних органів, що займаються питаннями організації безпеки дорожнього руху з метою розробки заходів, які дозволять знизити рівень аварійності на транспортній мережі.
Література
1. Вероятностные и имитационные подходы к
оптимизации автодорожного движения / Буслаев А.П., Новиков А.В., Приходько В.М. и др. - М.: Мир, 2003. - 368 с.
2. Владимирова Л.П. Прогнозирование и плани-
рование в условиях рынка. - М.: ИД «Дашков и Ко», 2001. - 308 с.
3. Бокс Дж., Дженкинс Г. Анализ временных ря-
дов прогноз и управление. - М.: Мир, 1974. - 401 с.
4. Лапач С.Н., Чубенко А.В., Бабич П.Н. Стати-
стика в науке и бизнесе. - К.: Морион, 2002. - 640с.
Рецензент: Є.В. Нагорний, професор, д.т.н.,
ХНАДУ.
Стаття надійшла до редакції 15 вересня 2006р.
51