Використання теорії марківських процесів при проектуванні моделі переходу і спостереження інтелектуальних агентів керування локомотивом

Горобченко О. М.

УДК 629.4.05:629.4.016.12 ГОРОБЧЕНКО О. М., к.т.н., доцент (Дон1ЗТ).

Використання теори марк1вських процеив при проектуванш модел1 переходу 1 спостереження штелектуальних агент1в керування локомотивом.

Постановка проблеми.

Використання штелектуальних систем при керуванш локомотивами розкри-вае широкi можливостi для тдвищення ефективностi використання локомотивiв. Важливе значення тут приймае проекту-вання штелектуальних агентсв, що забез-печать генеращю керуючих рiшень в за-лежносп вiд по'1зно'1 обстановки.

Анал1з дослщжень 1 публ1кац1й.

Питання використання штелектуальних систем е одним з актуальних для залiзничникiв [1, 2]. В [3] представлено загальш тдходи до розробки мереж при-йняття рiшень, де баесовськi мережi ком-бiнуються з вузлами додаткових титв, що визначають дiю i корисшсть. В загальнiй формi будь-яка мережа являе собою шфо-рмацiю про поточний стан агента, його можливi дп, стан, що буде результатом дано'1 дп, та про корисшсть цього стану. Тому приймаемо таку мережу в якост ос-нови для реалiзацii агенпв, що д^ть з урахуванням корисностi.

Формулювання цшей статт1.

Важливою ланкою в робот штелек-туального агента е мехашзм переходу (ви-бору наступного ршення) та спостереження (оцiнки поточного стану навколишнього середовища). Завданням даного досль дження е визначення теоретичного тдгру-нтя для моделювання цих механiзмiв.

Викладення основного матер1алу.

Проектування агента керування локомотивом виконаемо для частково спо-стер^аемих, стохастичних варiантiв середовища. Це обумовлено неможливютю однозначно визначити вс параметри, що впливають на прийняття рiшення при ке-руваннi.

Для розробки моделi переходу i спостереження опишемо змiну стану навколишнього середовища як ряд зшмюв, ко-жен з яких визначае ситуащю в даний кон-кретний момент часу. Кожний зшмок, або часовий зрiз, мiстить множину випадкових змiнних, причому одна частина з них е такою , що спостер^аеться, а шша - ш.

Для визначеностi у подальших мiрку-ваннях приймемо, що агент здшснюе керування гальмами по'1'зду. У випадку контролю гальмування в кожному часовому зрiзi е такою, що спостер^аеться, одна i таж тд-множина змiнних. Використаемо Хг для позначення множини змшних, що не спо-стерiгаються тд час 1;, та Ег для позначення множини змшних, що спостер^аються. Результата спостереження тд час 1 являють собою множину Е|=е1.

Спрощений приклад керування гальмами виглядае наступним чином. Агенту перед гальмуванням потрiбно визначити стан поверхш головки рейок. Однак безпосередньо це не можливо зробити з локомотива, що рухаеться. Побiчно шфо-рмацiя про поверхню рейки (а значить i про поточний коефщент зчеплення) може бути отримана шляхом вимiрювання таких параметрiв, як вологють та температура повггря. Таким чином кожний про-

мiжок часу 1 множина Е включае двi змiннi Вг та Тг, що показують величини вологосп та температури зовнiшнього по-вiтря. Множина Хг мiстить едину змшну С що характеризуе стан рейок. Таким чином св^ спрощено! задачi визначення стану рейок може бути представлений змшними стану Сь С2, С3, ... та змiнними свiдоцтв В1, Т1, В2, Т2, В3, Т3, ..

Пiсля того як обранi множини змш-них становища й змшних свiдоцтва для дано! конкретно! задачi гальмування, на наступному етапi необхiдно визначити залежносп мiж цими змiнними. Ми буде-мо розмiщати змiннi в деякому порядку й вiдповiдаючи на питання про умовну не-залежнiсть змшних-спадкоемщв, якщо дана деяка множина батьювських змш-них. Одним з очевидних варiантiв е упо-рядкування змшних у !х природнiй часо-вiй послiдовностi, оскiльки причина зви-чайно передуе результату, а нам потрiбно вводити змшш у причиннiй послщовносп.

Тут виникае проблема того, що доводиться мати справу з такою кшькютю батькiвських змiнних, котра в принцип може стати нескiнченною. Вона виршу-еться завдяки прийняттю так званого мар-

кiвського припущення, яке полягае в -пм, що поточний стан залежить лише вiд кш-цево! юторп попереднiх станiв. 1снуе кшь-ка рiзновидiв таких процеав. Найпрость шим з них е марювський процес першого порядку, у якому поточний стан залежить тiльки вщ попереднього стану i не залежить вщ бiльш раннiх сташв.

З використанням прийнято! системи позначень вщповщне твердження про умовну незалежшсть дозволяе сформулю-вати для вах г наступне спiввiдношення:

Р(Х1|Хо:1-1) = РСВД.О (1)

Таким чином, у марювскому процесi першого порядку закони, що описують, як стан розвиваеться в чаа, повнiстю пред-ставленi в умовному розподiлi Р(Х1|Х1.1), що ми будемо називати моделлю переходу для процеав першого порядку. Модел-лю переходу для маркiвського процесу другого порядку е умовний розподш

р(Хг|Хг-ь Хг-2).

Структура байесовських мереж, вщ-повiдна маркiвському процесу першого порядку, наведено на рисунку 1.

Рисунок 1. - Баесовська мережа, що вщповщае марювському процесу 1-го порядку

Потрiбно визначити правомiрнiсть використання теорп маркiвських процесiв для опису процеав керування по!здом i, зокрема, процеав гальмування.

В якостi прикладу розглянемо пока-зник «гальмiвноi ефективносп». Цей тер-мiн часто зустрiчаеться на практищ, але не мае кшьюсного вимiрювання. Пiд ним припускаеться довжина гальмiвного шляху, що залежить вщ багатьох факторiв: швидкостi гальмування, уклону, типу га-льмiвних колодок, !х натискання i т.д. Не-

прямi показники гальмiвноi ефективностi: розрахунковий гальмiвний коефiцiент i питома гальмiвна сила - зорiентованi на оцшку тiльки максимальних гальмiвних параметрiв без урахування динамши !х змiнення. У зв'язку з цим введений штег-ральний показник - коефщент використання зчеплення % [4].

,

де ВТ(1;) - гальмiвна сила по'1'зда як фун-кщя часу;

— сила опору руху, що виникае мiж колесами та рейками як функщя часу 1;

Бсц(1) — потенцiйна (таблична) сила зче-плення колiс як функцiя 1.

Не враховуючи незначш сили опору W(t), вираз (2) можна перетворити насту-пним чином

щ =

Г1'

к1

(3)

Тодi в узагальненому виглядi коефь щент г|у знаходиться, якщо вщом1 три ш-ших параметра: flp - розрахунковий галь-

м1вний коефщент, - коефщент темпу зростання гальмiвного натискання, -коефiцieнт вiдношення тертя до зчеплен-ня, наступним чином

%=-9p% Лф/V

(4)

(5)

де n^i - величина коефiцieнта використання зчеплення в i-ий момент часу;

nvi-i - величина коефщента використання зчеплення в i-1-ий момент часу;

- випадкова величина вщхилен-ня коефщента використання зчеплення в даний момент часу;

а - коефщент, що залежить вiд ш-тенсивностi зниження швидкостi.

Доведемо, що процес, описаний ви-разом (5) е маркiвським.

Представимо вираз (5) в наступному виглядi

nvi- =Дп

Vi

(6)

Перший множник дорiвнюе його максимальному розрахунковому значенню.

залежить вiд багатьох випадко-вих факторiв, таких як техшчний стан га-льмiвноï маriстралi (кiлькiсть та штенсив-нiсть витоюв повiтря), жорскостей пружин гальмiвних цилiндрiв, вiльностi пере-сування поршней в окремих цилiндрах, технiчного стану пов^ророзподшьниюв та iнших.

Якщо розглядати коефщент пф/у, то його величина також залежить вщ випад-кових параметрiв: коливання хiмiчного складу колодок та бандаж1в у межах до-пускiв, рiзницi в зношеннi колодок, рiзни-цi дiаметрiв бандажiв, коливанш прокату по колу кочення колю.

Тому робимо висновок, що величина коефщента використання зчеплення е ви-падковою у визначених межах для кожного поïзду. В такому випадку ефектившсть гальм поïзда в кожний момент часу ви-значаеться виразом

Нехай Д%~К(0,о2), де 0 - середне, g2 - дисперая.

В формулi (6) рiзниця мае гауссов-ський процес розподшення N(0,g2), або:

(7)

(8)

Вираз (7) отриманий з (8) та (6) шляхом замши Дп^ на n^- a-nvi-1. Оскшь-ю величини Дп^ незалежнi за умовою, то маемо:

ДДПуо, ДПу1, ДПу2,... ДПуп) = =Р(ДПуо) Р(Д%0 Р(ДПу2)^ Р(Дп^п) = =P(nV2lnvl) P(nV3lnV2) Р(П^Пуз). • •

... Р(пЛ-1) (9)

Вираз (9) доводить те, що процес (5) е марювським.

Аналопчно можна привести i iншi процеси керування поïздом до марювсь-ких.

Повертаючись до розробки модел^

потр1бно, KpÍM обмеження кшькосп бать-кiвських Змiнних, що вщносяться до 3MÍH-них стану Xt, обмежити кiлькiсть батьюв-ських змшних, що вщносяться до змшних свщоцтва Et. Змiннi свiдоцтва пiд час t за-лежать тiльки от поточного стану :

,P(Et|Xo:t,Eo:t-l) = P(Et|Xt) (10)

Висновки

Умовне розподшення P(Et|Xt) нази-ваеться моделлю сприйняття, оскiльки во-но показуе, як фактичний стан впливае на результати сприйняття, тобто на змшш свщоцтва. Розроблену модель можна ви-користовувати при проектуванш штелек-туальних агенпв. До ïï переваг вщносить-ся те, що вона вщносно легко може бути реалiзована на ЕОМ.

Список лггератури

1.Доступний з http://www.vniias.ru /index.php/news/34-2010-03-15-06-33-16/267--1-r.htm1, 4.09.2011.

2. Доступний з http://www.zdt-magazine.ru/pub1ik/exibition/2009/05-09.htm, 4.09.2011.

3. Рассел Н., Стюарт П. Искусственный интеллект: современный подход. -М.:Издательский дом «Вильямс», 2006. -1408 с.

4. Асадченко В. Р. Автоматические тормоза подвижного состава. -М.:Маршрут, 2006. - 392 с.

Анотацн:

Обгрунтовано використання теори маршв-ських процеав для моделювання штелектуальних агенпв керування локомотивом

Обосновано использование теории марковских процессов для моделирования интеллектуальных агентов управления локомотивом.

Use of the theory Markov processes for modelling intellectual agents of management by the locomotive is proved.

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Горобченко О. М.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Горобченко О. М.