МЕТОД ПЛАНУВАННЯ МАРШРУТУ В АВТОНОМНИХ ЛОГІСТИЧНИХ КІБЕРФІЗИЧНИХ СИСТЕМАХ ЗАСОБАМИ ШТУЧНОГО ІНТЕЛЕКТУ

І. А. Головатенко; А. В. Писаренко

УДК 004; 004.8; 004.9 DOI https://doi.Org/10.35546/kntu2078-4481.2023.4.27

I. А. ГОЛОВАТЕНКО

асшрант кафедри шформацшних систем та технологш Нацюнальний техшчний ушверситет Украши «Кшвський полiтехнiчний iменi 1горя Сшорського» ORCID: 0000-0003-0951-5687

А. В. ПИСАРЕНКО

кандидат техшчних наук, доцент, доцент кафедри шформацшних систем та технологш Нацюнальний техшчний ушверситет Украши «Кшвський полггехшчний iменi 1горя Сшорського» ORCID: 0000-0001-7947-218X

МЕТОД ПЛАНУВАННЯ МАРШРУТУ В АВТОНОМНИХ ЛОГ1СТИЧНИХ К1БЕРФ1ЗИЧНИХ СИСТЕМАХ ЗАСОБАМИ ШТУЧНОГО 1НТЕЛЕКТУ

У цш cmammi представлено ¡нновацгйний nidxid, заснований на алгоритмi A*, який мгстить кшька клю-чових модифiкацiй для значного пiдвищення його функцiональностi та ефективностi в автономнiй навiгацii автомобiля. nidxid надае прiоритет безnецi та дотриманню правил дорожнього руху шляхом iнтеграцii алгоритму A* з мехатзмом, який контролюе безпечну вiдстань до перешкод. КрiM того, введено компонент згладжування траекторП. Цей компонент покращуе юнцевий шлях, створюючи бшьш плавну та комфортну траекторiю. Виявлення небезпечних дшянок траекторП е ще одним фундаментальним аспектом запро-понованого пiдxоду. Досягаеться це шляхом застосування кластеризацП методом k-середнix, потужного методу машинного навчання. Завдяки кластеризацП сегментiв траекторП система може розпгзнавати кри-тичнi ситуацП, так як рiзкi повороти та рух смугою зустрiчного руху. Виявлення цих сегментiв дозволяе вживати проактивних коригувальних дш для перетворення потенцiйно небезпечних сценарПв на безnечнiшi альтернативи. Одним iз революцшних елементiв niдxоду е впровадження технологи навчання з тдкртлен-ням (Reinforcement Learning - RL). Сnецiальна модель RL адаптуеться до динамiчниx перешкод у режимi реального часу, niдвищуючи здатнiсть системи швидко й ефективно реагувати на несnодiванi ситуацП на дорозi. Ця адаnтивнiсть е ключовим фактором, що робить автономнi логiстичнi системи бiльш безпечни-ми таунiверсальними. Таким чином, метод пропонуе комплексне та iнтелектуальне ршення для планування маршруту в автономних кiберфiзичниx логiстичниx системах. Поеднуючи алгоритм A* i-з найсучаснiшими методами уникнення перешкод, згладжування траекторП, визначення небезпеки та адаnтивностi RL, про-кладаеться шлях до безnечнiшоi, ефективнiшоi та адаnтивнiшоi автономно'1' логiстики. Цей niдxiд мае nотенцiал для революцП в галузi транспортування та доставки, пропонуючи переконливе бачення майбут-нього, де автономнi транспортт засоби рухатимуться дорогами з найвищим рiвнем безпеки, вiдnовiдностi та ефективностi.

Ключовi слова: кiберфiзичнi системи, автономнi об'екти, планування маршруту, штучний iнтелект, логiс-тика, reinforcement learning.

I. A. HOLOVATENKO

Postgraduate Student at the Department of Informational Systems

and Technologies National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" ORCID: 0000-0003-0951-5687

A. V. PYSARENKO

Candidate of Technology, Associate Professor, Associate Professor at the Department of Informational Systems and Technologies

National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" ORCID: 0000-0001-7947-218X

METHOD OF ROUTE PLANNING IN AUTONOMOUS LOGISTICS CYBERPHYSICAL SYSTEMS

USING ARTIFICIAL INTELLIGENCE

This paper presents an innovative approach based on the A* algorithm, which includes several key modifications to significantly improve its functionality and efficiency in autonomous vehicle navigation. The approach prioritizes safety and traffic compliance by integrating the A* algorithm with a mechanism that monitors the safe distance to obstacles. In addition, a trajectory smoothing component is introduced. This component improves the final path, creating a smoother and more comfortable trajectory. Detection of dangerous sections of the trajectory is another fundamental aspect of the proposed approach. This is achieved by applying k-means clustering, a powerful machine learning method. Thanks to the clustering of the trajectory segments, the system can recognize critical situations such as sharp turns and driving in the oncoming traffic lane. Identifying these segments allows proactive corrective actions to be taken to transform potentially dangerous scenarios into safer alternatives. One of the revolutionary elements of the approach is the introduction of Reinforcement Learning (RL) technology. The special RL model adapts to dynamic obstacles in real time, increasing the system's ability to respond quickly and efficiently to unexpected road situations. This adaptability is a key factor that makes autonomous logistics systems more secure and versatile. Thus, the method offers a comprehensive and intelligent solution for route planning in autonomous cyber-physical logistics systems. By combining the A* algorithm with state-of-the-art obstacle avoidance, trajectory smoothing, detection of dangerous segments, and RL adaptability, the path to safer, more efficient, and more adaptive autonomous logistics is being paved. This approach has the potential to revolutionize transportation and delivery, offering a compelling vision of a future where autonomous vehicles will navigate the roads with the highest levels of safety, compliance and efficiency.

Key words: cyber-physical systems, autonomous objects, route planning, artificial intelligence, logistics, reinforcement learning.

Постановка проблеми

Традицшш алгоритми A* BWMi своею ефектившстю та точшстю у пошуку найкоротшого шляху в pi3HOMaHiT-них застосуваннях, ввд комп'ютерних irop до робототехшки. Однак у кiберфiзичних лопстичних системах юнуе бшьш тонкий rn6ip критерпв, яким мае задовольняти тpaектopiя. Просто знайти най-коротший шлях недостатньо. Щоб автономний об'ект м^ безпечно та ефективно пересуватися складною мюцевютю, тpaектopiя мае уникати перешкод, дотримуватися смуг розмгтки, адаптуватися до динашчного середовища та бути достатньо плавною для забезпечення комфорту та безпеки.

З практично! точки зору проблема автономного керування е дуже актуальною. У таких умовах автономний об'ект стикаеться з безлiччю проблем, включаючи pухoмi перешкоди (iншi автономш об'екти, шшоходи), статичш перешкоди (бар'ери, poздiлювaчi) i складш правила водшня (розмита смуг руху, заборонен зони). Планування траекторп також мае бути здатним щентиф^вати «небезпечш фрагменти», як-от круп повороти, або випадки, коли транспортний зааб може бути змушений рухатися смугою зус^чного руху, i завчасно адаптувати шлях для зменшення ризишв. Ц складносп роблять завдання планування траектори в реальних лопстичних програмах набагато складшшим, шж те, що здатш виршити традицшш алгоритми пошуку шляху.

Удосконалення традицшних алгоритмш A* шляхом включення здатносп адаптуватися до складних критерпв реального свпу сприяе бiльшoму науковому об'ему знань у таких галузях, як штучний iнтелект, po-бoтoтехнiкa та обчислювальна лoгiстикa. Цей прогрес може прокласти шлях до бшьш надшних та штелектуальних автономних систем, здатних приймати ршення в pежимi реального часу, яш враховують широкий нaбip змшних i обмежень. Так1 досягнення можуть поширитися на iншi сфери, включаючи нав^ацш безпiлoтникiв, складську робототех-шку та iншi проблеми прийняття ршень у складних середовищах.

З практично! точки зору, модифжований алгоритм A* може революцюшзувати роботу автоматизованих систем у системi лoгiстики. Наприклад, у гaлузi автономних лoгiстичних oб'ектiв безпечнiшi та ефективнiшi алгоритми нaвiгaцi! можуть призвести до значного зменшення кшькосп аварш на дорогах, споживання палива та часу в дopoзi. Пoдiбним чином в упpaвлiннi ланцюгом постачання poзумнiшi алгоритми визначення шляху можуть сприяти швидшим i безпечнiшим доставкам, тим самим зменшуючи витрати та тдвищуючи загальну ефективнiсть.

Прямо виpiшуючи цi прогалини та проблеми, дане дослвдження не лише додае тонкий piвень склaднoстi до ведомого алгоритму, але й слугуе важливою вiхoю на шляху до створення бшьш автономних i безпечнiших транспортних систем.

Шдводячи пiдсумoк, проблема полягае не просто в пошуку шляху, а в пошуку найбшьш «ввдповщного» шляху з огляду на складний нaбip обмежень реального свпу. Модифжащя алгоритму A* для задоволення цих потреб е кроком вперед як у наукових дослщженнях, так i в практичних застосуваннях.

Аналiз досл1джень i публшацш

Нaйпеpшi алгоритми планування шляху, таю як A*, створили платформу планування шляху для автономних об'екпв [1]. Проблема використання цих метoдiв полягае в кiнетичних обмеженнях, що не зводяться до геометричних.

Деяш останш роботи вир1шують цю проблему, модершзуючи стар1 методи планування траекторП та викорис-товуючи кинематику транспортного засобу в процес планування, так1 як RRT та hybrid-A* [1].

Hybrid A* е одним i3 найефектившших планувальнишв маршруту для автономних об'екпв. Найперша верая цього планувальника представлена на DARPA Urban Challenge 2007 [1]. Використовуючи цей шдхвд до планування шляху, найважлившим пунктом, який з'еднуе дискретний i безперервний проспр станiв один з одним, е те, як розширити алгоритм пошуку та вибрати правильнi наступнi вузли для просування далi. Цей метод реалiзуе кинематику транспортного засобу для вибору наступних потенцiйних вузлiв.

Тим не менш, вищевказаний метод боровся з деякими проблемами, як1 робили реалютичне застосування цього методу дещо проблематичним, наприклад, слвдування за шлькома маршрутними точками та наявнiсть бшьш реа-лютично! евристично! функцп вартосп для A*. Цi проблеми будуть бiльш помiтними на великiй карп, де цiльова позицiя знаходиться дуже близько до початково! позици, але фактична ввдстань руху до цшьово! областi досить значна.

Автори у [2] наводять свою модифiкацiю алгоритму А*, використовуючи ^rai Рiдса-Шеппа. Основною метою використання методу кривих Рвдса-Шеппа е тдвищення точностi та пришвидшення пошуку, осшльки даний метод е добре вщомим методом для переходу ввд конф^рацп

[хо>УоА>] С1)

до шшо! конфпурацп

[vv0*] (2)

найкоротшим шляхом. Детальшше про кривi Рiдса-Шеппа можна знайти в [3]. Як доведено тд час моделю-вання, запропонований алгоритм створював бiльш плавнi маршрути та мав принаймнi рiвний або нижчий ризик зiткнень з навколишшми перешкодами порiвняно з маршрутами, створеними звичайним hybrid-A* методом. Недолiком е те, що час обчислення запропонованого аналiтичного розширення збiльшуеться приблизно в десять разiв.

У дослiдженнi [4] описано метод згладжування шляху A* для мобшьного роботу. Представлена схема згладила шлях, створений A*, як показано в результатах, але запропонований метод не виршив проблему часу обчислення шляху.

У [5] представлений метод визначення оптимально1 ваги евристично1 функцп для алгоритму A*, щоб мшмь зувати час пошуку шляху алгоритмом за рахунок приведення релевантностi батьшвського вузла поточного вузла до евристично1 функцп. Час пошуку шляху зменшуеться за допомогою оптимально1 евристично1 функцп, але довжина шляху збiльшуеться.

В робоп [6] запропонований вдосконалений алгоритм A* для досягнення плавностi шляху включенням кое-фiцiента вiдстанi до перешкоди в евристичну функцiю для пошуку спшьного мiж довжиною шляху та його без-пекою, ^норуючи пошук недiйсних вузлiв, якi знаходяться надто близько до перешкод. Результата показують, що плавшсть траекторп покращилася порiвняно з традицiйним методом.

Пбридний алгоритм запропонований у [7]. Алгоритм спочатку використовуе алгоритм Дейкстри для визначення початкового шляху, а попм, у разi потенцiйного згткнення з динамiчною перешкодою, використовуеться принцип рухомого вiкна для вибору локальное' оптимально1 цшьово1 точки. Базовий алгоритм A* використовуеться для пошуку нового шляху ввд поточного мюця розташування до мети. Час повторного планування скороче-ний порiвняно з традицшним, але значного покращення довжини шляху досягти не вдалося.

У [8] представлений пбрид алгоритму A* та методу штучного потенцшного поля, для уникання динамiчних перешкод i заходження коротшого шляху. Запропонований метод зменшив довжину шляху, але пошук шляху зайняв бiльше часу.

Дослвдження [9] пропонуе вдосконалений алгоритм A* i деякi новi методи для подальшого покращення про-дуктивностi. Впроваджена стратегiя згладжування траекторil, для усунення зайвих точок i точок перегину та зменшення частих змiн напрямку руху мобiльних роботiв. Пiдвищений мехашзм безпеки, щоб уникати перешкоди. Для скорочення часу пошуку та пвдвищення ефективностi алгоритму додана модель витрат та функцiя адаптивнох вартосп.

Розглянутi алгоритми планування шляху, зосереджеш на пошуку найкоротшого шляху мгж початковою та концевою точками в заданому середовищi. У цiй робоп проводиться розроблення та теоретичне обгрунтування методу, який покращуе звичайний алгоритм A* шляхом: уведення обмежень результуючо1 траекторil для безпеч-но! нав^ацп; впровадження етапу згладжування траекторil для ll вiдповiдностi фiзичним особливостям автономного об'екту; кластеризацil методом k-середшх для визначення небезпечних особливостей запланованоl траекто-рil; та використання моделi навчання з пiдкрiпленням для уникнення перешкод у реальному часi.

Постановка задачi

Задача: перевести автономний рухомий об'ект з початкового стану

S start start 'У&аЛ )'

(3)

у к1нцевий

Sgoal (Xgoal ,ygoal )

(4)

Обмеження: уникнення перешкод, дотримання смуги руху, врахування ф1зичних особливостей автономного об'екту.

Задачу можливо под1лити на дешлька етaпiв:

1) первинне планування шляху методом А* з уведенням кшькох критерпв: тримати безпечну дистaнцiю в1д перешкод; планувати шлях таким чином, щоб в1н не перетинав горизонтальну дорожню розм1тку; виконати пере-творення траекторп таким чином, щоб вона бшьше вiдпoвiдaлa ф1зичним особливостям автономного об'екту;

2) проанал!зувати отриманий шлях на наявшсть небезпечних д1лянок, таких як круп повороти або ви!зд на смугу зустр1чного руху;

3) скоригувати тpaектopiю в1дпов1дним чином, задля уникнення небезпечних д1лянок;

4) реагувати на зовн1шн1 зм1ни на шляху слщування з використанням мoделi навчання з пiдкpiпленням (reinforcement learning model).

Етап побудови мапи середовища

Цей роздш присвячений процесу створення комплексно! мапи, яку можна використовувати для планування шляху та завдань намгаци. Зокрема, використано карти формату OpenDRIVE, прийнятий стандарт для опису дорожшх мереж. Зрештою карта перетворюеться у двшковий формат, який poзмiчaе смуги розмтки та меж дор1г, що робить !! сум1сною з алгоритмами планування шляху.

На рис. 1 показана дорожня карта мюта у формат OpenDRIVE.

Рис. 1. Приклад мапи мкцевост у формат OpenDRIVE

Етап первинного планування шляху модифшэваним A*. Першочергово формуеться так звана сита (grid), що являе собою мапу, створену на першому еташ. Дaлi, отримуючи початкову та шнцеву точку алгоритм починае пошук траекторп. Нижче наведено л1стинги мовою Python модифшэваного алгоритму A*.

За основу взятий оригшальний алгоритм A*. Фрагмент коду наведений на рис. 2.

Модифжацп зазнали методи, що визначають, чи можна наступну кл1тинку стки вносити у результат, чи ш.

Для прикладу, метод is_valid визначае чи не проходить шлях через лшш розмики зустр1чних потоков або чи на достатнш вiдстaнi в1д перешкоди знаходиться об'ект. Клiтинкa, яка ввдповщае обом вимога буде додана до результуючо! траекторЦ. Фрагмент коду наведено на рис. 3.

Результат роботи модифжованого алгоритму наведений на рисунку 4 (представлена частина траекторп для бшьшого розумшня результату).

def heuristic(self, a, b): return np.sqrt((a[0] - b[0])**2 + (a[1] - b[1])**2)

def find_path(self): queue = [(0, self.start)] came_from = {self.start: None} cost_so_far = {self.start: 0}

while queue: _, current = heapq.heappop(queue)

if current == self.goal: break

directions = [(-1, 0), (1, 0), (0, -1), (0, 1), (-1, -1), (-1, 1), (1, -1), (1, 1)] for dx, dy in directions: next_cell = (current[0] + dx, current[1] + dy)

if self.is valid(next cell[0], next cell[1]): new_cost = ...

if next_cell not in cost_so_far \ or new_cost < cost_so_far[next_cell]:

priority = new_cost + self.heuristic(self.goal, next_cell) heapq.heappush(queue, (priority, next_cell))

Рис. 2. Фрагмент коду алгоритму А*

def is valid(self, x, y): rows, cols = len(self.grid), len(self.grid[0]) if 0 <= x < rows and 0 <= y < cols: cell value = self.grid[x][y]

if cell_value == 1 or self.is_near_obstacle(x, y): return False

if cell_value == 2: return False # Never move onto a lane divider

return True return False

Рис. 3. Фрагмент коду методу is_valid

Рис. 4. Фрагмент побудованоТ траекторп

Ч1тко видно, що базовий алгоритм виконуе свою задачу, знаходячи шлях у ввдповщносп до евристики.

Також видно, що модифжащя алгоритму будуе шлях, тримаючись на вщсташ в1д перешкод (меж дороги) також не перетинаючи меж роздшення зустр1чних смуг.

Також очевидно, що нараз! тpaектopiя не бере до уваги лопчш осо6ливост1 смуг руху. Саме тому вiдбувaеться ви!зд на смугу зустр1чного руху.

Етап згладжування первинноТ траектор11

Алгоритм бере за основу даш попереднього етапу та модифшуе !х у в1дпов1дност1 до задача

На рис. 5 наведено фрагмент коду, котрий для кожно! точки траекторп знаходить нaйближчi точки меж дороги та л1н1! роздшення зус^чних потоков. Дaлi м1ж отриманими точками визначаеться середина. I, врешп, вщбува-еться зaмiнa попередньо! точки на отриману.

def smooth_path(raw_path, grid):

for i in range(len(raw_path) - 1):

nearby_obstacle = sorted( find_nearby_obstacle(grid, x, y, dx, dy)

)

new_x, new_y = fmd_midpoint( nearby_obstacle[0], nearby_obstacle[-1 ]

)

smoothed_path.append((new_x, new_y))

smoothed_path.append(raw_path[-1])

return smoothed_path Рис. 5. Фрагмент коду алгоритму згладжування траекторп

Результат роботи модифшэваного алгоритму наведений на рис. 6 (представлена частина траекторп для бшь-шого розумшня результату). Алгоритм чудово впорався iз завданням згладивши гострi дiлянки поворотiв та оно-вивши траекторш, тримаючи и по середиш смуги руху.

1 II

■ и\

Рис. 6. Фрагмент модифшованоТ траекторп

Етап аналiзу траекторп на небезпечш дiлянки

Наступний етап перед визначенням остаточно1 траекторп для руху автономним об'ектом - визначення небез-печних дiлянок у запланованш траекторп. Ддлянки, як1 потребують найбшьшо1 уваги це, звiсно, крутi повороти та вшзди на смугу зустрiчного руху. Алгоритм виконуе так зване видобування «ознак» траекторil. На рис. 7 наведено фрагмент коду видобування ознак.

def get_path_labels(path, grid):

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

f1 = count_sharp_turns(chunk)

f2 = detect_oncoming_lane_violations(chunk, grid)

feature_vector = [f1, f2]

feature_vectors. append(feature_vector)

X = np.array(feature_vectors) kmeans = KMeans(n_clusters=3) kmeans.fit(X)

# Get Cluster Labels

return (chunks, kmeans.labels_)

Рис. 7. Фрагмент коду видобування «ознак» траекторп

В даному випадку видобуваються двi ознаки: гострий кут повороту та ви1зду на смугу зустрiчного руху. Визначення гостроти повороту ввдбуваеться шляхом знаходження кута мгж двома векторами. Вiдповiдний фрагмент коду наведено на рис. 8.

def angle_between_three_points(A, B, C): BA = [A[0]-B[0], A[1]-B[1]] BC = [C[0]-B[0], C[1]-B[1]] dot_product = BA[0] * BC[0] + BA[1] * BC[1] magnitude_BA = math.sqrt(BA[0]**2 + BA[1]**2) magnitude_BC = math.sqrt(BC[0]**2 + BC[1]**2) magnitude = magnitude_BA * magnitude_BC angle = math.acos(dot product / magnitude) return math.degrees(angle)

Рис. 8. Фрагмент коду знаходження кута повороту

Перший вектор - тpaектopiя автономного об'екту перед поворотом. Другий - тpaектopiя одразу шсля заюн-чення повороту. Шляхом простих алгебра!чних перетворень знаходиться кут м1ж векторами, що пopiвнюеться з граничним значенням. У разу якщо кут менше гранично допустимого значення - поворот вважаеться гострим.

Друга ознака, що видобуваеться з траекторп - ви!зд на смугу зус^чного руху. Фрагмент коду наведено на рис. 9.

def detect_oncoming_lane_violations(path, grid): violations = 0

for i in range(len(path) - 1):

for j in range(1, 6): if dx > 0:

if grid[x1][y1 - j] elif dx < 0: if grid[x1][y1 + j] elif dy > 0: if grid[x1 + j][y1] elif dy < 0: if grid[x1 - j][y1]

return violations

Рис. 9. Фрагмент коду вдентифшаци виТзду на зустрiчну смугу руху

Алгоритм шукае смугу poздiлення зустр1чних поток1в з право! сторони ввд заплановано! траекторп, якщо зна-ходить - сигнaлiзуе про порушення, додаючи певну оцшку до сегменту, що обробляеться. Зрозумшо, що алгоритм слвдуе пpaвoстopoннiм правилам дорожнього руху. Однак мoдифiкувaти його до потреб л1во-стороннього руху не буде складною задачею.

Результатом алгоритму будуть оц1нки, проставлен кожному окремому сегменту шляху, де 0 - буде ввдповщати безпечному сегменту а все що бшьше 0 - небезпечному з точки зору правил дорожнього руху та ф1зичних осо-бливостей автономного об'екту.

Результат роботи алгоритму наведений на рис. 10 (представлено частину траекторп для бшьшого розумшня результату).

== 2: violations += 1 == 2: violations += 1 == 2: violations += 1 == 2: violations += 1

\

v

^ 4

Рис. 10. Фрагмент траекторп i промаркованими небезпечними дшянками

Алгоритм чудово впорався iз завданням вiднайшовши частини траектори, що вважаються небезпечними з огляду на набiр ознак та гх оцiнки, що були введет.

Наведет гострi повороти промарковаш червоним, що е гарним результатом. £дина частина траекторп, що виконувала ви1зд на смугу зустрiчного руху також промаркована червоним. Однак, невелика дмнка шляху все ж залишилася непромаркованою. Ця проблема мае назву «хибно позитивне визначення» (false-positive) або ж «викид» (outlier) алгоритму кластеризаци, що не сильно впливае на загальну картину результату.

Етап корекцп небезпечних дiлянок траектори

Визначивши небезпечш дiлянки траекторii, за допомогою методу k-середшх, наступним етапом е застосу-вання коригувальних заходiв. На цьому етапi використовуються два методи для виршення рiзних типiв небезпечних дмнок: базове вiдображення лшп для усунення проблем iз рухом смугою зустрiчного транспорту та крит Без'е для згладжування рiзких поворопв. Цi методи призначенi для забезпечення оптимiзацii кшцевого шляху не лише для ефективносп, але й для безпеки та практичности

Нехай

POT=[Pl>P^>->Pm]> (5)

послiдовнiсть точок на небезпечнiй дмнщ iз зустрiчним рухом. Вiдображення лшп можна математично визначити таким чином:

pi =Pi —2 • (Pin-d) • П (6)

де pi - нова точка;

p; - оригiнальна точка;

n - вектор нормалi до горизонтально1 розмiтки;

d - вiдстань вщ центру горизонтально1 розмiтки по нормали

Вiдображена дiлянка

p,OT =[p; ,P;,-,PU (7)

замiнюе POT вихiдного шляху P.

Проблема рiзких поворопв вирiшуеться за допомогою кривих Без'е, яш згладжують траекторiю.

Кубiчна крива Без'е B(t) визначаеться чотирма контрольними точками

B(t) = (1-t)3 • P0 +3•(l-t)2 • t• ^+3•(l-t)• t2 • P2+ t3 • P3,C<t<1, (8)

Контрольш точки вибираються на основi точок траектори до i пiсля рiзкого повороту, а також конкретних точок, де вщбуваеться поворот. Крива Без'е замшюе орипнальний рiзкий поворот на шляху.

Шсля внесения виправлень шлях Р повторно ощнюеться на наявнiсть будь-яких небезпечних дшянок, що залишилися. Якщо таш знайденi, алгоритм повертаеться до етапу кластеризацп k-середнiх, забезпечуючи строгий ггерацшний процес для найбезпечнiшого та найефектившшого планування шляху.

Результат роботи алгоритму наведений на рис. 11 (представлено частину траектори для бiльшого розумшня результату).

¡Т

П

Рис. 11. Фрагмент згладженоТ траектори

Алгоритм чудово впорався 1з завданням зглядивши гостр1 кути поворот1в та ввдобразивши частину траектори. що проходила смугою зустр1чного руху. Тpaектopiя готова до використання автономним лог1стичним об'ектом.

Етап адаптивного реагування на завади У сфеpi лог1стики штучний iнтелект (Ш1) став ключовим фактором пiдвищення ефективнoстi, точносп та aдaптивнoстi oпеpaцiй у лaнцюзi поставок i тpaнспopтувaннi. Мoделi Ш1 в лог1стиц1 вiдiгpaють виpiшaльну роль у р1зних аспектах, таких як oптимiзaцiя мapшpутiв, упpaвлiння запасами, прогнозування попиту та прийняття piшень у реальному чаа. Тут глибше дослвджуемо значення та застосування моделей AI у лопстищ, зосереджую-чись на нюансах планування шляху та адаптаци в реальному часг

Алгоритми на основ1 штучного iнтелекту aнaлiзують гсторичт дaнi, умови руху та фактори навколишнього середовища, щоб oптимiзувaти маршрути доставки. Це зменшуе споживання палива, шдвищуе ефективнiсть використання часу та мiнiмiзуе експлуaтaцiйнi витрати. Зокрема, мoделi Reinforcement Learning допомагають адаптуватися до дишм1чних умов i oптимiзувaти маршрути в реальному чаа.

У той час як попередш етапи гарантують, що шлях е безпечним, ефективним i бере до уваги р1зш обмеження, динaмiчнa природа реальних середовищ вимагае додаткового р1вня aдaптивнoстi. Саме тут i пoтpiбнa RL модель: вона дозволяе автономному об'екту коригувати св1й шлях у pежимi реального часу, щоб уникнути непередбаче-них перешкод, не вимагаючи повного повторного обчислення вае! траектори.

Незважаючи на надшшсть мoдифiкoвaнoгo алгоритму A* у створенн початкового безпечного та ефективного шляху, перешкоди можуть з'явитися або змшитися п1сля встановлення шляху. Вони можуть вapiювaтися в1д рап-тово припаркованого aвтoмoбiля до п1шоход1в, як1 переходять дорогу. Тому мехaнiзм, який забезпечуе швидку адаптацию в pежимi реального часу, мае виpiшaльне значення для практичного застосування.

Модель RL працюе в пapaдигмi «стан^я-винагорода» [10, 11]. Проспр стaнiв складаеться з поточного положения та opiентaцi! автономного об'екту, а також умов навколо нього, таких як перешкоди поблизу. Проспр ди включае в себе нaбip мaневpiв, як1 може здшснювати aвтoмoбiль, як-от незнaчнi вщхилення в1д траекторИ або

коригування швидкосп. Нагороди надаються за устшне уникнення перешкод, збериаючи загальний шлях, який е максимально близьким до початково1 траектори.

На рис. 12-16 наведено фрагменти iмплементацiï даного алгоритму з використанням gym [12] як iнструменту для опису модели

Алгоритм визначае «стан» як положення об'екту на двовимiрнiй мапi (рис. 12).

def step(self, action): x, y = self.state

return self.state, reward, done, False, {} Рис. 12. Фрагмент коду визнаиення «стану»

«Дiя» визначаеться набором з восьми варiантiв, що представляють собою прост рухи як-от: <шворуч», «пра-воруч», «уперед», «назад» та чотири дiагональнi вiдповiдники (рис. 13).

def step(self, action):

if action == 0: x = max(0, x-1)

elif action == 1: x = min(self.grid_size_x-1, x+1)

elif action == 2: y = max(0, y-1)

elif action == 3: y = min(self.grid_size_y-1, y+1)

elif action == 4: x, y = max(0, x-1), max(0, y-1)

elif action == 5:

x, y = max(0, x-1), min(self.grid size y-1, y+1) elif action == 6:

x, y = min(self.grid_size_x-1, x+1), max(0, y-1) elif action == 7: x, y = min(self.grid_size_x-1, x+1), \ min(self.grid_size_y-1, y+1)

return self.state, reward, done, False, {}

Рис. 13. Фрагмент коду визначення «дн»

«Винагорода» ж в свою чергу визначаеться у ввдповщносп до виконаноï дп за наступним принципом:

1) якщо ввдбулося досягнення цiлi - отримати найвищу винагороду (рис. 14);

def _get_reward(self, x, y):

if (x, y) == self.end: return 50

Рис. 14. Фрагмент коду «винагороди» за досягнення цШ

2) вщбувся нш'зд на смугу роздiлення чи на перешкоду - отримати високий штраф (рис. 15);

def _get_reward(self, x, y):

if self.grid[x][y] in [1, 4]: return -20

Рис. 15. Фрагмент коду «штрафу» 3) маленький штраф, щоб стимулювати систему шукати найкоротше ршення i не стояти на м1сщ (рис. 16).

def _get_reward(self, x, y): return -1

Рис. 16. Фрагмент коду стимулювання пошуку

На рис. 17 наведений фрагмент траекторп з перешкодою на шляху прямування автономного об'екту. Злiвa в1д об'екту знаходиться межа дороги, а справа - межа роздшення зус^чних поток1в.

Рис. 17. Приклад об'Тзду перешкоди з використанням адаптивного алгоритмом

З рисунку видно, що траектория, визначена адаптивним алгоритмом, тримае безпечну дистанцiю вiд пере-шкоди та меж дороги.

Висновки

Представлена багатоетапна модифiкацiя алгоритму А*, розроблену для розширеного планування траекторп в умовах лопстики за допомогою автономних рухомих транспортних засобiв. Метод включае iнновацiйнi еле-менти, так! як дотримання безпечно! дистанцп до перешкод, дотримання смуги руху, згладжування траекторп. iдентифiкацiя та виправлення небезпечних дмнок за допомогою кластеризацп к-середшх, а також уникнення перешкод у реальному чай за допомогою навчання з шдкршленням.

Метод демонструе ефектившсть у створеннi траекторiй, як! е не пльки оптимальними в традицшному розу-мiннi, але й бшьше вiдповiдають логiстичним обмеженням реального свпу. Також метод забезпечуе високу адап-тивнiсть до непередбачених перешкод в реальному чай.

Незважаючи на те, що модель е багатообiцяючою, все ще е областi, як1 можуть отримати користь вiд подаль-ших дослiджень i оптимiзацil:

1) обчислювальна ефективнiсть: зi збiльшенням складностi еташв алгоритму зростае i обчислювальне наван-таження. Майбутня робота може бути зосереджена на вдосконаленш алгоритмiв, щоб зменшити витрати на обчислення;

2) багатоагентт системи: модель Hapa3i не враховуе поведшку шших areHTÍB (наприклад, транспортних засо-6íb) у середовищi. Включення багатоагентно! спiвпрaцi або конкуренцй' може зробити модель бшьш реaлiстичною;

3) подальше вдосконалення моделi навчання з шдкршленням: компонент можна розширити, щоб урахо-вувати бiльше характеристик середовища, наприклад сигнали свилофора, для ще бшьш надшно! навтацп в реальному чай;

4) бiльш точна клaстеризaцiя: продуктившсть k-середнiх у щентифшацд небезпечних фрагменпв потенцiйно може бути покращена за допомогою альтернативних методiв кластеризацп або методiв оптимiзaцil пaрaметрiв.

Природним наступним кроком е застосування алгоритму до реальних лопстичних проблем i автономних навь гaцiйних систем транспортних зaсобiв, що дозволяе оцiнювaти продуктивнiсть у б№ш складних i динaмiчних середовищах.

Нижче наведемо ще декшька перспективних нaпрямiв подальшого дослiдження:

1) iнтегрaцiя з сенсорними даними: включення сенсорних даних у реальному чай (наприклад, LiDAR, радар та камери) може запропонувати бшьш повне розумшня навколишнього середовища, зробивши модель ще нaдiйнiшою;

2) онлайн-навчання: впровадження мехaнiзму онлайн-навчання в модель навчання з пвдкршленням може дозволити системi покращувати свою продуктившсть з часом, навчаючись на минулому досвiдi.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Завдяки подальшому вдосконаленню цих елеменпв i розширенню моделi для включення додаткових фaкторiв реального свиу, вважаемо, що алгоритм мае потенщал для значного вдосконалення сучасного рiвня автоматизо-ваного планування траекторй' для рiзних логiстичних програм.

Таким чином, ця робота е кроком до створення розумнiших, безпечнiших i ефектившших aлгоритмiв планування шляху, яш адаптуються до умов реального свиу, що постiйно змiнюються. Мaйбутнi роботи можуть спира-тися на цю основу для вирiшення ще бшьш складних i тонких завдань у сферi автономно! нашгаци та лопстики.

Список використаиоТ лiтератури

1. Practical search techniques in path planning for autonomous driving / D. Dolgov та ш. First International Symposium on Search Techniques in Artificial Intelligence and Robotics, 2008 р.

2. Improved Analytic Expansions in Hybrid A-Star Path Planning for Non-Holonomic Robots / С. Dang та ш Applied Science. Т. 12, № 12. С. 59-99.

3. LaValle S. M. Planning Algorithms. Cambridge: Cambridge University Press, 2006. 826 с.

4. Path planning and obstacle avoidance approaches for mobile robot / H. Nguyen та rn International Journal of Computer Science Issues. № 3-4.

5. Path Planning of mobile robot based on improved A* Algorithm / M. Lin та rn 29th Chinese Control and Decision Conference, 2017 .

6. Improved safety-first a-star algorithm for autonomous vehicles / J. Yu та rn 5th International Conference on Advanced Robotics andMechatronics, 2020 р.

7. Rapid path planning algorithm for mobile robot in dynamic environment / H-m. Zhang та ш. Advances in Mechanical Engineering. Т. 9, № 12. С. 1-12.

8. Path Planning using artificial potential field method and A-star fusion algorithm / С. Ju та ш. Global Reliability and Prognostics and Health Management, 2020 р, С. 1-7.

9. Improved A* Path Planning Method Based on the Grid Map / Y Ou та rn Sensors. Т. 22, № 16.

10. Barto A. G. Chapter 2 - Reinforcement Learning. Reinforcement Learning: An Introduction. Лондон, 2014. С. 45-67.

11. Ding, Z. та rn Introduction to reinforcement learning. Deep reinforcement learning: fundamentals, research and applications. 2020. С. 47-123.

12. OpenAI. Gym library. URL: https://www.gymlibrary.dev/index.html (дата звернення 10.10.2023).

References

1. D. Dolgov. Practical search techniques in path planning for autonomous driving, 2008 First International Symposium on Search Techniques in Artificial Intelligence and Robotics, 2008.

2. Dang, C. V, Ahn, H., Lee, D. S., & Lee, S. C. (2022, June 13). Improved Analytic Expansions in Hybrid A-Star Path Planning for Non-Holonomic Robots. Applied Sciences, 12(12), 5999. https://doi.org/10.3390/app12125999.

3. LaValle, S. M. (2006, May 29). Planning Algorithms. Cambridge University Press.

4. Path planning and Obstacle avoidance approaches for Mobile robot. (2016, July 31). International Journal of Computer Science Issues, 13(4), 1-10. https://doi.org/10.20943/01201604.110

5. M. Lin, K. Yuan, C. Shi and Y. Wang, Path planning of mobile robot based on improved A* algorithm, 2017 29th Chinese Control And Decision Conference (CCDC), Chongqing, China, 2017, pp. 3570-3576, doi: 10.1109/ CCDC.2017.7979125.

6. J. Yu, J. Hou and G. Chen, Improved Safety-First A-Star Algorithm for Autonomous Vehicles, 2020 5th International Conference on Advanced Robotics and Mechatronics (ICARM), Shenzhen, China, 2020, pp. 706-710, doi: 10.1109/ ICARM49381.2020.9195318.

7. Zhang, H. M., & Li, M. L. (2017, December). Rapid path planning algorithm for mobile robot in dynamic environment. Advances in Mechanical Engineering, 9(12), 168781401774740. https://doi.org/10.1177/1687814017747400

8. C. Ju, Q. Luo and X. Yan, Path Planning Using Artificial Potential Field Method And A-star Fusion Algorithm, 2020 Global Reliability and Prognostics and Health Management (PHM-Shanghai), Shanghai, China, 2020, pp. 1-7, doi: 10.1109/PHM-Shanghai49105.2020.9280929.

9. Ou, Y., Fan, Y., Zhang, X., Lin, Y., & Yang, W. (2022, August 18). Improved A* Path Planning Method Based on the Grid Map. Sensors, 22(16), 6198. https://doi.org/10.3390/s22166198

10. Sutton, R. S., & Barto, A. G. (2018, November 13). Reinforcement Learning, second edition. MIT Press.

11. Dong, H., Ding, Z., & Zhang, S. (2020, June 29). Deep Reinforcement Learning. Springer Nature.

12. OpenAI. Gym library. (2020). Retrieved October 10, 2023, from https://www.gymlibrary.dev/index.html

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — І. А. Головатенко, А. В. Писаренко

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — І. А. Головатенко, А. В. Писаренко

METHOD OF ROUTE PLANNING IN AUTONOMOUS LOGISTICS CYBERPHYSICAL SYSTEMS USING ARTIFICIAL INTELLIGENCE

Текст научной работы на тему «МЕТОД ПЛАНУВАННЯ МАРШРУТУ В АВТОНОМНИХ ЛОГІСТИЧНИХ КІБЕРФІЗИЧНИХ СИСТЕМАХ ЗАСОБАМИ ШТУЧНОГО ІНТЕЛЕКТУ»