Научная статья на тему 'ИССЛЕДОВАНИЕ МЕТОДА ИДЕНТИФИКАЦИИ МОДЕЛИ И МЕТОДОВ УПРАВЛЕНИЯ БЕСПИЛОТНЫМ ТРАНСПОРТНЫМ СРЕДСТВОМ ПО ПРОСТРАНСТВЕННОЙ ТРАЕКТОРИИ'

ИССЛЕДОВАНИЕ МЕТОДА ИДЕНТИФИКАЦИИ МОДЕЛИ И МЕТОДОВ УПРАВЛЕНИЯ БЕСПИЛОТНЫМ ТРАНСПОРТНЫМ СРЕДСТВОМ ПО ПРОСТРАНСТВЕННОЙ ТРАЕКТОРИИ Текст научной статьи по специальности «Медицинские технологии»

CC BY
79
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИДЕНТИФИКАЦИЯ / БЕСПИЛОТНОЕ ТРАНСПОРТНОЕ СРЕДСТВО / ОТСЛЕЖИВАНИЕ ТРАЕКТОРИИ

Аннотация научной статьи по медицинским технологиям, автор научной работы — Прокопьев И.В., Софронова Е.А.

В работе исследован метод идентификации модели реального беспилотного транспортного средства с использованием регресси-онных модельных структур по экспериментальным данным, полученным при движении по пространственной траектории. Сложность данной задачи заключается в том, что динамические характеристики объекта управления могут существенно меняться. Для поиска параметров модели применен эволюционный метод роя частиц. Идентифицированная модель была использована для эксперименталь-ного сравнения методов управления в реальном времени на примере решения задачи управления движением беспилотным транспортным средством по пространственной траектории. Рассматривались наиболее популярные методы: управление на основе Прегулятора, прогнозного управления и искусственной нейронной сети. Для более точной сравнительной оценки методов в модель были включены случайные возмущения и усложнена траектория движения

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по медицинским технологиям , автор научной работы — Прокопьев И.В., Софронова Е.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ИССЛЕДОВАНИЕ МЕТОДА ИДЕНТИФИКАЦИИ МОДЕЛИ И МЕТОДОВ УПРАВЛЕНИЯ БЕСПИЛОТНЫМ ТРАНСПОРТНЫМ СРЕДСТВОМ ПО ПРОСТРАНСТВЕННОЙ ТРАЕКТОРИИ»

8. Шипилов, В.В. Об одном методе классификации объектов контроля радиоэлектронного оборудования //Контроль. Диагностика, 2006, №7Г с. 56-59.

9. Корбут, А.А., Филькинштейн, Ю.Ю. Дискретное программирование. Москва: Наука, 1969.

10. Шипилов, В.В. Об одном подходе к решению задач многокритериальной оптимизации базовых структур средств и систем контроля РЭО // Журнал контроль, диагностика, 2006, №6.

11. Северцев, Н.А., Бецков, А.В., Дарьина, А.Н. Разработка вероятностных критериев безопасного управления объектами специальной техники // Надежность и качество сложных систем. 2019. T. 26. № 2.

12. Бецков, А.В., Прокопьев, И.В., Шевченко, В.Л. Аэромобильные комплексы для обеспечения безопасности // Труды международного симпозиума Надежность и качество. Пенза, Россия. 2019. Т. 1. С. 66-68.

УДК 658.62.018.012 Прокопьев И.В., Софронова Е.А.

Федеральный исследовательский центр «Информатика и управление» Российской академии наук (ФИЦ ИУ РАН), Москва, Россия

ИССЛЕДОВАНИЕ МЕТОДА ИДЕНТИФИКАЦИИ МОДЕЛИ И МЕТОДОВ УПРАВЛЕНИЯ БЕСПИЛОТНЫМ ТРАНСПОРТНЫМ СРЕДСТВОМ

ПО ПРОСТРАНСТВЕННОЙ ТРАЕКТОРИИ

В работе исследован метод идентификации модели реального беспилотного транспортного средства с использованием регрессионных модельных структур по экспериментальным данным, полученным при движении по пространственной траектории. Сложность данной задачи заключается в том, что динамические характеристики объекта управления могут существенно меняться. Для поиска параметров модели применен эволюционный метод роя частиц. Идентифицированная модель была использована для экспериментального сравнения методов управления в реальном времени на примере решения задачи управления движением беспилотным транспортным средством по пространственной траектории. Рассматривались наиболее популярные методы: управление на основе П- регулятора, прогнозного управления и искусственной нейронной сети. Для более точной сравнительной оценки методов в модель были включены случайные возмущения и усложнена траектория движения

Ключевые слова:

ИДЕНТИФИКАЦИЯ, БЕСПИЛОТНОЕ ТРАНСПОРТНОЕ СРЕДСТВО, ОТСЛЕЖИВАНИЕ ТРАЕКТОРИИ

1. Введение

Необходимым этапом решения задач управления нелинейными динамическими системами является получение их адекватных математических моделей. Задача идентификации математических моделей [1] возникает в тех случаях, когда математические модели объектов или процессов, для которых требуется решать задачи управления, очень сложны или полностью неизвестны. К таким объектам относятся беспилотные транспортные средства (БТС). Значения динамических параметров БТС могут существенно меняться, например, при добавлении полезной нагрузки. Многообразие видов нелинейно-стей динамических процессов, а также наличие помех в сигналах не позволяют создать единую теорию идентификации нелинейных систем. Наиболее широкое распространение получили параметрические модели, требующие решения задач структурной и параметрической идентификации и использующие при этом ограниченное число параметров.

Многочисленные исследования в области усовершенствования систем автономного движения БТС направлены на разработку нелинейного закона управления для отслеживания траекторий в режиме реального времени [2].

Традиционно управление беспилотными транспортными средствами в реальном времени делится на три подзадачи: генерацию траектории, определение положения и отслеживание траектории.

В настоящее время для отслеживания траекторий по-прежнему широко применяется управление с обратной связью из-за простоты и легкости его реализации [3], но из-за увеличения мощности компьютеров и микропроцессоров для решения такой задачи также эффективно применяются прогнозное управление (ПУ) [4, 5], нечеткие контроллеры, искусственные нейронные сети (ИНС) [6] и адаптивные методы. Наряду с этими методами имеется класс современных методов символьной регрессии, метод генетического программирования [7], грамматической эволюции [8], сетевого оператора [9]. Данные методы позволяют на основе эволюционных алгоритмов создавать численные методы для синтеза систем управления [10, 11], но они как правило не используются для синтеза управления в реальном времени.

В настоящей работе приведены результаты идентификации модели реального беспилотного транспортного средства (БТС) и экспериментального сравнения методов управления в реальном времени на примере решения задачи управления движением БТС по пространственной траектории. В сравнительном эксперименте для более точной оценки методов в модель включены случайные возмущения и усложнена траектория движения.

2. Идентификация модели беспилотного транспортного средства

Объектом управления является БТС, построенное с использованием автомобильного шасси 1/10 масштаба, рис. 1 а. БТС весит 1,5 кг и способен развивать скорость до 10 м/с.

Вычисления выполняются с помощью комплекта NVIDIA Jetson TX2. Измерение локальных координат движения БТС проводилось в Робототехническом центре ФИЦ ИУ РАН [12] .

Два передних колеса БТС служат для рулевого управления, а два задних колеса - для отслеживания состояния. Кинематическая схема управления движением БТС показана на рис. 1 б.

На рис. 1 б а - угол поворота руля; в - угол ориентации БТС относительно оси х; Н - расстояние между передней и задней осями робота; R -базовая точка, расположенная по середине задней оси робота; х,у - координаты.

Задача идентификации обычно формулируется как задача оценивания параметров модели системы, которая обладает существенными чертами реальной системы и характеризует её динамические свойства в удобной для синтеза управления форме.

Традиционным методом построения моделей динамических объектов является реализация процедуры идентификации с использованием регрессионных модельных структур.

Регрессия непосредственно связана с задачей прогнозирования величины выхода y(t) на основе информации, полученной при измерении других величин ipir i = l,d, содержащих информацию о прошлом поведении системы.

Для БТС, изображенного на рис. 1 а, задача идентификации состоит в нахождении функции д(<р) такой, чтобы оценка у(к) = д(ф) удовлетворяла некоторому критерию и была прогнозом величины у(к). Функция д(<р) - функция регрессии, должна быть некоторым методом оценена по экспериментальным данным, т.е. g(ip) = g(ip,q), где q - вектор настраиваемых параметров.

Задача состоит в сборе необходимого количества экспериментальных данных во всем рабочем диапазоне системы ZL = {и(к),у(к)}, k = l,L. Полнота и достоверность полученных данных во многом определяют качество идентификации.

Таким образом динамический объект может быть представлен в следующем виде:

у(к,ч) = д(ф(к,ч),ч). (1)

Если нет проскальзывания в реальной динамике, прогнозирующая модель g(ip(k,q),q) может быть реализована на следующей модельной структуре.

б

х(к + 1)

х(к + 1) = у(к+1) =

в(к + 1)

Рисунок 1 - БТС и кинематическая схема управления движением БТС

Конечно-разностные уравнения модели мобильного робота имеют следующий вид

х(к) + v(k)q1Лt со$(в(к)) соз(ц2а(к,)) у(к) + v(k)q1&tsin(в(k)) со$( ц2а(к)) в (к) + v(k)q3Лtsin(q2a(k))/H где х(к) - вектор состояния объекта данные управления у(1) при

х(к) = [х(к),у(к),в(к)]Т, (3) скорости

и(к) - вектор управления движением робота по траектории

и(к) = [у(к),а(к)]т, (4)

у(к) - скорость движения робота, = |-£| - временной интервал, шаг интегрирования, д - вектор идентифицируемых параметров модели, д = Ч2, Чз]Т ■

При использовании конечно-разностного уравнения (2) оптимизация параметров q представляет собой отображение множества экспериментальных данных на множестве параметров модели (2). Традиционно используемым критерием оптимальности является среднеквадратичная ошибка прогнозирования

а1(ч,г1) = 1Ц=1(У(к)-У(к1ч))2- (5)

Таким образом, идентификация параметров модели (2) состоит в нахождении вектора параметров q, минимизирующих критерий (5)

д = argminaL(qZL)

(2)

изменении линеинои

(6)

Для нахождения вектора оптимальных параметров используется метод оптимизации роя частиц (PSO) [13]

ч1+1 = ч1 + К+1,

"1+1 = + сл&'к - Я1к) + С2Г2(РI - ч'к), (7)

Рисунок 2 - Сравнение идентифицированной модели и экспериментальных данных

На рис. 3 показан график отклика канала поперечного управления БТС, т.е. ориентации БТС, на входное управление а при v(k) = const, график идентифицированной модели БТС, а также график самого управления.

гДе Чк

К -

величина параметра, юличина и направление

к -текущая итерация, зектора скорости каж-

0 до 1, р1к

параметра

q

Рк

дого параметра, wk - постоянный вес, с1г с2 -параметры ускорения, г1, г2 - случайные числа от лучшая найденная точка варианта - лучшая найденная точка всех вариантов параметра.

После вычисления направления вектора V, параметр перемещается в точку qlk+1. В случае необходимости, обновляются значения лучших точек для каждого параметра и для всех параметров в целом. После этого цикл повторяется.

Для сбора необходимого количества данных во всем рабочем диапазоне управления БТС, использовалась система SLAM на основе 2d Lidar (RPLIDAR A2M8), данные вектора управления и состояния были записаны с частотой 50 Гц.

В результате моделирования были получены следующие параметры

q = [0.018697,0.010132,0.252202]Т, удовлетворяющие (6) с ошибкой £ < 0.002.

На рис. 2 показано моделирование идентифицируемой модели и экспериментальных данных канала поперечного управления БТС в. На рисунке пунктирной линией обозначен идентифицируемый выход, сплошной линией - полученные экспериментальные

А Г\ /-V Л — Original system — Identified system — и

/ \ 1 V V

/ /

-1- i—— -1—

О 50 100 150 200 250 300

Time

Рисунок 3 - Управление и отклик исходной и идентифицированной моделей

3. Задача синтеза управления движением вдоль пространственной траектории

Рассмотрим формальную постановку задачи синтеза управления движением по траектории. Задана математическая модель объекта управления

x = f(x,u), (8)

где X - вектор состояния объекта, и - вектор управления,

xERn, uEUQRm, U - замкнутое

ограниченное множество, т<п. Заданы начальные условия

x(0) е Rn.

(9)

а

я

Задана пространственная траектория движения в форме п — г - мерных многообразий

(р(х) = 0, 1 = 1,г, г<п. (10)

Траекторию (10) называем пространственной, так как она не зависит от времени.

Задано время окончания процесса управления ^. Необходимо найти управление в форме функции от координат пространства состояний

и = к(х), (11)

где И(х) - искомая синтезирующая функция, Н(х~)\Яп ^ Ят, удовлетворяющая следующему свойству Ух £ , 1г(х) е и.

Функция должна обеспечивать минимум функционалу, описывающему точность движения по траектории

J = ^f04%=i<Pt {x{t))dt^min.

Для решения задачи (8)-(12) синтеза системы управления движением объекта по пространственной траектории (10) используем ПИД регулятор, прогнозное управление и аппарат искусственных нейронных сетей (ИНС). Для исследования предложенных подходов разработан симулятор, основанный на кинематике робота.

4. Схема движения по траектории Для отслеживания траектории необходима информация о желаемой, сгенерированной, траектории и результаты измерения движения реального объекта управления. На рис. 4 представлена обобщенная схема системы управления с использованием ПИД регулятора, прогнозного управления и ИНС.

Рисунок 4 - Обобщенная схема системы управления

На рис. 4 хг(к) = [хг(к),уг(к),9г(к)]Т - сгенерированная траектория, хт(к) = [хт(к),ут(к), вт(к)]Т - измеренная траектория движения реального объекта.

В качестве траектории движения используем сложную траекторию с перекрещиванием, одну из фигур Лиссажу х* (т) = 5т(ат), у* (т) = $т(Ьт), а = 1, Ь = 2.(13) Для аппроксимации траектории используем кубический сплайн. В общем виде аппроксимацию на интервале определяем из соотношений 51(х*) = аа1 + а11(х* — х*) +

(14)

+a2i{x" - x¡)2 + a3 í(x" - x¡)3, RÁy") = b0ii + bu(y'-yO + +hi(y" -y02hi(y" -УН3,

(15)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где (x¡,y¡) - координаты точки i на фигуре Лиссажу на плоскости XxY, i = l,N. 5. Контроллеры

а. Контроллер, основанный на обратной связи Рассмотрим применение в качестве обратной связи наиболее часто используемый в области управления ПИД регулятор. ПИД регулятор получает ошибку по отклонению реального движения от заданной траектории и пропускает через три звена. В общем случае ПИД регулятор имеет вид

y = k1e(t) + к2 f e(t) dt + k3é(t), где ( ) - ошибка отклонения желаемого сигнала от реального, k1r k2, k3 - скалярные коэффициенты звеньев, которые подбираются с целью повышения качества управления, y - управляющий сигнал, который подается на объект.

В большинстве случаев качество регулирования определяется временем переходного процесса, величиной перерегулирования и статической ошибкой.

При использовании в контуре управления беспилотным транспортным средством П-регулятора [2] на объект передаются следующие управляющие воздействия

Hw

а = ardan—, (16)

V

где Н - расстояние между передней и задней осями робота, v - линейная скорость движения робота, w - угловая скорость,

... _Vk(s)cos(ee) ,, „¡ипСВД,

(17)

к(я) - кривизна пути, ве - ошибка направления движения, е - ошибка по положению, кв, ке - коэффициенты регулятора. Линейная скорость объекта V считается постоянной.

На рис. 4 П-контроллер автоматически применяет точную и отзывчивую коррекцию к функции управления, которая позволяет с минимальной среднеквадратической ошибкой (МСО) отслеживать желаемую траекторию (см. Таблицу 1). Красным цветом отмечена желаемая, сгенерированная, траектория, зеленым цветом - отслеженная траектория.

б. Прогнозное управление

Прогнозное управление переопределяет собой оптимизационную стратегию, обладающую рядом преимуществ таких как учет ограничений на состояние системы и на управляющие сигналы, работа с нелинейными объектами.

Решением задачи оптимизации является оптимальная траектория. Прогнозное управление включает в себя моделирование различных входов объекта, прогнозирование итоговой траектории и выбор этой траектории по одному или нескольким критериям, например,

] = (П — х1)2+ ™щАи2 ^тт, (18)

где , - весовые коэффициенты, г1 - желаемая траектория, х1 - управляемая переменная, щ -управление.

Цель прогнозного управления заключается в нахождении на каждом шаге оптимального управления для некоторого временного интервала, называемого горизонтом управления. Применяется только первый найденный шаг из стратегии

К(хк) = ик+1(хк), (19)

далее происходят сдвиг горизонта прогнозирования и новая оптимизация. Проведение оптимизации на каждом шаге в режиме онлайн стало возможным благодаря доступности высокопроизводительных вычислительных средств на борту БТС.

Для модели объекта управления (2) и значения горизонта прогнозирования равного 8 эталонная и полученная траектории приведены на рис. 5.

в. Синтез нейросетевого управления на основе прогнозирующей модели

Синтез нейросетевого управления на основе прогнозирующей модели относится к косвенным методам синтеза. Искусственная нейронная сеть (ИНС) используется в качестве модели объекта

управления, а синтез регулятора осуществляется традиционным методом. Схема нейросетевого управления на основе прогнозирующей модели приведена на рис. 6.

Рисунок 6

Суть прогнозирующего определении управляющего сигнала на каждой ите рации посредством минимизации критерия

- Схема нейросетевого управления с прогнозирующей моделью управления состоит

(20)

/ = + + 0- Пк + Цк)]2

Ли(к + I — 1) = и(к + 0 — и(к + I — 1) г йи(к + 1) = 0,Ыи<1<Ытоа, и(к)тах . ,

где й - время задержки в системе, Ыт1п - минимальный горизонт прогнозирования, Мтах - максимальный горизонт прогнозирования.

Прогнозирующая модель з(<р(к,Ч),Ч) может быть реализована на нейросетевой модельной структуре, имеющей следующее математическое представление д1(<р(к,ч),ч) = уМЯ') = уМы^ =

(21)

= Wijfj№i wn<Pi + wio) + Wo),

где f(x) = tanh(x) - активационная функция нейронов скрытого слоя; Fi(x) = ax; a = const - активаци-где

онная функция нейронов выходного слоя; п^- размерность регрессионного вектора (число входов ИНС); пк - число нейронов в скрытом слое; д -вектор настраиваемых параметров нейронной сети, включающий весовые коэффициенты и нейронные смещения (и']1,Ш(] ).

Для синтеза закона управления для нахождения минимума (20) используются методы последовательного приближения, или итеративные методы поиска

^к+1 = ик + т1кАк, (22)

где ик - вектор управляющих сигналов на к-ой итерации; цк - шаг алгоритма и Лк - направление поиска.

Для определения направления поиска методом Ньютона с подходом Левенберга - Марквардта [1416] нужно решить следующее уравнение [Н(ик(1))+Ак1]йк = —д(ик(1))г

эШ<))=^ = -2Щ§ B(t) + 2P[?m] U(t)\ Г2^(и(ф({) + 2РЩ)} 0(t)

H(Uk(t)) =

d]2(U(t),t)\ ,

™2(О

-2

u(t)=uk(t)

т \

'df(t)

+ 2р[?Щ[?щ

du(t) r Lau(oJ Vau(t)i

W(t)=Uk(t)

Для реализации контроллера, основанного на ИНС, на первом этапе собрали данные для обучения в ручном режиме.

Минимальный прогнозирующий горизонт равен временной задержке. Максимальный прогнозирующий

горизонт по эмпирическому правилу приближенно равен времени переходного процесса системы.

Полученный на основе ИНС контроллер отслеживает желаемую траекторию не хуже, чем контроллер, построенный на основе обратной связи рис. 7.

ЧпЧ

Рисунок 4 - Отслеживание траектории с помощью П-регулятора

Sy - spline у*" \ - backing /

J

-20 -] 0 1 20

Л ml

Рисунок 5 - Отслеживание траектории с помощью прогнозного управления

( — \- jline ¿f a eking / \

1

V J

0 0 1

x[ml

Рисунок 7 - Отслеживание траектории с помощью ИНС

6. Вычислительный эксперимент

Для проведения сравнительного анализа методов было проведено три вида экспериментов. В первом

эксперименте использовалась желаемая траектория, по которой объект мог двигаться точно. Полученные графики моделирования для рассматриваемых трех методов приведены на рис. 4-5, 7. В

и

таблице 1 приведены полученные среднеквадрати-ческие ошибки.

Среднее время вычислений управления на каждом шаге составило ТП-рег = 0.0022 с, ТПУ= 1.12с, ТИНС =

Результаты вычи

0.0022 с. Соотношение по времени вычислений между методами для всех последующих экспериментов сохранялось.

отельного эксперимента Таблица 1

МСО П-рег. ПУ ИНС

Координата x 0.0124 0.0016 0.0073

Координата y 0.0329 0.0058 0.0092

Угол ориентации 8 0.0020 0.0368 0.0527

Во втором эксперименте модель объекта управления была подвергнута случайному воздействию х(к) + v(к)q1At соз(в(к)) соз(ц2а(к)) + %(к) у (к) + v(к)q1Atsin(в(к)) cоs(q2a(к)) + %(к) в(к) + v(к)q3Atsin(q2a(к))/H

где ( к) - случайная величина с нормальным распределением и стандартным отклонением 0,7. Результаты эксперимента со случайным воздействием

х(к + 1)

х(к + 1) = у(к+1) =

в(к + 1)

(23)

приведены на рис. 8-10. В таблице 2 приведены полученные среднеквадратические ошибки.

- spline - tracking

Цт]

Рисунок 8 - Отслеживание траектории при неопределенности с помощью П-регулятора

v n—11 ackirig

ß

J

¡s

*[т1

Рисунок 9 - Отслеживание траектории при неопределенности с помощью прогнозного управления

//- ¡pline 'y - tracking

Ilm]

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рисунок 10 - Отслеживание

траектории при неопределенности с помощью ИНС

Результаты вычислительного эксперимента при неопределенности

Таблица 2

МСО П-рег. ПУ ИНС

Координата x 1.1459 0.7597 1.2012

Координата y 0.8247 0.4194 0.7935

Угол ориентации 8 0.2356 0.1565 0.2256

В третьем эксперименте геометрия траектории была изменена так, чтобы объект заведомо не мог двигаться по траектории точно из-за имеющихся

ограничений на управление. Результаты экспериментов с движением по сложной траектории приведены на рис. 11-13. В таблице 3 приведены полученные среднеквадратические ошибки.

Рисунок 11 - Отслеживание сложной траектории с помощью П-регулятора

Рисунок 12 - Отслеживание сложной траектории с помощью прогнозного управления

Рисунок 13 - Отслеживание сложной траектории с помощью ИНС

Результаты вычислительного эксперимента при сложной траектории

Таблица 3

МСО П-рег. ПУ ИНС

Координата x 0.1053 0.0385 0.1065

Координата y 0.1333 0.0797 0.2627

Угол ориентации 8 0.0363 0.1410 0.2499

Графики полученных рулевых управлений во времени приведены на рис. 14-16. 7. Заключение

Представлены результаты экспериментального сравнения трех методов синтеза управления в реальном времени движением объекта по траектории. Рассматривались наиболее популярные методы: управление на основе П- регулятора, прогнозного управления и искусственной нейронной сети. Для

получения более достоверных результатов выполнялись три вида экспериментов. В первом эксперименте использовалась желаемая траектория, по которой объект мог двигаться точно. Во втором эксперименте модель объекта управления была подвергнута случайному воздействию. В третьем эксперименте геометрия траектории была изменена так, чтобы объект заведомо не мог двигаться по траектории точно. Показано, что все три метода

обеспечивают точное движение объекта по сложной траектории. В то же время длительность вычисления управления для прогнозного управления была в 500 раз больше, чем для остальных методов, что предъявляет определенные требования к бортовому компьютеру. Кроме того, в реальной машине управляющая команда не будет выполняться мгновенно,

а будет задержка, поскольку команда распространяется по системе. Способствующим задержке фактором является динамика привода, например, время, прошедшее с момента, когда угол поворота был задан, до того момента, когда этот угол фактически достигнут.

Рисунок 14 - Рулевой управление, полученное с помощью П- регулятора

Рисунок 15 - Рулевой управление, полученное с помощью прогнозного управления

Рисунок 16 - Рулевой управление, полученное с помощью ИНС с оптимизированными гиперпараметрами

Во всех трех экспериментах более лучшие результаты по значению значений среднеквадратических ошибок показал метод прогнозного управления. П-регулятор и ИНС показывают сравнимые результаты, но хуже примерно в 2 раза чем контроллер, построенный на основе прогнозного управления.

Более точным может быть контроллер на основе ИНС, обученный с помощью прогнозного управления по модели транспортного средства, учитывающей динамику привода.

Работа выполнена по гранту РФФИ №18-2 9-03 0 61, результаты главы 2 получены при поддержке РНФ, проект № 19-11-00258.

ЛИТЕРАТУРА

1. Льюнг, Л. Идентификация систем / Л. Льюнг. - М.: Наука. 1991. - 432 с.

2. Paden, В., Cap, M., Yong, S.Z., Yershov, D., Frazzoli, E. A Survey of Motion Planning and Control Techniques for Self-driving Urban Vehicles, arXiv:1604.07446.

3. Gu, D., Hu, H., Brady, M., Li, F. Navigation System for Autonomous Mobile Robots at Oxford, Proceedings of International Workshop on Recent Advances in Mobile Robots, Leicester, UK, 1-2 July 1997, pp. 24-33.

4. Clarke, D., Mohtadi, C., Tuffs, P., Generalized Predictive Control-Part I. The Basic Algorithm, Automatica, Vol. 23, No. 2, pp. 137-148, 1987.

5. Rawlings, J.B. Tutorial Overview of Model Predictive Control, IEEE Control Systems Magazine, Vol. 20, No. 3, June 2000, pp. 38-52.

6. Haykin, S. Neural Networks. A Comprehensive Foundation, 1999, Prentice Hall, 842 p.

7. Koza, J.R. Genetic Programming: on the Programming of Computers by Means of Natural Selection, MIT Press. 1992. 819 p.

8. Ryan, C., O'Neill, M., Collins, J.J. Handbook of Grammatical Evolution, Springer, 2018. 507

9. Diveev, A., Sofronova, E. The Network Operator Method for Search of the Most Suitable Mathematical Equation, in: Bio-Inspired Computational Algorithms and Their Applications, Edited by Dr. Shangce Gao, InTech, 2012. pp. 19-42.

10. Diveev, A. I., Kazaryan, D.E., .Sofronova, E.A. Symbolic Regression Methods for Control System Synthesis, In: 22nd Mediterranean Conference on Control and Automation (MED'14), 2014. p. 587-592.

11. Diveev, A.I. A Numerical Method for Network Operator for Synthesis of a Control System with Uncertain Initial Values, Journal of Computer and Systems Sciences International, 2012, Vol. 51, No. 2, pp. 228-243.

12. Дарьина, А.Н., Дивеев, А.И., Прокопьев, И.В. Робототехнический центр ФИЦ ИУ РАН // Вопросы теории безопасности и устойчивости систем, выпуск 21. М.: ФИЦ ИУ РАН. 2019. C. 66-77.

13. Kennedy, J., Eberhart, R. Particle Swarm Optimization, in Proceedings of IEEE International Conference on Neural Networks IV, 1995. pp. 1942-1948.

14. Marquardt, D. An algorithm for least-squares estimation of nonlinear parameters // SIAM J. Appl. Math. - 1963. - No 11. pp. 164 - 168.

15. Levenberg, K. A Method for the solution of certain nonlinear problems in least squares // Quart. Appl. Math. - 1944. - No. 2. pp. 164 - 168.

16. Broyden, C.G. Quasi-Newton methods and their applications to function minimization // Math Comp. - 1967. - Vol. 21. pp. 368 - 381.

УДК 658.62.018.012 Дарьина А.Н., Прокопьев И.В.

Федеральный исследовательский центр «Информатика и управление» Российской академии наук (ФИЦ ИУ РАН), Москва, Россия

МЕТОД ОПТИМИЗАЦИИ ПАРАМЕТРОВ КОНТРОЛЛЕРА БЕСПИЛОТНОГО ТРАНСПОРТНОГО СРЕДСТВА НА ОСНОВЕ ОПТИМИЗАЦИИ РОЯ ЧАСТИЦ

Для беспилотного транспортного средства, в сложных условиях, когда пространственные ограничения серьезно сужают пространство допустимых состояний, стратегия выбора пространства состояний более эффективна, чем выборка в пространстве управлений. Хотя это было очевидно, практический вопрос заключается в том, как его достичь, одновременно удовлетворяя жестким ограничениям динамической осуществимости транспортного средства.

В этой статье представлена система управления беспилотного транспортного средства на основе контроллера модели прогнозирующего интегрального пути (MPPI), глубокой сверточной нейронной сети (CNN) для понимания сцены в реальном времени и метода оптимизации роя частиц (PSO) для нахождения вектора оптимальных параметров функции стоимости. Метод основан на оптимизации функции стоимости, которая определяет, где на поверхности пути должно двигаться транспортное средство.

Ключевые слова:

БЕСПИЛОТНОЕ ТРАНСПОРТНОЕ СРЕДСТВО, МОДЕЛЬ ПРОГНОСТИЧЕСКОГО УПРАВЛЕНИЯ, НЕЙРОННАЯ СЕТЬ, МЕТОД ОПТИМИЗАЦИИ РОЯ ЧАСТИЦ

i Надоели баннеры? Вы всегда можете отключить рекламу.