Научная статья на тему 'ИССЛЕДОВАНИЕ МЕТОДА ИДЕНТИФИКАЦИИ МОДЕЛИ И МЕТОДОВ УПРАВЛЕНИЯ БЕСПИЛОТНЫМ ТРАНСПОРТНЫМ СРЕДСТВОМ ПО ПРОСТРАНСТВЕННОЙ ТРАЕКТОРИИ'

ИССЛЕДОВАНИЕ МЕТОДА ИДЕНТИФИКАЦИИ МОДЕЛИ И МЕТОДОВ УПРАВЛЕНИЯ БЕСПИЛОТНЫМ ТРАНСПОРТНЫМ СРЕДСТВОМ ПО ПРОСТРАНСТВЕННОЙ ТРАЕКТОРИИ Текст научной статьи по специальности «Медицинские технологии»

CC BY
98
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИДЕНТИФИКАЦИЯ / БЕСПИЛОТНОЕ ТРАНСПОРТНОЕ СРЕДСТВО / ОТСЛЕЖИВАНИЕ ТРАЕКТОРИИ / IDENTIFICATION / UNMANNED VEHICLE / PATH TRACKING

Аннотация научной статьи по медицинским технологиям, автор научной работы — Прокопьев Игорь Витальевич, Софронова Елена Анатольевна

Приведены результаты идентификации нелинейной модели беспилотного транспортного средства в симуляторе Gazebo на основе нейросетевой авторегрессионной модели. Сложность данной задачи заключается в том, что динамические характеристики объекта управления могут существенно меняться. Данные о движении по пространственной траектории беспилотного транспортного средства для обучающей выборки были получены в Робототехническом центре ФИЦ ИУ РАН. Параметры модели были найдены методом роя частиц. С помощью идентифицированной модели экспериментально были сравнены методы управления в реальном времени. Управление осуществлялось на основе ПИД-регулятора, метода прогнозного управления и идентификатора на основе искусственных нейронных сетей. В сравнительном эксперименте для более точной оценки метода идентификации модель была подвергнута случайным воздействиям, траектория движения объекта управления была существенно усложнена.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по медицинским технологиям , автор научной работы — Прокопьев Игорь Витальевич, Софронова Елена Анатольевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

STUDY ON MODEL IDENTIFICATION METHOD AND CONTROL METHODS FOR UNMANNED VEHICLE MOVEMENT ALONG A SPATIAL PATH

This paper presents the results of nonlinear model identification of an unmanned vehicle in the Gazebo simulator based on a neural network autoregressive model. The dynamic characteristics of the control object can vary significantly that complicates the problem. Data on the movement along the spatial path of an unmanned vehicle for the training sample was obtained at the Robotics Center of the FRC CSC RAS. The model parameters were found by the particle swarm optimization method. Using the identified model, real-time control methods were experimentally compared. Control was carried out on the basis of the PID controller, model predictive control method and identifier based on artificial neural networks. In a comparative experiment, for a more accurate assessment of the identification method, the model was subjected to random disturbances, and the tracking path of the control object was significantly complicated.

Текст научной работы на тему «ИССЛЕДОВАНИЕ МЕТОДА ИДЕНТИФИКАЦИИ МОДЕЛИ И МЕТОДОВ УПРАВЛЕНИЯ БЕСПИЛОТНЫМ ТРАНСПОРТНЫМ СРЕДСТВОМ ПО ПРОСТРАНСТВЕННОЙ ТРАЕКТОРИИ»

УДК 658.62.018.012

DOI 10.21685/2307-4205-2020-3-12

И. В. Прокопьев, Е. А. Софронова

ИССЛЕДОВАНИЕ МЕТОДА ИДЕНТИФИКАЦИИ МОДЕЛИ И МЕТОДОВ УПРАВЛЕНИЯ БЕСПИЛОТНЫМ ТРАНСПОРТНЫМ СРЕДСТВОМ ПО ПРОСТРАНСТВЕННОЙ ТРАЕКТОРИИ

I. V. Prokopyev, E. A. Sofronova

STUDY ON MODEL IDENTIFICATION METHOD AND CONTROL METHODS FOR UNMANNED VEHICLE MOVEMENT ALONG A SPATIAL PATH

Аннотация. Приведены результаты идентификации нелинейной модели беспилотного транспортного средства в симуляторе Gazebo на основе нейросете-вой авторегрессионной модели. Сложность данной задачи заключается в том, что динамические характеристики объекта управления могут существенно меняться. Данные о движении по пространственной траектории беспилотного транспортного средства для обучающей выборки были получены в Робототехни-ческом центре ФИЦ ИУ РАН. Параметры модели были найдены методом роя частиц. С помощью идентифицированной модели экспериментально были сравнены методы управления в реальном времени. Управление осуществлялось на основе ПИД-регуля-тора, метода прогнозного управления и идентификатора на основе искусственных нейронных сетей. В сравнительном эксперименте для более точной оценки метода идентификации модель была подвергнута случайным воздействиям, траектория движения объекта управления была существенно усложнена.

Ключевые слова: идентификация, беспилотное транспортное средство, отслеживание траектории.

Abstract. This paper presents the results of nonlinear model identification of an unmanned vehicle in the Gazebo simulator based on a neural network autoregressive model. The dynamic characteristics of the control object can vary significantly that complicates the problem. Data on the movement along the spatial path of an unmanned vehicle for the training sample was obtained at the Robotics Center of the FRC CSC RAS. The model parameters were found by the particle swarm optimization method. Using the identified model, real-time control methods were experimentally compared. Control was carried out on the basis of the PID controller, model predictive control method and identifier based on artificial neural networks. In a comparative experiment, for a more accurate assessment of the identification method, the model was subjected to random disturbances, and the tracking path of the control object was significantly complicated.

Keywords: identification, unmanned vehicle, path tracking.

Введение

Управление беспилотными транспортными средствами (БТС) из начального состояния в конечное должно обеспечивать требуемые показатели качества этого управления. При этом предъявляются требования синтезировать законы управления, обеспечивающие достижение цели управления в широком классе неопределенности динамики БТС. Для синтеза требуемых законов управления нам необходимо осуществить этап моделирования системы управления БТС. Математический аналог реальной системы можно получить с помощью известных методов идентификации [1, 2]. Данное исследование основывается на методах идентификации систем, таких как ARMAX (модели авторегрессивного скользящего среднего с эксогенными входами) и NARMAX (нелинейный ARMAX). Эти методы производят линейные и нелинейные полиномиальные функции, которые моделируют взаимосвязь между восприятием сенсора робота и моторной реакцией. Данные методы распространяются на нейросетевые структуры [3, 4] и применяются для нелинейного БТС.

Широкий спектр исследований в области мобильных систем БТС в автоматическом режиме направлен на разработку нелинейного закона управления для отслеживания траекторий в режиме реального времени [5].

© Прокопьев И. В., Софронова Е. А., 2020

Управление беспилотными транспортными средствами в реальном времени для отслеживания траектории разбивается, как правило, на три подзадачи: генерацию траектории, определение положения и отслеживание траектории.

В настоящей работе приведены результаты и показана возможность идентификации беспилотного транспортного средства в симуляторе Gazebo [6, 7] на основе нейросетевой авторегрессионной модели и экспериментально сравнены методы управления в реальном времени на примере решения задачи управления движением БТС по пространственной траектории. В сравнительном эксперименте для более точной оценки метода идентификации в модель включены случайные возмущения и усложнена траектория движения.

Идентификация модели беспилотного транспортного средства

Беспилотное транспортное средство построено на базе автомобильного шасси в масштабе 1:10, имеет вес 1,5 кг и может развивать скорость до 10 м/с. Внешний вид БТС представлен на рис. 1,а. Передние колеса БТС реализуют рулевое управление, задние колеса отслеживают состояние. На рис. 1,6 приведена кинематическая схема управления движением БТС, где x, y - координаты; а - угол поворота передних колес; В - ориентация БТС относительно оси x; L - расстояние между передней и задней осями робота; R - базовая точка, расположенная по середине задней оси робота.

а) 6)

Рис. 1. БТС и кинематическая схема управления движением

Измерение локальных координат движения БТС проводилось в Робототехническом центре ФИЦ ИУ РАН [8].

Сформулируем задачу идентификации как задачу оценивания параметров математической модели, которая обладает существенными чертами реальной системы и передает ее динамические свойства. Основу метода идентификации системы с динамическим объектом составляет реализация процедуры идентификации с использованием регрессионных математических форм.

Прогнозирование величины выхода у) на основе информации, полученной при измерении

других величин ф., I = 1, й , содержащих информацию о прошлом поведении системы, является задачей регрессии.

Для БТС, в том числе изображенного на рис. 1,а, идентификацию можно выразить в нахождении такой функции %(ф), чтобы оценка этой функции у(к) = %(ф) удовлетворяла установленному

критерию и была следующим шагом к величины у (к). Функция регрессии % (ф) оценивается по экспериментальным данным , к = 1, Ь, и % (ф) = % (ф, Ч), где q - вектор настраиваемых параметров, = {и (к), у (к)} - количество экспериментальных данных во всем рабочем диапазоне БТС. Для нашей системы это переменные состояния: продольная скорость, поперечная скорость, скорость

движения, рулевое управление и управление скоростью и производные по времени от переменных состояния. Качество идентификации зависит от достоверности и репрезентативности экспериментальных данных.

Динамический объект может быть выражен в следующем виде:

У (k > q )= g (Ф( k, q), q).

(1)

Модель динамики модели БТС была реализована на нейросетевой модельной структуре, имеющей следующую математическую форму:

g(Ф(k,q),q) = y(k|q) = y(k|w,W) = F £Wf £WjiФ

, + w

l=1

j o

+ W o

(2)

vj= vl

где q - настраиваемые параметры нейронной сети, включающие весовые коэффициенты и смещения (wjl,Wij); F(x) = ax — функция активации нейронов выходного слоя, a = const; nh — число нейронов в скрытом слое; fj (x) = tanh(x) — функция активации нейронов скрытого слоя; пф — число

входов. На вход обученной нейронной сети подаются переменные состояния, такие как продольная скорость, поперечная скорость, скорость движения, рулевое управление и управление скоростью и производные по времени от переменных состояния.

Модель кинематики БТС может быть реализована на следующей модельной структуре. Конечно-разностные уравнения модели мобильного робота имеют следующий вид:

" x( k +1)"

x( k +1) = У (k +1) =

0( k +1)

х (k) + V (k) д181и(9( k)) у (k) + V (k) ^т(9( k)) 9( k) + V (к )я1 1аи(а (k)) q2

где х( k) - вектор состояния объекта:

х (к) = [ х (к), у (к), 6( к), V (к), а (к )]Т,

v(к) - скорость движения робота, ц - вектор идентифицируемых параметров модели:

Ч =[4р Ч2]Т .

(3)

(4)

(5)

При использовании конечно-разностного уравнения (3) оптимизация параметров ц представляет собой отображение множества экспериментальных данных на множестве параметров модели (3). Критерием оптимальности является среднеквадратичная ошибка прогнозирования (1)

al (q, ZL) = -1- £ (y(к) - y(к | q))2.

2 L к =1

(6)

Идентификация заключается в автоматическом поиске параметров модели (3) и весовых коэффициентов нейронной сети (2) и в нахождении вектора параметров (5), минимизирующего критерий (6)

q = arg min aL (qZ ). q

(7)

Для нахождения вектора оптимальных параметров в ИНС использовался стохастический градиентный спуск с Adam [9].

Для нахождения вектора оптимальных параметров модели кинематики (3) используется метод оптимизации роя частиц (PSO) [10]

qk+1 = qk + vk+i> vk+1 = wkvk + с/1( pk - qk)+^r 2(pg - qk )>

(8)

где як - величина параметра, к - текущая итерация, VI - величина и направление вектора скорости каждого параметра, ^к - постоянный вес, с1, с2 - параметры ускорения, г1, г2 - случайные числа

от 0 до 1, p[ - лучшая найденная точка варианта параметра, pg - лучшая найденная точка всех вариантов параметра.

После вычисления направления вектора v параметр перемещается в точку qlk+1. В случае необходимости обновляются значения лучших точек для каждого параметра и для всех параметров в целом. После этого цикл повторяется.

Для сбора необходимого количества данных во всем рабочем диапазоне управления БТС использовалась система SLAM на основе 2d Lidar (RPLIDAR A2M8). Данные вектора управления и состояния были записаны с частотой 50 Гц.

В результате моделирования были получены следующие параметры:

q = [0,019; 0,0lf ,

удовлетворяющие (7) с ошибкой 8 < 0,002.

На рис. 2 показано моделирование идентифицируемой модели и экспериментальных данных канала поперечного управления БТС В . На рисунке пунктирной линией обозначен идентифицируемый выход, сплошной линией - полученные экспериментальные данные управления y (t) при изменении линейной скорости.

Рис. 2. Сравнение идентифицированной модели и экспериментальных данных

На рис. 3 показан график отклика канала поперечного управления БТС, т.е. ориентации БТС, на входное управление а при v(к) = const, график идентифицированной модели БТС, а также график самого управления.

— Original system — Identified system — U

—1-

-1-1- -1 1-1

50

100

150 Time

200

250

300

Рис. 3. Управление и отклик исходной и идентифицированной моделей

Задача синтеза управления движением вдоль пространственной траектории

В формальной постановке задачи синтеза управления [11] движением по пространственной траектории математическая модель объекта управления задается в виде системы обыкновенных дифференциальных уравнений х = f(х, и), где х - вектор состояния объекта, и - вектор управления, х е Кп, и е и с Кт, множество и замкнуто и ограниченно, т < п. Заданы начальное состояние объекта управления, пространственная траектория движения в виде п - г -мерных многообразий и время окончания процесса управления tf. Траектория движения не зависит от времени. Решением задачи синтеза является функция управления, зависящая от координат пространства состояний и = Ь (х), Ь (х ):Яп ^ Ят , при ^'х е Яп, Ь (х) е и, и обеспечивающая минимум критерия качества, например, минимум отклонения от траектории

J = — í p ф.(x(t))dt ^ min.

tfr oK í=i

Для решения задачи синтеза системы управления движением объекта по пространственной траектории используем ПИД-регулятор, прогнозное управление [12, 13] и аппарат искусственных нейронных сетей (ИНС) [3, 4, 14].

Для исследования предложенных подходов разработана среда моделирования БТС, построенная с использованием Gazebo ROS и основанная на динамике робота.

Схема отслеживания траектории

Желаемую траекторию задаем в виде последовательности точек на плоскости или в трехмерном пространстве в зависимости от задачи. Структурная схема системы управления БТС с использованием ПИД-регулятора, прогнозного управления идентификатора, основанного на нейронной сети и уравнений (3), представлена на рис. 4.

Рис. 4. Обобщенная схема системы управления

На рис. 4 отмечены: желаемая траектория х г (к) = [ хг (к), уг (к), В г (к )]г и измеренная траектория движения реального объекта х т (к) = [ хт (к), ут (к), Вт (к )]г.

В качестве желаемой траектории движения была использована траектория с перекрещиванием, одна из фигур Лиссажу

х (т) = 8ш(ат), у (т) = 8т(Ьт), а = 1, Ь = 2. (9)

Используем кубический сплайн для аппроксимации траектории. В общем виде аппроксимацию на интервале / определяем из соотношений

(х*) = а0/ + а1/(х * —х*) + а2/(х* - х*)2 + а3/ (х* - х*)3, (10)

% (у*) = к + Ьц (у * —у*) + Ь2. (у* — у*)2 + ЬХ1 (у — у*)3, (11)

где (х*,у*) - координаты точки I на траектории в плоскости XXУ, I = 1,N.

Контроллеры

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Управление с обратной связью

В качестве обратной связи по заданной скорости рассмотрим ПИД-регулятор, получающий ошибку по отклонению реального движения от заданной скорости. В общем случае ПИД-регулятор имеет вид

У

= kle(t ) + k2 J e(t ) dt + k3è(t ),

где е^) - отклонение желаемого сигнала от реального, к 1, к2, к3 - коэффициенты звеньев регулятора, у - управляющий сигнал, поступающий на объект.

Качество управления определяется величиной перерегулирования, временем переходного процесса и статической ошибкой.

В контуре рулевого управления БТС был использован ПИД-регулятор. Управляющие воздействия на БТС имели следующий вид:

а = arctan:

Lw

(12)

где Ь - расстояние между осями робота; V и w - линейная и угловая скорости движения робота,

ук (5) соз( 9е) |, зт(9е)

w = —е/ — к0 V 0е — (ке V —)е,

1 - k(s)e

9e

(13)

к(5) - кривизна пути; 9е - ошибка направления движения; е - ошибка по положению; к9, ке - коэффициенты регулятора.

На рис. 5 представлены результаты моделирования применения ПИД-регулятора, что позволило отследить желаемую траекторию с минимальной среднеквадратической ошибкой (МСО). Красной линией показана желаемая траектория, а зеленой линией - отслеженная.

Рис. 5. Результаты моделирования применения ПИД-регулятора

v

Прогнозное управление

Прогнозное управление переопределяет собой оптимизационную стратегию, обладающую рядом преимуществ, таких как учет ограничений на состояние системы и на управляющие сигналы, работа с нелинейными объектами.

Решением задачи оптимизации является оптимальная траектория. Прогнозное управление включает в себя моделирование различных входов объекта, прогнозирование итоговой траектории и выбор этой траектории по одному или нескольким критериям, например,

L L

J = X wX/ (r - x, )2 + X w, Am,2 ^ min , (14)

i=1 i=1

где wx , wu - весовые коэффициенты; rt - желаемая траектория; xi - управляемая переменная; ui - управление.

Цель прогнозного управления заключается в нахождении на каждом шаге оптимального управления для некоторого временного интервала, называемого горизонтом управления. Применяется только первый найденный шаг из стратегии

K (Xk ) = Uk+1(xk Ь (15)

далее происходят сдвиг горизонта прогнозирования и новая оптимизация. Проведение оптимизации на каждом шаге в режиме онлайн стало возможным благодаря доступности высокопроизводительных вычислительных средств на борту БТС.

Для модели объекта управления (3) и значения горизонта прогнозирования, равного (8), желаемая и полученная траектории приведены на рис. 6.

x[mj

Рис. 6. Предсказанная по модели и экспериментальная траектории

Нейросетевое управление с прогнозирующей моделью

Искусственная нейронная сеть используется в качестве модели объекта управления. Схема нейросетевого управления на основе прогнозирующей модели приведена на рис. 7.

Концепция прогнозирующего управления состоит в определении управляющего сигнала на каждой итерации посредством минимизации критерия

Nmax 2 Nu 2

J = X [r(k + i)-y(k + i| k)] +ßX[Au(k + i-1)] ^min, (16)

7=Nmin 7=1

Au (k + i -1) = u (к + i)-u (к + i-1), Au (к + i) = 0, Nu < i < Nmax - d, umin < u (k)< umax,

где d - время задержки в системе, Nmin - минимальный горизонт прогнозирования, Nmax - максимальный горизонт прогнозирования.

Прогнозирующая модель g(ф(k, q), q) может быть реализована на нейросетевой модельной структуре, имеющей следующее математическое представление:

g, (ф(k,q),q) = y,(k |q) = yt(k|w, W) = F £ Wf £ wßф,

, + w

j 0

Л л

+ Wo о

№3 (31), 2020 (17)

v j=1 Vl=1 j j

где q — вектор настраиваемых параметров нейронной сети, включающий весовые коэффициенты и нейронные смещения (wjl ,Wj); Fi (x) = ax; a = const — активационная функция нейронов выходного слоя; nh — число нейронов в скрытом слое; пф — размерность регрессионного вектора (число входов ИНС); fj (x) = tanh( x) — активационная функция нейронов скрытого слоя.

Рис. 7. Схема управления с прогнозирующей моделью с идентификатором динамики на основе нейронной сети

Для синтеза закона управления для нахождения минимума (16) используются методы последовательного приближения, или итеративные методы поиска:

U k+i = U k +П kd k >

(18)

где ик - вектор управляющих сигналов на к-й итерации; п к - шаг алгоритма и dк - направление поиска.

Направление поиска методом Ньютона с подходом Левенберга - Марквардта [15-17] определяется из следующего уравнения:

[ H (U k (t ) ) + Xk I ] d k =-g (U k (t ) )

где

g (Uk (t)) =

dJ (U (t ), t )

3U (t )

-2 " dY(t ) "

u ( t )=u k ( t ) 3U (t )

E (t ) + 2p

-2(U(t))E(t) + 2p

aij (t )

3U(t )

U (t )

dU (t )

dU (t )

u ( t )=u k ( t )

U (t)

u ( t )=u k ( t )

ч dJ2 (U(t), i)

H(U*(t))= ;

Эи (t )2

и (t)=u * (t)

/г- л IT

dY(t) dU (t)

E (t)

dU (t)

- + 2p

" dU (t) " T " dU (t)"

_ dU (t) _ _ dU (t) _

u (t )=u * (t)

Для реализации контроллера, основанного на идентификаторе ИНС, на первом этапе собрали данные для обучения в ручном режиме.

Минимальный прогнозирующий горизонт был равен временной задержке, максимальный прогнозирующий горизонт по эмпирическому правилу приближенно был равен времени переходного процесса системы.

Рис. 8. Отслеживание траектории при неопределенности с помощью ПИД-регулятора

Было проведено экспериментальное сравнение результатов двух широко применяемых методов управления движением беспилотного транспортного средства по траектории в реальном времени. Управление осуществлялось на основе ПИД-регулятора, метода прогнозного управления в си-муляторе Gazebo ROS с реальной динамикой БТС. В результате работы была исследована процедура предложенного метода идентификации с моделью нейронной сети и оптимизации параметров методом роя частиц.

Для каждого из методов выполнялись следующие эксперименты: движение объекта по заданной относительно простой траектории, движение объекта управления со случайным воздействием на модель и движение объекта по заведомо сложной траектории.

В первом эксперименте при движении объекта по заданной относительно простой траектории полученные при моделировании графики представлены на рис. 5, 6. Значения среднеквадратических ошибок приведены в табл. 1. Среднее время вычислений управления на каждом шаге составило ТПИд-рег = 0,0022 с, ТПУ = 1,12 с. Соотношение по времени вычислений между методами для всех последующих экспериментов сохранялось.

Таблица 1

Результаты вычислительного эксперимента

МСО ПИД-рег. ПУ

Координата x 0,0124 0,0016

Координата y 0,0329 0,0058

Угол ориентации 9 0,0020 0,0368

Во втором эксперименте в модель объекта управления была добавлена неопределенность

~ х (к) + V (к) я^тС 0( к)) + £( к)" у ( к ) + v( к ) qlsi п(9( к )) + к ) 9( к) + V (к) 1ап(а (к))

" x ( k + 1) "

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

x( k + 1) = У ( k +1) =

9( k +1)

(19)

где к) - случайная величина с нормальным распределением и стандартным отклонением 0,7. Графики, полученные при моделировании, представлены на рис. 8, 9. Значения среднеквадратиче-ских ошибок приведены в табл. 2.

Рис. 9. Отслеживание траектории при неопределенности с помощью прогнозного управления

Таблица 2

Результаты среднеквадратических ошибок вычислительного эксперимента при неопределенности

МСО ПИД-рег. ПУ

Координата х 1,1459 0,7597

Координата у 0,8247 0,4194

Угол ориентации 9 0,2356 0,1565

В третьем эксперименте геометрия траектории была изменена так, чтобы объект заведомо не мог двигаться по траектории точно из-за имеющихся ограничений на управление. Графики, полученные при моделировании движения по сложной траектории, представлены на рис. 10, 11. Значения среднеквадратических ошибок приведены в табл. 3.

Таблица 3

Результаты вычислительного эксперимента при сложной траектории

МСО ПИД-рег. ПУ

Координата x 0,1053 0,0385

Координата y 0,1333 0,0797

Угол ориентации 9 0,0363 0,1410

При проведении экспериментов фиксировались рулевые управления во времени. Графики полученных рулевых управлений приведены на рис. 12, 13.

Рис. 12. Рулевой управление, полученное с помощью ПИД- регулятора

Рис. 13. Рулевой управление, полученное с помощью прогнозного управления

Заключение

В результате работы была проверена процедура предложенного метода идентификации БТС с нейросетевой моделью и оптимизации параметров методом роя частиц. Идентификационная модель была использована в экспериментальном сравнении результатов двух методов управления движением беспилотного транспортного средства по траектории в реальном времени. Управление осуществлялось на основе ПИД-регулятора, метода прогнозного управления и идентификатора на основе искусственных нейронных сетей.

Для каждого из методов были выполнены следующие эксперименты: движение объекта по заданной относительно простой траектории, движение объекта управления со случайным воздействием на модель и движение объекта по заведомо сложной траектории.

В результате моделирования методы обеспечили достаточно точное движение БТС по простой и сложной траекториям, однако время вычисления управления для метода прогнозного управления было в 500 раз больше (при реализации оптимизатора на CPU). В реальном БТС управляющие команды не выполняются мгновенно, а происходит задержка, например, из-за динамики привода.

По значению среднеквадратических ошибок лучшие результаты показал метод прогнозного управления. ПИД-регулятор показывал приблизительно одинаковые результаты, при небольшой скорости, по сравнению с контроллером, на основе прогнозного управления, при увеличении скорости прогнозное управление справляется с задержками и проскальзыванием колес, а ПИД-регулятор становиться неустойчивым при скорости более 5 м/с, что в два раза хуже прогнозного управления.

Работа выполнена при частичной поддержке РФФИ, проект № 18-29-03061-мк, результаты главы 2 получены при поддержке РНФ, проект № 19-11-00258.

Библиографический список

1. Льюнг, Л. Идентификация систем / Л. Льюнг. - Москва : Наука, 1991. - 432 с.

2. Пупков, К. А. Статистические методы анализа, синтеза и идентификации нелинейных систем автоматического управления / К. А. Пупков, Н. Д. Егупов, А. И. Трофимов. - Москва : МГТУ им. Баумана, 1998. -562 с.

3. Круглое, В. В. Искусственные нейронные сети. Теория и практика / В. В. Круглов, В. В. Борисов. - Москва : Горячая линия - Телеком, 2002. - 382 с.

4. Руткоеская, Д. Нейронные сети, генетические алгоритмы и нечеткие системы / Д. Рутковская, М. Пилинь-ский, Л. Рутковский. - Москва : Горячая линия - Телеком, 2004. - 452 с.

5. A Survey of Motion Planning and Control Techniques for Self-driving Urban Vehicles / B. Paden, M. Cap, S. Z. Yong, D. Yershov, E. Frazzoli // IEEE Transaction on intelligent vehicles. - 2016. - DOI 10Л109ЛТУ.2016.257806.КорпусГО:1229096

6. Fairchild, C. ROS Robotics By Example / C. Fairchild, T. L. Harman. - Packt Publishing, 2016.

7. Gazebo. - URL: http://gazebosim.org/

8. Дарьина, А. Н. Робототехнический центр ФИЦ ИУ РАН / А. Н. Дарьина, А. И. Дивеев, И. В. Прокопьев // Вопросы теории безопасности и устойчивости систем. - 2019. - Вып. 21. - C. 66-77.

9. Kingma, D. P. A Method for Stochastic Optimization / D. P. Kingma, J. A. Ba // 3rd International Conference for Learning Representations. arXiv:1412.6980v8 [cs.LG]. - San Diego, 2015. - 15 p. - URL: https://arxiv.org/pdi71412.6980v8.pdf

10. Lindfield, G. Particle Swarm Optimization Algorithms // Introduction to Nature-Inspired Optimization / ed. by George Lindfield, John Penny. - Academic Press, 2017. - P. 49-68. - URL: https://doi.org/10.1016/B978-0-12-803636-5.00003-7.

11. Диееее, А. И. Синтез системы управления - задача тысячелетия / А. И. Дивеев, К. А. Пупков, Е. А. Софро-нова // Вестник РУДН, Сер.: Инженерные исследования. - 2011. - № 2. - С. 113-125.

12. Mehta, B. R. Advanced process control systems // Industrial Process Automation Systems / ed. by B. R. Mehta, Y. J. Reddy. - Butterworth-Heinemann, 2015. - P. 547-557. - URL: https://doi.org/10.1016/B978-0-12-800939-0.00019-X

13. Huang, B. Dynamic Modeling, Predictive Control and Performance Monitoring: A Data-driven Subspace Approach, Lecture Notes in Control and Information Sciences / B. Huang, R. Kadali. - Springer, 2008. - 241 p.

14. Pham, D. Neural Networks for Identification, Prediction and Control / D. Pham, X. Liu. - Springer, 1995. - 238 p.

15. Marquardt, D. An algorithm for least-squares estimation of nonlinear parameters / D. Marquardt // SIAM J. Appl. Math. - 1963. - № 11. - P. 164-168.

16. Levenberg, K. A Method for the solution of certain nonlinear problems in least squares / K. Levenberg // Quart. Appl. Math. - 1944. - № 2. - P. 164-168.

17. Broyden, C. G. Quasi-Newton methods and their applications to function minimization / C. G. Broyden // Journal of the American Mathematical Community. - 1967. - Vol. 21. - P. 368-381.

References

1. L'yung L. Identifikatsiya sistem [System identification]. Moscow: Nauka, 1991, 432 p. [In Russian]

2. Pupkov K. A., Egupov N. D., Trofimov A. I. Statisticheskie metody analiza, sinteza i identifikatsii nelineynykh sistem avtomaticheskogo upravleniya [Statistical methods for analysis, synthesis, and identification of nonlinear automatic control systems]. Moscow: MGTU im. Baumana, 1998, 562 p. [In Russian]

3. Kruglov V. V., Borisov V. V. Iskusstvennye neyronnye seti. Teoriya i praktika [Artificial neural network. Theory and practice]. Moscow: Goryachaya liniya - Telekom, 2002, 382 p. [In Russian]

4. Rutkovskaya D., Pilin'skiy M., Rutkovskiy L. Neyronnye seti, geneticheskie algoritmy i nechetkie sistemy [Neural networks, genetic algorithms, and fuzzy systems]. Moscow: Goryachaya liniya - Telekom, 2004, 452 p. [In Russian]

5. Paden B., Cap M., Yong S. Z., Yershov D., Frazzoli E. IEEE Transaction on intelligent vehicles. 2016. DOI 10.1109/TIV.2016.257806.KorpusID:1229096

6. Fairchild C., Harman T. L. ROS Robotics By Example. Packt Publishing, 2016.

7. Gazebo. Available at: http://gazebosim.org/

8. Dar'ina A. N., Diveev A. I., Prokop'ev I. V. Voprosy teorii bezopasnosti i ustoychivosti system [Questions of the theory of security and stability of systems]. 2019, iss. 21, pp. 66-77. [In Russian]

9. Kingma D. P., Ba J. A. 3rd International Conference for Learning Representations. arXiv:1412.6980v8 [cs.LG]. San Diego, 2015, 15 p. Available at: https://arxiv.org/pdf/1412.6980v8.pdf

10. Lindfield G. Introduction to Nature-Inspired Optimization. Academic Press, 2017, pp. 49-68. Available at: https://doi.org/10.1016/B978-0-12-803636-5.00003-7.

11. Diveev A. I., Pupkov K. A., Sofronova E. A. Vestnik RUDN, Ser.: Inzhenernye issledovaniya [RUDN Bulletin, Ser.: Engineering research]. 2011, no. 2, pp. 113-125. [In Russian]

12. Mehta B. R. Industrial Process Automation Systems. Butterworth-Heinemann, 2015, pp. 547-557. Available at: https://doi.org/10.1016/B978-0-12-800939-0.00019-X

13. Huang B., Kadali R. Dynamic Modeling, Predictive Control and Performance Monitoring: A Data-driven Subspace Approach, Lecture Notes in Control and Information Sciences. Springer, 2008, 241 p.

14. Pham D., Liu X. Neural Networks for Identification, Prediction and Control. Springer, 1995, 238 p.

15. Marquardt D. SIAM J. Appl. Math. 1963, no. 11, pp. 164-168.

16. Levenberg K. A Quart. Appl. Math. 1944, no. 2, pp. 164-168.

17. Broyden C. G. Journal of the American Mathematical Community. 1967, vol. 21, pp. 368-381.

Прокопьев Игорь Витальевич

доктор технических наук, ведущий научный сотрудник, Федеральный исследовательский центр «Информатика и управление» Российской академии наук, (Вычислительный центр им. А. А. Дородницына РАН) (Россия, г. Москва, ул. Вавилова, 44, стр. 2) E-mail: fvi2014@list.ru

Софронова Елена Анатольевна

кандидат технических наук, доцент, старший научный сотрудник, Федеральный исследовательский центр «Информатика и управление» Российской академии наук (Вычислительный центр им. А. А. Дородницына РАН) (Россия, г. Москва, ул. Вавилова, 44, стр. 2) E-mail: sofronova_ea@mail.ru

Prokopyev Igor Vitalevich

doctor of technical sciences, leading researcher,

Federal research center

«Computer science and control» of RAS

(Dorodnitsyn computer center

of the Russian Academy of Sciences)

(bld. 2, 44 Vavilova street, Moscow, Russia)

Sofronova Elena Anatolievna

candidate of technical sciences,

associate professor, senior researcher,

Federal research center

«Computer science and control» of RAS

(Dorodnitsyn computer center

of the Russian Academy of Sciences)

(bld. 2, 44 Vavilova street, Moscow, Russia)

Образец цитирования:

Прокопьев, И. В. Исследование метода идентификации модели и методов управления беспилотным транспортным средством по пространственной траектории / И. В. Прокопьев, Е.А. Софронова // Надежность и качество сложных систем. - 2020. - № 3 (31). - С. 99-111. - БО! 10.21685/2307-4205-2020-3-12.

i Надоели баннеры? Вы всегда можете отключить рекламу.