ДИСТАНЦИОННОЕ УПРАВЛЕНИЕ КОСМИЧЕСКИМИ РОБОТАМИ С АДАПТАЦИЕЙ К ИЗМЕНЕНИЯМ ЕГО ВНЕШНЕЙ СРЕДЫ

Кулаков Ф.М.; Соколов Б.В.; Алферов Г.В.; Ефимова П.А.

ВЕСТНИК ПЕРМСКОГО УНИВЕРСИТЕТА 2018 Математика. Механика. Информатика Вып. 4(43)

МЕХАНИКА МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

УДК 531.391

Дистанционное управление космическими роботами с адаптацией к изменениям его внешней среды

Ф. М. Кулаков1'2, Б. В. Соколов2, Г. В. Алферов1, П. А. Ефимова1

1 Санкт-Петербургский государственный университет

Россия, 198504, г. Санкт-Петербург, Петергоф, Университетский проспект, 35

2 Санкт-Петербургский ин-т информатики и автоматизации РАН (СПИИРАН) Россия, 199178, г. Санкт-Петербург, 14 линия, 39

kufelix@yandex.ru; +7-906-244-82-16

Описывается метод дистанционного билатерального управления космическими роботами, функционирующими в недетерминированной внешней среде, при большом запаздывании в передаче управляющих сигналов. Метод обеспечивает адаптацию поведения космического робота к возможному изменению внешней среды. В отличие от известных подходов, данный метод уменьшает влияние вариации внешней среды на процесс управления.

Ключевые слова: билатеральное управление; дистанционное управление; локационные сенсорные системы; адаптивное управление; устойчивость процессов управления.

DOI: 10.17072/1993-0550-2018-4-16-26

Введение

Одной из самых востребованных и перспективных областей применения роботов является проведение разнообразных работ в космосе, это дает огромный экономический эффект и освобождает людей от пребывания в опасной космической среде, где должны быть выполнены требуемые операции. Именно поэтому проблема создания дистанционно управляемых из наземного центра управления космических роботов стоит чрезвычайно актуально.

К сожалению, успех в решении этой проблемы нельзя признать достаточным для развертывания работ по созданию реактивных космических роботов, способных успешно выполнять требуемые действия в космосе, хотя исследования в этом направлении имеют

Работа выполнена при финансовой поддержке РФФИ, проект № 18-08-00419.

давнюю историю. Основными причинами этого являются, во-первых, недетерминированность внешней космической среды, в которой должен действовать робот (в отличие, например, от промышленной среды), во-вторых, нетривиальность действий, которые должен выполнять космический робот, в отличие от промышленных роботов, которые в подавляющем большинстве случаев должны захватывать и перемещать известные по форме предметы из одних точно известных позиций в другие.

В случае с космическими роботами при выполнении существенно более сложных операций в недетерминированной внешней среде система его управления, по существу, должна в какой-то степени воссоздавать функции центральной нервной системы человека и его мозга при формировании сигналов управления мышцами человеческого тела и его рук, выполняющих требуемое действие.

При необходимости выполнения подобных операций с помощью роботов не в космосе, а на Земле в недетерминированной внешней среде обычно применяется копирующее билатеральное управление, которое позволяет использовать при управлении интеллектуальные возможности человека, его центральную нервную и сенсорную системы.

Как известно, для управления человек пользуется так называемой задающей рукояткой, перемещая ее держатель, движение которой повторяет рабочий инструмент (схват) управляемого робота. Таким образом, человек контролирует движение схвата с помощью своей зрительной системы, заставляя его двигаться в пространстве требуемым образом в соответствии с выполняемой задачей. В случае если схват перемещает захваченный им предмет, используя механические связи, при выполнении операции возможно возникновение сил взаимодействия схвата с перемещаемым предметом и внешней средой, которые измеряются специальным силомоментным датчиком, обычно установленным на запястье рук. Они передаются на держатель задающей рукояти с помощью системы силомоментного управления. Эти силы воспринимаются кистью руки человека, перемещающего держатель, что позволяет человеку правильным образом мгновенно скорректировать перемещение держателя и соответственно схвата робота.

Только благодаря мгновенной реакции человека на силы взаимодействия возможно успешное выполнение операции. Любые запаздывания реакции затрудняют выполнение требуемой операции, а при запаздывании свыше 0,2 секунд делают ее невозможной. Именно поэтому применение билатерального управления космическими роботами в чистом виде невозможно и требует кардинального усовершенствования. К настоящему времени можно выделить следующие основные подходы к решению дистанционного управления космическими роботами.

Первый основан на использовании так называемых пассивных методов билатерального управления (passivity bilateral control scheme) [1, 2], при которых мощность, развиваемая билатерально управляемыми с помощью задающей рукоятки рабочим инструментом манипулятора, не должна превышать мощности, развиваемой рукой человека, перемещающего эту рукоятку.

Это хотя и накладывает определенные ограничения на функциональные возможности системы билатерального управления, вместе с тем в соответствии с теорией рассеяния энергии гарантирует выполнение одного из важнейших требований билатерального управления, обеспечивающего его работоспособность, - требование устойчивости. К сожалению, другое важное требование - требование транспарентности - в этом случае плохо реализуемо. А в отсутствие транспарентности, в данном случае идентичности ощущений оператора, дистанционно билатерально управляющего роботом, ощущениям, которые он испытывал бы при управлении в отсутствие запаздывания, как уже отмечалось выше, человеку трудно осуществить требуемую операцию по перемещению предметов, имеющих голономные связи.

Второй подход предполагает использование так называемого прогнозирующего управления (prediction control) [3, 4]. Оно базируется на применении компьютерных и полунатурных моделей космического робота и его внешней среды. С помощью этих моделей с учетом разнообразной сенсорной информации о текущем состоянии робота и его внешней среды прогнозируется их состояние. Исходя из этого прогноза, формируются соответствующие управляющие сигналы. Для этих целей возможно использование специальных регуляторов, в частности СМИТ-контроллера (SMITH-controller), как это сделано в [3]. Эти контроллеры формируют прогнозирующую поправку к сигналам управления приводами космического робота, генерируемую при перемещении задающей рукоятки. В рамках этого подхода достигается более качественное выполнение требования транспарентности.

Третий подход основан на применении скользящего режима управления (sliding control) [5, 6]. Сложность практической реализации этого подхода обусловлена необходимостью функционирования управляющей аппаратуры и механической части робота в весьма тяжелых режимах часто изменяемого знака управлений, имеющих к тому же максимально допустимые значения. Это приводит к появлению больших ускорений элементов конструкции, а следовательно, и больших реактивных сил.

Существуют и другие, правда, значительно менее распространенные методы.

Результаты теоретических и экспериментальных исследований этих подходов показали, что при их практическом использовании можно решить проблему запаздывания, когда оно, в лучшем случае, не превышает 1-2 с. Кроме того, внешняя среда, в которой должен функционировать реальный робот-манипулятор, должна быть "линейной", т.е. линейные приближения "прогнозирующих" поправок должны быть достаточно качественными.

1. Особенность предлагаемого способа дистанционного управления

Предлагаемый в статье подход [7-15] предусматривает разделение процесса управления на два этапа. Первый этап, осуществляемый на наземном центре управления, является этапом обучения робота требуемому действию. Второй - этап исполнения этого действия реальным космическим роботом.

На первом этапе осуществляется управление не самим роботом, а очень качественной его моделью, возможно компьютерной, но лучше полунатурной или, если это возможно, натурной.

Модель должна функционировать в среде, которая является моделью реальной внешней среды робота. В этой "модельной" среде человек должен выполнить с помощью модели робота требуемую операцию. Для этого, в частности, допустимо использование билатерального управления моделью с использованием так называемой задающей рукоятки. Рука человека, перемещающего задающую рукоятку, заставляет тем самым двигаться рабочий инструмент модели робота по траектории движения рукоятки. При этом рука человека ощущает силу взаимодействия рабочего инструмента модели с моделями объектами внешней среды, перемещения которых ограничены связями. Допустимо использовать и другие способы выполнения операций, например, с использованием, так называемой задающей перчатки, о которой будет сказано ниже.

В процессе выполнения требуемой операции с использованием соответствующих сенсоров формируется целый ряд разнообразных данных, необходимых для использования в процессе телеуправления космическим роботом.

В их число входит траектория изменения в пространстве и времени вектора положения рабочего инструмента модели робота в

координатах его корпуса, вектор изменения во времени силы взаимодействия рабочего инструмента модели робота с моделями объектов внешней среды, а также данные, несущие информацию о положении моделей объектов внешней среды, с которыми должен взаимодействовать рабочий инструмент робота.

Полезно отметить, что закон изменения во времени вектора силы взаимодействия рабочего инструмента робота с объектами внешней среды, а также "привязанный" к нему закон изменения вектора положения этого объекта в системе координат рабочего инструмента (например, схвата), являются необходимым инвариантом - паспортом требуемой операции, содержащим все необходимые данные для ее выполнения.

На втором этапе должно осуществляться управление реальным космическим роботом, локальная система управления которого должна отрабатывать программную траекторию, сформированную на первом этапе и переданную через канал связи в локальную систему управления роботом.

Суммируя сказанное, можно утверждать, что описанный метод организации дистанционного управления космическими роботами при наличии большого запаздывания передачи управляющих сигналов относится к классу методов, позволяющих осуществлять режим off-line управления, предусматривающих сначала формирование плана, а потом его реализацию.

Степень успешности их исполнения определяется качеством моделей внешней среды и самого робота, с помощью которых осуществляется процесс обучения. Очевидно, что программные траектории, полученные в процессе обучения с использованием неточной модели, при их использовании роботом, функционирующим в реальной внешней среде, спровоцируют ошибочное поведение робота.

Предложенный подход предусматривает формирование сигнала коррекции программной траектории рабочего инструмента космического робота, который в конечном счете повышает вероятность успешного выполнения требуемой операции. Это выделяет его из класса традиционных подходов off-line дистанционного управления. Возможность коррекции программной траектории базируется на вышеприведенном утверждении о сущест-

вовании паспорта выполняемой рабочим инструментом любой операции по взаимодействию его с объектами внешней среды. Он является инвариантом операции, содержащим все необходимые данные для ее выполнения.

Таким образом, для успешного выполнения рабочим инструментом операции по взаимодействию его с объектами внешней среды необходимо, чтобы взаимное положение рабочего инструмента и объекта в процессе выполнения операции, а также силы их взаимодействия были идентичны силам и положению в процессе обучения. Сигнал коррекции формируется в результате обработки дополнительной информации.

Эта дополнительная информация несет данные, с помощью которых можно определить взаимное положение модели рабочего инструмента космического робота и моделей объектов внешней среды, а также данные о силах взаимодействия между ними. Для получения дополнительной информации необходимо использование разнообразных сенсоров, которыми должны быть оснащены модель космического манипулятора и его рабочий инструмент. Ими могут быть локационные, силомоментные, тактильные сенсоры, а также ТУ-камеры, необходимые для реализации системы технического зрения.

Формирование корректирующих сигналов требует также использования аналогичной текущей дополнительной информации, получаемой в процессе выполнения космическим роботом требуемой операции с помощью сенсоров, идентичных сенсорам модели робота, и расположенных на нем таким же образом, как и на модели.

Поскольку вышеупомянутая дополнительная информация есть результат функционирования сенсорной системы робота, в дальнейшем будем именовать ее "сенсорным образом". Корректирующий сигнал является функцией величины рассогласования между "модельным" и реальным сенсорными образами. Он обращается в ноль при "нулевом" рассогласовании между ними. Простейшим примером сенсорного образа могут быть изображения множества характерных точек, принадлежащих предметам модели внешней среды робота. Ими могут быть изображения так называемых характерных точек, например, это вершины многогранников. Из изображения

внешней среды, полученного с помощью TV-камер, расположенных на модели рабочего инструмента, они выделяются специальной "распознающей программой". Изображения аналогичных точек реальной внешней среды формируются на стадии выполнения роботом программной траектории с помощью TV-камер, расположенных на реальном рабочем инструменте, точно так же, как и на его модели.

Поэтому при идеальном формировании программной траектории и идеальной их отработке изображения этих точек должны совпадать с изображениями "модельных" точек. Однако реально, из-за возможной неточности модели внешней среды, они не совпадают. Рассогласования позиций изображений характерных модельных и соответствующих им реальных точек используются для формирования величины коррекции положения рабочего инструмента космического манипулятора при воспроизведении программы его системой управления. Сенсорными образами могут быть и "силовые" образы, получаемые с помощью запястных силомоментных сенсоров робота и его модели. Результатом обработки этих сигналов являются векторы сил взаимодействия модели рабочего инструмента с моделями перемещаемых тел внешней среды, имеющими связи, а также векторы сил взаимодействия реального рабочего инструмента с реальными телами.

Как следует из вышеупомянутого, сигнал коррекции является результатом процесса регулирования "по отклонению" сенсорного образа от требуемого его значения. Для улучшения динамики этого процесса возможно вместо регулирования "по отклонению" использовать более совершенный способ регулирования, например комбинированный.

Важно отметить, что модифицированный off-line метод дистанционного управления сохраняет все преимущества немодифи-цированного метода, т.е. в значительной степени снимает ограничения по времени запаздывания и его вариации, и в то же время имеет меньшую, чем традиционный метод, зависимость от качества модели внешней среды.

Полагаем, модифицированный off-line метод дистанционного управления более эффективно применять при реализации дистанционного управления в стационарных или квазистационарных средах, когда объекты

внешней среды не слишком быстро перемещаются. Однако он остается работоспособным, как в случае свободно перемещаемых объектов среды, так и в случае, если перемещения объектов ограничены связями. Например, таким объектом может быть шкаф с гнездами, в которых должны быть вставлены платы, перемещаемые по направляющим. Возможной средой может быть поверхность произвольного профиля, которую надо отшлифовать специальным инструментом, осуществляя давление на поверхность с требуемой силой. Сочленение двух деталей, одна из которых имеет отверстие, а другая - вставляемый в это отверстие штырь, также является возможным вариантом внешней среды.

Вышеприведенные операции и другие им подобные в принципе могут быть использованы при создании интерпретатора расширяемого проблемно ориентированного языка для реализации супервизорного управления космическим роботом.

2. Основные виды информации, формируемые при обучении

Как уже было сказано выше, в процессе обучения дистанционно управляемого робота требуемому действию, которое осуществляется человеком-оператором с помощью модели робота в среде, являющейся моделью реальной внешней среды, обычно происходит формирование следующих данных:

- закон изменения во времени вектора обобщенных координат робота g(V), формируемый с помощью датчиков измерения обобщенных координат;

- закон изменения во времени вектора силы взаимодействия рабочего инструмента робота с объектом внешней среды G(t), если такое взаимодействие имеет место (например, в случае сборочных операций), перечисленные данные используются в законах управления роботом.

С помощью этих законов, во-первых, поддерживается перемещение рабочего инструмента робота в свободном пространстве по траектории, близкой к траектории движения рабочего инструмента модели рабочего инструмента, перемещаемого человеком при обучении.

Во-вторых - при "связанном" движении, когда на перемещаемый инструмент на-

ложены механические связи, этот закон обеспечивает повторение силы взаимодействия рабочего инструмента с предметом, измеряемой при обучении, что позволяет успешно выполнить операцию, требующую взаимодействия рабочего инструмента с перемещаемым объектом.

Указанные законы управления реализуют способ управления "по отклонению" и поэтому обязательным элементом этих законов является функция рассогласования, в данном случае между вектором желаемого gd (V) текущего g(V) изменения во времени векторов обобщенных координат, а также желаемого Gd (V) и текущего G(t) векторов

взаимодействия рабочего инструмента с перемещаемым им предметом внешней среды.

Однако этих перечисленных данных недостаточно, чтобы сформировать законы управления, которые, несмотря на возможные и очень вероятные отличия положений предметов внешней среды робота от их "модельных" положений, позволяют поддерживать положение рабочего инструмента относительно объектов внешней среды таким же, каким оно было при обучении робота требуемым действиям. Выполнение этого условия существенно повышает вероятность осуществления роботом операций по взаимодействию рабочего инструмента с объектами внешней среды.

Вышеуказанные соображения заставляют дополнить список данных, получаемых в результате обучения робота новым типом данных. Ими являются векторы изменения во времени положений, так называемых характерных точек второго типа на поверхности модели внешней среды робота х' (V), где ' = 1,2,..., п. В отличие от характерных точек первого типа, формируемых с помощью системы технического зрения, их позиции измеряются с помощью локационного сканирующего лазерного или радиоволнового устройства, жестко связанного с рабочим инструментом механической "руки" робота, например, с его схватом.

Каждый вектор положения характерной точки может быть представлен в системе координат устройства, т.е. в системе координат схвата, в виде трехмерного вектора, например, в сферической системе координат в виде х(г',ф'т,в'т) . При выполнении требуемой операции реальным роботом в реальной

внешней среде, которая может отличаться от "модельной", так же формируются характерные точки с помощь сканирующего устройства, подобного "модельному".

Полученные в результате этого векторы положения характерных точек X' (R' ,р'р,в1р )

реальной внешней среды будут отличаться от соответствующих векторов "положений модельных характерных точек". Соответствующими друг другу считаются модельные и реальные характерные точки, имеющие две из трех компонент векторов положения этих точек равными друг другу. Например, в случае, если векторы положения представлены в сферических координатах, ими могут быть угловые координаты: рт = (р'р и в'т = в'р.

Будем полагать, что типовое, наиболее часто встречающееся отличие реальной среды от ее модели, состоит не в разнице пространственных конфигураций их поверхностей, а, в основном, только в относительном смещении и повороте друг относительно друга этих поверхностей.

Поэтому для достижения положения рабочего инструмента (схвата) относительно поверхности внешней среды, идентичного их относительному "модельному" положению, что необходимо для успешного выполнения требуемой операции, достаточно соответствующим образом дополнительно повернуть и сдвинуть схват, рисунок поясняет сказанное.

На нем для большей наглядности представлен не трехмерный, а двумерный случай внешней среды. Векторы положений соответствующих характерных точек реальной среды X1 (Я1 ,р) и ее модели х' (г' ), выявленных локационными устройствами, отличаются только своими радиус-векторами Я Ф г1, где 1 = 1,2,...,п номер характерной точки.

Для того чтобы положение схвата относительно реальной поверхности было идентичным положению его модели относительно модели поверхности, необходимо чтобы векторы положения, по крайней мере, двух характерных точек (а в трехмерной среде - трех характерных точек, не лежащих на одной прямой) были равными, т.е.: X' = х1, где 1 = 1,2,...,п.

Нетрудно доказать, что если для трех точек в трехмерной среде совпадение векторов положения имеет место, то вышеуказанные равенства справедливы для большего числа соответствующих характерных точек.

Учитывая вышеизложенное, для поддержания в процессе управления реальным роботом положения его рабочего инструмента относительно поверхности реальной внешней среды с различными предметами на ее поверхности близкой к "модельному", целесообразно использовать в законе управления дополнительно к функциям рассогласования между желаемым и текущим изменениями во времени векторов обобщенных координат gd ^) и g(V), а также векторов сил взаимодействия Gd ^) и G(t) еще и вектор функции рассогласования х] ^) — X) между желаемым и текущим положениями рабочего инструмента относительно поверхности внешней среды, где: х] = (х1,х2,...,хп), X = (X1,X2,...,Xn).

3. Динамический анализ процесса управления с адаптацией робота к внешней среде

В работах [7-13] был дан детальный динамический анализ процесса управления роботом с использованием в законе управления членов, зависящих от упомянутых выше двух типов функций рассогласования по желаемым и текущим векторам обобщенных координат и силам взаимодействия рабочего инструмента с объектами внешней среды.

Были определены требования к структуре и параметрам закона управления, а также требования к параметрам конструкции робота, при которых обеспечивается работоспособность управления и, в первую очередь, его устойчивость при отслеживании требуемых траекторий перемещения рабочего инструмен-

та и силы взаимодействия его с перемещаемыми роботом предметами внешней среды.

Усложнение закона управления за счет введения в него нового члена, зависящего от вектора рассогласования между желаемым и текущим положениями рабочего инструмента относительно объектов его внешней среды, не должно нарушить устойчивость процесса управления.

Для нахождения представления этого дополнительного члена, при котором процесс управления оказывается устойчивым, введем в рассмотрение функционал, являющийся квадратом модуля вышеупомянутой функции

I |2

рассогласования: F = \хЛ - Щ .

Покажем, что при использовании в качестве этого дополнительного члена в законе управления вектора пропорционального антиградиенту функционала процесс управления оказывается асимптотически устойчивым. Вектор ха (V), входящий в F является только функцией времени и не зависит от g. Поэтому дополнительный член закона управления, пропорциональный антиградиенту может быть представлен в виде

U

доп

- K S

/ \T

dg

(xd - X' (g)),

где

f дх'Л T

i = 1,2,..., n (1)

- транспонированная (3xn) функ-

Ч ЧБ У циональная матрица.

Как ранее было сказано, векторы положения х' (г1' ,фгй ,в') модельный и реальный

X1 (R1 ,ф'р ,в'р ) соответствующих друг другу

характерных точек имеют идентичные угловые координаты:

^ = (Рг = 0, в' = в1 = 0.

Поэтому в трехмерных векторах (х' - X1 (g)) остается только первая ненулевая координата. Тогда вектор идоп можно представить более компактно в виде

U

доп

-K S

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

T

dg

i = 1,2,..., n,

(rd - R ),

(2)

dR

AJ,

где rld, R1 - первые компоненты (радиусы) векторов положения x'd, X1 модельных и реальных характерных точек;

- -- 1 х n функциональная матрица

dg

(Якобиева), связывающая вектор приращений обобщенных координат робота Ag с вектором приращений сферических координат

(AR, Ap, A0);

- Ai - первая строка 3 х 3 матрицы А, связывающей вектор приращений (AX, AY, AZ ) декартовых координат с вектором приращений сферических координат

J' = J' + J'

и и у т и w

J'v, J'w - (3 х n), блоки Якобиевой мат-

рицы робота

J' =

Л

J,

W

устанавливающей

связь между векторами угловой скорости Ж и линейной скоростью V начала системы координат схвата с вектором обобщенных скоростей g.

AJ

v

[0: X'JW ]

- (3 х n) матрица

поправок;

X' - косоугольная матрица соответствующая вектору X', представленному в декартовой системе координат, связанной со схватом.

Динамическое описание робота имеет следующий обобщенный вид:

Е(у,у,у) = д-

дт

(

дЛ ду

\

дЛ

+ к~ Y = к (Y + Y. ), ду ого т доп

где и - составляющая закона управления,

зависящая от функций рассогласования ^ - g) и - G);

- Е(g, g, g) - Эйлеров оператор от функции Лагранжа L = Т - П;

- Т и П - кинетическая и потенциальная энергии механической руки робота, укомплектованной электромеханическими приводами;

- kdis и kt - скалярные матрицы коэффициентов трения и коэффициентов связи вектора управления с вектором обобщенных управляющих сил.

Более детальное описание динамики имеет вид:

Ag + Bg + D =

n

= ~ktkgradF - ktkgrad Z

/ \T

i=1

vdg у

(rd - R ),(3)

A

dT

dg '

B = м_ -1_ dg)_+K dg 2 dg

dis ■

D = -

дП

В (3) опущена составляющая U закона управления, зависящая от функций рассогласования (gd - g) и (Gd - G) , так как в [7]

уже найдены условия устойчивости процесса управления роботом при использовании этой составляющей закона управления и поэтому неустойчивость процесса управления может породить только добавленная в закон управления составляющая идоп (2). С этой целью

полезно в динамическом описании использовать новые переменные:

А = (g - g0), А = (g - go), А =(g - go),

являющиеся отклонениями векторов g, g, g от своих устойчивых значений g0, g0, .

Приведем выражение (3) к представлению через введенные переменные А, А, А. Для этого, как известно, необходимо произвести вычитание правых и левых частей выражения (3), в которых переменные g, g, g заменены на g0, g0, g0 из этих же частей, в которых g, g, g заменены на

g 0 + А, g0 + А, g 0 +А.

При этом будем рассматривать квазистационарный режим, т.е.:

gd (t) « const, Xd (t) « const,

а, следовательно:

g0 (t) « const, g0 (t) « const.

В результате этого преобразования уравнения динамики в отклонениях после его

линеаризации в окрестности значений g0, g0 приобретает вид:

A А + В0А + N0 А + ktk

dR

V

i=i I

dR

А = 0

(4)

где: А0, в0 - положительно-определенные симметрически постоянные матрицы при значении g = g0, что всегда имеет место для механической системы;

- симметричность и положительная определенность М0 следует из того, что с помощью нее оценивается потенциальная сила

вблизи точки равновесия

dRi

g = g0 « const ,

ktk z

/ \T

i=1

dg

симметрическая и по-

ложительно определенная матрица в силу своей структуры и скалярности матриц kt и k .

Таким образом, в полученном уравнении динамики (4), которое является линейным приближением исходного нелинейного динамического описания поведения дистанционно управляемого робота (3), все коэффициенты

при переменных А, А, А являются положительно определенными симметрическими матрицами. Следовательно, это уравнение описывает асимптотически устойчивый процесс, что легко доказывается на основе использования теоремы Ляпунова.

При этом характеристическое уравнение, соответствующее этому линейному приближению (4), не имеет мнимых корней. А это значит, что и исходное нелинейное динамическое описание (3) поведения системы дистанционного управления при использовании предложенного метода адаптации робота к внешней среде имеет асимптотически устойчивое решение.

Чрезвычайно важно обратить внимание на одну полезную особенность предложенного адаптивного метода дистанционного управления. Она состоит в том, что характерные точки внешней среды робота, векторы положений которых, представленные в системе координат рабочего инструмента, используются для формирования управляющих сигналов адаптации рабочего инструмента робота к возможным изменениям внешней среды, могут

выбираться очень просто, причем число их не регламентировано и в процессе управления их можно легко менять.

Это позволяет повысить, по сравнению с другими методами [4], надежность и качество процесса управления, сгладить и даже избежать возможных скачков сигналов управления из-за "возможной негладкости" поверхности внешней среды.

Можно утверждать, что описанный процесс реализации адаптивного управления является непрерывным во времени процессом. Действительно, после передачи в локальную систему управления сформированных в процессе обучения данных, в число которых входят:

- программные значения изменения во времени вектора обобщенных координат

gd (V),

- векторы силы взаимодействия с предметами внешней среды рабочего инструмента робота G1d (V),

- радиусы г' (V) векторов положения х' (г' ,ф'с1 ,в' ) характерных точек внешней среды,

осуществляется одновременная их "обработка" локальной системой управления робота вплоть до конца выполнения требуемой операции. Остановка процесса управления осуществляется только при возникновении аварийной ситуации. При этом на центральный пункт управления посылается соответствующее сообщение.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Возможен и другой, так называемый дискретный способ реализации процесса адаптационного управления. Его отличие состоит в способе реализации процесса адаптации рабочего инструмента робота к возможной неточности модели внешней среды, с помощью которой осуществляется обучение робота.

Процесс адаптации является процессом реализации алгоритмом минимизации функционала рассогласования, в качестве которого возможно использование одного из существующих алгоритмов математического программирования, например, градиентного. Он включает в себя следующие шаги:

1) Измерение текущего значения вектора обобщенных координат g1d (V) .

2) Измерение радиусов R1, где 1 = 1,2,..., п являющихся первой компонентой

векторов X' положения характерных точек, соответствующих полученным из центра управления радиусам г' векторов положения х' .

3) Вычисление по выражению (2) антиградиента функционала рассогласования.

4) Перемещение робота на величину Ag, пропорциональную вычисленному антиградиенту.

5) Проверка величины функционала и повторение пунктов 1.. ..4 и в случае, если функционал больше некоторой заранее заданной малой величины, в противном случае -конец работы.

Как следует из описания процесса адаптации, его дискретность проявляется в непрерывном перемещении робота на каждом шаге работы алгоритма с целью вычисления величины очередного перемещения Ag.

Полезно заметить, что при использовании градиентного алгоритма минимизации по мере приближения к нулевому минимуму, т.е. когда К приближается к г', величина градиента уменьшается, как видно из (2) и, следовательно, уменьшается величина шага, что замедляет процесс управления.

Поэтому для ускорения процесса целесообразно перейти на другой метод, более приспособленный к особенностям решаемой задачи, который сводит нахождение аргумента функционала, соответствующего его нулевому минимуму, к итерационному процессу решения алгебраических уравнений методом Ньютона.

В данном случае эти уравнения формируются путем приравнивания к нулю функции рассогласования, что дает, с учетом идентичности угловых координат векторов положения соответствующих друг другу характерных точек, уравнение вида:

гй = К г = 1,2,...,п, (5)

где гй = (г1,Г'2,...Г;), Я^) = (Я1,Я2,...К).

Поскольку обычно вектор обобщенных координат шестимерен, то необходимым условием наличия решения уравнения является шес-тимерность векторов Я', г', т.е. необходимостью использования шести характерных точек для осуществления процесса адаптации рабочего инструмента робота к внешней среде.

Для нахождения из (5) искомого вектора g методом Ньютона необходимо представить дифференцируемую вектор-функцию Я^) в виде ряда членов степеней вектора Аg в некоторой окрестности текущего значения g = g0, причем в разложении остаются только линейные члены:

ш ч dR Л

rd = R( go) +

dg

(6)

dR

Если функциональная матрица - де-

дg

тально представляемая выражением (6) является неособенной, то из (6) следует:

Ag =

dg

-i

(rd - R( go)).

(7)

Величина g = g0 + Аg является первым приближенным значением искомого аргумента g. Второе приближение находится

из (6) заменой в нем g0 полученным значением gI. Процесс продолжается до того, пока функция рассогласования не достигнет заданной малой величины. На каждом шаге осуществляется перемещение робота на величину найденного Аg пока функция рассогласования не достигнет заданной малой величины.

Заключение

В статье предлагается, теоретически и экспериментально обосновывается метод реализации дистанционного билатерального управления космическими роботами. Он является усовершенствованием подходов, описанных в [7-13], и повышает вероятность реализации устойчивого дистанционного управления манипуляционным роботом, функционирующим в средах, топография которых изменяется при выполнения требуемых действий.

Процесс управления включает этапы:

1) С помощью видеокамеры и сканирующего трехмерного локатора формируется "топография" внешней среды, в которой должен функционировать дистанционно управляемый робот, т.е. с заданным шагом сканирования определяются координаты точек на поверхности внешней среды в системе координат сканирующего устройства, например, сферической.

2) Создается трехмерная модель внешней среды в центре управления роботом. Она может быть натурной или комбинированной, состоящей из натурных и виртуальных элементов, "совмещенных" друг с другом с помощью технологии дополненной реальности.

3) В этой модельной среде с использованием модели робота, предпочтительно физической (натурной), человеком-оператором производится обучение робота выполнению требуемой операции. С этой целью, используя режим билатерального управления моделью робота, человек-оператор выполняет требуемую операцию.

4) В результате этого процесса формируются данные, которые в качестве программных должны быть использованы локальной системой управления реального робота и "отработаны" ею, что обеспечит выполнение реальным роботом требуемой операции. В число этих данных входят законы изменения во времени вектора обобщенных координат g(t), векторы силы взаимодействия рабочего инструмента робота (схвата) с перемещаемыми им объектами внешней среды, свобода перемещения которых может ограничиваться связями (например, при выполнении сборочных операций).

Кроме того, в число формируемых данных входят законы изменения во времени вектора характерных точек внешней среды на поверхности, с целью коррекции положения рабочего инструмента робота по отношению к предметам внешней среды.

5) Выполнение требуемой операции роботом.

Список литературы

1. Anderson R., Spong M. Bilateral Control of Teleoperators with time Delay // IEEE Trans. on Automatic Control. 1989. Vol. 34(5). P. 494-501.

2. Hokayem P., Spong M. Bilateral Teleopera-tion: An Historical Survey // Automatica. 2006. Vol. 42. P. 2035-2057.

3. Niemeyer G., Slotine J. Stable Adaptive Teleoperation // IEEE J. Oceanic Engineering. 1991. Vol. 16(1). P. 152-162.

4. Fite K., Goldfarb M., Rubio A. Transparent Telemanipulation in the Presence of Time Delay // Proc. IEEE/ASME Intern. Conf. on Advanced Intelligent Mechatronics 1. Port Island, Kobe, Japan. 2003. P. 254-259.

5. Park J., Cho H. Sliding-mode Control of Bilateral Teleoperation Systems with Force-reflection on the Internet // Proc. IEEE/RSJ Intern. Conf. on Intelligent Robots and System. Vol. 2. Takamatsu, Japan. 2000. P. 11871192.

6. Garcia-Valdovinos L., Parra-Vega V., Arteaga M. Observer-based Higher-order Sliding Mode Impedance Control of Bilateral Teleoperation Under Constant Unknown Time Delay // Intelligent Robots and Systems, IEEE/RSJ Intern. Conf. Beijing, China. 2006. P.1692-1699.

7. Кулаков Ф.М. Методы супервизорного телеуправления космическими роботами // Известия РАН. Теория и системы управления. 2018 (в печати).

8. Kulakov F., Alferov G.V., Efimova P., Cher-nakova S., Shymanchuk D. Modeling and Control of Robot Manipulators with the Constraints at the Moving Objects // Intern. Conf. "Stability and Control Processes" in Memory of V.I. Zubov (SCP), St. Petersburg, 2015. P. 102-105.

9. Alferov G.V., Malafeyev O.A. The Robot Control Strategy in Domain with Dynamical Obstacles // Lecture Notes in Computer Science. 1996. Vol. 1093. P. 211-217.

10. Kulakov F., Alferov G., Efimova P. Methods of Remote Control over Space Robots // In-

tern. Conf. on Mechanics - Seventh Polyak-hov's Reading, St. Petersburg, 2015. P. 7106742.

11. Kulakov F., Alferov G., Sokolov B., Gorovenko P., Sharlay A. Dynamic analysis of space robot remote control system // AIP Conference Proceedings. St. Petersburg. 2018. Vol. 1959. P. 080014.

12. Kulakov F., Sokolov B., Shalyto A., Alferov G. Robot Master Slave and Supervisory Control with Large Time Delays of Control Signals and Feedback // Applied Mathematical Sciences. Vol. 10(33-36). P. 1783-1796.

13. Kulakov F., Alferov G., Sokolov B., Sharlay A. Bilateral Remote Control over Space Manipulators // AIP Conference Proceedings. St. Petersburg. 2019 (in print).

14. Кулаков Ф.М., Шмыров А.С., Шиманчук Д.В. Методы управления движением космического робота в окрестности точек либрации // XII всерос. совещ. по проблемам управления ВСПУ-2014. М.: ИПУ им. В.А. Трапезникова РАН, 2014. С. 3792-3801.

15. Кулаков Ф.М., Шмыров А.С., Шиманчук Д.В. Управление космическим роботом с использованием неустойчивой точки либрации // Мехатроника, автоматизация, управление. 2014. № 7. С. 23-28.

Remote control of space robots with adaptation to changes in its external environment

F. M. Kulakov1,2, B. V. Sokolov2, G. V. Alferov1, P. A. Efimova1

1 St. Petersburg State University; 35, University Avenue, St. Petersburg, Peterhof, 198504, Russia

2 St. Petersburg Institute of Informatics and Automation of the Russian Academy of Sciences (SPIIRAN) 39, 14 line, St. Petersburg, 199178, Russia

kufelix@yandex.ru; +7-906-244-82-16

The method of remote bilateral control of space robots operating in a non-deterministic environment is described, with a large delay in the transmission of control signals. The method provides adaptation of the behavior of the space robot to a possible change in the external environment. In contrast to the known approaches, this method reduces the influence of environmental variation on the management process.

Keywords: bilateral control; remote control; location sensory systems; adaptive control;

ДИСТАНЦИОННОЕ УПРАВЛЕНИЕ КОСМИЧЕСКИМИ РОБОТАМИ С АДАПТАЦИЕЙ К ИЗМЕНЕНИЯМ ЕГО ВНЕШНЕЙ СРЕДЫ Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Кулаков Ф.М., Соколов Б.В., Алферов Г.В., Ефимова П.А.

Похожие темы научных работ по математике , автор научной работы — Кулаков Ф.М., Соколов Б.В., Алферов Г.В., Ефимова П.А.

REMOTE CONTROL OF SPACE ROBOTS WITH ADAPTATION TO CHANGES IN ITS EXTERNAL ENVIRONMENT

Текст научной работы на тему «ДИСТАНЦИОННОЕ УПРАВЛЕНИЕ КОСМИЧЕСКИМИ РОБОТАМИ С АДАПТАЦИЕЙ К ИЗМЕНЕНИЯМ ЕГО ВНЕШНЕЙ СРЕДЫ»