Научная статья на тему 'Алгоритм равных цен в задаче управления манипулятором в неизвестной среде'

Алгоритм равных цен в задаче управления манипулятором в неизвестной среде Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
69
13
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Лопатин П. К.

Рассматривается алгоритм равных цен, применяемый для планирования пути в среде с запрещенными состояниями. Алгоритм может использоваться как подпрограмма в алгоритме захвата манипуляционным роботом объекта в неизвестной статической среде.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE EQUAL PRICES ALGORITHM IN A PROBLEM OF A MANIPULATOR CONTROL IN AN UNKNOWN ENVIRONMENT

The equal prices algorithm is considered for a path planning in an environment with forbidden states. The algorithm may be used as a subroutine in an algorithm for an object grasping by a manipulator in an unknown static environment.

Текст научной работы на тему «Алгоритм равных цен в задаче управления манипулятором в неизвестной среде»

(Решетневскце чтения

УДК 519.713

П. К. Лопатин

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск

АЛГОРИТМ РАВНЫХ ЦЕН В ЗАДАЧЕ УПРАВЛЕНИЯ МАНИПУЛЯТОРОМ В НЕИЗВЕСТНОЙ СРЕДЕ

Рассматривается алгоритм равных цен, применяемый для планирования пути в среде с запрещенными состояниями. Алгоритм может использоваться как подпрограмма в алгоритме захвата манипуляционным роботом объекта в неизвестной статической среде.

В настоящее время в мире учеными-робототехниками решается задача разработки алгоритмов управления манипуляционными роботами (МР) в среде с неизвестными препятствиями.

Широко применяются графовые алгоритмы, однако эти алгоритмы имеют одно общее свойство, которое затрудняет их применение для управления МР в неизвестной среде, заключающееся в том, что они в том или ином объеме требуют осуществлять поиск в ширину, иначе не гарантируется достижение целевой точки [1]. Но при поиске в ширину часто возникает следующая ситуация. Предположим, что мы только что закончили рассмотрение вершин, соседних с вершиной х, и теперь нам надо рассматривать вершины, соседние с вершиной хП, и вершины х и хП не являются соседними. Для того чтобы рассмотреть вершины, соседние с хП, МР должен сначала передвинуться в хП. Таким образом, возникает проблема множественных механических перемещений. В соответствии с классификацией [1], представителями алгоритмов поиска в ширину являются собственно алгоритм поиска в ширину, алгоритм А*, алгоритм равных цен, эвристический поиск "первый-лучший", ленивый вероятностный маршрут, динамическое программирование. Известно также, что алгоритмы поиска в глубину не всегда доводят до цели [2].

В [3] предложен алгоритм управления МР в неизвестной статической среде. Показано, что задача управления МР в неизвестной статической среде сводится к решению конечного числа задач ПИ (планирования пути в среде с известными запрещенными состояниями). Для решения же задачи ПИ применение алгоритма равных цен представляется вполне перспективным, поскольку переход от одного состояния к другому происходит не путем механического смещения робота, а лишь в памяти ЭВМ, т. е. практически мгновенно.

Задачу ПИ сформулируем следующим образом: задана стартовая точка х0 и целевая точка хт. Необходимо спланировать путь, т. е. последовательность точек, ведущих от х0 к хт, любая последующая точка пути отстоит от предыдущей не более чем на один дискрет. Каждая точка пути должна быть разрешенной - не налегать на препятствия и удовлетворять конструктивным ограничениям.

В алгоритме равных цен [4] задается функция с(п, п), дающая стоимость перехода от вершины п, к неко-

торой следующей за ней вершине nj. Пусть g(n) -стоимость пути от начальной вершины s к вершине n в дереве перебора.

Алгоритм предполагает следующие шаги.

1. Поместить начальную вершину s в список, называемый ОТКРЫТ. Положить g(s) = 0.

2. Если список ОТКРЫТ пуст, то на выход подается сигнал о неудаче поиска; в противном случае переходить к следующему шагу.

3. Взять из списка ОТКРЫТ ту вершину, для которой величина g(n) имеет наименьшее значение, поместить ее в список, называемый ЗАКРЫТ. Дать этой вершине название n.

4. Если n есть целевая вершина, то на выход выдать решающий путь, получаемый путем просмотра назад в соответствии с указателями; в противном случае переходить к следующему шагу.

5. Раскрыть вершину n, построив (т. е. получив координаты) все непосредственно следующие за ней разрешенные вершины. Если таковых не оказалось, переходим к шагу 2. Для каждой непосредственно следующей вершины nj вычислить g(nj), положив g(nj) = g(n) + c(n, n,■). Поместить эти вершины в список ОТКРЫТ и построить указатели, идущие назад к n.

6. Перейти к шагу 2.

Анализируя алгоритм равных цен, приходим к выводу, что он обладает такими преимуществами, как применимость к n-мерному пространству состояний, возможность задания функции вычисления стоимости перехода от одной вершины к другой, что открывает возможности к построению пути, отвечающему некоторому критерию качества.

Библиографические ссылки

1. LaValle S. M. Planning Algorithms, 1999-2006 [Electronic resource]. URL: http://msl.cs.uiuc.edu/ planning (date of visit: 30.08.2012).

2. Ильин В. А. Интеллектуальные роботы: теория и алгоритмы / Сиб. аэрокосмич. акад. Красноярск, 1995.

3. Лопатин П. К. Алгоритм захвата манипулятором объекта в неизвестной статической среде // Вестник СибГАУ. 2010. Вып. 3 (29). С. 33-37.

4. Нильсон Н. Искусственный интеллект. М. : Мир, 1973.

Математические методы моделирования, управления и анализа данных

P. K. Lopatin

Siberian State Aerospace University named after academician M. F. Reshetnev, Russia, Krasnoyarsk

THE EQUAL PRICES ALGORITHM IN A PROBLEM OF A MANIPULATOR CONTROL

IN AN UNKNOWN ENVIRONMENT

The equal prices algorithm is considered for a path planning in an environment with forbidden states. The algorithm may be used as a subroutine in an algorithm for an object grasping by a manipulator in an unknown static environment.

© Лопатин П. К., 2012

УДК 519.854.33

И. С. Масич

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск

ОТБОР ИНФОРМАТИВНЫХ ЗАКОНОМЕРНОСТЕЙ В ЛОГИЧЕСКИХ АЛГОРИТМАХ РАСПОЗНАВАНИЯ

Рассматривается способ отбора логических правил, которые описывают закономерности в исследуемом явлении или системе и предназначены для решения задачи распознавания. Способ отбора правил основывается на критерии максимизации разделяющей полосы между образами классов и сводится к задаче псевдобулевой оптимизации.

К настоящему времени разработаны довольно эффективные алгоритмы классификации для решения задач диагностики и прогнозирования, которые при умелой настройке решают задачи с большой точностью. Но при практическом применении таких алгоритмов зачастую встает вопрос об интерпретируемости и доказательности результатов. Для принятия решений требуется модель в явном виде, такая модель, в которой вычисляемые решения обоснованы и опираются на имеющиеся данные.

Процесс формирования решающих правил сопровождается решением задач выбора наилучших альтернатив в соответствии с некоторым критерием. Формализация этого процесса в виде ряда задач комбинаторной оптимизации формирует гибкий и эффективный алгоритм логического анализа для классификации данных [1].

Рассмотрим задачу распознавания объектов, описываемых бинарными признаками и разделенных на

два класса К = К + и К- с (0,1}" . Объект X е К описывается бинарным вектором X = (х1, х2,..., X") и может быть представлен как точка в гиперкубе пространства бинарных признаков В".

Под закономерностью Р (или правилом) понимается терм, который покрывает хотя бы один объект некоторого класса и не покрывает ни одного объекта другого класса.

То есть закономерность соответствует подкубу, имеющему непустое пересечение с одним из множеств (К + или К-) и пустое пересечение с другим множеством (К- или К + соответственно). Закономерность Р, которая не пересекается с К-, будем называть положительной, а закономерность РШ, которая не пересекается с К + - отрицательной.

Предположим, что в результате выполнения процедуры поиска закономерностей по обучающей выборке найден ряд положительных закономерностей Рг, г = 1, ..., р, и отрицательных закономерностей Щ, ] = 1, ..., ".

Решающая функция может быть задана выражением

Б(а) = -¿Р (а) - -(а).

Р г=1 " ]=1

для некоторого объекта а, где Рг(а) = 1, если закономерность Рг покрывает объект а, и Рг(а) = 0 в противном случае. То же самое для Щ(а).

При решении многих задач встает вопрос отбора закономерностей из общего их числа для формирования решающего правила, что способно не только уменьшить его размер, но и улучшить распознавание. Введем переменные, определяющие, будет ли закономерность присутствовать в решающей функции:

i Надоели баннеры? Вы всегда можете отключить рекламу.