Научная статья на тему 'Параллельные вычисления в нейросетевых архитектурах при решении задач оптимизации'

Параллельные вычисления в нейросетевых архитектурах при решении задач оптимизации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
81
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Параллельные вычисления в нейросетевых архитектурах при решении задач оптимизации»

является проблема кодирования хромосом в популяции. Предлагаемый метод кодирования состоит в следующем. Битовые строки включают в себя информацию о координатах точек Штейнера. В процессе кодирования граф необходимо разбить на области, включающие три или четыре вершины. В предлагаемом алгоритме применяется турнирная селекция.

В работе используется двухточечный оператор кроссинговера. Случайным образом выбираются две точки кроссинговера, а затем происходит обмен информацией между ними. Для повышения скорости работы ГА и устранения преждевременной сходимости алгоритма предлагается параллельная обработка информации. Суть работы блока параллельного эволюционного поиска заключается в выполнении макроэволюции, то есть создании не одной популяции, а некоторого множества популяций. В каждом ГА выполняется своя искусственная селекция: в первом - селекция на основе рулетки; во втором - селекция на основе заданной шкалы.

Поиск здесь осуществляется путем объединения решений из различных популяций. В памяти находится блок миграции, в который каждый раз отправляется лучший представитель из популяции. Далее происходит модификация каждой из подпо-пуляций по эволюционным схемам: первая по схеме Дарвина; вторая по схеме Де Фриза. В ее основе лежит моделирование социальных и географических катастроф, приводящих к резкому изменению видов и популяций. Далее управление передается блоку проверки условия остановки. Критерием остановки может служить заданное пользователем количество циклов, которое зависит от мощности вычислительных ресурсов. Если критерий остановки достигнут, выбирается наилучшее решение из двух популяций, и работа эволюционного поиска останавливается. В противном случае результаты эволюционного поиска передаются в блок адаптации, в котором происходит анализ результата и настройка динамических параметров комбинированного ГА для получения оптимального результата. Динамическими параметрами комбинированного ГА могут являться размер популяции, вероятность кроссинговера, мутации и инверсии. На следующем этапе результирующие подпопуляции и параметры, полученные в блоке адаптации, передаются на вход ком-

бинированного ГА, и процесс оптимизации повторяется до тех пор, пока не будет достигнут критерий остановки.

Алгоритм реализован в виде программы на языке С++ в Borland Buider 5.0 и рассчитан на функционирование в среде Windows XP. В ходе проведения вычислительного эксперимента были установлены эмпирические зависимости, диапазоны изменения входных параметров и выработан ряд рекомендаций по их оптимальному выбору. Проведено сравнение трех классических алгоритмов (Калашников Р.С. Экспериментальные исследования комбинированного эвристического алгоритма построения дерева Штейнера, основанного на методе эволюционного поиска, для этапа глобальной трассировки. // Изв. ТРТУ, 2004, №3). Результаты их исследования представлены в таблице.

Алго) эитм T. Ваггегах

Количество точек ЦФ Улучшение % Время работы, сек

50 1738 3,98 50,85

60 1952 2,40 92,34

70 2139 3,30 130.48

80 2227 1,81 198,74

90 2320 0,68 285,47

100 2396 1,24 400,17

Алгоритм Jones J.

50 1794 6,41 53,72

60 1934 3,30 98,98

70 2151 2,76 154,38

80 2179 3,92 216,96

90 2327 0,39 318,75

100 2385 1,69 432,83

Комбинированный ГА

50 1697 7,24 42,40

60 1910 4,50 67,91

70 2140 3,25 107,83

80 2174 4,14 161,91

90 2286 2,14 226,55

100 2375 2,10 299,20

Как видно из результатов теста, разработанный комбинированный алгоритм эффективнее по значению целевой функции и временной сложности по сравнению с классическими алгоритмами на множествах, превышающих 50 точек.

Результаты вычислительного эксперимента позволяют говорить о преимуществе рассмотренного алгоритма для решения задачи построения деревьев Штейнера. Временная сложность настоящего алгоритма в лучшем случае *O(nlogn), а О(п3) - в худшем случае.

ПАРАЛЛЕЛЬНЫЕ ВЫЧИСЛЕНИЯ В НЕИРОСЕТЕВЫХ АРХИТЕКТУРАХ ПРИ РЕШЕНИИ ЗАДАЧ ОПТИМИЗАЦИИ

П.Н. Башлы, к.т.н. (Ростовский военный институт ракетных войск)

Оптимизация антенных решеток (АР) является одной из проблемных задач современной антенной

техники. Это связано с возрастающей ролью АР в современных радиотехнических системах, а также с

их потенциальными возможностями, которые могут быть реализованы только на основе решения различных оптимизационных задач.

Большие объемы вычислений ограничивают применение высокоэффективных методов оптимизации в тех случаях, когда оптимальное решение должно быть получено за ограниченное время. Одним из направлений разрешения противоречия между увеличивающимися объемами вычислений и временными ограничениями может стать применение аппарата теории нейронных сетей, который находит все более широкое применение для решения инженерных задач (Галушкин А.И. Теория нейронных сетей. М., 2000).

С одной стороны, нейронным сетям свойственна высокая распараллеленность как для формализуемых, так и для неформализуемых задач. С другой стороны, нейронные сети претендуют на глобальность в смысле области приложения.

Выбор функционала оптимизации АР

Допустим, что требуется сформировать двухлу-чевую диаграмму направленности с максимальным средним коэффициентом направленного действия (КНД). В традиционной постановке подобная задача формулируется в следующем виде:

]0 = а^тах^О^] ), В2(]))} , (1)

Х(В1(]), В2(] ))=Ь1(])+ Ь2(]) , (2) где ]0 - ^-мерный вектор неизвестных комплекс-

ных амплитуд токов, определяющий амплитудно-фазовое распределение в элементах АР; О1]) ;

В1 (]) - КНД ^-элементной АР в направлении 00 и

00 соответственно.

Функционал вида (2) приводится к отношению эрмитовых форм, а для определения вектора оптимальных токов используется известная теорема об экстремальных свойствах характеристических чисел пучка эрмитовых форм. Одним из недостатков известного способа оптимизации является большой объем вычислений, требуемых для определения оптимального решения. Более существенный недостаток известного способа в том, что при использовании функционала (2) в результате оптимизации значения О1]) и В2 (]) существенно отличаются, что

неприемлемо в практических задачах (Мануилов Б.Д., Башлы П.Н., Безуглов Ю.Д., Кузнецов А.А. Формирование многолепестковых диаграмм направленности антенных решеток со стабилизацией положения и уровней лучей. //Сб. докл. междунар. конф. «Излучение и рассеяние радиоволн», Таганрог, 2005).

В связи с этим предлагается использовать более сложный функционал:

хВ1]), Ь2 (]))=Ь1 (])хЬ2 (]) ,

(3)

причем постановка задачи оптимизации (1) за исключением вида функционала не меняется.

Сложность решения задачи оптимизации АР с функционалом (3) заключается в невозможности применения теоремы об экстремальных свойствах характеристических чисел пучка эрмитовых форм,

позволяющей аналитически определить вектор оптимальных комплексных токов. Выполнив преобразования функционала (3), с учетом представления КНД в виде отношения эрмитовых форм получим:

, 2 (А1/,/) (А'/,/) (^ ® А' ] J ® // ® J)

(4)

([В ® В/ ® JJ ®/)

где А1 , А2 и В - эрмитовы матрицы порядка N ® - символ Кронекерова произведения матриц. Таким образом, функционал (3) сводится к отношению эрмитовых форм (4), порядок которых Очевидно, что в данном случае теорема об экстремальных свойствах характеристических чисел пучка эрмитовых форм не может быть использована, поскольку порядок вектора - /° , максимизирующего функционал (4) - N', тогда как в составе АР N управляемых каналов.

Синтез нейронной сети

Поскольку максимизируемый функционал (4) в рассматриваемой задаче имеет физический смысл только как функция N переменных, для синтеза нейронной сети воспользуемся градиентным методом.

Для этого определим градиент функционала (4), для которого в общем случае будем полагать матрицы В , входящие в знаменатель, различными:

"(А1 //) (А' //)"

Л/ = ^ай

(в1//) (в'//)

'

(в1//) (в'//)

(5)

(А1 /) (А' /,/)+(А2 /) (А1 /,/)-

Г (в1/) (в'/)

-(А1 /,/) (А' /,/) У ' + У '

(в1/,/) (в'/,/)

Синтез структуры нейронной сети для решения задачи оптимизации основан на свойстве градиента функционала (4), обращающегося в ноль в точках экстремума. Исходя из этого, положим в качестве входного сигнала нейронной сети вектор р, а в качестве выходного - градиент функционала (5) Л/. Структура нейронной сети будет определяться выражением (5), как показано на рисунке. Из анализа выражения (5) и рисунка можно сделать вывод о высокой степени распараллеленности операции вычисления градиента функционала в нейросетевых архитектурах, что достаточно важно с учетом итерационного характера градиентных методов поиска экстремума.

Алгоритм функционирования нейронной сети на к-м шаге записывается в следующем виде:

/(к)=/(к-1)-Н Л/(к-1) , (6)

где Н - параметр, определяющий скорость настройки сети.

Условием определения оптимального вектора

токов /0 будем считать равенство или стремление к нулю вектора Лр.

Результаты численного эксперимента

Для численного эксперимента была использована модель 25-элементной АР ненаправленных излучателей. На первом этапе сравнивалась эффективность известного и предлагаемого метода оптимизации.

Для этого проводились два численных эксперимента. Результаты первого приведены в таблице 1, где показана зависимость распределенного КНД

решетки (О*^) от углового положения лучей при заданном направлении одного из лучей по нормали (в0 = 0°). Второй эксперимент был направлен

на выявление зависимости КНД решетки от углового положения максимумов лучей, каждый из которых отклонен от нормали. Результаты приводятся в таблице 2.

Таблица 1

Зависимость Ю* от направлений лучей в*{50;400} и 0 = О0

Луч №1 в = 0° Положение луча №2

50 100 150 'О0 '50 300 350 400

Р, число итераций 170 250 280 300 300 320 380 430

Известный метод О1/), дБ 16.2 16.2 15.7 16.3 15.9 16.3 16.3 16.4

&(/), дБ 16.1 16.1 15.4 15.7 15.0 15.1 14.5 14.1

ю*, дБ 32.3 32.3 31.1 32.0 30.9 31.4 30.8 30.5

Новый метод О1/), дБ 16.2 16.2 16.2 16.1 16.1 16.1 16.1 15.9

О'(/), дБ 16.2 16.1 16.1 15.9 15.7 15.4 15.1 14.7

ю*, дБ 32.4 32.3 32.3 32.0 31.8 31.5 31.2 30.6

Таблица 2

Зависимость Ю* от направлений лучей в'е{-.50;-400} и 0 = '50

Луч №1 0 = '50 Положение луча №2

- 50 -100 -150 -'00 - '50 - 300 - 350 - 400

Р, число итераций 3450 3700 4200 4800 5800 7000 10000 25000

Известный метод О'(/), дБ 16.3 15.8 16.1 15.5 15.7 15.0 14.9 14.2

&(/), дБ 15.5 15.0 15.5 15.2 15.7 15.4 15.7 15.7

ю*, дБ 31.8 30.8 31.6 30.7 31.4 30.4 30.6 29.9

Новый метод О1/), дБ 16.1 16.0 15.9 15.8 15.7 15.4 15.2 14.8

&(/), дБ 15.7 15.7 15.7 15.7 15.7 15.6 15.6 15.8

ю*, дБ 31.8 31.7 31.6 31.5 31.4 31.0 30.8 30.6

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Анализ таблиц 1 и 2 позволяет сделать следующие выводы:

- оптимизация АР с функционалом (3) обеспечивает более высокое значение распределенного КНД, при этом энергия АР между лучами распределяется более равномерно;

- неравномерность распределения энергии между формируемыми лучами при оптимизации известными методами более выражена при отклонении обоих лучей от нормали;

- число итераций, требуемых для получения оптимального решения предлагаемым методом, существенно зависит от заданных направлений формируемых лучей, что особенно заметно для двух лучей, максимально отклоненных от нормали.

Второй этап исследований заключается в анализе возможности сокращения числа итераций при определении оптимального решения предлагаемым методом.

Как известно, градиентный метод, положенный в основу работы нейронной сети, основывается на последовательном приближении к экстремуму заданного критерия путем вычисления его градиента в каждой точке. Для ускорения процесса настройки нейронной сети можно использовать параметр Н, получивший название шаг настройки сети.

В таблице 3 приводятся результаты исследований, показывающие зависимость числа итераций при определении оптимального вектора токов

для случая в' =-35° и в' = 25" .

Таблица 3

Зависимость числа итераций Р от параметра Н

н 1 2 5 10 100 1000 10000

р 10000 5100 2100 1100 150 50 45

&(!), дБ 15.18 15.18 15.18 15.18 15.18 15.18 15.18

^д), дБ 15.623 15.623 15.623 15.623 15.622 15.621 15.62

в£, дБ 30.803 30.803 30.803 30.803 30.802 30.801 30.8

Выполненные исследования выявили существенную зависимость числа итераций Р, требуемых для определения оптимального решения, от параметра Н. При этом сокращение числа итераций на два порядка практически не влияет на значение распределенного КНД (табл. 3). Такой результат обусловлен особенностями максимизируемого критерия, который в рассматриваемой задаче имеет единственный глобальный экстремум.

Таким образом, в работе решена комплексная задача анализа возможностей нового метода оптимизации АР и проведено его сравнение с известными методами. Полученные результаты позволяют обосновать возможность использования нейроподобных сетей для снятия противоречия между возрастающими объемами вычислений и ограничением на время, требуемое для настройки АР в режим, оптимальный по заданному критерию.

СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ В СФЕРЕ ДИСТАНЦИОННОГО МОНИТОРИНГА

Е.А. Чернецова

(Российский государственный гидрометеорологический университет, г. Санкт-Петербург)

При решении задач дистанционного мониторинга требуется высокоскоростная обработка больших объемов данных в месте установки оборудования с выдачей человеку-оператору только координат местонахождения объектов наблюдения. В этом процессе большую роль играют программно-технические системы поддержки принятия решений.

Как правило, дистанционный мониторинг осуществляется с помощью комплексной системы, в составе которой есть устройства видеонаблюдения за зоной ответственности.

В данной работе рассматривается случай, когда зона ответственности представляет собой поверхность, а выходными данными датчика видеонаблюдения является массив пикселей, представляющих ее монохромное изображение. Пространственные черты изображенных объектов можно выявить, используя массив пикселей изображения в качестве входных параметров нейронной сети (НС) (см.: Нейрокомпьютеры в системах обработки

изображений. М.: Радиотехника, 2003), однако в этом случае приходится создавать слишком сложную сеть, что сказывается на ее быстродействии. Поэтому в настоящей программно-технической системе поддержки принятия решений предлагается сначала осуществить сегментацию изображения, вычислить параметры объекта наблюдения, а затем использовать их в качестве массива входных данных НС на этапе решения задачи классификации. Выходным параметром НС является вероятность принадлежности объекта тому или иному классу изображений.

При классификации объектов необходимо разделение изображения на области, имеющие одинаковые характеристики. Для этого можно использовать метод порога, достоинствами которого являются простота вычисления по минимуму гистограммы «оттенков серого» и возможность программной реализации процесса сегментации. Однако эта методика реализует алгоритм «жесткого принятия решений» и может не учитывать пиксе-

i Надоели баннеры? Вы всегда можете отключить рекламу.