СРАВНЕНИЕ НЕЙРОСЕТЕВЫХ АЛГОРИТМОВ ПРИ ОПТИЧЕСКИХ МЕТОДАХ КОРРЕКЦИИ СЕГМЕНТОВ ОТРАЖАЮЩИХ ПОВЕРХНОСТЕЙ РАДИОТЕЛЕСКОПОВ
П.В. Кужаков Научный руководитель - к.т.н., доцент А.Л. Андреев
Проводится сравнительный анализ работы алгоритмов на базе нейронных сетей в оптико-электронных системах. Отмечена возможность использования алгоритма обучения, позволяющего улучшить быстродействие системы в рабочем режиме за счет математической обработки результатов измерений.
Введение
Типовой канал измерения пространственных координат предназначен для контроля деформаций элементов радиотелескопа для миллиметрового диапазона длин волн. Радиотелескопы данного класса являются новейшими научными инструментами и требуют высокоточного контроля формы поверхности зеркала. Основное зеркало создаваемого Российской АН радиотелескопа РТ-70 (Суффа) имеет диаметр 70 метров, форма зеркала - трехмерная парабола. Поверхность зеркала состоит из 2000 плоских металлических секций. Работа в миллиметровом диапазоне длин волн требует минимального (не больше чем 0,1 мм) отклонения поверхности от теоретической трехмерной параболы.
На радиотелескоп оказываются различные воздействия, среди которых климатические, что вызывает смещение статически неопределимой конструкции большого количества ЩОП. Для решения задачи восстановления системы возможно использование нейронных сетей для различных задач, где требуется обеспечение управлением коррекции сложной поверхности. Нейронные сети усваивают и реализуют сложные алгоритмы управления (которые нельзя получить аналитически). Во многих случаях системы, управляемые нейронными сетями, могут быть построены при единственном допущении, что для структуры, выполняющей управление, существует алгоритм эффективного управления.
Основная часть
В настоящее время имеется большое разнообразие в построении зеркальных систем (ЗС) радиотелескопов, анализ и опыт использования которых для наблюдения космических источников радионаблюдения (КИР) миллиметровых длин волн (ММДВ) показывает, что наиболее перспективно использование больших полноповоротных наземных трех зеркальных радиотелескопов с третьим подвижным перископическим зеркалом (ПЗ).
Для повышения точности и эффективности в системе наведения такой зеркальной системы (ЗС) на КИР может использоваться сканирование принимаемого сигнала через точечный приемник с помощью перископического зеркала и адаптация поверхности основного зеркала с помощью управляемого перемещения щитов отражающей поверхности (ЩОП). Вместо сканирования принимаемого сигнала перископическим зеркалом можно использовать управляемый подвижный приемник (УПП), устанавливаемый вблизи исходного вторичного фокуса ЗС. Тогда приемник будет следить за уходом вторичного фокуса ЗС. При этом значительного снижения требований к точности наведения можно получить при использовании матричного приемника. На этапе проектирования расчетным и экспериментальным путями определяются оптимальные положения ПЗ или УПП при различных сочетаниях ошибок наведения и деформаций ЗС. Эти данные записываются в память вычислительно-управляющего комплекса (ВУК) и исполь-
зуются в процессе наведения ПЗ или УПП для формирования задающих сигналов на их приводы, на основании текущих значений измеряемого вектора состояния РТ. При таком способе приема сигналов нет необходимости требовать от приводов наведения точности соизмеримой с шириной диаграммы направленности антенны (ДНА). Требования к приводам наведения по точности могут быть существенно снижены, а разрешающая способность РТ повышена.
Одним из возможных способов решения задачи обеспечения управлением и коррекцией сложной поверхности, состоящей из статически неопределимой конструкции большого количества ЩОП, является применение алгоритма обучения по схеме приведенной на рис. 1.
Схема обучения, приведенная на рис. 1, позволяет обойти необходимость калибровки системы после каждого снятия отсчета координат объекта, и использовать алгоритм обучения [1-5].
Суммарная погрешность определения пространственного положения точек на поверхности каждого ЩОП не должна превышать 0,25 мм при относительно малом времени измерения. По причине сложности реализации системы измерения с требуемым быстродействием предлагается измерение положения вершины и оси ОЗ разделить на два этапа - предварительный статический этап обучения (зенитальный) и динамический этап (непосредственная оценка).
Рис. 1. Схема обучения системы в статическом режиме
На первом этапе обучения ОЗ переводится в зенитальное положение, и в течение длительного времени выполняется измерение положения ЩОП сначала с помощью универсальных измерительных средств - автоматических тахеометров - программным
наведением на произвольно выбранную и контролируемую точку со средней погрешностью 0,25 мм. На рис. 2 в качестве примера приведена статическая характеристика канала измерения положения актуаторов х одного из отражающих щитов. По оси абсцисс отложены истинные значения определённого значения положения актуаторов % а по оси ординат - поля числа отклонений ^ . Пунктиром показана идеальная статическая характеристика системы. Затем с помощью контактных измерительных средств, например, оптических мерных жезлов, положение уточняется с конечной погрешностью порядка 0,05 мм. Полученные данные о положении ЩОП заносятся в компьютерную модель, выполняющую расчет параметров ОЗ.
На втором этапе ОЗ находится в рабочем положении. С помощью специализированной измерительной системы измеряются пространственные координаты ограниченного числа (30-40) контрольных точек %т, Хп, • • •, & на поверхности зеркала с требуемой точностью и быстродействием 0,02 с (при разработке специальной системы снятия сигнала - 0,002 с). При этом погрешность установки ЩОП должна быть значительно меньше величины систематической погрешности измерения.
По измеренным данным выполняется коррекция расчетной модели параметров ОЗ для текущего азимутального и угломестного положения. Для контроля точности установки углов можно воспользоваться тахеометрами.
Рис. 2. Статическая характеристика канала измерения положения актуаторов х
На этапе калибровки переключатель 5, должен быть переведен в нижнее положение.
Предлагается следующая схема управления системой коррекции сегментов
отражающих поверхностей радиотелескопов:
1. каждый из трех измерителей находит расстояния до N ~ 1200 точек на поверхности зеркала и до других измерителей;
2. на ВУК вычисляются координаты этих N точек в системе, связанной с измерителями;
3. в памяти ВУК находятся 6 параметров предыдущих параметров параболоида -«старого» идеального параболоида (ИП) от предыдущей коррекции. Т.е для проведения самой первой коррекции параметры «старого» параболоида принимаются равными параметрам, померенным радиоголографическим методом;
4. в памяти ВУК находятся также старые (Ы ~ 1200) значения положения 5; (/=1,^.., 1200) актуаторов, которые они имели после окончания предыдущего цикла коррекции;
5. ВУК вычисляет поле (Ы~ 1200) чисел - отклонений А/, /=1,„.,1200 измеренных точек зеркала вдоль направления оси старого (ИП) до поверхности старого параболоида (ИП);
6. если каждое из отклонений мало, А<50 мкм, то коррекция не производится за ненадобностью;
7. если отклонения по совокупности не могут считаться малыми, тогда ВУК, которые вычисляет 6 параметров нового ИП и 1200 чисел - перемещений актуаторов, необходимых для корректировки каждой из N ~ 1200 деформаций выведения N ~ 1200 точек поверхности зеркала в положение нового ИП;
8. дается команда на актуаторы;
9. дается команда на двигатели контррефлектора для перевода его в положение нового фокуса и приемника для помещения его на новое направление оптической оси;
10. запоминаются в памяти ВУК 6 новых параметров ИП, которые для последующей корректировки будут являться параметрами старого ИП;
11. запоминаются в памяти ВУК новые (текущие) положения актуаторов;
12. через = 10т цикл коррекции повторить.
При задании определённого значения положения актуаторов х на выходе системы появляется двоичный параллельный код соответствующей оценки х*, который посредством устройства ввода/вывода (УВВ) ВУК заносится в его собственную память. Для уменьшения на этапе калибровки влияния случайной составляющей погрешности измерения, при каждом положении актуаторов в ВУК обеспечивается ввод не однократного значения измеренных точек зеркала х *, а целый массив значений, состоящий из 1200 значений. Этот массив в дальнейшем обрабатывается ВУК с целью вычисления поля числа отклонений ^ . Значения используется в дальнейшем как адрес той ячейки памяти, в которую должно быть записано истинное значение измеряемого угла установленное ВУК. Это же значение угла отображается на ВУК, и затем записывается во внешнее ОЗУ по адресу поля числа отклонений.
Аналогичным образом формируются все адреса поля числа отклонений и данные измеряемых точек зеркала записываемых в другие ячейки ОЗУ (рис. 3).
На следующем этапе ВУК осуществляет интерпретацию значений новых параметров ИП, которые для последующей корректировки будут являться параметрами старого ИП. Все рассчитанные значения х1, х2, ..., хт-1 и др. записываются в промежуточные, пока еще свободные ячейки внешнего ОЗУ.
Алгоритм ооучення_
Рис. 3. Схема формирования массива данных во внешнем ОЗУ на этапе обучения
Нелинейная статическая характеристика рис. 2 аппроксимируется кусочно-линейной функцией с различной крутизной наклона на различных участках. Эта функция в виде таблицы-массива хранится во внешнем ОЗУ измерительной системы. Число калибруемых точек определяется степенью нелинейности исходной статической характеристики системы и требуемой точностью коррекции систематической погрешности.
После завершения цикла обучения ключ £ переводится в верхнее положение, и система подготавливается к режиму измерения. Теперь двоичный код каждого однократного значения измеренных точек зеркала х*, формируемый системой, поступает непосредственно на вход дешифратора адреса внешнего ОЗУ, и из соответствующей ячейки памяти сразу считывается ошибка знания положения коррекции актуаторов, заранее вычисленная на этапе калибровки.
Для иллюстрации возможностей предложенной модели и алгоритма было проведено цифровое моделирование в среде МЛТЬЛБ. В качестве примера был рассмотрена система, имеющая передаточную функцию следующего вида:
W(s)=1l(s+1f. (1)
На входе системы описываемая передаточная функциия (1) с коэффициентом ней-роуправления постоянной времени T = 0,002 c и коэффициентом демпфирования a = 2 и комплексной переменной s. Обучение ОЭС проводилось согласно схеме, изображенной на рис. 1. В качестве алгоритма обучения ОЭС в статическом режиме был использован алгоритм обратного распространения ошибки - метод Левенберга-Марквардта [6].
Для обучения нейронных сетей использовалась одна из разновидностей алгоритма обратного распространения ошибки - метод Левенберга-Марквардта (ЬМ) [7]. Этот метод относится к методам Ньютона, которые являются примером способа быстрой оптимизации обучения. Основным выражением методов Ньютона является выражение для шага:
хк+1= Хк - Нк-Ек, (2)
где Нк - матрица Гессе вторых частных производных функционала ошибки по настраиваемым параметрам; gk - вектор градиента функционала ошибки. Процедура минимизации на основе метода Ньютона, как правило, сводятся быстрее, чем те же процедуры на основе метода сопряженных градиентов. Суть этих методов заключается в том, что на каждом шаге приращения вычисляется аппроксимирующая матрица Гессе, и само приращение вычисляется как функция градиента. Этот метод более быстрый, чем метод градиентного спуска (табл. 1). Однако для случая нейронных сетей прямого распространения он требует больших вычислений. Главный недостаток алгоритма ЬМ - в том, что требуется значительный объем памяти для хранения матриц больших размеров. Например, матрица Якоби составляет Q хп, где Q - число обучаемых наборов и п -число параметров сети. Это означает, что при оценке гессиана потребуются значительные ресурсы для ее хранения. Поэтому матрица разбивается на подматрицы меньших размеров. Причем в процессе формирования матрицы Гессе использованные подматрицы могут быть удалены из оперативной памяти. Параметр тет_геёис определяет, на какое количество подматриц разбивается исходная матрица. Если параметр тет_геёис равен 1, подматрицы делятся по строке на две части и сначала обрабатывается одна половина, а затем вторая. Это экономит половину объема памяти, требуемой для вычисления полного якобиана. И если нам доступна достаточная оперативная память, то надо установить параметр тет_геёис равным 1. Если память оказалась исчерпанной, следует назначить параметр тет_геёис равным 2 и выполнить расчеты заново. Если при этом памяти не будет достаточно, следует увеличить значение этого параметра.
Алгоритм Значение фиксированной максимальной точности (ошибки), Е
обучения Е= ю-1 Е= 10-3 Е= 10-5
Время Число Время Число Время Число
обучения, мс циклов обучения обучения, мс циклов обучения обучения, мс циклов обучения
Градиентного 42,52 80 данная данная данная данная
спуска (ГС) точность точность точность точность
не была не была не была не была
устано- устано- устано- устано-
влена влена влена влена
Левенберга- 5,1 4 10,63 9 14,27 13
Марквардта
Таблица 1. Сравнительная характеристика алгоритмов обучения НП
Критерий выбора параметров ИП зависит от компромисса между различными требованиями:
1) экономии хода актуатора (ресурса работы двигателей);
2) экономии времени настройки (быстрота работы);
3) быстрейшего времени вычисления параметров ИП (ВУК);
4) максимального использования площади зеркала (время наблюдения на телескопе источников, используя длину волны 1 мм).
Более оптимальным из вышеперечисленных методов решений поставленной задачи оказывается следующий метод.
1. Получим из расстояний координаты от датчиков до каждого сегмента (выбрав систему отсчета относительно опорного кольца (ОК)).
2. Ищем параболу, идеальную по форме, но с неизвестным положением, наиболее близкую к измеренным точкам.
3. При нахождении точки под параболой двигаем актуатор вверх, в противном случае - вниз.
Min |уид - уд| - оптимизируем наихудший случай (при оптимизации форма дана жестко, а оптимизируется (меняется) положение параболы). Min Е(увд - уд)2 - среднее квадратическое отклонение,
Min Е |увд - уд| - минимизируем энергию (уид - данные идеального параболоида в памяти ВУК, уд - данные, полученные после внешнего воздействия на систему).
Подстройка отражающей поверхности к положению ИП осуществляется путем перемещения большого числа N ~ 1200 отдельных точек в направлении, перпендикулярном зеркалу, при помощи актуаторов. Во время обучения нейросети на вход подается совокупность столбцов, каждый из которых содержит одну из возможных комбинаций параметров. Тогда длина обучающего вектора для нейросети будет равна Zm, где m - шесть параметров ИП, задаваемые в модели. На вход нейросети предъявляется последовательность, полученная решением уравнений на шаге интегрирования при идеальных значениях показаний системы (параметр управления подстройки равен 0). Таким образом, при работе нейросети на вход будут подаваться шесть искомых параметров ИП (с параметром управления подстройки равным 1), что не приводит к математическим усложнениям. Необходимо лишь запомнить значение суммы элементарных перемещений каждого актуатора при каждом акте.
Заключение
Результаты моделирования приведены на рис. 4 в виде графика сравнения алгоритмов. За счет быстрых алгоритмов математической обработки результатов измерений, время обучения уменьшилось более чем в 4 раза относительно использования менее быстрых нейросетевых алгоритмов.
Рис. 4. Результат моделирования с алгоритмом обучения (показан пунктиром)
На рис. 5 приведен график изменения ошибки обучения в зависимости от числа выполненных циклов обучения. В результате получили 3 цикла обучения, это показывает, что алгоритм Левенберга-Марквардта - самый быстродействующий и пригоден для обучения ОЭС с несколькими сотнями настраиваемых параметров.
о
ос ^
X
О)
IIJ-.-.-.-.-,-
а О 5 1 1.5 2 2.5 3
кол-во циклов обучения Рис. 5. График моделирования
Литература
1. Андреев А.Л., Кужаков П.В. Исследование оптико-электронной системы для высокоточного измерения пространственного положения объекта. // Международный оптический конгресс «Оптика -XXI век», конференция «Прикладная оптика-2006» 16-20 октября 2006 г., СПб.
2. Терехов В.А. Нейросетевые системы управления: Учеб. пособие для вузов. М.: Высш. шк., 2002. 183 с.
3. Городецкий А.Е., Козлов В.В., Артеменко Ю.Н., Тарасова И.Л., Вычисления в системах управления: Учеб. пособие. СПб: СПБГПУ, 2006. 463 с.
4. Обобщенный метод наименьших квадратов. Теория и применение в астрометрии. СПб: Наука, 1997. 318.
5. Андреев А.Л. Автоматизированные телевизионные системы наблюдения. Часть 2. Арифметико-логические основы и алгоритмы. Учебное пособие для курсового и дипломного проектирования. СПб: СПбГУИТМО, 2005. С. 56-83.
6. Сергиенко А.Б. Цифровая обработка сигналов. СПб: Питер, 2003. 608 с.
7. Медведев В.С. Нейронные сети. МАТЬАБ 6. М.:Диалог-МИФИ, 2002. 496 с.