УДК 612.821
А.А.Юдашкин
ИНВАРИАНТНЫЙ ПОДХОД К ПОСТРОЕНИЮ СТРУКТУР С ПАМЯТЬЮ В ДВУМЕРНОМ ЕВКЛИДОВОМ ПРОСТРАНСТВЕ
Рассматривается метод синтеза динамической системы, восстанавливающей свою геометрическую форму из произвольного начального состояния без внешнего управления. Система способна запоминать несколько конфигураций и релаксировать к одной из них в соответствии со свойствами определяющих нелинейных обыкновенных дифференциальных уравнений.
Идея целенаправленного создания моделей сред, обладающих свойствами самоорганизации, а не просто наблюдения за поведением уже существующих структур, является одной из наиболее популярных в современной науке [1]. Она проявляется в таких различных областях, как теория дифференциальных уравнений, материаловедение, физика твердого тела [2], адаптивное управление и искусственный интеллект. Первым из направлений в рамках этой задачи является обобщение подхода к анализу устойчивых заданных нелинейных структур при наличии различных внешних возмущений, а второе направление непосредственно направлено на развитие искусственных методов достижения самоорганизации систем в одну из нескольких возможных конфигураций, т.е. соответствует развитию сред с памятью. Вполне очевидно, что первая задача предшествует второй в смысле пути развития теории самоорганизующихся систем. Это связано с главной проблемой рассматриваемого вопроса: как в достаточно общей форме описывать динамику систем, достигающих требуемого состояния? Решение может лежать в формулировке принципов такого геометрического определения многокомпонентных, состоящих из нескольких частей систем, что они являлись бы инвариантными относительно сдвигов и поворотов в пространстве [3]. Затем стало бы возможным создать общую модель для запоминания и воспроизведения системой нескольких структурных состояний. Ряд выполненных работ проводит мысль о том, что воспроизведение структур и образование реальных паттернов имеют в основе общие геометрические механизмы [4,5]. Все же необходимо указать на то, что подходы, развитые в теории спиновых стекол и распознавании образов, будучи ориентированы на решение аналогичных указанным выше задач, принципиально не обладают требуемой инвариантностью. В то же время хорошо известно, что реальные материалы и среды сохраняют поверхность независимо от ориентации в конкретной системе координат в отсутствие внешних сил. Более того, эти материалы часто демонстрируют спонтанное [6] или управляемое [7] формирование упорядоченных структур. Для получения данного структурного состояния исследователи чаще всего изменяют управляющий параметр, который может быть, в частности, температурой [7]. Однако это достаточно слабый в общем смысле подход, поэтому было бы лучше стремиться к сложному образованию нескольких возможных паттернов в зависимости от начальных условий или внешнего управления. Соответственно некоторые работы посвящены проблеме описания и управления формой расплавов с памятью [8,9]. Одним из наиболее важных свойств таких сред является восстановление некоторыми расплавами одной своей поверхностной конфигурации из деформированного состояния в нормальное, сформированное в некоторых условиях. Таким образом, достаточно актуальным является развитие общего подхода к определению подобных материалов и приданию им способности запоминать и воспроизводить требуемые формы. По-видимому, наиболее перспективно в этом смысле построение нелинейной динамики, что необходимо для обладания системой несколькими устойчивыми состояниями, разделенными потенциальными барьерами. Для этих целей достаточно удобен класс потенциальных систем, чья нелинейная динамика определяется потенциалами, минимизирующимися простым методом градиентного спуска. Потенциал такой системы следует ввести как инвариантную функцию нескольких переменных, каждая из которых может представлять отдельную часть целой динамической системы. Первоначально части могут быть определены как точки в координатной системе. Для придания инвариантности подобному определению нужно найти некоторую универсальную характеристику набора точек, причем сначала можно рассмотреть относительно небольшой набор, а затем найденные свойства распространить на общий случай.
В целях ликвидации зависимости от поворотов и сдвигов в данной работе используются свойства скалярного произведения векторов. Строится универсальная система дифференциальных уравнений для большого набора точек, где каждое уравнение получено после минимизации потенциальной функции степенной формы четвертого порядка. Предложенный подход позволяет инвариантно запоминать и воспроизводить точечные структуры в случае их произвольных искажений.
Воспроизведение единственной конфигурации
Для задания инвариантной многокомпонентной структуры на координатной плоскости рассмотрим сначала три точки в двумерном евклидовом пространстве. Треугольник полностью определяется длинами любых двух различных векторов с началом в одной и концами в двух других точках и углом между ними. Иначе говоря, треугольник полностью определен тремя возможными скалярными произведениями двух векторов. Данный способ задает форму (т.е. треугольник), а не точное расположение точек и, таким образом, обладает пространственной инвариантностью в смысле описания формы. Соответствующий метод описания структур в случае конечного числа точек в двумерном евклидовом пространстве основан на декомпозиции набора точек в подмножестве триад. С целью достижения общности рассмотрим любую пару точек, принадлежащих структуре, и дополнительную точку, являющуюся центром масс множества точек, если в каждой из них сосредоточена единичная масса. Тогда два вектора с началом в центре масс и концами в двух указанных точках полностью определяют треугольник, что может быть получено для всех подобных триад, т.е. для всей структуры. Каждая точка задана комплексным числом рк = хк + 1ук, к = 1,2,..,N, где / = 4—1, хк представляет абсолютную абсциссу, а ук - абсолютную ординату к-той точки в евклидовом пространстве. В соответствии с
предлагаемым подходом все множество точек представлено вектором р с комплексными абсолютными координатами и одновременно вектором ц = Нр с комплексными относительными
координатами qk = ак + тк для начала координат в центре масс. Здесь Н - это матрица отображения абсолютного пространства в систему координат, связанную с центром масс, размерности NxN:
Н
N -1 N -1
-1
-1
N -1 N
-1
-1
-1
N -1 N
Пусть потенциальная функция системы имеет вид
ЗД) = - 2 цгц+4( цц)2, (1)
где J = уу , V - требуемая конфигурация точек, а V представляет сопряженную к вектору V строку. Кроме того, потребуем, чтобы V был нормализован. Легко можно видеть, что Ж0 - вещественнозначная функция. Тогда динамика определена следующей системой дифференциальных уравнений относительно ак и юк , записанной в матричной форме:
Г6 = -3ю - (а'а + ю'ю)а,
\ю = 3а -- (а6 + ю'ю)ю .
Здесь J R = Яе( J), J1 = 1т( J), а ст' - транспонированный вектор. Доказательство устойчивости стационарного решения ц 0 = у может быть получено из анализа собственных чисел матрицы линеаризации Ь. Матрица Ь размерности NxN принимает форму
Ь =
J
R
'2ст0^0
J1 - 2ю ост0
- J! -2ао®0 JR - 2ю 0Ю0
■Е
2N
и имеет одно нулевое собственное число: одно, равное -2, и 2(^1) собственных чисел, равных -1. Данный вывод может быть сделан из рассмотрения вырожденной матрицы
Ь0
Л” R 2ст 0^0 J1 2ст 0ю 0
J1 - 2ю 0ст0 JR - 2ю 0ю0
, если иметь в виду нормальность вектора V. Приведенная вы-
ше матрица обладает собственным вектором [ст 0 ю 0 ] , соответствующим собственному
'
числу -1; собственным вектором [ю 0 - ст 0 ] , соответствующим собственному числу 1 и 2(^1)
независимыми собственными векторами, соответствующими нулевым собственным числам. Соответственно заключение о собственных числах Ь следует из последнего предложения. Следовательно, решение ц 0 = у может быть определено как устойчивое.
Соответствующие дифференциальные уравнения для абсолютных координат могут быть получены из другой формы Ж0, зависящей от р:
Wо( р) = - 2 р.1р+2( рнр)2.
Таким образом, с целью воспроизведения единственной структуры точек введено инвариантное описание многокомпонентной динамической системы, основанное на свойствах скалярных произведений в треугольнике с одной из вершин в центре масс системы. Этот подход может быть распространен на случай запоминания нескольких форм.
Общий случай нескольких конфигураций
Пусть текущая конфигурация точек в двумерном евклидовом пространстве определена вектором р. Каждый элемент р, является комплексной переменной с действительной и мнимой частями, представляющими соответственно х- и у-координаты, как это было предложено выше. Тогда координаты точек относительно центра масс представлены вектором ц и получены из р с помощью действительного отображения:
ц=Нр . (2)
Ранее было показано, что система с потенциальной функцией (1) обладает свойствами связанной структуры точек, приходящей к устойчивой конфигурации V, если вектор V определен как форма системы относительно центра масс. Динамика системы инвариантна относительно сдвигов и поворотов в двумерном евклидовом пространстве. Для того, чтобы система могла запомнить набор конфигураций у(к) (к=1,2,..М) и воспроизводить их, рассмотрим схожую с (1), но
более сложную потенциальную функцию:
1 м
^(Я) = ^(ц) + - XX ци(к)и(к)цци(г)и(г)ц . (3)
4 к=1 I^к
Здесь м - общее число запомненных конфигураций,
м
J = Х V(к} и(к} , (4)
к=1
и(к}у('} = 8к}, (5)
где 8^ - символ Кронекера. Для соответствия условиям ортонормальности набор и(к-1 вычисляется в соответствии с формулой
и = У(УУ)-1 , (6)
где матрицы и и V состоят из столбцов и(к) и у(к) соответственно и М^-1. Для упрощения анализа без потери общности допустим, что все у(к) нормализованы. Тогда J - эрмитова NxN-матрица, что может быть доказано посредством изучения собственных чисел. Действительно, легко определить, что J является проективной матрицей, тогда это нормальная матрица, все
собственные значения которой действительные, причем М из них равны 1, а остальные - нулю.
Аналогично каждое произведение и(к -1 и(к -1 является эрмитовой матрицей, из чего следует, что Ж
- действительная функция от с аргументами q/■. Структура Ж в зависимости от абсолютных координат р имеет вид
1 1 1 м
Ж (р) =---р!р + -(рНр)2 + -XX ри( к ] и( к ] рри( 1} и( 1} р
2 4 4 к=1 I * к
и может быть построена с учетом того, что Н также является проектором в силу свойств (2), (4) и (6).
Рассмотрим поведение во времени системы с потенциалом (3). Можно получить дифференциальные уравнения отдельно для каждой из относительных координат. После разделения (3) на действительную и мнимую части возьмем градиент от W по векторам ст и та и запишем получающиеся уравнения:
м
6 = Ако- Вкю){ди{1)и(^)а,
к=1 1^к
М ,
(Ъ = JI6- JRw -^^(вк6-Ак®)\Ти(1)и{()
(7)
ди'и'д)-(дд)ю,
к=1 1^к
где JR=Re(J), J1=Im(J), Лк=Яе( и(к-1 и(к-1), Вк=1т( и(к-1 и(к-1), ц=ст+/та, или то же в сокращенной форме для комплексных векторов:
(М
ц ^ - X X (и(к) и (к) ч)(чи( 1) и( 1) ц)- ц( цц). (8)
к=1 Ык
В вышеприведенном уравнении для краткости не развернуты произведения цц и ци( 1 -1 и( 1 . По-
скольку все вычисления выполнены для системы (7), в данной работе рассмотрены только ее решения. Полученные дифференциальные уравнения обладают устойчивыми стационарными решениями у(к) , соответствующими максимумам потенциальной функции Ж. Стационарность состояния в любом у(к) хорошо видна после подстановки решения в систему (7), что дает нулевое тождество левой и правой частей уравнений. Устойчивость данных решений следует определить из рассмотрения матрицы линеаризации. Используя стационарное решение у(к)=ст(к)+/ю(к) для системы (7), получим матрицу линеаризации Ь(к) блочного вида:
Ь( к} = Ь1 + Ь 2 + Ь 3-ЕЖ , (9)
где
Ь,
M
Ь2 =-!
і * k
А і - В і
В.
Ь3 =-2
а(k} а(k} а(k }ш(k}
ш(k }а(kш(k }ш(k
а Еж представляет единичную матрицу размерности 2Nx2N.
Можно видеть, что действие любого из действительных операторов типа Ьь Ь2 или Ь3 на
I
действительный вектор Ї = [х' у'] гомотетично действию эрмитова оператора 8=8^/8/ на
комплексный вектор г=х+/у. В частности, можно получить следующее для оператора Ь1 и соответствующего эрмитова оператора J=JR+i :
= L1[Re(z') 1т( 2')] =[Яе^)' 1т( Jz)' ]
(10)
Поэтому сначала рассмотрим свойства эрмитовой матрицы К:
M
К = J - 2у (Іс} V(,с) -^ и(1} и(1} - ЕN . _/* k
(11)
Для нахождения знаков всех собственных чисел матрицы Ь докажем следующую теорему относительно собственных чисел К.
Т е о р е м а. Эрмитова матрица К размерности NxN обладает следующими N собственными значениями без учета их кратности: 1х=-2 и 1/<0 для всех />1.
Доказательство. Все собственные числа эрмитовой матрицы действительны, а собственные векторы, отвечающие различным собственным числам, ортогональны друг другу. Из (4),(5),(11) и нормальности запомненных конфигураций легко можно видеть, что 11=-2 соответствует собственному вектору у(к). Кроме того, для М векторов и® в К-мерном пространстве можно найти К-М линейно независимых векторов, ортогональных ко всем и®. В силу свойства (6) эти векторы также ортогональны к у(к) и являются собственными векторами К. Это позволяет определить, что К-М собственных значений равны -1. Теперь докажем, что другие М-1 собственных значений К являются также собственными значениями СМ-1. Здесь
^ М-1 = и М-1и М-1 ,
что получено после исключения к-того столбца из матрицы и. Рассмотрим характеристическое уравнение для К и умножим слева обе его части на и М-1. Получим
и м-1К = м-1г ,
что приводит к следующему соотношению:
и М-1
М _ _ _ _ _
J - 2У(k)V(k) - ^и(1)и(1) - ЕN 2 = (иМ-1 - ^М-1иМ-1 - иМ-1 )2 = М-1 иМ-12 = М-1z .
k
Видно, что если и М-1z является собственным вектором матрицы СМ-1, соответствующим собственному числу 1, то z - собственный вектор К, соответствующий тому же собственному чис-
лу. Матрица СМ_1 - это матрица Грама размерности (М-1)х(М-1) и, следовательно, имеет М-1 положительных собственных чисел. Тогда у K есть М-1 таких же по абсолютной величине, но отрицательных собственных чисел, что и требовалось доказать.
С л е д с т в и е. Действительная симметричная матрица Ь® размерности 2Nx2N обладает следующими 2N собственными числами без учета их кратности: 11=-2, 12=0 и 11<0 для всех />2.
Доказательство. В силу свойства (10) 11=-2 соответствует собственному вектору
г( k)
ш
(k)
а 12=0 соответствует собственному вектору
ш
(k)
- а
(k)
что может быть
получено путем прямой подстановки этих векторов в характеристическое уравнение для Ь(к). Вообще легко видеть из (9) и (10), что, если z(/)=x(/)+/y(/) (/ = 1,2,.., N) представляет собственный
вектор К, то і
(21-1) =
и і
(21) =
17( 1)
являются представлениями независи-
мых собственных векторов Ь(к). Случай /=к уже рассмотрен, а для ]Фк эти векторы соответствуют собственному числу 1/<0 кратности два, что и требовалось доказать.
Удвоение числа собственных чисел связано с переходом из ^мерного пространства комплексных чисел, рассмотренного в теореме, в 2^мерное пространство действительных чисел из следствия. Поскольку установлено, что одно из собственных чисел матрицы линеаризации системы равно нулю, было бы правильнее определить устойчивость каждого у(к) как устойчивость по Ляпунову. Кроме того, любой у(к)ехр(/0), т.е. повернутая на произвольный угол ф запомненная конфигурация у(к) , также является устойчивым решением для (7). Для подтверждения этого можно подставить у(к) ехр(ф) вместо ц в правую часть уравнения (8) и получить нулевое тождество, а затем найти собственные числа матрицы линеаризации решения у(к)ехр(/'ф). Поэтому нулевое собственное число возникает по следующей причине: предложенная динамическая система обладает аттракторами в форме параметрических многообразий у(к) ехр(ф), где ф
- параметр. Видно также, что любой из векторов I(21-1) и I(21 1 может быть получен путем вращения другого на угол р/2, что дает базис для определения произвольно повернутого соответствующего вектора.
Таким образом, доказано, что все запомненные конфигурации у(/) могут быть воспроизведены из начальной структуры ц и что динамика не зависит от начального поворота или сдвига, а определена только близостью ц к конкретному у(к-1 ехр(ф).
Численные эксперименты
Рассматривается самоорганизующаяся нелинейная система связанных точек в двумерном пространстве, способная запоминать и воспроизводить пространственно инвариантные структуры. Нижеприведенный пример иллюстрирует, как эта система работает в задаче построения двух различных фигур с использованием в обоих случаях одних и тех же составных частей. На рис.1 представлена известная геометрическая головоломка: как составить ромб из трех частей вазы [10]? Здесь видно разбиение вазы на три части, дающие две различные фигуры. В соответствии с представленным в работе подходом границы частей определены набором точек. В данном случае часть А определена шестью точками, часть В - семью, а часть С - тремя точками, так что любая из двух целых фигур определена шестнадцатью точками. Очевидно, что в каждом отдельном случае использование всех точек необязательно, но для обоих конечных результатов необходимо создать правильную динамику.
Р и с. 1. Разбиение вазы на три части, образующие также ромб
б
Р и с. 2. Формирование ромба из искаженного состояния:
а - начальная конфигурация; б - конечная конфигурация
0.5 р 0.4 -0.3 -0.2 -
0.1 -0 --0.1 --0.2 --0.3 --0.4 --0.5
-0.5-0.4-0.3-0.2-0.1 0 0.1 0.2 0.3 0.4 0.5
х
б
Р и с. 3. Формирование вазы из искаженного состояния:
а - начальная конфигурация; б - конечная конфигурация
а
У
а
Ваза и ромб были двумя структурами, запомненными системой (7). Достаточно важно подчеркнуть, что для запоминания выбирались произвольные пространственные положения этих конфигураций, так как матрицы связи вычислялись через отображение Н. Затем части располагались так, что они не образовывали ни одну из фигур, и из этого формировалась исходная конфигурация р(0). Дифференциальные уравнения (7) с начальным условием р(0) были решены численно с помощью простого метода Эйлера, который обеспечивает достаточную сходимость в данном случае. Динамика системы приводила изменяющуюся структуру р(0 к одной из устойчивых конфигураций, представлявших ромб или вазу. Случай воспроизведения ромба показан на рис.2. В то же время на рис.3 демонстрируется, что при дополнительном повороте части А в исходной конфигурации достигается другое конечное состояние системы. Хотя конфигурация на рис.3,а очень похожа на представленную на рис.2,а, часть А, расположенная в несколько иной позиции, заставляет систему двигаться к аттрактору, соответствующему вазе. Следовательно, начальной форме не обязательно быть очень схожей с требуемой, поскольку различные области притяжения имеют точные границы, на которых могут происходить бифуркации структур.
Свойства модели в случае искажения случайных конфигураций также были изучены. Общее количество точек выбрано равным 10, а запомнено было 8 независимых случайных структур. Необходимо было восстановить некоторую структуру из начальной формы, причем последняя выбиралась как одна из запомненных с наложенными случайными искажениями. При этом искаженная конфигурация р(0) вычислялась по следующей формуле:
р(0) = V(к} + ц,
где комплексный вектор ц представлял шум, добавленный к обеим координатам каждой точки. Вследствие свойств отображения Н не нужно было дополнительно сдвигать структуру в пространстве или поворачивать ее для дополнительного исследования характеристик модели. В процессе моделирования вычислялось отношение количества успешных восстановлений форм к общему числу тестов (показатель качества О). Отношение шума к сигналу р определялось по следующему принципу: для /-той точки структуры вычислялась длина добавленного вектора с координатами К.е(^/) и 1ш(^/), и дисперсия ст Ц этих длин являлась уровнем шума. Соответственно уровень сигнала ст2 вычислялся для вектора v(k) схожим образом. Использовалось следующее соотношение:
Р:
Отсюда легко видеть, что однородные трансформации типа сдвигов, поворотов или изменения масштаба дают нулевое отношение шума к сигналу. В процессе моделирования отношение шума к сигналу изменялось от 0 до 1, так что шум достигал уровня, сравнимого с характеристиками структур. Подобный тест проводился для каждой запомненной конфигурации v(k) , и показатель качества О рассчитывался как усредненная по всем тестам характеристика.
Р и с. 4. Зависимость качества восстановления конфигурации от уровня шума
Из рис.4 видно, что качество воспроизведения падает по мере роста уровня шума с 0 до 1. В начальной точке оно равно 1, что, очевидно, и остается достаточно высоким до значения уровня шума примерно 0.27. В конце интервала изменения уровня шума качество достигает значения 0.125, что соответствует чисто случайному выбору одной из восьми конфигураций. Основной целью проведенного моделирования была демонстрация того, что модель обеспечивает требуемое качество восстановления геометрических фигур в допустимом диапазоне искажений и работает произвольно, когда шум сравним с размерами структур. В последующих исследованиях необходимо также провести более тщательный анализ для исследования свойств областей притяжения запомненных конфигураций.
Метод создания самоорганизующихся систем с геометрической памятью, предложенный в данной работе, позволяет запоминать многокомпонентные структуры в двумерном евклидовом пространстве. Система из N точек определяется вектором с N комплексными координатами, каждая из которых содержит действительные абсциссу и ординату в качестве действительной и мнимой частей. Любая запомненная конфигурация характеризуется аналогичным вектором, состоящим из координат точек относительно центра масс. Система может быть определена действительной потенциальной функцией типа формы 4-го порядка и иметь притягивающие многообразия, соответствующие запомненным конфигурациям, повернутым на произвольный угол. С помощью данного метода может быть запомнено и успешно воспроизведено N-2 независимые структуры, состоящие из N точек, независимо от поворота или сдвига в плоскости. Воспроизведение производится достаточно правильно при уровне шума до 27% от геометрических характеристик типичной запомненной конфигурации, а интеллектуальное поведение рассмотренной системы наблюдается и при более высоких значениях уровня шума. Инвариантность системы к сдвигам и поворотам позволяет использовать подобный подход при построении различных интеллектуальных сред. Наиболее интересными направлениями в будущем развитии модели являются исследование реакции на внешнее управление, обобщение модели на пространства более высокой размерности и разработка непрерывного подхода к описанию границ объектов и сред.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Хакен Х. Синергетика: Иерархии неустойчивостей в самоорганизующихся системах и устройствах. М.: Мир, 1985. 423c.
2. Ball, Ph. Off and on reflection// Nature. Vol.391, 1998. Р.232-233.
3. Yudashkin A.A. On a Problem of Relations Between Pattern Recognition Pattern Formation and Moving Multi-unit Objects Perception// Proc. of 1998 IEEE Int. Conf. On Neural Networks. Vol.2, 1998. Р.1392-1397.
4. Goettinger W., Haug P., Lang D. Geometrical Principles of Pattern Formation and Pattern Recognition // Computational Systems, Natural and Artificial, H.Haken, ed., Berlin Heidelberg New York Tokyo, Springer-Verlag, 1987 Р. 97-116.
5. ХакенХ. Информация и самоорганизация. М.: Мир, 1991. 240с.
6. Bowden N., Brittain S., Evans A.G., Hutchinson J. W., Whitesides G.M. Spontaneous formation of ordered structures in thin films of metals supported on an elastomeric polymer// Nature. Vol.393, 1998. Р.146-149.
7. Hu Zh., Chen Y., Wang C., Zheng Y., Li Y. Polymer gels with engineered environmentally responsive surface patterns// Nature. Vol.393, 1998. Р.149-152.
8. Zhang, X. D., Rogers C. A., Liang C. Modelling of the Two-Way Shape Memory Effect// Journal of Intelligent Material Systems and Structures. Vol.8, № 4. 1997. Р.353-362.
9. Chandrashekhara, K., Varadarajan S. Adaptive Shape Control of Composite Beams With Piezoelectric Actuators// Journal of Intelligent Material Systems and Structures. Vol.8, № 2. 1997. Р.112-124.
10. Мочалов Л. П. Головоломки. М.: Наука, 1980. 128с.