Научная статья на тему 'Исследование поведения динамической системы распознавания образов при спонтанном изменении конфигурации Р2Р-сети'

Исследование поведения динамической системы распознавания образов при спонтанном изменении конфигурации Р2Р-сети Текст научной статьи по специальности «Математика»

CC BY
37
9
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Бояркин М. И., Юдашкин А. А.

Рассматривается поведение автоматизированной системы распознавания образов на основе динамически изменяющейся пиринговой сети. Моделирование процесса изменения размерности модели распознавания образов на ЭВМ демонстрирует ее эффективность при спонтанной модификации структуры распознающей распределенной сети.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Бояркин М. И., Юдашкин А. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Исследование поведения динамической системы распознавания образов при спонтанном изменении конфигурации Р2Р-сети»

Системный анализ, управление и автоматизация

УДК 004.75

М.И. Бояркин, А.Л. Юдашкин

ИССЛЕДОВАНИЕ ПОВЕДЕНИЯ ДИНАМИЧЕСКОЙ СИСТЕМЫ РАСПОЗНАВАНИЯ ОБРАЗОВ ПРИ СПОНТАННОМ ИЗМЕНЕНИИ КОНФИГУРАЦИИ Р2Р-СЕТИ1

Рассматривается поведение автоматизированной системы распознавания образов на основе динамически изменяющейся пиринговой сети. Моделирование процесса изменения размерности модели распознавания образов на ЭВМ демонстрирует ее эффективность при спонтанной модификации структуры распознающей распределенной сети.

В настоящее время широко распространены различные системы сбора и обработки информации. Системы, основанные на классической двухзвенной архитектуре (клиент-сервер), имеют ряд недостатков. Один из главных недостатков - постоянная необходимость в обслуживании данных систем и поддержании связи с сервером, так как на нем сосредоточена вся логика и основная функциональность, что делает централизованный сервер слабым и узким местом системы. Выход из строя сервера или потеря связи с'ним означает выход из строя всей системы целиком. Частично проблемы решаются при использовании более новой, трезвенной, архитектуры (тонкий клиент, сервер приложений, сервер), когда работа конечных пользователей в меньшей степени зависит от работы централизованного сервера. Однако и в данном случае сосредоточение функций на ключевых строго определенных узлах сети делает такие системы менее устойчивыми.

В последнее время все большее распространение получают различные децентрализованные модели сетей, т.е. сети без централизованного сервера. Это так называемые пиринговые (peer-to-peer, P2P) сети, работа которых основана на связи между всеми отдельными частями и их вычислительной мощности, а не на относительно малом количестве серверов [I]. Пиринговые сети в чистом виде не имеют клиентов или серверов, а состоят из равнозначных узлов, исполняющих одновременно роли клиентов и серверов для других подобных узлов. Существуют также гибридные пиринговые сети, имеющие вспомогательные серверы, которые в основном хранят информацию об узлах и их состояниях.

Пиринговые сети обладают рядом преимуществ. За счет того, что используются вычислительные ресурсы каждого из узлов, получается, что с ростом системы (появление новых узлов) и ее потребностей одновременно растут и ее возможности, и общая вычислительная мощность, в отличие от классической двухзвенной архитектуры, в которой вычислительная мощность ограничена возможностями центрального сервера. Пиринговые сети также устойчивы по отношению к ошибкам и отключению отдельных узлов, так как формально ни один узел не представляет собой узкое место сети и не является критически важным для ее работы.

Теория пиринговых сетей достаточно обширна [2, 3]: исследуются различные протоколы и алгоритмы работы таких сетей, их структурирования, гибридное использование пиринговой архитектуры с другими архитектурами. Кроме теории существует ряд практических реализаций пиринговых сетей и их применения для решения различных задач [3]: эффективное хранение и обмен информацией, биоинформатика, повышение устойчивости работы серверной части двухзвенной архитектуры (компьютерные кластеры), различные

1 Работа выполнена в рамках фанта Президента Российской Федерации для государственной поддержки молодых российских ученых МД-9422.2006.9 VI гранта РФФИ по проекту 07-08-00401-а.

распределенные вычислительные задачи. Вообще, пирингокыс сети можно использовать для любых задач, в том числе и вычислительных, которые можно разбить на ряд относительно независимых частей. При этом будет использоваться суммарная вычислительная мощность всех узлов, и данная система будет устойчива по отношению к изменению своей структуры. Особенно интересным является исследование работы различных автоматизированных интеллектуальных систем на основе Р2Р-архитектуры.

В данной статье рассматриваются особенности реализации модели распознавания цифровых графических образов на основе динамически меняющейся распределенной сети. Система распознавания образов построена с помощью модели искусственной синергетической нейронной сети Хакена [4]. Использование моделей на основе нейронных сетей Хакена позволяет произвести редукцию размерности решаемой задачи распознавания с исходной размерности входных векторов до количества запомненных образов в системе, сократив тем самым число настраиваемых параметров. Кроме того, в фазовом пространстве решаемой задачи отсутствуют ложные минимумы [4, 5]. Модель распознавания на основе нейронной сети Хакена представляет собой систему М нелинейных обыкновенных дифференциальных уравнений (М- количество запомненных образов системы) относительно мод, каждая из которых отвечает за распознавание отдельного запомненного образа.

Одним из основных критериев возможности развертывания подобных моделей на пиринговых сетях является возможность разбиения вычислительной работы модели на ряд независимых частей, что с очевидностью обеспечивается в рамках используемой модели. Здесь возможна реализация P2P сети на Музлах.

В предложенной реализации на отдельных узлах будут реализованы отдельные независимые машины распознавания. Динамическое изменение сети в данном случае будет равноценно изменению количества образов, предъявляемых для распознавания. В статье исследуется поведение системы при внезапном изменении размерности М в процессе распознавания.

Математическая модель распознавания

В [4] представлены принципы построения моделей распознавания образов на основе нейронной сети Хакена. Предъявляемый к распознаванию образ <7(0) состоит из N

вещественных чисел. В модели имеется Ы образов-прототипов v, (/ = 1 ,Л/ ), имеющих такую же структуру, В процессе распознавания образ может быть представлен в виде линейной комбинации запомненных образов V/ с коэффициентами с/, мод и некоторого остатка

Данное представление распознаваемого образа позволяет свести распознавание к конкуренции мод, значения которых изменяются во времени, и рассматривать задачу не в фазовом пространстве размерности N компонент вектора а в пространстве мод размерности М. После предъявления образа система со временем эволюционирует в одно из устойчивых состояний - узлов в фазовом пространстве мод, соответствующее одному из запомненных образов системы. В окрестности этой стационарной точки только одна мода стремится к ненулевому значению в отличие от остальных мод, стремящихся к нулю. Победившая ненулевая мода указывает на наиболее похожий запомненный образ. Динамику распознавания можно представить в виде системы М нелинейных обыкновенных дифференциальных уравнений относительно М мод сі,:

начальные условия определяются соотношениями:

(1ф)=А V'q{0),

(2)

(3)

где

Л - G~\ G = VV.

где V- матрица N*M, составленная из векторов v„

6

Динамическое изменение размерности системы

Ввиду сложности и многомерности системы уравнений (2) она решается численно для данных начальных условий. При распознавании важно лишь установить, какая мода стремится к ненулевому значению, что можно однозначно определить при достаточном количестве шагов численного интегрирования системы.

Численное интегрирование, особенно при больших размерностях задачи, из-за конкуренции мод занимает достаточное время. При работе данной модели на основе динамически меняюшейся сети возможна такая ситуация; количество распознаваемых образов изменилось, однако процесс распознавания с уже имеющимися эталонными образами и сформированной по ним матрицей б не закончен. Если каждый раз при этом ожидать окончания процесса распознавания, а после этого менять ее размерность, пересчитывая матрицу С, это будет причиной низкой производительности системы и в худшем случае приведет к непрекращающемуся пересчету данных.

Для решения данной проблемы в большинстве практических приложений предлагается следующий подход. Есть модель Л, распознавания (2) с размерностью Мя —П, т.е. с я

эталонными векторами, матрица размерности я, вычисленная по формуле (4), с вектором

#(0), подаваемым на распознавание посредством начальных условий */*'(0), вычисляемых по формуле (3):

^‘(0) = С*У'«7(0). (5)

Допустим, в данном случае получаем ответ ак , равный номеру распознанного вектора,

т.е. мода (1Яя в процессе численного интегрирования системы (2) с количеством шагов tк в

отличие от остальных мод достигла некоторого ненулевого значения.

Также имеется модель /?, с размерностью М^ =и + 1, с я эталонными векторами из

модели и еще одним новым эталонным вектором, например, хранящимся на вновь подключившемся узле сети. Матрица (?д размерности н + 1 и вектор (1Нг (0) подсчитаны по формулам (3) и (4) с учетом новой размерности и нового эталонного вектора уя+, . В данном случае после численного интегрирования с тем же с количеством шагов получаем ответ од , не обязательно равным ая в общем случае. Таким образом, в данном случае имеется динамическое изменение размерности системы, заключающееся в появлении нового эталонного вектора или нового узла пиринговой сети. Тогда пусть - это состояние модели

до динамического изменения, /?, - состояние после него.

Модификацию модели можно производить следующим образом: на некотором шаге численного интегрирования t№vr (на котором предположительно к пиринговой сети

подключается новый узел) численное интегрирование модели /?, останавливается, матрица С пересчитывается (соответственно, становится равной ). Вектор значений

дифференцируемых переменных мод */( на шаге вычисляется следующим образом:

у, )=(</)«.,■, <«)

где ^|(*нут)-.-^м(^и.г) - значения мод 7 полученные при численном интегрировании модели на момент 7 , ДО) - (л + ]) -й элемент вектора начальных условий ds*(0).

После этого производится численное интегрирование с вектором </(*мут) в качестве начальных условий и с количеством шагов * = Таким образом, общее время

интегрирования не меняется и в конечном итоге получается некоторый ответ а .

Введем предположение, существует некоторое / ., такое, что для 1 < V/ < /кри1.

модель Л,, подвергшаяся модификации, в большинстве случаев будет давать ответ амут =в*з, т.е. ответ будет таким же, как если бы распознавание в целом велось в модели /?3 .

Численное моделирование

Для первичной оценки такой возможности проведем простой эксперимент. В модель с тремя эталонными образами (т.е. /1 = 3) для распознавания последовательно подается ка вход выборка из 3000 векторов. Эталонные образы и образы для распознавания являются в данном случае реальными изображениями лиц. В данном фазовом пространстве системы образ для распознавания можно обозначить точкой с координатами, равными начальным условиям 4(0). Так как структура реальных векторов и распределение компонент в них отличаются от равномерно распределенного по всему фазовому пространству белого шума, то точки, соответствующие реальным векторам, покрывают равномерно не все доступное пространство, а только некоторый сектор, напоминающий по форме облако. Количество образов, подаваемых на вход модели, выбрано таким, чтобы достаточно плотно и равномерно заполнить область реальных векторов. После распознавания точка окрашивается цветом, зависящим от того, какой образ выбран в данном случае. В результате получается картина с закрашенными областями притяжения аттракторов, соответствующих запомненным эталонным образам (рис. 1).

і.

00-

06-

О*.

□ г-, о-■02-■СИ-41Ё. ■03*

У:*.'*

, * .л ;..

Ч /-’Т» . • ■

Рис. 1. Распределение областей притяжения в модели с тремя эталонными образами. Каждая точка-начальные условия образов для распознавания, оттенок точки показывает, какой образ выбран

Из рис. 1 видно, что области притяжения аттракторов имеют пирамидальную форму с достаточно ровными гранями. После этого к той же модели добавляется 4*й эталонный образ и на вход подаются те же 3000 векторов. Так как невозможно показать визуально 4-мерное фазовое пространство, то на рис. 2 будет приведено точно такое же распределение по первым трем эталонным образам (точки, соответствующие образам, распознающимся как четвертый, выделяются черным).

В

1 1

Р и с. 2. Распределение распознавания в модели с четырьмя эталонными образами

в пространстве 3-х первых мод

Из рис. 2 видно, что структура областей притяжения аттракторов существенно не изменилась, несмотря на то, что 4-й образ также имеет довольно большую область притяжения, судя по проценту распознанных образов.

Данную иллюстрацию можно считать косвенным подтверждением предположения, высказанного в предыдущем разделе, В данном случае поведение системы можно спрогнозировать таким образом: если аД| =ой , тогда точка, соответствующая текущим

значениям мод при модификации (т.е. параллельном переносе точки на значение нового начального условия по новому эталонному вектору), не выйдет за пределы области притяжения аттрактора, соответствующего правильному ответу, и модель в конечном итоге выдаст правильный ответ. Отличаться будет лишь траектория точки с координатами мод. При «Л| ая в случае, если модификация произошла до некоторого критического шага

(точка не успела достаточно близко притянуться к аттрактору, соответствующему некорректному ответу), описанный выше параллельный перенос точки обеспечивает ее перемещение в корректную область притяжения, и в конечном итоге модель даст корректный ответ ая .

С целью практического подтверждения высказанной гипотезы далее моделируется модификация системы. В данном случае используется модель, в которой образы - это цифровые изображения лиц.

Для модели Д,: Мк = 203,=204, /д.=125. Тестирование производилось на двух выборках входных векторов д(0) по 20 векторов в каждой. Первая выборка состояла из векторов, которые не распознаются как у204 в модели . Вторая выборка состояла из векторов, которые распознаются как у2М в модели Л2. Соответственно, *мут менялось от 10 до /2 =/к-5 = 120. Ниже приведена таблица с результатами эксперимента (значения яиуг в зависимости от *муг), а также график зависимости количества правильных ответов системы от времени /мрт(рис. 3).

образах. Последний столбец - корректные ответы модели R^

10 15 20 25 30 35 40 45 50 55 Б0 65 70 75 80 65 90 95 100 105 110 115 120 ая

1 113 113 113 113 204 204 204 204 113 113 113 113 113 113 113 113 113 113 113 113 113 113 113 113

2 149 149 149 149 149 149 149 149 149 149 149 149 149 149 149 149 149 149 149 149 149 149 149 149

3 43 43 43 43 43 43 43 43 43 43 43 43 43 43 43 43 43 43 43 43 43 43 43 43

4 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110

5 204 204 204 204 204 204 204 204 204 204 204 204 204 204 62 52 62 62 62 62 62 62 62 62

1 204 204 204 204 204 204 204 204 204 204 204 204 175 175 175 175 175 175 175 175 175 175 175 204

2 204 204 204 204 204 204 204 204 204 204 204 204 204 204 204 204 204 74 74 74 74 74 74 204

3 204 204 204 204 204 204 204 204 204 204 204 204 204 204 204 204 204 204 204 32 32 32 32 204

4 204 204 204 204 204 204 204 204 204 204 204 204 204 204 204 204 204 204 204 204 204 204 32 204

5 204 204 204 204 204 204 204 204 204 204 204 113 113 113 113 113 113 113 113 113 113 113 113 204

90

80

70

60

50

40

г V ' / Ч у- —

... ....тТх

20 40 ВО 80

время модификации

100

120

Р и с, 3. Зависимость числа корректных ответов от времени модификации

Так как фазовое пространство распознавания имеет сложную структуру и система (2) интегрируется численно, крайне сложно аналитически вычислить точное значение и зависящую от него вероятность корректного ответа изменившейся системы. В данном случае

при

крит

= модель дает корректный ответ в 87,5% случаев (80% случаев в первой выборке

и в 95% случаев - во второй), что можно считать вполне успешным результатом и экспериментальным подтверждением относительной эффективности предложенного

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

механизма реализации модели распознавания образов на основе сети Р2Р,

Выводы

У современной пиринговой архитектуры построения компьютерных сетей большой потенциал. Такие сети удобны для решения задач обмена информацией и ее интеллектуальной обработки, так как их общая вычислительная мощность повышается с ростом количества узлов; они также устойчивы к динамическому изменению своей структуры и отключению от сети отдельных узлов, так как не имеют централизованных серверов.

В статье для имитации работы сети Р2Р используется механизм модификации модели распознавания образов, заключающийся в подготовке начальных условий (1(0) для модели с новой размерностью с учетом уже вычисленных к данному моменту в результате некоторого количества шагов 1ЫУГ и повторном численном интегрировании системы дифференциальных

уравнений новой размерности на оставшемся количестве шагов. Высказано предположение о том, что существует некоторый момент в процедуре численного интегрирования, до которого модификация не вызывает существенного снижения эффективности распознавания, и изменившаяся модель дает адекватный ответ. Под адекватным ответом понимается результат, который был бы дан, если бы система имела увеличенную размерность с самого начала процесса распознавания.

В результате эксперимента, моделирующего предложенный механизм модификации модели распознавания образов - реальных изображений лиц - установлено, что упомянутый

выше критический момент приблизительно равен fKpni -~* ?к ~ общее число шагов

численного интегрирования. При модификации до этого момента система дает правильный ответ в 80% и более случаев.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Agre РЕ. P2P and the promise о I' internet equality / Communications of the ACM. Vol. 46(2). 2003, pp.39-42.

2. Stephanos Androutsellis-Theotokis and Diomidis Spinel I is. A survey of peer-to-peer content distribution technologies. ACM Computing Surveys. 36(4):335-371, December. 2004.

3. Ralf Steinmetz, Klaus Wehrte {Eds). Peer-to-Peer Systems and Applications. ISI1N 3-540-29192-X. Lecture Notes in Computer Science, Vol. 3485. Sep. 2005.

4. Haken H. Synergetic computers and cognition: A top-down approach to neural nets. Berlin: Springer-Vcriag, 1991.

5. Юдашкин А.А. бифуркации стационарных решений в синергетической нейронной сети и управление распознана]Iнем образов П Автоматика и Телемеханика. 1996. № 11. С. 139-147.

Статья поступила в редакцию 3 октября 2007 г.

УДК 681.51, 629.78 С.А. Бутырин

ПРОГРАММНЫЙ КОМПЛЕКС ДЛЯ РАСЧЕТА И ВИЗУАЛИЗАЦИИ МАРШРУТОВ ОПТИКО-ЭЛЕКТРОННОЙ СЪЕМКИ ЗЕМЛИ1

Описывается комплекс программ для расчета и визуализации различных вариантов съемки поверхности Земли из космоса. Комплекс позволяет выполнить расчеты параметров поступательного и углового движения космического аппарата пру объектовой съемке, съемке площадок и стереосъемке с отображением маршрутов на карте.

Программный комплекс GeoPlan позволяет выполнить расчеты параметров поступательного и углового движения космического аппарата (КА), оснащенного орбитальным телескопом (ОТ) при оптико-электронной съемке поверхности Земли с отображением маршрутов съемки на картографической основе. Методологическая основа расчетов приведена в [f, 2], где рассмотрены три практически применяемых варианта построения маршрутов съемки: “с выравниванием”; “по геодезической линии”; “с постоянной ориентацией в ОСК”.

Метод “с выравниванием” дает приближенно постоянное значение продольной составляющей скорости движения изображения (СДИ) в фокальной плоскости (ФП) орбитального телескопа и применяется для получения изображения с высоким качеством. Недостатком этого метода является отклонение линии маршрута от первоначально заданного направления сканирования, причем скорость такого отклонения увеличивается пропорционально угловому расстоянию от трассы полета. Метод съемки “по геодезической линии” обеспечивает прохождение следа линии визирования орбитального телескопа на поверхности Земли по линии, образованной сечением общеземного эллипсоида с плоскостью, проходящей через заданные начальную и конечную точки поверхности и центр Земли. Он имеет практическое преимущество, связанное с прохождением маршрута через заданные объекты на поверхности Земли. Метод съемки '‘с постоянной ориентацией в ОСК” выполняется при постоянстве ориентации ЛВ в орбитальной системе координат (ОСК). Этот метод не требует существенных угловых эволюций КА, но маршруты съемки не могут отклоняться от направления трассы полета. Движение КА между маршрутами съемки (на межмаршрутных интервалах) представляется как результат сложения трех одновременно происходящих элементарных плоских поворотов.

'Работа поддержана РФФИ (04-01-96501. 07-08-97611). Президиумом РАН (программа фундаментальных исследований 22) и Отделением энергетики, механики, машиностроения и процессов управления РАН (программа 15).

i Надоели баннеры? Вы всегда можете отключить рекламу.