Научная статья на тему 'Когерентный нейрон и распознавание образов'

Когерентный нейрон и распознавание образов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
235
57
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Головинский П. А.

Рассмотрена возможность использования интерференции для создания искусственного нейрона. Дан анализ волновых явлений, приводящих к скалярному произведению основной операции, определяющей результат срабатывания нейрона. Обсуждено отличие когерентного нейрона от классического искусственного нейрона. Описан механизм обучения когерентного нейрона и показано решение на его основе простейшей задачи распознавания образов

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COHERENT NEURON AND PATTERN RECOGNITION

The possibility of applying interference for creating an artificial neuron is examined. Wave phenomena entailing scalar product the key action specifying the result of neuron's operation, are analyzed. The difference between a coherent neuron and the classical artificial neuron is discussed. The mechanism of coherent neuron learning is described, and the solution on its basis of a trivial pattern recognition problem is demonstrated.

Текст научной работы на тему «Когерентный нейрон и распознавание образов»

УДК 519.7

КОГЕРЕНТНЫЙ НЕЙРОН И РАСПОЗНАВАНИЕ ОБРАЗОВ

П. А. Головинский

Воронежский государственный архитектурно-строительный университет

Рассмотрена возможность использования интерференции для создания искусственного нейрона. Дан анализ волновых явлений, приводящих к скалярному произведению — основной операции, определяющей результат срабатывания нейрона. Обсуждено отличие когерентного нейрона от классического искусственного нейрона. Описан механизм обучения когерентного нейрона и показано решение на его основе простейшей задачи распознавания образов.

ВВЕДЕНИЕ

В основных типах искусственных нейронных сетей, применяемых в настоящее время, используется статическая модель нейрона [1, 2]. Несмотря на значительные успехи, вопросы эффективного обучения нейронных сетей и повышения их быстродействия далеки от окончательного решения. Особенно это сказывается в задачах распознавания образов.

В статической модели искусственный нейрон представляет собой систему с п входами и одним выходом. На входы подаются сигналы х, которые потом суммируются с некоторыми весами а;, обеспечивающими настройку нейрона в процессе обучения. В результате формируется величина

П

и = Е а,х; + с, (1)

I = 1

где с определяет размер смещения, обеспечивающего сдвиг порога срабатывания нейрона. Далее с помощью ^-образной передаточной функции f формируется выходной сигнал у = f(и). Для повышения быстродействия и увеличения числа возможных нейронов в единице объема возможны различные подходы, в том числе с привлечением внутримолекулярных механизмов [3]. Данная работа посвящена возможности использования интерференции для построения модели когерентного нейрона, которая обеспечивает при параллельной обработке информации быстрое распознавание образов.

1. МОДЕЛЬ КОГЕРЕНТНОГО НЕЙРОНА

Поскольку главной математической операцией, определяющей результат срабатывания отдельного нейрона, является вычисление скалярного произведения, то

для реализации искусственного нейрона может быть использован любой физический процесс, моделирующий скалярное произведение, например, интерференция волн различной природы, в частности, световых волн (фотонов) [4]. Пусть имеются две волны, состоящие из суперпозиции разных частотных компонент — гармоник:

= Е ае фр ()

I

__ -Iф; {

Уь = Е Ъе ()

I

Если волны (2) и (3) частично перекрываются в некоторой области, их средняя интенсивность будет про-

порциональна квадрату суммы амплитуд в области перекрытия волн, усредненному по времени:

j = /о ^аЬ = ./'о|фа + ¥ь| =

=/о (Е\“М + Е1ъ,121у,12 + 2Re е Ъ*Ч).

I I I

Функции ф; и у, вообще говоря, все различны. Однако если они устроены похожим образом, как это может быть, например, для импульса с широкой полосой частот, то в области интерференции функций можно положить \ф;\2 = \ у.\2 = а, = р. Из нормировки фа и уь сле-

дует, что

ЕЦ\2 = Е\ъ,\2 = 1.

I I

Тогда можно записать

/ = 2/оР( ^ Е Ъ1а; + а ). (4)

I ”

Если сопоставить выражение для интерференции с аргументом (1) в передаточной функции f(и), то видно, что выражение (4) является его комплексным обобщением, где и = у/(2/0р), с = а/р. Формирование самой передаточной функции может быть осуществлено обычными методами электроники. При использовании фотонов перспективным для формирования многочастотного волнового пакета представляется применение существующих широкополосных лазерных кристаллов и техники генерации ультракоротких лазерных импульсов [5].

Технические преимущества когерентного нейрона заключаются в принципиальной возможности повышения быстродействия и степени параллельности обработки информации по сравнению с классическими искусственными нейронными сетями. Основное отличие когерентного нейрона от классического заключается в появлении дополнительных параметров — относительных фаз у компонент b¡ и а. Представим эти компонен-

/ а щ и

ты в экспоненциальной форме: Ь. = В1 е , a¡ = A¡ е , где A¡ и В. — действительные амплитуды, и п — действительные фазы. Введем в явном виде разность фаз X¡ = п — <з¡ между компонентами векторов. Тогда выражение для аргумента и передаточной функции примет вид

= I АіВі cosX,- +

(5)

Тем самым в вычисление величины и вносится дополнительная возможность управления результатом интерференции, как с помощью амплитуд частотных компонент, так и с помощью фазового сдвига между ними, т. е. используя фазовую модуляцию. Полезность такой дополнительной возможности мы продемонстрируем далее на примере распознавания изображений. При оптической реализации квантового нейрона можно, например, использовать дифракционную решетку для пространственного разделения частотных компонент и управляемый фазовый экран, обеспечивающий изменение фаз отдельных компонент волны. Подобная техника хорошо разработана в оптике формирования ультракоротких лазерных импульсов.

Сама нейронная сеть, построенная из когерентных нейронов, работает так же, как любая другая искусственная нейронная сеть. В сети из когерентных нейронов когерентность существенна в пределах операций, выполняемых отдельным нейроном до его срабатывания, которое приводит к необратимому изменению. Это означает, что сложная проблема сохранения когерентности на протяжении всего процесса вычислений, характерная для всех моделей квантовых компьютеров, здесь не возникает, и система значительно проще реализуется технически. Не требуется и создания принципиально новых алгоритмов по сравнению с обычными алгоритмами [6], развиваемыми для искусственных нейронных сетей.

2. РАСПОЗНАВАНИЕ ОБРАЗОВ КОГЕРЕНТНЫМ НЕЙРОНОМ

В качестве одного из возможных приложений когерентного нейрона рассмотрим проблему распознавания

образов. В этой задаче важно, чтобы распознавание производилось инвариантно по отношению к положению тела в пространстве [7]. Будем считать, что изображение представляет совокупность точек на плоскости, и различные изображения одного предмета отличаются друг от друга конформными аффинными преобразованиями [8]. Тем самым мы ограничиваемся приближением геометрической оптики при построении изображения объекта в регистрирующем приборе, только перемещениями с поворотами вокруг оси зрения без поворотов относительно других свободных осей тела, которое в данной постановке задачи считается абсолютно твердым. Преобразования такого типа имеют вид x = XBz + £,, где

В = [ cos х sin х I - sin х cos х

параметр х имеет смысл угла поворота изображения, X — масштабный коэффициент, £, вектор смещения изображения. Матрицы В удовлетворяют условию В В = 1 и реализуют представление двумерной ортогональной группы SO(2) [9], которая изоморфна группе U(1) вращений векторов в комплексной плоскости. Изоморфизм между этими группами задается соответствием В е'х, 0 < х m 2п и на комплексной плоскости можно

рассматривать преобразования векторов y' = Xe'xy + п.

При подготовке данных для распознавания образов применяется выделение контуров, соответствующих резким перепадам яркости [10]. Выделенные контуры можно представить множеством n точек на плоскости. Эту совокупность далее можно задавать с помощью набора комплексных чисел а = {а;}, i = 1, 2, ..., n.

Для сравнения двух образов а и b приведем их к системе центра масс, а затем произведем нормировку, при которой максимальный модуль комплексных компонент равен единице:

(6)

b¡ ^ b. - - I b,

1 1 и j

bi

maxi bJ

Пусть имеется эталонный образ а и образ Ь того же объекта для сравнения. После выполнения преобразования (6) они могут отличаться лишь углом поворота х0. Если коэффициенты эталонного вектора а рассматривать как комплексные веса входов когерентного нейрона, а коэффициенты точного образа Ь как значения сигналов на входах, то аргумент и передаточной функции в выражении (5) примет вид

П

и = ^(х - Хо) Е АД.

U

С

n

a

a

a

max a

n

1

Величина а является действительной и достигает максимального значения при х = Х0. Для близких образов существует значение х, при котором

П \ П (Re Е (а]Ъ]е'х - аЦа))/ Е а* а < е ] = 1 ] = 1

и изображение с заданной точностью е > 0 совпадает с эталонным. Тем самым когерентный нейрон обеспечивает прямую техническую реализацию распознавания образов.

ЗАКЛЮЧЕНИЕ

Множественность возможных физических реализаций нейронных сетей отмечалась неоднократно. Суть многих текущих и последующих поисков заключается в выборе наиболее удачной реализации, позволяющей оптимально решать определенный класс задач. Предложенная в настоящей работе модель когерентного нейрона апеллирует к многочастотным процессам. Рассмотренная в работе математическая модель искусственного нейрона может быть реализована с помощью колебаний или волн самой различной физической природы. Важнейшие условия ее осуществимости состоят в линейности используемых колебательных явлений и выполнении принципа суперпозиции, обеспечивающего интерференцию. В частности, данную модель вполне можно реализовать в радиодиапазоне обычными радиотехническими средствами.

ЛИТЕРАТУРА

1. Осовский С. Нейронные сети для обработки информации. — М.: Финансы и статистика, 2002. — 343 с.

2. Котов В. Б. Динамическая нейросеть с локальными связями как пространственно-временная ассоциативная память // Радиотехника и электроника. — 2002. — Т. 47, № 9. — С. 1083—1090.

3. Григорьев С. Л. Модель нейрона как квантово-механического устройства // Журнал технической физики. — 2002. — Т. 72, вып. 2. — С. 16—19.

4. Пейн Г. Физика колебаний и волн. — М.: Мир, 1979. — 389 с.

5. Cundiff S. T. and Jun Ye. Femtosecond optical frequency combs // Review of Modern Physics. — 2003. — Vol. 75 (1). — P. 325—342.

6. Головинский П. А. Кинетика нейросетей и естественные аналоги // Нейрокомпьютеры: разработка, применение. — 2004. — № 2—3. — С. 50—59.

7. Сосулин Ю. Г., Фам Чунг Зунг. Инвариантное распознавание изображений комбинированной нейронной сетью // Нейрокомпьютеры: разработка, применение. — 2003. — № 8—9. — С. 29—36.

8. Дубровин Б. А., Новиков С. П., Фоменко А. Т. Современная геометрия. — М.: Наука, 1986. — 759 с.

9. Кострикин А. М. Введение в алгебру. Ч. 3. Основные структуры алгебры. — М.: Наука, 2001. — 272 с.

10. Гнеушев А. Н., Мурынин А. Б. Адаптивный градиентный метод выделения контурных признаков объектов на изображении реальных сцен // Известия РАН. Теория и системы управления. — 2003. — № 6. — С. 153—160.

а (4732) 52-47-34

e-mail: [email protected]

XIV МЕЖДУНАРОДНАЯ КОНФЕРЕНЦИЯ "ПРОБЛЕМЫ УПРАВЛЕНИЯ БЕЗОПАСНОСТЬЮ СЛОЖНЫХ СИСТЕМ"

(Москва, 20 декабря 2006 г.)

Предполагается рассмотреть: проблемы и методы оценки безопасности различного типа; механизмы управления безопасностью; правовое регулирование вопросов безопасности; формирование структур систем управления безопасностью; теорию и методы принятия решений, связанные с безопасностью; прогнозирование и моделирование процессов управления безопасностью; планирование и стратегическое управление в системах обеспечения безопасности; методы построения средств информационной поддержки принятия решений в системах управления безопасностью; системы управления силами и средствами при управлении безопасностью.

Конференция состоится в Институте проблем управления им. В.А. Трапезникова РАН по адресу: Москва, Профсоюзная ул., 65. Официальные языки конференции — русский, английский. Продолжительность работы конференции — 1 день.

Заявки на участие в конференции принимаются по адресу: 117997 Москва, ГСП-7, Профсоюзная ул., 65, Институт проблем управления, лаб. 20, Оргкомитет международной конференции; тел. (495) 334-89-59, e-mail: [email protected]

Материалы представляются на дискете плюс 1 экз. в распечатанном виде (2—4 стр.). На этикетке дискеты указать ф.и.о. авторов и имя файла, названного по фамилии первого автора; или высылается по электронной почте. В графе «Тема» укажите — Конференция. Необходимо сообщить сведения об авторах: фамилию, имя, отчество автора(ов); должность, ученое звание; место работы (полное название и аббревиатура); почтовый адрес для переписки (обязательно указать индекс) и(или) e-mail; номер телефона для связи.

Требования по оформлению. Материалы должны быть представлены в редакторе Word, версии не ниже 6.0; формат А4, заполняемый текстом 115x165 мм. Шрифт — Times New Roman, 10 пунктов через 1 интервал, красная строка — 0,5 см, страницы не нумеруются. Библиографические ссылки в тексте даются в квадратных скобках, рисунки должны допускать возможность масштабирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.