Научная статья на тему 'Алгоритм выбора эталонов в заданном конечном множестве элементов'

Алгоритм выбора эталонов в заданном конечном множестве элементов Текст научной статьи по специальности «Математика»

CC BY
120
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МНОЖЕСТВО ЭЛЕМЕНТОВ / АЛГОРИТМ ВЫБОРА ЭТАЛОНОВ

Аннотация научной статьи по математике, автор научной работы — Крашенинников Виктор Ростиславович, Кузнецов Вячеслав Владимирович, Распутько Евгения Анатольевна

Рассматривается задача выбора определённого количества элементов из заданного конечного множества элементов. Выбор должен быть оптимальным по некоторому критерию. Такая задача возникает, например, при распознавании речевых сигналов и других образов, когда их класс нужно достаточно хорошо представить несколькими эталонами. Предложены экономные алгоритмы, дающие близкие к оптимальным решения

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Крашенинников Виктор Ростиславович, Кузнецов Вячеслав Владимирович, Распутько Евгения Анатольевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Алгоритм выбора эталонов в заданном конечном множестве элементов»

Таким образом, описанные алгоритмы позволяют проектировать разнообразные системы обработки многозональных изображений,

которые в зависимости от задачи могут обнаруживать сигналы произвольной формы на спутниковых снимках.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Прэтт, У. Цифровая обработка изображений / У. Прэтт. - М.: Мир, 1982. - Т. 1. - 3 ] 2 с.

2. Крамер, Г. Математические методы статистики / Г. Крамер. - М. : Мир, 1975. - 648 с.

3. Васильев, К. К. Обнаружение точечных аномалий на фоне мешающих изображений / К. К. Васильев, В. В. Балабанов // Радиотехника. - 1991. - № 10. - С. 86-89.

4. Васильев, К. К. Представление и быстрая обработка многомерных изображений / К. К. Васильев, В. Р. Крашенинников, И. Н. Синицын,

УДК 621.391

В. И. Синицын // Наукоёмкие технологии. - 2002. -Т. 3, № 3. - С. 4-24.

5. Васильев, К. К. Методы обработки сигналов. - Ульяновск : УлПИ, 1990. - С. 95.

6. Левин, Б. Р. Теоретические основы статистической радиотехники / Б. Р. Левин. - М. : Сов. радио, 1966. - 686 с.

Васильев Константин Константинович, доктор технических наук, профессор, заведующий кафедрой «Телекоммуникации» УлГТУ, заслу-женный деятель науки и техники РФ. Область научных интересов - статистические методы представления и обработки многомерных случайных сигналов и полей.

Дементьев Виталий Евгеньевич, аспирант кафедры «Телекоммуникации» УлГТУ. Имеет работы в области статистической обработки изображений

В. Р. КРАШЕНИННИКОВ, В. В. КУЗНЕЦОВ, Е. А. РАСПУТЬКО

АЛГОРИТМ ВЫБОРА ЭТАЛОНОВ В ЗАДАННОМ КОНЕЧНОМ МНОЖЕСТВЕ ЭЛЕМЕНТОВ

Рассматривается задача выбора определённого количества элементов из заданного конечного множества элементов. Выбор должен быть оптимальным по некоторому критерию. Такая задача возникает, например, при распознавании речевых сигналов и других образов, когда их класс нужно достаточно хорошо представить несколькими эталонами. Предложены экономные алгоритмы, дающие близкие к оптимальным решения.

Ключевые слова: множество элементов, алгоритм выбора эталонов.

Постановка задачи

Имеется конечное множество элементов Р = {р1,р2,...,рп}. Для любых элементов р1

и pJ из Р определена функция (квазиметрика)

с$(Р< »Р /)» которая из аксиом метрики, возможно, не удовлетворяет только аксиоме треугольника. В приложениях с1(рпр^ является степенью какого-то различия между элементами р1 и р;. Например, это может быть некоторая разница между спектрами звуковых сигналов, корреляционными функциями изображений и т. д.

Из Р требуется выбрать подмножество к

элементов Е = {е],е2,...,ек}с Р, которые будем

В. Р. Крашенников, В. В. Кузнецов, Е. А. Распутько, 2006

называть эталонами. При этом среднее квазирасстояние

1

п-к

£тіп {d(pl,eJ),eJєE} (1)

р,еР

от элементов Р до ближайших эталонов должно быть минимальным.

Таким образом, элементы из множества/3 разбиваются на к классов, в каждом из которых Р(е1) содержатся элементы, для которых е1 является ближайшим эталоном. На

рис. 1, а показано множество из 50 точек плоскости. На рис. 1, б показан выбор 5 эталонов, каждый из которых соединён линиями с элементами из своего класса.

Подобная задача возникает, например, при распознавании речевых сигналов (фо-

нем, слогов или слов) с использованием эталонов. Ввиду изменчивости речи обычно требуется несколько эталонов одного звука. Поэтому требуется из имеющихся вариантов произнесений выбрать представительный набор эталонов.

Л

# • •

*

^ • *

4

К

а

Рис. 1

Решение простым перебором

Сформулированная задача, очевидно, может быть решена простым перебором. Нужно перебрать все способы выбора к элементов из п, то есть все сочетания, и выбрать то из них, для которого (1) минимально. Однако технически выполнить этот перебор трудно или даже невозможно ввиду очень большого числа сочетаний п(п - - к + \) / к\ Например, при п = 60 и

к = 5 требуется около 10 минут работы ПК с тактовой частотой 2,5 гГц.

Квазиоптимальный алгоритм улучшения решения

Сначала случайным образом выбирается первоначальный набор эталонов £, = {е]9е2,...,ек}, для которого по формуле (1) вычисляется соответствующее значение ^ =с1(Е,). Затем производится перебор всех вариантов замены эталона е, на элемент из Р \ Ех. Лучший из Е{ и

этих вариантов (в смысле минимума с/ ) запоминается и принимается за

и принимается за Е2 = {е[,е2,...,ек}, где е\ - оптимальная замена эталона е].

Затем производятся пробы замены второго эталона е2 в Е2 на элементы из множества

Р \ Е2. И так далее, вплоть до получения набора

эталонов Ек+1.

Описанная процедура производится ещё два раза, принимая перед её началом достигнутое

ранее Ек+] за £,.

Эксперименты с данным алгоритмом показали, что получаемый набор эталонов оказывается обычно тупиковым (не улучшается описанной процедурой) и, если и не является оптимальным, то довольно близок к нему, уступая 2-5 процентов. Выполняется алгоритм быстро, например, при п — 60 и к - 5 вместо 10 минут полного перебора требуется только 0,2 секунды. Существенно, что затрачиваемое время растет примерно линейно с ростом п .

Результат, естественно, существенно зависит от

первоначального выбора набора Е:. Поэтому целесообразно испробовать несколько первоначальных случайных вариантов £,. На множестве примеров было установлено, что обычно оптимальное решение находилось после нескольких десятков попыток. На рис 1, б показано оптимальное решение, которое было получено за 10 секунд.

Гравитационный алгоритм

Пусть элементы множества Р являются точками /^-мерного Евклидова пространства с обычной метрикой. Примем их за материальные точки с единичной массой в вязкой среде. Тогда эти точки будут испытывать взаимное притяжение с сопротивлением среды. Точки, расположенные ближе друг к другу, притягиваются сильнее, быстрее сближаются и соединяются в кластеры. На рис. 2, а показано первоначальное положение точек на плоскости. На последующих рисунках рис. 2, б-д показаны следующие друг за другом фазы перемещения и слияния точек.

Между слиянием точек в кластеры и разбиением их на классы Р(е1) по принадлежности к эталонам имеется аналогия - в обоих случаях происходит разбиение множества точек на группы близких друг к другу точек. Если при этом в процессе движения точек отмечать к самых крупных кластеров, принимая в каждом из этих кластеров наиболее близкую к центру тяжести точку за эталонный элемент, то получаются хорошие решения задачи выбора эталонов. На рис. 2, е показано решение для рассматриваемого примера.

% «

%

д

а л

4

* 4

*» *

В

Этот эвристический алгоритм прост в реализации, требует немного памяти - требуется хранить только текущие координаты и скорости движущихся точек. Вязкость среды имитируется умножением достигнутой на каждой итерации скорости точки на коэффициент с < 1.

Заключение Предложенные два алгоритма позволяют получить хорошие решения задачи выбора эталонов за приемлемое время, существенно меньшее, чем этого требует прямой перебор. Первый из этих алгоритмов более универсален, так как в исходном множестве элементов не предполагается какая-то чёткая структура, требуется только задание квазиметрики.

Крашенинников Виктор Ростиславович, доктор технических наук, профессор, заведующий кафедрой САПР УлГТУ. Имеет публикации в области статистических методов обработки сигналов и изображений.

Кузнецов Вячеслав Владимирович, студент пятого курса экономико-математического факультета УлГТУ.

Распутько Евгения Анатольевна, студентка четвёртого курса экономико-математи-ческого факультета УлГТУ.

i Надоели баннеры? Вы всегда можете отключить рекламу.