Научная статья на тему 'Особенности оперативной обработки и анализа многомерной измерительной информации на основе структурно-дескриптивного подхода'

Особенности оперативной обработки и анализа многомерной измерительной информации на основе структурно-дескриптивного подхода Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
52
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПЕРАТИВНАЯ ОБРАБОТКА / СТРУКТУРНО-ДЕСКРИПТИВНЫЙ ПОДХОД / РАСПОЗНАВАНИЕ ОБЪЕКТОВ / РАЗДЕЛЕНИЕ ИЗОБРАЖЕНИЙ / РАССТОЯНИЕ ЛЕВЕНШТЕЙНА / OPERATIONAL PROCESSING / STRUCTURAL AND DESCRIPTIVE APPROACH / OBJECT RECOGNITION / IMAGE SEPARATION / LEVENSTEIN DISTANCE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Зиновьев В.Г., Попов Д.В., Азарян М.В.

Предлагается на основе структурно-дескриптивного подхода проводить оперативную обработку и анализ многомерной измерительной информации. Анализ объекта наблюдения проводится по его контуру. Описание контура объекта на прямоугольном растре производится в виде цепочек символов произвольной длины в коде Фримена. Для определения сходства цепочек вводится структурная метрика (расстояние Левенштейна). Расстояние между цепочками определяется методом дискретного динамического программирования. Рассматривается соответствующие алгоритмы обработки и анализа.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Features real-time processing and analysis of multidimensional measurement information on the basis of structural-descriptive approach

Offered on the basis of structural-descriptive approach to carry out rapid processing and analysis of multivariate measurement data. The analysis of the object of observation is carried out along its outline. Description of object contour on a rectangular raster is produced in the form of chains of characters of arbitrary length in the code of Freeman. To determine the similarity of the chains introduces a structural metric (Levenshtein distance). The distance between the chains is determined by the method of discrete dynamic programming. Considered appropriate algorithms for processing and analysis.

Текст научной работы на тему «Особенности оперативной обработки и анализа многомерной измерительной информации на основе структурно-дескриптивного подхода»

Особенности оперативной обработки и анализа многомерной измерительной информации на основе структурно-дескриптивного подхода

Зиновьев В.Г.

к.т.н., доцент; Военно-космическая академия имени А.Ф. Можайского Попов Д.В.

Военно-космическая академия имени А.Ф. Можайского Азарян М.В.

Военно-космическая академия имени А.Ф. Можайского Аннотация

Предлагается на основе структурно-дескриптивного подхода проводить оперативную обработку и анализ многомерной измерительной информации. Анализ объекта наблюдения проводится по его контуру. Описание контура объекта на прямоугольном растре производится в виде цепочек символов произвольной длины в коде Фримена. Для определения сходства цепочек вводится структурная метрика (расстояние Левенштейна). Расстояние между цепочками определяется методом дискретного динамического программирования. Рассматривается соответствующие алгоритмы обработки и анализа.

Ключевые слова: оперативная обработка; структурно-дескриптивный подход; распознавание объектов; разделение изображений; расстояние Левенштейна.

Введение

Оперативная обработка и анализ многомерной информации, полученной с оптико-электронных средств наблюдения, является актуальной задачей для космических информационных систем, осуществляющих наблюдение за наземными и космическими объектами.

Практический интерес для широкого класса объектов наблюдения представляет оперативное распознавание изображений объектов наблюдения по их контурам.

Структурно-дескриптивный подход к контурному распознаванию объектов

Для обеспечения оперативности анализа объектов наблюдения предлагается использовать структурно-дескриптивный подход [1], сочетающий преимущества структурно-синтаксического [2], информационного [3] и дескриптивного подходов [4]. Структурно-дескриптивные модели эквивалентны по мощности регулярным грамматикам (конечным автоматам), но позволяют строить более оперативные алгоритмы анализа, а по форме представления - естественным образом получить "расширение" до более мощных моделей с контекстной зависимостью. При синтезе математических моделей этапов обработки информации об объекте наблюдения можно выделить две группы задач: получение формального описания наблюдаемого объекта и разработка алгоритмов анализа и распознавания. Теоретической основой для этого служат информационная теория зрения Д. Марра и дескриптивная теория изображений. Предметом информационной теории являются восприятие и обработка зрительной информации, предмет дескриптивной теории изображений составляют структура изображений, методы построения изображений объектов из элементов с более простой структурой, модели изображений и преобразования, определенные на классах эквивалентности моделей изображений.

Введение классов эквивалентности на множестве моделей изображений отражает гипотезу об обладании всяким изображением определенной регулярностью (смесью регулярностей различных типов). Задачи анализа и распознавания сводятся к разделению изображений, сохраняющих собственную регулярность, и изображений с нарушением собственной регулярности. При решении задач анализа и рас-

познавания обрабатываемые изображения на различных этапах преобразования представляются в виде двумерных числовых матриц. При синтезе модели наблюдаемого объекта могут использоваться как структурные, так и параметрические модели. Последние весьма сложны в практической реализации. Проблематично выглядит и реализация преобразований при анализе и распознавании изображений в виде числовых матриц вследствие их больших размерностей. Поэтому при синтезе модели наблюдаемого изображения и реализации этапов анализа и распознавания предлагается использовать структурно-дескриптивный подход.

С помощью оптико-электронных средств (ОЭС) осуществляется наблюдение за некоторой ограниченной областью (пространства - звездного поля или поверхности Земли). Световой поток, проходя через оптическую систему ОЭС, попадает на находящийся в её фокальной плоскости блок чувствительных элементов (обычно на основе многоэлементной фотомикросхеме с зарядовой связью). Получившийся аналоговый электрический сигнал, интенсивность которого зависит от суммарного количества энергии поступившего светового потока, попадает на аналого-цифровой преобразователь (АЦП). Таким образом, после АЦП на выходе ОЭС информацию можно представить в виде матрицы значений, заданной на целочисленной прямоугольной решетке - растре.

Предлагается использовать следующий подход, учитывающий структуру растра. На клеточном растре образуют замкнутый контур. Так как на прямоугольной решетке имеется восемь возможных направлений, то контур можно представить в виде цепного кода Фримена [2].

Вследствие различного рода искажений и помех контур, полученный в результате обработки растра, будет отличаться от эталонного контура. Встает вопрос о степени их близости.

Меры близости. Расстояние Левенштейна

В синтаксическом распознавании образов одним из узких мест является определение принадлежности полученной в результате анализа цепочки символов (строки) х = а\а2...а„ одному из классов юь / = 1, 2, ..., I.

В качестве критерия сходства двух строк используется минимум расстояния между ними. Каждому классу ю1 ставится в соответствие набор векторов, или эталонов, уI = ЬпЬа...Ь„,, / = 1, 2, ..., I, а поступающая неизвестная строка х относится к определенному классу, если расстояние между ней и соответствующим эталоном из набора является минимальным.

Понятие сходства между последовательностями символов или чисел базируется на работе Кендал-ла [5], где введена мера сравнения порядка списков.

Пусть имеем реализацию х = а1а2...а„ и эталон у = Ь1Ь2...Ь„.

Коэффициенты сравнения определяются так:

Д а = и

1, если a ;> a j -1, если a ; < a j, Д jj= 0, если a ; = a j

1, если b ;> b j -1, если b ; < b j 0, если b ; = b ;

2

j-1

где i < j . Расстояние по Кендаллу равно d (x, y) = 1--V Д a Д b.

n (n — 1) i=1 ' '

Если компоненты векторов x и y упорядочены однотипно, то Д ?j= Д Ь. для всех i, j и d(x,y) = 0.

Когда компоненты строк упорядочены в противоположном порядке, то d(x,y) = 2. Для составления векторов, элементы которых выражаются не числами, а некоторыми понятиями, используются отношения порядка.

Оба указанных подхода имеют следующие существенные недостатки: во-первых, число элементов в обоих списках должно быть одинаковым, во-вторых, здесь не учитывается структура последовательности в каждом списке.

Пусть мы имеем множество классов Q = (ю 1, ю 2, ••• ,ю t}. Каждому классу ставится в соответствие эталонная цепочка y. = b b 2 • b ■ , i = 1, 2, •.., t.

V 1 11 12 l^ft^ ~ 7 7 7

Распознаваемое изображение X относится к классу ю ; если

ё (х, у1) = ш1п{ё (х, у1), , = 1,2,...^}.

Если х = (а 1, а 2, ..., ап Т и у1 = ( Ь11, Ь12, ..., Ь 1п )Т являются векторами, то х и у, можно рассматривать как две точки в пространстве признаков.

Г п к ] ¥

Следовательно, ёк(х,у1) = 1^(аJ -Ь^( I для Ь к -метрики.

i=i

Для к = 1 имеем хеммингово расстояние: ё 1( х, у 1) = ^

i=i

a j" b ij

j = 1,2, ...n.

Для к = 2 получаем эвклидово расстояние: ё 2(х, у1) = |а — Ь lj

При к = ю имеем чебышевское расстояние: ё(х,У1) = Шах|аj-Ьlj

Если х и у1 расстояние между строками, то ё (х, у) - расстояние между строками. Алгоритм вычисления такого расстояния зависит от конкретного приложения. Для синтаксического распознавания образов возможно применение расстояния Левенштейна [6] ё ь (х, у) между строками х и уъ определяемое как минимальное число преобразований, требуемое для получения строки у1 из цепочки х.

Преобразования состоят из замещения, добавления и удаления элементов строки. Расстояние между строками будем использовать в качестве меры близости цепочек, когда между ними нельзя найти точного соответствия.

Пусть мы, например, имеем описания изображений: эталонного у=ааесеааЬ и распознаваемого х = ааЬссеёас. Для того, чтобы преобразовать цепочку х в цепочку у, следует сохранить первый и второй символы, заменить третий, оставить (удалить) четвертый, удалить (оставить) пятый, сохранить шестой, заменить седьмой, сохранить восьмой и заменить девятый символы.

Каждому шагу преобразования соответствует своя цена: Б(а1,Ь1) = Б - для замещения символа ai на Ь и I(Х1,Ь1) = I - для вставки символа Ь,; Б(а1, X) = Б - для удаления символа а,. Обычно полагают: I = 1, Б = 1, 8 = 1 (а, ф Ь), 8 = 0 (а, = Ь)

Алгоритм распознавания методом динамического программирования на основе расстояния Левенштейна

Для определения расстояния между строками по Левенштейну возможно применение метода динамического программирования [7]. В алгоритме можно выделить на три этапа.

Первый этап - подготовительный и включает:

- ввод массивов исходных данных;

- установку начальных значений расстояний и счетчиков циклов;

- вычисление весов для удаления и вставки символов.

На втором - основном этапе выполняются:

- обновление начальных значений счетчиков циклов;

- вычисление весов для замещения символов;

- расчет минимального пути перехода к эталонной цепочке.

Третий - заключительный этап работы алгоритма состоит в распознавании рассматриваемой цепочки и содержит:

- вычисление абсолютного расстояния Левенштейна;

- вычисление приведенного расстояния между цепочками;

- определение класса принадлежности распознаваемой цепочки.

Приведенное, или нормализованное, или нормированное расстояние вводится из-за эффекта размера: две цепочки большей длины представляются более похожими, чем две меньшие цепочки при одинаковом абсолютном расстоянии Левенштейна.

Заключение

Предложенный алгоритм оперативного контурного распознавания методом динамического программирования на основе расстояния Левенштейна реализован на IBM PC в едином комплексе программ, обеспечивающих:

а) ведение эталонных объектов наблюдения;

б) зашумление эталонного объекта наблюдения помехами с заданным законом распределения и его параметрами;

в) медианную фильтрацию с заданной апертурой n*n (n = 3, 5, 7);

г) получение цепного кода Фримена для эталонных и отфильтрованных контуров;

д) сравнение эталонного и рабочего контуров на основе расстояния Левенштейна.

Алгоритм показал устойчивую работу для вероятности искажения символа (в случае импульсного шума) до 0,35.

Литература

1. Зиновьев В.Г. Структурно-дескриптивный метод контурной обработки оптических изображений // Оптический журнал, т. 67. 2000. № 7. С. 33-37.

2. Фу К. Структурные методы в распознавании образов. М.: Мир. 1977. 320 с.

3. Марр Д. Зрение: Информационный подход к изучению представления и обработки зрительных образов. М.: Радио и связь. 1987. 400 с.

2. Журавлев Ю.И., Гуревич И.Б. Распознавание образов и распознавание изображений // Распознавание, классификация, прогноз: Математические методы и их применение. Вып. 2. М.: Наука. 1989. С. 5-72.

3. Кендэл М. Ранговые корреляции. М.: Статистика. 1975. 214 с.

4. Левенштейн В.И. Элементы теории кодирования // Дискретная математика и математические вопросы кибернетики. Т. 1 / Под ред. Яблонского С.В. и Лупанова О.Б. М.: Наука. 1974. С. 207-305.

5. Зиновьев В.Г., Мышко В.В., Самойлов Е.Б. Оперативная обработка и анализ многомерной измерительной информации на основе структурно-дескриптивного подхода // Информация и космос. 2008. № 4. С. 120-126.

Для цитирования:

Зиновьев В.Г., ПоповД.В., Азарян М.В. Особенности оперативной обработки и анализа многомерной измерительной информации на основе структурно-дескриптивного подхода // i-methods. 2015. Т. 7. № 2. С. 34-38.

Features real-time processing and analysis of multidimensional measurement information on the basis of structural-descriptive approach

Zinoviev V.G.

Ph.D., associate professor, Military space Academy named after A. F. Mozhaisky

Popov D.V.

Military space Academy named after A. F. Mozhaisky Azaryan M.V.

Military space Academy named after A. F. Mozhaisky

Abstract

Offered on the basis of structural-descriptive approach to carry out rapid processing and analysis of multivariate measurement data. The analysis of the object of observation is carried out along its outline. Description of object contour on a rectangular raster is produced in the form of chains of characters of arbitrary length in the code of Freeman. To determine the similarity of the chains introduces a structural metric (Levenshtein distance). The distance between the chains is determined by the method of discrete dynamic programming. Considered appropriate algorithms for processing and analysis.

Keywords: operational processing; structural and descriptive approach; object recognition; image separation; Levenstein distance.

References

1. Zinoviev V.G. Structural-descriptive method contour processing of optical images // Optical journal, V. 67. 2000. No. 7. Pp. 33-37.

2. Fu K. Structural methods in pattern recognition. M.: Mir. 1977. 320 p.

3. Marr D. Vision: an Informational approach to the study of representation and processing of visual images. M.: Radio and communication. 1987. 400 p.

2. Zhuravlev Y.I., Gurevich I. B. pattern Recognition and image recognition // the Recognition, classification, forecast: Mathematical methods and their application. Vol. 2. Moscow: Nauka. 1989. Pp. 5-72.

3. The Kendall M. Rank correlation. M.: Statistics. 1975. 214 p.

4. Levenshtein V.I., Elements of coding theory // Discrete mathematics and mathematical questions of Cybernetics. T. 1 / Under the editorship of S. V. Yablonskii and O. B. Orthodox course, Moscow: Nauka. 1974. Pp. 207-305.

5. Zinoviev V.G., Myshko V.V., Samoilov E.B. On-line processing and analysis of multidimensional measurement

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

For citation:

Zinoviev V.G. Popov D.V. Azaryan M.V. Features real-time processing and analysis of multidimensional measurement information on the basis of structural-descriptive approach // i-methods. 2015. T. 7. No. 2. Pp. 34-38.

i Надоели баннеры? Вы всегда можете отключить рекламу.