УДК 004.932.2
СИСТЕМА ТЕХНИЧЕСКОГО ЗРЕНИЯ ДЛЯ ОБНАРУЖЕНИЯ ДВИЖЕНИЯ В ВИДЕОПОТОКЕ
М.Н. Гречишкин
Исследованы вопросы создания системы технического зрения для обнаружения движения в видеопотоке. В основе метода распознавания движения лежит анализ последовательности изображений на предмет различий между ними. Предложен метод анализа получаемого изображения на предмет зашумленности для настройки чувствительности системы к нему.
Ключевые слова: система технического зрения, обнаружение движения, цифровой шум, изображение, сигнал.
Разрабатываемая система технического зрения, работающая в режиме реального времени, будет основываться на том, что:
устройство получения информации (камера) покадрово выдает двумерный массив (матрицу), состоящую из кодов выбранной цветовой схемы Р [х, у], где Р - код цвета элемента, находящегося на х строке, у столбца.
если камера физически закреплена неподвижно, можно утверждать, что она выдает полностью повторяющиеся изображения, при нахождении рабочей сцены без движения (Pt = Р2).
Таким образом, по величине изменений последующего кадра относительно предыдущего можно обнаруживать движение на рабочей сцене. Стоит заметить, что обработка каждого пикселя состоит из получения информации о его цвете. Значение цвета зашифровано в числе, которое несет в себе три компоненты цвета, при использовании модели RGB это красный (Red, R), зеленый (Green, G), синий (Blue, В). Система должна получить каждую из этих компонент, для дальнейшей работы с ней.
Если при сравнении изображений окажется, что некоторое количество пикселей имеют разные значения цвета ^ Р2), то система должна посчитать, что было обнаружено движение. При этом, изменяя порог срабатывания по количественному признаку, можно производить настройку чувствительности системы к размерам движущегося объекта, поскольку, чем крупнее объект, тем большее количество пикселей поменяет цвет при его движении в кадре.
Все цифровые камеры подвержены влиянию шума. Цифровой шум - маска, наложенная на изображение, состоящая из случайного количества случайно распределенных пикселей разной яркости.
Для исключения ложных срабатываний, обусловленных реагированием системы на шум, следует ввести допустимую погрешность при сравнении. Таким образом, программа будет принимать соответствующие пиксели одинаковыми, даже если между их значениями RGB будут незначительные отличия.
Появление шума может негативно воздействовать на синтезируемую систему технического зрения. Для повышения уровня доверия к ней следует позаботиться о снижении уровня воздействия шума на программу. Для этих целей в первую очередь следует оценить уровень возникающего шума, после чего уже можно изменять параметры чувствительности к нему.
На отношение сигнала к шуму влияют такие явления, как шумы аналоговой электроники цифровой камеры, например «обвязка», АЦП, усилители. Главным источником цифрового шума можно назвать светочувствительную матрицу и ее несовершенство. Следовательно, появление шума в разных камерах будет разным, так как невозможно создать два абсолютно идентичных девайса. Поэтому перед началом работы системы технического зрения следует настроить ее для работы с выбранным оборудованием.
Для упрощения дальнейших исследований будем считать, что случайные искажения изображения являются аддитивным белым гауссовым шумом.
Обозначим отдельный пиксель изображения, формируемого камерой, как Р(х,у,к), где х, у - координаты пикселя в матрице значений по горизонтальной и вертикальной осям; к - порядковый номер исследуемого кадра.
С учётом приведённых выше допущений сигнал Р (х, у, к) можно представить суммой из двух компонент: Я1(х, у, к) - полезный сигнал, который несет «чистое» изображение; е(х, у, к) - шум. Таким образом, получаемый сигнал состоит из полезного сигнала и добавленного к нему шума:
Р(х,у,к) = Р1(х, у, к) + е(х, у, к).
Компонента е является случайно распределенной случайной величиной, значит можно проанализировать ее с точки зрения математики и теории вероятности. Для анализа этой компоненты можно рассчитать математическое ожидание М\е\ и дисперсию D.
Учитывая, что последовательность анализируемых изображений формируется через равные промежутки времени, величину е(х, у, к) можно считать дискретной.
Математическое ожидание дискретной случайной величины есть сумма произведений ее возможных значений на вероятности их появления. Рассчитать математическое ожидание возможно с помощью таблицы распределения, в которой показаны значений случайных величин и вероятность их появления.
Математическое ожидание случайной величины может быть оценено следующим образом:
п
м = ^ Рк*к-к=о 67
При проведении эксперимента вероятность появления неизвестна и может быть оценена по частоте появления этой величины, то есть по количеству появлений, отнесённому к общему числу кадров (таблица).
Таблица распределения
Параметры оценки вероятности появления Значения оценки вероятности появления
Значение случайной величины X хк
Вероятность появления р Pi Р2 Vk
хк - случайная величина; рк - вероятность появления этой случайной величины.
Аналогичным образом может быть оценена дисперсия этой случайной величины, характеризующая разброс значений случайной величины относительно математического ожидания. Квадратный корень из дисперсии, который равен о, называется среднеквадратичным отклонением, стандартным разбросом или стандартным отклонением. Данное стандартное отклонение измеряется в тех же единицах, что и случайная величина, а дисперсия измеряется в квадратах данной единицы измерения.
Неравенство Чебышёва утверждает, что вероятность того, что случайная величина отклоняется от своего математического ожидания больше чем на к стандартных отклонений, составляет меньше, чем 1 /к2. Минимум в 95 % из всех случаев случайная величина, имеющая нормальное распределение, отклонена от её среднего значения не более чем на два стандартных отклонения, примерно в 99,7 % случаев она отклонена не более чем на три стандартных отклонения.
При этом, чем больше значение дисперсии, тем сильнее отклоняются случайные величины от их среднего значения. Это продемонстрировано на рисунке.
Дисперсию можно рассчитать по формуле
D(x) = М(х2) - М2(х) = М[(х - М[х])2], где D(x) - дисперсия; М(х2) - математическое ожидание квадрата случайной величины; М2(х) - квадрат математического ожидания случайной величины.
Квадратный корень из дисперсии - это среднеквадратичное отклонение, оно рассчитывается по формуле
68
где о - среднеквадратичное отклонение; D(x) - дисперсия.
Дх; j
s— ol ■■St .ijer'
J \ Ш "V
-
ol<o2 Л
Влияние величины а на вид гистограммы
Проведя серию экспериментов, можно узнать характер шума. Если математическое ожидание приближается к нулю, то количество отклонений в положительную и отрицательную сторону примерно равно. Зная значение среднеквадратичного отклонения, можно использовать Правило трёх сигм, согласно которому большая часть значений нормально распределённой случайной величины лежат в интервале {Р — За; Р + Зсг). Исходя из этих суждений, можно произвести настройку системы технического зрения на предмет чувствительности к шуму. Можно сделать вывод, что следует настроить систему так, чтобы она не реагировала на различия в цвете двух соответствующих пикселей, если их разница не составляет более чем три среднеквадратичных отклонения, что позволит значительно увеличить надежность и достоверность системы.
Список литературы
1. Вентцель Е.С., Овчаров JI.A. Теория вероятностей и ее инженерные приложения: учеб. пособие для втузов / 4-е изд.,стер. М.: Высш. шк., 2007. 491 с.
2. Гонсалес Р., Вудс Р., Эддинс С. Цифровая обработка изображений в среде MATLAB. М.: Техносфера 2006. 616 с.
3. Форсайт Д., Понс Ж. Компьютерное зрение. Современный подход. М.: Вильяме 2004. 928 с.
Гречишкин Максим Николаевич, студент, makson 7 lrys(a),yandex. ги, Россия, Тула, Тульский государственный университет
VISION SYSTEM FOR DETECTION MOVEMENT IN THE VIDEO STREAM
M.N. Grechishkin. 69
The problems of creating a vision system for detecting movement in the video stream. The method of motion detection is the analysis of image sequences for differences between them. A method of analysis of the image for noise sensitivity of the system to adjust to it.
Key words: machine vision, motion detection, digital noise, the image, the signal.
Grechishkin Maxim Nikolayevich, student, makson 71rys@yandex. ru, Russia, Tula, Tula State University
УДК 004.932.2
МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЯ ЯРКОСТЕЙ В ВИДЕОПОТОКЕ СЕРИИ ЛАНДШАФТНЫХ ИЗОБРАЖЕНИЙ
Б.В. Костров, Н.Н. Гринченко, К.И. Баюков
Рассматривается возможность создания модели данных видеопотока, формируемого в процессе съемки поверхности Земли с типичным ландшафтным сюжетом. Адекватность модели определяется на основе воссоздания изображения путем замены яркостей пикселей исходного на яркости, сгенерированные по нормальному распределению и распределению Коши с параметрами, определенными на основе распределений яркостей пикселей серии изображений.
Ключевые слова: передача изображений, восстановление изображений, стандартные распределения.
В настоящее время проблема передачи изображений от различных видеодатчиков, устанавливаемых на космических и атмосферных летательных аппаратах, требует совершенствования существующих и разработки новых методов кодирования данных в высокоскоростных каналах передачи информации [1]. Выбор наилучшего варианта невозможен без разработки средств моделирования элементов канала, при этом использование простейших методов формирования случайных потоков данных не соответствует специфике распределения значений яркостей в передаваемых изображениях [2].
Целью работы является поиск наилучшего варианта аппроксимации распределения значений яркости пикселей изображения значениями, полученными на основе применения нормального распределения, распределения Коши и распределения Рэлея относительно набора яркостей пикселей серии изображений.