Сегментация изображения руки на видеопоследовательности

Абдугалимова Е.Г.; Степурко К.В.; Фаворская М.Н.

Секция

«ИНФОРМАЦИОННЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ»

УДК 004.93

Е. Г. Абдугалимова, К. В. Степурко Научный руководитель - М. Н. Фаворская Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЯ РУКИ НА ВИДЕОПОСЛЕДОВАТЕЛЬНОСТИ

Рассмотрены алгоритмы поиска областей, соответствующих цвету кожи, морфологической обработки изображения и этапы сегментации: алгоритм погружения и перемаркировка. Также представлен алгоритм исключения «ложных» областей.

Задача обнаружения положения рук в видеопоследовательностях ставится при разработке систем распознавания жестов, дактилем, систем интерактивного взаимодействия и т. д. Обнаружение руки можно разбить на два этапа: поиск областей с распределением цвета, соответствующему цвету кожи человека, и морфологическая обработка изображения с выделенными областями цвета кожи. Для каждого пикселя изображения принимается решение о принадлежности к цвету кожи. Если условие выполняется, то устанавливаем пометку о принадлежности пикселя к цвету кожи, иначе помечаем, что пиксель не относится к цвету кожи. Далее производится проверка на наличие необработанных пикселей. Если таковые имеются, обработка продолжается для них. На выходе алгоритма генерируется маска пикселей цвета кожи на изображении.

На этапе морфологической обработки последовательно применяются операции расширения и сжатия с целью слить воедино «разорванные» области и избавиться от незаполненных отверстий внутри полученных областей. Для обеих операций задается структурный элемент, который называют маской морфологического фильтра. Ненулевые значения в маске определяют, какие из соседних пикселей следует учитывать при осуществлении операции. При расширении бинарного изображения пиксель исходного изображения устанавливается равным 1, если хотя бы один из пикселей окрестности, соответствующий ненулевому элементу маски, равен 1. При сжатии бинарного изображения пиксель исходного изображения сбрасывается на 0, если хотя бы один из пикселей окрестности, соответствующий ненулевому элементу маски, равен 0 [1].

Данные правила применяются нерекурсивно ко всем пикселям изображения. В качестве примитивов в операции расширения используются маски апертурой 3x3 и 5x5, в результате чего создаются области пикселей цвета кожи. Далее применяется операция сжатия для сглаживания внешних краев связных областей. В качестве примитива используются маска апертурой 3x3. Данные операции могут осуществляться последовательно несколько раз для более эффективного слияния в общие области. Для каждого пикселя

изображения строится структурное множество, каждый элемент которого сравнивается с соответствующим пикселем на изображении. Если пиксель окрестности, соответствующий ненулевому элементу маски, принадлежит цвету кожи, пиксель исходного изображения перекрашивается в цвет кожи, иначе продолжается обработка окрестности пикселя исходного изображения, если остались необработанные элементы маски. Далее производится проверка на наличие необработанных пикселей. Если таковые имеются, обработка продолжается для них.

Когда обнаружены области кожи, их необходимо разделить - сегментировать. Сегментация является важным этапом, так как полученная с ее помощью промаркированная картина изображения используется на последующих этапах. При этом также необходимо объединить связные области в единые области. Связность бывает двух типов:

- 4-связность: пиксели считаются соседними, если либо их х-координаты, либо их у-координаты отличаются на единицу;

- 8-связность: пиксели считаются соседними, если их х-координаты и ^-координаты отличаются не более чем на единицу:

Понятие 4-связности является более сильным: любые два 4-связных пикселя являются и 8-связ-ными, но не наоборот.

Для сегментации рук на изображении сначала используется алгоритм «погружения», при этом для маркируемых пикселей создается таблица связей, с помощью которой после прохода алгоритма «погружения» общие области перемаркировываются и сливаются воедино по правилу 4-связности. Алгоритм «погружения» состоит из следующих операций:

Шаг 1. Начинаем с самых «глубоких» (темных) пикселей. Они определяют начальные бассейны - области, в которых поток из всех точек «стекает» к одной общей точке [2];

Шаг 2. Для каждой яркости к:

Для каждой связной компоненты пикселей яркости к:

- Если принадлежит только к одному существующему бассейну, то добавить компоненту к бассейну.

Актуальные проблемы авиации и космонавтики. Информационные технологии

- Если более чем к одному существующему бассейну, то пометить как границу.

- Иначе создать новый бассейн.

Шаг 3. Переходим к следующему пикселю.

Маркировка связных областей осуществляется с учетом окружающих маркеров. В качестве окружающих маркеров используется маркер вышестоящего пикселя и пикселя слева. Если значение пикселя не удовлетворяет заданному порогу, пиксель помечается как граничный. Если вышестоящий пиксель помечен маркером, то для текущего пикселя при сканировании изображения устанавливается аналогичный маркер. Если пиксель слева помечен маркером, текущий пиксель помечается этим маркером. При этом если задан и маркер сверху, то выбирается максимальный маркер из вышестоящего и находящегося слева маркера, и запоминается связь между ними. Если пиксель слева не имеет маркера, то текущий пиксель маркируется следующим маркером. На основании полученных маркеров строится таблица связности маркированных областей и осуществляется связывание этих областей в общую зону с пометкой данной зоны индексом.

Когда изображение будет сегментировано, необходимо исключить «ложные» области. Алгоритм использует найденные сегменты изображения и рассчитывает для них геометрические характеристики. Основными характеристиками, использующимися для определения принадлежности областей к рукам, яв-

ляются площадь области (сумма всех пикселей рассматриваемой области) и ее центр масс Яс (среднее значение координат всех пикселей области). Пусть область руки занимает примерно 0,3-2,5 % от всего изображения. Также предполагается, что человек не будет показывать жест слишком высоко, поэтому Яс области не может находиться ниже 1/3 высоты Н изображения (ось у направлена вниз). Каждый сегмент представляет собой связную область, помеченную одним маркером. Для каждого маркера изображения берется соответствующая ему связная область, для которой вычисляются 5 и Яс. Если полученные характеристики рассматриваемой области удовлетворяют условиям, оставляем область для дальнейшей обработки, иначе исключаем ее из дальнейшего рассмотрения. Далее производится проверка на наличие необработанных маркеров. Если таковые имеются, обработка продолжается для них.

Библиографические ссылки

1. Фаворская М. Н., Зотин А. Г. Методы оценки движения в видеопоследовательностях и их программная реализация : учеб. пособие; Сиб. гос. аэро-космич. ун-т. Красноярск, 2012. 132 с.

2. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М. : Техносфера. 2005. 1072 с.

УДК 004.422

М. С. Алехина Научный руководитель - О. Н. Моргунова Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

РАЗРАБОТКА ИНФОРМАЦИОННОЙ СИСТЕМЫ ДЛЯ ОРГАНИЗАЦИИ РАБОТЫ

СЕРВИСНОГО ЦЕНТРА

Рассматривается проблема учета и отслеживания ставлен функционал проектируемой программы.

В настоящее время уже невозможно представить нашу жизнь без техники. Основное ее назначение -избавление человека от выполнения физически тяжёлой или рутинной, однообразной работы, чтобы предоставить ему больше времени для творческих занятий, облегчить его повседневную жизнь. Но вся техника, бытовые приборы, устройства связи не могут служить вечно, и поломки неизбежны. Зачастую, выгоднее качественно отремонтировать вещь, чем покупать новую. На помощь в починке техники приходят ремонтные фирмы - сервисные центры. Для качественного обслуживания клиентов, необходимо соответствующее программное обеспечение, позволяющее отслеживать все заявки, и осуществлять ремонтные работы вовремя.

Конечно, существуют аналогичные программы, но, к сожалению, их функционал ограничен, настройки недостаточно гибкие. Поэтому было принято решение разработать собственный программный пакет для организации работы сервисных центров.

заявок в сервисных центрах по ремонту техники, пред-

Основная функция проектируемой программы -возможность создания и последующего сопровождения базы данных учета техники, заявок на ремонт, а так же возможность клиентам следить за состоянием их заявки.

В программе должны быть реализованы максимально упрощенный, понятный, но в то же время обладающий необходимой функциональностью интерфейс; разграничение уровней доступа; поиск и сортировка информации по различным критериям; возможность анализа накопленных данных.

На рис. 1-2 представлены предварительные диаграммы прецедентов и классов

Данный программный продукт позволит автоматизировать работу сервисных центров по ремонту техники и средств связи, что приведет к повышению качества обслуживания клиентов и ремонта оборудования.

Сегментация изображения руки на видеопоследовательности Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Абдугалимова Е. Г., Степурко К. В., Фаворская М. Н.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Абдугалимова Е. Г., Степурко К. В., Фаворская М. Н.

Текст научной работы на тему «Сегментация изображения руки на видеопоследовательности»