Автоматическое аннотирование ландшафтных изображений по их содержанию

Проскурин А.В.; Белоконь А.В.; Фаворская М.Н.

Актуальные проблемы авиации и космонавтики. Информационные технологии

ботки дистанционных обучающих систем, которые дают возможность удаленно использовать различные электронные ресурсы, а также совместно решать учебные задачи.

На кафедре программных систем СГАУ коллективом студентов разрабатывается дистанционная виртуальная обучающая система (ВОС), которая использует технологию виртуальной реальности. Данная система позволяет обучаемым в игровой форме осваивать учебные курсы. Погружение в виртуальную реальность и возможность соприкоснуться с областью необходимых ему знаний, взаимодействуя с объектами искусственно созданного информационного мира, должны способствовать, по мнению разработчиков, вовлечению учащихся в активный процесс обучения, а также устойчивому отложению в памяти только что изученных фактов.

Пользователь взаимодействует с 3Б-объекты виртуального мира через аватара - трехмерного персонажа, который является своеобразным проводником, гидом в виртуальной реальности, а быть может, даже будет сопоставляться исследователем с самим собой. Для повышения уровня интереса к ВОС и увеличения возможностей обучаемого, необходимо обеспечить ему взаимодействие с другими пользователя системы, поэтому перед авторами была поставлена задача -разработать подсистему сетевого взаимодействия.

Данная подсистема позволит обучаемым оказывать помощь друг другу, если при изучении учебного материала возникли затруднения, обмениваться предметами или просто обсуждать только что пройденный материал. Сетевое взаимодействие позволит включать в процесс обучения задачи, требующие совместного (командного) решения, в этом случае обмен оперативной информацией поможет сократить время решения и повысит эффективность обучения. Такой подход реализован во многих опНпе-играх, где человек видит других игроков, их успехи или поражения, общается с ними и тем самым мотивируется на дальнейшие успехи и достижения.

Введение в ВОС подсистемы сетевого взаимодействия решит ряд проблем: повысит общий интерес учащихся ко всей системе за счет возможности общения, мотивирирует ученика на активное усвоение учебного материала, поможет с освоением самой системы.

Подсистема сетевого взаимодействия разрабатывается на языке С# с применением технологий ASP.NET и сетевого АР1-движка иш1у3Б, она будет интегрирована в общее информационное пространство виртуальной обучающей системы.

УДК 004.652

А. В. Проскурин, А. В. Белоконь Научный руководитель - М. Н. Фаворская Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

АВТОМАТИЧЕСКОЕ АННОТИРОВАНИЕ ЛАНДШАФТНЫХ ИЗОБРАЖЕНИЙ ПО ИХ СОДЕРЖАНИЮ

Рассмотрен метод автоматического аннотирования ландшафтных изображений на основе модели машинного перевода.

За последние годы объем мультимедиа данных возрос в несколько раз. Однако вся эта информация была бы бесполезна без точного, удобного и быстрого поиска по ней. Все существующие методы поиска графической информации можно разделить на два направления: поиск по содержанию (content-based image retrieval - CBIR) и поиск по текстовым аннотациям (description based image retrieval - DBIR). Поиск в CBIR-системах производится на основе анализа и сравнения низкоуровневых характеристик изображения (цвет, текстура и др.), позволяя получать неплохие результаты. Однако у таких систем есть два недостатка. Типичным видом запроса является изображение-образец, что менее удобно для пользователя, чем текстовый запрос. Другим существенным недостатком является проблема семантического разрыва -отсутствия связи между семантикой изображения и его низкоуровневыми характеристиками. Использование текстового запроса позволяет решить проблему запроса-образца и уменьшить семантический разрыв.

В связи с этим становится актуальной задача автоматического аннотирования изображений, используя их низкоуровневые характеристики. В докладе рассматривается задача автоматического аннотирования ландшафтных изображений на основе текстурных признаков.

Существует несколько подходов к автоматическому аннотированию изображений. Все их условно можно разделить на три класса [1]: статистические подходы, классификационные подходы, подходы, связанные с векторным пространством. Основная идея статистических подходов заключается в оценке вероятности связанности изображения с запросом пользователя. После этого изображения ранжируются в соответствии с их вероятностями. Классификационные подходы рассматривают процесс присоединения слов к изображениям как классификацию изображений на ряд предопределенных групп, каждая из которых характеризуется понятием или словом. Подходы, связанные с векторным пространством, как правило,

Секция «Информационнее системы и технологии»

представляют изображение в виде векторов, каждый из которых содержит вхождение слов. В рамках задачи аннотирования ландшафтных изображений оптимальным является статистический подход, включающий в себя модель машинного перевода [2].

В данной модели процесс распознавания рассматривается как аналог машинного перевода. При аннотировании изображения разделяются на регионы, после чего для каждого полученного региона извлекаются признаки. На завершающем этапе процесса аннотирования осуществляется машинный перевод (для этого заранее создается «лексикон» - таблица перевода, содержащая оценки вероятности перевода между регионом изображения и словом). В данной модели ключевыми моментами являются сегментация изображения и признаки регионов. Для получения лучшего результата необходимо подобрать метод сегментации, оптимальный для разделения ландшафтных изображений, а также признаки, наиболее точно описывающие естественные изображения.

Сегментация ландшафтных изображений является сложной проблемой из-за наличия текстур. Если изображение содержит только однородные цветные области, пороговые методы сегментации (например, кластеризация цветного пространства) достаточны для решения проблемы. В действительности, естественные сцены насыщены цветом и текстурой. Из-за того, что различные текстуры зачастую не имеют четких границ, подходы, основанные на выделении границ, также не дают удовлетворительного результата. Однако в этом случае хорошую сегментацию можно получить наращиванием областей. Одним из вариантов метода слияния/расщепления является алгоритм ^ЕО, показывающий хорошие результаты сегментации естественных изображений [3].

После сегментирования изображения необходимо описать полученные регионы. В случае ландшафтных изображений, когда большую часть изображения занимают естественные текстуры, оптимальными для их описания являются статистический и фрактальный подходы. Статистический подход основан на вычислении порядковых статистических признаков изображения. Существует более 20 статистических признаков, однако наиболее информативными являются пять [4]: момент обратной разности, корреляция, энтропия, информационная мера корреляции и однородность. Фрактальный подход основан на том, что большинство естественных поверхностей являются пространственно изотропными фракталами. В связи с этим, тек-

стура представляется фракталом и для ее описания используются характеристики фракталов: фрактальная размерность и лакунарность.

В результате проведенного исследования было разработано программное приложение, позволяющее автоматически аннотировать ландшафтные изображения. В данном приложении на начальном этапе аннотирования создается уменьшенная копия загруженного изображения, после чего она сегментируется методом JSEG. Предварительное уменьшение изображения производится с целью исключения выделения мелких регионов и их последующего отдельного анализа. После создания карты уменьшенной копии изображения, границы регионов переносятся на оригинальное изображение, и для каждого полученного региона вычисляется вектор текстурных признаков, состоящий из 7 вышеописанных статистических и фрактальных признаков. На завершающем этапе аннотирования происходит перевод векторов признаков в слова, используя таблицу перевода. Даная таблица заполняется заранее на основе эталонных изображений путем выделения региона и присваивания ему тега.

В ходе тестирования приложения было выявлено, что точность описания изображений находится в диапазоне от 84 % до 88 %, что демонстрирует целесообразность использования данного метода.

Библиографические ссылки

1. Tang J. Automatic Image Annotation and Object Detection: PhD Thesis, University of Southampton, ECS, United Kingdom, May 2008. 135 p.

2. Duygulu P., Barnard K., Freitas N., Forsyth D. Object recognition as ma-chine translation: Learning a lexicon for a fixed image vocabulary // In The Seventh European Conference on Computer Vision, Copenhagen, Denmark, 2002. P. 97-112.

3. Deng Y., Manjunath B.S. Unsupervised Segmentation of Color-Texture Re-gions in Images and Video // IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 23.№ 8. 2001. P 800-810.

4. Проскурин А. В., Белоконь А. В. Оценка эффективности статистических признаков текстур первого и второго порядков при анализе ландшафтных текстур // Решетневские чтения : материалы XVI Междунар. науч. конф. : в 2 ч. Ч. 2. Красноярск, 2012. С. 593-594.

УДК 004.056

Р. С. Савицкий Научный руководитель - В. В. Вдовенко Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

РАЗРАБОТКА БИБЛИОТЕКИ КЛАССОВ ДЛЯ ПРИЕМА GPS-КООРДИНАТ C ПОМОЩЬЮ ТЕХНОЛОГИИ SMS

Приводится описание технологии SMS, формулируется возможность применения в целях безопасности и рассматривается разработанная библиотека классов.

Автоматическое аннотирование ландшафтных изображений по их содержанию Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Проскурин А.В., Белоконь А.В., Фаворская М.Н.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Проскурин А.В., Белоконь А.В., Фаворская М.Н.

Текст научной работы на тему «Автоматическое аннотирование ландшафтных изображений по их содержанию»