Контекстное моделирование объектов земной поверхности с целью получения метаданных о содержании изображений

Ковалевская Нелли Михайловна; Боенко Константин Александрович; Ловцкая Ольга Вольфовна; Добрецов Николай Николаевич; Королюк Андрей Юрьевич

Вычислительные технологии

Том 15, № 6, 2010

Контекстное моделирование объектов земной поверхности с целью получения метаданных о содержании изображений*

Н.М. Ковалевская, К. А. Боенко, О. В. Ловцкая Институт водных и экологических проблем СО РАН, Барнаул, Россия e-mail: knm@iwep. asu. ru, bka@iwep. asu.ru, lov@iwep. asu. ru

Н.Н.ДОБРЕЦОВ

Институт геологии и минералогии СО РАН, Новосибирск, Россия

e-mail: dnn@uiggm.nsc.ru

А.Ю.Королюк

Центральный сибирский ботанический сад СО РАН, Новосибирск, Россия

e-mail: akorolyuk@csbg.nsc.ru

Предлагается модель для преодоления различий между классами естественных объектов земной поверхности с точки зрения их пространственно-спектрального представления на новой концептуальной основе. Модель дает новые возможности для выделения значимой структуры визуально-однородных образов, формализации оценок специалистов-экологов и автоматического создания аннотаций для аэрокосмических изображений.

Ключевые слова: поиск по содержанию, метаданные архивов изображений, гибб-совские модели, кусочно-однородные космические изображения.

Введение

Науки об окружающей среде становятся все более междисциплинарными, поскольку проблемы, связанные с пониманием и рациональным использованием экологического потенциала планеты, требуют изучения связей между многими взаимодействующими процессами. Глобальное изучение сложных природных систем все более зависит от поступающей информации, так как для исследований в глобальном масштабе привлекаются буквально терабайты данных. Из-за высокой стоимости спутниковых наблюдений крайне важно, чтобы полученные с орбиты данные анализировались различными специалистами во всевозможных экологических аспектах. Очевидно, что успешный междисциплинарный обмен требует эффективных подходов к формализации информации, созданию метаданных и каталогизации.

С другой стороны, традиционная библиотечная метафора не обеспечивает растущие потребности научного сообщества для совместного использования пространственно-спектральной информации. В частности, метаданные космических снимков опре-

* Исследования проводились в рамках Интеграционного проекта СО РАН № 56 "Сопряженный анализ и моделирование пространственной структуры биотической и абиотической составляющих наземных экосистем (Алтайский экорегион)".

деляются производителями информации, а не специалистами, работающими с этими данными. Очевидно, что назрела необходимость в составлении стандартов геопространственных метаданных с учетом анализа и содержательной составляющей изображений. Это позволит расширить возможности поиска в цифровых каталогах и архивах для специалистов в различных областях исследования окружающей среды.

До сих пор наиболее корректным определением метаданных является определение "данные о данных" [1]. На сегодня термин "метаданные" стал настолько часто применяться в различных описательных контекстах, что сложно дать четкое недвусмысленное понятие о том, что такое метаданные в общем смысле. Более того, поскольку традиционные библиотеки не имеют аналогов, соответствующих термину пространственные метаданные, необходимо связать этот термин с тем уровнем детальности информации, который возможен в современных цифровых коллекциях геопространственных данных и архивах космических снимков. Это особенно важно в отношении объектов на снимках земной поверхности, поскольку один и тот же космический снимок и/или отдельные его участки могут анализироваться с разным уровнем детальности специалистами различных направлений (ландшафтоведения, геоморфологии, почвоведения, геологии и др.). Благодаря возможностям поиска объектов по содержанию в цифровых коллекциях и в архивах изображений нет четкого различия между данными и метаданными. Более того, в зависимости от заданного уровня детальности визуального содержания возможны несколько вариантов такого поиска. Поэтому необходимы исследования общего подхода к созданию метаданных о содержании изображений для различных типов пространственно-спектральной информации (многомерной спектральной, панхроматической, различного разрешения и т.д.). Целью данной работы является анализ возможностей применения различных способов содержательного описания и моделирования изображений и их реализаций для эффективного содержательного поиска информации в каталогах данных дистанционного зондирования Земли,

1. Модели метаданных для каталогов изображений земной поверхности

Метаданные согласно [2] определяются как "информация о том, что делает данные полезными", включая три возможных подмножества:

— информация, необходимая для успешной обработки и использования данных, такая как формат и местоположение;

— информация, которая обобщает или резюмирует данные для выявления характерных содержательных особенностей и, таким образом, поддерживает функции поиска и просмотра;

— информация о качестве или любая другая информация, отсутствующая в содержании,

В цифровой библиотеке изображений первое и третье подмножества в определении метаданных являются контекстно-независимыми. Второе подмножество метаданных полностью зависит от содержания и является определяющим в выборе уровня детальности при содержательных запросах. Именно с этим подмножеством связан вопрос о моделировании пространственно-спектральных данных, в частности, выбор такой модели, которая, с одной стороны, является достаточно общей для различных типов объектов, а с другой — позволяет производить эффективный поиск по визуальному содержанию (образцу).

В определении из [2] подчеркивается, что метаданные не только являются характеристикой объекта, но также должны быть способны адаптироваться к точке зрения пользователя. Оценка "пригодности использования" объекта должна отражать как объект, так и взгляд на него пользователя и может быть уникальной для комбинации "объект — взгляд пользователя",

В частности, простая содержательная модель геопространственных метаданных для изображений может состоять из трех частей:

— структура, определяемая как информация, необходимая для понимания расположения битов и байтов в объекте;

— контекст, который определен в качестве значения в более абстрактных терминах и общих свойствах объекта по отношению к окружающим объектам;

— содержание как конкретные классы объектов земной поверхности.

Например, цифровой космический снимок может быть описан следующим образом:

— структура: формат файла;

— контекст: снимок ленточного бора, Алтайский край, полученный со спутника С^шскВЫ 06.08.2005 в 12.06.15;

— содержание: лесопосадки, лес на песках, лиственный лес, поляны, поляны с единичными деревьями, засоленные участки, травяные болота, кустарниковые болота, водные участки.

Чтобы найти изображение искомого объекта, пользователь, как правило, опирается на структуру снимка и связи с окружающими объектами. Для оценки качества изображения объекта необходимо получить представление о содержании снимка и связи объекта с окружающими объектами, и, наконец, для анализа и использования изображения необходимы структура и содержание.

Важный вопрос по поводу содержания изображения возникает с точки зрения каталогизации снимков в архиве — должно ли содержание включать информацию о классах объектов только в том случае, когда это информация получена с помощью автоматического анализа (и/или моделирования), или содержание должно также включать результаты ручной интерпретации? Это очень важный аспект в создании каталогов и в последующем использовании цифровой космической информации, поскольку возможные интерпретации снимков — автоматические и ручные — зачастую оказываются весьма сложными и неоднозначными.

Большинство тематических архивов и коллекций изображений содержат снимки самого разного разрешения и размерности. Поэтому особенно важно разрабатывать такой подход к созданию метаданных пространственно-спектральной информации, который способен охватывать объекты некоторого общего класса независимо от разрешения и размерности имеющейся визуальной информации, например спектрально- или пространственно-однородные естественные объекты.

С другой стороны, очевидно, что результаты поиска по содержанию в архивах изображений зависят от уровня детальности, установленного моделью контекста данных.

Таким образом, для получения (а в последующем и автоматической генерации) метаданных содержания изображений и эффективного поиска по содержанию необходима такая модель представления контекстуальной информации об объектах окружающей среды, которая способна перенастраиваться и охватывать информацию об объектах с различным уровнем детальности.

2. Реализации систем содержательного поиска 2.1. Семантический поиск

Существует целая серия стандартов метаданных для описания географической информации, которая, несомненно, включает и данные дистанционного зондирования Земли, К ним относятся такие известные стандарты как Дублинское ядро [3], ISO 19115 [4] и разработанный на его основе российский стандарт ГОСТ Р52573 [5] и др. В задачу данной работы не входит подробное описание существующих стандартов, так как авторов интересует только та их составляющая, которая позволяет использовать элементы содержательного описания применительно к данным дистанционного зондирования,

С точки зрения цифровых каталогов и архивов геопространственных данных наборы элементов почти всех стандартов могут быть расширены с помощью включения дополнительных элементов, необходимых для поддержки пространственно-визуального поиска, Одним из таких расширений для Дублинского ядра является структура метаданных географического каталога [6] Александрийской цифровой библиотеки (Alexandria Digital Library, ADL), который содержит более 4 ООО ООО наименований в различных пространственных покрытиях — участки земной поверхности, физиографические признаки, искусственные объекты, земельные участки, гидрографические признаки, административные районы, ADL-каталог является функционально совместимым с цифровыми архивами USGS [7] и NGIA [8].

В частности, тематический список ADL-элементов содержит такие объекты как бесплодные земли, скалы, кратеры, дюны, горные хребты, долины, пустоши, пустыни, леса, окаменелые леса, луга, оазисы, тундры, водно-болотные угодья. Данные добавляются и обновляются по мере появления новой информации, ADL-каталог содержит обширную информацию, в том числе связанную с визуальным представлением объектов земной поверхности, и возможность поиска аэрофотоснимков (рис, 1),

Реализация тематического ADL-поиека осуществляется на уровне задания ключевых слов, описывающих характеристики объектов земной поверхности на английском языке. Это существенно ограничивает возможности поиска по следующим причинам:

— ключевые слова часто задают только тематику документа, а не его содержание;

— использование конкретного естественного языка затрудняет межъязыковой поиск;

— выражения на естественном языке часто неоднозначны;

— для сравнения текста запроса на естественном языке и поискового образа требуются нетривиальные операции, И хотя, в принципе, можно преодолевать вариативность анализа методом проведения эквивалентных трансформаций текста в аннотациях [9], такой метод предполагает решение двух сложнейших задач — создание модулей синтаксического анализа и семантической интерпретации предложений произвольного текста, а также аппарата перефразирования предложений произвольного текста. Эти задачи пока остаются на стадии исследования.

Следует отметить, что перечисленные ограничения являются существенными не только для реализации систем содержательного поиска на базе Дублинского ядра, но присущи всем системам, основанным на семантических описаниях. Иными словами, семантические описания изображений позволяют сравнительно легко создать контекстную модель конкретного изображения, но ограничены в реализации систем поиска и сравнения данных по этим моделям.

Альтернативой поиску по описательным характеристикам объектов, присутствующих в изображении, могут быть системы поиска по визуальному содержанию.

13

1. Collection to search

квяп

Browse the selected collection or all collections, 2. Constraints

If multiple constraints are specified, they should be...

' ANDed togethe ORed together

* Geographic region

Use the map to the right to set the geographic extent of the search., or directly enter bounding coordinates

N

W [v

54

Select items that... are Inside.., §P Overlap.., f Contain...

are Excluded from... the above geographic region,

• Time period

[[Any time period

]jan ^ 11830

to_

] Dec j 31 jd I 2007 __-d Select items that... are Inside... 1 Overlap,., ^ Contain...

a re Excluded fro m... the above time range,

• Object type

I . Aerial photographs

Select items that...

ГШ о Not have the above type Browse the object type thesaurus.

• Object format/media /availability

I Any object format j*]

Select items that...

rln Nnl* Каир thp аЬшрр fnrrn^t .

zi

-

J"

3.75-MIN DIGITAL OQ BiW of PENTLAND, CA

Date: 13.30-12,02

ADL iilentifiei: dot(ii_bw_ca:03511362.SES.344276.

^itfhiij^^.r jfl'vTA^: uown .judut.ii

BROWSE GRAPHIC Download *r L-tt|.n? RelereQi^fo.^ji^LM LiJC". If'U

CATALOG RECORD • Download Mr Sid tile !:■:n UCSB rimaoe/*fnisid1

ACCESS INFORMATION • Download DOOO from UCSB fim¿.geVtiffl

3.75-MIN DIGITAL OQ BiW of PENTLAND. CA

Date: ШШ-02

ADL identifier: doqq_bw_cai03511362.NWS 344275.

HIGHLIGHT IN ТИАР tädätAe Resources

BROWSE GRAPHIC f ir '|11'. Г>1:-: Тй| ЛQ

■ •.'lli'—UGhlbirjf-li', • Download Mr Sid file in:m UCSB Itieq^iff r.jj-

ACCC5S INFORMATiON • DOwrri^ad'D^ÜQ frorrcUC^efimagertiffl

3.75-MIN DIGITAL OQ BiW of PENTLAND, C A

Date: 1338-15-02

ADL identifier: doqq_bw_Ci3:C®1I362.'SWS.344277.

HIGHLIGHT IN MAP Downloadab!e Resources

BROWSE GRAPHIC Download or Offline l^le/ero=:f:-i0 75-lli'. HIATAL OQ BM

CATALOG RECORD • Download Mr.Sid H-* nr.in lirc;- i ln.-n-.':-n r-l

ACCESS ll.-fUHV^LlVjU • Download DOOO from UCSB limaeeVtiffk

3.75-MIN DIGITAL OQ BIW of PENTLAND, CA

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Date: ЩШЩ.

ADL identifier: doqq_bvi_ta:0351196Z;hE.SiS44274.

HIGHLIGHT IN MAP Downloadable Resources

'BfiOWg£::gfl'APHTC Download or Offline Referepije'fqr DIGITAL OQ BW

CATALOG RECORD • I'-^.'^^rf-fe brf^ ib W'aif U'ib^iirr г.п:

ACCESS INFORMATION • Download DOQQ fron. UCSB iinVaridfliffr

3.75-MIN DIGITAL OQ BiW of SANTA CRUZ ISLAND D, C A

Date: 133SP№

ADL identifier: doqt)_bw_ca:03411S60.SES

HIGHLIGHT IN MAP Bownloadalole fiescjarCes

BROWSE GRAPHIC Download of Offline Referen-Oefar 3,7S-MIN DIGITAL OQ BM

CATALOG RECORD • H im* im Mi Sid file from 1 H":=;- liln.-u-.n -n r-l

ACC^aSilNPORMAnoU • Download DOOO from UCSB limaee/tiffr

3.75-MIN DIGITAL OQ BiW of SANTA CRUZ ISLAND C OE N. CA

Date: 1335-03-1.0

ADL identifier: dot(ii_bw_ca:03411353.SWS

^¡¿Hlg^r-i^tafopv Lir.'.'.n oudubli ki-tij-lr^

BROWSE GRAPHIC Download oriOfffjiii Referees.fo^j^MLM LrJC-. I 'VL O^ H."1"1'

CATALOG RECORD • Download Mr Sid tile from UCSB fimaee^-fnisidl

ACCESS INFORMATION • Download DOQQ from UCSB fimaqe/tiffl

Рис. 1. Интерфейс поисковой ADL-еиетемы

Все существующие системы поиска но визуальному содержанию созданы па основе выделения одной из трех груш: визуальных характеристик объектов:

— характеристики формы;

— цветовые характеристики;

— пространственно-спектральные характеристики.

Поскольку поиск объектов земной поверхности но заданным форме и цветовым характеристикам имеет ограниченные возможности, существующие системы содержательного поиска в цифровых библиотеках аэрокосмической информации вынуждены опираться на анализ локальных пространственно-спектральных или многомерных спектральных соотношений в элементах растра изображений.

2.2. Контекстный поиск в цифровой библиотеке АБЬ

Цифровая библиотека АБЬ содержит более 15 000 элементов геонространственной информации, в том число аэрофотоснимков |10|,

Поиск но содержанию визуальной информации основан на сравнении двух визуальных образцов 1шд\ и 1шд2 с помощью заданного (нормализованного) расстояния в некотором выбранном признаковом пространстве:

ШБТЛОЬ(1шд1,1шд2) = ^ ^ ¿1вгтп{1шд1,1шд2),

где

distmn(Imgi,Img2)

(Imgi) _ (Img2) fmn fmn

a(fmn)

(Imgi) _ _(Img2) O mn O mn

a(omn)

fmn и omn — соответственно средние значения и стандартные отклонения

IWmn(x,y)ldxdy, Om

f-^mn^ dxdy

коэффициентов двумерных функций Габора g(x,y) и порождающего вейвлет-преобра-зования

Wmn(x,y) = j Img(xi,yi)gmn • (x _ xi,y _ yi)dxidyi,

a(^) — стандартное отклонение соответствующей характеристики по всей библиотеке.

Дня формализации характеристик проетрапетвешю-одпородпых объектов па снимках используется вектор признаков V = [f00, o00, ..., f35, о35], который состоит из 72 элементов 1111,

Таким образом, в основе моделирования визуальной информации дня ADL-ноиска но содержанию используются предположение об обязательном наличии образца, который, в свою очередь, может быть найден только но стандартному набору метаданных, включая семантические описания; предположение о локальной нрострапствеппо-сиектралыюй однородности искомых объектов дня поиска; традиционное статистическое решающее правило, в основе которого .нежит предположение о гауссовском распределении векторов-признаков изображений в имеющейся цифровой библиотеке.

2.3. Контекстный поиск в системе CANDID

Поисковая система CAXDID |12| ориентирована на запросы в цифровых архивах, содержащих многоеиектральные снимки Landsat (рис, 2),

В основе CAXDID-моделировапия визуальной информации .нежит предположение о том, что объекты земной поверхности на снимках адекватно описываются моделью

Рис. 2. Результаты поиска по архиву, содержащему 100 снимков Landsat размером 512 х 512: первый снимок запросный, остальные представлены системой как первые результаты поиска с расстояниями равными (слева направо) 0.89, 0.84, 0.83, 0.81, 0.80, 0.76

кусочно-постоянного изображения, искаженного аддитивным независимым гауссовским шумом, В этом случае вероятность многоспектрального снимка 1тд, содержащего X объектов земной поверхности, может быть представлена с помощью гауссовской взвеси:

к

Pi

Img

(с) « J~2wíGí(c),

i=1

Gi(c) = (2тг )■

к ' 2

£

exP [-^(c- ¡a)

(c- Vi)],

где с = (со^гьапЛи • • •) со1огьап(1м) — вектор в Л'-мориом спектральном пространстве, вычисляются с помощью алгоритма кластерного анализа К-средпих,

г

Поиск осуществляется па основе сравнения пар визуальных образцов 1шд\ и 1шд2 с помощью двух типов расстояний, которые в качестве характеристики целого изображения используют его вероятность, соответствующую К изображенным объектам:

DISTfANDID(Imgi,Img2)

(Plmgi(C) - Plmg2(c))2dc

DIST^ANDID(Imgi,Img2) =-I P^Ac)Pim92(c)dc

[I PL91(c)dcJ PLJ-сЩ

Таким образом, ('Л.\1)Н)-понск охватывает следующие факторы:

— требует наличия образца, который, в свою очередь, может быть найден только по стандартному набору метаданных;

— не учитывает локальную пространственную зависимость элементов растра для однородных участков;

— использует многомерный статистический анализ для векторов со спектральными компонентами в элементах растра;

— ориентирован на архивы многоспектральных космических снимков среднего и низкого разрешения (30 м и ниже).

2.4. Контекстный поиск в системе SIMPLIcity

Цифровая библиотека поисковой системы SIMPLIcity [13] содержит более 50 000 многоспектральных и панхроматических изображений объектов, снятых из космоса,

SIMPLIcity-поиек изображений, наиболее сходных по визуальному содержанию с заданным образцом, сводится к поиску карт участков (результатов сегментаций), наиболее сходных с картой участков заданного изображения (рис, 3, 4), В основе получения карт участков лежит алгоритм кластеризации K-средних по векторному пространству V, состоящему из шести векторных компонент [13]

V = (Col1, Col2, Col3, fHL, fLH, fHH),

1 16 1 16 1 16

Col1 = — V colorj, Col2 = — V color2, Col3 = — colorf, 16^ 16^ 16^

i=1 i=1 i=1

1НЬ ~ ( 4 ) ' /1'Я - ( 4 ) '

V г=0 j=0 / \ г=0 j=0 /

/ЯЯ = ( 4 ) '

V г=0 j=0 /

где со/ог1, со/ог2, со1ог3 — значения цветовых компонент в окрестности элемента растра 4 х 4, с^, сН^ г, с^ г+1 _ коэффициенты вейвлет-преобразования в НЬ-канале

(аналогично в ЬНУ- и НН-каналах).

В 81МРЫе^у-моделировании визуальной информации дня поиска но содержанию используется предположение о локальной ироетранетвешю-еиектральпой однородности искомых объектов дня поиска. Но поскольку вычислительные ресурсы системы ограничены установлением зависимости в весьма малой окрестности элементов растра — 4х4

содержащих спектральные снимки среднего разрешения, чем дня архивов панхроматической информации высокого разрешения (рис, 5),

Таким образом, БИИРЫе^у-иоиек характеризуется следующими факторами:

— требует наличия образца, который, в свою очередь, может быть найден только но стандартному набору метаданных;

— учитывает локальную пространственную зависимость элементов растра дня однородных участков;

— использует промежуточный результат кластеризации изображения дня проверки предположения о локальной ирострапствеппо-сиектраньной однородности искомых объектов дня поиска;

Рис. 3. Результат сегментации занрашиваемшх) изображения на участки

а б в г д

Рис. 4. Первые четыре результата 31МР1ЛсНу-поиека но архиву космических снимков в соответствии с увеличением расстояния до занрашиваемшх) образца: а запрашиваемый образец; Мег = 1.28 (б), 1.38 (в), 1.72 (г), 1.89 (д)

Рис. 5. Результаты 31МР1ЛсНу-поиека изображений: верхний ряд в библиотеке спектральных снимков среднего разрешения, нижний ряд в библиотеке панхроматических снимков высокого разрешения

— эффективен при работе с архивами многоепектральпых космических снимков среднего и низкого разрешения (30 м и ниже).

3. Модель пространственно-однородных объектов для получения метаданных о содержании изображений

Описанные выше системы поиска аэрокосмических изображений но содержанию обладают рядом общих ограничений, к которым относятся:

— требование к наличию образца изображения дня поиска;

— моделирование контекстуальной информации на разных концептуальных основах;

— использование формально несовместимых уровней представления и детальности контекстной информации об объектах;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

— отсутствие возможности поддерживать функциональную совместимость с другими архивами путем установления семантических связей.

В свою очередь, эффективные дня описания естественных объектов земной поверхности гиббсовско-марковские модели кусочно-постоянных объектов земной поверхности были представлены в работах |14, 151:

Р(1тд) = 2-1 * ехр ^ У(!тдтп = стп : (т, п) е г, стп е О), (1)

гСЯ

где Р(1тд) — совместное распределение марковского случайного поля снимка 1тд; У(...), г С Я — потенциалы гиббсовского распределения на заданных парах соседних элементов г; {1тдтп, (т, п) е г} — переменные гиббсовского случайного поля, поддерживающие пару г] О = {0,1,...,^тах} _ множество разных значений сигналов в элементах растра; 2 — нормирующая постоянная по пространству всех возможных состояний Б\

2 = ^ ехр ^ Уг(1тдтп = стп : (т, п) е г). (2)

ТтдеЯ тСЯ

Эти модели являются весьма гибкими и позволяют "захватывать" существенную часть визуальной информации об объектах земной поверхности независимо от пространственного разрешения снимков, В частности, при увеличении разрешающей способности съемочной аппаратуры можно менять набор параметров, "захватывающих" визуальные признаки однородности в некоторой заданной окрестности.

Основными параметрами модели (1), (2) дня получения метаданных о содержании визуального образца являются следующие:

— заданный размер окрестности (окна) дня поиска нар соседних элементов;

— структура элементов в окрестности, представляющих основное визуальное содержание образца;

— значимость каждого элемента в структуре, представляющей визуальное содержание.

Эксперименты но получению визуального содержания проводились с двумя наборами модельных образцов из |16|:

• первый — несхожие образцы (рис, 6): допускается мгновенное (за время, не превышающее 200 мс) разделение образцов;

Визуальный образец, №а[13]

Значимая структура а окне поиска 9®9

Значимая структура в окне поиска рЙг®

Рис. 6. Визуально несхожие образцы и соответствующие значимые структуры

• второй — схожие образцы (рис, 7): возможно разделение образцов только после их тщательного сравнения.

На рис, 7 представлены наборы образцов второго тина в соответствии с экспертной классификацией в |17|, На рис, 6, 7 также показаны значимые структуры дня различных размеров окрестностей так, что значимость каждого элемента структуры обозначена уровнем серого цвета — чем темнее цвет элемента структуры, тем выше его значимость дня представления визуального содержания. Из результатов экспериментов очевидно, что значимые структуры образцов объектов одного класса весьма схожи (класс 1, см, рис, 7) или практически совпадают, если образцы класса схожи но более чем одному критерию визуального сходства. Если образцы внутри класса визуально схожи только но одному критерию (класс 3, см, рис, 7), значимые элементы образцов показывают отличия в расположении окна поиска.

1, 029

2, Щ

класс 2: DS4

класс 3. D107

класс 3, РЭД

Классы ШШШ визуальных образцов (№ класса, № в [13])

Значимая структура в окне поиска 9р?9

Значимая структура в окне поиска Щ

Рис. 7. Визуально схожие образцы и соответствующие значимые структуры

Образцы объекта «хвойный лес»

Зона спектра (мкм)

0.76-0.90

0.445-0.90

Структуры, значимые для визуального содержания

Спутник

Landsat

1копоэ

ОшскВис!

Разрешение (м)

Рис. 8. Образцы объекта "хвойный .лес1', полученные с разных спутников, и соответствующие значимые структуры

Образцы естественных объектов

Значимые структуры в окне поиска 13x13

Образцы естественных объектов

Значимые структуры в окне поиска 13x13

Посадки леса

Болото

Редкий лес с песком

Лиственный лес

Рис. 9. Значимые структуры для образцов естественных объектов, полученных со снимка С^дс-кВи-с!

Установлено, что свойство модели (1), (2) захватывать визуальную информацию в случае, если образцы одного класса сходны более чем по одному критерию, достаточно для того, чтобы эффективно сравнивать естественные природные объекты одного класса, полученные с различным разрешением спутниковой аппаратуры (рис, 8), и разных классов при одном и том же разрешении (рис, 9),

Важным результатом проведенного анализа оказался и тот факт, что пространственное расположение и количественный состав элементов растра, значимых для визуального представления однородного объекта, остаются постоянными даже при больших изменениях уровня детальности снимка.

Таким образом, описанные значимые легко формализуемые структуры являются достаточно надежными элементами содержательного представления объектов земной поверхности, присутствующих как в отдельно взятом изображении, так и в серии снимков разного пространственного разрешения, С их помощью возможно создание модели метаопиеаний изображений, и результаты такого моделирования могут служить основой для развития нового подхода к сбору, накоплению и использованию космической информации и баз данных космических изображений, основанного на концепции визуальной однородности естественных объектов земной поверхности.

Список литературы

fl] CNI White Paper on Networked Information Discovery and Retrieval, http: / / www.cni.org/projects / nidr /

[2] Bretherton F. Metadata from the Perspective of an Environmental Scientist. NSF Invitational Workshop on Distributed Information, Computation, and Process Management for Scientific and Engineering Environments (DICPM), May 15-16, 1998. Hyatt Dulles, Herndon, Virginia. http://deslab.mit.edu/DesignLab/dicpm/position.html

[3] The Dublin Core Metadata Initiative, http://dublincore.org/

[4] ISO Geographic Information: Metadata.

http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=26020

[5] ГОСТ P 52573-2006. Географическая информация. Метаданные, http: / / protect .gost .ru / document .aspx?control=7<fcid=128907

[61 Collection metadata for ADL gazetteer.

http://collections.alexandria.ucsb.edu/adl_gazetteer/metadata.html

[7] U.S. Geological Survey, http://www.usgs.gov/

[8] National Geospatial-Intelligence Agency, http://www.nga.mil/

[9] Emeljanov G.V., Krechetova T.V., Kurashova E.P. Tree grammars in the problems of searching for images by their verbal descriptions // Patt. Recognit. and Image Analysis. 2000. Vol. 10, No. 4. P. 520-526.

[10] Alexandria Digital Library, http://clients.alexandria.ucsb.edu/webclient/index.jsp

[11] Manjunath B.S., Ma W.Y. Texture features for browsing and retrieval of image data // IEEE Trans, on Patt. Analysis and Machine Intelligence (PAMI — Special Issue on Digital Libraries). 1996. Vol. 18, No. 8. P. 837-842.

[12] Kelly P.M., Cannon T.M. Efficiency issues related to probability density function comparison // Proc. IS&T/SPIE Svmp. on Electronic Imaging. 1996. Vol. 2670. P. 42-49.

[131 Wang James Z., Li Jia, Wiederhold Gio. SIMPLIcitv: Semantics-sensitive integrated matching for picture libraries // IEEE Trans, on Patt. Analysis and Machine Intelligence. 2001. Vol. 23, No. 9. P. 947-963.

[14] Kovalevskaya N. Gibbs model of image as a tools for thematic analysis // Patt. Recognit. and Image Analysis. 1999. Vol. 9, No. 2. P. 282-285.

[15] Gimel'farb G. Image Textures and Gibbs Random Fields. Dordrecht: Kluwer Acad. Publ., 1999. 250 p.

[16] Brodatz Texture: A Photographic Album for Artists, and Designers. N.Y.: Dover, 1966.

[17] Ma W., Manjunath B. Texture FEATURES AND LEARNING SIMILARitv // Proc. IEEE Internat. Conf. on Comput. Vision and Patt. Recognit. San Francisco, 1996. P. 425-430.

Поступила в редакцию 4 декабря 2008 г., с доработки — 25 февраля 2010 г.

Content modeling Earth regions for automated generation of satellite image metadata

Текст научной работы на тему «Контекстное моделирование объектов земной поверхности с целью получения метаданных о содержании изображений»