Научная статья на тему 'Комбинированная аналогия при поиске картографических материалов'

Комбинированная аналогия при поиске картографических материалов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
186
51
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГЕОИНФОРМАЦИОННЫЕ СИСТЕМЫ / ЦИФРОВЫЕ КАРТЫ / КОМПЬЮТЕРНЫЕ СЕТИ / GGEOGRAPHIC INFORMATION SYSTEM / DIGITAL MAPS / COMPUTER NETWORK

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Беляков Станислав Леонидович, Розенберг Игорь Наумович

Рассматривается задача поиска картографических материалов в интеллектуальных геоинформационных системах, использующих механизм аналогии. Предлагается использовать комбинированную аналогию как способ представления знаний о поиске. Приводится алгоритм нахождения контекстов комбинированной аналогии.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Беляков Станислав Леонидович, Розенберг Игорь Наумович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMBINED ANALOGY WHEN LOOKING FOR CARTOGRAPHIC MATERIALS

In work the problem of search of maps and sharts in the intellectual geoinformation systems using the mechanism of analogy is considered. It is offered to use the combined analogy as a way of representation of knowledge of search. The algorithm of a finding of contexts of the combined analogy is resulted.

Текст научной работы на тему «Комбинированная аналогия при поиске картографических материалов»

9. Erten C., Harding P.J., Kobourov S.G., Wampler K., Yee G. Exploring the computing literature using temporal graph. http://tgrip.cs. arizona.edu.

10. Dittmann F., Bobda C. Temporal graph placement on mesh-based coarse grain reconfigurable systems using the spectral method // From Specification to Embedded Systems Application, vol.184, Springer, 2Oo5. - P. 3O1-31O.

Берштейн Леонид Самойлович

Технологический институт федерального государственного образовательного учреждения высшего профессионального образования «Южный федеральный » .

E-mail: [email protected].

347928, Таганрог, пер. Некрасовский, 44.

.: 88634371695.

Боженюк Александр Витальевич

E-mail: [email protected].

Bershtein Leonid Samoilovich

Taganrog Institute of Technology - Federal State-Owned Educational Establishment of Higher Vocational Education «Southern Federal University».

E-mail: [email protected].

44, Nekrasovskiy, Taganrog, 347928, Russia.

Phone: +78634371695.

Bozhenyuk Alexander Vitalievich

E-mail: [email protected].

УДК 681.3.06

C.JI. Беляков, ИЛ. Розенберг

КОМБИНИРОВАННАЯ АНАЛОГИЯ ПРИ ПОИСКЕ КАРТОГРАФИЧЕСКИХ МАТЕРИАЛОВ

Рассматривается задача поиска картографических материалов в интеллектуальных геоинформационных системах, использующих механизм аналогии. Предлагается использовать комбинированную аналогию как способ представления знаний о поиске. Приводится алгоритм нахождения контекстов комбинированной аналогии.

Геоинформационные системы; цифровые карты; компьютерные сети.

S.L. Belyakov, I.N. Rozenber

COMBINED ANALOGY WHEN LOOKING FOR CARTOGRAPHIC

MATERIALS

In work the problem of search of maps and sharts in the intellectual geoinformation systems using the mechanism of analogy is considered. It is offered to use the combined analogy as a way of representation of knowledge of search. The algorithm of a finding of contexts of the combined analogy is resulted.

Ggeographic information system; digital maps; computer network.

Решение прикладных задач с помощью интеллектуальной геоинформацион-ной системы предполагает использование процедуры картографического анализа. Одним из начальных его этапов является поиск и отбор необходимых картографи. -точников, размещённых в сети Интернет. Использование средств поиска по ключевым словам либо каталогам поисковых серверов имеет определённые недостат-

ки. Аналитик вынужден проходить все этапы поискового процесса - отбор ключевых слов, экспериментирование с различными поисковыми системами, просмотр ранее использовавшихся ссылок, каталогов. Если же накоплен опыт поиска в виде уже апробированных источников картографической информации, их повторное использование имеет несомненные преимущества. Особый интерес представляет накопление коллективного опыта использования картографических ресурсов в рамках сетевых сообществ и социальных сетей. Поиск картографических материалов в перечнях ранее найденных и использованных ресурсов членами сетевого сообщества делает актуальным развитие средств поиска по аналогии.

Решение заданной прикладной задачи предполагает поиск по аналогии в множестве Е = {в1,в2,...вы} накопленных сообществом картографических ре,

через поисковый сервис. Укажем на достоинства использования поискового сервиса на основе аналогии:

♦ если рассматривать поиск как оди н из инструментов генерации и анализа гипотез при решении прикладных задач, механизм рассматриваемого режима поиска приобретает особое значение. Аналогию относят к одному из способов правдоподобных рассуждений, применимых к порождению гипотез [1,2]. Вероятность получить полезную информацию, в некотором смысле аналогичную отсутствующей, выше при поиске в ограниченном смысловом пространстве данных поискового сервиса. Чем шире тематическая направленность информационных ресурсов, тем шире спектр аналогий, однако их разумность и полезность снижаются;

♦ анализ собственного опыта ( в данном случае коллективного опыта сетевого сообщества ) удачных прецедентов поиска как для человека, так и для интеллектуальной системы является логичным начальным шагом решения проблемы [3].

, , применяется для реализации интеллектуальных систем [2-6]. Несмотря на свою логическую необоснованность [1] , аналогия отражает «логику здравого смысла», используемую в практике решения прикладных задач. Формально аналогия строится на оценке сходства одних частей объектов и признании истинными заключений об объектах в целом или сходстве других частей. В данной работе предлагается следующая модель информационного пространства для поиска аналогий

О =< С, Я, X, ¥, в >,

где С - множество описаний классов картографических ресурсов, Я - множество отношений между классами и между экземплярами картографических ресурсов, X - множество статических атрибутов (свойств) информационных ресурсов, ¥ -

в - .

решения прикладной задачи установлена функция s(a, Ь) оценки сходства пары подмножеств а,Ь по атрибутам из < С, Я, X,¥,В >, то сходство любой пары экземпляров 01 £ 0,02 £ О логически выводится как

5 (а, Ь) > 5* ^ 8( 01, 02) > 5 *, где 5 * - требуемый уровень сходства.

Выбор базы аналогии - пары (а, Ь), атрибутов из < С, Я, X, ¥ > и функции 5(а, Ь) - определяет содержательное многообразие рассуждений. Например,

1) а £ С, Ь £ С предполагает аналогию «природы» объектов: классы растровых и векторных изображений описывают аналогичные объекты в смысле визуального представления;

2) а £ X, Ь £ X предполагает аналогию свойств: частота употребления в атрибутивных данных ключевых слов позволяет утверждать об их аналогичности по содержанию;

3) а£ ¥,Ь£ ¥ :

время воспроизведения позволяет включать или отключать собственные ,

речи на иностранных языках.

Поиск реализуется отбором картографических ресурсов на основе гипотезы: если некоторый ресурс ei £ Е обладает информативностью I(е.) > I * и в контексте близости 5(е1, е*) > 5 *(здесь е * - эталонный ресурс для сравнения), то по аналогии I(е.) > I * в этом контексте.

Для минимизации времени решения прикладной задачи должен быть построен механизм оценки аналогии (схожести) максимально содержательных информа-.

Трудности решения данной проблемы состоят в следующем:

♦ понятие содержательности трудноформализуемо и понимается аналити-

. , -поставить каждому пользователю сервиса информационную структуру,

;

ресурса е * дня оценки сходства. Как показал анализ известных методов [6], данный вопрос решается соответственно прикладной задаче;

♦ процедура рассуждения по аналогии описывается аналитиком неодно-

, . -дели вывода об аналогичности экземпляров ресурсов;

♦ параметры, по которым определяется сходство, также подвержены влиянию НЕ-факторов [7].

По перечисленным причинам непосредственное применение механизмов поиска по аналогии [4] не представляется возможным. Поэтому в данной работе предлагается новый метод комбинированной аналогии, являющийся развитием метода структурной аналогии [4,5].

В основе предлагаемого метода комбинированной аналогии лежит предположение о том, что аналогия между картографическими ресурсами имеет составную конструкцию, т.е. характеризуется вектором аналогий

А = ( а^ а 2 ,... ам ).

В качестве а. выступают независимые аналогии, целостно отражающие определённые аспекты вида и поведения объектов. Предлагаемое структурирование достаточно естественно для картографических ресурсов: рассматривая аналогию между парой е{, е_1 £ Е, эксперт учитывает сходство по источнику ресурса, тематической

направленности, качеству представления данных, уровню достоверности, степени актуальности, привычности терминологии, ссылочной ценности, и т.д.

В терминах теории структурной аналогии [4], любая аналогия А имеет контекст иА , и множество

ГаЬ = и А П а П Ь

включает в себя элементы, которые используются для оценивания близости объектов а и Ь функцией 5(а, Ь) . В качестве контекста выступает подмножество атрибутов

ил =< СД,ЯД,ХД,РД >,еА с С,ЯД С Я,ХА с ХЛ с ¥,Вл с в.

Для комбинированной аналогии и =<С ,Я ,Х ,Б ,Ъ >,

а. а. * а. * а.' а. * а. *

Са с С,Яа сЯ,Ха с Х,Р с ¥,Ъа с В,

Сч П С^ *0,Яа ПЯ^ ^0,Хч П X^ *0,^ П ?*0,0, П *0, ., ] = Щ],

5(^ У) = К (X, У\ За2 (X УХ... ^ (х у)).

Приведённая модель позволяет формально описать содержательность как набор контекстов А с А, А * 0 . Набор А специфичен для каждого пользователя

системы, все пользователи имеют разные контексты А . Величину | А | можно использовать как меру содержательности: чем больше частных аналогий «про» , -. , применение которой практически бесполезно.

, , -кладной задачи сводится к построению максимальных по мощности контекстов . ,

существует для конкретного пользователя ли набор контекстов А .

Как показывает анализ, при нахождении набора контекстов А возникают :

♦ задача отбора А из множества возможных контекстов. Формально, А с С X Я X X X ¥ X В, однако принцип отбора полезных элементов

;

♦ определения функции близости 5(а, Ь). Сходство на основе набора аналогий А означает, что 5(а, Ь) зависит от многих параметров и имеет

различный вид как для отдельных пользователей, так и в разных областях пространства аналогий. Получить адекватное аналитическое выражение для 5 (а, Ь) не представляется возможным из-за недостатка данных. Поэтому должен использоваться некий практически полезный подход.

Отбор полезных контекстов в набор А с С X Я X X X ¥ X В предлагается строить на основе анализа онтологии. Как известно [8], описание онтологий ис-

пользует понятие классов. Язык OWL, предназначенный для создания Web-онтологий ресурсов, наделён синтаксическими конструкциями для определения классов и их отношений. Таким образом, можно без ограничения общности считать, что между классами существуют отношения, рассматриваемые в объектноориентированном анализе:

♦ наследование;

♦ агрегирование (композиция);

♦ ассоциирование.

С каждым отношением r Е R между классами может быть связана смысловая аналогия. Например, всё, что относится к автомобилям вообще, в определённой степени может относиться к грузовым либо легковым автомобилям; всё, что связано с легковыми автомобилями, в той или иной степени имеет отношение к конкретной марке авто, а также к ассоциирующимся с этими марками объектами: запчастями, услугами по ремонту и т.д. Таким образом, может быть построен нечёткий ориентированный граф [9] аналогий G = (X,U), в котором множество

X ,

< х, xj >е X2, U = {^(< x, xj >) / < x., xj >}, i, j = 1,| X2 |

соответствует степени аналогии между парой классов < x, X >. Здесь

. J

М< xi, xj >) является степенью принадлежности ребра нечёткому множеству

рёбер U . Граф G = (X U) строится на основе опроса экспертов-анадитиков сетевого сообщества и является формальным представлением глубинных знаний об осмысленных аналогиях прикладной области. В общем случае для построения графа G = (X,U) по описанию на OWL используется набор экспертных правил

r0WL =< Cowl > Aowl > Dowl > , гДе Cowl - условие правилу Aowl - множество фактов, добавляемых правилом, Dowl - множество фактов, удаляемых правилом.

Будем считать, что правила roWL =< Cowl, Aowl, Dowl > обеспечивают полноту описания аналогий в том смысле, что любому концепту ci Е С, i = 1,| С | всегда может быть сопоставлен класс xj Е X, j = 1,| X |. Тогда справедливы сле-.

Утверждение 1. Каждому дескриптору ресурса Dk (E') соответствует подграф gD С G.

DK

Утверждение 2. Путь L(x., xj ) из вершины x. в вершину xj в графе аналогий G = (X, U) соответствует аналогии между любой парой концептов, сопоставляемых классам x и x .

. j

Справедливость утверждения вытекает их способа построения графа аналогий.

Определение 1. Весом пути L(x. , xj ) из вершины xt в вершину xj является величина VL(Xj ,xj ) = min M(< xn , xm >) .

<xn ,xm >eL(xi,xj )

Определение 2. Степенью аналогии класса xj классу x. является вес пути

L( x, xj).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Утверждение 3. Контекст at Е А аналогичен контексту Oj Е А , если справедливо высказывание

(Vc е a 3x е X: c ^ x ) & (Vc е a 3x е X: c ^ x) & (L(x , x ) Ф 0).

V m i p m p/ V n j q n q/ \ \ p“ q/ /

Ограничив вес пути некоторым числом а > 0,

L(x. , xj) > а,

получим набор аналогичных контекстов уровня а .

Приведённые рассуждения позволяют генерировать набор контекстов А на основе дескриптора запрашиваемого ресурса Dk (E') . Контексты зависят только от внутренней структуры онтологии и не персонализированы, т.е. остаётся не известным вид функции близости s(a, b) .

В основе предлагаемой методики лежит гипотеза о стабильности комбинированной аналогии и постоянстве значимости частных аналогий, которыми пользу. ,

А / А /V /V \ /V л

s(a1, a2,..aQ), at Е А,

и обладает свойством

ds(ai, a2,..ciQ) .

----------------— = const, i = 1, Q.

da

i

/V / /V /V /V \

Считая, что функция S^,(C,2,.‘CIq) растёт с увеличением степени близости, можно заключить, что практический интерес представляют частные аналогии, для которых выполняется соотношение

ds(aI, C2,..Cq )

da

= L. > 0. (I)

Значение Ь. еле дует рассматривать как чувствительность функции степени

близости по аналогии а.. Содержательно это означает, что аналитик, проводя аналогии между информационными ресурсами в некотором контексте, использует частную аналогию а. как существенно важную. Например, при анализе последних достижений в некоторой области деятельности важно учитывать фактор аналогий времени. Когда речь идёт о достижениях отдельных научных школ, сущест-

венно более важную роль играют аналогии тематики исследований, количественного и качественного состава группы исследователей. Аналогии размещения самих информационных ресурсов роли не играют.

Для экспериментального выявления набора контекстов смешанной аналогии заданного аналитика предлагается следующий алгоритм:

1) формируется начальный набор контекстов a1,S2,..CIq на основе имеющейся онтологии и имеющихся для аналитика дескрипторов ресурсов;

2)

тестовые пары eT = {eT,e2,..,eK},eT = {em,en},em,en Е E,m * n;

3) проводится тестирование аналитика, результатом которого является набор значений s 3 ,m = 1, K;

em’ ’

4) для каждого контекста из набора Сх, C2,..Cq подсчитывается число значений — , чувствительных к контексту, по правилу: если пара em признана аналитиком аналогичной и выполнено (1), значение — увеличивается на 1;

5) для каждого контекста из набора a,, a, ,..Сq выотеляется величина ——,

12 Q K

характеризующая значимость контекста;

— i?

6) отбрасываются контексты со значимостью -cc- < о , где О- порог зна-

K

, -

иска UО информационного ресурса вне поисковой системы, которая рассчитывается как

Zn.

—).

7/- /

- nai s K о. :—L >О i K

Здесь Umax - максимально возможное значение трудоёмкости.

,

материалов на основе аналогии. Применение описанного подхода позволит повысить эффективность решения прикладных задач, связанных с использованием кар.

БИБЛИОГРДФИЧЕСКИЙ СПИСОК

1. Ивин АЛ. Jloгика. Учебное пособие. - М.: Знание, 1998. - 232 с.

2. Вагин В.Н., Головина ЕМ., Загорянская А.А., Фомина М.В. Достоверный и правдоподобный вывод в интеллектуальных системах. - М.: Физматлит, 2008. -564 с.

3. .. . .

- М.: Наука, 1989.

4. . ., . .

интеллектуальных систем поддержки принятия решений // Известия РАН. Теория и системы управления. - 2005. - № 1. - С. 97-109.

5. Carbonell J.G. Learning By Analogy: Formulating and Generalizing Plans from Past Experience // Machine Learning: An Artifical Intelligence Approach. V 1. Tioga; Palo Alto, 1983.

- P. 137-161.

6. ЛюгерД.Ф. Искусственный интеллект: стратегии и методы решения сложных проблем. Пер. с англ. - М.: Вильямс, 2003.

7. Нариньяни А.С. НЕ-факторы : неточность и недоопределённость - различие и взаимосвязь // Изв. РАН «Теория и системы управления». - 2000. - № 5. - С. 51-55.

8. . . // -мы. - 2006. - № 1. - С. 28-32.

9. . ., . . . - .: , 2005.

Беляков Станислав Леонидович

Технологический институт федерального государственного образовательного учреждения высшего профессионального образования «Южный федеральный университет» в г. Таганроге.

E-mail: [email protected].

347928, г. Таганрог, пер. Некрасовский, 44.

Тел.: 88634371743.

Розенберг Игорь Наумович

ОАО «Научно-исследовательский и проектно-конструкторский институт инженеров железнодорожного транспорта» (НИИАС).

E-mail: [email protected].

109029, Москва, ул. Нижегородская, д. 27, стр. 1.

Тел.: 84959677701.

Beliacov Stanislav Leonidovich

Taganrog Institute of Technology - Federal State-Owned Educational Establishment of Higher Vocational Education «Southern Federal University».

E-mail: [email protected].

44, Nekrasovskiy, Taganrog, 347928, Russia.

Phone: +78634371743.

Rozenberg Igor Naymovich

Public corporation “Research and development institute of railway engineers”.

E-mail: [email protected].

27/1, Nizhegorodskaya, Moscow, 109029, Russia.

Phone: +74959677701.

УДК 681.03.06

Д.А. Диденко

РАЗРАБОТКА МОДЕЛИ ОЦЕНКИ КАЧЕСТВА ИНФОРМАЦИИ В ГИС

Рассмотрена проблема оценки качества информационной базы ГИС в условиях нечеткости информации о требуемом качестве. Проведен анализ известных методик и моделей оценки качества, выявлены их недостатки. Предложена гибридная модель оценки качества информационной базы ГИС, основанная на нечеткой модели пользователя.

Качество информации; ГИС; оценка качества; гибридная модель; нечеткая модель; пользователь; модель ответа, интеллектуальная система.

D. A. Didenko

WORKING OUT OF MODEL OF THE ESTIMATION OF QUALITY OF THE

INFORMATION IN GIS

The problem of an estimation of quality of information base GIS in the conditions of an illegibility of the information on demanded quality is considered. The analysis of known techniques and models of an estimation of quality is carried out, their lacks are revealed. The hybrid model of an estimation of quality of the information base GIS, based on indistinct model of the user is offered.

Quality of the information; GIS, a quality estimation; hybrid model; indistinct model; the user; answer model; intellectual system.

i Надоели баннеры? Вы всегда можете отключить рекламу.