Научная статья на тему 'Обновление информационной основы ГИС с использованием онтологий'

Обновление информационной основы ГИС с использованием онтологий Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
151
46
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГИС / КАРТОГРАФИЧЕСКИЕ ДАННЫЕ / ОНТОЛОГИИ / ИНФОРМАЦИОННАЯ ОСНОВА / СОВМЕСТИМОСТЬ ДАННЫХ / GIS / CARTOGRAPHIC DATA / ONTOLOGIES / INFORMATION BASE / DATA COMPATIBILITY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Беляков Станислав Леонидович, Коломийцев Ярослав Алексеевич

Проанализированы возможности совмещения картографических данных, получаемых из различных источников, при наличии в них определенных типов несовместимости. Рассматриваются случаи, когда данные различаются по терминологии и используемым понятиям. Предлагается метод преодоления несовместимости в частных случаях посредством применения онтологий. Осуществляется объединение существующих онтологий каждого из исходных массивов данных, с соотнесением понятий из каждой из них, для получения общей системы понятий. Новизна решения заключается в применении онтологического подхода к задаче соотнесения понятий и терминов, используемых в различных геоинформационных системах.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Беляков Станислав Леонидович, Коломийцев Ярослав Алексеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

UPDATING OF THE INFORMATION BASE OF THE GIS USING ONTOLOGIES

The article analyzes the possibility of combining map data from different sources if there are some specific types of incompatibility in them. The cases where the data differ in terminology and concepts used are regarded. A method of overcoming the incompatibility in particular cases through the use of ontologies is proposed. Existing ontologies of each source data set are integrated and from each of them are brought into correlation in order to receive the general conceptual framework. The novelty of the solution is to use an ontological approach to the problem of bringing into correlation the concepts and terms used in a variety of geographic information systems.

Текст научной работы на тему «Обновление информационной основы ГИС с использованием онтологий»

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Форд Л.Р., Фалкерсон ДР. Потоки в сетях. - М.: Мир, 1966. - 276 с.

2. Кристофидес Н. Теория графов. Алгоритмический подход. - М.: Мир, 1978. - 432 с.

3. Филипс Д., Гарсиа-Диас А. Методы анализа сетей. - М.: Мир, 1984. - 276 с.

4. Майника Э. Алгоритмы оптимизации на сетях и графах. - М.: Мир, 1981. - 326 с.

5. Ху Т. Целочисленное программирование и потоки в сетях. - М.: Мир, 1974. - 520 с.

6. Zimmermann H.J. Fuzzy Set Theory and Its Applications, (2th edition). - Boston/Dordrecht/London: Kluwer Academia Publishers, 1991. - 435 p.

7. Bershtein L.S., Bozhenuk A.V. Fuzzy graphs and fuzzy hypergraphs. In: Dopico J., de la Calle J., Sierra A. (eds.) Encyclopedia of Artificial Intelligence, Information SCI. Hershey, New York (2008). - P. 704-709.

8. . .

нечеткой транспортной сети // Сборник докладов XII научно-практической конференции преподавателей, аспирантов и молодых ученых: ’’Проблемы качества образования. Новые информационные технологии, методы и модели в экономике”. - Таганрог: НОУ ВПО ТИУиЭ, 2011. - С. 125-130.

9. . ., . ., . .

в САПР. - М.: Энергоатом издат, 1991.

10. Ganesan K., Veeramani P. Fuzzy Linear Programs with Trapezoidal Fuzzy Numbers // Ann Oper Res. - 2006. - P. 305-315.

11. Kumar A., Kaur J., Singh P. Fuzzy Optimal Solution of Fully Fuzzy Linear Programming Problems with Inequality Constraints // International Journal of Mathematical and Computer Sciences 6:1, 2010. - P. 37-41.

12. Maleki H.R., Mashinchi M. Fuzzy Number Linear Programming: a Probabilistic Approach // J. Appl. Math. and Computing. - 2004. - Vol. 15. - P. 333-341.

13. . ., . ., . .

живучести в транспортных сетях - М.: Научный мир, 2006.

14. Chanas S., Kuchta D. Linear programming problem with fuzzy coefficients in the objective function // In: Delgado M. et al. (eds.) Fuzzy Optimization, Physica-Verlag, Heidelberg, 1994.

- P. 148-157.

Статью рекомендовал к опубликованию д.т.н., профессор В.П. Карелин.

Герасименко Евгения Михайловна - Технологический институт федерального государственного автономного образовательного учреждения высшего профессионального образования «Южный федеральный университет» в г. Таганроге; e-mail: [email protected]; 347928, г. Таганрог, пер. Некрасовский, 44; тел.: +79885315343; acnnpanTKa.

Gerasimenko Eugenia Michailovna - Taganrog Institute of Technology - Federal State-Owned Autonomy Educational Establishment of Higher Vocational Education “Southern Federal University”; e-mail: [email protected]; 44, Nekrasovskiy, Taganrog, 347928, Russia; phone: + 79885315343; postgraduate student.

УДК 681.3.06

СЛ. Беляков, Я .А. Коломийцев

ОБНОВЛЕНИЕ ИНФОРМАЦИОННОЙ ОСНОВЫ ГИС С ИСПОЛЬЗОВАНИЕМ ОНТОЛОГИЙ*

Проанализированы возможности совмещения картографических данных, получаемых из различных источников, при наличии в них определенных типов несовместимости. Рас, -

.

.

*

Работа выполнена при финансовой поддержке грантов РФФИ 11-01-00011-а, 10-01-00029-а.

из исходных массивов данных, с соотнесением понятий из каждой из них, для получения общей системы понятий. Новизна решения заключается в применении онтологического подхода к задаче соотнесения понятий и терминов, используемых в различных геоинфор-.

ГИС; картографические данные; онтологии; информационная основа; совмести.

S.L. Beliacov, Y.A. Kolomiytsev

UPDATING OF THE INFORMATION BASE OF THE GIS USING

ONTOLOGIES

The article analyzes the possibility of combining map data from different sources if there are some specific types of incompatibility in them. The cases where the data differ in terminology and concepts used are regarded. A method of overcoming the incompatibility in particular cases through the use of ontologies is proposed. Existing ontologies of each source data set are integrated and from each of them are brought into correlation in order to receive the general conceptual framework. The novelty of the solution is to use an ontological approach to the problem of bringing into correlation the concepts and terms used in a variety of geographic information systems.

GIS; cartographic data; ontologies; information base; data compatibility.

В процессе работы геоинформационная система формирует картографическую основу из определенного множества информационных ресурсов, используемых ГИС при решении пользовательских задач. При этом под информационными ресурсами могут пониматься достаточно разнородные сущности, начиная от архивов спутниковых списков или карт специальных форматов и заканчивая описа-

, . , данных зависят от самой ГИС или от особенностей работы структуры, являющейся источником информации.

В настоящее время сетевые технологии широко используются для предоставления доступа к пространственной информации в электронном виде, а также для активного информационного обмена. Вопрос о необходимости использования кар, -, . -новой понимается область, наполняемая пространственными данными.

Основной целью объединения данных является повышение информативности

.

.

относятся:

♦ отсутствие единых стандартов представления данных;

♦ неполнота или отсутствие описаний координатных систем и параметров

;

♦ неоднозначность восприятия и толкования информации, различия терминологии, семантическая несовместимость данных;

♦ разнородность по структуре, способам кодирования и представления [1].

Рассматривается задача совмещения данных из различных источников путем

выработки методов по преодолению проблем совместимости данных. В общем виде задачу можно сформулировать следующим образом: задана группа источни-, -

.

данных для формирования картографической основы с определенным уровнем .

Для рассматриваемой задачи можно выделить следующие основные ограничения:

♦ уровень информативности получаемой картографической основы должен быть выше, чем информативность исходных данных источников по отдельности;

.

Данная задача имеет различные подходы к решению.

Первый подход заключается в создании единых стандартов представления

.

. ,

пространственных данных рассматривается в таких работах, как «Инфраструктура распределенной среды хранения, поиска и преобразования пространственных данных» [2] и «Р^работка инфраструктуры пространственных данных ГИС-портала СО РАН» [3].

, -

вместимость создаваемых данных. Однако внедрение подобных нормативов, обеспечение их повсеместного использования и приведение уже существующих данных к единому формату являются сложными и долговременными задачами. Разработка единых норм и правил, согласующихся с мировыми стандартами, в перспек-

тиве может обеспечить эффективное решение проблемы совместного использования данных из различных источников.

, -

,

количества источников данных.

Второй подход к решению проблемы заключается в создании локальной совместимости, т.е. функциональных модулей, обеспечивающих взаимодействие нескольких стандартов представления данных. Очевидным преимуществом такого решения является получение определенного результата за конечный промежуток времени для конкретной задачи. В частности, именно к такому подходу прибегает консорциум ОрепОК [4].

Данный подход является наиболее удобным при возникновении единичных конфликтов совместимости и при необходимости работы с крайне узким кругом .

Недостатком является необходимость внесения изменений для каждого нового конфликта данных, т.е. решение является узкопроблемным, его целью является обеспечение технической совместимости конкретных форматов данных. Также данный подход практически неприменим, если число участников информационного обмена значительно или не определено изначально.

Одним из возможных методов более общего решения проблемы является .

онтологий в области картографии является малоизученной областью.

Применение данного подхода подразумевает, что источники имеют свои наборы стандартов и терминологию. В то же время все источники осуществляют обработку пространственных данных, следовательно, возможно выделить понятия, термины, характеристики, типы данных, которые являются общими или сходными для разных источников. Определив области, в которых источники близки, можно осуществить совмещение данных.

В рамках данного исследования рассматривается задача обеспечения совместимости данных на уровне понятий, терминов и атрибутов.

, , : имеются наборы данных, совместимые по форматам, проекциям, координатным системам, но отличающиеся с точки зрения терминологии, понятий и используе-. ,

.

Формально онтология определяется как O = <X,R,F>, где X - конечное множество понятий предметной области, R - конечное множество отношений между понятиями, F - конечное множество функций интерпретации [5].

,

, .

работы должно быть формирование онтологии, являющейся общей для наборов .

Механизм приведения наборов понятий к единой онтологии можно описать .

Существует исходная база понятий и отношений, полученная в результате обучения системы, проводящей формирование информационного массива. Возможность создания начальной онтологии обусловлена тем, что все рассматриваемые массивы относятся к пространственным данным, т.е., так или иначе, имеют значительное количество общих понятий.

Новые понятия и атрибуты сравниваются с существующими в онтологии. Рассматриваются два множества терминов, соответствующих первому и второму набору данных, - X1 и X2.

Объект x Е X2 определяется совокупностью из n атрибутивных параметров

u, т.е. x = <u1,u2,^.un>. Совпадение большинства атрибутов из первого и второго множества говорит о том, что новый параметр может быть отнесен к группе уже .

системы, т.е. вводится пороговое значение, для определения эквивалентных значений. Таким образом, устанавливается соответствие между термином или параметром из первого множества и термином или параметром из второго множества.

Если объект не находит эквивалента в существующем наборе, он может быть отнесен к группе или области объектов. Область объектов - определенное множе-, . с критериями существующих объектов определяется в процессе обучения системы. В этом случае можно говорить, что объект находится в отношении сходности с определенной группой объектов.

В случае если на основе существующих правил объект невозможно отнести ни к одному из типов, в онтологии может быть создан новый тип объектов и правил. Их внесение может потребовать нового этапа обучения или вмешательства эксперта.

Если невозможно соотнести новое понятие с существующими, оно может быть исключено из рассмотрения. То есть итоговый массив данных может не включать некоторой их части.

, -бор отношений, т.е. существует полноценная начальная онтология для каждого из ,

классу могут быть сделаны на основе существующих отношений с понятиями, которые уже определены в общей онтологии как сходные или эквивалентные.

Результатом классификации являются группы понятий, эквивалентных или сходных по значению. На основе полученной информации пространственные данные могут быть соотнесены и объединены по общим признакам.

Рассмотрим описываемые механизмы на конкретном примере. Существуют два массива данных, первый из которых получен из системы Google maps, а второй из системы Autocad map 3D. Каждый из наборов данных содержит определенную

, . , Google maps

могут содержать объекты классов point (точка), placemark (маркер), line (линия).

, autocad map 3D ,

включает многие другие возможные типы, такие как полигон, полигон с пустой областью. Очевидно, что объект класса «очка» будет обладать основной характери- . placemark

« » « ». , -жет быть отнесен к классу точечных объектов. Таким образом, происходит объединение сходных классов. Понятие «облако точек», существующее в autocad map 3D, может быть соотнесено с точечными объектами первого множества. Линии в каждой из систем имеют сходные характеристики, такие как координаты начальной и конечных точек, цвет, тип. Сходство большинства параметров позволяет относить их к . google

route ( ).

другим объектам Autocad map 3D, за счет наличия таких параметров, как «координа-», « », « ».

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

На основе представленных данных можно сделать следующие выводы. Предлагаемый подход позволяет решить задачу совмещения картографических данных из нескольких разнородных источников посредством применения онтологий. Подход может быть эффективно использован при различии в описании данных, терминологии и атрибутивной информации.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. ., .

планов, или как нам обустроить ЦММ // ArcReview. - 2006. - № 2 (37).

2. . ., . ., . .

, // . - 2010. - № 5. - С. 61-73.

3. . ., . ., . ., . .

- // -ренции «Математические и информационные технологии» (MIT-2011).

4. . . -

- // . -вычислительного моделирования СО РАН. T. 12. Cnen. вып. 2. - 2007.

5. . ., . . . . 1.

« » // - -формация. Сер. 2. Информационные процессы и системы. - 2001. - № 2. - С. 20-27.

Статью рекомендовал к опубликованию д.т.н., профессор В.П. Карелин.

Беляков Станислав Леонидович - Технологический институт федерального государственного автономного образовательного учреждения высшего профессионального образования «Южный федеральный университет» в г. Таганроге; e-mail: [email protected]; 347928,

г. Таганрог, пер. Некрасовский, 44; тел.: 88634371743; кафедра прикладной информатики;

д.т.н.; профессор.

- e-mail: [email protected];

информатики; аспирант.

Beliacov Stanislav Leonidovich - Taganrog Institute of Technology - Federal State-Owned Autonomy Educational Establishment of Higher Vocational Education “Southern Federal University”; e-mail: [email protected]; 44, Nekrasovskiy, Taganrog, 347928, Russia; тел.: +78634371743; the department of applied information science; dr. of eng. sc.; professor.

Kolomiytsev Yaroslav Alekseevich - e-mail: [email protected]; the department of applied information science; postgraduate student.

i Надоели баннеры? Вы всегда можете отключить рекламу.