Научная статья на тему 'Эволюционный подход к использованию пространственных данных геоинформационными сервисами'

Эволюционный подход к использованию пространственных данных геоинформационными сервисами Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
257
62
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВИЗУАЛИЗАЦИЯ ПРОСТРАНСТВЕННЫХ ДАННЫХ / ГЕОИНФОРМАЦИОННЫЕ СИСТЕМЫ / ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ / АДАПТАЦИЯ / VISUALIZATION OF SPATIAL DATA / GEOGRAPHIC INFORMATION SYSTEMS / INTELLIGENT SYSTEMS / ADAPTATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Беляков Станислав Леонидович, Боженюк Александр Витальевич, Розенберг Игорь Наумович

Анализируется проблема адаптации геоинформационного сервиса к росту объема и модификации структуры базы пространственных данных. Необходимость учитывать факторы изменения информационной основы порождается визуальным способом поиска и анализа пространственных данных пользователями геоинформационного сервиса. Традиционно решение всякой прикладной задачи начинается с построения рабочей области карты. Конечный результат анализа определяется содержанием построенной рабочей области. Современные геоинформационные системы и сервисы относят с системам «больших данных», поэтому подготовка исходной рабочей области обладает трудоемкостью, превосходящей трудоемкость решения прикладной задачи. Без принятия специальных мер качество полученного решения становится низким. В работе предлагается способ решения проблемы, базирующийся на принципе эволюции технических систем. В данной задаче эволюционный принцип заключается в непрерывной генерации геоинформационным сервисом правил-продукций, содержащих знания о полезных для визуального анализа картографических объектах. Правила рассматриваются как гипотезы, требующие коллективного подтверждения со стороны клиентов сервиса. Подтверждение любого правила представляет собой селективный отбор полезных для дальнейшего использования знаний. Таким образом, предложенный механизм обеспечивает непрерывное приспособление к изменяющейся информационной среде за счет выработки и отбора правил-продукций. В работе анализируются механизм генерации и определяется структура правил-продукций. Рассматривается порождение правил путем наблюдения за действиями пользователя, агрегирования, генерализации и транспозиции существующих наборов правил. Рассматривается механизм коллективного подтверждения правил. Предлагается новый механизм, использующий сеть подтверждения, которая строится на основе общих пространственных, временных и семантических объектов, классов и отношений, входящих в правила.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Беляков Станислав Леонидович, Боженюк Александр Витальевич, Розенберг Игорь Наумович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AN EVOLUTIONARY APPROACH TO THE USE OF SPATIAL DATA IN GEOGRAPHIC INFORMATION SERVICES

The problems of adaptation of geographic information service to increase volume and modification of the spatial database structure are analyzed in this paper. The need to consider the factors changes the informational basis is generated by a visual way of searching and analysis of spatial data users of geographic information service. Traditionally, the decision of any applied problem begins with the construction of the workspace map. The final result of the analysis is determined by the content built workspace. Modern geoinformation systems and services include systems with big data, so the preparation of the original workspace has a complexity that exceeds the complexity of solving applied tasks. Without special measures the quality of the solution becomes low. This paper proposes a solution based on the principle of evolution of technical systems. In this problem, the evolutionary principle is the continuous generation of geoinformation service rules-productions that contains the knowledge of useful for visual analysis of cartographic objects. Rules are considered as hypotheses that require collective support to the clients of the service. Confirmation of any rule represents a selective sampling is useful for further use of knowledge. Thus, the proposed mechanism provides a continuous adaptation to the changing information environment due to the production and selection rules-productions. This paper analyzes the mechanism of generation and determined the structure of the rules-productions. The generation of rules by monitoring user activity, aggregation, generalization and transposition of existing rule sets is considered here. The mechanism of collective acknowledgement of the rules is examined. We propose a new mechanism that uses a network of confirmation, which is based on a common spatial, temporal and semantic objects, classes, and relations within the rules.

Текст научной работы на тему «Эволюционный подход к использованию пространственных данных геоинформационными сервисами»

18. Kacprzyk J., Kureichik V.M., Malioukov S.P., Kureichik V.V., Malioukov A.S. Experimental investigation of algorithms developed, Studies in Computational Intelligence, 2009, No. 212, pp. 211-223+227-236.

19. Parsopoulos K.E. and Vrahatis M.N. Modification of the particle swarm optimizer for locating all the global minima, in: Artificial Neural Networks and Genetic Algorithms, V. Kurkova, N. Steele, R. Neruda and M. Karny, eds, Wien, Germany: Springer-Verlag, 2001, pp. 324-327.

20. Stutzle T.andDorigoM. A short convergence proof for a class of ant colony optimization algorithms, IEEE Transactions on Evolutionary Computation, 2002, No. 6, pp. 358-365.

Статью рекомендовала к опубликованию д.т.н., профессор Л. С. Лисицына.

Курейчик Владимир Викторович - Южный федеральный университет; e-mail: [email protected]; 347928, г. Таганрог, пер. Некрасовский, 44; тел.: 88634371651; кафедра систем автоматизированного проектирования; зав. кафедрой САПР; д.т.н.; профессор.

Заруба Дарья Викторовна - e-mail: [email protected]; кафедра систем автоматизированного проектирования; аспирант.

Запорожец Дмитрий Юрьевич - e-mail: [email protected]; кафедра систем автоматизированного проектирования, ассистент.

Kureichik Vladimir Victorovich - Southern Federal University; e-mail: [email protected]; 44, Nekrasovskiy, Taganrog, 347928, Russia; phone: +78634371651; the department of computer aided design; head of CAD department; dr. of eng. sci.; professor.

Zaruba Daria Viktorovna - e-mail: [email protected]; the department of computer aided design; postgraduate student.

Zaporoghetz Dmitri Yurievich - e-mail: [email protected]; the department of computer aided design; teaching assistant.

УДК 519.688

С.Л. Беляков, А.В. Боженюк, И.Н. Розенберг

ЭВОЛЮЦИОННЫЙ ПОДХОД К ИСПОЛЬЗОВАНИЮ ПРОСТРАНСТВЕННЫХ ДАННЫХ ГЕОИНФОРМАЦИОННЫМИ

СЕРВИСАМИ*

Анализируется проблема адаптации геоинформационного сервиса к росту объема и модификации структуры базы пространственных данных. Необходимость учитывать факторы изменения информационной основы порождается визуальным способом поиска и анализа пространственных данных пользователями геоинформационного сервиса. Традиционно решение всякой прикладной задачи начинается с построения рабочей области карты. Конечный результат анализа определяется содержанием построенной рабочей области. Современные геоинформационные системы и сервисы относят с системам «больших данных», поэтому подготовка исходной рабочей области обладает трудоемкостью, превосходящей трудоемкость решения прикладной задачи. Без принятия специальных мер качество полученного решения становится низким. В работе предлагается способ решения проблемы, базирующийся на принципе эволюции технических систем. В данной задаче эволюционный принцип заключается в непрерывной генерации геоинформационным сервисом правил-продукций, содержащих знания о полезных для визуального анализа картографических объектах. Правила рассматриваются как гипотезы, требующие коллективного подтверждения со стороны клиентов сервиса. Подтверждение любого правила представляет собой селективный отбор полезных для дальнейшего использования знаний. Таким образом, предложенный механизм обеспечивает непрерывное приспособление к изменяющейся информационной среде за счет выработки и отбора правил-продукций. В работе анализиру-

* Работа поддержана грантами РФФИ, проекты № 15-01-00149, № 15-07-00185.

ются механизм генерации и определяется структура правил-продукций. Рассматривается порождение правил путем наблюдения за действиями пользователя, агрегирования, генерализации и транспозиции существующих наборов правил. Рассматривается механизм коллективного подтверждения правил. Предлагается новый механизм, использующий сеть подтверждения, которая строится на основе общих пространственных, временных и семантических объектов, классов и отношений, входящих в правила.

Визуализация пространственных данных; геоинформационные системы; интеллектуальные системы; адаптация.

S.L. Belyakov, A.V. Bozhenyuk, I.N. Rozenberg

AN EVOLUTIONARY APPROACH TO THE USE OF SPATIAL DATA IN GEOGRAPHIC INFORMATION SERVICES

The problems of adaptation of geographic information service to increase volume and modification of the spatial database structure are analyzed in this paper. The need to consider the factors changes the informational basis is generated by a visual way of searching and analysis of spatial data users of geographic information service. Traditionally, the decision of any applied problem begins with the construction of the workspace map. The final result of the analysis is determined by the content built workspace. Modern geoinformation systems and services include systems with big data, so the preparation of the original workspace has a complexity that exceeds the complexity of solving applied tasks. Without special measures the quality of the solution becomes low. This paper proposes a solution based on the principle of evolution of technical systems. In this problem, the evolutionary principle is the continuous generation of geoinformation service rules-productions that contains the knowledge of useful for visual analysis of cartographic objects. Rules are considered as hypotheses that require collective support to the clients of the service. Confirmation of any rule represents a selective sampling is useful for further use of knowledge. Thus, the proposed mechanism provides a continuous adaptation to the changing information environment due to the production and selection rules-productions. This paper analyzes the mechanism of generation and determined the structure of the rules-productions. The generation of rules by monitoring user activity, aggregation, generalization and transposition of existing rule sets is considered here. The mechanism of collective acknowledgement of the rules is examined. We propose a new mechanism that uses a network of confirmation, which is based on a common spatial, temporal and semantic objects, classes, and relations within the rules.

Visualization of spatial data; geographic information systems; intelligent systems; adaptation.

Введение. Сетевые геоинформационные сервисы представляют собой системы для коллективного использования пространственных данных. Информационная база данных геосервиса включает в себя схемы, карты, планы, снимки земной поверхности и другие материалы, отражающие явления и объекты реального мира [1-3]. Пространственные данные используются в самых различных областях производства и бизнеса, что привело к появлению разномасштабных геосервисов - от корпоративных до геосервисов Интернет [4].

Геосервис любого масштаба можно отнести к системам Big Data («больших данных») [5]. Эта особенность определяется назначением любой геоинформационной системы, которое заключается в непрерывном накоплении данных об изменяющемся окружающем мире. Объем пространственных данных постоянно растет, изменяются существующие структуры их представления, возникают новые. Пространственные данные никогда не устаревают, меняя лишь актуальность применительно к решению конкретных прикладных задач. Использование пространственных данных невозможно без набора специальных методов, направленных на получение полезной для решения задачи информации. Наибольший интерес вызывают методы, применяемые для визуального представления и визуального анализа пространственных данных. Именно картографическая визуализация является наиболее эффективным инструментом решения сложных неформальных проблем. Программные инструменты специальных видов анализа - статистического, топологи-

ческого, морфологического, сетевого и многих других - играют вспомогательную роль, дополняя виртуальный картографический образ, который складывается у аналитика карты [6].

Отбор полезной для визуального анализа информации во многом определяет конечный результат использования пространственных данных. В соответствии с принципами картографического исследования [7] пользователем должна быть построена рабочая область информационной базы геосервиса. В рабочую область входят картографические объекты, объединенные в тематические слои и связанные ссылками с внешними базами данных. Сложность задачи построения рабочей области в том, чтобы отобрать полезные данные из источника Big Data, которым является база пространственных данных геосервиса. Неудовлетворительная реализация этой задачи влечет за собой потери, вызванные принятием неадекватных решений.

К проблеме отбора полезных для анализа пространственных данных известно несколько подходов.

Методология картографического исследования [7] предполагает создание тематической карты для поставленной прикладной задачи. Авторами данных работ определены фундаментальные принципы картосоставления. Недостатком инструментария данной области является его трудноформализуемость: процедуры поиска и обобщения тематических карт базируются на знаниях и профессиональном опыте картографа.

Неокартография [8] ставит своей целью отображение окружающего мира в реальном времени. Данный подход ориентирован на представление реального мира мультимедиа-данными. Недостатком подобного подхода следует считать ослабление связи с такими важными механизмами синтеза пространственных данных, как картографическая классификация и генерализация. Это сужает спектр инструментов автоматического анализа картографических изображений.

Исследования в области интеллектуальной визуализации [9-11] ставят своей целью создание процедур отбора полезной информации. Как показал анализ, данная задача решается созданием завершенных, готовых к использованию информационных ресурсов. При этом проблема разработки универсальных механизмов отбора тематических данных в локальных областях баз пространственных данных категории Big Data остается малоисследованной.

Вопросы коллективного использования пространственных данных исследуются в рамках направления создания глобальной инфраструктуры пространственных данных [12, 13]. Главное внимание здесь уделяется технологии совместного доступа к пространственным данным и обслуживания системы хранения пространственных данных класса Big Data. В то же время проблемы использования информации в условиях динамичности структуры базы данных, коллективного опыта рационального отбора данных остаются за рамками исследований.

Направление исследований, связанное с обеспечением качества геоданных, охватом всех этапов получения и использования пространственных данных, является, с нашей точки зрения, наиболее перспективным [14-17]. Выявление и использование знаний, позволяющих управлять качеством рабочих областей и решением классов прикладных задач [18], представляет собой важную, но недостаточно изученную проблему.

Работы [19-21] посвящены развивающимся (эволюционирующим) системам. Механизм эволюции предполагает накопление знаний в реальном времени и автоматическое обучение. Данное направление построения систем позволяет реализовать автономную адаптацию к изменению внешних условий. Результаты исследований связаны с обработкой потоков числовых данных и выработкой правил-продукций нечеткой классификации. Представляется целесообразным распространить подобный механизм для процесса диалога клиентов и геосервиса.

Необходимо отметить, что задача адаптации геосервисов к изменению пространственных данных о реальном мире в настоящее время на практике решается интернет-сервисами «ручного» картографирования [22, 23]. Учитывая важность своевременного отображения пространственной информации и объективную трудность ее обновления, геосервисы Google и Yandex используют знания пользователей, способных выполнять картографирование. Для этого им предоставляются необходимые программные инструменты. Анализируя такой способ получения и использования данных, можно заключить следующее:

♦ на эффективное использование геосервиса решающим образом влияет качество его пространственных данных - в первую очередь, их достоверность и актуальность:

♦ принцип извлечения знаний пользователей сервиса является практически важным способом управления его информационной основой.

В настоящей работе исследуется эволюционный подход в организации работы геоинформационного сервиса, позволяющий реализовать непрерывную адаптацию к росту объема и модификации структуры базы пространственных данных.

Постановка задачи. Рассматривается геоинформационный сервис, информационная база которого имеет значительный объем и непрерывно пополняется новыми пространственными данными. Эти факторы порождают значительную избыточность и снижают качество картографических данных, получаемых клиентами сервиса. Необходимо оценить механизм повышения качества предоставляемых клиентам пространственных данных за счет адаптации процедур поиска данных к изменению структуры информационной базы сервиса.

Принцип работы геосервиса. Эволюционный принцип заключается в генерации и целенаправленном отборе правил-продукций, отражающих знание о картографических объектах и отношениях, полезных для решения прикладных задач. Необходимый для эволюции механизм наследования реализуется тем, что всякое новое правило возникает как результат взаимодействия двух базовых когнитивных сущностей: знаний геосервиса и знания пользователя, создающего рабочую область карты. Процесс отбора полезных знаний реализуется коллективно клиентами геосервиса. Продолжительность существования правил в этом процессе играет существенную роль.

Задача адаптации в общем виде формулируется следующим образом. Пусть Q = - множество объектов базы пространственных данных, а

т^ £ Q есть рабочая область, созданная пользователем для решения прикладной задачи. Обозначим через I(тw ) функцию полезности рабочей области, а через q\,- последовательность запросов клиента геосервису, которые позволяют получить пространственные данные для рабочей области и манипулировать ее изображением. Тогда в сеансе работы геосервиса должна решаться задача

I(mw) ^ max,

mw £ Q,

mw = B u E, (1)

B = U®q. ,E = U®r , i j

где (Dq - множество картографических объектов, полученных по запросу q

(or - множество картографических объектов, отобранных по правилу r j из базы

j ^

знаний геосервиса R(B, О). Через B (скелетон рабочей области) обозначено множество объектов, формируемое сервером по запросу клиента, а через E -

множество объектов, являющихся смысловым дополнением (окружением) скелетона В. Объекты окружения отбираются соответственно знаниям о смысловом наполнении рабочей области. За счет варьирования количества объектов окружения максимизируется полезность рабочей области I(т^). Как показано в работах [24, 25], решение данной задачи связано с нахождением классов, объектов и отношений множества окружения Е и задания отношения предпочтения, позволяющего установить нестрогий порядок на множестве его элементов.

Подсистему управления геосервиса, решающего задачу (1), назовем подсистемой интеллектуальной поддержки. Геосервис с интеллектуальной поддержкой работает следующим образом:

1) программный клиент устанавливает соединение с сервером, согласовав при этом набор правил базы знаний Я(В, О), который будет использоваться в сеансе взаимодействия. Тем самым определяются правила формирования максимально полезных изображений соответственно профессиональной принадлежности пользователя. В системе имеется описание нескольких профессионально ориентированных групп пользователей, каждой из которых соответствует собственный набор правил базы знаний;

2) пользователь отправляет запросы q\,Ц2> -<1п, формируя скелетон рабочей области В. На стороне сервера применением правил базы знаний Я(В, О) строится окружение скелетона. Правила реализуют разумную стратегию построения максимально полезной рабочей области. После обработки каждого запроса сервер оценивает полезность I(т^), изменяя

число объектов, относящихся к окружению Е ;

3) с помощью инструментов визуализации на стороне клиента пользователь анализирует рабочую область. Кроме традиционных операций масштабирования, панорамирования, изменения ракурсов и ряда других, он может вызывать специальную функцию интеллектуальной поддержки Изме-нитьСложностьРабочейОбласти(х), где х - параметр изменения сложности. Увеличение сложности (х > 0) предполагает увеличение числа объектов окружения, уменьшение сложности (х < 0) - сокращение их числа. Суть вызова указанной функции в формировании различающихся по сложности представлений рабочей области, сохраняющих при этом согласованную в сеансе смысловую направленность. Серверная процедура, которая вызывается при обращении к рассматриваемой функции, обеспечивает максимальную полезность рабочей области;

4) в любой момент времени пользователь имеет возможность отключить интеллектуальную поддержку со стороны геосервиса. Это означает, что применение правил Я(В, О) блокируется, после чего скелетон (В) и окружение (Е) рабочей области пользователь формирует вручную. Включение интеллектуальной поддержки приведет к реорганизации рабочей области: из нее будут удалены объекты, относящиеся к избыточным, а отбором объектов окружения будет обеспечена максимальная полезность;

5) завершение сеанса не предусматривает никаких специальных действий по сохранению информации о рабочей области. Пользователь может установить новый сеанс как член другой профессиональной группы.

Можно видеть, что качество решения задачи (1) определяется знаниями Я(В, О) об объектах, классах и отношениях базы пространственных данных О. Адаптация ограничена заданной структурой О и в случае ее изменения теряет

свою эффективность по двум причинам. Во-первых, любые новые классы объектов и отношений между ними интерпретируются как избыточные и исключаются из рабочих областей. Во-вторых, рост числа объектов известных классов все более затрудняет отбор наиболее полезных из них. Для адекватного выбора наиболее значимых объектов требуется дополнительная информация.

Таким образом, механизм адаптации недостаточно эффективен относительно модификации базы пространственных данных и нуждается в усовершенствовании.

Эволюционный принцип работы геосервиса. Механизм адаптации следует дополнить поведением, позволяющим реагировать на изменения базы пространственных данных за счет использования опыта пользователей, находящих полезную информацию в изменяющейся базе данных. Поведение отражает эволюционный принцип адаптации систем, заключающийся в следующем:

1) геосервисом непрерывно фиксируются знания, возникающие в процессе построения пользователями рабочих областей;

2) оценивается качество обнаруженных знаний и полезные знания переносятся в базу знаний;

3) отобранные знания включаются в когнитивный процесс коллективного использования и совершенствования накопленного знания;

4) любые изменения информационной базы сервиса вызывают реакцию геосервиса, направленную на максимально полезное использование новых информационных объектов в рабочих областях.

Для реализации перечисленных принципов должны быть решены следующие задачи:

♦ обнаружения и идентификации возникающего знания;

♦ оценки полезности нового знания и его отбор;

♦ реорганизации базы знаний сервиса с течением времени.

Генерация правил-продукций. Как показал анализ, правила могут генерироваться следующими способами:

1) как результат фиксации опыта работы пользователя в сеансе;

2) путем агрегирования существующих правил;

3) за счет генерализации существующих правил;

4) в результате переноса опыта из одних областей в другие.

Накопление опыта в виде правил-продукций является основным способом получения достоверного знания. На опыте базируются «сильные» методы решения задач [25]. Механизм интеллектуальной поддержки геосервиса играет решающую роль в процедуре выявления и фиксации опытных данных. Знание о полезной рабочей области должно включать в себя следующие концепты, которые позволят логическим выводом использовать знание при построении рабочих областей в аналогичных условиях:

♦ смысловые связи с прикладными задачами;

♦ описание условий их фактического применения;

♦ картографические объекты.

База знаний R(B, О) является компонентом геосервиса, отражающим знания о смысловых связях картографических объектов с решаемыми прикладными задачами. Следовательно, генерируемые правила должны включать в себя привязку к R(B, О), которая указывает на картографический образ - обобщенную модель картографических изображений определенной прикладной направленности [24, 25]. Наличие системы картографических образов серьезно повышает достоверность знания и его полезность. Пользователь, зарегистрировавший начало сеанса, явно указывает картографический образ и это решает проблему привязки правил, полученных в данном сеансе.

Условиями конкретного применения правила считаются пространственные, временные и семантические границы рабочей области, которую создавал пользователь в сеансе. По очевидным причинам эти границы являются нечеткими, их фиксация требует применения соответствующих интеллектуальных процедур. Условия конкретного применения доступны для обработки по завершению сеанса, т.е. являются наблюдаемым параметром опыта.

Картографические объекты, которые необходимо отнести к правилу, не наблюдаемы, т.е. не указаны на карте явно. Проанализируем возможный путь их выявления.

Формально для полученной любым образом рабочей области mw множество объектов и отношений можно определить подмножеством

mW =mW\mR,

где mR есть множество объектов и отношений, описанных и используемых в базе знаний R(B, Q). Множество mw содержит как избыточные, так и полезные в смысловом отношении элементы. Отделить одни от других без дополнительных знаний метауровня невозможно. Однако в геосервисе с интеллектуальной поддержкой необходимая дополнительная информация может быть получена следующим образом. Предположим, что пользователь зарегистрировал сеанс работы с геосервисом. Включенная интеллектуальная поддержка обеспечивает смысловую целостность формируемой рабочей области, исключая из нее избыточные объекты. Этот факт важен для последующей фиксации новых полезных объектов. Поскольку пользователь не может получить новые объекты вне классов и отношений, зафиксированных в R(B, Q), он вынужден отключить интеллектуальную поддержку для поиска и включения новых объектов. Считая поисковую деятельность пользователя рациональной, следует ожидать появления в рабочей области исключительно полезных объектов. Если результат своей работы пользователь оценивает положительно, с большой уверенностью объекты подмножества mw могут считаться картографическими объектами нового правила-продукции вида

If CartographicImage is ObservedCartographicImage and Workspace is ObservedWorkspace then Add( mw).

Антецедент правила содержит переменные картографического образа (CartographicImage) и рабочей области (Workspace). Консеквент включает в себя функцию загрузки (Add) множества картографических объектов (mw).

Агрегированием правил будем считать операцию объединения нескольких правил в одно:

R = A(Rb R2,-,Rk X

где А - оператор агрегирования, объединяющий, например, антецеденты правил дизъюнкцией, консеквенты - конъюнкцией. Агрегирующее правило Ru вводится

в базу знаний, правила Ri, R2,...,Rk удаляются. Результат агрегирования не является достоверным, но выглядит правдоподобно. Применяя другие операторы агрегирования, можно конструировать правила, наследующие по-разному свойства исходных правил. Подобная операция дает богатый материал для отбора в процессе эволюции.

Генерализация набора правил Ri,R2,...,Rm предполагает построение обобщающего правила

Rg = G(Ri, R2,...,Rm),

где G - оператор генерализации. Как и в предыдущем случае, в базе знаний остается только правило Rg. Обобщение также не дает достоверного знания, хотя может оказаться правдоподобным [27]. В отличие от агрегирования, генерализация использует более сложную логику наследования.

Перенос опыта между различными рабочими областями (транспозиция правил) базируется на операции нахождения аналогии. Операция построения правила

R¡ аналогичного заданному правилу Ri заключается в применении оператора конструирования правил по сходству

Д = вд),

который использует логику аналогии. Примером может служить близость рабочих областей по географическим показателем - рельефу либо геофизической структуре. Перенос опыта заключается в преобразовании антецедента и консеквента выбранного правила в аналоги правила, привязанного к другой рабочей области. Операция переноса опыта недостоверна, но правдоподобна.

Подтверждение правил. Рассмотренные выше способы генерации дают лишь правила-гипотезы, нуждающиеся в подтверждении своей полезности. Задача отбора полезных правил состоит в том, чтобы оценить достоверность генерируемых правил-продукций и исключить из базы знаний сервиса недостоверные правила. Критерием достоверности следует считать степень коллективного признания полезности правила пользователями геосервиса в течение некоторого ограниченного времени. Фактор времени, с нашей точки зрения, необходим по следующим причинам:

1) время имитирует «старение» знаний. В отличие от пространственных данных, информация о том, как пользоваться пространственными данными, устаревает. Объекты и отношения, использованные для решения одной и той же задачи, по многим причинам со временем изменяются;

2) время прагматично ограничивает полезность правил «настоящим временем». Геосервис не ставит целью выработать фундаментальные правила с не зависящей от времени ценностью. Первостепенное значение придается локальности и оперативности знаний;

3) картографическое производство регламентирует нормативные периоды обновления пространственных данных. Это означает наличие точно прогнозируемых периодов изменения информационной основы геосервиса. Изменения должны давать толчок к выработке новых правил, обеспечивающих адаптацию к новым условиям.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таким образом, каждое правило-гипотеза должно быть апробировано в процессе работы определенной части пользователей. Сделать полную апробацию всех правил сложно: число гипотез велико и оценить реакцию на каждую из них со стороны даже ограниченного числа пользователей невозможно. Кроме того, строящиеся рабочие области не покрывают равномерно всю поверхность карты геосервиса, а это препятствует оценке полезности всех знаний.

Чтобы сделать процедуру подтверждения гипотез менее зависимой от положения рабочих областей, снизить влияние субъективного поведения пользователей, предлагается использовать сеть подтверждения правил. Сетью подтверждения Н^, V) назовем граф, каждой вершине которого соответствует правило Rj е R из множества правил-гипотез. Дуги графа

и с R2 ^ [0,1]

имеют веса, соответствующие степени подтверждения. Если подтверждение правила Ri свидетельствует о подтверждении правила Rj, то иц > 0. Любой путь в сети подтверждения - это отражение причинно-следственной связи между прави-

лами, на которой базируется аргументация их полезности. Например, фрагмент сети может отражать следующий принцип: если подтверждено правило, содержащее в консеквенте топологическое отношение «находиться недалеко от автомагистрали», то со степенью 0.5 подтверждаются все правила, содержащие это отношение, с областью привязки в радиусе 30 км.

Сеть подтверждения можно рассматривать как механизм косвенного подтверждения правил. Прямым подтверждением назовем число сеансов, в которых правило использовалось и полезность рабочей области была удовлетворительной для пользователя. В этом случае суммарная степень подтверждения правила определяется как

V (Я1) = V (Я1) + (Я; )У (Р.),

М

V (Р;.) = Питп ,

и.„£Рг

где Р;. - множество путей, ведущих к правилу Я..

Использование сети подтверждений дает возможность по результатам работы в сеансе оценивать гораздо больше правил, чем число непосредственно использованных в рабочей области. Это повышает достоверность знаний геосервиса в целом.

Пример применения адаптации. Пусть один из пользователей сервиса, решая задачу транспортировки груза, построил рабочую область, показанную на рисунке. Используя средства редактирования, пользователь отобразил место парковки транспорта по рабочим дням, не отмеченное на карте. Место отображено закрашенным эллипсом, семантическая информация условно показана в виде овальной выноски. Заметим, что для отображения, возможно, был создан новый слой карты, тип семантической или темпоральной базы данных.

Пример рабочей области с картографическим объектом

Созданный объект представляет собой пространственные данные, непосредственно не доступные всем пользователям сервиса по очевидной причине - для многих они избыточны. Чтобы получить эту полезную информацию традиционным образом, следует сформировать запрос к информационной базе сервиса, в котором указать условия отбора объекта - тип объекта, дату создания, слой, автора и ряд других. Проблема в том, что значения этих условий пользователям не известны и это вынуждает их искать информацию путем выборочного просмотра слоев, фрагментов карты для различных интервалов времени и значений семантических атрибутов. Такой режим поиска требует времени, порождает дополнительный сетевой трафик и не гарантирует при этом положительного результата.

В случае применения адаптации будет создано правило

If CartographicImage is Логистика and Workspace is Area(x1? x2, x3, x4)

then Add(ObjId),

в котором x15 x2, x3, x4 - координаты пространственной области, ObjId - идентификатор картографического объекта, показанного на рисунке. Это правило активируется в случае, когда пользователь решает задачу логистики в пространственной области, пересекающейся с указанной. Созданное правило является гипотезой, которая

♦ может быть не подтверждена, если в течение длительного времени ни один из пользователей не решал логистические задачи;

♦ может быть подтверждена, если логистические задачи решались в смежных областях пространства либо осуществляли поиск местоположения парковок по рабочим дням (имело место косвенное подтверждение в сети подтверждения).

Таким образом, объект, отображающий парковку, станет доступным пользователям благодаря коллективно выработанной оценке его полезности. Сокращение объема сетевого трафика на поиск оценивается исходя из того, что размер в байтах блоков карты, загружаемых клиентом, колеблется от 104 до 107 байт, а в процессе построения рабочей области и поиска данных «пробная» загрузка таких блоков может достигать величины 15-20.

Стоимость логистического проекта за счет правильно принятого решения о парковке может быть существенно снижена.

Заключение. Рассмотренный эволюционный механизм использования геосервисом пространственных данных дает эффект благодаря распространению опыта построения рабочих областей для визуального анализа. Механизм базируется на знаниях о полезности рабочих областей и полезных для анализа отдельных объектов и отношений, субъективно выделенных пользователями [28]. Благодаря этому возрастает качество информационного наполнения рабочих областей и повышается качество решений, принимаемых на основе пространственных данных.

Достоинством эволюционного принципа является исключение жесткой зависимости работы программных компонентов геосервиса от структуры базы пространственных данных. Традиционно все возможности формирования рабочих областей определяются исключительно схемой базы данных. Чтобы пользоваться новыми информационными объектами, необходимо опубликовать их описание и модифицировать программные компоненты. Рассмотренные в данной работе принципы использования знаний о новых информационных объектах не ограничиваются конкретной схемой базы данных.

Наибольшую значимость в процессе адаптации имеет опыт пользователей, зафиксированный правилами. Следовательно, качество работы геосервиса сильно зависит от активности пользователей в поиске и использовании данных. Для ослабления подобной зависимости в работе предложены операции генерации гипотез на основе существующих правил. Даже при небольшом экспериментально подтвержденном материале может быть построено много гипотез, которые будут затем проверяться опытным путем.

Оценивая эффект предложенного подхода, следует обратить внимание на сокращении коллективных затрат на поиск полезной информации. Как известно [29], сложность поиска среди N объектов в лучшем случае требует O(log N) операций. Такие затраты в случае индивидуальной работы неизбежны и суммируются для всех пользователей геосервиса При повторном использовании уже найденного элемента сложность составляет O(1), что для коллектива пользователей дает значительный выигрыш.

Приведенные результаты могут быть использованы в системах Big Data. Дальнейшие исследования могут быть сосредоточены на обобщении и переносе эволюционного принципа на сетевые сервисы другого назначения.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Розенберг И.Н. Спутниковые и геоинформационные технологии в интеллектуальных системах управления // Железнодорожный транспорт. - 2013. - № 3. - С. 28-32.

2. G. Randy Keller, Chaitanya Baru. Geoinformatics: Cyberinfrastructure for the Solid Earth Sciences. - Cambridge University Press, 2011.

3. Krishna Sinha Geoinformatics: Data to Knowledge. - Geological Society of America, 2006.

4. Allan Brimicombe, Chao Li Location-Based Services and Geo-Information Engineering.

- John Wiley & Sons, 2009.

5. Chaowei Yang, Min Sun, Kai Liu, Qunying Huang, Zhenlong Li, Zhipeng Gui, Yunfeng Jiang, Jizhe Xia, Manzhu Yu, Chen Xu, Peter Lostritto, Nanying Zhou Contemporary Computing Technologies for Processing Big Spatiotemporal Data // Space-Time Integration in Geography and GIScience. - 2015. - P. 327-351.

6. Беляков С.Л., Белякова М.Л., Самойлов Д.С. Геоинформационный сервис ситуационного центра // Информационные технологии. - 2011. - № 8. - С. 29-32.

7. Берлянт А.М. Картографический метод исследования. - М.: Изд-во МГУ, 1978. - 255 c.

8. Holger Faby, Andreas Koch From maps to neo-cartography. - http://cartography-gis.com/pdf/64_Faby_Koch_Austria_paper.pdf (дата обращения 07.06.2015 )

9. Pettit C., Cartwright W., Bishop I., Lowell K., Puller D., Duncan D. Landscape Analysis and Visualisation, Spatial Models for Natural Resource Management and Planning. - Berlin: Springer-Verlag. - 2008.

10. Jacek Malczewski GIS-based land-use suitability analysis: a critical overview // Progress in Planning. - 2004. - Vol. 62. - P. 3-65.

11. Keim D.A. Information visualization and visual data mining // IEEE Transactions on Visualization and Computer Graphics. - 2002. - Vol. 8. - P. 1-8.

12. Li W., Linna L., Goodchild M.F., Anselin L. A geospatial cyberinfrastructure for urban economic analysis and spatial decision-making // ISPRS International Journal of Geo-Information.

- 2012. - № 2. - Р. 413-431.

13. Wang, S A cyberGIS framework for the synthesis of cyberinfrastructure, GIS, and spatial analysis // Annals of the Association of American Geographers. - 2010. - Vol. 100. - P. 535-557.

14. Hart G., Dolbear C. Linked Data: A Geographic Perspective. - Taylor & Francis. - 2013.

15. Ahmed Loai Ali, Falko Schmid Data Quality Assurance for Volunteered Geographic Information // Geographic Information Science Lecture Notes in Computer Science. - 2014.

- Vol. 8728. - P 126-141.

16. Michael F. Goodchild,, Linna Li Assuring the quality of volunteered geographic information // Spatial Statistics. - 2012. - Vol. 1. - P. 110-120.

17. David Fairbairn Mapping Disorder: An Exploratory Study. Modern Trends in Cartography // Lecture Notes in Geoinformation and Cartography. - 2015. - P. 13-22.

18. Popovich, V., Vanurin, S., Kokh, S., Kuzyonny, V. Intellectual Geographic Information System for navigation safety // IEEE Aerospace and Electronic Systems Magazine. - 2011. - Vol. 26.

- P. 29-31.

19. Edwin Lughofer Evolving Fuzzy Systems - Methodologies, Advanced Concepts and Applications. - Springer Science & Business Media, 2011.

20. Plamen Angelov, Dimitar P. Filev,Nik Kasabov Evolving Intelligent Systems: Methodology and Applications. - John Wiley & Sons, 2010.

21. Plamen Angelov Autonomous Learning Systems: From Data Streams to Knowledge in Realtime. - John Wiley & Sons, 2012.

22. https://support.google.com/mapmaker/?hl=ru#topic=3180752 (дата обращения 01.09.2014).

23. http://clubs.ya.ru/narod-karta/ (дата обращения 01.09.2014).

24. Беляков С.Л., Розенберг И.Н. Программные интеллектуальные оболочки геоинформационных систем. - М.: Научный мир, 2010. - 132 c.

25. Беляков С.Л., Диденко Д.А., Самойлов Д.С. Адаптивная процедура управления представлением рабочей области электронной карты // Известия ЮФУ. Технические науки.

- 2011. - № 1 (114). - С. 125-130.

26. Luger G.F. Artificial Intelligence: Structures and Strategies for Complex Problem Solving.

- Addison Wesley. - 2004.

27. Вагин В.Н., Головина Е.Ю., Загорянская А.А., Фомина М.В. Достоверный и правдоподобный вывод в интеллектуальных системах / Под ред. Вагина В.Н. и Поспелова Д.А.

- М.: Физматлит, 2008. - 712 c.

28. Stanislav L. Belyakov, Alexander V. Bozhenyuk, Marina L. Belykova, Igor N. Rozenberg. Model Of Intellectual Visualization Of Geoinformation Service // Proceedings 28th European Conference on Modelling and Simulation ECMS 2014, Flaminio Squazzoni, Fabio Baronio, Claudia Archetti, Marco Castellani (Editors). - P. 326-332.

29. Кормен Т., Лейзерсон Ч., Ривест Р., Штайн К. Алгоритмы. Построение и анализ. - 2-е изд. - М.: Вильямс, 2005. - 1296 c.

REFERENCES

1. Rozenberg I.N. Sputnikovye i geoinformatsionnye tekhnologii v intellektual'nykh sistemakh upravleniya [Satellite and GIS technologies in intelligent control systems], Zheleznodorozhnyy transport [Railway Transport], 2013, No. 3, pp. 28-32.

2. G. Randy Keller, Chaitanya Baru. Geoinformatics: Cyberinfrastructure for the Solid Earth Sciences. Cambridge University Press, 2011.

3. Krishna Sinha Geoinformatics: Data to Knowledge. - Geological Society of America, 2006.

4. Allan Brimicombe, Chao Li Location-Based Services and Geo-Information Engineering. John Wiley & Sons, 2009.

5. Chaowei Yang, Min Sun, Kai Liu, Qunying Huang, Zhenlong Li, Zhipeng Gui, Yunfeng Jiang, Jizhe Xia, Manzhu Yu, Chen Xu, Peter Lostritto, Nanying Zhou Contemporary Computing Technologies for Processing Big Spatiotemporal Data, Space-Time Integration in Geography and GIScience, 2015, pp. 327-351.

6. Belyakov S.L., Belyakova M.L., Samoylov D.S. Geoinformatsionnyy servis situatsionnogo tsentra /Geoinformation Service of the Situational Center], Informatsionnye tekhnologii [Information Technologies], 2011, No. 8, pp. 29-32.

7. Berlyant A.M. Kartograficheskiy metod issledovaniya [The cartographic method of research]. Moscow: Izd-vo MGU, 1978, 255 p.

8. Holger Faby, Andreas Koch From maps to neo-cartography. Available at: http://cartography-gis.com/pdf/64_Faby_Koch_Austria_paper.pdf (Accessed 07 June 2015)

9. Pettit C., Cartwright W., Bishop I., Lowell K., Puller D., Duncan D. Landscape Analysis and Visualisation, Spatial Models for Natural Resource Management and Planning. Berlin: Springer-Verlag, 2008.

10. Jacek Malczewski GIS-based land-use suitability analysis: a critical overview, Progress in Planning, 2004, Vol. 62, pp. 3-65.

11. Keim D.A. Information visualization and visual data mining, IEEE Transactions on Visualization and Computer Graphics, 2002, Vol. 8, pp. 1-8.

12. Li W., Linna L., Goodchild M.F., Anselin L. A geospatial cyberinfrastructure for urban economic analysis and spatial decision-making, ISPRS International Journal of Geo-Information, 2012, No. 2, pp. 413-431.

13. Wang, S A cyberGIS framework for the synthesis of cyberinfrastructure, GIS, and spatial analysis, Annals of the Association of American Geographers, 2010, Vol. 100, pp. 535-557.

14. Hart G., Dolbear C. Linked Data: A Geographic Perspective. Taylor & Francis, 2013.

15. Ahmed Loai Ali, Falko Schmid Data Quality Assurance for Volunteered Geographic Information, Geographic Information Science Lecture Notes in Computer Science, 2014, Vol. 8728, pp. 126-141.

16. Michael F. Goodchild, Linna Li Assuring the quality of volunteered geographic information, Spatial Statistics, 2012, Vol. 1, pp. 110-120.

17. David Fairbairn Mapping Disorder: An Exploratory Study. Modern Trends in Cartography, Lecture Notes in Geoinformation and Cartography, 2015, pp. 13-22.

18. Popovich, V., Vanurin, S., Kokh, S., Kuzyonny, V. Intellectual Geographic Information System for navigation safety, IEEE Aerospace and Electronic Systems Magazine, 2011, Vol. 26, pp. 29-31.

19. Edwin Lughofer Evolving Fuzzy Systems - Methodologies, Advanced Concepts and Applications. Springer Science & Business Media, 2011.

20. Flamen Angelov, Dimitar P. Filev,Nik Kasabov Evolving Intelligent Systems: Methodology and Applications. John Wiley & Sons, 2010.

21. Plamen Angelov Autonomous Learning Systems: From Data Streams to Knowledge in Realtime. John Wiley & Sons, 2012.

22. Available at: https://support.google.com/mapmaker/?hl=ru#topic=3180752 (Accessed 01 September 2014).

23. Available at: http://clubs.ya.ru/narod-karta/ (Accessed 01 September 2014).

24. Belyakov S.L., Rozenberg I.N. Programmnye intellektual'nye obolochki geoinformatsionnykh system [Software intellectual sheath geographic information systems]. Moscow: Nauchnyy mir, 2010, 132 p.

25. Belyakov S.L., Didenko D.A., Samoylov D.S. Adaptivnaya protsedura upravleniya predstavleniem rabochey oblasti elektronnoy karty [Adaptive procedure of management by representation of working area of an electronic card], Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2011, No. 1 (114), pp. 125-130.

26. Luger G.F. Artificial Intelligence: Structures and Strategies for Complex Problem Solving. Addison Wesley. 2004.

27. Vagin V.N., Golovina E.Yu., Zagoryanskaya A.A., Fomina M.V. Dostovernyy i pravdopodobnyy vyvod v intellektual'nykh sistemakh [Credible and plausible inference in intelligent systems], Under ed. Vagina V.N. i Pospelova D.A. Moscow: Fizmatlit, 2008, 712 c.

28. Stanislav L. Belyakov, Alexander V. Bozhenyuk, Marina L. Belykova, Igor N. Rozenberg. Model Of Intellectual Visualization Of Geoinformation Service, Proceedings 28th European Conference on Modelling and Simulation ECMS 2014, Flaminio Squazzoni, Fabio Baronio, Claudia Archetti, Marco Castellani (Editors), pp. 326-332.

29. Kormen T., Leyzerson Ch., Rivest R., Shtayn K. Algoritmy. Postroenie i analiz [Algorithms. The construction and analysis], 2nd ed. Moscow: Vil'yams, 2005, 1296 p.

Статью рекомендовал к опубликованию д.т.н., профессор Н.И. Витиска.

Беляков Станислав Леонидович - Южный федеральный университет; e-mail: [email protected]; 347928, Таганрог, Некрасовский пер., 44; тел.: +78634371695; кафедра информационно-аналитических систем безопасности; д.т.н.; профессор.

Боженюк Александр Витальевич - e-mail: [email protected]; д.т.н.; профессор.

Розенберг Игорь Наумович - ОАО «Научно-исследовательский и проектно-конструкторский институт инженеров железнодорожного транспорта» (НИИАС); e-mail: [email protected]; 109029, г. Москва, ул. Нижегородская, 27, стр. 1; тел.: 84959677701; зам. генерального директора; д.т.н.

Belyakov Stanislav Leonidovich - Southern Federal University; e-mail: [email protected]; 44, Nekrasovsky, Taganrog, 347928, Russia; phone: +78634371695; the department of informationanalytical systems of safety; dr.of eng. sc.; professor.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Bozhenyuk Alexander Vitalievich - e-mail: [email protected]; dr. of eng. sc.; professor.

Rozenberg Igor Naymovich - Public corporation "Research and development institute of railway engineers"; e-mail: [email protected]; 27/1, Nizhegorodskaya, Moscow, 109029, Russia; phone: +74959677701; deputy director; dr. of eng. sc.

i Надоели баннеры? Вы всегда можете отключить рекламу.