Научная статья на тему 'Электронный документооборот и генерализация электронных карт в ГИС'

Электронный документооборот и генерализация электронных карт в ГИС Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
343
104
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Электронный документооборот и генерализация электронных карт в ГИС»

6. Eden C. Cognitive mapping // European Journal of Operational Research-1998. № 36.-pp. 1-13.

7. Волкова В.Н., Денисов А.А. Основы теории систем и системного анализа: Уч. - СПб.: Изд-во СПГГТУ, 1998.- 510 с.

8. Пьявченко О.Н., Горелова Г.В., Боженюк А.В., Клевцов С.А., Каратаев В.Л., Радченко С.А., Клевцова А.Б. Методы и алгоритмы моделирования развития сложных ситуаций.-Таганрог: ТРТУ, 2003.- 157 с.

С.Л. Беляков

ЭЛЕКТРОННЫЙ ДОКУМЕНТООБОРОТ И ГЕНЕРАЛИЗАЦИЯ ЭЛЕКТРОННЫХ КАРТ В ГИС

Генерализация является обязательным элементом процесса создания любой географической карты [1, 2]. Процедура генерализации заключается в отборе главного и существенного и целенаправленном его обобщении в соответствии с назначением, тематикой и масштабом карты. Во многом из-за присутствия процедуры генерализации картосоставление остается трудноформализуемой задачей и не поддается автоматизации. Причина - в значительной роли опыта и интуиции картографа, в применении утрирования - сознательного искажения формы генерализуемого объекта.

Электронные карты геоинформационных систем (ГИС) строятся в соответствии со всеми принципами картографии. Важной особенностью электронных карт является способность изменяться в процессе эксплуатации, вбирая в себя новые сведения о событиях и явлениях. Подобная динамичность отсутствует у неэлектронных карт. Существенны отличия в механизме использования генерализации: в «традиционной» картографии генерализация применяется только при проектировании, в «электронной» картографии - как при проектировании, так и в любой момент использования картографической информации пользователем. Многие области применения географических карт таковы, что использование неактуальных данных приводит к недопустимым потерям. Поскольку процесс накопления информации непрерывен, логично осуществлять отбор главного и существенного не только в соответствии с назначением, тематикой и масштабом карты, но и соответственно указанному временному интервалу. Это требует построения программ автоматической генерализации, направленных на обеспечение актуальности картографических данных.

В данной работе анализируется механизм генерализации, использующий электронный документооборот. Целью анализа является выявление особенностей процедур обработки электронных документов.

Современные предприятия и учреждения немыслимы без компьютерной техники, без связи, без информационных систем. В информационной поддержке нуждаются практически все функции предприятия, начиная с регистрации работников и заканчивая решением сложных вопросов оперативного управления. Информационную инфраструктуру предприятия образуют системы, обеспечивающие его функционирование. Обобщенно структуру связи информационных систем промышленного предприятия можно изобразить так, как показано на рис. 1. Каждая из систем является источником информации, которая в различной степени может использоваться в ГИС для актуализации.

Коммуникационная среда обеспечивает совместную работу отдельных информационных систем. В ее функции входит:

• установление связи между работающими компонентами систем;

• надежная передача по установленным соединениям;

Рис. 1. Структура связи информационных систем промышленного предприятия

• восстановление после ошибок или сбоев в среде коммуникации;

• защита информации;

• высокоуровневый коммуникационный сервис: электронная почта, Web-службы, поисковая система.

Внутренняя организация коммуникационной среды может быть достаточно сложной. Современные принципы построения подобных систем направлены на создание многоуровневого программного обеспечения, которое делает взаимодействие через коммуникационную среду «прозрачным». Для взаимодействия используются высокоуровневые механизмы, многие из которых уже приняты как стандарты систем обработки информации. Данные о суммарном трафике, направлении и интенсивности информационных потоков полезны ГИС для планирования собственной работы - реализации процедур снижения избыточности [3].

SCADA-системы внедряются для сбора информации и управления технологическими системами предприятия. Под технологической системой понимается комплекс оборудования, необходимого для переработки сырья. Входной информационный поток SCADA образуют сигналы от датчиков физических параметров и команды управления, отдаваемые оператором. Информационная база SCADA включает в себя оперативные данные о состоянии технологической системы, базу знаний об управлении технологическим процессом, архивную информацию о работе системы на длительных временных интервалах.

Система электронного документооборота (СЭД) предназначена для управления потоком электронных документов. Информационная база СЭД содержит весьма разнородный набор объектов:

• нормативные документы предприятия;

• техническую документацию на выпускаемую продукцию;

• архив деловой переписки;

• директивные документы: приказы, распоряжения, служебные записки;

• первичные документы: накладные, акты, реестры, журналы;

• документы электронных средств коммуникации: письма электронной почты, факсимильные сообщения.

Несмотря на различную природу, содержимое информационных баз SCADA и СЭД по сути являет собой информацию, непосредственно необходимую для планирования и управления производством. Информационные объекты этих систем

являются моделями внешних событий, которые влияют на состояние всей производственной системы. Для задачи актуализации данных ГИС эти объекты играют первостепенную роль.

Системы бухгалтерского и налогового учета относительно обособлены и выполняют специальные учетные функции. Примечательно, что бухгалтерский учет предусматривает в качестве элемента учет основных (материальных) средств предприятия. В информационной базе данной системы, таким образом, находят отражение стоимостные характеристики, затраты на обслуживание и реконструкцию объектов. Документооборот системы бухгалтерского и налогового учета может быть изолирован от внешних систем, однако для решаемой задачи получить доступ к части документов необходимо: подсистема материального учета содержит оперативную информацию о движениях материалов, комплектующих и готовой продукции.

Системы автоматизированного проектирования (САПР) используют подразделения предприятия, связанные с технологической и конструкторской подготовкой производства. В среде САПР разрабатываются проекты новых изделий и, соответственно, оборудования и процессов для их выпуска. Системы подобного типа имеют специальное назначение, что естественным образом влияет на структуру и содержание их информационной базы. Получение информации, касающейся технологической подготовки производства - размещения и модернизации оборудования, перенастройки существующих процессов - может повысить степень достоверности актуализации данных в ГИС.

Системы экологического мониторинга обеспечивают наблюдение за состоянием окружающей среды, оценивают влияние на нее процесса производства. Информационная база таких систем содержит результаты многолетних наблюдений и лабораторных исследований. Сведения из данного информационного источника позволяют косвенно судить о состоянии ландшафта.

Геоинформационная система предприятия, по сути, играет роль кадастра. Механизмы пространственной и временной привязки, которые заложены в ГИС, универсальны и позволяют связывать практически любую информацию с объектами электронной карты. Этим определяется роль и место ГИС в информационной инфраструктуре:

• ГИС выступает как интегрирующая подсистема, средствами которой данные из всех источников систематизируются и накапливаются в единой информационной базе. Группирование и обобщение данных осуществляется вручную и автоматизированным способом. В любом случае разнообразные и разносторонние сведения о предприятии и учреждении активно перерабатываются перед их вводом;

• ГИС является системой для хранения исторических данных о предприятии или учреждении. Ни один из элементов инфраструктуры подобную функцию не выполняет. Кадастровые данные не удаляются никогда. Именно по ним можно получить ретроспективу развития отдельных объектов или их совокупностей;

• ГИС играет роль справочной системы. Это означает, что данные о любом объекте доступны в любой момент времени, могут быть введены или модифицированы в произвольный момент времени. Кроме того, параллельно должны обслуживаться многие пользователи с учетом разграничения полномочий доступа к информации. Разнообразные сведения, которые можно получить через кадастровую систему, доступны через средства формирования запросов, встроенные в ГИС;

• ГИС представляет собой средство для интеллектуальной деятельности пользователя. Электронные карты используют образное представление данных и знаний, богаты фактографической информацией, содержат множество ссылок на источники мультимедиа данных. В совокупности с механизмами пространственного анализа, картометрии, трехмерной визуализации это образует интеллектуальную среду для анализа, моделирования и принятия решений.

Электронный документ в информационной структуре предприятия следует рассматривать как информационный объект, отображающий внешнее событие, которое должно фиксироваться ГИС. Концептуально имеет место цепочка «документ - событие - картографический объект», описывающая причинно-следственную связь между событиями реального мира и изменением элементов электронной карты. Заметим, что оба звена цепи отражают неоднозначную и нечеткую связь между концептами.

Документы могут либо непосредственно направляться ГИС, либо храниться в других звеньях инфраструктуры. В любом случае для фиксации сведений о внешнем событии документ должен нести информацию следующего содержания:

• данные для пространственной и временной локализации объектов электронной карты;

• указание на правила получения графического образа картографического объекта, если событие приводит к его модификации;

• сведения для вычисления атрибутов картографических объектов, модифицированных после наступления события.

Субъективной мерой достоверности сведений о наступлении события X будем считать значение

У(Х) е ] 0 , 1 [,

установленное экспертным путем. Любой документ В характеризуется вектором достоверности

(У1(Бк) ,У2(Бк),...,Ум(Бк)},

где У/Бь) - достоверность сведений, которые несет документ об изменении состояния /-го картографического объекта. Размерность данного вектора в общем случае совпадает с числом картографических объектов в электронной карте, которое достаточно велико. Однако принципы организации ГИС таковы, что несущественные элементы вектора достоверности легко устраняются: любой картографический объект принадлежит только одному тематическому слою. Это существенно сужает область действия каждого документа. Предлагаемая мера достоверности свойств документа привлекательна тем, что:

• отражает вербальные формулировки мнений экспертов. Например, годовой план реконструкции предприятия с достоверностью 0,2 инициирует замену оборудования в заводской лаборатории, однако акт передачи техники со склада в плановый отдел свидетельствует с достоверностью 0,9 о том, что замена произведена;

• интегральным образом позволяет судить о процессах, последовавших за событием. Пропорционально уровню достоверности модифицируется графическое изображение, многие его параметры могут представляться линейно зависящими от уровня достоверности. Аналогично может строиться расчет числовых атрибутов.

На рис. 2-6 приведен в качестве примера участок плана, отображающий стадии замены оборудования в одном из помещений. На рис. 2 изображен исходный вид: контуры оборудования показаны сплошной линией. На рис. 3 отображена ситуация замены оборудования в одном из помещений: контуры оборудования показаны пунктиром, сделана соответствующая надпись. План данного помещения обобщенно отражает его состояние на временном интервале с нечетко определенными границами. На практике показанная ситуация сохраняется в течение некоторого времени, после чего сменяется ситуацией не менее неопределенного характера: старое оборудование демонтировано, помещение заполнено вспомогательными предметами - крепежом, соединителями и т.д. (см. рис. 4). Детальное отображение вида помещения не дается, вводится обобщающее изображение в виде контура

зоны демонтажа и поясняющей надписи. По прошествии некоторого времени приступают к монтажу нового оборудования, что по аналогичным причинам не отображается детально, но указывается зона выполнения работ (см. рис. 5). Наконец, по окончании монтажа до проведения геодезических работ по привязке установленных устройств приближенно указывают только область размещения нового оборудования (см. рис. 6).

1=1 1=1 1=1 1=1

1 1 П 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 и

1 1 Оборудование

73 26 демонтируется

П Г 1 1 1 __________ оо 1

1 1 1 •--» 1- 1

7 25 °

Рис. 2

Рис. 3

1=1 1=1 1=1 1=1

1=1 1=1 1=1 1=1

і=і і=і . .

Рис. 4

Рис. 5

Рис. 6

Из приведенного примера можно видеть, что картографический объект существенно меняет свой визуальный облик с течением времени. Моменты смены связываются с наступлением событий и, соответственно, появлением документов. Первым шагом разработки процедуры генерализации должно стать создание информационной базы, связывающей картографические объекты и документы. Для этого может использоваться механизм хранения атрибутивных данных, принятый в ГИС. Картографическому объекту через атрибуты сопоставляются типы или экземпляры документов. Например, помещению с установленным и привязанным оборудованием могут сопоставляться следующие документы:

• служебная записка на перепланировку помещения;

• утвержденный план размещения оборудования;

• наряд на выполнение строительно-монтажных работ в помещении;

• накладная на получение оборудования со склада;

• акт списания морально устаревшего оборудования и т.д.

Каждый из них с определенной достоверностью указывает на стадию замены оборудования.

Задача генерализации может ставиться как нахождение наиболее достоверного представления картографического объекта при имеющемся наборе электронных документов. Исходным является картографический объект К и момент времени 1', к наступлению которого актуализируется электронная карта.

Рис. 7. Граф состояний

Представим изменение объекта К нечетким графом, описывающим переходы между конечным числом состояний }, 1 = 1, N. Каждой вершине графа Si

соответствует графический объект, а исходящие дуги задают переходы, т.е. смену графических объектов [4]. Граф состояний для рассматриваемого примера показан на рис. 7. Здесь:

80 - оборудование установлено и осуществлена его привязка;

8] - оборудование демонтируется;

82 - демонтаж оборудования закончен;

83 - устанавливается новое оборудование;

84 - новое оборудование установлено, но не привязано.

Дуги графа помечены степенями принадлежности ц , которые ассоциируются с возможностью переходов из одного состояния в другое. Граф строится на основании экспертных данных и отображает реальные представления о смене графических изображений. Функцию принадлежности любому из состояний будем

рассматривать как достоверность сведений, предоставляемых картографическим объектом в этом состоянии. Содержательному смыслу задачи адекватен следующий вид функции принадлежности (рис. 8): на протяжении нечеткого интервала времени объект находится в указанном состоянии ^ , причем с течением времени

достоверность его нахождения в этом состоянии убывает. В рассматриваемом примере в состоянии 82 (демонтаж оборудования закончен) объект находится некоторое время, по истечении которого с возрастающей уверенностью можно утверждать об окончании демонтажа.

Рис.8. Функция принадлежности

Граф состояний задает множество возможных гипотез О о смене состояния картографического объекта. Каждой гипотезе соответствует путь в графе и, соответственно, последовательность состояний:

Ок е О,Ок = {^,Sъ,...,Sz}.

Любая гипотеза порождается появлением документов. Степень достоверности документа отражается кривой, аналогичной по характеру показанной на рис. 8. Задача определения наиболее достоверного состояния, таким образом, сводится к выполнению следующих действий:

• определяется временной интервал анализа. Его величина соответствует максимально возможной суммарной длительности цепочек состояний из О. Правая граница интервала совпадает с точкой 1';

• отбираются документы, относящиеся к образованному временному интервалу, и определяется степень их достоверности по отношению к возможным состояниям объекта. Данная операция строится как логический вывод, использующий экспертные оценки содержания документа;

• формируются гипотезы о последовательности смены состояний объекта. Достоверности гипотез напрямую определяются достоверностью документа;

• оцениваются достоверности каждого из состояний на момент времени 1'. Максимально достоверное достояние используется для отображения картографического объекта.

Подводя итог, следует сделать следующие выводы.

Основу процедур автоматической генерализации с целью повышения актуальности данных на основе использования электронных документов образует нечеткое прогнозирование. Суть его в построении и оценке гипотез о возможном изменении состояния картографического объекта.

Реализация процедур предполагает ведение базы знаний о влиянии документов на состояние картографических объектов. Влияние субъективно оценивается показателем достоверности документа.

Окончательно целесообразность генерализации определяется разностью потерь из-за неактуальности данных ГИС и затрат на поддержание их актуальности. Отправной точкой разработки подсистемы генерализации является поиск типов объектов электронной карты, для которых это условие будет выполнено.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Салищев К.А. Проектирование и составление карт. 2-е изд.- М.: Изд-во МГУ, 1987.- 280 с.

2. Берлянт А.М. Картографический метод исследования.- М.: Изд-во МГУ, 1988.- 288 с.

3. Берштейн Л.С., Беляков С.Л. Геоинформационные справочные системы.- Таганрог: Изд-во ТРТУ, 2001.

4. Берштейн Л.С., Боженюк А.В. Введение в теорию нечетких графов.- Таганрог: Изд-во ТРТУ, 1999.

А.В. Боженюк, А.В. Чкан

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ПРОДУКЦИОННЫЙ ВЫВОД ПРИ ЧЕТКОМ И НЕЧЕТКОМ ПРЕДСТАВЛЕНИИ ИНФОРМАЦИИ*

* Работа поддержана РФФИ (проект № 03-07-90202).

Теория нечетких множеств и основанная на ней логика [1] позволяют, используя естественный язык со всем набором имеющихся в нем средств для выражения человеческих способов рассуждений и принятия решений с помощью качественных представлений, понятий и оценок, описывать неточные категории, представления и знания, оперировать ими и делать соответствующие заключения и выводы. Использование нечеткого описания наряду с четким представлением информации позволяет всесторонне и компактно описывать общую смысловую постановку задач управления и принятия решений, возникающих в различных прикладных областях. Решение задач, в которых исходная информация включает в себя нечеткие и четкие характеристики, является в настоящее время интересной и актуальной проблемой.

Использование только теории нечетких множеств или исключительно четких методов при решении подобного рода задач является неправильным, поскольку в первом случае значения четких параметров необходимо «размывать», т.е. приводить к нечеткому виду, что в свою очередь приводит к привлечению дополнительных ресурсов, а также внесению дополнительной информации, которая в дальнейшем будет использоваться при вычислении. Причем вовлечение подобной информации не всегда представляется возможным. Во втором случае использование четких методов при решении задач, содержащих нечеткие значения параметров, приведет к необходимости преобразования нечетких значений в четкие, что неминуемо вызовет потерю информации. Очевидным выходом из сложившейся ситуации явилась бы разработка методов, которые позволили бы совместное использование как четких, так и нечетких алгоритмов обработки информации для решения такого рода задач.

В связи с этим предлагается метод, позволяющий, используя алгоритмы четкой и нечеткой обработки информации, работать с входными данными, представленными как в четком, так и нечетком виде и получать при этом достаточно точные, обоснованные решения, имеющие как четкое, так и нечеткое представление. Следует отметить, что разработанный метод также может быть использован в случае, когда параметры имеют только четкое или только нечеткое представление.

На основе вышеизложенного рассмотрим общую постановку задачи.

Пусть в базе знаний содержится набор эталонных продукционных правил, характеризующихся как нечеткими , 1 = 1, т, ] = 1, г , так и четкими ХЧ >

1 = 1, т , ] = г + 1, п входными параметрами, определяющими посылку продукции и выходным параметром , 1 = 1, т - следствие продукции:

i Надоели баннеры? Вы всегда можете отключить рекламу.