Научная статья на тему 'Технология разработки порталов научных знаний'

Технология разработки порталов научных знаний Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
180
67
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Загорулько Ю. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Технология разработки порталов научных знаний»

,<2,V) (11)

il, если операция jpis предшествует j'pis'; w......=<

jpis,j pis Л . f • •

[О, если операция j pis предшествует jpis,

(12)

(13)

V(jpis,j'pis')<El(

(A,0,V) :

¡=1 ¡=1

Ъ= . (14)

В вышеприведенной модели соотношения (6) и (7) описывают зависимости текущих задержек начала обслуживания заявок от предшествующих задержек, соотношение (8) определяет компенсированные задержки, соотношения (9) и (10) описывают отношения предшествования-следования технологических операций при соблюдении временных ограничений на межоперационные задержки, соотношения (11) и (12) определяют условия неодновременности выполнения некоторых пар операций, соотношения (13) и (14) реализуют минимаксный критерий максимального быстродействия ОС.

Условия (6)-(13) содержат рекурсивные функции, при раскрытии которых задачи, подобные (1)-(14), редуцируются в задачу частично целочисленного линейного программирования сверхбольшой размерности. Подобные механизмы разработаны и подробно рассмотрены в [3].

Таким образом, для корректного решения практических задач календарного планирования нанотехнологических производств необходимо

строить итерационные алгоритмы, основанные на разбиении глобальной задачи оптимизации расписаний III ЮС на подзадачи, с оптимизацией расписаний и итерационной синхронизацией входных и выходных параметров локальных подзадач. Подобные алгоритмы представлены в [3, 4].

Итак, в данной работе представлен подход к планированию производств с учетом особенностей нанотехнологий. Конкретизация подхода возможна не только на основе анализа существующих технологий производства наноматериа-лов путем апостериорного определения зависимо" fk/ 1 2 „m „1т 2 т m

стеи Sj =fj ................. 'Pj.' -'Pj. ) •

Специфика производства в данном случае позволяет получить такие зависимости, непосредственно опираясь на математические модели межатомных и межмолекулярных взаимодействий. Поэтому решение представленной задачи актуально как для действующих производств, так и для перспективных разработок в области нанотех-нологий.

Литература

1. Рыбалкина М. Нанотехнологии для всех. URL: www.nanonewsnet.ru (дата обращения: 20.08.2009). 2006. 436 с.

2. Драгунов В.П., Неизвестный И.Г., Гридчин В.А. Основы наноэлектроники: учеб. пособ. Новосибирск: Изд-во НГТУ, 2000. 332 с.

3. Мезенцев Ю.А. Оптимизация расписаний параллельно-последовательных систем в календарном планировании // Информационные технологии. М.: Изд-во «Новые технологии». 2009. № 6. С. 35-41.

4. Мезенцев Ю.А. Оптимизация расписаний последовательно-параллельных обслуживающих систем // Программные продукты и системы. 2009. № 1. С. 22-26.

ТЕХНОЛОГИЯ РАЗРАБОТКИ ПОРТАЛОВ НАУЧНЫХ ЗНАНИЙ

Ю.А. Загорулько, к.т.н. (Институт систем информатики им.. А.П. Ершова СО РАН,

г. Новосибирск, zagor@iis.nsk.su)

Статья посвящена описанию технологии построения порталов научных знаний, обеспечивающих содержательный доступ к знаниям и информационным ресурсам определенной области знаний. Рассматриваются концепция, архитектура и информационная модель портала научных знаний, средства поддержки его разработки, настройки и сопровождения.

Ключевые слова: портал знаний, информационная модель, онтология, информационные ресурсы, содержательный доступ.

В сети Интернет представлен большой объем знаний и информационных ресурсов по различным областям. Однако доступ к этим ресурсам значительно ограничен из-за того, что они слабо структурированы, недостаточно систематизированы и к тому же рассредоточены по всевозможным интернет-сайтам, библиотекам и архивам. Решению этой проблемы могла бы помочь реализация концепции Semantic Web [1], основной целью которого является обеспечение возможности выражения смысла (семантики) информационных ресурсов, представленных в Интернете. К сожале-

нию, сейчас объем ресурсов, отвечающих требованиям Semantic Web, - лишь капля в океане информации, доступной через Интернет.

Для решения этой проблемы предлагается строить специализированные порталы знаний, которые обеспечивали бы систематизацию знаний и информационных ресурсов по требуемой научной тематике, их интеграцию в единое информации-онное пространство и содержательный доступ к ним [2]. При этом данный подход естественным образом интегрирует наиболее важные компоненты технологии Semantic Web, в частности, исполь-

зование онтологии для представления семантики информационных ресурсов и поддержки их интеллектуального анализа.

В данной статье описываются технология построения порталов научных знаний и ее основные компоненты: информационная модель и архитектура портала научных знаний, средства поддержки его разработки, настройки и сопровождения.

Информационная модель портала знаний

Информационная модель должна обеспечивать унифицированное представление и хранение знаний и данных по тематике портала, на ее основе должны строиться внутренние хранилища данных портала, базироваться его информационное наполнение, логический вывод, навигация и поиск. В связи с этим в качестве ядра такой модели выбрана онтология, которая является удобным средством описания областей знаний [3].

Формально онтология портала представляет собой семерку вида 0=(С, R, Т, D, A, F, Ах), где C - конечное непустое множество классов, описывающих понятия некоторой предметной или проблемной области (ПрО); R - конечное множество бинарных отношений, заданных на классах (понятиях); T - множество стандартных типов; D - множество доменов (множеств значений стандартного типа string); A - конечное множество атрибутов, описывающих свойства понятий C и отношений R; F - множество ограничений на значе-

ния атрибутов понятий и отношений; Ах - множество аксиом, определяющих семантику классов и отношений онтологии.

В онтологии выделены три типа отношений: Ит - асимметричное, транзитивное, нерефлексивное бинарное отношение наследования, на базе которого могут строиться иерархии понятий С;

- бинарное транзитивное отношение включения («часть-целое») и ЯА - конечное множество ассоциативных отношений. Особенностью отношений ЯА является то, что предложенный формализм позволяет задавать для них атрибуты, специализирующие связи между аргументами (объектами).

Для упрощения настройки портала на выбранную область знаний в его онтологии выделены базовые онтологии, не зависящие от ПрО портала, и предметная онтология, описывающая определенную область знаний. В качестве базовых онтоло-гий выступают онтологии научной деятельности и научного знания [2].

Онтология научной деятельности (рис. 1) включает базовые понятия, относящиеся к организации научно-исследовательской работы и используемые для описания ее участников (исследователей и организаций), мероприятий (семинаров и конференций), научных программ и проектов, публикаций. В эту онтологию также включено понятие интернет-ресурса, служащее для описания информационных ресурсов, представленных в сети Интернет.

Онтология научного знания содержит метапо-нятия, задающие структуры для описания ПрО (научной дисциплины) портала знаний, позволяющие выделить в данной науке значимые разделы и подразделы, задать типизацию предметов, объектов и методов исследования, описать результаты научной деятельности и произведенные и используемые в ходе ее выполнения продукты.

Понятия описанных выше онтологий связаны между собой ассоциативными отношениями (рис. 1), выбор которых осуществлялся исходя не только из полноты представления ПрО портала, но и из удобства навигации по его информационному пространству и поиска информации. (Следует заметить, что понятие интернет-ресурса связано практически со всеми понятиями, поэтому, чтобы не загромождать рисунок, все его связи показаны пунктирной линией.)

Понятия онтологии ПрО, описывающие конкретную научную дисциплину, строятся на основе метапонятий онтологии научного знания и могут быть упорядочены в иерархию «общее-частное».

Представленная выше онтология не только описывает ПрО портала, но и задает структуры для представления реальных объектов и связей между ними. В соответствии с этим данные на портале представлены как множество взаимосвязанных информационных объектов (ИО). Каждый ИО соответствует некоторому понятию онтологии (является его экземпляром) и имеет заданную им

структуру. Между конкретными ИО могут существовать связи, семантика которых определяется отношениями, заданными между соответствующими понятиями онтологии. Совокупность таких ИО и их связей образует информационное содержание, или контент портала.

Для решения задач поиска и автоматизации наполнения контента портала в информационную модель включен тезаурус, который является лингвистическим дополнением онтологии. Он содержит термины ПрО портала, то есть слова и словосочетания, с помощью которых понятия онтологии представляются в текстах и пользовательских запросах. Термины тезауруса связываются традиционными тезаурусными отношениями, главными из которых являются отношения «общее-частное» и синонимия. Между терминами тезауруса и понятиями онтологии устанавливаются отношения соответствия, создающие предпосылки для их совместного использования при поиске и обработке информации.

Архитектура портала знаний

Портал знаний имеет традиционную трехуровневую архитектуру (рис. 2): уровень доступа к информации, уровень обработки информации и базовый уровень.

Уровень доступа к информации обеспечивается пользовательским интерфейсом. Его главными функциями являются представление пользова-

Пользовательский интерфейс

Подсистема навигации и поиска

Результаты

I

Предметные Предметные / Настройка знания знания

База знаний

Подсистема сбора онтологической информации о ресурсах

Базовые онтологии

Онтология предметной области

визуализации данных

Настройка базы знаний

Предметные знания

Разнородные документы в Интернете

Предметные данные

Управление контентом

Редактор данных

Рис. 2. Архитектура портала знаний

тельских запросов и результатов поиска, а также обеспечение удобной навигации в информационном пространстве портала. Благодаря использованию онтологии и тезауруса пользовательский интерфейс позволяет формулировать запросы в терминах предметной области портала и поддерживает управляемую онтологией навигацию по ИО и интегрированным в портал информационным ресурсам. Вся информация о конкретном объекте и его связях отображается в виде HTML -страницы, формат и наполнение которой зависят от свойств понятия, экземпляром которого является данный объект, а также заданного для него шаблона визуализации. При этом объекты, связанные с данным объектом, представляются на его странице в виде гиперссылок, по которым можно перейти к их детальному описанию.

Уровень обработки информации включает подсистему навигации и поиска информации, средства настройки базы знаний портала и управления его контентом, а также подсистему сбора онтологической информации о ресурсах [4].

Настройка базы знаний выполняется с помощью редакторов онтологий и тезаурусов. Для управления контентом служит редактор данных, который позволяет создавать, редактировать и удалять ИО и связи между ними. Все эти редакторы реализованы как web -приложения, поэтому обеспечивают удаленную настройку портала и поддержку его контента экспертами через Интернет.

Подсистема сбора онтологической информации выполняет поиск релевантных информационных ресурсов (документов) в Интернете, их семантический анализ и индексирование (аннотирование) в терминах онтологии портала знаний. Содержимое аннотаций сохраняется в хранилище данных и вместе с другими ИО используется при поиске и навигации по контенту портала.

В качестве хранилища данных используется специальная БД, в которой одновременно хранятся и контент портала, и описание онтологии. Предложенная схема представления знаний и данных позволяет редактировать онтологию не только во время разработки, но и при эксплуатации портала.

Технология построения и сопровождения портала научных знаний

Построение портала научных знаний в рамках предлагаемого подхода фактически сводится к настройке на заданную ПрО типового портала знаний, информационная модель и архитектура которого описаны выше, а также к созданию его контента. В связи с этим процесс построения портала предполагает выполнение следующих действий: разработка онтологии и тезауруса ПрО, настройка пользовательского интерфейса и информационное наполнение портала знаний.

Процесс построения онтологии ПрО портала знаний состоит из следующих шагов.

1. Построение базовых иерархий. Выявляются наиболее важные (базовые) понятия ПрО и упорядочиваются в иерархии «общее-частное» и, если необходимо, «часть-целое», причем вершиной каждой такой иерархии является одно из ме-тапонятий онтологии знаний. При этом выполняется обращение к экспертам, энциклопедическим словарям, учебникам и другим источникам, где уже дана какая-то систематизация понятий данной ПрО.

2. Выявление дополнительных понятий и отношений ПрО. Выявляются понятия ПрО, не вошедшие ни в одну из иерархий, а также существующие между ними отношения. Для этого собирается достаточно представительный корпус текстов, релевантных ПрО портала. Затем с помощью ручной и машинной обработки текстов извлекается значимая лексика, то есть слова и словосочетания, наиболее точно характеризующие данную область знаний. Полученный словник передается экспертам. Эксперты выбирают наиболее предпочтительные термины, которые будут использоваться в качестве названий понятий и отношений в онтологии ПрО. Для каждого такого понятия и отношения разрабатываются точные текстовые определения. Термины, не попавшие в разряд предпочтительных, в дальнейшем будут включены в тезаурус в качестве синонимов последних.

3. Кодирование онтологии. С помощью редактора онтологий создается формальная спецификация онтологии, включающая: иерархии понятий; множество заданных на понятиях отношений; множество атрибутов, описывающих свойства понятий и отношений; множество доменов, определяющих значения атрибутов; множество ограничений и аксиом, описывающих свойства классов и отношений.

Параллельно с разработкой онтологии с использованием тех же корпусов текстов и словников строится тезаурус ПрО.

Настройка пользовательского интерфейса выполняется для более удобного представления информации пользователю портала. При этом используются включенные в редактор онтологии средства настройки визуализации знаний и данных, с помощью которых для каждого понятия в терминах онтологии (понятий, атрибутов, отношений) задается шаблон визуализации ИО - экземпляров этого понятия и шаблон визуализации ссылок на них.

Создание контента портала знаний выполняется как вручную - с помощью редактора данных, так и автоматизированно - с использованием подсистемы сбора онтологической информации о ресурсах.

Следует заметить, что предложенная технология обеспечивает возможность не только опера-

тивного пополнения контента, но и декларативной подстройки онтологии портала знаний в ходе его эксплуатации, что позволяет отслеживать динамику появления новых знаний и типов информационных ресурсов по его тематике и тем самым поддерживать его в актуальном состоянии.

Таким образом, в статье предложена технология, поддерживающая разработку порталов научных знаний без участия разработчиков-программистов. Для создания портала требуются только инженеры знаний - специалисты в представлении знаний и эксперты - носители знаний в моделируемой ПрО.

На основе этой технологии были разработаны археологический портал знаний (http://www.sati. archaeology.nsc.ru/classarch2/) и портал знаний по компьютерной лингвистике (http://uniserv.iis. nsk.su/cl/), обеспечивающие содержательный доступ широкому кругу пользователей к системати-

зированным знаниям и информационным ресурсам по археологии и компьютерной лингвистике соответственно.

Литература

1. Tim Berners-Lee, James Hendler and Ora Lassila. The Semantic Web // Scientific American, May 2001, pp. 29-37.

2. Загорулько Ю.А., Боровикова О.И., Загорулько Г.Б. Организация содержательного доступа к информационным ресурсам на основе онтологий // Электронные библиотеки: перспективные методы и технологии, электронные коллекции : тр. 9-й Всеросс. науч. конф. RCDL'2007. Переславль-Залесский: Изд-во «Университет города Переславля», 2007. Т. 1. С. 217224.

3. Guarino N. Formal Ontology in Information Systems. Proceedings of FOIS'98, Trento, Italy, 6-8 June 1998. Amsterdam, IOS Press, pp. 3-15.

4. Боровикова О.И., Загорулько Ю.А., Сидорова Е.А. Подход к автоматизации сбора онтологической информации для интернет-портала знаний // Компьютерная лингвистика и интеллектуальные технологии : тр. Междунар. конф. Диа-лог'2005. М.: Наука, 2005.

ЭКСПЕРТНАЯ СИСТЕМА ИДЕНТИФИКАЦИИ ТЕХНИЧЕСКОГО СОСТОЯНИЯ ТЕХНОЛОГИЧЕСКОГО ОБОРУДОВАНИЯ НА ОСНОВЕ НЕЙРОСЕТЕВОЙ МОДЕЛИ

С.В. Нусс (Пермский государственный технический университет, S.Nuss@ies-holdmg.com)

Излагается методика построения экспертной системы идентификации технического состояния технологического оборудования на основе нейросетевой модели.

Ключевые слова: экспертная система, идентификация технического состояния, технологическое оборудование, нейросетевая модель, формальный нейрон.

Подавляющее большинство отечественных промышленных предприятий применяет стратегию управления техническим состоянием оборудования на основе планово-предупредительных ремонтов. Эта стратегия обеспечивает поддержание необходимого уровня надежности оборудования, но имеет серьезный недостаток: при планировании технического обслуживания фактическое состояние оборудования практически не учитывается. Повышение эффективности ремонта достигается переходом к более прогрессивной стратегии - ремонту по фактическому состоянию, когда начало и объем работ определяются в зависимости от состояния оборудования. Применение подобной стратегии подразумевает наличие достоверной и оперативной информации об отказах в узлах и механизмах оборудования.

Современный уровень развития средств измерения позволяет проводить измерения подавляющего числа параметров оборудования непосредственно в процессе его эксплуатации под нагрузкой. Однако ввиду значительной сложности установления причинно-следственной связи между соотношением параметров оборудования и его техническим состоянием применяемые на практике ме-

тодики идентификации технического состояния базируются на специализированных математических моделях, описывающих узел или механизм только определенного типа оборудования [1]. Распространение таких моделей (как и их применение) на другие типы оборудования персоналом без определенного опыта работы затруднительно.

Выходом из сложившейся ситуации является разработка специализированного программного комплекса - экспертной системы, позволяющей изменять структуру базы знаний, дополнять ее новыми знаниями для решения задачи идентификации технического состояния при минимальном участии специалистов-экспертов [2]. В данной статье для организации экспертной системы идентификации технического состояния технологического оборудования предлагается использовать новый подход, основанный на применении нейро-сетевой модели. Такой подход позволяет на основе имеющейся на промышленных предприятиях статистики, содержащей излишние и противоречивые данные о значениях параметров и соответствующих им технических состояниях технологического оборудования, выявлять и распространять на вновь измеренные параметры оборудования

i Надоели баннеры? Вы всегда можете отключить рекламу.