Научная статья на тему 'Нечеткая модель семантического описания интернет-ресурсов'

Нечеткая модель семантического описания интернет-ресурсов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
161
57
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Нечеткая модель семантического описания интернет-ресурсов»

Известия ТРТУ

Тематический выпуск

kJ jk

матричного типа { Г = {к }• Здесь kj - элемент на k-й строке и j-м столбце матрицы {kj}, а справа - матрица транспонированных элементов.

Диспетчирование преобразует входной поток вариантов требований пользователей, метрируемый величинами значимостей и результативностей закона Бернулли, в поток вариантов предложений, метрология которого подчиняется котетраэдному закону испытаний Лапласа и Теппера. Данный переход трактуется в качестве транспонирования комбинаций кубических слоёв в комбинации котетраэдной модели Лапласа.

А.А. Целых

НЕЧЕТКАЯ МОДЕЛЬ СЕМАНТИЧЕСКОГО ОПИСАНИЯ ИНТЕРНЕТ-РЕСУРСОВ

До недавнего времени Интернет был ориентирован на работу в нем человека. Всемирная Паутина следующего поколения, глобальная информационная семантическая сеть Semantic Web, рассчитана на машинную обработку информации и потому должна обеспечивать более высокий уровень семантической интероперабельности. С этой целью разрабатываются стандарты не только для синтаксической формы документов, но и для их семантического наполнения.

Назначение абстрактной методологической модели Resource Description Framework (RDF) состоит в формальном семантическом описании содержания интернет-ресурсов. Эта технология позволяет выразить смысл терминов и понятий в виде, доступном для машинной обработки, и предназначена для стандартизации определений, а также представления и использования метаданных, описывающих интернет-ресурсы.

Спецификация RDF [1] предусматривает наличие трех компонентов - объекта, атрибута и значения. Для описания множества таких троек вводится понятие «RDF-граф», который, однако, в классическом смысле слова графом не является. Спецификация не проводит четких различий между термином «RDF-граф», визуализацией RDF-данных в виде графа и математическим понятием графа. Она оставляет открытым и вопрос работы с атрибутами (помеченными ребрами), которые являются субъектами или объектами других троек. Решением служит дублирование ресурсов в виде вершин и помеченных ребер либо допущение соединения ребрами других ребер. Однако оба эти подхода имеют существенные недостатки, лишающие модель математической строгости теории графов.

Предлагается представить RDF-графы в виде гиперграфов и ультраграфов [2, 3], что позволит эффективно структурировать знания в сложной семантической сети, включающей множество понятий, когда контроль связей и многоарных отношений между узлами является затруднительным. Эти математические модели имеют ряд преимуществ перед представлением в виде помеченных ориентированных графов. К числу таких преимуществ можно отнести наличие: формальной теории и математического аппарата, позволяющего доказывать свойства и разрабатывать алгоритмы, а также алгоритмов для визуализации данных и библиотек, реализующих алгоритмы на графах. Многие прикладные задачи, возникающие в глобальной информационной семантической сети, можно свести к задачам, которые хорошо изучены в теории графов.

Предполагается развитие теории нечетких ультраграфов, исследование их структурных свойств и нечетких инвариантов. Определенное внимание будет уде-

Раздел I. Информационные системы в управлении

лено вопросам трансформации RDF-данных и семантических отношений между информационными ресурсами. С этой целью предлагается ввести характеристики нечеткой связности и нечеткого равенства нечетких ультраграфов, исследовать метрики и разработать алгоритмы для нахождения семантического расстояния. Предполагается разработать методы оценки степени изоморфизма нечетких ультраграфов и масштабируемые алгоритмы интеллектуального анализа данных.

Как правило, информацию в Интернете можно характеризовать как неточную и неполную. Данные носят качественный характер, порождающий многообразие расплывчатых классификаций, что существенно затрудняет принятие решений. В этой связи является актуальным проведение теоретических исследований в области разработки моделей представления знаний, методов и алгоритмов поиска оптимальных решений, методов оценки эффективности и качества принимаемых решений с использованием аппарата нечетких множеств и нечетких отношений.

В нечетком RDF-утверждении тройка характеризуется функцией принадлежности - действительным числом из интервала [0, 1]. Расширенная нечеткая RDF-модель может естественно работать с лингвистическими оценками, в частности, с метаданными доверия.

Основной задачей на этом этапе исследования является разработка расширенного синтаксиса описания данных на основе аппарата теории нечетких множеств и нечетких отношений, что предполагает определение понятия нечеткого RDF-утверждения, нечеткую интерпретацию словаря, определение понятий и исследование нечеткого домена, нечеткого диапазона, нечеткого подкласса и нечеткого подсвойства. Будут разработаны механизмы дефаззификации и нечеткого логического вывода в системе. Предполагается также разработка инструментария для работы с метаданными доверия.

Разработанные модели, методы и алгоритмы лягут в основу концепции и методики создания адаптивных интеллектуальных информационно-советующих интернет-систем, отличающихся от известных высоким уровнем интеграции семантических знаний и онтологий.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Resource Description Framework (RDF) Semantics. W3C Recommendation, February 2004. -http://www. w3. org/TR/rdf-mt/

2. Берштейн Л.С., БоженюкА.В. Нечеткие графы и гиперграфы. - М.: Научный мир, 2005.

3. Целых А.А. Разработка и исследование методов и алгоритмов для моделирования адаптивных веб-ресурсов на основе нечетких ультраграфов: Дис. ... к.т.н. - Таганрог, 2005.

А.Н. Целых, Э.М. Котов ОЦЕНКА ЭФФЕКТИВНОСТИ ИНФОРМАЦИОННОГО ПОИСКА

Необходимость оценки эффективности работы информационно-поисковой системы (ИПС) по сравнению с существующими аналогами можно назвать одной из основных задач, решение которой должно осуществляться на стадии разработки ИПС посредством ведения теоретических оценок эффективности используемых методов поиска и определения классов ситуаций, при которых использование разрабатываемой ИПС целесообразно.

i Надоели баннеры? Вы всегда можете отключить рекламу.