Научная статья на тему 'Интеллектуальный поиск знаний в сети Интернет'

Интеллектуальный поиск знаний в сети Интернет Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
260
38
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Никонов В. О.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Интеллектуальный поиск знаний в сети Интернет»

совокупность статических и динамических атрибутов отдельного объекта. Целостная часть состоит из набора правил, поддержание которых позволяет обеспечить непротиворечивость ТБД и выборку из нее требуемых данных по запросам пользователя. Манипуля-ционная часть определяет совокупность необходимых операций манипулирования атомарными объектами и порядок их выполнения, обеспечивающую реализацию всего множества возможных запросов пользователей к ТБД [2]. Проведенные исследования [2] показали, что создание такой надстройки возможно в среде практически всех известных реляционных инструментальных средств, обладающих лингвистическими возможностями по реализации реляционных операций селекции и соединения, в которых предусмотрен учет динамических атрибутов, представленных временными рядами значений. Остальные операции, включая манипуляционные действия наборами реляционных таблиц, выполняются путем применения последовательности операций реляционной алгебры к компонентам наборов.

Таким образом, анализ принципов организации ТБД показывает, что их применение есть перспективное и вполне реализуемое направление дальнейшего совершенствования существующих и создания новых систем управления, придающее им не только новые функциональные возможности, но и обеспечивающее высокую безопасность АСУ.

Литература

1. Голубев В.А. Информационная безопасность: проблемы борьбы с киберпреступлениями: Монография. Запорожье, 2003.

2. Комарович В.Ф., Саенко И.Б. Безопасность информации в телекоммуникационных системах: Сб. статей. СПб., 2001.

15 ноября 2006 г

Ставропольский военный институт связи ракетных войск

УДК 681.3

ИНТЕЛЛЕКТУАЛЬНЫЙ ПОИСК ЗНАНИЙ В СЕТИ ИНТЕРНЕТ

© 2007 г. В.О. Никонов

Самая главная проблема сети Интернет - извлечение действительно ценных знаний из информации, объем которой непрерывно возрастает.

Поиск знаний в Интернет в отличие от простого поиска информации, в котором не учитывается семантика запросов, должен представлять пользователю действительно актуальную информацию, которая соответствует его потребностям. При обычном поиске пользователь знает, что он должен получить в итоге, при поиске знаний пользователь получает нечто, до сих пор ему неизвестное.

О сложности получения знаний в сети Интернет говорит ряд исследований, согласно которым люди тратят слишком много времени, пытаясь найти нужную информацию.

Пользователи сети Интернет обращаются к поисковым системам и форумам, стремясь найти ответы на свои вопросы. Интернет уже содержит ответы на большинство вопросов, проблема состоит в том, что эти знания никак не упорядочены, и не прописаны механизмы доступа к ним. В результате знания есть, а доступ к ним связан с большими временными затратами.

В настоящий момент нельзя ввести вопрос в поисковую систему и сразу получить релевантную страницу с ответом. Поисковая система предоставит набор страниц, содержащих слова вопроса, но не ответ на него.

Для поиска знаний в сети Интернет предлагается создать новый класс программ - интеллектуальные

системы с естественно-языковым интерфейсом. Данные системы будут устанавливаться на сайты в сети Интернет и отвечать на вопросы пользователей. Поиск ответов на вопросы будет происходить по ключевым словам, определяемым в запросе по специально разработанному алгоритму.

На данном этапе развития интернет-технологий ключевые слова используются при создании страниц сайтов и представляют собой перечень слов, перечисленных в метатеге «Keywords». Метатег «Keywords» используется поисковыми машинами для оценки релевантности страниц. Все слова, перечисленные в этом теге, имеют одинаковый вес при поиске.

Предлагается новый подход к определению и описанию ключевых слов. При анализе вопросительного предложения для человека, в отличие от компьютера, не составляет трудности определить, о чем вопрос, и выделить главные (ключевые) слова в нем. Главные слова несут основную смысловую нагрузку в предложении. Такими словами являются (в порядке убывания их значимости): подлежащее, сказуемое, обстоятельство, дополнение и определение.

Новый подход к получению знаний состоит в следующем: вопрос пользователя интеллектуальной системы с естественно-языковым интерфейсом анализируется лингвистическим анализатором, и в нем выделяется цепочка ключевых слов. Например, для вопроса: «Где купить сухое вино в Краснодаре?» - анализатор выделяет последовательность ключевых слов:

«вино сухой - купить - Краснодар». Слова после анализа представлены в виде их лемм, что позволяет распознавать слова в разных морфологических интерпретациях. По данной цепочке слов будет произведен запрос в базу знаний системы.

Каждому ответу в базе знаний прописана цепочка ключевых слов, по которым будет выведен этот ответ.

Например, ответ, содержащий адреса магазинов, где можно купить сухое вино в Краснодаре, доступен по последовательности ключевых слов «вино сухой -купить - Краснодар».

Данный ответ будет дан на запросы: «где купить сухое вино в Краснодаре», «в Краснодаре приобрести вино сухое», «достать вино сухое в Краснодаре», «в Краснодаре где можно купить вино сухое».

При поиске ответов последовательно проверяется каждое звено цепочки запроса. Так, для запроса: «В Краснодаре приобрести вино сухое», - последовательность ключевых слов будет «вино сухой - приобрести - Краснодар». В базе знаний есть только ответ по цепочке «вино сухой - купить - Краснодар». Эксперт, прописывающий ключевые слова для ответов, может принять решение, что слова: «купить», «приобрести», «достать» в данном случае являются синонимами.

Поэтому при поиске ответа на запрос: «в Краснодаре приобрести вино сухое», - сначала будет произведен запрос по словосочетанию «вино сухой», в базе знаний будет найдена цепочка с таким началом, теперь в этой цепочке будет производиться поиск второго слова - «приобрести», но его там нет, так как там установлено слово «купить». В этом случает система обращается в словарь синонимов данной цепочки и проверяет, есть ли там для слова «купить» синоним «приобрести». Если есть, то произойдет переключение на следующее звено цепи ключевых слов - «Краснодар». В нашем примере все слова запроса и цепочки ответа совпадут и будет выведен ответ.

Таким образом, во всех указанных выше вариантах запроса, несмотря на их различную формулировку, система даст один и тот же ответ, так как смысл у всех запросов идентичный.

Главным компонентом системы, осуществляющем выделение ключевых слов, является лингвистический анализатор. Лингвистический анализатор представляет собой многоуровневый преобразователь, состоящий из трех уровней пофразного представления текста - морфологического, синтаксического и семантического.

Каждый из уровней обслуживается массивом правил и определенными словарями. В результате анализа в системе происходят следующие преобразования: предложение на естественном языке - морфологическая структура - синтаксическая структура - семантическая структура - ключевые слова. Преимущество данного подхода над традиционным состоит в том, что обычные поисковые системы при анализе предложения не могут распределить ключевые слова в иерархическом порядке. При использование лингвистического анализатора эту проблему можно решить. Задача решается с использованием лингвистических процессоров системы www.aot.ru. На вход системы поступает предложение, а на выходе лингвистический анализатор строит его семантический граф.

После работы лингвистического анализатора в действие вступает алгоритм выделения ключевых слов, который по заданным правилам выделяет ключевые слова - как правило, это существительное/ словосочетание (подлежащее), затем глагол (сказуемое), обстоятельства и дополнения.

Предложенный подход к анализу текста позволяет точно находить ответы на вопросы независимо от их формулировки.

Испытания системы, разработанной для торговых предприятий, занимающихся оптовой и розничной продажей алкогольной продукции, доказали работоспособность предложенного метода.

7мая 2007 г.

Кубанский государственный технологический университет, г. Краснодар

УДК 621.317.7

ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ МГНОВЕННЫХ ЗНАЧЕНИЙ ЧАСТОТЫ ПРОМЫШЛЕННОГО НАПРЯЖЕНИЯ В ЭЛЕКТРИЧЕСКИХ СЕТЯХ

АВТОНОМНОЙ ЭНЕРГОСИСТЕМЫ

© 2007 г. В.Ф. Ермаков, В.С. Федоров

При разработке частотомера Ч3-90 на базе ЛУЯ-микроконтроллера [1] в нем была предусмотрена возможность фиксации мгновенных значений частоты промышленного напряжения в сетях 50 Гц на интервале 2,56 с. При этом в памяти устройства размещаются значения частоты за 128 периодов. После выполнения замера указанная информация считывалась

в персональный компьютер типа IBM PC и подвергалась дальнейшей обработке.

В мае 2007 г. с помощью частотомера Ч3-90 была получена регистрограмма частоты в электрических сетях автономной энергосистемы (рисунок), питающей газо-добывающий промысел и расположенный рядом с ним населенный пункт.

i Надоели баннеры? Вы всегда можете отключить рекламу.