совокупность статических и динамических атрибутов отдельного объекта. Целостная часть состоит из набора правил, поддержание которых позволяет обеспечить непротиворечивость ТБД и выборку из нее требуемых данных по запросам пользователя. Манипуля-ционная часть определяет совокупность необходимых операций манипулирования атомарными объектами и порядок их выполнения, обеспечивающую реализацию всего множества возможных запросов пользователей к ТБД [2]. Проведенные исследования [2] показали, что создание такой надстройки возможно в среде практически всех известных реляционных инструментальных средств, обладающих лингвистическими возможностями по реализации реляционных операций селекции и соединения, в которых предусмотрен учет динамических атрибутов, представленных временными рядами значений. Остальные операции, включая манипуляционные действия наборами реляционных таблиц, выполняются путем применения последовательности операций реляционной алгебры к компонентам наборов.
Таким образом, анализ принципов организации ТБД показывает, что их применение есть перспективное и вполне реализуемое направление дальнейшего совершенствования существующих и создания новых систем управления, придающее им не только новые функциональные возможности, но и обеспечивающее высокую безопасность АСУ.
Литература
1. Голубев В.А. Информационная безопасность: проблемы борьбы с киберпреступлениями: Монография. Запорожье, 2003.
2. Комарович В.Ф., Саенко И.Б. Безопасность информации в телекоммуникационных системах: Сб. статей. СПб., 2001.
15 ноября 2006 г
Ставропольский военный институт связи ракетных войск
УДК 681.3
ИНТЕЛЛЕКТУАЛЬНЫЙ ПОИСК ЗНАНИЙ В СЕТИ ИНТЕРНЕТ
© 2007 г. В.О. Никонов
Самая главная проблема сети Интернет - извлечение действительно ценных знаний из информации, объем которой непрерывно возрастает.
Поиск знаний в Интернет в отличие от простого поиска информации, в котором не учитывается семантика запросов, должен представлять пользователю действительно актуальную информацию, которая соответствует его потребностям. При обычном поиске пользователь знает, что он должен получить в итоге, при поиске знаний пользователь получает нечто, до сих пор ему неизвестное.
О сложности получения знаний в сети Интернет говорит ряд исследований, согласно которым люди тратят слишком много времени, пытаясь найти нужную информацию.
Пользователи сети Интернет обращаются к поисковым системам и форумам, стремясь найти ответы на свои вопросы. Интернет уже содержит ответы на большинство вопросов, проблема состоит в том, что эти знания никак не упорядочены, и не прописаны механизмы доступа к ним. В результате знания есть, а доступ к ним связан с большими временными затратами.
В настоящий момент нельзя ввести вопрос в поисковую систему и сразу получить релевантную страницу с ответом. Поисковая система предоставит набор страниц, содержащих слова вопроса, но не ответ на него.
Для поиска знаний в сети Интернет предлагается создать новый класс программ - интеллектуальные
системы с естественно-языковым интерфейсом. Данные системы будут устанавливаться на сайты в сети Интернет и отвечать на вопросы пользователей. Поиск ответов на вопросы будет происходить по ключевым словам, определяемым в запросе по специально разработанному алгоритму.
На данном этапе развития интернет-технологий ключевые слова используются при создании страниц сайтов и представляют собой перечень слов, перечисленных в метатеге «Keywords». Метатег «Keywords» используется поисковыми машинами для оценки релевантности страниц. Все слова, перечисленные в этом теге, имеют одинаковый вес при поиске.
Предлагается новый подход к определению и описанию ключевых слов. При анализе вопросительного предложения для человека, в отличие от компьютера, не составляет трудности определить, о чем вопрос, и выделить главные (ключевые) слова в нем. Главные слова несут основную смысловую нагрузку в предложении. Такими словами являются (в порядке убывания их значимости): подлежащее, сказуемое, обстоятельство, дополнение и определение.
Новый подход к получению знаний состоит в следующем: вопрос пользователя интеллектуальной системы с естественно-языковым интерфейсом анализируется лингвистическим анализатором, и в нем выделяется цепочка ключевых слов. Например, для вопроса: «Где купить сухое вино в Краснодаре?» - анализатор выделяет последовательность ключевых слов:
«вино сухой - купить - Краснодар». Слова после анализа представлены в виде их лемм, что позволяет распознавать слова в разных морфологических интерпретациях. По данной цепочке слов будет произведен запрос в базу знаний системы.
Каждому ответу в базе знаний прописана цепочка ключевых слов, по которым будет выведен этот ответ.
Например, ответ, содержащий адреса магазинов, где можно купить сухое вино в Краснодаре, доступен по последовательности ключевых слов «вино сухой -купить - Краснодар».
Данный ответ будет дан на запросы: «где купить сухое вино в Краснодаре», «в Краснодаре приобрести вино сухое», «достать вино сухое в Краснодаре», «в Краснодаре где можно купить вино сухое».
При поиске ответов последовательно проверяется каждое звено цепочки запроса. Так, для запроса: «В Краснодаре приобрести вино сухое», - последовательность ключевых слов будет «вино сухой - приобрести - Краснодар». В базе знаний есть только ответ по цепочке «вино сухой - купить - Краснодар». Эксперт, прописывающий ключевые слова для ответов, может принять решение, что слова: «купить», «приобрести», «достать» в данном случае являются синонимами.
Поэтому при поиске ответа на запрос: «в Краснодаре приобрести вино сухое», - сначала будет произведен запрос по словосочетанию «вино сухой», в базе знаний будет найдена цепочка с таким началом, теперь в этой цепочке будет производиться поиск второго слова - «приобрести», но его там нет, так как там установлено слово «купить». В этом случает система обращается в словарь синонимов данной цепочки и проверяет, есть ли там для слова «купить» синоним «приобрести». Если есть, то произойдет переключение на следующее звено цепи ключевых слов - «Краснодар». В нашем примере все слова запроса и цепочки ответа совпадут и будет выведен ответ.
Таким образом, во всех указанных выше вариантах запроса, несмотря на их различную формулировку, система даст один и тот же ответ, так как смысл у всех запросов идентичный.
Главным компонентом системы, осуществляющем выделение ключевых слов, является лингвистический анализатор. Лингвистический анализатор представляет собой многоуровневый преобразователь, состоящий из трех уровней пофразного представления текста - морфологического, синтаксического и семантического.
Каждый из уровней обслуживается массивом правил и определенными словарями. В результате анализа в системе происходят следующие преобразования: предложение на естественном языке - морфологическая структура - синтаксическая структура - семантическая структура - ключевые слова. Преимущество данного подхода над традиционным состоит в том, что обычные поисковые системы при анализе предложения не могут распределить ключевые слова в иерархическом порядке. При использование лингвистического анализатора эту проблему можно решить. Задача решается с использованием лингвистических процессоров системы www.aot.ru. На вход системы поступает предложение, а на выходе лингвистический анализатор строит его семантический граф.
После работы лингвистического анализатора в действие вступает алгоритм выделения ключевых слов, который по заданным правилам выделяет ключевые слова - как правило, это существительное/ словосочетание (подлежащее), затем глагол (сказуемое), обстоятельства и дополнения.
Предложенный подход к анализу текста позволяет точно находить ответы на вопросы независимо от их формулировки.
Испытания системы, разработанной для торговых предприятий, занимающихся оптовой и розничной продажей алкогольной продукции, доказали работоспособность предложенного метода.
7мая 2007 г.
Кубанский государственный технологический университет, г. Краснодар
УДК 621.317.7
ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ МГНОВЕННЫХ ЗНАЧЕНИЙ ЧАСТОТЫ ПРОМЫШЛЕННОГО НАПРЯЖЕНИЯ В ЭЛЕКТРИЧЕСКИХ СЕТЯХ
АВТОНОМНОЙ ЭНЕРГОСИСТЕМЫ
© 2007 г. В.Ф. Ермаков, В.С. Федоров
При разработке частотомера Ч3-90 на базе ЛУЯ-микроконтроллера [1] в нем была предусмотрена возможность фиксации мгновенных значений частоты промышленного напряжения в сетях 50 Гц на интервале 2,56 с. При этом в памяти устройства размещаются значения частоты за 128 периодов. После выполнения замера указанная информация считывалась
в персональный компьютер типа IBM PC и подвергалась дальнейшей обработке.
В мае 2007 г. с помощью частотомера Ч3-90 была получена регистрограмма частоты в электрических сетях автономной энергосистемы (рисунок), питающей газо-добывающий промысел и расположенный рядом с ним населенный пункт.