Научная статья на тему 'Адаптивный поиск и персонификация в информационных системах'

Адаптивный поиск и персонификация в информационных системах Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
116
14
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Жуков Е.А.

Проводится обзор различных методов и алгоритмов, осуществляющих персонификацию информации, предоставляемой пользователю информационной системы (ИС), генерацию персонифицированного ссылочного меню для обеспечения пользователя удобной ему навигации по ИС. Предлагается также модификация и детализация алгоритма в соответствии с существующей информационной системой типа электронного библиотечного каталога.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ADAPTIVE SEARCH AND INFORMATION PERSONIFICATION IN THE INFORMATION SYSTEM

In this work different methods and algorithms making personification of information being provided to information system user, generation of personal menu of links for providing of the comfortable navigation in information system to user are examined. Also the modification and the detailed algorithm according to the existing information system are examined.

Текст научной работы на тему «Адаптивный поиск и персонификация в информационных системах»

Информационно-управляющие системы

УДК 004.58

Е. А. Жуков

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск

АДАПТИВНЫЙ ПОИСК И ПЕРСОНИФИКАЦИЯ В ИНФОРМАЦИОННЫХ СИСТЕМАХ

Проводится обзор различных методов и алгоритмов, осуществляющих персонификацию информации, предоставляемой пользователю информационной системы (ИС), генерацию персонифицированного ссылочного меню для обеспечения пользователя удобной ему навигации по ИС.

Предлагается также модификация и детализация алгоритма в соответствии с существующей информационной системой типа электронного библиотечного каталога.

Ежедневно каждый из нас в той или иной степени пользуется услугами информационных систем (ИС), будь то локальная корпоративная сеть или глобальная поисковая система, такая как Yandex.ru или Google.com. К использованию сервисов различных поисковых систем нас приводит необходимость отыскания какого-либо документа, файла, различного вида информации. Естественно, выполненный запрос должен соответствовать некоторой нами установленной степени релевантности (качество выполнения запроса). К сожалению, современные системы в связи с тем, что работают с достаточно большим количеством пользователей, не в состоянии обеспечить каждого пользователя достаточным количеством документов с максимальным процентом релевантности. Также пользователь стремиться не только получить от ИС требуемую информацию, но и сделать это как можно быстрее. Увеличение скорости предоставления пользователю необходимой ему информации приведет к тому, что пользователь будет иметь время и на просмотр прочей информации, соответствующей его запросу, а такой сервис будет привлекать еще больше клиентов к ИС.

В данной работе рассматриваются различные подходы к решению проблемы персонификации информационного наполнения выполненных запросов информационной системой. Рассматриваются частотная терминологическая модель пользователя, алгоритм тематико-ориентированного мониторинга и персонификации в информационных системах, многоатри-бутывные методы принятия решений в целях обеспечения персинификации информационного наполнения.

Различные алгоритмы и методы могут различаться сложностью реализации, системой создания профиля пользователя информационной системы, типами классификации новых поступивших в информационную систему документов, качеством персонификации и целями персонификации - то есть тот или иной алгоритм разрабатывается согласно целям определенного рода систем и контингента, использующего это систему. Описание каждого алгоритма отражает как преимущества каждого метода, так и его недостатки.

Предлагается также модификация и детализация одного из алгоритмов. Идея детализируемого алгоритма заключается во введении в предлагаемых алгоритмах понятия 5-мерного пространства Б тематик

информационного наполнения информационной системы. В пространстве Б тематические предпочтения пользователей и блоки информационного наполнения (документы информационной системы, страницы сайта, рекламные объявления и т. д.) представляются в виде точек, чьи координаты определяются степенью их принадлежности к каждой из ¿-тематик. Близость информационного блока к тематическим предпочтениям пользователя можно определять как расстояние между их точками в пространстве Б. Тематические предпочтения пользователя веб-сайта устанавливаются на основе статистической информации о тематиках запрошенных им страниц, собранной в ходе тематико-ориентированного мониторинга его предпочтений [1]. Предложена детализация алгоритма в виде архитектуры программы, предназначенной для обеспечения адаптивного поиска информационных документов (статей, публикаций, учебной литературы и др.) в информационной системе типа электронного учебного каталога. Все пункты алгоритма детализированы в терминах электронного каталога.

Таким образом, в качестве документов информационной системы преимущественно будет использоваться коллекция библиографических записей об изданиях, хранящихся в библиотеке. Пользователями будут являться как студенты университета, так и преподаватели. Профиль пользователя может разделяться на две части: персональную и общую (групповую), означая, что при работе с системой пользователь сможет получать рекомендации по литературе не только соответствующей его личным интересам, но и близкой к тематической направленности его научной специализации. Для студента научной специализацией является его специальность или институт в целом, для преподавателя - его научная область деятельности. Также система дает пользователю рекомендации не только на литературу, хранящуюся в электронном каталоге, но и предоставляет ссылки на близкие его интересам материалы, найденный системой в сети Интернет.

Библиографическая ссылка

1. Гриднев А. А. Система тематико-ориенти-рованного мониторинга предпочтений пользователя информационной системы: дис. ... канд. техн. наук. Красноярск, 2006.

Решетневские чтения

E. A. Zhukov

Siberian State Aerospace University named after academician M. F. Reshetnev, Russia, Krasnoyarsk

ADAPTIVE SEARCH AND INFORMATION PERSONIFICATION IN THE INFORMATION SYSTEM

In this work different methods and algorithms making personification of information being provided to information system user, generation of personal menu of links for providing of the comfortable navigation in information system to user are examined. Also the modification and the detailed algorithm according to the existing information system are examined.

© Жуков Е. А., 2010

УДК 004.932

В. В. Журавлев

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск

ПОСТРОЕНИЕ ВИРТУАЛЬНОЙ SD-СЦЕНЫ ПО ИЗОБРАЖЕНИЮ

Описывается алгоритм построения виртуальной 3D-сцены по изображению. Рассматриваются методы предварительной обработки изображений, выделения контуров и нахождения линий. Приводится сравнительная характеристика готовых графических библиотек «OpenGL» и «DirectX».

Алгоритм построения виртуальной 3Б-сцены по изображении состоит из нескольких этапов. Первый этап заключается в предварительной обработке изображения с использованием сглаживающих фильтров, что позволит избавиться от шумов. Следующий этап состоит в выделении контуров на изображении, результатом чего является набор связанных кривых, обозначающих границы объектов, граней и оттисков на поверхности, а также кривые, которые отображают изменения положения поверхностей. Для выделения контуров используются методы Лапласа, Робертса, Собеля. После получения контурного изображения проводится пороговая бинаризация, где величина порога зависит от значений яркостной карты, что позволяет сократить «малые» контурные изменения. Следующим этапом после получения бинарного представления контурного изображения является нахождение линий - применение методов по извлечению элементов из изображения. Найденные линии используются для построения виртуальной 3Б-сцены, привлекая возможности программных сред по работе с графическими библиотеками «OpenGL» или «DirectX».

В работе большинства систем, которые имеют дело с изображениями, как правило, не применяется исходное (без предварительной обработки) изображение. Зачастую реальное изображение искажено шумами, имеет неравномерную яркость или контрастность. Все это может приводить к разрывам линейных объектов, разрушению символов. Поэтому на начальном этапе крайне важно предварительно обрабатывают изображения.

Обычно предварительная обработка включает выравнивание общего яркостного фона изображения,

устранение помех, шумов, бинаризацию, контрастирование, инвертирование, фильтрацию изображения. При разработке алгоритма построения виртуальной 3D-сцены по изображению из методов предварительной обработки используются методы подавления помех и шумов [1].

Для формирования контурных изображений существует множество различных алгоритмов и методов. Самые распространенные методы - это методы Собе-ля, Робертса, Лапласа, Превитта, Уоллеса, а также статические методы и др. Каждый из этих методов обладает определенными специфическими особенностями [2].

Для нахождения линий на сформированном контурном изображении используются метод Хафа и метод Радона.

Преобразование Хафа - метод по извлечению элементов из изображения, применяемый в анализе и обработке изображения. Данный метод предназначен для поиска объектов, принадлежащих определенному классу фигур, использующих процедуры голосования. Процедура голосования применяется к пространству параметров, из которого и получаются объекты определённого класса фигур по локальному максимуму в так называемом накопительном пространстве (accumulator space), строящемся при вычислении трансформации Хафа [3].

При программировании приложений целесообразно сконцентрировать основное внимание на задачах проекта и использовать для визуализации готовые графические библиотеки, которые позволяют избавиться от массы рутинной работы. Наиболее известными графическими библиотеками в настоящее время являются «OpenGL» и «DirectX».

i Надоели баннеры? Вы всегда можете отключить рекламу.