Научная статья на тему 'ПРИНЦИПЫ РАБОТЫ ПОИСКОВОГО РОБОТА КАК АГЕНТА ИССЛЕДОВАТЕЛЯ'

ПРИНЦИПЫ РАБОТЫ ПОИСКОВОГО РОБОТА КАК АГЕНТА ИССЛЕДОВАТЕЛЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
16
3
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИОННЫЙ ПОИСК / АГЕНТНЫЕ ТЕХНОЛОГИИ / ПОИСКОВЫЙ АГЕНТ / ИНФОРМАЦИОННЫЙ РОБОТ / ПОИСКОВАЯ СИСТЕМА / INFORMATION SEARCH / AGENT TECHNOLOGIES / SEARCH AGENT / INFORMATION ROBOT / SEARCH ENGINE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Горбулина Е.С.

Статья посвящена персональным поисковым роботам. В настоящее время актуальна тема поиска информации, подходящей под запросы, конкретного пользователя. В статье рассматривается принцип работы таких роботов. Также рассматривается проблемная ситуация пользователей сети Интернет.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE PRINCIPLES OF WORK OF THE SEARCH ROBOT AS THE AGENT-RESEARCHER

This article is devoted to personal search robots. In the present time search of information for special person is actual subject. In the article considered principle of operation for these robots. In addition, considered problem situation of users network.

Текст научной работы на тему «ПРИНЦИПЫ РАБОТЫ ПОИСКОВОГО РОБОТА КАК АГЕНТА ИССЛЕДОВАТЕЛЯ»

УДК 007.52

Горбулина Е.С. бакалавр

направление подготовки «Прикладная математика и информатика» Национальный исследовательский ядерный университет «МИФИ.»

Россия, г. Москва ПРИНЦИПЫ РАБОТЫ ПОИСКОВОГО РОБОТА КАК АГЕНТА

ИССЛЕДОВАТЕЛЯ

Аннотация:

Статья посвящена персональным поисковым роботам. В настоящее время актуальна тема поиска информации, подходящей под запросы, конкретного пользователя. В статье рассматривается принцип работы таких роботов. Также рассматривается проблемная ситуация пользователей сети Интернет.

Ключевые слова: информационный поиск, агентные технологии, поисковый агент, информационный робот, поисковая система.

Gorbulina E.S. bachelor

direction of training «Applied mathematics and informatics» National research nuclear university «MEPHI»

Russia, Moscow

THE PRINCIPLES OF WORK OF THE SEARCH ROBOT AS THE

AGENT-RESEARCHER

Annotation:

This article is devoted to personal search robots. In the present time search of information for special person is actual subject. In the article considered principle of operation for these robots. In addition, considered problem situation of users network.

Keywords: information search, agent technologies, search agent, information robot, search engine.

В настоящее время и в обозримом будущем, все возрастающими темпами увеличивается количество источников информации научно-технического содержания. Ограниченные биофизические возможности отдельного человека делают все более актуальными создание персональных информационных роботов-агентов, выполняющих многообразные функции вместо человека-пользователя.

Поиск информации в интернете состоит из двух частей. Первая — поисковая система обходит веб-страницы, создавая их копии на своих серверах. Вторая — пользователь задаёт запрос и получает ответ с серверов поисковой системы.

Поисковая система ищет по поисковому индексу — базе данных, где

для всех слов, которые есть на известных поисковой системе сайтах, указано их местонахождение — адрес страницы и место на ней. Индекс можно сравнить с предметным указателем в книге или адресным справочником. В отличие от обычного предметного указателя, индекс содержит не только термины, а вообще все слова. А в отличие от адресного справочника, у каждого слова-адресата есть не одно, а очень много «мест прописки».

Подготовка данных, по которым ищет поисковая машина, называется индексированием. Информационный робот - программа, которая систематически просматривает страницы интернета, как правило, именно с целью индексирования. Поисковые системы используют их, чтобы проанализировать содержимое веб-страниц и сохранить их в некотором специальном виде на сервере поисковой машины. После этого робот отправляется по ссылкам на следующие страницы.

Информационный робот начинается со списка URL-адресов для посещения. По мере их посещения, робот идентифицирует все гиперссылки на странице и добавляет их в список URL-адресов для посещения, увеличивая количество индексируемых страниц.

В настоящее время существует следующая проблемная ситуация. Нужная информация в сети Интернет теоретически является доступной для заинтересованных в ней пользователей, но практически пользователь зачастую не может воспользоваться ею в полной мере из-за увеличения объема работ по контролю содержания множества сайтов.

Поведение информационных роботов является следствием сочетания следующих правил:

- правило выбора, которое определяет страницы для посещения;

- правило повторного посещения, которое определяет частоту проверки изменений;

- правило вежливости, которое определяет, как избежать перегрузки

сайта;

- правило распараллеливания, которое определяет работу нескольких роботов.

Именно информационный робот как агент исследователя способен контролировать входные информационные потоки и предоставлять отобранную и отфильтрованную информацию пользователю.

Использованные источники: 1. H. Nwana. Software Agents: An Overview. Knowledge Engineering Review, Vol. 11, No 3, 1996. Cambridge University Press.

i Надоели баннеры? Вы всегда можете отключить рекламу.