Научная статья на тему 'Некоторые аспекты обучения технологии поиска информации в сети Internet'

Некоторые аспекты обучения технологии поиска информации в сети Internet Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
841
160
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Некоторые аспекты обучения технологии поиска информации в сети Internet»

А. В. Голанова, Е. И. Голикова

Некоторые аспекты обучения технологии поиска информации в сети Internet

Одним из направлений модернизации современной системы образования является широкое использование компетентностного подхода. Целью профессиональной подготовки становится формирование профессиональной компетентности - способности специалиста решать типичные профессиональные задачи, возникающие в реальных ситуациях профессиональной деятельности, с использованием знаний, опыта, ценностей и наклонностей. В условиях информатизации образования способность выпускника использовать средства информатизации и информационные технологии для решения профессиональных задач является одним из компонентов его профессиональной компетентности, которая проявляется как совокупность ключевой, базовой и специальной компетентностей. Эффективность формирования профессиональной компетентности выпускника обеспечивается развитием его способностей решать профессиональные задачи разного уровня сложности.

При решении профессиональных задач выпускнику часто приходится использовать информационные ресурсы глобальной сети Internet, в частности осуществлять поиск информации. К сожалению, большинство выпускников не владеют грамотной технологией поиска информации и поэтому затрачивают много времени на эту процедуру.

По мере развития Internet увеличивается объем информации в ней содержащейся и вместе с этим возникает проблема поиска нужной информации. Таким образом, вероятность существования необходимой информации возрастает, а возможность ее нахождения уменьшается.

В связи с этим актуальной становится проблема обучения поиску информации в Internet. Мы считаем, что при обучении поиску информации следует выделить следующие этапы:

I. Использование поисковой системы

II. Использование тематических каталогов

III. Использование метапоисковых систем

IV. Использование специализированных поисковых систем

I этап. Использование поисковой системы

Использование поисковой системы предполагает составление поискового запроса на языке поисковой системы. Результатом поиска является так называемая поисковая выдача - список ссылок на документы (web-страницы), соответствующие запросу.

129

К наиболее популярным поисковым системам, осуществляющим поиск на различных языках, следует отнести: AlltheWeb, AltaVista, Excite, Google, HotBot, Lycos, MSN Search, Teoma, Webtop, WiseNut, Yahoo! Search.

Для поиска по русскоязычному Internet, в основном используют следующие поисковые машины: Yandex, Google, Bing, Rambler, GoGo.ru, Апорт.

Все крупные поисковые машины имеют специальный язык запросов, дающий широкие функциональные возможности для детализации поиска и экономии времени.

Знание операторов языка запросов поможет находить информацию, добыть которую только с помощью простых запросов практически невозможно.

Язык запросов - мощный инструмент, который позволяет искать информацию и документы, например:

• только на определенном сайте (или группе сайтов);

• опубликованную в строго заданном временном диапазоне;

• опубликованные на каком-либо из языков (например, русском).

При помощи языка запросов, мы можем искать текст на определенных участках страниц (в ссылках, в заголовках, в ключевых словах и др.).

К сожалению, не существует общепринятого стандарта для операторов языка поисковых машин. Поэтому, как правило, изучают язык какой-нибудь одной поисковой машины, которую предполагают в дальнейшем использовать для поиска информации. Поисковая машина предоставляет пользователю различные способы составления запроса:

1. Пользователь вводит текст запроса непосредственно в строку поиска, не используя при этом операторы языка.

2. Пользователь вводит текст запроса непосредственно в строку поиска, используя при этом операторы языка.

Рассмотрим язык поисковых запросов поисковой машины Yandex.

Наиболее часто используются:

1. Операторы поискового контекста, позволяющие указать расположение ключевых слов в документе: слова идут подряд (оператор “...”), слова находятся в одном предложении (оператор &), слова в одном документе (оператор &&).

2. Операторы, регулирующие расстояние между словами: слова на расстоянии в несколько слов (указание после первого слова символа /, сразу за которым идет число, означающее расстоя-

130

ние), слова на расстоянии в несколько предложений (перед оператором расстояния / указывается оператор &&).

3. Операторы, позволяющие указать порядок слов: слова следуют в определенном порядке на нужном расстоянии (указание между символом / и числом-расстоянием символа “+” для прямого порядка слов или “-“ для обратного), слова расположены в заданной окрестности (добавление между словами запроса оператора / (n m)).

4. Оператор нахождения любого из слов (оператор |).

5. Операторы исключения слов: исключение страниц, содержащих определённые слова (использование оператора —, слева от которого пишется «что искать», а справа - какие страницы исключать из поиска), исключение возможности нахождения ключевых слов в одном предложении (оператор ~).

6. Оператор отключения учёта морфологии (использование оператора ! перед словом (без пробела)).

Приведём примеры заданий, связанных с составлением запросов.

Задание 1. Создайте в Yandex запрос, который позволит найти страницы, где в одном предложении должны встретиться слова системы и делопроизводства, и где угодно на странице должно быть слово специальные.

Ответ: системы & делопроизводства && специальные

Задание 2. Создайте в Yandex запрос, который позволит найти страницы, где максимально допустимое расстояние между словами оформление и переписки равно 2.

Ответ: оформление /2 переписки

Задание 3. Создайте в Yandex запрос, который позволит найти страницы, где слово документ встречается только в этой форме.

Ответ: ! документ

Поисковая система Yandex позволяет осуществлять поиск не только в отдельных элементах внутри страницы, но и в относящейся к этой странице служебной информации или в связанной с ней информации. Такой поиск осуществляется с помощью специальных операторов называемых документными. Среди документных операторов наиболее часто используются:

1. Оператор поиска текста в заголовке страницы (title:)

2. Оператор поиска по URL (url:)

3. Оператор поиска по фрагменту URL (inurl:)

4. Оператор поиска по хосту (host:)

5. Оператор поиска по хосту в обратной записи (rhost:)

6. Оператор поиска по одному типу файлов (mime:)

7. Оператор поиска с ограничением по языку (lang:)

8. Оператор поиска с ограничением по домену (domain:)

9. Оператор поиска с ограничением по дате (date:)

131

Приведём примеры заданий, связанных с использованием, документных операторов при составлении запросов.

Задание 1. Создайте в Yandex запрос с использованием документного оператора поиска по заголовкам документов, для нахождения ответа на вопрос: «Какие существуют типовые

организационные структуры предприятий?».

Ответ: title: (Типовые организационные структуры предприятий)

Задание 2. Создайте в Yandex запрос с использованием документного оператора поиска по одному типу файлов, для выполнения задания: «Найдите презентацию в формате PPT про историю развития системы государственного документирования».

Ответ: mime:ppt История развития системы государственного документирования

Задание 3. Создайте в Yandex запрос с использованием документного оператора поиска по хосту, для выполнения задания: «Найдите, какие существуют обязательные реквизиты регламента, воспользовавшись хостом www.edou.ru».

Ответ: host:www.edou.ru Обязательные реквизиты регламента

Более подробную информацию о языке поисковых запросов Yandex можно получить по адресу:

http://help.yandex.ru/search/?id=481939.

Yandex позволяет решать сложные поисковые задачи, не пользуясь языком запросов. Для этого существует форма расширенного поиска, где сложные поисковые условия задаются в простой и наглядной форме.

Данная поисковая форма имеет следующие разделы:

1. Я ищу (поле ввода запроса)

2. На сайте (поле для ввода адреса сайта)

3. Слова (переключатели для выбора способа расположения на странице и употребления в тексте)

4. Страницы (поля для выбора языка страницы, даты обновления и формата страницы)

После заполнения требуемых разделов запрос будет сформулирован на естественном языке

II этап. Использование тематических каталогов

Каталог Internet-ресурсов - это постоянно обновляющийся и пополняющийся иерархический каталог, содержащий множество категорий и отдельных web-серверов с кратким описанием их содержимого Каталогами удобно пользоваться, если ищется не ответ на конкретный вопрос, а сайты на какую-то тему. Способ поиска по каталогу подразумевает «движение вниз по ступенькам», то есть движение от более общих категорий к более конкретным. Одним из преимуществ тематических каталогов является то, что пояснения к ссылкам делают создатели каталога и полностью отражают его со-

132

держание, то есть дает возможность точнее определить, насколько соответствует содержание сервера цели поиска.

В каталогах также как и в поисковых машинах можно производить поиск с использованием запроса. Однако поиск в этом случае будет производиться не по всему Internet, а по описаниям ресурсов, представленных в данном конкретном каталоге.

Среди каталогов глобального масштаба можно отметить: About, LookSmart, Open Directory, Yahoo! Directory, среди российских каталогов — List.ru, Улитка, Zabor.com, Weblist, Иван Сусанин.

Рассмотрим тематический русскоязычный каталог Улитка (http://www.ulitka.ru/).

На главной странице данного сайта расположен тематический рубрикатор, с помощью которого пользователь попадает в рубрику со ссылками на интересующую его продукцию. В каталоге также имеется возможность сортировки сайтов по количеству посещений, по алфавиту, по дате занесения.

III этап. Использование метапоисковых систем

Метапоисковые системы рассылают вводимые в них запросы по

другим системам, а затем суммируют результаты. К наиболее известным их представителям относятся, в частности, MetaCrawler, Vivisimo, KartOO, Mamma MetaSearch, Ixquick MetaSearch, Dogpile, Ez2find.com, WebCrawler, а также российская метапоисковая система Нигма.РФ.

Остановимся на рассмотрении возможностей метапоисковой системы Нигма ^^//нигма.рф/).

Основыми возможностями метапоисковой системы Нигма являются:

1. Выбор поисковой машины (Yandex, Google, Rambler, Bing, Yahoo, Altavista, Aport. Nigma).

2. Выбор языка страниц (любой язык, русский, украинский, английский).

3. Выбор способа сортировки найденных страниц (без сортировки, по дате (с новых), по дате (со старых)).

Страницы, найденные в результате поиска, могут быть отфильтрованы по предложенным критериям.

Приведём пример задания связанного с использованием метапоисковой системы Нигма для поиска информации.

Задание. Воспользовавшись поисковыми машинами Google, Rambler, Aport найдите определение понятия иконографический документ. Найденные страницы отсортируйте по дате, начиная с новых.

IV этап. Использование специализированных поисковых систем

Существуют поисковые машины, позволяющие производить поиск по изображениям, звуковым и видеофайлам, новостям и т. д. Примерами таких специализированных поисковых систем служат

133

SkreemR, FindSounds, Digital Audio Search - поиск аудиофайлов, Truveo, Blinkx - поиск видеофайлов, Gnod.net - поиск музыки, книг и фильмов, ANdN.net - поиск файлов библиотек, Medpoisk.ru - поиск медицинской информации, Taggalaxy.de - поиск изображений, Searchme.com - поиск с предпросмотром, Torrent-finder.com - поиск торрентов.

Среди российских специализированных поисковых систем можно выделить следующие: Picsearch - поиск изображений, Тындекс -поиск товаров и услуг, Букинист - библиографическая поисковая система, Scholar.ru - поиск научных публикаций на русском языке.

Несмотря на большое количество имеющихся инструментов, существует ряд проблем, возникающих в процессе поиска:

1. При организации поиска одновременно решаются две противоположные задачи: с одной стороны - увеличение количества найденных страниц с целью извлечения максимального количества значимой информации, с другой - уменьшение количества информации, не соответствующей критерию поиска.

2. Многовариантность человеческого языка. Русский отличается богатством морфологических вариаций слов, а для полноты поиска необходимо учитывать еще и синонимы.

3. Технические трудности из-за различных кодировок информации. Российские поисковые машины распознают кодировки пользователя и искомого сайта, но совместить их удается не всегда.

4. Нестабильность. Постоянно изменяются адреса и структура сайтов, они появляются и исчезают, и поисковые машины не успевают обновлять свои базы индексированных данных, поэтому значительная часть списка документов, выданного машиной, может оказаться недоступной.

Для того, чтобы поиск был наиболее эффективен, необходимо обратить внимание на следующие моменты:

1. Определить тему запроса;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Обратить внимание на язык, грамматику, использование различных небуквенных символов, морфологию;

3. Правильно выявить ключевые слова;

4. Использовать возможности различных поисковых систем, в частности расширенный поиск.

Подводя итог, можно сказать, что единой оптимальной схемы поиска в Internet не существует. В зависимости от специфики необходимой информации, для ее поиска должны использоваться соответствующие поисковые службы. Чем грамотнее подобраны поисковые службы и составлен запрос на поиск информации, тем качественнее будут результаты поиска.

134

i Надоели баннеры? Вы всегда можете отключить рекламу.