Научная статья на тему 'Использование поисковых систем для увеличения посе-щаемости федеральной системы информационно-обра-зовательных ресурсов'

Использование поисковых систем для увеличения посе-щаемости федеральной системы информационно-обра-зовательных ресурсов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
370
43
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОИСКОВАЯ ОПТИМИЗАЦИЯ / СЕО / ПРОДВИЖЕНИЕ САЙТОВ / ПОИСКОВОЕ ПРОДВИЖЕНИЕ САЙТОВ / РАСКРУТКА САЙТОВ / ОПТИМИЗАЦИЯ ПОД ПОИСКОВЫЕ СИСТЕМЫ / SEARCH OPTIMISATION / ADVANCEMENT OF SITES / SEARCH ADVANCEMENT OF SITES / PROMOTION OF SITES / OPTIMISATION FOR SEARCH SYSTEMS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гридина Е. Г., Лысенко Д. С.

Проблема повышения посещаемости федеральной системы информационно-образовательных ресурсов стала актуальной сравнительно недавно. В данной статье рассматривается решение этой проблемы путем поисковой оптимизации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Icreasing attendance of the federal educational portals system using search engines

The problem of increasing attendance of the federal educational portals system has become particularly topical recently. Solving this problem by search engines optimization (SEO) is considered.

Текст научной работы на тему «Использование поисковых систем для увеличения посе-щаемости федеральной системы информационно-обра-зовательных ресурсов»

ными ресурсами могут получить развитие в рамках проекта «Глобальная электронная система обучения граждан Союзного государства России и Беларуси (ГЭСО СГ)», разрабатываемого в рамках Концепции социального развития Союзного государства до 2010 года. Это обеспечит получение современного качественного образования ли-

цами с ограниченными возможностями (в том числе проживающими в малых городах Российской Федерации и Республики Беларусь) по специальностям, востребованным на рынке труда, с использованием современных технологий дистанционного обучения на базе ведущих учебных заведений Союзного государства.

Литература

1. Jennex M., Olfman L. Organizational Memory/Knowledge Effects on Productivity: A Longitudinal Study // 35th Hawaii International Conference on System Sciences (HICSS-35 2002). Электронный ресурс. Режим доступа: http://csdl.computer.org/comp/proceedings/hicss/2002/1435/04/14350109babs.htm.

2. Статистические данные Министерства здравоохранения Республики Беларусь. Электронный ресурс, режим доступа: http://www.minzdrav.by/med/article/statsod.php?prg=10&prn=%C8%ED%E2%E0 %EB%E8%E4%ED%EE%F1%F2%FC.

3. Статистические данные Пенсионного фонда Российской Федерации. Электронный ресурс, режим доступа: http://statistika.ru/zdr/2007/12/12/zdr_9933.html?curPos=2.

4. Горбачев Н.Н., Гринберг А. С. Концепция платформы для формирования и поддержки технологичных образовательных продуктов на основе отчуждения знаний // Сб. научн. тр. Реинжениринг бизнес-процессов - Системы управления знаниями (РБП-СУЗ-2007). - М., 2007.

5. Горбачев Н.Н., Гринберг А.С. Инструментальный комплекс управления образовательными информационными ресурсами вуза // Открытое образование. - 2009. - № 1.

6. IMS Learning Design Information Model, электронный ресурс. Режим доступа: http://www. Imsglobal.org/learningdesign/ldv1p0/imsld_infov1p0.html.

7. SCORM Documents. Электронный ресурс, режим доступа: http://www.adlnet. gov/Technologies/scorm/SC0RMSDocuments/2004%204th%20Edition/0verview.aspx - загл. с экрана

8. PowerPointForce. Электронный ресурс, режим доступа http://elearningforce.ru/powerpointforce.html.

ИСПОЛЬЗОВАНИЕ ПОИСКОВЫХ СИСТЕМ ДЛЯ УВЕЛИЧЕНИЯ ПОСЕЩАЕМОСТИ ФЕДЕРАЛЬНОЙ СИСТЕМЫ ИНФОРМАЦИОННО-ОБРАЗОВАТЕЛЬНЫХ РЕСУРСОВ

Е.Г. Гридина, д.т.н., проф.

Тел.: (495) 955-08-15; E-mail: gridina@informika.ru Д. С. Лысенко, асп., м. н. с.

Тел.: (495) 955-08-15; E-mail: lysenko@informika.ru ФГУ ГНИИ ИТТ «Информика» http://www.infomika.ru

The problem of increasing attendance of the federal educational portals system has become particularly topical recently. Solving this problem by search engines optimization (SEO) is considered.

Проблема повышения посещаемости федеральной системы информационно-образовательных ресурсов стала актуальной сравнительно недавно. В данной статье рассматривается решение этой проблемы путем поисковой оптимизации.

Ключевые слова: поисковая оптимизация, СЕО, продвижение сайтов, поисковое продвижение сайтов, раскрутка сайтов, оптимизация под поисковые системы.

Keywords: search optimisation, СЕО, advancement of sites, search advancement of sites, promotion of sites, optimisation for search systems.

1. Актуальность проблемы (далее - ФСИОР). В ФСИОР входят: инфор-

На протяжении многих лет ФГУ ГНИИ мационная система «Единое окно доступа к

ИТТ «Информика» ведет работы по созда- ресурсам образовательных порталов»

нию и развитию федеральной системы ин- (http://window.edu.ru), федеральный образо-

формационно-образовательных ресурсов вательный портал «Российское образование»

(http://edu.ru), Единая коллекция цифровых образовательных ресурсов (Ьйр://8Лоо1-

collection.edu.ru). ФСИОР содержит только достоверные, качественные и проверенные ресурсы сферы образования, и важной задачей является повышение посещаемости ФСИОР, в том числе через поисковые системы сети

в сети Интернет в решают поисковые

Интернет.

Проблему поиска большинстве случаев системы, которые в ответ на запрос пользователя выдают список документов, релевантных с точки зрения алгоритма поисковой системы запросу пользователя. С ростом популярности и увеличением доступности сети Интернет растет и посещаемость поисковых систем. Наибольшей популярностью в России пользуются поисковые системы Яндекс (http://www.yandex.ru), Google (http://www.google.ru), Рамблер (http:// wwwrambler.ru) и Мэйл.ру (http://search. mail.ru). На рис. 1 (см. цв. вставку) отображены кривые переходов на сайты зоны RU из поисковых систем.

Образовательный портал «Российское образование» получает около 60% пользовательского трафика через поисковые системы, Единая коллекция цифровых образовательных ресурсов - свыше 90%, портал Единое окно доступа к образовательным ресурсам - свыше 80%.

2. Поисковая оптимизация как инструмент повышения посещаемости

Количество переходов из поисковых систем зависит от положения ссылки на страницу в результатах поиска по запросам и его частотности, т. е. популярности запроса среди пользователей Интернета. Соответственно, чем выше расположена ссылка на страницу сайта в результатах поиска, тем выше вероятность перехода по ней. Средний CTR (количество переходов по ссылке, деленное на количество показов ссылки, выраженное в процентах) для ссылок результатов поиска с 1-й по 5-ю колеблется от 5 до 20%. Очень часто пользователи ограничиваются переходом по ссылкам на первой странице результатов поиска, не переходя на последующие. Поэтому важной задачей

Ш1ысенко

является попадание именно на первую страницу. Для увеличения числа переходов из поисковых систем необходимо знать основы работы алгоритмов поисковых машин и в соответствии с этими требованиями выстраивать структуру веб-сайтов.

________Поисковая

« ' новый термин, | новая область Интернет- техноло-| гий, которая активно развивается I в России в XXI ^^ веке. Поисковая ' оптимизация - это комплекс меро-I приятий, направленных на повышение видимости страниц вэб-сайта в поисковых системах, т. е., другими словами, на повышение позиций вэб-сайта в поисковых системах по списку ключевых запросов. Ключевой запрос - это то, что вводят пользователи в строку поиска поисковой системы. При вводе запроса поисковая система предлагает пользователю список релевантных страниц, который определяется ее алгоритмом. В Яндексе есть возможность сортировки результатов поиска по дате, по умолчанию же результаты сортируется по релевантности.

Релевантность всех ведущих поисковых систем основана на двух критериях: релевантность текста страницы и релевантность входящих (внешних) гиперссылок на страницу. Помимо непосредственного наличия текста на странице поисковые системы учитывают также тексты входящих гиперссылок. Так, если какой-либо сайт ссылается на страницу, например, с текстом «образовательный портал», то на этой странице, скорее всего, речь идет действительно об образовании, и она релевантна запросу «образование».

Поисковую оптимизацию разделяют на два вида - «белую» и «черную». Белая оптимизация - это улучшение структуры сайта и его страниц для индексации поисковыми роботами и повышение релевантности страниц запросам пользователей. Черная оптимизация - это попытка манипулировать результатами поиска, используя знания о работе алгоритмов поисковых систем (в основном это увеличение числа внешних гиперссылок на сайт в целях повышения позиций в результатах поиска).

В данной статье речь пойдет о «белой» оптимизации документов в формате HTML, который наиболее часто встречается на сайтах и в результатах поиска. Поисковые системы осуществляют также поиск по картинкам и документам в форматах Microsoft Word, Excel Acrobat Reader (.pdf) и др. (более подробно в п.3 - Общие сведения о поисковых системах). Таким образом, для успешного позиционирования страницы в поисковых системах необходимо работать над HTML кодом страниц, структурой гиперссылок внутри сайта, а также текстов внешних гиперссылок на страницу.

3. Общие сведения о поисковых системах

Яндекс, Google, Рамблер и Поиск mail.ru - наиболее популярные поисковые системы в Российском Интернете. Поиск mail.ru на данный момент не имеет собственной поисковой машины и использует результаты поисковой системы Яндекс на своем портале, поэтому рассмотрим оставшиеся три поисковые системы.

Яндекс - наиболее популярная система в России. Поиск осуществляется по следующим видам документов: HTML, PDF (Acrobat Reader), RTF (Rich Text Format), DOC (Microsoft Word), XLS (Microsoft Excel), PPT (Microsoft PowerPoint), FLASH (Adobe Flash). Яндекс также умеет искать по картинкам. Есть возможность поиска с учетом региона, даты документа, языка документа, расположения слов в документе. Все эти возможности доступны через расширенный поиск (http://yandex.ru/advan ced.html). Обновление поисковой базы и соответственно изменение результатов поиска по запросам происходят 1-2 раза в неделю. Реализован сервис для вэб-мастеров (http://webmaster.yandex.ru/), позволяющий увидеть ошибки в индексации вэб-сайта (сохранении копии документов в поисковой базе).

Google осуществляет поиск по тем же форматам документов, что и Яндекс, но умеет также искать по формату DWF (Autodesk DWF). Возможен поиск с ограничением по региону, языку документов, дате изменения. Обновление поисковой базы происходит практически ежедневно.

Рамблер осуществляет поиск по документам в форматах: HTML, DOC (Microsoft Word), PDF (Acrobat Reader). Помимо форматов, реализована возможность ограничения поиска по языку документа, дате его

изменения. Обновление поисковой базы происходит 1-2 раза в месяц.

Таким образом, все поисковые системы предоставляет расширенный поиск с ограничениями по ряду параметров. Если говорить о быстроте индексации документов и появлении их в результатах поиска (обновления поисковой базы), то Google занимает первое место, Рамблер работает медленнее всех.

4. Выбор поисковых запросов для проведения поисковой оптимизации

Для анализа частотности запросов по тому или иному ключевому запросу необходимо обратиться к статистике поисковых запросов. Открытая статистика доступна во всех рассматриваемых поисковых системах Яндекса (http://wordstat.yandex.ru /advq?rpt =ppc&shw=1), Рамблера (https://ad.rambler.ru /swrds/wrds.pl), Google.ru (https:// adwords .google.com/select/ KeywordTo olExternal ?defaultView=2), а также Mail.ru (http://stat .go.mail.ru/stats).

Несмотря на то, что Mail.ru использует поисковую базу Яндекса, статистика представлена немного в другом виде, нежели в Яндексе. Для просмотра статистики в Рамблере необходимо предварительно зарегистрироваться, иначе система не даст выполнить более трех обращений к данным.

В каждой из систем статистики есть свои плюсы и минусы. В первых двух поисковых системах можно просматривать статистику запросов по регионам пользователей, а также по месяцам. Запросы пользователей приведены в нижнем регистре, т.е. узнать разницу в статистике запросов «Образование» и «образование» возможности нет.

При просмотре результатов поиска пользователь чаще предпочитает просмат-реть документы, предложенные поисковой системой, на первой странице (Яндекс и Google отображают по умолчанию по 10 документов на каждой странице результатов поиска, Рамблер - 15 документов), чем перейти на вторую или последующие страницы (рис.2. - см. цв. вставку).

Рамблер позволяет посмотреть количество показов результатов поиска по словам как первой страницы выдачи, так и всех страниц в сумме. Такие данные позволяют оценить возможное число переходов на вэб-сайт при отсутствии на первой странице результатов поиска по интересующему запросу (рис.3. - см. цв. вставку).

Статистика Рамблера позволяет просмотреть словоформы, которые вводят пользователи при запросах (падежи, числа), а также показывает предлоги. Результаты поиска поисковых систем чувствительны к словоформам и регистрам букв, например, при разных падежах вводимых в строку поиска слов результаты могут отличаться (рис.4. - см. цв. вставку).

Яндекс не показывает варианты словоформ, которые вводят пользователи при поиске, их можно увидеть, используя статистику Рамблера. Статистика Яндекса имеет один большой плюс - позволяет подобрать синонимы для запросов.

Справа от статистики запросов по интересующему запросу приводится статистика по тем запросам, которые искали пользователи в рамках одной сессии (рис. 5 - см. цв. вставку). В приведенном примере статистики по слову «образование» (рис. 4) пользователь не находил в результатах поиска Яндекса ответ на свой вопрос и вводил новые запросы, уточняя первый. Эти данные позволяют расширить список запросов для поисковой оптимизации.

Статистика Mai1.ru (рис. 6 - см. цв. вставку) позволяет увидеть «чистые» запросы пользователей, т.е. запросы пользователей в таком виде, в каком их вводят в строку поиска. В статистике отображаются вводимые пользователями запросы с учетом регистра и предлогов.

Еще один способ подбора ключевых слов - статистика запросов в поисковой системе Goog1e.ru (рис. 7 - см. цв. вставку). В данной системе статистики показывается тенденция поиска, т. е. распределение количества запросов по месяцам и максимум по ключевому слову. Для некоторых вэб-сайтов посещаемость зависит от сезонности, соответственно эти данные могут быть полезны.

Также статистика Goog1e.ru показывает смежные запросы (рис. 8 - см. цв. вставку).

Существуют также уже обработанные источники статистики запросов, например база Пастухова (http://pastukhov.com), которая использует все перечисленные системы статистики, позволяет подбирать слова по различным поисковым системам.

В прямом эфире Яндекса .yandex.ru/queries/1ast20.xm1) можно увидеть «чистые» запросы, т.е. в таком виде, в котором их вводят пользователи (с предлогами, с учетом морфологии, спецсимволов и т.д.). Данный сервис, к сожалению, мало полезен,

т.к. ежесекундно производится слишком много обращений к Яндексу, и собрать статистику невозможно.

Для подбора поисковых запросов для оптимизации вэб-сайта необходимо составить список фраз, по которым, на ваш взгляд, могут искать ваш вэб-сайт или страницу. После этого следует воспользоваться статистикой поисковых запросов Яндекса, Рамблера, Mail.ru. Возможно также использовать статистику Liveinternet (http://www .liveinternet.ru) для подбора уточняющих запросов и т.н. тематического кластера, т.е. запросов схожих по тематике (рис. 9 - см. цв. вставку).

Для оценки возможной посещаемости можно считать, что веб-сайт, находящийся в первых пяти позициях результатов поиска по запросу, в среднем получит от 5 до 20% от числа показов запроса по статистике поисковой системы. Но это лишь очень приблизительная оценка, основанная на данных статистики Liveinternet.ru различных сайтов различных тематик.

5. Оптимизация страниц под поисковые запросы

После подбора поисковых запросов можно переходить ко второму этапу поисковой оптимизации - оптимизации HTML-кода страниц, структуры внутренних гиперссылок, а также ряда других параметров для улучшения индексации вэб-сайта поисковыми системами и увеличения релевантности по поисковым запросам.

Файл robots.txt, расположенный в корневой директории сайта, позволяет управлять доступом робота поисковой системы к сайту. Подробно стандарт описан в http://help.yandex.ru/webmaster/?id=996567 и http://www.conman.org/people/spc/robots2.html.

Остановимся на ключевых моментах. Для снижения нагрузки на вэб-сервер следует запретить поисковым роботам индексировать разделы и страницы сайта, не имеющие смысловой нагрузки. Примерами таких страниц и разделов могут быть: административный раздел сайта; каталог скриптов cgi-bin; страницы для печати (как правило, они являются дубликатами страниц вэб-сайта, не содержащими графических элементов); страницы, содержащие прайс-листы; спецификации, которые являются сортированными по тем или иным столбцам оригинала. В файле robots.txt возможно указание карты сайта для ускорения индексации

новых и переиндексации старых страниц сайта.

Все поисковые роботы индексируют новые документы, переходя по гиперссылкам в сети, и в случае появления внутри вэб-сайта новой страницы карта поможет роботу быстрее обнаружить ее. К примеру, вы создали новую страницу на сайте, разместили ссылку на нее на одной из внутренних страниц. Новую страницу робот поисковой системы проиндексирует только тогда, когда найдет на нее гиперссылку с внутренней страницы. Соответственно, не дождавшись переиндексации внутренней страницы со ссылкой на новую страницу, эта новая страница не будет проиндексирована поисковым роботом. При имеющейся карте сайта и записи о ней в файле robots.txt поисковый робот быстрее найдет новую страницу, т.к. индексирование страниц сайта робот обязан начинать с файла ограничений robots.txt.

Еще одним немаловажным понятием является т. н. хост с точки зрения поисковой системы. Все привыкли, что адрес вэб-сайта начинается с http://www. На самом деле для поисковой системы http://www.site.ru, http://site.ru - это разные адреса, разные страницы, и роботу необходимо указывать, по какому именно адресу необходимо индексировать и сохранять в своей базе документы. Для этого и создана директива «Host» в файле robots.txt. Соответственно ссылки внутри одного вэб-сайта также должны выглядеть соответствующим образом, например, если файл robots.txt выглядит так:

User-Agent: * Host: www.site.ru,

то ссылки внутри сайта будут выглядеть:

http://www.site.ru/contacts http://www.site.ru/page.htm.

Неправильный вариант: http://site.ru/contacts http://site.ru/page.htm.

В случае, если сайт имеет зеркала, в файле robots.txt сайтов-зеркал в директиве Host необходимо указывать главный сайт:

Например, www.site.ru - главный, а www.zerkalo.ru - зеркало, тогда его robots.txt должен выглядеть следующим образом: User-Agent: * Host: www.site.ru.

В случае, если вэб-сайт содержит множество страниц, разделов, и даже при закрытии от индексации разделов и страниц, не

несущих смысловую нагрузку, поисковые роботы излишне перегружают вэб-сервер, следует воспользоваться директивой Crawl-delay для указания поисковым роботам минимального интервала между индексацией двух страниц.

Следует внимательно изучить директивы, которые поддерживают поисковые системы. Например, Яндекс поддерживает не все директивы стандарта ограничений для роботов

(http://help.yandex.ru/webmaster/?id=996567# 996575).

Настройки вэб-сервера и адресация внутри сайта. При создании динамических вэб-сайтов, например, с каталогами описаний, часто можно наблюдать длинные адреса страниц: http://www.site.ru/catalog. php?id =1&param=2&sort=name&page=1. Такие адреса обычно обусловлены множественностью параметров внутри скрипта, выводящего содержимое страницы. Страницы с такими «длинными» адресами индексируются поисковыми роботами. Но бывают ситуации, когда страницы с такими адресами пропадают из поисковой базы на некоторое время, затем снова появляются (особенно часты такие случаи в Google). Гораздо реже такие ситуации возникают со страницами, которые по виду напоминают структуру вложенных папок. Для приведенного примера адрес страницы должен быть таким: http://www.site.ru/catalog/1/2/name/1, т.е. значения параметров скрипта catalog.php (id, param, sort, page) как бы являются вложенными друг в друга папками. Изменение вида адресов страниц может быть реализовано на уровне вэб-сервера. Для наиболее распространенного вэб-сервера Apache это можно сделать при помощи встроенного модуля ModRewrite

(http://httpd.apache.org/docs/1.3/mod/ mod_ rewrite.html).

Оформление страниц согласно выбранному ключевому слову. Ключевое слово должно встречаться в следующих тегах HTML документа: TITLE, H1, а также в тексте страницы. Количество вхождений ключевого слова на странице должно быть в разумных пределах, т.е. нужно просто руководствоваться тем, что страница пишется для пользователей, не нужно допускать излишних повторов. Если в тексте страницы встречается ключевое слово, которое относится к другой странице вэб-сайта, можно выделить его в гиперссылку. Хороший пример в этом случае Википедиа

(http://ru.wikipedia.org), где внутри текста страниц выделены в гиперссылки ключевые слова, которые описаны на других страницах внутри того же вэб-сайта.

Знание работы алгоритмов поисковых систем и их правильное применение на практике позволяют повысить эффектив-

ность работы ФСИОР путем снижения нагрузки на серверы роботами поисковых систем, улучшить индексацию, повысить релевантность страниц поисковым запросам и, следовательно, увеличить посещаемость ФСИОР, которая содержит качественные и достоверные образовательные ресурсы.

Литература

1. Гридина Е.Г., Иванников А.Д., Булгаков М.В., Чиннова И.И., Сигалов А.В.. Система федеральных образовательных порталов: 3 года в Интернете // Открытое Образование. - 2005. - № 1.

2. Ашманов И.С., Иванов А.А.. Оптимизация и продвижение сайтов в поисковых системах. - СПб.: Питер, 2008.

3. Колисниченко Д.Н.. Поисковые системы и продвижение сайтов в Интернете. - М.: Диалектика-Вильямс, 2007.

ВЫБОР ИНСТРУМЕНТАЛЬНЫХ СРЕДСТВ АНАЛИЗА КАЧЕСТВЕННЫХ ХАРАКТЕРИСТИК ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ В ОБЛАСТИ ОБРАЗОВАНИЯ КАК ОБЪЕКТА ИНВЕСТИЦИЙ

О.В. Рогозин, доц., к.т.н.

Каф. Программного обеспечения ЭВМ и информационных технологий Тел.: (495) 442 8098; E-mail: orogozin@mail.ru Московский государственный технический университет им. Н.Э. Баумана

http://www.bmstu.ru

The article provides a fuzzy logic method, to select a decision-making tools of analysis based on quality parameters of software in educational spheres as the investment object. Fuzzy techniques have been successfully used in control in several fields, and engineers and researchers are today considering fuzzy logic algorithms in order to implement intelligent functions in embedded systems. We have started to develop a set of tools to support our courses on intelligent control of investment decision.

Существующие методы поддержки принятия решений опираются на анализ количественных характеристик, среди них MAUT , ELECTRE, AHP. В представленной статье рассматриваются методы поддержки принятия решений на основе нечеткой логики. Точность полученного результата сравнивается с результатами, полученными методом MAUT.

Ключевые слова: нечеткая логика, принятие решений, инвестиция, методология в экономике.

Keywords: fuzzy logic, decision making, investment, methodology in economics.

ет необходимость в подборе ПО не только с учетом формальных показателей его качества, но и в соответствии с предпочтениями конкретного пользователя. По характеру принимаемого решения задача относится к задаче распределения альтернатив по классам решений: из множества альтернатив (программных продуктов) выделяется группа предпочтительных для пользователя.

Представим задачу выбора эффективного ПО в образовании как задачу поддержки принятия решения (ППР Decision Making DM) в инвестиционном процессе с

Введение

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Разнообразие решаемых в образовательном процессе задач и инновационная составляющая современных экономических процессов диктуют новые требования ко всем компонентам качественного обучения. В связи с этим возника-

i Надоели баннеры? Вы всегда можете отключить рекламу.