Научная статья на тему 'Анализ нововведений в алгоритмах поисковых систем Yandex и Google'

Анализ нововведений в алгоритмах поисковых систем Yandex и Google Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
371
47
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОИСКОВАЯ СИСТЕМА / РАНЖИРОВАНИЕ САЙТОВ / АЛГОРИТМ ПОИСКА / ПОИСКОВОЙ РЕСУРС / GOOGLE / YANDEX

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Пестерев П.В.

В статье рассмотрены нововведения в алгоритмах поисковых систем Yandex и Google. Проанализированы и представлены основные направления совершенствования алгоритмов поисковых систем. На основе рассмотренных принципов работы алгоритмов разработчики сайтов могут поднять свои ресурсы в результатах поисковой выдачи. Статья может быть полезна дизайнерам и разработчикам сайтов, студентам, магистрантам и аспирантам, обучающимся по направлениям в сфере информационных технологий.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Анализ нововведений в алгоритмах поисковых систем Yandex и Google»

DOI: 10.12737/24888

Пестерев П.В., аспирант Омский государственный технический университет

АНАЛИЗ НОВОВВЕДЕНИЙ В АЛГОРИТМАХ ПОИСКОВЫХ СИСТЕМ YANDEX И GOOGLE

scoolptor@mail.ru

В статье рассмотрены нововведения в алгоритмах поисковых систем Yandex и Google. Проанализированы и представлены основные направления совершенствования алгоритмов поисковых систем. На основе рассмотренных принципов работы алгоритмов разработчики сайтов могут поднять свои ресурсы в результатах поисковой выдачи. Статья может быть полезна дизайнерам и разработчикам сайтов, студентам, магистрантам и аспирантам, обучающимся по направлениям в сфере информационных технологий.

Ключевые слова: поисковая система, ранжирование сайтов, алгоритм поиска, поисковой ресурс, Google, Yandex._

Введение. Поисковая система - веб-сервис, предназначенный для поиска текстовой и графической информации в сети Интернет. Поиск информации осуществляется на основе сформулированного пользователем поискового запроса [1]. Работа такой системы заключается в том, чтобы пользователь по запросу, содержащему ключевые слова, нашел необходимые документы [2]. При этом поисковая система генерирует страницу, содержащую результаты поиска, как правило, в виде списка сайтов с краткой информацией. Результаты такой выдачи называются ранжированием сайтов, которое осуществляется на основе алгоритмов, меняющихся в процессе их функционирования [3]. В России наиболее популярными поисковыми системами являются Yandex и Google [4]. В данной статье рассматриваются и анализируются нововведения в алгоритмах данных поисковых систем.

Анализ алгоритмов Яндекс. Анализ алгоритмов Яндекс с 2007 по 2012 год (алгоритмы «8 SP1», «Магадан», «Находка», «Арзамас», «Снежинск», «Коканово», «Матрикснет», «Обнинск», «Краснодар», «Рейкьявик», «Калининград») приводится в статье «Перспективы развития поисковых систем Рунета на основе обзора алгоритмов Яндекса» [5].

30 мая 2013 года компания Яндекс запустила алгоритм «Дублин» [6], являющийся модификацией выпущенного в декабре 2012 года алгоритма «Калининград». «Калининград» [5, 7] делил интересы пользователей на кратковременные и долговременные, «Дублин» же реагировал на сиюминутные интересы. Данный алгоритм работал на основе изучения браузерной истории, анализируя запросы за последние несколько часов. Например, пользователь искал информацию по географии, а после этого задал поисковой запрос «Мадагаскар», в этом случае он находит остров. Если же непосредственно перед этим он интересовался кинематографом,

то в результатах запроса вначале будут стоять сайты с информацией о мультфильме с этим названием. Если рассматривать данный алгоритм с точки зрения поисковой оптимизации, то можно сказать, что он не оказывает никакого влияния на позиции сайта и их рейтинг в результатах поисковой выдачи. В сущности, алгоритм «Дублин» отвечает на сиюминутные запросы и выдает результаты в соответствии с этими запросами в том порядке, в котором их оценили другие алгоритмы.

Также в мае 2013 года Яндекс анонсировал введение «Островов» [8] - интерфейсного изменения поисковой выдачи. Главным нововведение стали интерактивные блоки на странице выдачи результатов поиска, позволяющие напрямую взаимодействовать с сайтом. Таким образом, например, стало возможно узнавать расписание сеансов и бронировать места в кинотеатре сразу из поискового ресурса. Изначально компания предполагала, что интерактивные блоки будут создаваться разработчиками сайтов.

15 мая 2015 Яндекс запустил новый алгоритм «Минусинск» [9, 10]. В соответствии с данным алгоритмом сайты, при продвижении которых используются SEO-ссылки (Search Engine Optimization [11]), стали понижаться в результатах поисковой выдачи. Таким образом, представители Яндекс планировали, что владельцы сайтов перенаправят деньги, которые до этого тратились на закупку SEO-ссылок, на реальное улучшение ресурсов. Однако использование таких ссылок остается актуальным до сих пор. Тем не менее, единственным верным направлением является развитие сайта, системное улучшение контента, сервиса и дизайна.

2 февраля 2016 года Яндекс запустил алгоритм «Владивосток» [12]. В соответствии с данным алгоритмом поисковая система стала учитывать в результатах поисковой выдачи адапти-рованность сайта под мобильные устройства.

Также Яндекс сообщил, каким требованиям должна соответствовать страница такого сайта: контент должен быть оптимизирован под размеры экрана смартфона, не должно быть горизонтальной прокрутки, тогда пользователю не придется увеличивать шрифт для просмотра страницы и скролить ее влево-право; на сайте должно быть элементов, не поддерживаемых мобильными браузерами (java-апплеты, flash и т.д.).

2 ноября 2016 года Яндекс запустил новый алгоритм «Палех» [13]. Данный алгоритм работает с использованием искусственных нейронных сетей и позволяет более точно понимать, о чем его спрашивают люди. По данным статистики Яндекс каждый день отвечает примерно на 280 миллионов запросов, примерно около 100 миллионов из них уникальны или задаются очень редко [13]. Именно на эти запросы нейронная сеть и помогает подобрать более точный ответ, т.к. по ним нет поведенческой статистики, а, следовательно, работа с ними более сложная. К таким запросам часто относятся вопросы детей, еще не освоившихся с поисковой системой и общающихся с ней, как с живым человеком, например: «дорогой яндекс посоветуй пожалуйста новые интересные мультфильмы про фей». Или запросы людей про фильмы или книги: «фильм в котором человек выращивает картошку на Марсе» («Марсианин»). Данная модель, основанная на нейронных сетях, обладает огромным потенциалом и в перспективе способна «понимать» семантическое соответствие между запросами и документами на уровне, сопоставимом с человеческим.

Анализ алгоритмов Google. Еще в 2014 году Google объявлял о необходимости ресурсов переходить на защищенный протокол HTTPs (HyperText Transfer Protocol Secure [14]). Это позволило бы обеспечить лучшее ранжирование сайта в результатах поисковой выдачи. Данный аспект связан с тем, что Google планирует постепенно относить сайты на HTTP (HyperText Transfer Protocol) к числу «потенциально небезопасных».

Также в 2016 году Google ввел фактор адап-тированности страниц ресурса под мобильные устройства. Такие страницы имеют более высокий рейтинг в результатах поисковой выдачи. Кроме того стала очень важной скорость загрузки сайта. Пользователи не готовы ждать более 3 секунд, и если сайт не загружается за это время, то 40 % посетителей покидает его [15]. Каждая секунда загрузки снижает уровень конверсии на 7 % [16]. Как следствие, сайты с высокой скоростью загрузки вызывают доверие посетителей, имеют более хорошие поведенческие факторы и,

соответственно, более высокие позиции в результатах поисковой выдачи.

Количество встроенных алгоритмов в поисковую систему Google увеличивается. Одним из интересных нововведений стал в 2012 году алгоритм «Пингвин» («Penguin»), который позже неоднократно обновлялся [17]. Суть алгоритма заключалась в борьбе с неестественными SEO-ссылками.

В 2013 году был запущен алгоритм «Колибри» («Calibri») [17], главной задачей которого стало более точное понимание запросов пользователей. Для качественной совместной работы сайта и данного алгоритма необходимо предоставлять более качественную и обширную информацию, а не использовать только продвижение по ключевым словам.

В 2015 году был запущен алгоритм Rank-Brain [17], в основе которого используются искусственные нейронные сети. Алгоритм научился угадывать запросы пользователей по логическим цепочкам, связывая слова из запросов между собой и выдавая правильный ответ. Google стал ориентироваться не только на ключевые слова, но и на смысл запросов в целом, основываясь на семантическом анализе. Таким образом, алгоритм RankBrain успешно обрабатывает уникальные запросы, количество которых составляет примерно 16-20 % от общего количество запросов в Google [15].

Выводы. В статье были рассмотрены нововведения в алгоритмах поисковых систем Yandex и Google. На основе приведенного анализа можно заключить, что поисковые системы стали негативно относиться к сайтам, использующим покупные искусственные SEO-ссылки, их рейтинг в результатах поисковой выдачи стал падать. Важной стала адаптированность страниц сайтов под мобильные устройства. Поисковые системы стали использовать искусственные нейронные сети, в перспективе способные «понимать» семантическое соответствие между запросами и документами на уровне, сопоставимом с человеческим. Все это означает, что поисковые системы дают все более точные ответы на запросы пользователей, а искусственная накрутка показателей в результатах поисковой выдачи становится все менее возможной и зачастую имеет противоположный эффект, поисковая система понижает рейтинг таких сайтов. Соответственно единственным верным способом продвижения сайта является его развитие, системное улучшение контента, сервиса, дизайна, оптимизация ресурса под мобильные устройства.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Chu H., Rosenthal M. Search Engines for the World Wide Web: A Comparative Study and Evaluation Methodology // Proceedings of the Annual Meeting-American Society for Information Science. 1996. Vol. 33. P. 127-135.

2. Tarakeswar M.K., Kavitha M.D. Search Engines: A Study // Journal of Computer Applications (JCA). 2011. Vol. 4, №1. P. 29-33.

3. Ашманов И.С., Иванов А.А. Продвижение сайта в поисковых системах. ИД Вильямс, 2011. С. 71.

4. Рейтинг поисковых систем [Электронный ресурс]. Систем. требования: AdobeAcrobatReader. URL: http://www.gs.seo-auditor.com.ru/sep/ (дата обращения: 27.02.2017)

5. Пестерев П.В., Рудюк А.П., Янишевская А.Г. Перспективы развития поисковых систем Рунета на основе обзора алгоритмов Яндекса / Информационные технологии в науке и производстве: материалы Всерос. молод. науч.-техн. конф. (Омск, 9-10 февр. 2015 г.) / М-во образования и науки РФ, ОмГТУ; М-во образования Омской обл. // Омск: Изд-во ОмГТУ, 2015. С. 38-41.

6. Новый персональный поиск Яндекса [Электронный ресурс]. Систем. требования: AdobeAcrobatReader. URL: https://yandex.ru/company/press_releases/2013/053 0/ (дата обращения: 27.02.2017)

7. Яндекс дает персональный ответ [Электронный ресурс]. Систем. требования: AdobeAcrobatReader. URL: https://yandex.ru/company/press_releases/2012/121 2 (дата обращения: 27.02.2017)

8. Острова Яндекса [Электронный ресурс]. Систем. требования: AdobeAcrobatReader. URL: https://yandex.ru/blog/company/66690 (дата обращения: 27.02.2017)

9. Новый этап в борьбе со ссылочным спамом [Электронный ресурс]. Систем. требования: AdobeAcrobatReader. URL: https://yandex.ru/blog/webmaster/20143 (дата обращения: 27.02.2017)

10. Алгоритм «Минусинск» [Электронный ресурс]. Систем. требования: AdobeAcrobatReader. URL: https://yandex.ru/support/webmaster/yandex-indexing/algorithm-minusinsk.xml (дата обращения: 27.02.2017)

11. Ortiz-Cordova A., Jansen B.J. Classifying Web Search Queries in Order to Identify High Revenue Generating Customers // Journal of the American Society for Information Sciences and Technology. 2012.P.1426 - 1441.

12. Оптимизация для мобильных - теперь фактор ранжирования [Электронный ресурс]. Систем. требования: AdobeAcrobatReader. URL: https://yandex.ru/blog/webmaster/optimizatsiya-dlya-mobilnykh-teper-faktor-ranzhirovaniya (дата обращения: 27.02.2017)

13. Алгоритм «Палех»: как нейронные сети помогают поиску Яндекса [Электронный ресурс]. Систем. требования: AdobeAcrobatReader. URL: https://yandex.ru/blog/company/algoritm-palekh-kak-neyronnye-seti-pomogayut-poisku-yandeksa (дата обращения: 27.02.2017)

14. Secure Your Site with HTTPS [Электронный ресурс]. Систем. требования: AdobeAcrobatReader. URL: https://support.google.com/webmasters/answer/607 3543 (дата обращения: 27.02.2017)

15. Шульгина Е. SEO-тренды в Google -2017 [Электронный ресурс]. Систем. требования: AdobeAcrobatReader. URL: http://artvision.pro/seo-trendy-v-google-20176073543 (дата обращения: 27.02.2017)

16. Федотова Ю. Время загрузки сайта -влияние на настроение пользователей [Электронный ресурс]. Систем. требования: AdobeAcrobatReader. URL: http://blog .getgoodrank.ru/vremya-zagruzki -saj ta-vliyanie-na-nastroenie-polzovatelej/ (дата обращения: 27.02.2017)

17. Google Algorithm Change History [Электронный ресурс]. Систем. требования: AdobeAcrobatReader. URL: https://moz.com/google-algorithm-change#2012 (дата обращения: 27.02.2017)._

Pesterev P.V.

ANALYSIS OF IMPROVEMENTS IN THE SEARCH ENGINE ALGORITHMS OF YANDEX AND GOOGLE

The article describes improvements in the search engine algorithms of Yandex and Google. It is analyzed and presented the main directions of improving the search engine algorithms. Based on the present principles of algorithms developers can raise their sites in the search engine results page (SERPs). The article can be useful to designers and web developers, students, undergraduates and postgraduates in the fields of information technology.

Key words: search engine, ranking sites, search engine algorithm, search resource, Google, Yandex.

Пестерев Павел Викторович, аспирант. Омский государственный технический университет. Адрес: Россия, 644042, Омск, пр. Карла Маркса, д. 37 E-mail: scoolptor@mail.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.