Научная статья на тему 'Качественная оценка веб-узла в киберметрии: возможности усовершенствования алгоритма hits'

Качественная оценка веб-узла в киберметрии: возможности усовершенствования алгоритма hits Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
145
42
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЕБОМЕТРИКА / АЛГОРИТМЫ РАНЖИРОВАНИЯ / ПОИСКОВАЯ ИНДЕКСАЦИЯ / ИНФОМЕТРИЯ / КИБЕРМЕТРИЯ

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Якунин Александр Васильевич

Статья посвящена вопросам усовершенствования технологической основы информационного поиска алгоритма HITS, являющегося основой современных поисковых систем. Автором предложено дополнение к основному алгоритму ранжирования, способное вовлечь в индексацию качественный критерий параметры визуальной организации веб-сайта.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Качественная оценка веб-узла в киберметрии: возможности усовершенствования алгоритма hits»

_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «СИМВОЛ НАУКИ» №10-2/2016 ISSN 2410-700Х_

Материалы международной научно-практической конференции «Перспективные инновации в науке, образовании, производстве и транспорте 2012». Выпуск 2. Том 6. - Одесса: КУПРИЕНКО, 2012 - С.32-34.

4. Суровцева, О.А. Решение задач технологической подготовки производства обуви с использованием потенциала машиностроительной САПР ТП [Текст] / О.А. Суровцева // Сборник научных трудов по материалам международной научно-практической конференции «Наука сегодня: проблемы и перспективы развития» (25 ноября 2015 г.) - Вологда, 2015, Ч.1, С. 65-67.

5. Суровцева, О.А. Адаптация машиностроительной САПР ТП для улучшения качества технологической подготовки производства [Текст] / О.А. Суровцева // Современные тенденции развития науки и технологий. IV Междунар. Научно-практич. конференция, сб. науч. трудов (31 июля 2015) - Белгород, 2015, Ч.1, С 137139.

© Шишкина Г.И., Суровцева О.А., 2016

УДК 51-7

Якунин Александр Васильевич

кандидат филологических наук, доцент Санкт-Петербургский государственный университет

г. Санкт-Петербург

КАЧЕСТВЕННАЯ ОЦЕНКА ВЕБ-УЗЛА В КИБЕРМЕТРИИ: ВОЗМОЖНОСТИ УСОВЕРШЕНСТВОВАНИЯ АЛГОРИТМА HITS

Аннотация

Статья посвящена вопросам усовершенствования технологической основы информационного поиска - алгоритма HITS, являющегося основой современных поисковых систем. Автором предложено дополнение к основному алгоритму ранжирования, способное вовлечь в индексацию качественный критерий - параметры визуальной организации веб-сайта.

Ключевые слова

вебометрика, алгоритмы ранжирования, поисковая индексация, инфометрия, киберметрия

Работа выполнена при финансовой поддержке гранта РФФИ 15-01-06105 А «Разработка вебометрических и эргономических моделей и методов анализа эффективности присутствия в Вебе информационных веб-пространств крупных организаций».

Методам оценки эффективности присутствия организации в глобальной сети в последнее десятилетие уделяется значительное внимание. Особое значение эти методы имеют для развития крупных образовательных учреждений, типичными представителями которых являются университеты [1, с. 117— 131; 4, с. 25—28]. Именно для них созданы и совершенствуются специализированные поисковые программно-аппаратные комплексы - краулеры, анализ деятельности которых составляет предмет одного из разделов киберметрии - вебометрики.

Алгоритмическую основу большинства краулеров составляют математические модели информационного поиска, ориентированные на представление взаимосвязей между документами сети в виде гиперссылочной архитектуры. Главная задача при этом - обеспечение автоматической оценки авторитетности соответствующей веб-страницы, т.е. определение её вебометрического ранга (Webometrics Rank — WR). Одним из ключевых принципов расчета индекса авторитетности является алгоритм HITS, основанный на упорядочивании страниц по убыванию значений индекса входящей центральности (in-degree) и исходящей активности (out-degree). Первый индекс актуален для страниц, которые можно назвать

_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «СИМВОЛ НАУКИ» №10-2/2016 ISSN 2410-700Х_

целевыми («страница-автор») - они в максимальной степени соответствуют поисковому запросу и при этом принимают на себя рекордное количество гиперссылок со стороны других документов. Второй индекс актуален для страниц-посредников («хаб-страницы»), содержащих большое количество ссылок на целевые документы. Структура алгоритма HITS предусматривает расчет для каждой страницы индекса авторитетности и посреднической оценки одновременно, при этом первая формируется на основе оценок указывающих на «автора» «хаб-страниц», а вторая - на основе рейтинга «страниц-авторов», на которые данная страница отсылает через гиперссылки.

Однако, как свидетельствуют некоторые исследования [3], алгоритмы наиболее авторитетных поисковых систем Яндекс и Google не ограничиваются моделированием гиперссылочной структуры вебсайта. В поисковой индексации все большее значение приобретает оценка поведения пользователя, непосредственно связанная с опытом его взаимодействия с интерактивной информационной системой. В связи с этим возникает вопрос: можно ли шагнуть еще дальше - возможна ли интеграция в алгоритм информационного поиска автоматической оценки визуальной архитектуры веб-сайта?

В рамках реализации грантового проекта РФФИ 15-01-06105 А «Разработка вебометрических и эргономических моделей и методов анализа эффективности присутствия в Вебе информационных веб-пространств крупных организаций» мы предприняли попытку интеграции критериев оценки дизайна вебстраницы в структуру алгоритма HITS. Основой нашего подхода является концепция когнитивных режимов Б.М.Величковского [2, с. 440-446], согласно которой характер задачи (поиск или рассматривание) обуславливает и определенные познавательные процессы, проявляющиеся в двух основных паттернах глазодвигательной активности. Паттерн, связанный с рассматриванием целевого элемента на странице, отражает процесс пристальной концентрации внимания и деятельности по распознаванию. Будучи характерен для процессов глубокого чтения («чтения-изучения»), он имеет особое значение для «страниц-авторов»: именно на них приоритетом ранжирования должны стать качество типографики, интерлиньяж и контрастность изображений. Его можно отождествить с микроуровнем композиционно-графической модели страницы [5, с. 226-231]. Второй паттерн, связанный с процессом пространственной ориентации на плоскости страницы, отражает поисковый режим распределения внимания и в большей степени характерен для страниц-посредников, «хабов». Он в большей степени характерен для макроуровня визуальной организации.

Таким образом, интегральный алгоритм индексации предполагает определение соответствия режима когнитивной активности вебометрическому статусу веб-страницы. Если страница имеет высокий статус в качестве «автора», ее визуальная организация должна соответствовать паттерну фокального режима обработки информации - ведь на ней восприятие информации становится более глубоким и детализированным. Соответственно, при высокой значимости страницы как посредника в ее дизайне особое значение приобретают средства эффективной навигации для взора - распределение контента по площади, контрастное зонирование, определенность модульной структуры и визуальная плотность.

Список использованной литературы

1. Антопольский А.Б., Поляк Ю.Е. Измерение присутствия в Интернете образовательных учреждений // Проблемы современного образования. — 2012. — № 4.

2. Величковский Б. М. Исследование когнитивных функций и современные технологии // «Вестник РАН», 2010, 80(5-6).

3. Ландэ Д.В., Снарский А.А., Безсуднов И.В. Интернетика. Навигация в сложных сетях: модели и алгоритмы. — Либроком, 2009. — 264 с.

4. Печников А.А., Илюкевич О.Г. Рейтинг официальных web-сайтов университетов России и Финляндии: сравнительный анализ // Информационные ресурсы России. — Москва: Российское энергетическое агентство Министерства энергетики Российской Федерации, 2008. — № 3.

5. Якунин А.В. Композиционно-графическая модель веб-сайта как фактор его эстетической привлекательности // Проблемы, перспективы и направления инновационного развития науки: Сборник статей международной научно-практической конференции (1 октября 2016, Уфа). В 2 ч. Ч.2 / - Уфа: АЭТЕРНА.

© Якунин А.В., 2016

i Надоели баннеры? Вы всегда можете отключить рекламу.