Научная статья на тему 'Ранжирование официальных сайтов университетов мира как метод построения рейтинга посредством присутствия в сети Интернет'

Ранжирование официальных сайтов университетов мира как метод построения рейтинга посредством присутствия в сети Интернет Текст научной статьи по специальности «Науки об образовании»

CC BY
350
118
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЕБОМЕТРИКА / ИНДИКАТОРЫ / ПОИСКОВЫЕ МАШИНЫ / РАНЖИРОВАНИЕ САЙТОВ / WEBOMETRICS / INDICATORS / SEARCH ENGINES / RANKING OF SITES

Аннотация научной статьи по наукам об образовании, автор научной работы — Бузунов Петр Александрович

На основе настоящих данных проведён общий обзор состояния вебометрических исследований в России и зарубежом. Проанализирована методология определения рейтинга доменов учебных заведений в сети Интернет на примере исследования технологии обработки входных-выходных данных с сайтов представителями испанской исследовательской группы Webometrics.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Ranking of the Official Websites of World Universities as a Method of Rating by the Presence in the Internet

On the basis of current data the overview of webometric researches in Russia and foreign countries is carried. The methodology of ranking of official websites of educational institutions in the Internet are analyzed on the example of research of technology processing of inputoutput data from the sites by the representatives of Spanish research group Webometrics.

Текст научной работы на тему «Ранжирование официальных сайтов университетов мира как метод построения рейтинга посредством присутствия в сети Интернет»

УДК З 97 ББК 681 П. А. Бузунов

г. Чита, Россия

Ранжирование официальных сайтов университетов мира как метод построения рейтинга посредством присутствия в сети Интернет

На основе настоящих данных проведён общий обзор состояния вебометрических исследований в России и зарубежом. Проанализирована методология определения рейтинга доменов учебных заведений в сети Интернет на примере исследования технологии обработки входных-выходных данных с сайтов представителями испанской исследовательской группы Webometrics.

Ключевые слова: вебометрика, индикаторы, поисковые машины, ранжирование сайтов.

P.A. Buzunov

Chita, Russia

Ranking of the Official Websites of World Universities as a Method of Rating by the Presence in the Internet

On the basis of current data the overview of webometric researches in Russia and foreign countries is carried. The methodology of ranking of official websites of educational institutions in the Internet are analyzed on the example of research of technology processing of inputoutput data from the sites by the representatives of Spanish research group Webometrics.

Keywords: webometrics, indicators, search engines, ranking of sites.

Введение

Существует достаточно много методик для сравнения эффективности представления университетского веб-пространства в сети Интернет. Один из наиболее качественных подходов — использование инструментов вебометрики (веб-индикаторов), доверием к измерению которых не пренебрегает ни один из академических кругов.

Термин «вебометрика» («webometrics») был введен сравнительно недавно - в 1997 году. П. Игверсен и Т. Алминд в своей работе «Informetric analyses on the World Wide Web: Methodological approaches to ’’webometrics”», опубликованной в журнале Journal of Documentation, определили данное понятие после расширения понятия «библиометрика» на веб-пространство. «Вебометрика» здесь понимается как информетрический метод для World Wide Web (далее, Веб). Другими словами, вебометрика занимается количественными аспектами конструирования (создания) и использования информационных ресурсов, структур и технологий применительно к Вебу [4].

В 1998 году П. Ингверсон ввел понятие Web Impact Factor (WIF) и определил его как отношение числа входящих ссылок V на сайт к общему количеству страниц S на сайте:

V

WIF = S

Это, по сути, первая достойная внимания вебометрическая характеристика, предложенная в то время, которая использовала веб-индикаторы для создания общей картины ранжирования. Конечно, она уже позволяла составить рейтинг сайтов высших учебный заведений и научных организаций, но зависимость этого отношения только от двух веб-индикаторов вызывало сомнение в том, что с помощью этой характеристики можно провести всесторонний анализ сайта. К тому же, значение данных индикаторов разнилось для одного и того же сайта в зависимости от использования для их определения разных поисковых машин.

На сегодняшний день существует достаточно рейтинговой информации по университетам мира, следовательно, разработано множество методик по ранжированию сайтов университетов.

© Бузунов П. А., 2011

179

Существуют несколько зарубежных источников по ранжированию университетов мира [1]:

1) Webometrics: World Universities’ Ranking on the Web by Cybermetrics Lab;

2) The Times Higher Education - QS World University Rankings;

3) Academic Ranking of World Universities by SJTU;

4) Top 100 Global Universities by Newsweek;

5) G-Factor International University Rankings by Google Search;

6) Professional Ranking of World Universities by MINES Paris Tech;

7) Performance Ranking of Scientific Papers for World Universities by HEEACT;

8) Global University Ranking by Wuhan University, China и др.

В России же можно отметить несколько исследований, направленных на изучение национальных веб-ресурсов университетов и научных отделений РАН: исследование научных сайтов Сибирского отделения РАН, рейтинг научных учреждений СО РАН, рейтинги университетов северо-запада России и Финляндии [5].

Исследование подхода к построению рейтингов доменов университетов мира

на примере проекта Webometrics

Из мировых рейтинговых работ можно отметить испанскую исследовательскую группу Cybermetrics Lab, принадлежащей крупнейшему исследовательскому Центру информации и документации Испании Consejo Superior de Investigaciones Cienthficas (CSIC) с их успешным проектом Webometrics Ranking of World Universities (кратко, проект Webometrics). Изначально сайт проекта -http://www.webometrics.info — разрабатывался для привлечения научных публикаций в глобальную сеть, но, со временем, практика показала, что полученные данные с сайтов можно использовать с целью ранжирования [6]. Первая публикация рейтингов появилась в 2004 году, начиная с 2006 года, в год появляется по 2 рейтинга (в январе и июле) [2].

Для своих исследований Webometrics использовали 4 веб-индикатора:

1) Размер сайта (Size) - количество страниц на сайте, найденных четырьмя поисковыми машинами: Google, Yahoo, Live Search и Exalead [3];

2) Видимость сайта (Visibility) - общее количество уникальных внешних ссылок на сайт. С большей степенью достоверности может быть получено только в Yahoo Search [3];

3) Число файлов на сайте (Rich Files) - количество размещенных на сайте научных работ, публикаций исследований в форматах Adobe Acrobat (.pdf), Adobe PostScript (.ps), Microsoft Word (.doc) и Microsoft Powerpoint (.ppt). для поиска файлов используют ресурс Google [3];

4) Научность сайта (Scholar) - научная популярность, или индекс цитирования, сайта с точки зрения поисковой системы Google Scholar. Здесь определяется количество работ и цитат на сайте, используемых в мире в различных областях знаний [3].

Формула, предложенная Webometrics, представляет собой многочлен с весовыми коэффициентами:

WR = aV + вБ + yR + SSc, (1)

где:

WR (Webometrics Rank) - результирующее значение в статистике Webometrics (ранг); а, в, y, S - весовые коэффициенты;

V, S, R, Sc - нормированные вебометрические параметры: видимость сайта, его размер, научные файлы сайта и индекс цитирования соответственно.

Остановимся отдельно на каждом параметре и на весовых коэффициентах.

V - параметр, представляющий нормированный на единицу по всем исследуемым учебным заведениям результат, полученный с помощью Yahoo Search.

В общем виде нормирование параметров происходит по формуле [2]:

= 1п(па + 1)

“ 1п{тах{щ) + 1У у ;

где:

N - поисковая машина (Google, Yahoo, Live Search или Exalead); a - исследуемый домен (сайт);

na - значение параметра поисковой машины N для домена a;

г - количество исследуемых сайтов учебных и научных заведений.

Тогда нормированный параметр видимости домена (сайта) а примет вид:

К = Уа;

где:

^ _ 1п(уа + 1)

У- П.

ln(max(yi) + 1)’ здесь

Va - значение видимости (наличия внешних ссылок ) домена (сайта) а;

Ya - нормированное по методу (2) значение числа внешних ссылок на домен (сайт) а, полученное с помощью Yahoo Search.

S - индикатор индексированной части сайта, представляющий собой нормированные на единицу по всем исследуемым учебным заведениям значения, полученные поисковыми машинами Google, Yahoo, Live Search, Exalead значения объема сайта, усреднённые с помощью метода медиан [2]. Используя (2), запишем:

Ба = 2 ((^“ ~\~Ya + La + Еа) — max(Ga, Ya, La, Ea) — min(Ga, Ya, La, Ea)),

где:

Sa - усреднённый параметр нормированных значений числа страниц домена (сайта) а;

Ga, Ya, La, Ea - нормированные по методу (2) значения числа страниц домена, a по поисковым машинам Google, Yahoo, Live Search, Exalead соответственно;

R - параметр, представляющий собой сумму нормированных на единицу по всем исследуемым учебным заведениям значений числа файлов по отдельности четырёх форматов (*.pdf, *.ps, *.doc, *.ppt) [2]:

Ra = P DFa + P sa + DOCa + P PTa,

где:

Ra - результирующее значение показателя числа файлов с научными данными домена (сайта) a, нормированного отдельно по каждому формату;

PDFa, Psa, DOCa, PPTa - нормированные значения числа файлов домена (сайта) a, найденные Google. Для нормирования используется формула (2).

Sc - популярность сайта, представляющая собой нормированное на единицу по формуле (2) количество страниц и ссылок на сайт учебного заведения, найденных с помощью поисковой системы Google Scholar [6].

Sca = Ga,

где:

Sca - нормированный индекс цитирования домена (сайта) а.

Весовые коэффициенты за историю Webometrics менялись 2 раза. Главным условием было сохранение для коэффициентов отношения:

k(V) _ L

к(Б) + к(Бс) + ЦК)

С начала исследования весовые коэффициенты распределялись как:

к(У) : к(Б) : к(Бс) : к(К) = 0, 5:0, 25 : 0,125 : 0,125.

Затем параметрам индекса цитируемости (Бе) и количества файлов домена (Е) были увеличены весовые коэффициенты.

к(У) : к(Б) : к(Бс) : к(К) =0, 5:0, 20 : 0,15 : 0,15. (3)

Так весовые коэффициенты выглядят и в настоящее время.

Исходя из (3), формула (1) принимает вид:

WR = 0, 5V + 0, 2S + 0,15R + 0,15Sc,

или:

WR = (10V ) + (4S + 3R +3Sc).

Что касается позиции России в рейтинге Webometrics в январе 2011 года:

1) В Топ-200 не попал никто;

2) В Топ-500 один вуз;

3) В Топ-1000 5 вузов.

По сравнению с июлем 2010 года изменилась ситуация только с Топ-1000, куда попали ещё 2 вуза.

Интересно привести мнение руководителя проекта Webometrics, Isidro F. Aguillo из Центра научной информации и документации при Высшем совете по научным исследованиям Испании относительно мест в этом рейтинге российских вузов [7]:

«.. .По моему мнению, у России в Топ-100 должны быть, по крайней мере, два университета -Московский и Санкт-Петербургский. Сегодня они далеки от этого.

Возможно, первая причина - недостаток контента, что удивительно, тем более, если учесть, что это очень большие учреждения с множеством профессоров и студентов. Следует обязать все факультеты и исследовательские группы увеличить свое присутствие в сети, и, конечно, создать архивы публикаций.

Вторая причина - недостаток английских текстов. В ее решении надо руководствоваться не формулой ’’английский вместо русского”, а ’’английский плюс русский”».

Многие исследователи рейтингов в России используют в своих работах статистику поисковых машин Yandex, Rambler, которые лучше индексируют русскоязычные сайты, и, основываясь на данных которых, сравнивают рейтинги сайтов каждый год. Но прогресс в рейтинге среди поисковых машин России не говорит о росте в рейтинге на арене более популярных поисковых систем. Поэтому целесообразнее использовать более популярные в мире Google, Yahoo, и др.

Список литературы

1. Engr Muhammad Ismail. Ranking of Universities // National University of Science & Technology. URL: http://www.nust.edu.pk/general/Ranking%20of%20Universities%20-% 20Engr%20Muhammad%20Ismail.doc. (дата обращения 01.06.2011).

2. Isidro F. Aguillo. Webometrics Ranking of World Universities// 3rd Meeting of the International Rankings Expert Group (IREG-3). Shanghai Jiao Tong University, 2007. URL: http:

//ed.sjtu.edu.cn/IREG-3/PPT/4%20No%20PPT%20Isidro%20 Aguillo%20(table)/webometrics_aguillo.ppt (дата обращения 05.05.2011).

3. Methodology. Ranking Web of World Universities. URL: http://www.webometrics.info/methodology.html (дата образщения 31.05.2011).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Вебометрика. Институт прикладных математических исследований КарНЦ РАН. URL: http://webometrics.krc.karelia.ru (дата обращения 31.05.2011).

5. Мазалов В. В., Печников А. А. О рейтинге официальных сайтов научных учреждений северо-запада России // Управление большими системами. Вып. 24. М.: ИПУ РАН, 2009. С. 130146.

6. Рейтинг Webometrics: мировые вузы в виртуальном пространстве / Материалы независимого агентства РейТОР. URL: http://www.reitor.ru/ru/analitic/experience/index. php?id19=304 (дата обращения 04.06.2011).

7. Стерлигов И. Самый дешевый способ помочь российской науке // Ученый совет. 2008.

№8. С. 21-23.

Рукопись поступила в редакцию 14 июня 2011 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.