ИСТОРИЯ НАУКИ
УДК 004.738.5:030[929:378.4(470-25)]
ЛЮДИ МОСКОВСКОГО УНИВЕРСИТЕТА В ЗЕРКАЛЕ ВИКИПЕДИИ
М.В. Леонов, Е.Н. Раевский, В.М. Леонов1
Обсуждаются цели и актуальные результаты проекта факультета ВМК МГУ по систематизации и мониторингу статей по персоналиям Московского университета в свободной энциклопедии Википедия и некоторых других интернет-источниках. Приведены статистические данные на весну 2018 года по выпускникам Московского университета в сравнении с аналогичными данными по университетам Оксфорда, Кембриджа, Гарварда и Парижа. Сообщается о средствах автоматизации мониторинга и других процедур для повышения качества отражения истории Московского университета в интернете. Проект выполняется в сотрудничестве с музеями МГУ.
Ключевые слова: история Московского университета, биографические справочники, Википедия, базы данных, информационные технологии в музеологии.
THE FACES OF MOSCOW UNIVERSITY IN THE MIRROR OF WIKIPEDIA
M.V. Leonov, PhD, E.N. Raevsky, V.M. Leonov Lomonosov Moscow State University (Faculty of Computational Mathematics and Cybernetics)
The article deals with a multidisciplinary project of the Faculty of Computational Mathematics and Cybernetics. The project aims to systematize, monitor and analyze information on personalities in the history of Moscow University and the actual presentation of this information in the free encyclopedia Wikipedia and some other Internet sources. The authors compare statistical data on graduates of Moscow University for the spring of 2018 with the similar data on the universities of Oxford, Cambridge, Harvard and Paris. According to the article, software tools for monitoring automation were developed by the Faculty of Computational Mathematics and Cybernetics of Moscow State University. The project is being executed in collaboration with the museums of Moscow State University.
1 Леонов Михаил Васильевич - к.б.н., в.н.с., [email protected]; Раевский Евгений Наумович - инженер, [email protected]; Леонов Василий Михайлович - программист факультета ВМК МГУ, [email protected].
Жизнь Земли 40(4) 2018 441-445 441
Keywords: history of Moscow University, biographical reference books, Wikipedia, databases, faces of Moscow University.
«Люди, бескорыстно и продуктивно трудившиеся, оставившие глубокий, яркий след в культуре и науке родной страны, составляющие её гордость и славу, не должны и не могут быть забыты» [4]. Эти слова С.Ю. Липшица (1905-83) были сказаны о ботанике Дмитрии Петровиче Сырейщикове, 150-летний юбилей которого приходится на 2018 год. Имя Д.П. Сырейщикова, долгие годы заведовавшего Гербарием МГУ, и ныне носящим его имя, не забыто: уникальной личной библиотекой, завещанной им Научной библиотеке МГУ, по-прежнему пользуются её читатели. Но напрасно мы будем искать его фамилию в современных добротно изданных современных энциклопедических справочниках. Д.П. Сырейщикову было присвоена степень доктора биологических наук, но он не был профессором, поэтому сведений о Дмитрии Петровиче нет в двухтомном справочнике по профессорам Московского университета [6].
Благодаря 250-летнему юбилею Московского университета появился целый ряд важных биографических справочников [1, 6, 7], а также электронных источников по истории нашего университета. Но по-прежнему немало примеров отсутствия в энциклопедиях таких людей как Д.П. Сырейщиков. Сейчас на помощь обычным печатным справочникам постепенно приходит Интернет. Особо нужно отметить наиболее авторитетный касательно истории университета сайт «Летопись Московского университета» [3], где в разделе «Наши люди» перечислены профессора, академики, члены-корреспонденты, ректоры и некоторые другие известные люди. Но, несмотря на этот прогресс, можно утверждать, что на сегодняшний день не существует энциклопедии, которая достаточно полно отражала бы всех тех людей, имена которых стали частью истории университета.
Наиболее полной энциклопедией нашего времени считается свободная интернет-энциклопедия Википедия, русский вариант которой насчитывает около полутора миллиона статей. Не будем останавливаться на недостатках, не позволяющих считать её достоверным научным источником; ссылки на Википедию в некоторых изданиях считаются даже признаком плохого тона. Но с десятитысячной армией активных авторов этого проекта трудно конкурировать любому академическому или университетскому, даже электронному изданию, и в результате она стала самой популярной энциклопедией в русскоязычном пространстве. Поэтому естественно заинтересоваться вопросом, насколько полно и качественно отражены в ней люди Московского университета. Ведь именно люди составляют гордость любого университета!
Большинство правил, сложившихся в википедийном сообществе для написания персоналии для Википедии, носит рекомендательный характер. Это привело к тому, что отбор статей, посвящённых, например, выпускникам МГУ, особенно с определёнными признаками, например, годом рождения, реализовать весьма сложно. Вручную выполнить такие операции практически нереально. Да и реализация автоматизированного отбора представляет собой непростое дело, поскольку Википедия является не строго структурированной базой данных, а коллекцией текстовых материалов. Поиск статей по атрибутам зачастую затруднён. Статьи и категории, составленные в результате коллективного творчества, имеют разную полноту и принципы формирования. Например, далеко не все интересующие нас статьи имеют заполненное поле «Alma mater», а также поле «Образование». Далеко не все авторы и проверяющие следят за тем, чтобы статья имела принадлежность к категориям, облегчающим поиск и класси-
фикацию статей. Поэтому задача накопления и отслеживания информации о выпускниках МГУ не является тривиальной и, по нашему мнению, решается только в процессе регулярного исполнения комплекса автоматизированных процедур, результаты которого в свою очередь требуют дополнительного редакторского контроля.
Проект «Википедия» постепенно обрастает целым семейством близких проектов. Так, в конце 2012 г. фонд Ш1к1те^а запустил проект Викидата, который облегчает поддержку совместно редактируемой базы знаний для всех проектов, «родственных» Википедии, причём на различных языках. В этом хранилище есть более удобный, чем в Википедии, доступ к типизированным данным, в том числе для статей о личностях, уже присутствующих в Википедии, но их наличие в Викиданных никто не гарантирует, а их взаимообогащение выполняется иногда со значительной задержкой по времени.
На факультете вычислительной математики и кибернетики МГУ в последние годы выполняется ряд проектов, в основе которых - применение технологий баз данных для систематизации сведений о людях Московского университета. Поэтому инициативный проект по «частично автоматизированному контролю» за количественными и качественными характеристиками отражения истории Московского университета в таком важном зеркале общества, как Википедия, стал естественным продолжением наших работ по базам данных дореволюционного студенчества и МОИП [2].
В Википедии особую роль имеет термин «значимость». Разработаны критерии значимости для статьи, персоны и т. д. Мы тоже решили выяснить «значимость» статей, посвящённых выпускникам Московского университета, сравнив их с аналогичными характеристиками ведущих университетов Великобритании, Франции и США. Под значимостью, или весом статьи здесь понимается отношение статей о выпускниках к общему количеству статей в Википедии на соответствующем языке. Результаты вычисления этой значимости, а также основные количественные результаты приведены в таблице.
Конечно, эта статистика не является основной целью нашего проекта. Более важно иметь регулярно пополняемый список статей по персоналиям Московского университета, а также архив этих статей, организованный в соответствии с нормами технологии баз данных. Вычисление статистики без такой базы данных затруднительно, так как применение аппарата категорий в Википедии авторами является добровольным де-
Таблица. Выпускники университетов в Википедии (данные от 17.04.2018)
Число Языковой Общее число Доля Период суще-
Университет статей о сегмент статей в сегмен- статей о ствования уни-
выпускниках Википедии те Википедии выпускниках верситета (лет)
Московский университет 7 034 русская Википедия 1 467 223 0,50 % 262
Кембридж (Великобритания) 14 696 0,26 % 808
Оксфорд (Великобритания) 16 447 английская Википедия 5 614 157 0,29 % 921
Гарвард (США) 19 282 0,34 % 381
Париж (Франция) 2 355 французская Википедия 1 975 598 0,12 % 817
лом, и поэтому нет гарантии достоверности подсчёта статей, посвящённых, например, окончившим Московский университет, с помощью соответствующих категорий «Выпускник ИМУ2» и «Выпускник МГУ».
Заметим, что использование аппарата категорий применительно к университетам в разных языковых фрагментах может сильно отличаться. Например, в немецкоязычной Википедии категория «Факультеты университета Георга-Августа в Геттингене» содержит в качестве подкатегорий имена известных людей, когда-либо работавших в этом университете, а не только выпускников. В «университетских категориях» русской Википедии такого нет, и бороться за подобное улучшение практически невозможно.
В результате наших подсчётов выяснено, что в Википедии находится не менее 2149 статей по выпускникам Императорского Московского университета (ИМУ) и не менее 4885 статей по выпускникам МГУ имени М.В. Ломоносова, то есть в общей сложности не менее 7034 статей.
Если сравнить эти числа с числом статей о выпускниках Кембриджского, Оксфордского, Стэнфордского и Парижского университетов, с общем числом статей в соответствующих национальных (русской, английской и французской) Википедиях, то даже не учитывая длительности существования этих университетов можно увидеть, что значимость статей о выпускниках Московского университета значительно выше, чем значимость аналогичных статей в указанных университетах для соответствующих национальных Википедий. Это 0,5 процента для Московского, 0,26; 0,29; 0,34 и 0,12 процента для Кембриджского, Оксфордского, Стэнфордского и Парижского университетов соответственно.
Наиболее посещаемым разделом Википедии является её английский раздел, поэтому естественно обратить внимание на то, какая часть выпускников Московского университета имеет, кроме русской, также и английскую статью. Согласно нашему подсчёту выяснилось, что таких людей примерно 20 %, причём как для МГУ, так и для ИМУ.
Для автоматического выполнения рутинных операций в Интернете, например, скачивания большого количества файлов по определённому алгоритму, используются специальные программы, называемые ботами (или роботами). Для нашего проекта также была использована эта технология: ведь даже имея готовый список фамилий, имён и отчеств персон, получить несколько тысяч соответствующих статей вручную затруднительно.
Хотя Википедия является «свободной», существуют неформальные группы энтузиастов, а также организации, исследующие её процессы и участвующие в её жизни [8]. Показателен также пример Геттингенского университета (Германия), где студенты выполняют и защищают работы, посвящённые различным аспектам Википедии, в основном, социологическим. Другими словами, жизнь этой свободной энциклопедии находится под пристальным вниманием университетских сообществ. По-видимому, это хороший пример для подражания и для нашего университета.
Необходимость мониторинга количества и качества персоналий Московского университета в свободной энциклопедии - Википедии особых доказательств не требует. Также достаточно очевидна необходимость разработки автоматизированных средств для упрощения вышеуказанного мониторинга и соответствующих баз данных. В этом направлении нами разработаны специализированные программы на языке Python [5] и база данных под управлением системы управления базами данных SQLite.
2 Императорский Московский университет.
Основной результат нашего пилотного проекта на сегодняшний день - создание и наполнение экспериментальной базы данных по персоналиям, уже включённым в эту энциклопедию, а также значительное количество исправлений в статьях Википедии, связанных с Московским университетом. Кроме того, нам было важно ещё раз обратить внимание коллег-историков на то, что от нас самих зависит, будет зеркало Википедии в отношении нашего вуза кривым или нет.
ЛИТЕРАТУРА
1. Императорский Московский университет. 1755-1917. Энциклопедический словарь / Сост. А.Ю.Андреев, Д.А.Цыганков. М.: РОСПЭН, 2010. 894 с.
2. Леонов М.В., Орлов А.С. Междисциплинарный проект оцифровки картотек Московского общества испытателей природы: состояние и перспективы // Жизнь Земли. 2016. 38 (1). С. 118-124.
3. Летопись Московского университета [Электронный ресурс]. Сайт: Аналитическая служба МГУ им. М.В. Ломоносова. Москва, 1993-2018 (http://letopis.msu.ru/).
4. Липшиц С.Ю. Московские ботаники Дмитрий Петрович Сырейщиков (1868-1932) и Алексей Николаевич Петунников (1868-1932) // Бюлл. МОИП. Отд. биологии. 1968. Т. LXXII (4). С. 5-23.
5. Митчелл Р. Скрапинг вэб-сайтов с помощью Phyton. М.: ДМК Пресс, 2016. 280 с.
6. Профессора Московского университета. 1755-2004. Биографический словарь: в 2 т. / Авт.-сост. А.Г. Рябухин, Г.В. Брянцева. Т. 1. 816 с. Т. 2. 768 с. М.: Изд-во МГУ, 2005.
7. Учёные Московского университета - действительные члены и члены-корреспонденты Российской академии наук (1755-2004). Биографический словарь / Авт.-сост. Ю.М. Кацур. М.: Изд-во МГУ, 2004. 944 с.
8. WikiRath. Dr. Rath Health Foundation [электронный ресурс] (http://www.wiki-rath.de/ index.html).
REFERENCES
1. Andreev A.Yu., Tsygankov D.A. (comp.). Imperial Moscow University. 1755-1917. Encyclopedic Dictionary. 894 p. (Moscow: ROSPEN, 2010) (in Russian).
2. Leonov M.V., Orlov A.S. Interdisciplinary project of digitization of card files of the Moscow Society of Naturalists: state and prospects. Zhizn Zemli. 38(1), 118-124 (2016) (in Russian).
3. Annals of the Moscow University [electronic resource]. Site: Analytical Service of the Moscow State University (http://letopis.msu.ru/) (in Russian).
4. Lipshits S.Yu. Moscow Botany Dmitry Petrovich Syreischikov (1868-1932) and Alexei Nikolaevich Petunnikov (1868-1932). Bull. MOIP. Otd. Biologii. LXXII (4), 5-23 (1968) (in Russian).
5. Mitchell R. Scrapping web sites with the help of Phyton. 280 p. (Moscow: DMK Press, 2016) (in Russian).
6. Riabukhin A.G., Briantseva G.V. (comp.). Professors of Moscow University. 1755-2004. Biographical Dictionary. V. 1: A-L. 816 p. V. 2: M-IA. 768 s. (Moscow: Izd-vo MGU, 2005) (in Russian).
7. Katsur Yu.M. (comp.). Scientists of Moscow University - full members and corresponding members of the Russian Academy of Sciences (1755-2004). Biographical Dictionary. 944 p. (Moscow: Izd-vo MGU, 2004) (in Russian).
8. WikiRath. Dr. Rath Health Foundation [electronic resource] (http://www.wiki-rath.de index html).