Перспективы Науки и Образования
Международный электронный научный журнал ISSN 2307-2334 (Онлайн)
Адрес выпуска: pnojoumal.wordpress.com/archive20/20-03/ Дата публикации: 30.06.2020 УДК 314.74
А. Е. Судакова
Миграция ученых: цифровой след и наукометрия
Миграция, ее количественные и качественные изменения, является одной из актуальных тем. Во-первых, ученые - непосредственные участники научно-технического прогресса, уровень и развитие которого приоритетен в большинстве стран, страны конкурируют за привлечение лучших «умов» мира, а ученые в поиске достойных условий для своей деятельности. Во-вторых, оценка миграции отдельных профессиональных кругов затруднительна.
Одним из инструментов анализа и оценки миграции ученых является анализ их профилей, что стало возможным благодаря цифровизации научной деятельности (развитие наукометрических баз: SCOPUS, WoS, eLibrary, PubMed, профессиональных сетей - ResearchGate, присвоение идентификационных номеров ученых - ORCID и другие инструменты). В сети остаются так называемые цифровые следы ученых (их исследования, ФИО, принадлежность к научной организации и их смена, сфера интересов и другие показатели). Вследствие этого становится возможным оценить взаимодействие ученых, проанализировать мобильность, оценить количественные и качественные показатели миграции. При этом анализ ученых по их идентификационным показателям называется наукометрией, или в практике отечественной терминалогии библиометрией.
Популярность библиометрического анализа растет с 1980-х гг. Однако истоки метода уходят в 20-е гг. XIX в. Используя библиометрические данные можно оценить количественные показатели ученого и его исследования проанализировать миграцию и ее качественные и количественные изменения.
В рамках научной работы сотрудниками Лаборатории по проблемам университетского развития УрФУ был разработан алгоритм генерации данных с наукометрической базой SCOPUS. Цель создания алгоритма -проанализировать и оценить миграцию ученых. Разработанный алгоритм генерирует данные следующим образом: j-ое количество строк, в которых представлены ФИО авторов и их ID; i-ое количество столбцов, включающие, наукометрические данные (научная сфера, страна, университет, общее количество статей и другие). Значимость для исследования представляют те профили, в которых сменилась аффилиация. Анализ проводился на примере УрФУ. Наибольший отток ученых пришелся на 90-е годы, а также 2000-2002 гг., как и во всей стране. Среди лидеров принимающих стран США, Израиль, Англия, Канада, Германия, Франция, Чехия, страны постсоветского пространства - Беларусь, Украина, Республика Молдова, Узбекистан и другие.
Среди основных выводов, стоит отметить, то, что происходит смена характера миграции, а именно, переход от brain drain к drain sharing, от безвозвратной миграции и потери интеллектуального капитала к его совместному использованию. Цифровизация наукометрии является существенным прогрессом, способствующим не только распространению научного знания, но и его защите, а цифровые следы - важным инструментом в анализе количественных и качественных научных показателей.
Ключевые слова: библиометрия, наукометрия, мобильность, миграция, Big Data, Data Science, цифровой след
Ссылка для цитирования:
Судакова А. Е. Миграция ученых: цифровой след и наукометрия // Перспективы науки и образования. 2020. № 3 (45). С. 544-557. doi: 10.32744^.2020.339
Perspectives of Science & Education
International Scientific Electronic Journal ISSN 2307-2334 (Online)
Available: psejournal.wordpress.com/archive20/20-03/ Accepted: 15 March 2020 Published: 30 June 2020
A. E. Sudakova
Migration of scientists: digital footprint and scientometry
Migration, its quantitative and qualitative changes is one of the topical issues. First, scientists are direct participants in scientific and technological progress, the level and development of which is a priority in most countries, countries compete to attract the best "minds" of the world, and scientists in search of decent conditions for their activities. Second, it is difficult to assess the migration of individual professional circles.
One of the tools for analyzing and evaluating the migration of scientists is the analysis of their profiles, which became possible thanks to the digitalization of scientific activities (development of scientometric databases: SCOPUS, WoS, eLibrary, PubMed, professional networks-research gate, assignment of identification numbers of scientists - ORCID and other tools), so-called digital traces of scientists remain in the network (their research, full name, affiliation to a scientific organization and their change, sphere of interests and other indicators), as a result, it becomes possible to evaluate the interaction of scientists, analyze mobility, evaluate quantitative and qualitative indicators of migration. At the same time, the analysis of scientists by their identification indicators is called scientometry, or in the practice of domestic terminology bibliometry.
The popularity of bibliometric analysis begins with the 1980s with a sharp increase in the number of articles using this method to 2019, However, the origins of the method go in the 20-ies of the XIX century Using bibliometric data to assess the quantitative indicators of academic and study (however, put forward hypotheses about ambiguous citation of the article and its significance to the scientific community), to perform the migration and its qualitative and quantitative changes.
As part of the research work, the staff of the Laboratory for University development of UrFU developed an algorithm for generating data from the scientometric database SCOPUS. The purpose of the algorithm is to analyze and evaluate the migration of scientists. The developed algorithm generates data as follows: j-th number of rows, which represent the full name of the authors and their ID, i-th number of columns, including scientometric data (scientific field; country; University; total number of articles, and others). The profiles in which the affinity has changed are important for further research. The resulting database was "cleared". The largest outflow of scientists from UrFU, as well as throughout Russia, occurred in the 90s, as well as 2000-2002. among the leaders of the host countries were the United States, Israel, England, Canada, Germany, France, Czech Republic, post-Soviet space-Belarus, Ukraine, Moldova, Uzbekistan. In General, the Ural Federal University is characterized by positive dynamics, which is represented, on the one hand, by a decrease in the share of migrating scientists, on the other hand, by the involvement of foreign specialists for the implementation of joint projects.
Among the main conclusions, it is worth noting that there is a change in the nature of migration: its transition from brain drain to drain sharing, i.e. from irrevocable migration and loss of intellectual capital to its sharing.
The digitalization of scientometry is a significant advance that contributes not only to the dissemination of scientific knowledge, but also to its protection (for example, the detection of plagiarism), and digital traces are an important tool in the analysis of quantitative and qualitative scientific indicators.
Key words: bibliometry; scientometry; migration; Big Data, Data Science; brain drain; digital footprint
For Reference:
Sudakova, A. E. (2020). Migration of scientists: digital footprint and scientometry. Perspektivy nauki i obrazovania - Perspectives of Science and Education, 45 (3), 544-557. doi: 10.32744/pse.2020.3.39
_Введение
ифровизация проникает во все отрасли человеческой деятельности, и нельзя однозначно оценить ее влияние: с одной стороны, данный процесс ускоряет и упрощает деятельность человека, с другой, может оказывать деструктивное влияние на личность человека. Цифровизация, находясь в фокусе внимания многих исследователей, изучается в разных ракурсах. Так, например, M. A. Dyachkova, O. N. Tomyuk, N. B. Kirillova, A. Yu. Dudchik исследуют цифровизацию в аспекте личностного и профессионального самоопределения человека [1]. Настоящая статья нацелена на выявление значимости цифровых технологий при анализе миграции ученых через те «цифровые следы», которые остаются в сети. Цифровые следы облегчают оперативный поиск необходимой информации, количественную и качественную обработку библиометрических данных.
Актуальность проводимого исследования обусловлена тем, что:
• ученые являются непосредственными участниками научно-технического прогресса, уровень и развитие которого приоритетен в большинстве стран;
• страны конкурируют за привлечение лучших «умов» мира, университеты заботятся о позициях в мировых рейтингах, привлекательности вуза для потенциальных обучающихся [2];
• ученые ищут лучшие условия для своей деятельности;
• в рамках миграции высококвалифицированных кадров особенно важно проанализировать количественные и качественные связи.
В связи с этим исследование научного потенциала страны и миграции ученых является весьма актуальным (в данной статье мобильность будет рассматриваться как вид миграции).
Мобильность ученого в отличие от безвозвратной миграции несет в своем проявлении положительные и отрицательные эффекты для всех участвующих сторон: приращение знаний индивидом, трансляция своих знаний как имеющихся, так и приобретенных, «переток» интеллектуального капитала. Если мобильность ученого рассматривать в национальном масштабе, то границы между положительными и отрицательными эффектами в рамках приращения интеллектуального капитала размываются, так как научный потенциал и приращение знаний все равно транслируются внутри страны. Данные различия выявляются только внутри принимающих и отправляющих отечественных организаций. Но другая картина складывается, если рассматривать трансграничную миграцию: среди отрицательных эффектов (для страны отправителя ученого) можно говорить об оттоке интеллектуально капитала.
Если в целом миграция с некоторыми корректировками поддается учету (данные о миграции представлены на сайте Федеральной службы государственной статистики, регистрируются Федеральной миграционной службой), то миграцию определенных категорий населения, например, высококвалифицированных кадров, в том числе ученых, трудно оценить по причине того, что отдельно учет миграции по категориям населения и их профессиональной занятости не ведется или не представлен в открытом доступе. В этой связи актуальным становиться вопрос сбора статистических данных.
В свете сказанного отметим, что в изучения миграции ученых необходимо уточнить теоретико-методологические основы об учете потерь интеллектуального капита-
ла при двойной аффилиации и при полной ее смене, а также, каким образом ее виды влияют на распространение знаний и научную эффективность.
_Обзор литературы
Последние несколько десятилетий ознаменовались активизацией интернет пространства, освоением интернет коммуникаций. Данный процесс коснулся и научной деятельности, таким образом, цифровизация научной деятельности представлена развитием наукометрических баз SCOPUS, WoS, eLibrary, PubMed, профессиональных сетей - ResearchGate, присвоение идентификационных номеров ученым - ORCID, Google Analytics, Dimensions и другие инструменты.
Интернет-пользователь генерирует свой контент, тем самым оставляя так называемые «цифровые следы» в виде различной информации: от фотографий и видеороликов до комментариев, лайков, репостов и даже обычной статистики использования ресурсов. При этом предположим, что способ размещения информация в интернет пространстве, условно можно разделить на:
• активный, т.е. информация, которая размещается самим пользователем о себе (к примеру, информация, представленная пользователями на своих интернет страницах в социальных и профессиональных сетях);
• пассивный - информация размещена в интернете, вследствие профессиональной необходимости третьим лицом (например, резюме и прочая информация на сайте работодателя, информация о субъекте вследствие его научной деятельности, публикации статьи). К данному способу можно отнести информацию об ученых, которая представлена в Интернете, в этом случае в сети также остаются «цифровые следы»: исследования, информация об ученом - принадлежность к научной организации, хронология занятости, сфера интересов и другие показатели.
Благодаря развитию интернет пространства, и вследствие этого активизацией интернет-исследований, поддерживаемых значительным развитием как аппаратных средств, так и программного обеспечение, трансформировались методы исследований от классических (интервью, опросы) до анализа огромных массивов данных - Big Data. К примеру, исследователи Дэвид Лейзер и Джейсон Редфорд [3] выделили три основных типа «полей» получения Big Data: виртуальное поведение пользователей на различных платформах, оцифрованные данные государственных и частных учреждений, оцифрованные данные, полученные непосредственно путем сбора в «реальной» жизни (например, фиксация открытых и закрытых wi-fi точек на пути следования актора).
Цифровизация и методы анализа Big Data расширили возможности изучения взаимодействия ученых, проанализировать их мобильность и миграцию. Однако сама природа больших данных определяет ряд ограничений, среди которых одним из наиболее важных является проблема доступа [4]. Несмотря на то, что большие данные генерируются либо государственными организациями, либо посредством взаимодействия людей в сети, либо благодаря различным техническим средствам, агрегируются они на серверах, принадлежащих различным орГ"» V»
ганизациям. В данном случае возможные действия исследователей ограничены не только законодательством, но и политикой самой организации. Решение о
свободной публикации массивов или об их предоставлении конкретным исследовательским центрам принимается исключительно руководством организации, обладающей этими данными.
Но, тем не менее, пользователи имеют возможность собрать данные самостоятельно, например при помощи метода webscraping, позволяющего «выкачивать» и систематизировать данные с различных ресурсов с помощью автоматизированного использования пользовательского интерфейса, что является практически безальтернативным способом в условиях закрытого доступа к программному интерфейсу сервисов (API).
Итак, анализ деятельности ученых по их ранее обозначенным идентификационным показателям называется наукометрией, или в практике отечественной терминологии - библиометрией.
Библиометрия как термин впервые была определена в 1969 году Аланом Притчар-дом и трактовалась им как «применение математических и статистических методов к книгам и другим средствам коммуникации» [5, с. 348]. Библиометрия является не только инструментом для словесного анализа, но также позволяет определить важные качественные и количественные характеристики ученого: публикационная активность, принадлежность к стране, цитирование, соавторы и другие показатели.
В последнее десятилетие библиометрический анализ приобретает все большую популярность, хотя его истоки уходят в 20-е гг. XIX в. Э. Уиндхем Халм в 1922 г. использовал термин для освещения процессов науки и техники путем подсчета документов [6]. Э. У. Халм обобщил результаты Коула и Илса [7], подготовил работу о росте британских патентов (связывая их с социальными процессами в Великобритании), об изменениях, отображаемых в Международном каталоге научной литературы (анализируя изменения в тематике и стране производства литературы с международными событиями).
После этого термин библиометрия не использовался около 20 лет, вновь появившись только в 1943 г. в работе С. Госнела [8]. Суть термина осталась неизменной, обозначая выявление чего-либо на основе анализа статей. После длительного перерыва термин «библиометрия» в 1962 году получил развитие в работе Л. Райзинга [9]. В настоящее время термин активно используется, а библиометрический анализ набирает популярность. В связи с ростом количества публикаций ученых и по данным библи-ометрической базы Wed of Science можно наблюдать популярность данного метода, начиная с 1980-х гг. и до настоящего времени.
Смысл и цель использования термина библиометрия формулируются по-разному:
• необходим для изучения хода развития дисциплины [10], такой позиции придерживается Юджин Гарфилд, что выражается в созданном под его руководством Science Citation Index [11-13], и отечественные исследователи Влэдуц Г. Э. [14], Марокусова В. А. [15], Михайлова А. И. [16] и др.;
• cбор и интерпретация статистических данных, относящихся к книгам и периодическим изданиям, для демонстрации исторических движений, определения использования книг и журналов на национальном или универсальном уровне, определения частоты использования материала в местах общего пользования [9] (учитывая давность работы, необходимо уточнить, модификацию определения - для определения цитируемости статьи); в данной трактовке библиометрия используется для оценки производительности ученого; первый анализ подобного типа представлен в работе Гросса в 1927 г. [17];
• анализ аффилиаций из публикаций для выявления качественных и количественных характеристик исследователей, для целей оценки миграции (в том числе, мобильности) ученого (авторская трактовка).
Общий смысл библиометрии был представлен в работе Алана Притчарда в 1969 г., где метод обозначается как «применение математики и статистических методов к книгам и другим средствам коммуникации» [5]. Несмотря на давность публикации, общая формулировка термина актуальна по сей день. В этой же работе представлена дискуссия, о том, что термин имеет весьма тесные связи с уже существующими понятиями: «биометрикой», «эконометрикой» и русским термином «наукометрией».
Уже в 1988 г. Дж. Бадд [18] четко формулирует, что возможно анализировать с помощью библиометрии: «этот ненавязчивый или нереактивный аспект методологии оказался привлекательным для исследователей, изучающих процесс коммуникации в научных дисциплинах», данное видение можно дополнить фразой: «а также позволяет оценивать научную производительность» (авторское дополнение). Об этом говорит основатель SCI [19], однако, сама идея была сформулирована ещё в 1927 г., задолго до цифровизации библиометрии. Это нашло отражение в законе Лотка [20], в основе которого лежит измерение производительности ученого по данным цитирования его работ.
Среди большого количества работ по библиометрике и активного использования ее как инструмента наукометрии стоит отметить, что некоторые исследователи не поддерживают использование данного инструмента, соответственно, высказанная точка зрения дискуссионна. К примеру, Ф. Торн [21] в своей работе утверждает, что уровень цитирования не всегда можно интерпретировать как достоинство автора, так как на него могут ссылаться с критикой проведенного исследования и полученных результатов. В противовес мнению Ф. Торна, Л. Смит приводит довод о том, что качество - это необоснованный показатель, и ответом на поиск критерия может выступать качество журнала в корреляции с цитированием статьи [22].
Возникает вопрос, если научная литература как инструмент для анализа используется давно, в чем же заключается прогресс или развитие библиометрии? До создания индекса SCI и наукометрических баз обработка информации осуществлялась вручную и благодаря развитию цифровизации произошло или, возможно, до сих пор происходит упрощение процесса: стандарты для библиометрических ссылок позволяют осуществлять оперативный поиск информации, создается единство для каждой отдельной публикации, вследствие чего возможно отследить популярность (цитируемость) статьи и другое.
Развитие библиометрии можно разделить на три этапа: обработка данных вручную, цифровизация библиометрии и создание SCI, генерация данных и картография данных с помощью программ (VOSviewer, SPSS, Pajek и т. п.).
Одной из первых работ, освещающих результаты обработки библиометрических данных, является работа Д. Прайса [23], в которой построена сеть цитирования. На основе полученных результатов разработана математическая теория роста этих сетей, сформулирован закон Прайса о старении научной литературы. Начиная с этого момента, повышается значимость SCI, что определяет его ценность для изучения отдельных направлений науки, сетей научных коммуникаций и как средство оценки результативности научных исследований.
В настоящей статье обзор делается в основном по зарубежным исследованиям, в которых изучается обработка библиометрических данных с помощью средств циф-
ровизации. Следует отметить, что труды отечественных ученых по наукометрии получили широкое распространение в зарубежных странах, хотя наукометрия активно развивалась в нашей стране без использования программ ЭВМ [12].
Каким же образом с помощью библиометрии возможно изучать миграцию? Ученые всесторонне используют показатели наукометрических баз. Далее представлен обзор отдельных работ, включающих исследование миграции посредством библиометрии. Миграция ученых изучается и оценивается:
• с помощью данных государственной статистики; среди исследований можно отметить работы Д. Арвизу и Р. Бовен [24], OECD [25];
• посредством анализа резюме и персональных веб-страниц (С. Касибо и Б. Бозе-мен [26], У. Сандструм [27], Р. Вулей и Т. Тюрпин [28]);
• через анкетирование и интервью с учеными, например, в работах П. Боринга [29], К. Фланагана [30];
• используются государственные и административные базы данных; исследование подобного типа представлено в работе Д. Филиппо, Е. Касадо, И. Гумез [31].
Однако в условиях цифровизации, изучение миграции ученых становится возможным с использованием еще двух инструментов: социальные сети (в том числе, профессиональные, например, ResearchGate), библиометрические данные наукометрических баз (SCOPUS, Web of Science и др.). Среди работ, посвященных сбору библи-ометрических данных, можно отметить работы Dubois P. [32] о связи научной продуктивности и мобильности математиков за период 1984-2006 г., акцент в работе сделан на «активный» математиков, сбор данных осуществлялся по конкретным журналам (всего обработано 98 журналов и собрано чуть более 32 тыс. профилей), Moed H. F. [33], van Eck N. J. [34] и Кокшарова В. А., Агаркова Г. А. [35] об автоматизации процесса данного метода, Николаенко Г.А. [36] об особенностях профессиональной сети ученых, а также о технической стороне генерации данных с данной сети.
Анализ библиометрических данных позволяет провести сравнительное исследование публикационной активности «мобильных» и «немобильных» авторов [37], а также изучить влияние миграции на развитие различных дисциплин [38]. Используя профиль ученого в базе и сведения о его аффилиации возможно изучить мобильность отдельных групп ученых, которые малочисленны, но имеют большое значение для развития науки, например, группу «элитных» ученых [39]. Их «цифровые следы» могут фиксировать перемещение ученых между странами [40], концентрацию представителей различных дисциплин в определенных странах или организациях [41], позволяют проводить анализ миграционных потоков [42].
Лаудель Дж. [42] одна из первых высказалась за использование библиометрии для построения глобальных показателей научной мобильности. Лаудель [39], работающая в англоязычной текстовой базе данных медицинских и биологических публикаций (PubMed), собрала информацию по первым авторам в статьях, начиная с 1980 г. Она дополнила свой анализ данными о наличии докторской степени, ограничив анализ определенной классификацией «элитных» ученых, которые опубликовали, по крайней мере, три статьи в области науки и природы в период с 1980 по 2002 гг. Это ограничительный набор данных как с точки зрения дисциплинарного охвата, так и охвата стран. Второй вопрос, который освещается в её статье - это определение принадлежности ученого к элите, в некоторых случаях он решается с помощью наукометрических баз, но есть и другие инструменты, представленные в статье Г. Зукермана [43] и Р. Хантера [44].
Среди российских работ стоит выделить работу Е. Дьяченко [45], в которой представлено сравнение структуры сетей внутренней миграции для российских и американских физиков, в частности, для ученых, работающих в области прикладной физики. Сбор данных осуществлялся так называемым аналоговым способом (вручную). Информация об ученых были получена из статей, проиндексированных в базе данных Web of Science. Построенная сеть была визуализирована с помощью программного обеспечения UCINET (UCINET 6 для Windows). Другое исследование с более широким охватом информации представлено в работе Ю. Марковой и др. [46]. В этих работах выдвинуты гипотезы о связи миграции ученых с их научной продуктивностью.
В работе авторов van Eck N. J. и Waltman L. [34] представлены инструменты для агрегации библиометрических данных и их визуализации. В статье показано использование VOSviewer для построения и просмотра библиометрических карт. В отличие от таких программ, как SPSS и Pajek, VOSviewer уделяет особое внимание графическому представлению библиометрических карт. Функциональность VOSviewer особенно полезна для отображения больших библиометрических карт в удобной для понимания форме.
_Материалы и методы исследования
В рамках научной работы сотрудниками Лаборатории по проблемам университетского развития УрФУ был разработан алгоритм генерации данных с наукометрической базы SCOPUS. Цель создания алгоритма - получить данные и проанализировать миграцию ученых. В настоящей работе освещаются некоторые результаты обработки библиометрических данных при использовании технологий Big Data.
Разработанный алгоритм позволяет генерировать данные, которые агрегируются в таблицы следующим образом:
• j-ое количество строк, в которых представлены ФИО авторов и их ID;
• i-ое количество столбцов, включающие наукометрические данные (научная сфера; страна; университет; общее количество статей и др.).
На первом этапе производится майнинг статей, аффилированных к выбранной организации, по наукометрическим базам данных. Исходный массив данных для статей представлен в виде столбцовой матрицы As1=(as1)rx1, s=1,...,r, где столбец рассматриваемой организации, является строкой с названием статьи, r-общее количество статей, аффилированных к рассматриваемой организации.
На втором этапе матрица Asi расширяется путем добавления новых столбцов характеристик к анализируемому набору данных: идентификатор автора, имя, страна аффиляции, дополнительные аффиляции и количество цитирований для анализируемой статьи. Для этого производится, в том числе, майнинг личных профилей авторов статей с использованием ID автора.
Для выявления ученых, вовлеченных в процесс brain drain, формируется новая матрица, отражающая информацию о том, имеются ли статьи у автора, аффилированные за анализируемый год с рассматриваемой организацией. Для этого вводится i-параметр, определяющий идентификатор автора. По результатам алгоритма поиска авторов в собранном массиве данных сформирована матрица B, в которой элемент bij получается путем накопления значений в случае совпадения идентификационных номеров авторов в массиве с целевыми номерами авторов.
В результате преобразований получается матрица B=(bij)mx|, строки которой представляют всех авторов научных работ, а столбцы матрицы i=1,...,m - все выявленные академические организации. Эта матрица составляется для каждого анализируемого года, поэтому каждая статья имеет 3 основных индекса, определяющих ее положение в анализируемом массиве данных. Следует отметить, что результирующая матрица B представляет собой разреженную матрицу с элементами, отражающими информацию о количестве статей bij автора i из организации j.
В составленной матрице первый столбец представляет анализируемую академическую организацию. Если принадлежность основной организации определена, то элемент bij фиксируется в первой колонке с указанием количества статей. При обнаружении изменения принадлежности автора элементу bij присваивается значение статьи, а затем он записывается в столбец j, где j-порядковый номер столбца, обозначающего организацию, в которую перешел автор. Для вывода данных об утечке мозгов на основе полученного массива данных необходимо проверить элементы матрицы B на соответствие ряду условий для временного интервала k=2011, ..., 2018=1, ..., N.
С практической точки зрения, при реализации алгоритма производится проверка всего массива данных по статьям, аффилированных с выбранной организацией и авторам, участвовавшим в работе над ними. При этом производится проверка текущих аффиляций профилей авторов с помощью API - в случае их несовпадения с профилем исходной организации данные об авторах переводятся в отдельный массив для дальнейшей обработки и визуализации.
Результатом работы данного алгоритма является матрица ученых, указывающая основные индивидуальные характеристики, в том числе направление работы, количество и качество научных работ, а также текущие и предыдущие места работы ученого. Итоговая матрица X=(xij)cxd отражает количество статей, написанных автором i=1,...,c от академической организации j=1,...,d.
В общем случае решение задачи можно представить следующим образом: при майнинге данных с помощью API производится скрутка базы по статьям, авторам и научным организациям; производится чистка полученного массива с использованием ID авторов, статей и организаций; выполняется проверка аффиляций в статьях и в профилях авторов; по результатам проверки получаются статистические массивы по академической активности и разреженная матрица, отражающая взаимодействие ав-
f W л W I V V»
торов работ и научных организаций. Статистической информацией, представленной в статье, служат библиометрические данные базы SCOPUS.
_Результаты
С помощью алгоритма была сгенерирована информация об ученых Уральского федерального университета. Задача на данном этапе - проанализировать количественные данные по процессу миграции, отождествляемой с «brain drain». Алгоритм настроен таким образом, чтобы выявить, кто из сотрудников университета имел в анализируемый период аффилиацию в профиле УрФУ и сменил ее на момент 2018 года (то есть в профиле ученого не имеются публикаций, аффилированных с УрФУ в 2018 г.).
В итоге было обработано около 9 тысяч профилей сотрудников вуза (временной промежуток ограничен 2018 годом, при этом начальный период не ограничен). Из об-
работанных профилей автоматически было выделено 372 ученых, которые сменили аффилиацию.
Имеющийся массив данных ученых необходимо проверить согласно авторской методологии, суть которой состоит в самом понимании определения миграции в трактовке «brain drain»: в конечной базе данных останутся только те профили, которые утратили аффилиацию с УрФУ, но при этом они могут иметь множественную аффилиацию, в числе которой обязательна УрФУ. Обработка профилей 372 ученых осуществлялась по заданному алгоритму: первичная обработка через исключение некоторых профилей и дальнейшая проверка оставшихся профилей через базу SCOPUS.
Посредством инструментов Excel была осуществлена чистка базы:
• убраны повторяющиеся фамилии (их оказалось 5);
• не учитывались авторы, которые имели менее 2-х публикаций, таких оказалось еще 59 человек;
• из анализа были исключены еще 34 профиля, так как данные авторы сменили профиль на другое российское учреждение (миграцию ученого в трактовке brain drain принято считать его переезд в другую страну);
• в дальнейшей обработке не учитывались данные за 2018 и 2019 годы, так как существует некоторый временной промежуток для публикации: от принятия к печати до ее размещения в журнале и далее в базе SCOPUS.
Таким образом, на конец 2019 г. (без учета изменения данных в профиле за 2018 и 2019 годы) 204 ученых сменили аффилиацию УрФУ на другую страну.
Наибольший отток ученых из УрФУ, как и по всей России, происходил в период, начиная с 90-х годов XX века и до 2002 гг. (см. рис. 1). Кроме того, следует отметить некоторую особенность в процессе миграции: если до начала 2000-х годов миграция наблюдалась в числе ученых, которые были заняты в УрФУ продолжительный период, то после, миграция имеет несколько иную картину. Её можно описать как миграцию за счет ученых, которые были привлечены в рамках какого-либо проекта (гранта), так как учёные, которые сменили аффилиацию после 2003 г., были заняты в УрФУ непродолжительный период времени (1-2 года) и, как правило, имели аффилиацию с зарубежными вузами.
Трансграничная миграция представлена зарубежными странами и странами постсоветского пространства, причём, последние имели наибольшую популярность, начиная с 1978 г. и до середины 90-х гг. XX века. Среди лидеров принимающих стран США, Израиль, Англия, Канада, Германия, Франция, Чехия, страны постсоветского пространства - Беларусь, Украина, Республика Молдова, Узбекистан. Всего 37 стран.
Трансграничная миграция в УрФУ представлена следующими областями знаний: 20% - наука о материалах, 19% - физика и астрономия, 15% - инженерия, 8% - биохимия и молекулярная биология, с долей 5% и менее присутствуют такие области знаний как компьютерные науки, математика, наука о земле, энергетика и др.
Средний IF мигрирующего ученого составил 14, при этом детальный анализ можно представить следующим образом: IF более 26 у 16% эмигрированных ученых, IF 2 -14%, IF 3 - 10%, IF 4 - 8%.
В целом для Уральского федерального университета можно отметить положительную динамику, которая представлена, с одной стороны, снижением доли мигрирующих ученых, с другой стороны, привлечением зарубежных специалистов для реализации совместных проектов. Именно второй аспект, по нашему мнению, является некоторым доказательством смены характера миграции: ее переход от brain drain к drain sharing, то есть от безвозвратной миграции и потери интеллектуального капитала к его совместному использованию. Первые теоретические размышления на данную тему представлены в работе П. Хантера [47].
Что касается миграции в национальном масштабе, то рассматривать ее как «утечку мозгов», по нашему мнению, не правомерно, так как научный капитал остается внутри страны. Но, если рассматривать организацию как самостоятельную структурную единицу, конкурирующую за кадры, то можно говорить о миграции ученых. В этом случае важность представляют национальные наукометрические базы, так, в России -это eLibrary.
Заключение
Цифровизацию в библиометрии можно назвать цифровыми следами, которые в настоящее время характеризуются с положительной стороны. Во-первых, обеспечивается доступ к научной литературе широкому кругу читателей, во-вторых, обеспечивается некоторая защита интеллектуальной деятельности посредством использования цифровых технологий проверки на плагиат, в-третьих, становится возможным анализировать научную деятельность более оперативно и учитывать большее количество информации (уровень развития отдельных отраслей науки, производительность и миграцию ученых). Однако несмотря на широкое распространение использования наукометрических данных для количественного и качественного анализа, затруднения возникают на этапе формирования базы данных, и, чаще всего, сбор осуществляется аналоговым способом, так как развитие компьютерных программ и алгоритмов еще не получило должного применения в данной отрасли.
Кроме того, массовый характер использования библиометрии как способа оценки научной деятельности проявился недавно, поэтому для исследования миграции и ее видов необходимо четко определить задачи:
• если необходимо изучить взаимодействие ученых (которое частично можно отнести к мобильности) в национальных масштабах, то для этих целей нельзя
оставлять без внимания отечественные базы (для России - eLibrary);
• если задачей ставиться оценка безвозвратной миграции или мобильности в трансграничном состоянии, тогда в приоритет выводиться анализ по зарубежным базам - SCOPUS, WoS и др., но также при любом анализе стоит обратить внимание на отраслевые, профессиональные базы, например, PubMed;
• необходимо четко обозначить методологию исследования в части исследования миграции посредством наукометрии, т.к. смена аффилиации позволяет количественно оценить ее в трактовке «brain drain», но при этом без внимания остаются остальные составляющие миграции, важные для научной сферы (например, мобильность, и такое явление как brain sharing).
Проведенный нами анализ показал, что для УрФУ за анализируемый период характерно следующее:
• миграция осуществлялась преимущественно в США, Израиль, Германию, Канаду и некоторые страны постсоветского пространства;
• сфера научных отраслей, мигрирующих сосредоточена в области наук о материалах, физике, астрономии, инженерии.
В заключении отметим, что цифровизация наукометрии является существенным прогрессом, способствующим не только распространению научного знания, но и его защите (например, выявление плагиата), а цифровые следы - важным инструментом в анализе количественных и качественных научных показателей.
_Финансирование
Исследование выполнено за счет гранта Российского научного фонда (проект № 19-78-00080)
REFERENCES
1. Dyachkova M. A., Tomyuk O. N., Kirillova N. B., Dudchik A. Yu. Digitalization of the educational environment as a factor of personal and professional self-determination of students. Perspektivy Nauki i Obrazovania, 2019, no. 42 (6), pp. 422-434.
2. Tomyuk O., Shutaleva A., Dyachkova M., Fayustov A., Novgorodtseva A. University Positioning in Modern World. Proceedings of the Internation Conference on "Humanities and Social Sciences: Novations, Problems, Prospects" (HSSNPP 2019). Advances in Social Science, Education and Humanities Research, 2019, pp. 641-645. doi: 10.2991/ hssnpp-19.2019.122
3. Lazer D., Radford J. Data ex Machina: Introduction to Big Data. Annual Review of Sociology, 2017, vol. 43, pp. 19-39.
4. Golder S. A., Macy M. W. Digital Footprints: Opportunities and Challenges for Online Social Research. Annual Review of Sociology, 2014, vol. 40, pp. 129-152.
5. Pritchard A. Statistical bibliography of bibliometrics? Journal of Documentation, 1969, no. 25 (4), pp. 348-349.
6. Hulm E. W. Statistical bibliography in relation to the growth of modern civilization. London. 1923. 64 p.
7. Cole F. J., Eales N. B. The history of comparative anatomy. Part I. A statistical analysis of the literature. Science Progress, 1917, no. 11 (44), pp. 578-596.
8. Gosnell C. F. The rate of obsolescence in college library book collections as determined by an analysis of three select lists of books for college libraries. PhD thesis. New York University. 1943.
9. Raisig L. M. Statistical bibliography in the health sciences. Bull. Med. Lib. Assoc, 1962, no. 50 (3), pp. 450-461.
10. Pritchard A. Statistical bibliography; an interim bibliography. North-Western Polytechnic. School of Librarianship. 1969. 60 p.
11. Garfield E. Citation Indexes for Science. Science, 1955, no. 122 (3159), pp. 108-111.
12. Rukovodstvo po naukometrii: indikatory razvitiya nauki i tekhnologii [Guide to scientometrics: indicators of the development of science and technology] M. A. Akoev, V. A. Markusova, O. V. Moskaleva [et al.]. Yekaterinburg, Ural University Publ., 2014. 250 p.
13. Garfield E. Citation indexing: its theory and application in science, technology, and humanities. New York: Wiley. 1979. p. 274.
14. Vladutz G. E., Nalimov V. V., Styazhkin N. I. Nauchnaya i tekhnicheskaya informaciya kak odna iz zadach kibernetiki [Scientific and technical information as one of the tasks of cybernetics]. Uspekhi fizicheskih nauk - Advances in Physical Sciences, 1959, no. 69 (1), pp. 13-56.
15. Markusova V. A. Pervyj sovetskij ukazatel' bibliograficheskih ssylok po informatike [The first Soviet index of bibliographic references in computer science]. Nauch.-tekhn. informaciya - Scientific and technical information, 1976, no. 1 (2), pp. 30-32.
16. Mikhalov A. I., Chernyi A. I., Gilyarevskyi R. S. Osnovy nauchnojinformacii [Fundamentals of Scientific Information]. Moscow, Nauka Publ., 1965, p. 435.
17. Gross P. L. K., Gross E. M. College Libraries and Chemical Education. Science. New Series, 1927, no. 66 (1713), pp. 85-389.
18. Budd J. M. A bibliometric analysis of higher education literature. Research in Higher Education, 1988, no. 28 (2), pp. 180-190.
19. Garfield E. Citation Index in Sociological and Historical research. Current Contents, 1969, no. 9, pp. 42-46.
20. Lotka A. J. The frequency distribution of scientific productivity. Journal of the Washington Academy of Sciences, 1926, no. 16 (12), pp. 317-323.
21. Thorne F. C. The Citation Index: Another Case of Spurious Validity. Journal of Clinical Psychology, 1977, no. 33, pp. 1157-61.
22. Smith L.C. Citation analysis. Library Trends, 1981, no. 30 (1), pp. 83-106.
23. Price D. J. de S. Networks of Scientific Papers. Science, 1965, no. 149 (3683), pp. 510-515.
24. National Science Board. Science and Engineering Indicators 2014 / D. E. Arvizu, R. M. Bowen (eds) // National Science Foundation, Arlington, VA. Available at: http://www.nsf.gov/statistics/seind14/ (accessed 3 March 2020)
25. OECD science, technology and industry scoreboard 2013: innovation for growth. OECD Publishing. Paris. 2013. doi: 10.1787/sti_scoreboard-2013-en
26. Cacibano C., Bozeman B. Curriculum vitae method in science policy and research evaluation: the state-of-the-art. Res Eval, 2009, no. 18 (2), pp. 86-94. doi: 10.3152/095820209X441754
27. Sandstrum U. Combining curriculum vitae and bibliometric analysis: mobility, gender and research performance. Res Eval, 2009, no. 18 (2), pp. 135-142. doi: 10.3152/095820209X441790
28. Woolley R., Turpin T. CV analysis as a complementary methodological approach: investigating the mobility of Australian scientists. Res Eval, 2009, no. 18 (2), pp. 143-151. doi: 10.3152/095820209X441808
29. Boring P., Flanagan K., Gagliardi D., Kaloudis A., Karakasidou A. International mobility: findings from a survey of researchers in the EU. Sci Public Policy, 2015. doi: 10.1093/scipol/scv006
30. Flanagan K. International mobility of scientists. In: Archibugi D., Filippetti A. (eds) The handbook of global science, technology, and innovation. Wiley. Chichester, 2015, pp. 364-381. doi: 10.1002/9781118739044.ch17
31. De Filippo D., Casado E. S., Gymez I. Quantitative and qualitative approaches, to the study of mobility and scientific performance: a case study of a Spanish university. Res Eval, 2009, no. 18 (3), pp. 191-200. doi: 10.3152/095820209X451032
32. Dubois P., Rochet J. C., Schlenker J. M. Productivity and mobility in academic research: evidence from mathematicians. Scientometrics, 2014, no. 98 (3), pp. 1669-1701. doi: 10.1007/s11192-013-1112-7
33. Moed H. F., Halevi G. A bibliometric approach to tracking international scientific migration. Scientometrics, 2014, no. 101 (3), pp. 1-15. doi: 10.1007/s11192-014-1307-6
34. van Eck N. J., Waltman L. Software survey: VOSviewer, a computer program for bibliometric mapping. Scientometrics, 2010, no. 84 (2), pp. 523-538. doi: 10.1007/s11192-009-0146-3
35. Koksharov V. A., Agarkov G. A. Mezhdunarodnaya nauchnaya migraciya: progress ili ugroza nauchno-tekhnicheskoj bezopasnosti Rossii [International Scientific Migration: Progress or a Threat to Russia's Scientific and Technological Security]. Ekonomika regiona - Economy of Region, 2018, no. 14 (1), pp. 243-252. doi: 10.17059/2018-1-19
36. Nikolaenko G. A. Perspektivy ispol'zovaniya cifrovyh sledovissledovatelej dlya analiza ih kommunikativnyh strategij (naprimeresocial'nojseti ResearchGate) [The Perspectives of Using Digital Traces of Researchers for Analyzing their Communication Strategies (by the Example of the Social Network "ResearchGate")]. Sociologiya nauki i tekhnologij - Sociology of science and technology, 2019, no. 10 (2), pp. 93-109. DOI: 10.24411/2079-0910-2019-12005
37. Pierson A.S., Cotgreave P. Citation figures suggest that the UK brain drain is a genuine problem. Nature, 2000, no. 407(6800), p. 13. doi: 10.1038/35024218
38. Borjas G. J., Doran K. B. The collapse of the Soviet Union and the productivity of American mathematicians. QJ Econ, 2012, no. 127 (3), pp. 1143-1203. doi: 10.1093/qje/qjs015
39. Laudel G. Migration currents among the scientific elite. Minerva, 2005, no. 43 (4), pp. 377-395. doi: 10.1007/ s11024-005-2474-7
40. Furukawa T., Shirakawa N., Okuwada K., Sasaki K. International mobility of researchers in robotics, computer vision and electron devices: a quantitative and comparative analysis. Scientometrics, 2012, no. 91 (1), pp. 185-202. doi: 10.1007/s11192-011-0545-0
41. Deville P., Wang D., Sinatra R., Song C., Blondel V. D., Barabasi A. L. Career on the move: geography, stratification,
and scientific impact. Sci Rep, 2014. 4770. doi: 10.1038/srep04770
42. Laudel G. Studying the brain drain: Can bibliometric methods help? Scientometrics, 2003, no. 57 (2), pp. 215-237.
43. Zuckerman H. Scientific elite: Nobel Laureates in the United States. Transaction Publishers. 1977. 335 p.
44. Hunter R. S., Oswald A. J., & Charlton B. G. The elite brain drain. The Economic Journal, 2009, no. 119 (538), pp. 231- 251.
45. Dyachenko E. L. Internal migration of scientists in Russia and the USA: the case of physicists. Scientometrics, 2017, no. 113 (1), pp. 105-122. doi: 10.1007/s11192-017-2478-8
46. Markova Yu., Shmatko N. A., Katchanov Yu. L. Synchronous international scientific mobility in the space of affiliations: evidence from Russia. SpringerPlus, 2016, no. 5 (1), pp. 1-19. DOI: 10.1186/s40064-016-2127-3
47. Hunter P. Brain drain, brain gain or brain sharing? New studies of the migration routes of scientists show that international mobility benefits all parties including countries that are net exporters of researchers. EMBO Reports. 2013, no. 14 (4), pp. 315-318.
Информация об авторе
Судакова Анастасия Евгеньевна
(Россия, г. Екатеринбург) Доцент, кандидат экономических наук, старший научный сотрудник научно-исследовательской лаборатории по проблемам университетского развития
Уральский федеральный университет имени первого Президента России Б. Н. Ельцина E-mail: [email protected] ORCID ID: 0000-0002-3791-1129) Scopus ID:57194490425
Information about the author
Anastasia E. Sudakova (Russia, Ekaterinburg) Associate Professor, PhD in Economic Sciences, Senior Researcher, University Development Research Laboratory
Ural Federal University named after the first President of Russia B.N. Yeltsin Email: [email protected] ORCID ID: 0000-0002-3791-1129) Scopus ID: 57194490425