Научная статья на тему 'РАБОТА С ДАННЫМИ ОТКРЫТЫХ ИСТОЧНИКОВ ДЛЯ ПРОВЕДЕНИЯ СОЦИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ НА ПРИМЕРЕ ИССЛЕДОВАНИЯ РЕАКЦИИ УЧАЩИХСЯ НА ПЕРЕХОД НА ДИСТАНЦИОННОЕ ОБУЧЕНИЕ В ПЕРИОД НАЧАЛА ПАНДЕМИИ КОРОНАВИРУСА'

РАБОТА С ДАННЫМИ ОТКРЫТЫХ ИСТОЧНИКОВ ДЛЯ ПРОВЕДЕНИЯ СОЦИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ НА ПРИМЕРЕ ИССЛЕДОВАНИЯ РЕАКЦИИ УЧАЩИХСЯ НА ПЕРЕХОД НА ДИСТАНЦИОННОЕ ОБУЧЕНИЕ В ПЕРИОД НАЧАЛА ПАНДЕМИИ КОРОНАВИРУСА Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
159
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОТКРЫТЫЕ ИСТОЧНИКИ / БОЛЬШИЕ ДАННЫЕ / СОЦИОЛОГИЧЕСКОЕ ИССЛЕДОВАНИЕ / ПЕРЕХОД НА ДИСТАНЦИОННУЮ ФОРМУ ОБУЧЕНИЯ / РЕАКЦИЯ УЧАЩИХСЯ / OPEN DATA / BIG DATA / SOCIOLOGICAL RESEARCH / TRANSITION TO DISTANCE LEARNING / STUDENT FEEDBACK

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Калаврий Т.Ю., Золотарева Т.В.

Открытые данные - это то хранилище информации, в котором можно найти и использовать информацию о многих аспектах жизни, что делает их ценными для проведения социологических исследований, в том числе связанных с субъективными оценками. В данной статье рассматривается методика проведения такого исследования - исследования реакции учащихся на переход на дистанционное обучение в начале пандемии коронавируса Covid-19. Исследование проводилось сообществом ученых Университетского Консорциума исследователей больших данных. Работы в рамках данного исследования проводились на основе анализа высказываний пользователей социальной сети ВКонтакте, опубликованных там в период перехода учебных заведений на дистанционную форму обучения в марте 2000 года в начале пандемии коронавируса. В ходе исследования были проведены выгрузка и анализ сообщений из постов социальной сети. Все работы условно делились на три этапа: подготовительный, где производился подбор субъектов, имеющих данные, соответствующие требованиям, предъявляемым к большим данным и релевантных теме исследования, выгрузка данных, их предварительный анализ; непосредственно анализ высказываний в соответствии с разработанными индикаторами; подготовка итогового отчета, в котором проанализированы сообщения студентов 309 российских университетов из 80 регионов, определена эмоциональная тональность сообщений, выявлены основные проблемы перехода на дистанционное обучение, проведено сравнение ситуаций в разных регионах.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по СМИ (медиа) и массовым коммуникациям , автор научной работы — Калаврий Т.Ю., Золотарева Т.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

WORKING WITH OPEN DATA SOURCES FOR SOCIAL RESEARCH PURPOSES VIA STUDENT FEEDBACK ON THE TRANSITION TO DISTANCE LEARNING AT THE BEGINNING OF THE COVID-19 PANDEMIC

Open data is a repository of information about many aspects of life, which makes it valuable for conducting sociological research, including the kind that is related to subjective assessments. This article discusses the methodology for conducting a study on the reaction of students to the transition to distance learning during the initial period of the Covid-19 pandemic. The study was conducted by a community of scientists from the University of the Big Data Research Consortium. The research was based on the analysis of statements on the social network VK made by users during the transition of educational institutions to distance learning in March 2020 at the beginning of the coronavirus pandemic. The study included uploading and analyzing messages from social network posts. The research was divided into three stages: the preparatory stage, where the selection of subjects with data that meet the requirements for big data and are relevant to the research topic as well as data uploading and its preliminary analysis were made; the analysis stage, where the statements were analyzed in accordance with the developed indicators; the stage of preparation of the final report, where the messages of students from 309 Russian universities in 80 regions were analyzed. The stage also involved determining the emotional tone of messages, identifying the main problems of switching to distance learning, and compared the situations in different regions.

Текст научной работы на тему «РАБОТА С ДАННЫМИ ОТКРЫТЫХ ИСТОЧНИКОВ ДЛЯ ПРОВЕДЕНИЯ СОЦИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ НА ПРИМЕРЕ ИССЛЕДОВАНИЯ РЕАКЦИИ УЧАЩИХСЯ НА ПЕРЕХОД НА ДИСТАНЦИОННОЕ ОБУЧЕНИЕ В ПЕРИОД НАЧАЛА ПАНДЕМИИ КОРОНАВИРУСА»

DOI: https://doi.org/10.23670/IRJ.2020.102.12.068

РАБОТА С ДАННЫМИ ОТКРЫТЫХ ИСТОЧНИКОВ ДЛЯ ПРОВЕДЕНИЯ СОЦИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ НА ПРИМЕРЕ ИССЛЕДОВАНИЯ РЕАКЦИИ УЧАЩИХСЯ НА ПЕРЕХОД НА ДИСТАНЦИОННОЕ ОБУЧЕНИЕ В ПЕРИОД НАЧАЛА ПАНДЕМИИ КОРОНАВИРУСА

Научная статья

Калаврий Т.Ю.1' *, Золотарева Т.В.2 1 ORCID: 0000-0002-2279-2059; 1 2 Северо-Восточный федеральный университет им. М.К. Аммосова, Якутск, Россия

* Корреспондирующий автор (k-tipu[at]mail.ru)

Аннотация

Открытые данные - это то хранилище информации, в котором можно найти и использовать информацию о многих аспектах жизни, что делает их ценными для проведения социологических исследований, в том числе связанных с субъективными оценками.

В данной статье рассматривается методика проведения такого исследования - исследования реакции учащихся на переход на дистанционное обучение в начале пандемии коронавируса Covid-19.

Исследование проводилось сообществом ученых Университетского Консорциума исследователей больших данных.

Работы в рамках данного исследования проводились на основе анализа высказываний пользователей социальной сети ВКонтакте, опубликованных там в период перехода учебных заведений на дистанционную форму обучения в марте 2000 года в начале пандемии коронавируса. В ходе исследования были проведены выгрузка и анализ сообщений из постов социальной сети.

Все работы условно делились на три этапа: подготовительный, где производился подбор субъектов, имеющих данные, соответствующие требованиям, предъявляемым к большим данным и релевантных теме исследования, выгрузка данных, их предварительный анализ; непосредственно анализ высказываний в соответствии с разработанными индикаторами; подготовка итогового отчета, в котором проанализированы сообщения студентов 309 российских университетов из 80 регионов, определена эмоциональная тональность сообщений, выявлены основные проблемы перехода на дистанционное обучение, проведено сравнение ситуаций в разных регионах.

Ключевые слова: Открытые источники, большие данные, социологическое исследование, переход на дистанционную форму обучения, реакция учащихся.

WORKING WITH OPEN DATA SOURCES FOR SOCIAL RESEARCH PURPOSES VIA STUDENT FEEDBACK ON THE TRANSITION TO DISTANCE LEARNING AT THE BEGINNING OF THE COVID-19 PANDEMIC

Research article

Kalavriy T.Yu.1' *, Zolotareva T.V.2

1 ORCID: 0000-0002-2279-2059;

1 2 M. K. Ammosov North-Eastern Federal University, Yakutsk, Russia

* Corresponding author (k-tipu[at]mail.ru)

Abstract

Open data is a repository of information about many aspects of life, which makes it valuable for conducting sociological research, including the kind that is related to subjective assessments.

This article discusses the methodology for conducting a study on the reaction of students to the transition to distance learning during the initial period of the Covid-19 pandemic.

The study was conducted by a community of scientists from the University of the Big Data Research Consortium.

The research was based on the analysis of statements on the social network VK made by users during the transition of educational institutions to distance learning in March 2020 at the beginning of the coronavirus pandemic. The study included uploading and analyzing messages from social network posts.

The research was divided into three stages: the preparatory stage, where the selection of subjects with data that meet the requirements for big data and are relevant to the research topic as well as data uploading and its preliminary analysis were made; the analysis stage, where the statements were analyzed in accordance with the developed indicators; the stage of preparation of the final report, where the messages of students from 309 Russian universities in 80 regions were analyzed. The stage also involved determining the emotional tone of messages, identifying the main problems of switching to distance learning, and compared the situations in different regions.

Keywords: Open data, big data, sociological research, transition to distance learning, student feedback.

Введение

Исследования жизни общества ведутся различными методами и средствами. Большинство из них опирается на данные, как на сведения, необходимые для какого-либо вывода, решения.

Открытые источники, большие данные, цифровой след - все эти термины прочно вошли в современную жизнь. И эти явления предоставили дополнительную возможность для формирования различных выводов в разных сферах деятельности. Мы привыкли к контекстной рекламе, цифровому портрету потребителя, сформированным на основе таких данных. Применение больших данных, в том числе из открытых источников, таких, как социальные сети, дает возможным проводить анализ не только в целях маркетинга, что уже привычно.

Технологические новации последней четверти века создали ситуацию сбора и хранения в автоматическом или почти автоматическом режиме огромных массивов данных. Данные активности в социальных сетях и поисковых запросов в сети Интернет, материалы видеонаблюдения в общественных местах, архивы личных записей кадровых отделов крупных компаний - все это постепенно становится доступным для обработки и анализа, радикальным образом меняя ситуацию в исследованиях человеческого поведения. Часто такие массивы информации называются "большими данными" (Big Data) [2].

Новые данные превосходят старые в своем объеме, разнообразии и глубине, но обычно они существуют совсем не в том виде, в котором готовы для анализа. Превращение сырых данных в нужный для исследователей формат требует специальных компетенций из области компьютерной науки. Исследователи перечисляют целый арсенал методов: математическое и статистическое моделирование; динамический анализ сетей; автоматическое генерирование гипотез; методы интеграции мультимодальных данных; возможности обработки естественного языка и машинное обучение [3].

Поэтому научный интерес вызывают конкретные примеры исследований, проводимых на основе обработки больших данных. Изучение методик проведения исследований, основанных на обработке больших данных, позволит исследовательскому сообществу выработать инструментарий для анализа, построить программы исследования, освоить новые актуальные приемы.

Основная часть

Примером такого исследования может служить проект по изучению эмоциональной тональности сообщений студентов в социальных сетях [8]. Данное исследование проводилось сообществом ученых Университетского Консорциума исследователей больших данных по заказу Министерства науки и высшего образования РФ, в которое входят команды 28 высших учебных и научных заведений. Работы в рамках данного исследования проводились на основе анализа высказываний пользователей социальной сети ВКонтакте, опубликованных там в период перехода учебных заведений на дистанционную форму обучения в марте 2000 года в начале пандемии коронавируса.

Молодежная аудитория представлена в основном в сетях Fasebook, Twitter, ВКонтакте (тогда как, например, Живой Журнал, Одноклассники.ру охватывают в основном более «взрослую» аудиторию). ВКонтакте - крупнейшая русскоязычная социальная сеть. Огромным ее преимуществом является возможность задавать сложные поисковые запросы - например, искать студентов определенного факультета определенного вуза конкретного года выпуска. Охват молодежной аудитории данной сетью значителен, о чем можно судить, сопоставляя общее число студентов определенного вуза и общее число зарегистрированных пользователей сетей из числа студентов того же вуза [4].

Анализ социальных сетей представляет собой актуальный метод исследования, который способен обеспечить доступ к сведениям, недоступным традиционным исследованиям, таким, например, как опрос: проведение исследования в крупных масштабах, анализ социального капитала посредством выявления и установления социальных связей и взаимодействия между отдельными выпускниками [1].

Обработка полученных данных в соответствии с целями и задачами проекта обеспечивалось применением следующего инструментария: социально-сетевой анализ, технологии визуализации графов, методы математической статистики и машинного обучения, нейро-нечеткие методы.

Основная работа сводится к ручной разметке текстовых сообщений по категориям, подбору необходимой информации и статистических данных, поиску онлайн сообществ в социальных сетях по лингвистическим маркерам, а также написанию аналитических отчетов по проделанной работе.

За период 16 марта- 14 июня 2020г. в мониторинг было включено 456 вузов страны, были выгружены и проанализированы сообщения с 1,73 млн. аккаунтов студентов в социальных сетях.

Обработка данных проводилась в три этапа.

I. Подготовительный. На данном этапе производился подбор субъектов, имеющих данные, соответствующие требованиям, предъявляемым к большим данным и релевантных теме исследования, получение (выгрузка) данных, их предварительный анализ.

В разрезе проводимого исследования «Образование в условиях коронавируса: большие данные как инструмент измерения реакции общества» субъектами исследования были определены крупные неформальные сообщества (группы пользователей) социальной сети ВКонтакте численностью от 300 человек, размещавшие сообщения (посты) о переходе на дистанционное обучение и обучение в условиях начавшейся пандемии Covid-19. Как правило, такими сообществами являлись студенческие или школьные группы.

Найденные сообщества должны были удовлетворять нескольким критериям, в том числе они должны быть активны (не менее 10 постов за 30 дней, предшествующих дате поиска).

Поиск таких сообществ осуществлялся вручную, средствами поиска самой социальной сети, по лингвистическим маркерам. Данные маркеры определялись самостоятельно исполнителем в соответствии с тематикой поиска (например, слова «подслушано», «типичный», «студент» и т.п.) и в обязательном порядке фиксировались.

Результаты отбора субъектов отображались в табличной форме (таблица 1), с указанием названия сообщества, ссылки на него, региона (при наличии).

Таблица 1 - Фрагмент предварительной подготовки отбора субъектов исследования

№ ГО сообщества Название сообщества Регион сообщества Ссылка на сообщество Количество участников, чел.

1 -46599987 Дворец пионеров и школьников им.Н.К.Крупской Челябинская область https com/palacechelyabi nsk 6094

2 -194020521 Подслушано МОУ СОШ №39 Республика Коми https://vk.com/public9006645 7 552

3 -136489951 "Подслушано в школе" Омская область https://rn.vk.com/school шш ber130 582

4 -194020521 "ДИСТАНЦИОНКА" МОУ "СОШ №9" г. Сыктывкар Республика Коми https://vk.com/club194020521

5 -62051738 "Подслушано" | МАОУ СОШ №74 Челябинская область https://vk.com/chel.shkool74 2727

6 -162167489 | Подслушано | Лицей №6 | Свердловская область https://vk.com/litsey6supergoo а 389

7 -177873701 ФПрИзНаВаШкИ г.Чадан школа2Ф Республика Тыва https://vk.com/priznavashki01 7 669

Затем, в целях удаления нерелевантных сообществ, проводилась перекрестная проверка списков.

После формирования списка обрабатываемых сообществ была определена целевая аудитория исследования. Для этого для каждого сообщества проводилась выгрузка подписчиков. Выгрузка проводилась с использованием специального программного обеспечения, разработанного и предоставляемого в рамках Университетского консорциума исследователей больших данных. По результатам выгрузки формировались таблицы, содержащие данные подписчиков. Фрагмент такой таблицы приведен на рисунке 1. Общее количество полученных таким образом записей составило более 2 млн.

Подобная таблица формировалась для каждого сообщества, и проводился ее анализ. Целевая аудитория была определена вхождением пользователей в возрастную группу 7-18 лет, т.е. учащиеся учебных заведений уровней общего среднего, среднего профессионального и высшего образования. Сверялось количество подписчиков в сообществе с количеством выгруженных записей, затем проводился отбор среди лиц, указавших полную дату рождения и соответствующих выделенной возрастной группе. Данные обезличивались и сводились в таблицу для дальнейшего анализа (таблица 2).

id firs last is close can accesex city ¡d city_title соипг:гу_1 bdate follower career career career careerj horme_t relatic activiti universlt univen universit universit universit universit un iversit universit u n ivers universit universit schoo 1:

'16133591 Иль Сафи True Fa Ise 'l '147 Тюмень Россия

19174517 Ра,г Тран False True 2 Г2001 Первоург Россия 27.3.1937 Г104 Уралстг Г2001 Г2003 Гл. Механик 'о Г21122

Г20251434 Ваг Шля г False True 2 Г49 Екатерин Россия 10.1.2001 "393

Г20436363 Юл Вла£ False True 1 Г2001 П ервоург Россия 18.9.1988 Г966 Г2001 r2Q17 Екатер* "4 12549, :

21356572 Сер Лене False r True 2 2001 Первоург Россия 1.5.1984 121 Первоу г 0 Г32031

23759393 Оль Дюд True Fa Ise 1 2001 Первоург Россия 2Ö.2

26991211 Юл Сыче True False ri Россия 19.5

29260570 ДНЕ Бобр True False ri г 49 Екатерин Россия 18.8

Г31251325 Lie Бо-0 False r True 1 2001 Первоург Россия 26.6.1972 114 Первоу г 4 ТВОрЧЕ 2QB470 r 1 "zDOl Ревдинск "505413 педагог начальный классов 1991 Очное от Выпуски и 132333,

Г31541021 Ека Брат False r True 1 Россия г 93

"31910542 Mpiflypc False r True 1 г 49 Екатерин Россия 2Ö.3 Г 40 трейд-ft г 49 2008 менедж Екатер* г 0 общее 9953 r 1 r 49 Frnny Г12325 Институт "*2039029 Технолог 2013 Заочное Студентк Г23907

"32693403 Lie Скакуно&а r

Г3 5496946 Ли,: Гаек; True False 1 2001 Первоург Россия 1.6

35762062 Ека Пеня False r True 1 2001 Первоург Россия 9.12 251

"з 6820106 АНс Ман! False r True 1 2001 П ервоург Россия 108 г 0 "Ï62053 r 1 "zOOl УГГУ(6ые "303515 Инженер "з 23620 Экономи 2009 Заочное ëbinv'lkhh М5506

40Ö99142 Ксе Коре False r True 1 Россия 18.10.1983 106

45231547 Еег Самс False r True 1 108 Орск Россия 9.1.1986 г 97 Орск г 0 10564 r 1 IDS ОГТИ (фи. Г131337 Физико-м "Î26724 Технолог 2012 Заочное Студентк 15930, :

49614542 Ma Анан False r True 1 г 49 Екатерин Россия 10.8.1984 282

Г5 0245723 Ане Коче True False ri г 49 Екатерин Россия 21.3.1983

Г5 0329322 Lie щер False r True 1 2001 Первоург Россия 17.9 133 Салон н 2001, 24 2009, 2( Бухгалтер., Заме г 0 Г162053 r 1 "zOOl УГГУ(6ые "303515 Инженер "з 23620 Экономи 2007 Заочное Еыпускни 21122, :

Г5 2715965 Тат Сила False r True 1 2001 Первоург Россия 4.6 498

54330037 Вив Собч False r True 1 2001 Первоург Россия 20.9 120 Первоу г 0 477 r 1 Г2001 УГТУ-УГИ 2470 Механик Г5В90 Технолог 2004 Очное отделение "б7124

Г5 3746043 Rus Gash True False Z 2001 П ервоург Россия

"53946343 Вяч нспе False r True 2 2001 Первоург Россия 22.2 г 27

Г5 9472939 Све MEai- True Fa Ise 1 2001 Первоург Россия 7.9.1985

Г59941051 A Hi Понс False r True 2 2001 П ервоург Россия 22.11.1981 г 23 nepsoyf г 1 "21122

60Ü25933 Рин Дауг False r True 2 2001 Первоург Россия 12.12 г 277

62141377 Ma Видя False r True 1 2001 Первоург Россия ' 64 Россия г 0 43196

63019421 Да Сафь True False ri 2001 Первоург Россия 2 8.8

64691354 Auf Трун False r True 2 Россия 232

65890759 Вл; СаЕр False r True 2 2001 П ервоург Россия 28.10.1985 F 30 ремстр 2001 2017 Се ар щи первоу[ г 0 's 3338

65921030 Ека Е кат True False 1 2001 Первоург Россия 2.4

63026033 Юл Нике False r True 1 2001 Первоург Россия 3.7.1985 124

Рис. 1 - Фрагмент результатов выгрузки сведений о подписчиках

Таблица 2 - Обработка данных сообществ для оп

зеделения целевой аудитории исследования

Кол-

№ Название сообщества Регион сообщества Ссылка на сообщество ГО сообщес тва во посто в 17.0320.06. 2020 Кол-во участн иков Кол-во участник ов, указавши х возраст Кол-во участн иков из ЦА Мин. возра ст Макс. возра ст Ср. возра ст 13 лет 14 лет 15 лет 16 лет 17 лет 18 лет Дру гие Доля ЦА, %

1 Дворец пионеров и школьников им.Н.К.Крупско й Челябинская область https://vk.com/ ра1асеЛе1уаЫ шк 4659998 7 125 6094 1742 311 13 16 30 63 64 55 53 46 143 1 5,1

2 Подслушано МОУ СОШ Республика Коми https://vk.com/ риЪНс9006645 9006645 4 552 205 114 13 18 16 2 9 23 26 26 28 91 20,7

№39 7 7

3 "Подслушано в школе" Омская область https://rn.vk.co т^Лоо1 пит Ъег130 1364899 51 17 582 260 186 13 18 15 12 40 51 39 25 19 74 32,0

4 "ДИСТАНЦИО НКА" МОУ "СОШ №9" г. Республика Коми https://vk.com/ с1иЪ194020521 1940205 21 9 277 92 23 13 17 15 1 5 7 7 3 69 8,3

Сыктывкар

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таким образом, на подготовительном этапе в результате предварительной обработки данных были подготовлены списки сообществ, имеющие релевантную исследованию аудиторию, активную в исследуемый период для дальнейшего анализа сообщений в этих сообществах (контента) и данные о целевой аудитории.

II. Анализ высказываний в соответствии с разработанными индикаторами.

Для дальнейшей работы на втором этапе также производилась выгрузка данных с помощью инструментов платформы по работе с данными социальных сетей. Выгружалось содержимое сообщений (постов). Выгруженные данные распределялись по видам учебных заведений и территориальному признаку (субъектам РФ), что соответствовало сортировке, также проведенной на предварительном этапе.

Выгруженные сообщения были размечены по релевантности изучаемой теме, что позволило в дальнейшем систематизировать релевантные сообщения по тематике и тональности. Так как предметом исследования являлась реакция обучающихся на переход на дистанционное обучение, то рассматривались только сообщения, в которых упоминались явления, с ним связанные. К релевантным («не мусорным») сообщениям относили:

- системные проблемы и организация образовательного процесса (сессия, домашние задания, лекции, семинары, документооборот, техническое обеспечение учебного процесса, личные кабинеты, канал интернета и т.д.);

- отношение к преподавателям и качеству преподавания;

- плохое информирование учащихся в условиях перехода на дистанционное обучение (доступность корпусов и общежитий, режим работы и т.д.);

- проживание в кампусе, его доступность; организация досуга, питания и медицинского обслуживания, неформальное образование;

- стипендия, оплата за обучение, материальная поддержка и подработка;

- самочувствие и психологическое состояние студента;

- мнение или вопрос абитуриента, связанный с поступлением в учебное заведение в новых условиях.

Соответственно, посты маркировались следующим образом:

1. Мусор - нерелевантные сообщения, т.е. не относящиеся к организации учебного процесса и деятельности учебного заведения в период перехода на дистанционное обучение;

К «мусорным» сообщениям относились:

- проблемы и вопросы не системного, а субъективного характера: помощь в выполнении учебных заданий, сдача определенных предметов, получении контактов преподавателей и т.д.;

- бытовые и личностные вопросы (кино, любовь, отношения, политические взгляды, семья, собаки, кошки, одежда, парни, девушки, вечеринки, заведения, игры и другое);

- объявления о событиях, реклама, поздравления, акции, розыгрыши;

- ироничные сообщения, мемы, шутки.

2. Не дистант - сообщения, относящиеся к организации учебного процесса и деятельности учебного заведения в целом, но не содержащие информации о дистанционном обучении;

3. Предложение - выдвижение какой-то идеи, рекомендации, действия;

4. Вопрос - вопрос, связанный с организацией учебного процесса и деятельностью учебного заведения;

5. Тематика - предмет обсуждения, смысловая нагрузка поста;

В тематике сообщений были выделены следующие группы:

- Организационно-методические вопросы, связанные с учебным процессом, документооборотом, расписанием, нагрузкой, организацией занятий и самостоятельной работы, контролем знаний;

- Техническое обеспечение учебного процесса: применяемые информационные технологии, в том числе программное обеспечение.

- Самочувствие и личные качества: физиологическое и психологическое состояние, личные качества.

- Социально-финансовая сфера: стипендия, материальная помощь, работа, оплата за обучение.

- Бытовые условия: проживание в общежитиях, занятия спортом, доступность магазинов, предметы первой необходимости, организация питания, конфликты с соседями по комнате.

- Другое.

При этом указывалось, если в одном сообщении затрагивалось несколько тем. Вопрос о разметке постов, вызывающих трудности с отнесением к определенной категории, решался экспертно.

На основе проводимой разметки был создан алгоритм автоматической сортировки текстов на «мусор» и «не мусор».

Для релевантных (немусорных) сообщений была проведена оценка тональности. Тональность - степень эмоциональности, выраженная в сообщении. Тональность сообщения определялась по эмоциональному впечатлению, производимому на читателя.

Выделялись следующие значения тональности:

- Позитивная: в сообщении высказывается позитивное мнение относительно обсуждаемого вопроса;

- Негативная: в сообщении высказывается негативное мнение относительно обсуждаемого вопроса. Часто негатив свидетельствует о существующей проблеме;

- Нейтральная: в сообщении не выражается конкретное мнение, а сообщаются сухие факты или задается вопрос (без эмоциональной окраски).

Если в сообщении обозначалась какая-либо проблема, указывалась негативная тональность (даже если явно такая тональность не проявлена).

В ходе дальнейшего анализа негативные значения позволят выявить существующие проблемы в дистанционном обучении.

Фрагмент работы по категоризации сообщений и определения их релевантности представлен в таблице 3.

Таблица 3 - Категоризация данных для определения релевантных сообщений

region long univ name post link univ name post text Мусор / Не мусор Предложе ние Вопрос Организа ционно-методиче ские вопросы Техническ. обеспеч. учебного Самочув ствие и личные качества Соц-финансо вая сфера Бытовые условия Друг ое

Хабарове кий край КнАГУ (бывш. КнАГТУ) https://vk. com/publi c6116524 5?w=wall 61165245 40044 Комсомольск ий-на-Амуре государствен ный университет Кто знает, как связаться сейчас с деканатом ФЗДО? На телефон не отвечают. Есть Негатив но

Хабарове кий край КнАГУ (бывш. КнАГТУ) https://vk. com/publi c6116524 5?w=wall 61165245 39473 Комсомольск ий-на-Амуре государствен ный университет Будут ли давать стипендию в апреле или нет? А то вдруг из-за карантина что изменилось. Есть Нейтраль но

Хабарове кий край ДВГУПС (бывш. ХабИИЖ Т) https://vk. com/publi c9980692 0?w=wall 99806920 _25681 Дальневосто чный государствен ный университет путей сообщения Кто-нибудь может прояснить, как быть абитуриенту в этом году? Как подавать документы? Насколько мне известно, в ДВГУПС нельзя будет подать заявление через госуслуги. Будет какая-то своя платформа? Есть Нейтраль но

Хабарове кий край ТОГУ (бывш. ХПИ, ХГТУ) https://vk. com/publi c3841817 7?w=wall 38418177 41909 Тихоокеанск ий государствен ный университет Расскажите, пожалуйста, как проходит дистанционное обучение в тогу? Есть Нейтраль но

Результаты этого этапа позволили отобрать для дальнейшей обработки те сообщества в сети ВКонтакте, которые соответствуют целевой группе и имеют текстовые сообщения по теме исследования. Сообщества были объединены в соответствующие категории.

III. Составление отчета.

На заключительном этапе работы результаты компоновались в таблицы по субъектам Российской Федерации в соответствии с отобранными (проявляющими наибольшую активность в обсуждении темы перехода на дистанционное обучение в начале пандемии Covid-19) учебными заведениями.

Была дана характеристика и оценка информационного охвата, активности, лояльности и степени вовлеченности в обсуждение ситуации. При подготовке материалов использовались, кроме результатов, полученных обработкой открытых данных социальной сети ВКонтакте, данные из официальных источников [5], [6]. Пример таблицы приведен ниже (таблица 4).

Таблица 4 - Оценка информационного охвата, активности, вовлеченности и лояльности по региону

Наименование Амурский гуманитарно -педагогический Комсомольс кий-на-Амуре государстве нный университет Дальневосто чный государствен ный Тихоокеанск ий государстве Хабаровский государствен ный университет экономики и права Дальневосто чный государствен ный медицинский университет

государственный университет университет путей сообщения нный университет

Аббревиатура АмГПГУ КнАГУ ДВГУПС ТОГУ ХГУЭП ДВГМУ

Федеральный округ Дальневосточный федеральный округ Дальневост очный федеральны Дальневосто чный федеральный Дальневосто чный федеральны Дальневосточ ный федеральный Дальневосто чный федеральный

й округ округ й округ округ округ

Субъект РФ Хабаровский край Хабаровски й край Хабаровский край Хабаровски й край Хабаровский край Хабаровский край

Город Комсомольск-на-Амуре Комсомольс к-на-Амуре г. Хабаровск г. Хабаровск г. Хабаровск г. Хабаровск

Численность

населения 246607 246607 616372 616372 616372 616 372

(чел.)

Статус Прочие Прочие Прочие Прочие Прочие Прочие

Министерство Министерст во науки и высшего образования Российской Федеральное Министерст во науки и высшего образования Российской Министерств о науки и высшего образования Российской Министерств о здравоохране ния Российской

Подведомствен ность науки и высшего образования Российской Федерации агентство железнодоро жного

Федерации транспорта Федерации Федерации Федерации

Численность студентов (чел) 2532 5124 10418 13576 4778 2871

Количество

сообществ 2 1 3 3 3 3

(шт.)

Подслушано

Сообщества Группа учащихся и выпускников АмГПГУ (КнАГПУ) Подслушано в АмГПГУ Подслушан о вКнАГУ Подслушано в Железке (ДВГУПС) Профком студентов ДВГУПС Студенчески й Совет ДВГУПС в ТОГУ|Хабар овск Портал ТОвиШе и газета ТОГУ «ТЕХНОПО ЛИС» Профком студентов ТОГУ Научная библиотека ХГУЭП Подслушано ХГУЭП| Хабаровск Профком Студентов ХГУЭП Новости ДВГМУ Подслушано @ДВГМУ Цитаты ДВГМУ

Количество

уникальных подписчиков 3088 2755 10668 19806 953 6884

(чел.)

За какой

период выгружены публикации (недель) 17 19 19 19 19 18

Окончание таблицы 4 - Оценка информационного охвата, активности, вовлеченности и лояльности по региону

Наименование Амурский гуманитарно-педагогический государственный университет Комсомольс кий-на-Амуре государстве нный университет Дальневосто чный государствен ный университет путей сообщения Тихоокеанск ий государстве нный университет Хабаровский государствен ный университет экономики и права Дальневосто чный государствен ный медицинский университет

Общее

количество 34 242 1065 603 879 100

постов (шт.)

Общее

количество просмотров 13108 117082 1301388 693540 474126 189137

всех постов

Среднее

количество просмотров на 397,212 483,81 1221,961 1150,149 539,392 1891,37

пост

Количество

участников к среднему 0,129 0,176 0,115 0,058 0,566 0,275

количеству

просмотров

Общее

количество лайков всех 220 515 33840 6345 3279 3823

постов

Среднее

количество лайков на один 6,471 2,128 31,775 10,522 3,73 38,23

пост

Общее

количество комментариев 12 379 2097 390 777 91

всех постов

Среднее

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

количество комментариев 0,353 1,566 1,969 0,647 0,884 0,91

на один пост

Среднее кол-во

публикаций в 2,03 12,826 18.839 10.826 15.552 5.737

неделю

Количество

релевантных 0 3 4 21 3 1

постов

Доля

релевантных постов до 0.000 0.000 0.000 0.012 0.009 0.000

16.03.20

Доля

релевантных постов после 0.000 0.015 0.016 0.167 0.011 0.017

16.03.20

Среднее кол-во

в неделю до 0.000 0.000 0.000 0.167 0.167 0.000

16.03.20

Среднее кол-во

в неделю после 0.000 0.231 0.308 1.538 0.154 0.077

16.03.20

Для подобной оценки были разработаны общие индикаторы (таблица 5).

Таблица 5 - Индикаторы оценки сообществ учебных заведений по вузам РФ

Индикатор Значение по вузам России

Количество сообществ в сетях 1 сообщество - ниже среднего 2 сообщества - средний уровень 3-6 сообществ - выше среднего 7 и больше - высокий уровень

Количество подписчиков до 5411 - низкое количество от 5412 до 9914 - количество ниже среднего от 9915 до 17872 - количество выше среднего от 17873 - высокое количество

Информационный охват (количество участников к среднему количеству просмотра одного поста) до 0,083 - низкое количество от 0,084 до 0,144 - ниже среднего от 0, 145 до 0,227 - выше среднего от 0,228 - высокое количество

Уровень лояльности (среднее количество лайков на один пост) до 6,66 - низкое количество от 6,66 до 13,392 - ниже среднего от 13,392 до 25,027 - выше среднего от 25,028 - высокое количество

Уровень вовлеченности в обсуждение контента (среднее количество комментариев на один пост) до 0,884 - низкое количество от 0,885 до 1,607 - ниже среднего от 1,608 до 2,713 - выше среднего от 2,714 - высокое количество

В итоге было охарактеризовано отношение учащихся к переходу на дистанционное обучение с точки зрения наиболее часто встречавшихся и обсуждаемых тем сообщений и их эмоциональной окраски. Была проведена лемматизация слов в сообщениях выделенных сообществ учебных заведений и выделены топы релевантных постов. Это позволило определить наиболее характерные проблемы учащихся, возникшие при смене формы обучения.

Заключение

С применением сложного математического аппарата и большого количества информации появилась возможность более точно предсказывать поведение отдельного человека или целой социальной группы. В силу популяризации цифрового мира данных для анализа с каждым годом будет генерироваться все больше, вследствие чего и прогнозы будут становиться более точными [7].

Соответственно, такое количество данных, в том числе цифровых следов, оставляемых пользователями в социальных сетях, возможно использовать в социологических исследованиях. Пример подобного исследовательского проекта рассмотрен в статье.

Основной задачей проекта являлось составление перечня проблем в образовательном процессе (как в условиях перехода на дистанционное обучение, так и вне его), поиск историй успеха в области перехода на дистанционное обучение и сбор предложений к изменениям.

Итогом всей работы стал сводный отчет, в котором проанализированы сообщения студентов 309 российских университетов из 80 регионов, оставленные молодежью в неофициальных университетских сообществах (например, «Подслушано в...»), определена эмоциональная тональность сообщений, проведено сравнение ситуаций в разных регионах. Всего было проанализировано более 2 млн. сообщений [8]. Такая характеристика соответствует понятию «большие данные».

Конфликт интересов Conflict of Interest

Не указан. None declared.

Список литературы / References

1. Бабкина Т.С. Траектория выпускников российских вузов на данных социальных медиа. / Т.С. Бабкина, В.Л. Гойко, Ю.О. Мундриевская и др. // Управление развитием крупномасштабных систем (mlsd'2018): Материалы одиннадцатой международной конференции / Под общей редакцией С.Н. Васильева, А.Д. Цвиркуна. - М.: Институт проблем управления им. В.А. Трапезникова РАН, 2018. - с. 489-491.

2. Волков В.В. Проблемы и перспективы исследований на основе Big Data (на примере социологии права) / В.В. Волков, Д.А. Скугаревский, К.Д Титаев // Социологические исследования - 2016. - № 1 (381). - с. 48-58.

3. Губа К. Большие данные в социологии: новые данные, новая социология? / К. Губа // Социологическое обозрение - 2018. - т. 17, № 1. - с. 213-236.

4. Замятина Н.Ю. Метод изучения миграций молодежи по данным социальных интернет -сетей: Томский государственный университет как "центр производства и распределения" человеческого капитала (по данным социальной интернет-сети "ВКонтакте") / Н.Ю. Замятина // Региональные исследования - 2012. - №2 (36). - с. 15-28.

5. Информационно-аналитические материалы по результатам проведения мониторинга эффективности деятельности образовательных организаций высшего образования // Департамент государственной политики в сфере высшего образования и молодежной политики Министерства науки и высшего образования Российской Федерации. -[Электронный ресурс] URL: http://indicators.miccedu.ru/monitoring/2019/index.php?m=vpo (дата обращения 25.07.2020).

6. Информация о социально-экономическом положении России // Федеральная служба государственной статистики - [Электронный ресурс] URL: https://rosstat.gov.ru/compendium/document/50800 (дата обращения 25.07.2020).

7. Китенко А.М. Может ли социология быть точной наукой? / А.М. Китенко // Философия и гуманитарный науки в информационном обществе - 2020. - № 2 (28). - с. 112-120.

8. На форуме «Открытые данные-2020» представили результаты проекта по изучению эмоциональной тональности сообщений студентов в соцсетях // Официальный сайт Университетского консорциума исследователей больших данных - [Электронный ресурс] URL: https://opendata.university/page13481895.html (дата обращения 30.10.2020).

Список литературы на английском языке / References in English

1. Babkina T. S. Traektoriia vypusknikov rossiiskikh vuzov na dannykh sotsial'nykh media. [Trajectory of Russian University Graduates Based on Social Media Data] / T. S. Babkina, V. L. Gojko, Yu. O. Mundrievskaya et al. // Upravlenie razvitiem krupnomasshtabnykh sistem (mlsd'2018): Materialy odinnadtsatoi mezhdunarodnoi konferentsii. [Managing the development of large-scale systems (mlsd ' 2018)]. Proceedings of the Eleventh International Conference]. Edited by S. N. Vasiliev, A.D. Tsvirkun. - M.: V.A. Trapeznikov Institute of Control Sciences, Academy of Sciences, 2018, pp. 489-491 [in Russian]

2. Volkov V. V. Problemy i perspektivy issledovanii na osnove Big Data (na primere sotsiologii prava) [Problems and Prospects of Research Based on Big Data (on the Example of the Sociology of Law)] / V. V. Volkov, D. A. Skugarevsky, K. D. Titaev // Sotsiologicheskie issledovaniia [Sociological Research]- 2016. - № 1 (381). - pp. 48-58 [in Russian]

3. Guba K. Bol'shie dannye v sotsiologii: novye dannye, novaia sotsiologiia? [Big Data in Sociology: New Data, New Sociology?] / K. Guba // Sotsiologicheskoe obozrenie [Sociological Review] -2018. - vol. 17, no. 1. - pp. 213-236 [in Russian]

4. Zamyatina N. Yu. Metod izucheniia migratsii molodezhi po dannym sotsial'nykh internet-setei: Tomskii gosudarstvennyi universitet kak "tsentr proizvodstva i raspredeleniia" chelovecheskogo kapitala (po dannym sotsial'noi internet-seti "VKontakte") [Method for Studying Youth Migration Based on Social Internet Networks: Tomsk State University as a" Center of Production and Distribution " of Human Capital (According to the Social Internet Network "Vkontakte")] / N. Yu. Zamyatina // Regional'nye issledovaniia [Regional Research] - 2012. - №2 (36). - pp. 15-28 [in Russian]

5. Informatsionno-analiticheskie materialy po rezul'tatam provedeniia monitoringa effektivnosti deiatel'nosti obrazovatel'nykh organizatsii vysshego obrazovaniia [Information and Analytical Materials on the Results of Monitoring the Effectiveness of Higher Education Institutions] // Departament gosudarstvennoi politiki v sfere vysshego obrazovaniia i molodezhnoi politiki Ministerstva nauki i vysshego obrazovaniia Rossiiskoi Federatsii. [Department of State Policy in Higher Education and Youth Policy of the Ministry of Science and Higher Education of the Russian Federation]. - [Electronic resource] URL: http://indicators.miccedu.ru/monitoring/2019/index.php?m=vpo (accessed: 25.07.2020). [in Russian]

6. Informatsiia o sotsial'no-ekonomicheskom polozhenii Rossii [Information on the Socioeconomic Situation in Russia // Federal'naia sluzhba gosudarstvennoi statistiki [Federal State Statistics Service] — [Electronic resource] URL: https://rosstat.gov.ru/compendium/document/50800 (accessed: 25.07.2020). [in Russian]

7. Kichenko A. M. Mozhet li sotsiologiia byt' tochnoi naukoi? [Can Sociology Be an Exact Science?] / A. M. Kitenko // Filosofiia i gumanitarnyi nauki v informatsionnom obshchestve [Philosophy and Humanities in the Information Society] -2020. - № 2 (28). - pp. 112-120 [in Russian]

8. Na forume «Otkrytye dannye-2020» predstavili rezul'taty proekta po izucheniiu emotsional'noi tonal'nosti soobshchenii studentov v sotssetiakh [The Results of a Project on Studying the Emotional Tone of Students' Messages in Social Networks At the "Open Data-2020" Forum] // Universitetskogo konsortsiuma issledovatelei bol'shikh dannykh [Official website of the University of the Big Data Consortium] [Electronic resource] URL: https://opendata.university/page13481895.html (accessed: 30.10.2020). [in Russian]

i Надоели баннеры? Вы всегда можете отключить рекламу.