УДК 316.1
DOI 10.18522/2227-8656.2022.2.3
BIG DATA И НОВЫЕ ЗАДАЧИ СОЦИОЛОГИИ
© 2022 г.
Л. Ш. Крупеникова*
* Институт социологии и регионоведения Южного федерального университета, г. Ростов-на-Дону, Россия
Целью исследования: характеристика экспертных оценок и аналитический обзор результатов использования больших данных (big data) как массивов социологической информации, дающих возможность определить новые перспективные методы построения социологического знания.
Методологическая база исследования.
Основными и исследовательскими методами являются методы концептуального анализа экспертных оценок, методы сравнения, обобщения и генерализации выводов, методы систематизации результатов оценочных экспертиз, методы интеграции данных, методы прогнозной аналитики, выражающиеся в классификации разных не связанных между собой оценок.
Результаты исследования. В статье показано, что массивы информации в виде больших данных становятся важными социологическими исходными данными, дают возможность более полного изучения социальной динамики, создания на их основе новых динамических моделей социальной реальности, соразмерных цифровой информации, а также становятся основой формирования новой социологической теории - теории цифровой социологии. Для нее возникают новые методологические вызовы, требующие обоснования новых методов исследования и пере-
Тип статьи в журнале - научная
BIG DATA AND NEW TASKS OF SOCIOLOGY
© 2022 L. Sh. Krupenikova*
* Institute of Sociology and Regional Studies, Southern Federal University, Rostov-on-Don, Russia,
Objective of the study is to characterize expert assessments and an analytical review of the results of Big Data use as arrays of sociological information that make it possible to use digital methods for its processing.
The methodological basis of the research.
The main and research methods are methods of conceptual analysis of expert assessments, methods of comparison, generalization of conclusions, methods of systematization of the results of evaluation examinations, methods of data integration, methods of predictive analytics, expressed in the classification of different unrelated assessments.
Research results. The article shows that large amounts of information in the form of Big Data become important sociological initial data, make it possible to more fully study social dynamics, create new dynamic models of social reality, commensurate with digital information on its basis, and become the basis for the formation of a new sociological theory - the theory of digital sociology. For it, new methodological challenges are identified that require the substantiation of new research methods and rethinking of tools and conceptual apparatus, for example, such as network and neural modeling, thematic modeling, automatic generation
осмысления инструментария и понятийного аппарата, например, такие как сетевое и нейронное моделирование, тематическое моделирование, автоматическое генерирование гипотез, интеграция мультимодаль-ных данных, операционализация ключевых концептов, символизация и цифрови-зация социологического дискурса, фрей-мирование и кластеризация знаний, методы визуализации в репрезентации объяснительных процедур, реляционный анализ значений, символическая обработка естественного языка и др.
Перспективы исследования. Цифровая социология позволяет изучать паттерны поведения человека в связи с гораздо большими, чем это было ранее, формами обусловленности: как в реальных условиях, реальном времени, так и в различных условиях виртуальности, как в форме события, так и в формах намерения, действия или даже эмоции.
Ключевые слова: big data (большие данные), большие массивы информации, модели социальной действительности, циф-ровизация, цифровая социология
of hypotheses, integration of multimodal data, key concepts operationalization, symbolization and digitalization of sociological discourse, framing and clustering of knowledge, visualization methods in the representation of explanatory procedures, relational analysis of meanings, symbolic processing of natural language and others.
Prospects of the study. Digital sociology makes it possible to study the patterns of human behavior in connection with much larger forms of conditionality than it was previously: both in real conditions, real time, and in various conditions of virtuality, both in the form of an event and in the forms of intention, action or even emotion.
Keywords: Big Data, large amounts of information, models of social reality, digitalization, digital sociology
Термин big data (большие данные), появление которого обязано эксперту К. Линчу (Линч, 2008), означает систематически структурированные и бессистемные неструктурированные разнообразные данные, которые характеризуются огромным и постоянно пополняемым объемом различной многопрофильной информации, обрабатываемой с помощью специальных программных инструментов и технологий.
Источниками больших данных являются блоги, социальные сети, сайты, форумы, СМИ, корпоративные архивы, многообразные транзакции, различные профессиональные базы данных, в том числе показания разнообразных считывающих устройств, данные геолокации, метеорологии, сотовой связи и т. д.
Большие данные связаны с оцифровкой огромных массивов информации и вообще с цифровыми технологиями. Одним из первых, кто обратился к цифровым технологиям, был американский социолог из Массачусетского технологического института Ш. Теркл, написавший о развивающихся благодаря цифровым технологиям отношениях в социуме (Turkle, 1995). К настоящему времени большие данные, согласно
международной компании McKinsey, а также оценкам таких экспертов, как П. Бихани, З. Вишант, А. Гандоми, М. Камаль, С. Патиль и М. Хайдер, включают в себя не только огромный массив цифровой информации, но также и методы обработки данных: краудсорсинг (классификация), интеграцию данных (data fusion and integration), машинное обучение, сетевой анализ с использованием генетических алгоритмов (genetic algorithm), распознавание образов, прогнозную аналитику, имитационное моделирование (simulation), пространственный анализ (spatial analysis), статистический анализ, визуализацию аналитических данных (Bihani, 2014; Gandomi, 2015; Kamal, 2017).
Большие данные стали также массивом важной социологической информации, которая позволяет не только изучать многомерную социальную динамику, строить прогностические модели и анализировать различные данные, но и разрабатывать новые социологические методы обработки больших объемов социальной информации, а также развивать социологическую теорию в новых форматах, таких как цифровая социология и визуальная социология. Вместе с этим возникли новые вопросы критериев репрезентативности информации больших данных и риска использования недостоверной информации, приводящего к некорректным выводам и прогнозам. Все это делает изучение больших данных как социологической информации важной и актуальной исследовательской задачей.
Решение такой задачи станет возможным, если осуществляется трансформация традиционных моделей социальной реальности в новые модели, которые должны быть соразмерны с теми мерами измерения, которыми являются цифры больших данных. В результате на смену каузальным моделям должны прийти модели нового типа, что, естественно, потребует и новых интерпретаций этих моделей, новых методов и новой теории, которой является цифровая социология как доказательная социальная наука. И на этом пути возникают непростые вопросы, например, как анализировать и интерпретировать эти данные? Не приведут ли эти данные к переосмыслению моделей социальной реальности? И наконец, вопрос о том, нужны ли новые теории и какими они будут?
В этом плане большой шум наделала статья К. Андерсона с очень красноречивым заглавием «Конец теории. Поток данных делает научный метод устаревшим». В ней он пишет о кризисе социологической теории, построенной на гипотетических моделях, проверяемых эмпирически, а также логической индукцией и дедукцией. Теперь, с его точки зрения, все это ушло в прошлое: при достаточном количестве данных цифры репрезентируют лучше, т. е. традиционные причинно-
следственные отношения, объясняющие мир, заменяются отношениями между цифрами. Поэтому требуется новая теория, новые методы и новые, в частности, цифровые, вычислительные общественные и гуманитарные науки (Anderson, 2008).
Ответом на вызов, брошенный К. Андерсоном, уже послужила дискуссия в социологии о роли больших данных как достоверной, репрезентативной и валидной социологической информации. По этому поводу был достаточно большой разнобой мнений и оценок. Например, по мнению Л. Раснянски, использование больших данных должно привести к полному пересмотру теории социального знания в той части, которую выделил еще Б. Латур, предложив унификацию моделей социальной реальности, которая с развитием больших цифровых данных делает различие микро- и макрофеноменов несущественным, а то и излишним (Resnyansky, 2019; Latour, 2012).
«Перчатка», брошенная К. Андерсоном, была подхвачена как отечественными (А.В. Одинцов, С.И. Платонова), так и зарубежными (Х. Луи, Дж. Фан, Ф. Хан) экспертами, по мнению которых ложные корреляции, подменяющие традиционно понимаемые причинно-следственные отношения, возникают по следующим причинам: это большое количество случаев самовоспроизводящихся цифровых отношений и ошибки, производные от этого, которые могут быть связаны с так называемым случайным цифровым шумом, а также со смещением выборки, ошибок измерения и сопоставления (Одинцов, 2017; Платонова, 2018; Fan, 2014).
ТЛ __W W
В соответствии с этим должно произойти изменение моделей социальной реальности: они должны быть соразмерны с теми мерами измерения, которыми являются цифры как основа информации больших данных. Вследствие этого на смену каузальным моделям должны прийти модели нового типа, что, естественно, требует и новых интерпретаций этих моделей. Собственно, это и есть выход на теории нового типа, а именно цифровую социологию, цифровую антропологию, цифровую культурологию и т. п. (Одинцов, 2017). В настоящее время цифровая социология (англ. digital sociology) понимается как субдисциплина, ориентированная на использование цифровых средств и информационных технологий для анализа массовой информации.
Терминологически, как название доказательной общественной науки, цифровая социология впервые появилась в научной статье Дж. Винна в 2009 г. (Wynn, 2009). В 2012 г. Д. Лаптон определила четыре раздела цифровой социологии: профессиональная цифровая практика; социологический анализ использования цифровых технологий; цифро-
вой анализ данных (использование цифровых данных для социальных исследований, количественных или качественных); критическая цифровая социология (проведение рефлексивного и критического анализа цифровых медиа, основанных на социальной и культурной теории).
В работах отечественных исследователей, таких как И. Ф. Девятко,
B. И. Дудина, Д. И. Юдина, эти разделы получили развитие и представили модели использования цифровых мультимедиа в социологической практике (Девятко, 2016; Дудина, 2017). Первая книга под названием «Цифровая социология» была опубликована Д. Лаптон в 2015 г. В этой книге Д. Лаптон дала развернутое представление о цифровом обществе, исследовала преимущества и возможности, предлагаемые цифровыми технологиями, осуществила переосмысление методологии социологических исследований в эпоху цифровых технологий, дала характеристику так называемой критической цифровой социологии, которая представляет собой изучение общества, сфокусированное на необходимости социальных изменений и направленности данных изменений, и определила цифровую политику как вовлечение граждан в цифровую деятельность (Лаптон, 2015).
В 2017 г. Н. Марес дополнила разделы цифровой социологии, выделив пятое направление в виде публичной цифровой социологии, ориентированное на изучение публичной социальной активности (Marres, 2017). За цифровой социологией окончательно закрепилась репутация «вычислительной социальной науки» (computational social science), а это означает, что поведение человека изучается прежде всего при помощи больших данных, способов обработки больших массивов информации и анализа данных, по крайней мере на этом сходятся и отечественные эксперты, такие как К. Губа, В. Ф. Ницевич, и зарубежные, в числе которых
C. Арал, А.-Л. Барабпси, Д. Бревер, Т. Джебара, Д. Лазер и др. (Губа, 2018; Ницевич, 2018; Lazer, 2009).
В соответствии с этим предлагается заменить традиционную социологию на цифровую доказательную социальную науку, которая основывается на больших данных, на разработанных в этой сфере аналитиках и методах автоматизированной обработки больших массивов информации. Это позволит, используя инструменты компьютерных наук, изучать паттерны поведения человека в связи с гораздо большими, чем это было ранее, формами обусловленности, при этом как в реальном времени, так и в различных условиях виртуальности, как в форме события, так и в форме намерения, действия или даже эмоции, для чего предлагается целый набор методов, таких как сетевое и нейронное моделирование, тематическое моделирование, автоматическое генерирование
гипотез, интеграция мультимодальных данных, операционализация ключевых концептов, символизация и цифровизация социологического дискурса, фреймирование и кластеризация знаний, методы визуализации в репрезентации объяснительных процедур, реляционный анализ значений, символическая обработка естественного языка и др.
Замену традиционной социологии на цифровую доказательную социальную науку ряд исследователей, например Р. Берроуз, М. Сэвидж, называют кризисом в социологии и рассматривают big data как новый методологический вызов, требующий переосмысления всего инструментария и понятийного аппарата социологии (Берроуз, 2016).
Литература
Берроуз Р. , Севидж М. После кризиса? Bigdata и методологические вызовы эмпирической социологии // Социологические исследования. 2016.№ 3. С. 28-35.
Губа К. Большие данные в социологии: новые данные, новая социология? // Социологическое обозрение. 2018. Т. 17, № 1. С. 213-234.
Девятко И. Ф. От «виртуальной лаборатории» до «социального телескопа»: метафоры тематических и методологических инноваций в онлайн-исследованиях // Он-лайн-исследования в России: тенденции и перспективы / под ред. А. В. Шашкина, И. Ф. Девятко, С. Г. Давыдова. М.: Типография, 2016. С. 19-33.
Дудина В.И., Юдина Д.И. Извлекая мнения из сети Интернет: могут ли методы анализа текстов заменить опросы общественного мнения? // Мониторинг общественного мнения: экономические и социальные перемены. 2017. № 5. С. 63-78.
Ницевич В. Ф. Цифровая социология: теоретико-методологические истоки и основания // Цифровая социология. 2018. Т. 1, № 1. С. 18-28.
Одинцов А. В. Социология общественного мнения и вызов Big Data // Мониторинг общественного мнения: экономические и социальные перемены. 2017. № 3. С.30-43.
Платонова С. И. Эпистемические объекты и социальные отношения в современном обществе // Вестник Ленинградско-
References
Burroughs, R., Savage, M. (2016). After the Crisis? Big data and methodological challenges of empirical sociology // Sotsiolog-icheskiye issledovaniya, 3, 28-35. (In Russian).
Guba, K. (2018). Big data in sociology: new data, new sociology? Sotsiolog-icheskoye obozreniye, 17, 1, 213-234. (In Russian).
Devyatko, I. F. (2016). From "virtual laboratory" to "social telescope": metaphors for thematic and methodological innovations in online research. Online research in Russia: trends and prospects. In A.V. Shashkin, I.F. Devyatko, S.G. Davydov (Eds.). Moscow: Typography Publ., 19-33. (In Russian).
Dudina, V.I., Yudina, D.I. (2017). Extracting opinions from the Internet: can text analysis methods replace public opinion polls? Monitoring obshchestvennogo mneniya: ekonomicheskiye i sotsial'nyye peremeny, 5, 63-78. (In Russian).
Nitsevich, V. F. (2018). Digital Sociology: theoretical and methodological origins and foundations. Tsifrovaya sotsiologiya, 1, 1, 1828. (In Russian).
Odintsov, A. V. (2017). Sociology of public opinion and the challenge of Big Data. Monitoring obshchestvennogo mneniya: ekonomicheskiye i sotsial'nyye peremeny, 3, 30-43. (In Russian).
Platonova, S. I. (2018). Epistemic objects and social relations in modern society.
го государственного университета им. А. С. Пушкина. 2018. № 3-1. С. 114-123.
Anderson C. The End of Theory: The Data Deluge Makes the Scientific Method Obsolete // Wired. 2008. 23 June. Available at: https://www.wired.com/2008/06/pb-theory/.
Bihani P., Patil S. T. A comparative study of data analysis techniques // International Journal of Emerging Trends & Technology in Computer Science. 2014. № 3 (2). Р. 95-101.
Gandomi A., Haider M. Beyond the hype: Big data concepts, methods, and analytics // International Journal of Information Management. 2015. № 35 (2). Р. 137-144.
Kamal M., Vishanth Z. Critical analysis of Big Data challenges and analytical methods // Journal of Business Research. 2017. Vol. 70. Р. 263-286. https://doi.org/10.1016/jjbusres. 2016.08.001.
Latour B., Jensen P., Venturini T., Grauwin S., Boullier D. "The Whole Is Always Smaller than Its Parts" - a Digital Test of Gabriel Tardes' Monads // The British Journal of Sociology. 2012. Vol. 63, № 4. P. 590-615.
Lazer D., Pentland A., Adamic L., Aral S., Barabasi A-L., Brewer D., Christakis N., Contractor N., Fowler J., Gutmann M., Jebara T., King G., Macy M., Roy D., Van Alstyne M. Computational Social Science // Science. 2009. Vol. 323, № 5915. P. 721-723.
Lupton D. Digital sociology. Abingdon, Oxon. 2015. 230 p.
Lynch C.A. Big data: How do your data grow? // Nature. 2008. Vol. 455. № 7209. Р. 28-41.
Marres N. Digital sociology: The Reinvention of Social Research // Polity. Cambridge Press, 2017. 232 p.
Resnyansky L. Conceptual frameworks for social and cultural Big Data analytics: Answering the epistemological challenges // Big Data & Society. 2019. Vol. 6, № 1. P. 1-12.
Turkle S. Life on the screen: identity in the age of the Internet. New York: Simon & Schuster, 1995. 347 p.
Fan J., Han F., Liu H. Challenges of Big Data analysis // National Science Review. 2014. Vol. 1, № 2. P. 293-314. Available at: https:// www.ncbi.nlm.nih.gov/pmc/articles/
Vestnik Leningradskogo gosudarstvennogo universiteta im. A. S. Pushkina, 3-1, 114-123. (In Russian).
Anderson C. (2008). The End of Theory: The Data Deluge Makes the Scientific Method Obsolete. Wired. 23 June. Available at: https://www.wired.com/2008/06/pb-theory/.
Bihani, P., Patil, S. T. (2014). A comparative study of data analysis techniques. International Journal of Emerging Trends & Technology in Computer Science, 3 (2), 95101.
Gandomi, A., Haider, M. (2015). Beyond the hype: Big data concepts, methods, and analytics. International Journal of Information Management, 35 (2), 137-144.
Kamal, M., Vishanth, Z. (2017). Critical analysis of Big Data challenges and analytical methods. Journal of Business Research, 70, 263-286. https://doi.org/10.1016/jjbusres. 2016.08.001.
Latour, B., Jensen, P., Venturini, T., Grauwin, S., Boullier, D. (2012). "The Whole Is Always Smaller than Its Parts" - a Digital Test of Gabriel Tardes' Monads. The British Journal of Sociology, 63, 4, 590-615.
Lazer, D., Pentland, A., Adamic, L., Aral, S., Barabasi, A-L., Brewer, D., Christakis, N., Contractor, N., Fowler, J., Gutmann, M., Jebara, T., King, G., Macy, M., Roy, D., Van Alstyne, M. (2009). Computational Social Science. Science, 323, 5915, 721-723.
Lupton, D. (2015). Digital sociology. Abingdon, Oxon.
Lynch, C.A. (2008). Big data: How do your data grow? Nature, 455, 7209, 28-41.
Marres, N.(2017). Digital sociology: The Reinvention of Social Research. Polity. Cambridge Press.
Resnyansky, L. (2019). Conceptual frameworks for social and cultural Big Data analytics: Answering the epistemological challenges. Big Data & Society, 6, 1, 1 -12.
Turkle, S. (1995). Life on the screen: identity in the age of the Internet. New York: Simon & Schuster.
Fan, J., Han, F., Liu, H. (2014). Challenges of Big Data analysis. National Science Review, 1, 2, 293-314. Available at: https:// www.ncbi.nlm.nih.gov/pmc/articles/PMC
PMC 4236847/.
Wynn /.Digital sociology: emergent technologies in the field and the classroom // Sociological Forum. 2009. № 24 (2). P. 448456.
4236847/.
Wynn, J. (2009). Digital sociology: emergent technologies in the field and the classroom. Sociological Forum, 24 (2), 448456.
Для цитирования: Крупеникова Л. Ш. Big data и новые задачи социологии // Гуманитарий Юга России. 2022.2 (54). Т. 11. С.50-57. DOI 10.18522/2227-8656.2022.2.3
История статьи:
Поступила в редакцию - 24.03.2022 г. Получена в доработанном виде - 04.05.2022 г.
Одобрена - 11.05.2022 г.
Сведения об авторе
Крупеникова Лейла Шамильевна
Кандидат социологических наук, доцент кафедры прикладной социологии, Институт социологии и регионоведения Южного федерального университета
344006, г. Ростов-на-Дону,
ул. Пушкинская, 160,
e-mail: [email protected]
Information about author
Leyla Shamilyevna Krupenikova
Candidate of Sociological Sciences, Associate Professor, Institute of Sociology and Regional Studies, Southern Federal University
160 Pushkinskaya St., Rostov-on-Don, 344006, e-mail : [email protected]