Научная статья на тему '2017. 01. 007. Общественные науки и веб-ресурсы: от "скрытного" к междисциплинарному исследованию "больших данных" / боун Дж. , Эмиль Ч. , Абдул А. , Когхилл Дж. , Пан Уэй. The social Sciences and the Web: from "lurking" to interdisciplinary "big data" research / bone J. , Emele Ch. , Abdul A. , Coghill G. , Pang Wei. // methodological innovations. - 2016. - vol. 9. - p. 1-14. - doi:10. 1177/2059799116630665'

2017. 01. 007. Общественные науки и веб-ресурсы: от "скрытного" к междисциплинарному исследованию "больших данных" / боун Дж. , Эмиль Ч. , Абдул А. , Когхилл Дж. , Пан Уэй. The social Sciences and the Web: from "lurking" to interdisciplinary "big data" research / bone J. , Emele Ch. , Abdul A. , Coghill G. , Pang Wei. // methodological innovations. - 2016. - vol. 9. - p. 1-14. - doi:10. 1177/2059799116630665 Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
45
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕЖДИСЦИПЛИНАРНОЕ / ТРАНСДИСЦИПЛИНАРНОЕ ИССЛЕДОВАНИЕ / "БОЛЬШИЕ ДАННЫЕ" / ОНЛАЙН-ЭТИКА / ОБЩЕСТВЕННЫЕ НАУКИ / КОМПЬЮТЕРНЫЕ НАУКИ
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «2017. 01. 007. Общественные науки и веб-ресурсы: от "скрытного" к междисциплинарному исследованию "больших данных" / боун Дж. , Эмиль Ч. , Абдул А. , Когхилл Дж. , Пан Уэй. The social Sciences and the Web: from "lurking" to interdisciplinary "big data" research / bone J. , Emele Ch. , Abdul A. , Coghill G. , Pang Wei. // methodological innovations. - 2016. - vol. 9. - p. 1-14. - doi:10. 1177/2059799116630665»

своему. Во-вторых, исследовательская стратегия СМ не есть какая-то особая методологическая парадигма, основанная на некой особой философии, но представляет вполне рутинную практику научного исследования, которая сочетает эмпирический и теоретический уровни познания. В-третьих, несмотря на систематическую и глубокую интеграцию качественных и количественных подходов и данных в научной практике, почти нет попыток построить типологии такой интеграции или даже осмыслить эту интеграцию как тип исследования. В-четвертых, большинство научных исследований демонстрируют работу исследователей по сбору и анализу и качественных и количественных данных, не разделяя оба рода данных на отдельные исследовательские «линии». В-пятых, заметная особенность интегрированных между собой качественного и количественного подходов - использование сочетания качественных и количественных данных в развитии исследовательских выводов. В-шестых, важно идентифицировать фактическое использование интегрированных между собой качественного и количественного видов анализа, а не полагаться только на заявления самих исследователей или на готовые исследовательские результаты (с. 19-21).

А.А. Али-заде

2017.01.007. ОБЩЕСТВЕННЫЕ НАУКИ И ВЕБ-РЕСУРСЫ: ОТ «СКРЫТНОГО» К МЕЖДИСЦИПЛИНАРНОМУ ИССЛЕДОВАНИЮ «БОЛЬШИХ ДАННЫХ» / БОУН Дж., ЭМИЛЬ Ч., АБДУЛ А., КОГХИЛЛ Дж., ПАН УЭЙ.

The social sciences and the web: From «lurking» to interdisciplinary «big data» research / Bone J., Emele Ch., Abdul A., Coghill G., Pang Wei. // Methodological innovations. - 2016. - Vol. 9. - P. 1-14. -D0I:10.1177/2059799116630665.

Ключевые слова: междисциплинарное / трансдисциплинарное исследование; «большие данные»; онлайн-этика; общественные науки; компьютерные науки.

Авторы из Великобритании поднимают ряд проблем, вставших перед социологической наукой в связи с появлением чрезвычайно интересной для социологии области «больших данных» -огромных массивов социологических данных, размещаемых в Интернете и легкодоступных для исследователя. С этим связаны эти-

ческие проблемы, касающиеся законности доступа к обширной персональной информации, а также проблемы сбора и анализа широчайшей и бесконечно разнообразной информации, представленной на всевозможных сайтах, форумах, в блогах и т.д. Поднимая такие проблемы, авторы ставят своей целью понять и описать новый инструментарий социологического исследования - инструментарий исследования онлайн.

В результате развития компьютерных технологий в их многообразном приложении и связанного с этим экспоненциального роста социальной коммуникации использование данных из Интернета практикуется в широком спектре областей научного исследования. Сегодня у социологической науки есть прямой интерес к он-лайн-исследованию и прежде всего интерес к позднейшему типу онлайн-исследования в форме так называемых «больших данных» (big data) (с. 1). Такое развитие представляется неизбежным, если видеть рост масштабов хранения информации, что становится главной особенностью Интернета и вызывает интерес его пользователей. Признано также, что этот новый и бурно растущий ресурс создает для социологов определенные вызовы, как и хорошие исследовательские возможности. Прежде всего ясно, что положение традиционного социологического исследования «пошатнулось» из-за возрастающей аналитической активности в отношении социологических данных со стороны коммерческих организаций. Кроме того, неуклонное возрастание сегодня значения Интернета как средства массовой коммуникации и количества мнений, комментариев и индивидуальных самопрезентаций уже радикально реформировало социальное взаимодействие / социальный обмен - базу общественной жизни, общественной динамики. Все это открывает огромные возможности для исследователей-обществоведов, которые вынуждены сейчас переоценивать не только свои методологические подходы к пониманию процессов социальной коммуникации и социального взаимодействия, но и сами теории общества.

В настоящее время происходит стремительная эволюция и самого цифрового ландшафта, и исследовательского инструментария, призванного в этот ландшафт вписываться. Исследователями уже пройден определенный путь от робкого вхождения в этот огромный виртуальный мир к полномасштабному сотрудничеству с учеными-компьютерщиками с целью более полной реализации ис-

следовательского потенциала богатого нового ресурса. Примерно 10 лет назад все начиналось с освоения таких ключевых платформ, притягивающих исследовательское внимание, как Фейсбук, Инста-грам и Твиттер, тогда они находились в «детском» возрасте и не имели публичного признания. Но уже и тогда эти платформы давали гораздо больше информации и гораздо меньшей ценой, чем было в эпоху до Интернета, причем даже при использовании традиционных (старых) исследовательских методов. Сегодня в распоряжении социолога, даже не имеющего финансирования и раньше с борьбой добивавшегося проведения интервью с маленькой выборкой респондентов, находятся сотни, тысячи, а то и миллионы (в случае с Твиттером) «респондентов» при явно меньших затратах усилий и времени. Признано также, что скрытное присутствие исследователя на форумах в Интернете помогает избежать проблем, связанных с эффектом «гало», неизбежно возникающим, когда респонденты знают, что они являются участниками исследования. Но и наоборот - в этой новой исследовательской реальности существует вопрос «честности» онлайн-респондентов, которые становятся для исследователя респондентами не по его выборке, а сами собой и которые поэтому вполне могут создавать ложные о себе впечатления без какого-либо исследовательского контроля. И это действительно большая проблема для работающего в виртуальном мире социолога. Самоотбирающиеся (self-selecting) группы респондентов могут формировать искаженное представление о проблемах, что сильно затруднит оценку исследовательских данных, если вообще не сделает ее невозможной. Вместе с тем, напротив, некоторые комментаторы развития реальности «больших данных» предполагают, что само по себе разрастание «больших данных», увеличение их многообразия и будут сводить указанные искажения к минимуму, делать эти искажения хотя и неизбежной, но несущественной статистической величиной.

Как ясно из дискуссий вокруг онлайн-этики, для онлайн-исследования наряду с возникновением новых дилемм остаются значимыми и некоторые вечные вопросы традиционного социологического исследования. Но не только цифровой ландшафт вместе с соответствующими исследовательской техникой и исследовательским умением претерпевает сегодня множественные метаморфозы; трансформируются и этические проблемы исследования.

Возникает важный вопрос: станет ли появление этого нового ресурса путем к лучшему пониманию общества и более рациональному принятию решений или приведет к эксплуатации и контролю со стороны властей, которые станут использовать инструмент «фетишизации и диктатуры данных» (с. 4)? Мир онлайн-данных рассматривается некоторыми экспертами по аналогии с «массовым обществом» середины XX в., когда его высокая атомизация, т.е. высокая степень отчуждения людей друг от друга - антипод общественных отношений доверия - давала элитам хорошую возможность манипулировать людьми, превращая индивида в «массового человека», человека толпы.

Наряду с тем что необходимо заботиться о возможном этичном (или неэтичном) использовании «больших данных», важно еще и видеть способность этих инструментов открывать новые горизонты в общественном развитии - решении управленческих, исследовательских проблем. Человек, общество всегда и по самой своей природе связаны с этическими проблемами. Любое технологическое преобразование общества имеет этическую составляющую, иначе человек перестал бы быть человеком, и вхождение современного общества в мир «больших данных» - не исключение. Например, с политической точки зрения, исследовательская техника сбора и анализа «больших данных» несет в себе разный потенциал. С одной стороны, открывая широкие пути для проявления общественного мнения, она способна вынуждать политиков к большей ответственности в отношении нужд и ожиданий избирателей, а с другой - напротив, может стать в руках тех же политиков средством манипулирования общественным мнением. Поэтому ничего нового в этике исследовательской работы с «большими данными» нет: «Любого масштаба использование исследовательской техники в конечном счете зависит от тех, кто ее использует, - от их этики. Они обязаны постоянно взвешивать свои действия с точки зрения последствий этих действий для онлайн-респондентов и общества в целом» (с. 4).

Ввиду стремительного развития компьютерных технологий и роста количества данных многое из социологической науки переходит в компетенцию компьютерных наук. Таким образом, формируется новое междисциплинарное поле исследований в области общественных наук, и формирующим это поле началом выступают

именно компьютерные науки. Исследовательский союз ученых-обществоведов и ученых-компьютерщиков представляется скорее трансдисциплинарным, нежели междисциплинарным, поскольку речь идет о сотрудничестве разного рода наук.

Что касается методологии исследования в трансдисциплинарной области, то есть основания сфокусироваться на данных Твиттера - платформы, признаваемой социологами. Социальная сеть Твиттера - гибкая коммуникативная структура: пользователи могут включать хэштеги (ключевые слова с прибавлением символа «#») в свои твиты, чтобы сделать сообщения видимыми для тех, кто следит за хэштегом. Решающее в платформе Твиттера то, что хэштеги обеспечивают механизм общения пользователей, связи между ними, даже если эти пользователи уже не «следят» друг за другом в социальной сети. Главная проблема исследователя коммуникации в Твиттере - охватить исчерпывающую или по крайней мере репрезентативную выборку твитов, связанных с исследуемым событием или сообществом. Эта проблема может быть решена довольно просто - с помощью выборки твитов, содержащих хэштеги на тему исследования. Твиттер обеспечивает доступ к твитам посредством двух ключевых элементов своего «приложения, программирующего интерфейс» (application programming interface) (ППИ): ППИ-поиска и ППИ-потока. Из этих двух элементов первый используется для нахождения прошлых твитов (по ключевым словам / хэштегам, отправителям и т.д.). Причем ППИ-поиск будет находить лишь ограниченное число твитов, он не даст весь их архив, например твиты, содержащие специфические хэштеги. К тому же существуют запрограммированные ограничения на количество ключевых слов или запросов пользователей в единицу времени. Если ППИ-поиск фокусируется на прошлом контенте, ППИ-поток, напротив, используется для подписки на непрерывный поток новых твитов, содержащих специфические ключевые слова. Но и в случае ППИ-потока имеются существенные ограничения на число пользователей или ключевых слов.

При этих ограничениях исследователю в его стремлении установить разумно широкий ряд данных в отношении исследуемого события нужно будет проследить за событием с того момента, когда оно произошло, иначе исследователь, пользующийся ППИ-поиском, рискует упустить важную раннюю информацию о собы-

тии, которую ППИ-поиск может не дать. Должна быть охвачена вся последовательность твитов либо с помощью ППИ-потока - подписки на идущий поток твитов, либо с помощью программы ППИ-поиск, используемой в режиме постоянного поиска позднейших прошлых твитов. Но даже и такой метод использования ППИ-поиска не может гарантировать исчерпывающий охват данных Твиттера. Кроме того, существует очень мало надежных средств для проверки данных на их достоверность, поскольку Твиттер не имеет такой программы. Тем не менее, несмотря на все эти ограничения, такое исследование остается весьма важным, поскольку в любом случае охватывает огромную выборку твитов - информацию, гораздо более содержательную, чем те данные, которые способен получить исследователь, применяющий стандартные методы социологического анализа.

Есть мнение, что, поскольку Твиттер и прочие онлайн-плат-формы социальной коммуникации относительно новые, соответственно, междисциплинарные подходы к качественному и количественному исследованию данных с этих платформ не стандартизированы, это не дает возможности воспроизводить такие исследования в схожих контекстах. Поэтому методология онлайн социологического исследования нуждается в детализации, чтобы показать ее применимость для всего спектра исследований в междисциплинарном / трансдисциплинарном поле сотрудничества общественных и компьютерных наук.

Требуемая детализация методологии должна основываться на том факте, что расшифровка, «добывание» мнений, высказываемых в текстах пользователей Интернета, - базовая задача аналитики в отношении сетей социальной коммуникации. Этот материал дает большинство платформ, использующих инструмент блогов, что позволяет пользователям выражать свои взгляды и мнения в единстве текста, образов и смысловых «картинок». Это и есть данные, собираемые аналитиком, который пропускает их через сито техник статистического и текстового анализа для выявления и сравнения между собой образцов коммуникации. Такой анализ обеспечивает инструменты описания активности в Твиттере, с помощью которых можно, например, определить частоту употребления искомых терминов / ключевых слов. Далее идентифицируются темы и создаются тематические модели, позволяющие осуществлять вероятност-

ное моделирование частот употребления значимых терминов. Можно также использовать техники анализа настроения (sentiment analysis techniques), содержащегося в анализируемых данных, для оценки позиций по определенным темам, связанным с ключевыми словами.

Нужно просто хорошо осознавать, подчеркивают авторы, и растущие возможности, и сложности этих междисциплинарных / трансдисциплинарных исследований нового типа, в которых стираются границы между дисциплинами, весьма далекими друг от друга по своим предметам, объединяются радикально разные научные интересы, методологические подходы, исследовательские умения, техники, дисциплинарные лексиконы. Надо понимать, что Интернет с его сетями социальной коммуникации поставил общественные науки перед необходимостью радикального изменения исследовательского инструментария, самой исследовательской коммуникации, со всеми вытекающими последствиями, главное из которых - формирование трансдисциплинарного исследовательского поля (объединения общественных и компьютерных наук) с ломкой многого в традиционной исследовательской практике, в том числе в сфере этики науки.

Действительно, пишут авторы в заключение, «сама пропасть между дисциплинарными практиками ученых-обществоведов, с одной стороны, и ученых-компьютерщиков - с другой, ставит тех и других перед необходимостью сотрудничать в сложившихся условиях, мотивируя к такому "странному" - трансдисциплинарному -сотрудничеству. Вместе с тем эти вызовы для ученых, которые привыкли существовать в комфортной зоне своих дисциплин, автономно друг от друга, сохраняются, и есть соблазн вернуться с новой исследовательской территории к испытанным и проверенным методам. Однако такое возвращение вполне может оказаться возвращением в никуда - порог невозврата для общественных наук уже пройден» (с. 13).

А.А. Али-заде

i Надоели баннеры? Вы всегда можете отключить рекламу.