Научная статья на тему 'Матрица данных как природный объект'

Матрица данных как природный объект Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
73
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Матрица данных как природный объект»

МАТЕМАТИКА В СОЦИОЛОГИИ: ФЕНОМЕНОЛОГИЧЕСКИЕ ЗАМЕТКИ

От автора

Эта авторская рубрика открывает серию эссе по теме «математика в социологии». Всем известно, что математические методы широко применяются в социологии. Но мало кто из социологов знает, что методы эмпирической социологии важны для понимания природы математики. И что без учета этого обстоятельства полноценное решение междисциплинарных проблем применения математики в социологии невозможно.

В планируемой серии небольших эссе я намерен шаг за шагом показать, как именно практика опросов позволяет понять природу таких разделов математики, как арифметика, теория вероятностей, логика. И связать это с решением проблем, с которыми сталкиваются социологи, применяя математические методы для анализа данных, полученных путем опросов.

Каждое эссе посвящено одной локальной теме. Например, природе социологических матриц данных. Или феноменологическим прототипам общеизвестных математических объектов в практике опросов. Или математической интерпретации социологической задачи кодификации ответов, данных респондентами. Или «научному мифу», будто разные коэффициенты статистической связи представляют разные методы измерения связи.

Я надеюсь на критические отклики читателей с учетом того, что точки зрения автора рубрики и редакции не обязаны совпадать.

С.В. ЧЕСНОКОВ

МАТРИЦА ДАННЫХ КАК ПРИРОДНЫЙ ОБЪЕКТ

Цель этих заметок — проследить, как именно математические объекты порождаются реалиями социологических опросов [1]. Методологически ничего нового. Можно даже не говорить об истории включения математических методов в социологию. Достаточно вспомнить, что методы современного математического анализа (в том

Чесноков Сергей Валерианович — старший научный сотрудник Института социологии РАН, научный директор компании «Контекст Медиа». Автор детерминационного анализа и детерминационной логики. Адрес: 117419 Москва, а/я 13. Телефон: +7(499) 132-36-11. Электронная почта: [email protected]

числе и те, что востребованы в социологии) возникли как следствие внимательного чтения «книги природы», которая, по словам Галилея (1564-1642) «написана на языке математики» [2].

Но Галилей имел в виду неживую природу. А мир социологических опросов — это мир феноменов, представляющих сознание людей. Вопросы, ответы, речь, тексты... Тоже природа, но другая. Другой мир. Наверняка и другая наука. В чем именно другая? Тем интереснее, следуя в русле идей Эдмунда Гуссерля (1859-1938) [3], отнестись к этому миру как к источнику математического знания.

Может быть, что-то станет яснее в том, как математика соотносится с гуманитарностью?

Матрица данных. Любой опрос это серия диалогов с повторяющимся вопросником. Сами диалоги и реплики, в них участвующие, очевидно, есть феномены сознания социолога и респондентов. Займемся ими как прообразами математических объектов, необходимых для социологии.

Когда опрос состоялся, корпус этих феноменов представлен пачкой заполненных анкет. Более выразительная и компактная форма записи первичных данных опроса имеет известный вид матрицы данных:

g Х1 Х2 Х т и

g 1 хп Х21 Хт1 и

g 2 Х12 Х22 Хт 2 и

g п Х1п Х2п Х тп и

(1)

Символы в клетках верхней строки представляют вопросы социолога, символы в клетках остальных строк — ответы респондентов.

Интересный факт: в матрице любого опроса есть два столбца с уникальными свойствами. В (1) это столбцы g , и . Столбец g замечателен тем, что в его клетках все п ответов g1,g2,...,gn физически попарно различны. Их часто считают уникальными именами опрошенных. В столбце и все ответы физически одинаковы, сводятся к ответу и, он символизирует выборку п респондентов как целое.

Так что минимальное число столбцов любой матрицы данных равно 2 (кроме вырожденного случая, когда п = 1). Число т > 0 прочих столбцов будем называть размерностью матрицы, а число респондентов п — ее объемом. Это просто объем выборки опрошенных.

Таблица (1) похожа на формальный объект. Но ее происхождение не имеет отношения к формальным вещам. Она порождена не чем-то внешним по отношению к опросам, а практикой диалогов.

Если принять, что каждый «сам себе социолог», то не так уж невероятно, что любой человек, говорящий на родном языке, оперирует в своем сознании огромным количеством матриц данных. Только

Чесноков С.В. Матрица данных как природный объект

129

маленьких, — скажем, т < 3, а п < 10. Такая гипотеза высказана в [4]. Если она справедлива, углубленное исследование свойств матриц может оказаться одновременно исследованием свойств сознания.

Но мы пока говорим лишь о социологических опросах. Матрица (1) представляет реалии опроса и только. Ничего внешнего.

Эта констатация чрезвычайно важна. Потому что если так, то в образе матриц данных мы имеем точку опоры для получения явно вне-личностных знаний об источнике социальных фактов, каким является опрос для социолога. К этому стоит отнестись серьезно. Ведь не мы же придумали диалоги. Они были основой языка до нас, будут и после.

Индивидуальная история опроса. У каждого опроса своя индивидуальная история. Матрица данных делит ее на две части — до матрицы данных и после. «До» — сам опрос, «после» — анализ полученных данных и описание результатов. Любой опрос своеобразный «коммуникативный круг», содержащий «перевод» обычного текста в матрицу данных и обратно. Как показано на рисунке 1.

_____Нацио5?л_ь?ьш_я_зьж_____

Инициатор опроса

Респонденты

Рис. 1. Схема социологического опроса

Слева: перевод обычного текста на язык матрицы данных.

Справа: перевод матрицы данных на обычный язык.

События «до» (слева на рисунке) и «после» (справа на том же рисунке) радикально различны по степени организованности и по типу взаимодействия с сознанием социолога.

Все, что «до», есть перевод социальной проблемы с обычного языка на язык диалогов, язык матрицы данных. Человека спросили, он ответил. Кажется просто, а на деле масса проблем. Интервьюер прочел в анкете одно, озвучил, как вопрос, другое, респондент услышал третье, подумал четвертое, ответил пятое, интервьюер услышал шестое, записал седьмое, в базу данных ушло восьмое, в отчет попало девятое [5]... Как в жизни: тьма событий. Что попадает в матрицу? Все учесть невозможно. Искажения неизбежны. Профессионализм социолога определяется умением учесть максимум того, чем формируется социальный факт [6]. И никакой математики. Либо она глубоко скрыта.

То, что «после», — это перевод с языка матрицы данных в текст отчета, статьи, доклада. Возврат в обычный язык. Именно здесь

5 «Социологический журнал», № 3

математика становится явной, в виде методов анализа данных. Центральные события в этой части коммуникативного круга — преобразования матрицы данных. Исключительное поле действия математических методов.

Если матрицы маленькие, математика скрыта. Метод перевода в текст отчета выглядит «неколичественным осмыслением». Такими «неколичественными методами» часто пользуются социологи, предпочитающие анкетированию живые диалоги во включенном наблюдении или неформализованном интервью. При внимательном рассмотрении — те же методы анализа данных, только выраженные средствами обычного языка.

Но когда вопросов десятки, а респондентов тысячи, а то и больше, математические методы становятся неизбежным помощником всякого, кто имеет дело с опросами такого масштаба. И тогда математика обнаруживает себя с очевидностью.

Вопрос: откуда она берется? Принято отвечать: из руководств по математической статистике. А в руководства она откуда попала? Если проявить настойчивость, может выясниться (судя по всему, не безумное предположение), что в конечном итоге источник математики в социологии — сами матрицы данных. Диалоги. Именно серии диалогов с повторяющимися вопросниками испокон веков, задолго до эры социологических опросов [7], формировали то, что принято называть «математической интуицией», приведшей математиков к таким понятиям, как арифметическая единица, переменная, значение переменной, функция, множество и мера на множестве (в частном случае — вероятность) [1].

Будучи природным объектом, матрица данных вместе с тем объект еще и математический [8]. Но об этом в следующем эссе.

ЛИТЕРАТУРА

1. Чесноков С.В. Феноменология диалогов в гештальт-теории, математике, логике. М.: URSS, 2008.

2. Галилей Г. Пробирных дел мастер / Галилей. Пер. с итал. Ю.А. Данилова; Отв. ред. Я. А. Смородинский. М.: Наука, 1987.

3. Гуссерль Эдмунд. Из статьи «Феноменология» в Британской энциклопедии / Пер. В.И. Молчанова // Логос. 1991. № 1.

4. Ротенберг В.С., Чесноков С.В. Виртуальность имен в процессе диалога в естественном языке // Известия АН СССР. Серия: Техническая кибернетика. 1986. № 5.

5. Рогозин Д.М. Когнитивный анализ опросного инструмента. М.: Институт Фонда «Общественное мнение», 2002.

6. Садмен С., Брэдберн Н. Как правильно задавать вопросы. М.: Институт Фонда «Общественное мнение», 2002.

7. Докторов Б.З. Первопроходцы мира мнений: от Гэллапа до Грушина. М.: Институт Фонда «Общественное мнение», 2005.

8. Чесноков С.В. Метаматрицы в логике натуральных текстов // Социологический журнал. 2003. № 2.

i Надоели баннеры? Вы всегда можете отключить рекламу.