Научная статья на тему 'Уважительный операционализм'

Уважительный операционализм Текст научной статьи по специальности «Психологические науки»

CC BY
132
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
измерение / операциональные определения / операционализм / психометрия / реализм

Аннотация научной статьи по психологическим наукам, автор научной работы — Э. Вессонен

Во-первых, я утверждаю, что в современных дебатах об операционализме есть три основных течения. Это: (а) методологи, критикующие операционализм как философию, (б) психологи, которые практикуют операционализацию, которая якобы философски неопределённа, и (в) критики, утверждающие, что методы валидации обязывают психологов к более сильному операционализму, чем думают психологи. Затем я описываю уважительный операционализм и утверждаю, что он позволяет избежать основных критических замечаний операционализму, но при этом включает некоторые эпистемологические преимущества операционных определений. Я показываю, как уважительный операционализм согласуется с другими дружественными к операционализму теориями, такими как теория обобщаемости и основанный на аргументах подход Майкла Т. Кейна к валидности.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Уважительный операционализм»

Э. Вессонен Уважительный операционализм*

Сведения об авторе

*Vessonen, E. Respectful operationalism. Theory & Psychology, vol. 31, 1: pp. 84-105. , First Published August 27, 2020. Перевод с англ. В. Мединцев

Аннотация. Во-первых, я утверждаю, что в современных дебатах об операционализме есть три основных течения. Это: (а) методологи, критикующие операционализм как философию, (б) психологи, которые практикуют операционализа-цию, которая якобы философски неопределённа, и (в) критики, утверждающие, что методы валидации обязывают психологов к более сильному операционализму, чем думают психологи. Затем я описываю уважительный операционализм и утверждаю, что он позволяет избежать основных критических замечаний операционализму, но при этом включает некоторые эпистемологические преимущества операционных определений. Я показываю, как уважительный операционализм согласуется с другими дружественными к операционализму теориями, такими как теория обобщаемости и основанный на аргументах подход Майкла Т. Кейна к валидности.

Ключевые слова: измерение, операциональные определения, операционализм, психометрия, реализм

Цитирование: Вессонен Э. Уважительный операционализм. Теоретичш дотдження у психологи: монографiчна серiя. Сост. В.О. Медшцев. Том 16. 2022. С. 2-34. doi: 10.24412/2616-6860-2022-2-2-34.

Вообще говоря, есть два аспекта истории операцио-нализма1 в психологии. С одной стороны, есть история операционализма как философского тезиса - история, которая выглядит примерно так: Операционализм вырос из работы Перси В. Бриджмена, американца, который впоследствии получил Нобелевскую премию за свою работу по физике высоких давлений. Наблюдения Бриджмена за путаницей понятий в физике привели его к мысли, что полезно связать значение понятия с эмпирической операцией, используемой для фиксации этого понятия. Вскоре операционализм привлек некоторых из самых известных психологов, экономистов и философов первой половины 20-го века, от С.С. Стивенса и Б.Ф. Скиннера до Карла Хемпеля и Пола Самуэльсона. Несколько философски настроенных светлых умов предлагали и обсуждали разные версии операциона-лизма в течение двух десятилетий, но как они ни старались, операционализм казался фатально ошибочным. К середине 1950-х Бриджмен почувствовал, что он «создал Франкенштейна» (цит. по Chang, 2009; цит. по Frank, 1956), и многие энтузиасты отказались от операционализма. Многие современные комментаторы называют операционализм ошибочной, неработоспособной и мёртвой философией (Lovett & Hood, 2011;

Maul, 2017; Meehl, 1995). Худ, 2011; Мол, 2017; Мил, 1995). Худ, 2011; Мол, 2017; Мил, 1995).

Другая сторона этой истории связана с психологической практикой, то есть с историей операционализма, который определяет способ, которым психологи строят, подтверждают и используют измерения психологических атрибутов. Точную природу практики операциона-лизма современных психологов трудно определить, в основном потому что люди редко объявляют себя опе-рационалистами. Вместо того чтобы обсуждать изм, психологи сосредотачиваются на деятельности: опера-ционализации, процессе определения своих целевых понятий в измеримых терминах. Такие учебники, как «Методы исследования и статистика в психологии» Ку-ликана (2014 г.), «Методы исследования и статистика в психологии Хаслама и МакГарти» (2003 г.), а также «Методы психологических исследований» Эванса и Руни (2011) сообщают изучающим психологические измерения, что операционализация является важным шагом на пути к высококачественным исследованиям (особенно Coolican, 2014, с. 37). Хотя, возможно, нет единого мнения о том, как следует проводить операционализа-цию в психологии (Slife et al., 2016), это, несомненно, деятельность, которая пронизывает все психологические исследования.

Без подробностей может показаться, что здесь мы можем иметь две отдельные истории научного (или философского) прогресса: с одной стороны, историю отвергнутой после тщательного анализа философской теории (операционализма), а с другой стороны, история экспериментальной деятельности (операционализа-ции), которая живет, потому что выдержала испытание временем и научную проверку. Но ситуация осложняется тем, что современных психологов обвиняют в необоснованном, эпистемически сомнительном операци-онализме (Borsboom, 2006; Maul, 2017; McGrane, 2015; Michell, 2008). Например, Мичелл (2008, особенно с. 10) утверждает, что операционализм - это способ для психологов скрыть свое незнание природы их целевого атрибута. Что происходит? Практикуют ли психологи неработоспособный операционализм? Или критики неправильно диагностируют современную психологию? Какова связь между операционализацией в современной психологии и якобы мёртвой операционалист-ской философией?

Моя первая цель в этой статье - прояснить статус текущих дебатов об операционализме. Я утверждаю, что в современных дебатах есть три основных течения. Во-первых, есть методологи, критикующие описанную выше операционалистскую философию. Во-вторых,

есть психологи, практикующие вышеописанную опера-ционализацию, предполагая, что эта деятельность философски ни к чему не обязывает. В-третьих, и это наиболее важно, есть те, кто критикует психологов за то, что они скатываются к операционализму, который является более требовательным и менее оправданным, чем думают психологи. Сопоставление этих трех точек зрения показывает, что споры об операционализме не разрешены.

Во второй аргументативной части этой статьи я определяю и защищаю новый тип операционализма, который я называю уважительным операционализмом. Грубо говоря, уважительный операционализм - это точка зрения, согласно которой психологи могут определять целевое понятие в терминах теста (например, «интеллект - это то, что проверяется тестом»), если этот тест подтверждается и включает общие коннотации целевого понятия и применимость меры. Я утверждаю, что уважительный операционализм включает в себя некоторые из основных преимуществ операционалист-ского мышления, одновременно защищая от сползания к тому типу операционализма, против которого предостерегают критики.

Статья продолжается следующим образом. В следующем разделе представлена краткая история операциона-лизма. Затем в статье анализируются современные дебаты об операционализме. После этого в статье

Краткая история

Операционализм означает несколько вещей. Для некоторых это теория значения: она говорит нам, что означает выражение «Билл в депрессии». Для других это эвристика исследования: она говорит нам, как определить, находится ли Билл в депрессии. Для третьих опе-рационализм - это метафизический тезис: он говорит нам, что такое депрессия, например, что депрессия -это телесное состояние (ср. Flanagan, 1980). Поскольку у этого термина так много значений, легко неправильно обозначить идеи авторов относительно операциона-лизма2. Таким образом, в этом кратком историческом обзоре я воздержусь от классификации идей, которые были обозначены термином операционализм. После исторического обзора я остановлюсь на более точных определениях.

Перси Бриджмена обычно считают отцом операцио-нализма (Chang, 2009). Его самая известная и чаще всего критикуемая декларация операционализма появилась в

определяется и защищается уважительный операциона-лизм. Следующий раздел отвечает на возражения, а последний раздел подводит итоги.

его книге «Логика современной физики» (1927): «Вообще под любым понятием мы подразумеваем не что иное, как набор операций; понятие синонимично соответствующему набору операций» (с. 5).

Это утверждение было прочитано как радикально редукционистская теория значения: в значении таких понятий, как длина, нет ничего, кроме операций, используемых для измерения этих понятий. Но некоторые комментаторы считают, что это неверное истолкование и что на самом деле Бриджмен защищал менее радикальный операционализм (см., например, Garner et al., 1956). Согласно Чангу (2017b), менее радикальный опе-рационализм Бриджмена поддерживает мнение о том, что учёные должны быть осторожны, чтобы не предполагать, что разные операции измеряют одно и то же, даже если к двум операциям применяется одно и то же имя или термин.

Одной из главных причин, по которой Бриджмен выбрал операционализм, было его желание сделать

науку «безопасной». Бриджмен считал, что до революции Эйнштейна физика страдала от концептуальной путаницы, возникшей в результате нерефлексивного распространения старых понятий на новые области исследований (Chang, 2009). По словам Бриджмена, опе-рационализм защитит от таких нерефлексивных расширений, тем самым сделав ученых менее уязвимыми для концептуальной путаницы.

Однако понятие безопасности Бриджмена не единственное, связанное с операционализмом. Многие психологи считали, что операционализм обеспечит межсубъективное согласие и повторяемость выводов. С этой точки зрения, определение понятий в терминах операций предназначено для устранения ошибок и разногласий, которые обычно сопровождают выводы относительно неоперациональных понятий. Халл (1968) резюмирует стремление к безопасности следующим образом: «Если научное понятие синонимично набору операций, и если эти операции таковы, что их может публично выполнять любое квалифицированное лицо, то интерсубъективность и повторяемость, столь важные для объективности науки, гарантируются. (с. 438-439).

Карл Хемпель, Герберт Фейгл и другие логические эмпирики были заинтригованы операционализмом

Бриджмена. Операционалистский акцент на наблюдаемости и проверяемости находил отклик у логических эмпириков, которые пытались поставить язык науки на прочную, проверяемую или подтверждаемую основу. Рудольф Карнап мечтал о языке науки, в котором все утверждения либо поддаются проверке бесспорными средствами наблюдения, либо сводятся к утверждениям, поддающимся проверке таким образом. Однако операционализм отличался от логического эмпиризма в отношении единицы анализа: там, где операциона-лизм сосредоточивался на значении понятий, логический эмпиризм обычно рассматривал эмпирическое значение утверждений (Хемпель, 1954). Тем не менее, сторонники двух подходов дискутировали и обменивались идеями.

Семена операционалистского мышления были посажены задолго до того, как Бриджмен сформулировал свой операционализм и до того, как с ним столкнулись логические эмпирики. В своей статье «Как сделать наши идеи ясными» (1878 г.) Ч.С. Пирс выразил идеи, которые перекликаются с более поздним операционализмом, утверждая, что наше представление об объекте состоит из эффектов, которые оказывает этот объект. Склонность к операционализму также скрыта в том, что стало известно как бихевиоризм. В своей статье 1913 года

Джон Б. Уотсон ввёл бихевиоризм в качестве реакции на фрейдистскую психологию, которая фокусировалась на сознании и других ненаблюдаемых атрибутах3. Уотсон (1913) полагал, что психологам пора прекратить апеллировать к сознанию и другому ненаблюдаемому, так как нет согласия в том, что такого рода понятия обозначают и как их изучать: «Кажется, настало время, когда психология должна отказаться от всех ссылок на сознание; когда ей больше не нужно обманывать себя, думая, что она делает психические состояния объектом наблюдения» (с. 163).

Вместо этого, по словам Уотсона, психологи должны сосредоточиться на наблюдаемых изменениях в поведении. В частности, бихевиористская психология Уот-сона состоит из отчётов о реакциях в экспериментальных условиях - например, о том, как люди реагируют на визуальные стимулы или слова в тесте памяти. Опера-ционалистский привкус здесь очевиден, потому что память, зрение и другие психологические способности изучаются и описываются в терминах поведения в тестовых условиях, что является своего рода операцией4.

Уотсон в своём описании бихевиоризма 1913 года сосредоточил внимание не на том, что внутренних состояний не существует, а на том, что выводы о внутрен-

них состояниях более противоречивы, чем отчёты о поведении. Два человека могут легко согласиться с ответами пациента на личностный тест, но не согласиться с тем, что эти ответы означают с точки зрения личности пациента и его психического здоровья. Сосредоточение внимания на поведении сделает психологию более прозрачной и доступной и, следовательно, более полезной для других человеческих начинаний, по словам Уотсона: «Если бы психология следовала предложенному мной плану, педагог, врач, юрист и бизнесмен могли бы использовать наши данные. практически, как только мы сможем экспериментально получить их» (1913, с. 168).

Однако собственно операционализм появился в психологии примерно 20 лет спустя, в середине 1930-х годов5. Одним из самых влиятельных его первых сторонников был гарвардский психолог Стэнли Смит Стивенс. Стивенс, который работал в рамках психофизической традиции, изучая, например, субъективный слуховой опыт, цитировал Карнапа и Бриджмена в своих работах по операционализму. Стивенс изучал, как различные свойства тона зависят друг от друга, например, как субъективное восприятие громкости тона зависит от интенсивности и частоты тона. В одном из эксперимен-

тов Стивенса участники слышали два тона разных частот и регулировали интенсивность одного из них до тех пор, пока громкость двух тонов не воспринималась как одинаковая (Stevens, 1934). Затем Стивенс мог определить субъективное ощущение объёма с точки зрения этой операции. То есть субъективное переживание объёма может быть определено в терминах суждений о различии и равенстве, которые участники делают, когда их помещают в только что описанную экспериментальную обстановку (см. Stevens, 1935). Мотивация Стивенса (1935) для такого операционалистского подхода была сродни мотивации Уотсона: сделать психологию и другие науки общедоступными и воспроизводимыми, а тем самым объективными (с. 522).

Работа Стивенса положила начало дискуссиям о месте операционализма в психологической методологии. Журнал Psychological Review предложил платформу для многих статей об операционализме в конце 1930-х и начале 1940-х годов, и эти обсуждения завершились симпозиумом в 1945 году. Среди участников симпозиума были психологи-бихевиористы (например, Б. Ф. Скиннер), логические эмпирики (например, Герберт Фейгл) и сам Бриджмен, тем самым объединив три основных направления операционалистского мышления.

По-видимому, авторы разошлись во мнениях относительно того, что такое операционализм и какова его роль в психологии и науке в целом (Green, 1992). Несмотря на неспособность договориться об основных принципах, интерес к операционализму сохранялся еще около десяти лет. В 1953 году на собрании Американской ассоциации развития науки был организован еще один симпозиум по операционализму.

К 1959 г., однако, многие ранее операционально настроенные психологи усомнились в адекватности операционализма (Green, 1992). По мере того как логические эмпирики модифицировали свою собственную позицию (позиции) в свете хорошо известных теперь нападок и критических анализов, их философия также начала расходиться с ранним операционализмом (Хем-пель, 1950, 1954). В психологии тоже операционализм постепенно отходил на второй план, хотя дискуссия пару раз всплывала вновь: в начале 1980-х на страницах Journal of Mind and Behavior, в начале 1990-х на страницах журнала Theory & Psychology и снова в начале 2000 г. в Theory & Psychology (Feest, 2005).

Хотя операционализм больше не является модной темой философских и методологических дебатов, некоторые комментаторы утверждают, что операционализм

в различных формах живёт в современной психологической практике (например, Rogers, 1989). В следующем разделе я подробно расскажу о том, как операционализм

Современные дебаты

Сильный, слабый и скользящий

определяется, защищается и критикуется в современной психологии.

В этом разделе я утверждаю, что мы можем выделить по крайней мере три широких направления аргументов из современных дебатов об операционализме в психологии. Этот список предназначен не для того, чтобы исчерпать полемику вокруг операционализма, а для того, чтобы наметить некоторые основные течения: (а) аргументы против сильного операционализма, где сильный операционализм - это точка зрения, согласно которой психологические понятия обозначают6 тест-зависимые качества; (б) сторонники слабого операциона-лизма, где слабый операционализм - это точка зрения, согласно которой исследователи должны изучать результаты тестов независимо от того, что обозначает целевое понятие; и (с) аргументы, критикующие слабый операционализм за скатывание к сильному операцио-нализму. Теперь я буду обсуждать эти три течения по очереди.

Против сильного операционализма. В качестве примеров аргументов против того, что я называю сильным операционализмом, рассмотрим следующие утверждения: «Хотя позитивизм, бихевиоризм и операционализм были почти повсеместно отвергнуты как философски неработоспособные, их наследие остаётся влиятельным во всей социологической литературе. (Мол, 2017, с. 60)

«Наша ссылка на «современный операционизм» не означает, что операционизм является живой позицией в современной философии науки, а только то, что он формирует определенный современный подход к изучению психопатологии» (Lovett & Hood, 2011, с. 219, сноска 2).

«Принятие операционизма (ошибочная философия науки) и псевдомедицинской модели (определение

только по синдрому) порождает ошибочный исследовательский подход, который вряд ли окупится в долгосрочной перспективе» (Мил, 1995, с. 267).

Что такое операционализм, который эти критики называют философски неработоспособным, ошибочным и мёртвым? Согласно Бенджамину Ловетту и Брайану Худу (2011), операционализм проявляется, когда «исследователи рассматривают наблюдаемое поведение как составную часть психических расстройств» (с. 209). Пол Миль (1995) утверждает, что «некоторые сверхоперациональные психологи говорят так, как будто вывод теоретических сущностей был каким-то методологически греховным» (с. 268). Наконец, Эндрю Мол (2017) пишет, что в операционализме «теоретизирование о психологическом атрибуте ... не может происходить независимо от построения конкретной меры этого признака» (с. 60).

Из замечаний авторов следует, что Ловетт, Худ, Мол и Мил рассматривают операционализм как подход, в котором объекты психологического исследования концептуализируются (и теоретизируются) с точки зрения наблюдаемого поведения в тестовой среде, а не с точки зрения тестовой среды - как независимые качества, определяющие это тестовое поведение. Я предлагаю,

чтобы мы назвали этот вид операционализма сильным операционализмом:

D1. Сильный операционализм: Целевые понятия психологов обозначают тест-зависимые качества, а не тест-независимые качества7.

Чтобы объяснить Д1, я предлагаю следующие характеристики зависимости от теста и независимости от теста:

D2. Тест-зависимость: качество является тестово-за-висимым, если для характеристики этого качества необходимо упомянуть конкретный психологический тест. Например, «самоотчёты по шкале удовлетворённости жизнью» и «оценка поведения при депрессии по шкале оценки депрессии Гамильтона» являются тест-зависимыми качествами.

D3. Тест-независимость: независимое от теста качество - это качество, которое может быть полностью охарактеризовано без ссылки на тест. Например, уровни серотонина (независимо от того, измеряются они или нет), чувство отчаяния (независимо от того, наблюдаются они или нет) и склонность к чувству беспокойства (независимо от того, установлено ли это тестом или нет) являются тест-независимыми качествами.

Почему сильный операционализм мёртв, ошибочен и неработоспособен? Одно из часто повторяемых обвинений в адрес операционализма состоит в том, что он ведёт к вредному распространению понятий (например, Hempel, 1966; Hull, 1968; Leahey, 1980). Сильный операционализм мог бы привести к такому распространению, если бы он был дополнен указанием на то, что все психологические меры (которых существует множество) определяют уникальную психологическую понятие. Ещё одно распространённое возражение заключается в том, что операционализм произволен (см. Meehl, 1995) в том смысле, что он неадекватно реагирует на эмпирические и теоретические знания о психологических явлениях и значениях, связанных с психологическими понятиями. Например, часто цитируемый операциона-листский лозунг «интеллект - это то, что проверяют тесты» (Boring, 1923), по-видимому, неправомерно игнорирует тот факт, что для большинства людей интеллект означает гораздо больше, чем результаты теста на IQ.

Однако самое распространённое беспокойство вызывает то, что результаты тестов - это просто не та вещь, на которой психологи должны сосредотачиваться. Многие критики операционализма реалистично относятся к психологическим измерениям (Borsboom et al., 2003; Hood, 2008; Meehl, 1995)8. Они утверждают, что

психологи должны сосредоточиться на измерении качеств, не зависящих от тестов, то есть качеств, которые могут вызвать определённый вид наблюдаемого поведения в условиях тестирования, но которые концептуально или онтологически независимы от тестов.

Для того чтобы реализм считался чем-то большим, чем констатация исследовательских предпочтений, его сторонники должны утверждать, что операционализм не может пожинать эпистемологические плоды, предлагаемые реализмом. Многие реалисты утверждают, что более подробное изучение независимых от тестов причин наблюдаемого поведения улучшает понимание, а также способность исследователей и политиков успешно осуществлять вмешательство (литературу о функциях причин см., например, в Cartwright & Hardie, 2017; Howick et al., 2013; Machamer et al., 2000). Например, когда дело доходит до лечения депрессии и ее отличия от тревожности и других родственных заболеваний, возможно (или было бы) полезнее рассмотреть биологические и психологические причины подавленного настроения, чем смотреть на двусмысленные результаты тестов по шкале оценки депрессии Гамильтона (HDRS).

Подводя итог, можно сказать, что строгий операци-онализм - это точка зрения, согласно которой целевые

понятия обозначают наблюдаемое поведение в ответ на тест, а не независимые от теста детерминанты или причины этого поведения. Сильный операционализм подвергался резкой критике со стороны исследователей, которые обычно считают себя реалистами. Но применима ли критика сильного операционализма к практикующим психологам?

Слабый операционализм. В 1956 году психологи Уэн-делл Гарнер, Гарольд Хейк и Чарльз Эриксен написали в Psychological Review, что некоторые из их современников склонны определять восприятие (и другие понятия) в терминах реакций на стимулы в тесте. Гарнер, Хейк и Эриксен утверждали, что этот вид операционализма представляет собой «извращение основ [операциона-лизма], как утверждали его создатели» (с. 149). Они думали, что в защищённой форме операционализма ответы участников будут использоваться не для определения целевого понятия, а для вывода о ненаблюдаемых свойствах целевого понятия (с. 150). Опера-ционализм, который они обрисовывают и защищают, совместим с идеей о том, что психологические тесты -это средства исследования психологических качеств, которые онтологически или концептуально независимы от теста, то есть тип реализма. Конечно, Розебум

(2005) называет Гарнера, Хейка и Эриксена психологами, считавшими операционализм «вариантом эмпирического реализма» (с. 1320). Если это тот операционализм, которого придерживаются современные психологи, то критика, представленная в предыдущем разделе, неприменима к современной психологии.

Трудно сказать, являются ли современные психологи операционалистами - сильными или нет, - потому что они редко используют термин операционализм. Вернее, учебники регулярно подчеркивают необходимость операционализации целевых понятий, чтобы сделать их измеримыми (Slife et al., 2016). В своём учебнике Эванс и Руни (2011) описывают операционализа-цию как деятельность, которая превращает концептуальную гипотезу в исследовательскую гипотезу, где концептуальная гипотеза представляет собой неосязаемое утверждение, такое как «Дружелюбные люди счастливее, чем люди, которые держатся особняком», а исследовательская гипотеза - это утверждение о результатах теста, например: «Люди, получившие высокие баллы по стандартному тесту экстраверсии E, дают более высокие оценки счастья по тесту H, чем люди с низкими баллами по E». Это наглядно представлен на Рис. 1.

Дружелюбные люди счастливее, чем те, которые замыкаются в себе

Концептуальная ги-

Дружелюбный => Высокий балл по тесту Е Люди, набравшие высокие баллы в стан-

Гипотеза исследо-

дартном тесте экстраверсии Е, дают более высокие оценки счастья в тесте Н, чем люди с низкими баллами.

Рис. 1. О

Если распространённую деятельность по операцио-нализации рассматривать как форму операционализма, то операционализм - это не философская позиция, а в лучшем случае исследовательская эвристика. Этот вид операционализма состоит просто в рекомендации излагать свои гипотезы в измеримых терминах, независимо от того, является ли человек реалистом в отношении целевого понятия. Например, исследователям рекомендуется изучать различия в уровне счастья с точки зрения различий в оценках по опроснику, который соответствующим образом связан с их целевым понятием, независимо от того, определено ли это понятие в реалистичных терминах. Назовём это слабым операциона-лизмом:

D4. Слабый операционализм: исследователи должны изучить тестовое поведение9 независимо от того, как определено целевое понятие. 4 является неопределённым, потому что этот вид исследовательской эвристики редко прямо указывается в учебниках или где-либо ещё как изм. Скорее, это определение предназначено для того, чтобы уловить, возможно, здравый смысл, который скрывается за вездесущей операциона-лизацией психологов-исследователей: исследователям нужны числа для ведения статистики, поэтому они строят операции по генерации чисел, которые, по-видимому, связаны с целевым понятием. Чтобы убедиться, что связь не просто очевидна, психологи проверяют свои измерения - процесс, который в учебниках

обычно описывается гораздо шире, чем операционали-зация (например, Coolican, 2014, с. 37).

Слабый операционализм по видимому совместим с реализмом в отношении целевых понятий10. Слабо опе-рационалистский исследователь может концептуализировать депрессию как независимое от теста качество и использовать валидацию меры, чтобы установить связь между этим качеством и его операционализацией. В таких случаях ранее описанная критика сильного опера-ционализма не превращается в критику слабого опера-ционализма. Однако та же открытость, которая позволяет слабым операционалистам быть реалистами, позволяет сильным операционализмам вернуться в психологические исследования.

Пробелы и соскальзывания. Слабый операционализм - это очень подвижная структура, а это означает, что его практическое применение может в конечном итоге выглядеть очень похожим на строгий операционализм, независимо от того, чего хочет исследователь. Более конкретно, возможно, что практики в конечном итоге изучают операционально определенные понятия, потому что проверка их измерений не может установить достаточную связь между операцией измерения и независимой от теста целью. Например, даже если кто-то

думает, что счастье является независимым от теста понятием11, он может не исследовать это понятие, если связь между опросником счастья и целевым понятием не установлена должным образом. Заявления, сделанные на основе такого «неполного» опросника счастья, -это просто заявления о результатах опроса, а не о интересующем концепте.

Это утверждение о возможности разрыва между мерой и понятием является не только гипотетическим поводом для беспокойства, но и общей характеристикой критических замечаний, которые регулярно выдвигаются против психологов. Психологов часто обвиняют в материализации своих целевых понятий, то есть их критикуют за то, что они делают неправомерные выводы из наблюдаемого выполнения теста в независимую от теста «вещь», которая вызывает это выполнение (Kane, 2006, 2013). В качестве примеров овеществления рассмотрим дебаты о психических расстройствах или интеллекте: Хайман (2010) утверждает, что психические расстройства, классифицированные в DSM, часто неправомерно трактуются как естественные, независимые от тестов сущности, в то время как Гулд (1981) критиковал вывод о том, что различия в структуре тестов IQ указывает на различия в мозге (но см. Худ, 2008, критику Гулда). Когда психологи овеществляют, они делают

заявления о независимых от теста сущностях или качествах, даже если у них есть только эпистемические основания для заявлений о наблюдаемом поведении в тесте.

Может возникнуть соблазн подумать, что неуклюжий переход от реалистических наклонностей к (сильной) операционалистской исследовательской практике является скорее исключением, чем правилом. Но некоторые учёные утверждают, что (сильный) операциона-лизм может быть укоренён во многих психологических исследованиях, и это вызывает беспокойство. В том же духе, что и Мичелл (1997, 2008), МакГрейн (2015) утверждает, что операционализм С. С. Стивенса помог популяризировать исследовательский подход, при котором операции измерения создают психологические понятия, а не позволяют делать выводы: «Психологические науки переняли практику, когда психологические величины могут быть изобретены по желанию исследователя, а затем внимание сосредоточено на всё более

Современный

Мы в настоящее время определили три позиции в современных дебатах об операционализме: (а) аргументы против сильного операционализма, где сильный

творческих и технических средствах наложения математики «действительных чисел» на психологические атрибуты практически без теоретического обоснования для этого» (с. 6).

Другими словами, по словам МакГрейна, даже если в основании имелись реалистические наклонности, опе-рационализация редко адекватно связана с качествами, не зависящими от теста. Вопрос о том, что требуется для такой адекватной или оправданной «обратной связи», обсуждается, но многие считают, что для этого потребуется больше теоретизирования и более тщательное моделирование связи между результатами теста и причинно-следственными переменными (Borsboom, 2006; Maul, 2017; McClimans et al., 2017). Тот факт, что ведутся дебаты о необходимых улучшениях, не умаляет сути аргумента против современной психологической практики: она (возможно) не может перейти от утверждений о тестовом поведении (т. е. операционально определённых целевых концептах) к тест-независимым качествам.

операционализм

операционализм - это точка зрения, согласно которой психологические понятия обозначают тестовое поведе-

ние; (б) сторонники слабого операционализма, где слабый операционализм - это точка зрения, согласно которой исследователи должны изучать тестовое поведение независимо от того, как они концептуализируют цели психологического исследования; (c) критики психологических исследований, которые обвиняют психологов в том, что они не смогли устранить разрыв между целевым понятием, обозначающим независимое от теста качество, и мерой, предназначенной для фиксации этого качества.

Какой бы позиции ни симпатизировал человек, должно быть очевидно, что в настоящее время нет общего подхода к размышлению об операционализме и

его практике. В оставшейся части этой статьи я собираюсь защищать уважительный операционализм (RO), новый подход, который балансирует между преимуществами и проблемами более ранних форм операционализма. С одной стороны, RO учитывает тот факт, что качества, независимые от тестов, трудно понять и измерить, и что иногда лучшее, что мы можем сделать, - это изучить тестовое поведение - прагматичный подход, который, как я утверждала выше, мотивирует слабый операционализм. С другой стороны, RO пытается предотвратить неоправданные логические сдвиги от тестового поведения к тест-независимым качествам, то есть те виды соскальзывания, которые бес-

покоят реалистов.

Уважительный операционализм Внеоперационные значения и юзабилити

Грубо говоря, RO - это точка зрения, согласно которой мы можем определить целевое понятие в терминах теста, при условии, что этот тест проверен на предмет включения общих коннотаций целевого понятия и применимости меры12. Более технически:

D5. Уважительный операционализм: подход к психологическим исследованиям, в котором целевое понятие определяется в терминах поведения в тесте, который (а) валидизирован в отношении внеоперационных значений и удобства использования, но (б) не валиди-зирован в отношении выводов о качествах, не зависящих от теста.

Как мы увидим, уважительные операционалисты делают то же самое, что и нынешние психологи, разрабатывающие тесты. Но есть тонкие и существенные различия, которые продвигают нас вперёд в дебатах об операционализме. Я объясню этот интеллектуальный смысл лучше в следующем разделе. В этом разделе основное внимание уделяется описанию RO.

Уважительные операционалисты начинают с широко признанных внеоперационных коннотаций13 понятия цели. Например, для интеллекта коннотацией является способность решать задачи, поэтому в тестах интеллекта имеет смысл включать задания по решению проблем (Yoakum & Yerkes, 1920). Депрессия, в свою очередь, ассоциируется с плохим настроением и грустью, поэтому измерения депрессии должны так или иначе исследовать эти аспекты. Все идёт нормально. Требуется больше усилий, чтобы уважительно относиться к деталям внеоперационных коннотаций, например к идее о том, что интеллект, как правило, связан с успеваемостью, или мысли о том, что депрессия не включает тревогу, хотя они часто совпадают. Чтобы включить такие значения, уважительные операциона-листы используют методы, которые часто называют проверкой содержания и проверкой критериев. В качестве примера валидности критерия мы можем привести

исследования о корреляции результатов тестов интеллекта и школьных оценок (Gygi et а1., 2017). Что касается проверки содержания, рассмотрим, например, часто цитируемую статью Ва§Ьу et а1. (2004), где они утверждают, что часто используемый HDRS не является содержательно валидным, поскольку включает вопросы о тревоге, несмотря на то, что тревога не является частью текущего понятия депрессии.

В дополнение к проверке внеоперационных значений, уважительный операционалист проверяет свою меру на удобство использования. Одной из составляющих удобства использования является согласованность результатов. Например, проверяя свою меру депрессии, Макс Гамильтон (1960) изучал, насколько последовательно два психолога оценивают пациентов, изучая корреляцию между двумя наборами оценок. Согласованность указывает на удобство использования, потому что для разных людей полезно иметь возможность проводить тест и получать результаты, которые сразу отчасти сопоставимы. Другие методы оценки надёжности показывают, насколько хорошо одно предъявление теста представляет или согласуется с повторным предъявлением (СгапЬаЛ et а1., 1963). Такая репрезентативность полезна, потому что она показывает, насколько

устойчивым мы можем ожидать наш оперативный диагноз - скажем, глубокая депрессия будет проявляться при независимых от администрации тестированиях. Ещё одним аспектом удобства использования являются прогностические возможности теста, то есть его прогностическая валидность. Это полезно, например, если образцы результатов теста на депрессию позволяют нам предсказать, на какое лечение пациент, скорее всего, отреагирует. Первоначально Гамильтон хотел использовать свою меру депрессии для этой цели: классифицировать типы депрессии и соответственно назначать лечение (Hamilton & White, 1959; Worboys, 2013).

Уважительная операционалистка развивает свои измерения, уравновешивая требования удобства использования и уважения к внеоперационному смыслу. Она находит элемент здесь и там, чтобы улучшить согласованность, затем добавляет элемент, чтобы включить некоторые пропущенные значения, затем меняет формулировку ещё одного элемента, чтобы его было легче понять участникам, и так далее и тому подобное. Пока это выглядит так, как будто реалисты могут отстать от процесса проверки, но это скоро изменится. Когда уважительная операционалистка удовлетворена результатом своего балансирования, она заявляет, что тест определяет её целевой концепт. Она делает это, зная, что

некоторые из неуправляемых и постоянно меняющихся значений понятия были опущены. Она признает, что её операциональное понятие является одним из множества концептов, правомерно обозначаемых одним и тем же термином14.

Почему уважительная операционалистка делает этот шаг? Потому что она не подтвердила независимое от теста обозначение своего теста, то есть она не знает, какие атрибуты или сущности отслеживает её измерение. Тот факт, что два интервьюера дают одинаковые оценки, не говорит нам о том, что движет реакцией интервьюируемых. Отражают ли их проявления депрессивного настроения стабильное состояние или просто чувство, которое доминировало в их переживаниях во время теста? Существуют ли биологические причины того, как пациенты реагируют на тестовые задания? Склонны ли респонденты к преувеличениям или другим предубеждениям? Выглядят ли они грустными, хотя на самом деле они обеспокоены ситуацией с тестом? Точно так же корреляции между тестами интеллекта и школьными оценками не говорят нам о детерминантах результатов тестов интеллекта. Определяются ли они врождённой способностью? Является ли образование лучшим объяснением различий в

баллах? Какую роль играет опыт проходить тестирование в результатах теста интеллекта? Короче говоря, опе-рационалистская валидация не гарантирует выводов из тестовой оценки о том, что её вызвало.

Операционалистка оставляет эти вопросы без ответа, потому что разработанный ею тест имеет свои достоинства. Во-первых, рабочие определения помогают обеспечить сопоставимость выводов исследований. Например, если в разных исследованиях в качестве определяющего порога ремиссии депрессии используется оценка HDRS, равная семи, можно легко сравнить выводы этих исследований (при прочих равных условиях, таких как соблюдение рекомендаций по проведению интервью; например, Thase et а1. ., 2001).

Интеллектуальное значение

Уважительные операционалисты используют те же методы, которые уже стали хлебом с маслом для психологов. Что RO привносит в современные дебаты? И в более широком смысле, как RO связан с недавними исследованиями в области измерения и разработки понятий? В этом разделе я объясняю интеллектуальный и прагматический смысл RO.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Хотя RO во многих отношениях выглядит как обычный процесс проверки, он помогает нам решить несколько загадок. Прежде всего, RO не становится жертвой

Напротив, если каждая исследовательская группа сделает свои собственные выводы о том, что означают баллы HDRS, группы, вероятно, закончат тем, что будут говорить друг без друга. Во-вторых, тесты, определяющие операционные понятия, как правило, имеют полезные прогностические функции.

В общем, уважительная операционалистка уравновешивает два вида соображений при проверке теста: удобство использования и внеоперационные значения. Затем она определяет свою целевое понятие с точки зрения теста. Она использует тест и понятие, которую определяет, для выполнения прогностических функций и для сравнения выводов разных исследований.

уважительного операционализма

общих возражений против сильного операционализма. То, как RO проверяет меры для внеоперационных значений, защищает от произвольных определений, таких как интеллект, определяемый с точки зрения политической лояльности, или благосостояние, определяемое с точки зрения среднего балла средней школы ^РА). В RO также нет ничего, что мешало бы новым, лучшим15 тестам заменить старые. Следовательно, RO не приводит к некон-

тролируемому распространению операционных понятий. И, наконец, хотя RO, по общему признанию, не соответствует объяснительным и вспомогательным возможностям знания о причинных механизмах, RO служит другим полезным целям, когда причины недоступны. В частности, RO служит для сравнения исследований и прогностических функций.

RO улучшает слабый операционализм, явно и чётко определяя целевые понятия с точки зрения тестов. Узаконивая определения, относящиеся к конкретным операциям, RO препятствует необоснованным логическим сползаниям к утверждениям о качествах, не зависящих от тестов. Но заметьте, что ничто в КО не требует использования операционных определений во всей психологии. RO можно проводить бок о бок с реалистическим проектом, пытаясь обосновать выводы, сделанные на основе результатов теста, относительно независимых от теста причин, если ясно, какой вид валидации, реалистический или RO, был выполнен для каждого измерения меры. Иногда проект RO может проложить путь к измерению, позволяющему делать выводы о качествах, не зависящих от тестов. Например, даже если тест на депрессию изначально построен и используется для обобщения тестовых ответов, дальнейшая проверка

может привести к выявлению физического или психологического свойства (или их группы), которое приводит к результатам теста.

Это видение развития научных понятий, то есть идея о том, что научные понятия могут начинаться как обозначающие что-то легко наблюдаемое, зависящее от теста или поведения, а затем развиваться, чтобы обозначать что-то не наблюдаемое напрямую, независимое от теста и каузально действенное согласуется с недавними историко-философскими работами по формированию научных понятий (например, Chang, 2004; Nersessian, 2008). Возьмем, к примеру, группу заболеваний, которые мы сейчас называем сахарным диабетом. Древние врачи использовали диабет для обозначения состояний, связанных с непрерывным мочеиспусканием и жаждой, в 19 веке он охватывал состояния, при которых глюкоза выделяется с мочой, а в 20 веке понятие разделилось для обозначения двух разных состояний, связанных с различными дисфункциями в производстве и использовании инсулина (Zajac et al., 2017). Улучшение тестов (например, уровня глюкозы) шло рука об руку с сужением понятия от той, которая обозначает большое количество внешне сходных состоя-

ний, до той, которая охватывает меньшую, более однородную группу состояний, которые имеют общие биологические механизмы.

Разработка психологической меры также может начинаться как проект, направленный на категоризацию различных видов результатов теста, и постепенно развиваться в проект, выводящий из этих результатов качества, независимые от теста. Хотя RO-проекты таким образом могут превратиться в реалистические проекты16, концептуальное различие между RO и реализмом напоминает нам о необходимости ясно понимать точную природу выводов, для которых была подтверждена психологическая мера. Сообщая о подтверждении психологической меры, следует быть осторожным, чтобы объяснить, может ли эта мера использоваться только для скромных заявлений о тестовом поведении или имеется разумная степень поддержки амбициозных заявлений о причинах и тест-независимых качествах. Это особенно важно в психологических науках, где изучаются такие понятия, как депрессия, счастье и интеллект имеют большое значение в обычном языке, и поэтому легко порождают необоснованные выводы.

Подчёркивая необходимость помечать выводы, для которых была подтверждена мера, описанный выше

подход к проверке напоминает основанный на аргументах подход Майкла Т. Кейна к валидности. Подход Кейна (2016) гласит, что, в общем, существует два этапа измерения валидации: (а) указание предполагаемого использования тестовых результатов и (б) оценка правдоподобия этих утверждений в свете соответствующих доказательств. Согласно Кейну (2006), подход, основанный на аргументах: «допускает множество возможных интерпретаций и применений результатов тестов с оговоркой, что любая предлагаемая интерпретация или использование должны быть подтверждены соответствующими доказательствами. Таким образом, операционально определённые переменные хороши до тех пор, пока мы признаем их такими, какие они есть, и не прячем под радаром какие-либо теоретические утверждения» (с. 443)

RO основывается на важной предпосылке подхода, основанного на аргументах, который заключается в том, что достоверность психометрической меры зависит от ее способности удовлетворять потребности использования, для которого предназначена эта мера. Однако, в отличие от подхода, основанного на аргументах, RO - это не общая теория (психометрической) валидности, а скорее новый подход, специально предназначен-

ный для формирования полезных операционных понятий, чтобы избежать проблем, которые долгое время преследовали психологические исследования, ориентированные на операции. Другими словами, хотя принятие подхода к обоснованности, основанного на аргументах, является минимальным условием для принятия RO, в моем аргументе в пользу RO поставлено на карту гораздо больше, а именно его способность (частично) искупить операционализм. Тот факт, что основанный на аргументах подход допускает операциональные определения, не является аргументом в защиту полезности и обоснованности (формы) операционализма.

RO также имеет сходство с теорией обобщаемости, интегрированным подходом к психометрической надежности и валидности, который получил известное объяснение в 1963 году в статье Ли Кронбаха, Нагесвари Раджаратнам и Голдин Глезер. Грубо говоря, теория обобщаемости утверждает, что процедура измерения действительна в той мере, в какой она обеспечивает точные оценки совокупности наблюдений, определяющих целевое понятие (Cronbach et al., 1963; ср. Kane, 1982, p. 134). В этой структуре целевые понятия определяются в терминах некоторой совокупности наблюдений, таких как наблюдения за реакциями на тест на тревогу A в больнице H под наблюдением интервьюера I и

т. д. для других условий интереса. В теории обобщаемо-сти проверка включает в себя обоснование вывода на основе фактических наблюдений относительно совокупности потенциальных наблюдений. Операциона-листский привкус исходит из того факта, что основное внимание уделяется наблюдениям и потенциальным наблюдениям, а не ненаблюдаемой, каузально действенной сущности или качеству.

Я считаю, что соображения по поводу обобщаемости являются важной частью уважительной операциона-листской валидации. Мера, которая подтверждается методом RO, предназначена для подтверждения заявлений, специфичных для теста, таких как «Мэй получила более высокий балл по тесту на депрессию D, чем Кай» и «Оценки пациентов по тесту на тревогу А в среднем на 50% ниже после лечение препаратом D». Чтобы определить точное значение таких утверждений, уважаемый операционалист должен быть в состоянии установить границы теста, то есть сказать, что является и что не является необходимым компонентом теста. Например, является ли частью теста на депрессию то, что опрашивающий является клиницистом, или то может быть кто угодно? Является ли частью теста на тревогу то, что интервьюер следует определенному правилу собеседова-

ния? Теория обобщаемости может помочь уважительным операционалистам определить, на какие условия тестирования обобщаются наблюдаемые оценки, что, в свою очередь, поможет им более точно сформулировать значение утверждений, специфичных для теста. Но в RO есть нечто большее. Во-первых, необходимо обеспечить, чтобы операционально определённое целевое понятие резонировало с более широкими коннотациями понятия. RO также охватывает соображения удобства использования, выходящие за рамки обобщения, такие как продолжительность теста, формулировка вопросов и т. д. В более широком смысле, RO и теория обобщае-мости выполняют разные функции: первая понимается как последовательная, работоспособная альтернатива критикуемым формам операционализма, в то время как последняя предоставляет технические и интерпретационные инструменты для обобщения.

Во:

Эта статья посвящена месту операционализма в современной психологии и его потенциалу в будущих исследованиях. Есть три причины, по которым я до сих пор не углублялась в давние фундаментальные вопросы. Во-первых, о философских проблемах, связанных с операционализмом, уже написано немало, тогда

В этом разделе я в общих чертах описала, как RO продвигает нас вперёд в текущих дебатах об операцио-нализме и как он связан с разработками в более широкой литературе по измерениям. Я утверждала, что RO не становится жертвой самых серьёзных проблем сильного операционализма и что, в отличие от слабого операци-онализма, RO защищает от необоснованных промахов от тестово-зависимых утверждений к утверждениям о тест-независимых качествах. Я также выдвинула аргумент о том, что RO совместим с недавними исследованиями по совместной разработке мер и понятий. Наконец, я утверждала, что, хотя RO в целом представляет собой новую основу для формирования операционных понятий в психологии, он имеет общие элементы с основанным на аргументах подходом Кейна к валидации и теорией обобщаемости.

как его возможностям в современных психологических исследованиях уделяется меньше внимания (см. второй раздел этой статьи). Во-вторых, как свидетельствует большое количество чернил, пролитых на операциона-лизм, эти вопросы слишком обширны, чтобы их можно было решить в одной статье. И в-третьих, я рассмотрела

некоторые из давних философских возражений в другом месте (Vessonen, 2019a). Однако, чтобы заверить читателя в том, что RO не унаследовал проблемы, которые досаждают другим формам операционализма, я кратко изложу ответы на известные возражения.

Первое возражение утверждает, что операциона-лизм несовместим с валидацией измерений, потому что операционалистские меры действительны по определению («интеллект - это то, что измеряют тесты IQ»). Тому, кто разделяет эту точку зрения на операционализм, может показаться непонятным, что RO включает в себя проверку внеоперационных значений (например, проверку содержания и критериев, как описано в третьем разделе этой статьи). Возражение можно изложить в виде аргумента:

Р1. Операционализм никогда не предполагает проверки.

Р2. RO включает в себя проверку.

С. Поэтому РО не может быть операционализмом.

Я считаю, что P1 слишком строгое определение операционализма (см. также Chang, 2009). Осмелюсь предположить, что на практике никто так строго не относится к операционализму. В противном случае мы бы

увидели ярых операционалистов, определяющих депрессию с помощью термометров, а температуру - с помощью анкет. Мы не видим таких заявлений, разбросанных по литературе, потому что почти все согласны с тем, что мы должны гарантировать, что научные понятия депрессии и температуры имеют какое-то сходство с повседневным (научным) использованием этих понятий (см. Carnap, 1950b, глава 1). Первое возражение несостоятельно, потому что P1 ложно: операционализм включает проверку внеоперационных значений.

Второе, связанное с этим беспокойство, заключается в том, что никакие эмпирические исследования не могут убедить истинного операционалиста в том, что их определение неверно. Другими словами, если кто-то определяет интеллект исключительно в терминах теста IQ (Boring, 1923), даже если этот тест IO не коррелирует ни с какими другими мерами успеха, это не убеждает операционалиста изменить определение - в конце концов, они уже измеряют интеллект по определению. Этот шаг нелогичен для реалистов: несомненно, определение интеллекта, не имеющее ничего общего с академическими или другими формами успеха, неверно и должно быть изменено.

Как должно быть ясно из моего описания RO, я думаю, что операционалисты могут и должны изменить

свои понятия в свете эмпирических данных. Разница между реалистами и операционалистами заключается в том, что реалисты оценивают правильность понятий, а операционалисты оценивают их полезность. Если тест IQ не может предсказать успехи в учёбе, уважающий себя операционалист может пересмотреть понятие, поскольку считает полезным сохранить дотеоретическое интуитивное представление о том, что интеллект связан с академическими достижениями. Однако нет ничего неправильного в том определении интеллекта, которое не связано с академическими достижениями - на самом деле, можно также утверждать, что требование такого отношения является элитарным, устаревшим или иным образом лишённым ценности.

Тут же следует третье возражение: если нет общего стандарта, такого как истина, для арбитража между определениями, что мешает исследователям выбирать любые определения, подходящие для их целей? Не снова ли мы тонем в произвольных понятиях? Мой ответ двоякий. Во-первых, существует множество (эпи-стемических) ценностей, помимо истины, в которые верят (большинство) учёных, такие как последовательность, простота, точность, применимость, а также способность к предсказанию и объяснению (о ценностях в науке см. Douglas, 2015; о ценностях

в формировании понятии см. Duti1h Novaes, 2020). Понятия, воплощающие эти общие ценности, скорее всего, получат более широкое признание и переживут произвольные понятия. Во-вторых, хотя определение понятия не является вопросом истины (см. Сагпар, 1950а, 1950Ь; я отстаиваю эту точку зрения в Vessonen, 2019Ь), наша способность определять более полезные понятия зависит от раскрытия истин о значении этого понятия17. Например, если мы установим, что конкретный тест 10 не коррелирует с реальными навыками решения проблем, мы можем использовать этот факт для оценки полезности понятия, которое определяет тест 10. Другими словами, полезность не зависит от истин18.

Последнее возражение, которое я могу здесь рассмотреть, касается любопытной связи между операцио-нализмом и точностью. Дональд Гиллис (1972) утверждал, что строгие операционалисты не могут понять такие заявления, как «термометры типа А измеряют температуру более точно, чем термометры типа В». Если каждая мера определяет своё целевое понятие, мы не сможем сравнить две меры по их способности отслеживать общие целевые значения. Таким образом, возражение состоит в том, что подход к измерению, который не может объяснить точность, просто не является наукой (М^е11, 1990).

Мой ответ на это возражение снова двоякий. Во-первых, хотя я думаю, что верно то, что операционалисты не могут оценить точность своих собственных измерений, неверно, что операционалисты не могут понимать точность как стандарт измерения в целом. Чтобы объяснить это, мне нужно сначала уточнить, что, на мой взгляд, операционалисты не обязательно должны быть антиреалистами (Vessonen, 2019b). Другими словами, операционалисты не должны отрицать (а) возможность эпистемологического доступа к независимым от тестов сущностям или (б) существование таких сущностей (см. Lovett & Hood, 2011). Скорее, операционалисты воздерживаются от утверждений о независимых от тестов сущностях, потому что в настоящее время у них нет эпи-стемического доступа к этим сущностям. Следова-

тельно, даже если они не могут указать, насколько хорошо (то есть точно) их собственная мера отслеживает независимую от теста сущность или качество,

Во-вторых, хотя операционалисты не могут оценить точность, они могут оценить другие достоинства своих показателей. Например, они могут оценивать прецези-онность, т. е. постоянство результатов при проведении многочисленных измерений в одинаковых условиях. Это ещё раз подчёркивает, что у операционалистов есть стандарты для улучшения своих показателей, хотя эти стандарты не имеют прямого отношения к независимым от тестов качествам. Вопрос о том, следует ли называть этот вид разработки инструментов «измерением» или просто «испытанием», является предметом терминологических дебатов.

Вывод

Я аргументировала, что в современной дискуссии об операционализме есть три основных направления: (а) аргументы против сильного операционализма, (б) практика, связанная со слабым операционализмом, и (в) критика практиков, которые скатываются к более сильным формам операционализма, чем они осознают. Затем я определила и защитила RO - подход, который

включает элементы уже существующей теории и практики для формирования нового, последовательного и философски обоснованного операционализма. Я утверждала, что RO реализует преимущества операциона-лизма, но оставляет место для других, более реалистичных методов измерения в рамках психологии.

Поскольку эта статья является первой презентацией RO, ряд открытых вопросов остается не рассмотренным. Как лучше всего внедрить RO в исследовательскую практику? Что является достаточным основанием для заявлений о тест-независимых качествах? Как мы должны обращаться со множеством связанных понятий, которые, вероятно, возникают, когда мы допускаем сосуществование уважительного операционалист-ского и реалистического подтверждения? Чтобы

ответить на эти и другие открытые вопросы, я считаю, что нам необходимо сочетание литературы по формированию понятий и валидации измерений (например, Alexandrova & Haybron, 2016; Angner, 2013; McClimans, 2013; Peterson, 2018), литературы по психометрической валидации (например, , Borsboom, 2005; Cronbach & Meehl, 1955; Fiske, 1971; Loevinger, 1947), а также исследования по истории операционализма (например, Chang, 2017b; Feest, 2005; Rogers, 1989).

Примечания

1. Я использую термин «операционализм» вместо «операционизм». Термины взаимозаменяемы.

2. Имеются статьи, в которых утверждается, что операционализм С.С. Стивенса был неправильно понят (Feest, 2005) и что Бриджмен не разделял взглядов, которые ему часто приписывают (Chang, 2017b).

3. См. Hacking (1983) и van Fraassen (1980) для получения дополнительной информации о наблюдаемости.

4. Точное определение операции дискуссионно. В этой статье мы можем сосредоточиться на относительно очевидных случаях, таких как бумажно-карандашные тесты. См. классификацию у Бриджмена (1959).

5. Feest (2005) отмечает, что Эдвину Г. Борингу можно приписать введение операционализма в психологию еще раньше, в 1920-х годах.

6. В философии принято думать о понятиях как об идеях, имеющих коннотацию (или интенсионал) и денотацию (или расширение). Обозначение относится к объектам или качествам, к которым относится понятие (например, «собака» обозначает одомашненных животных, происходящих от волков), в то время как коннотация относится к способу представления значения понятием (например, понятия «лекарство» и «яд» имеют частично общее обозначение, но представляют разные аспекты этого общего обозначения). О понятиях и конструктах в психологии см. Maraun and Gabriel (2013) и Slaney and Racine (2013).

7. Можно настаивать на более метафизическом определении, например, «психологические атрибуты - это не что иное, как тестовое поведение». Это не будет верным в отношении цитируемых выше авторов, все из которых говорят о том, что делают операционалисты (т. е. «относятся к поведению как», «теоретизируют атрибуты в терминах», «запрещают делать выводы»), а не о метафизике, которой они придерживаются.

8. См. Траут (1998) о типах реализма.

9. «Тест поведения» - фрагмент поведения, наблюдаемого в условиях тестирования.

10. Под «реализмом в отношении целевых понятий» я имею в виду то, что психологические понятия берутся для обозначения не зависящих от теста качеств.

11. Независимое от теста понятие - это сокращение от «понятие, обозначающее независимое от проверки качество», как определено в D3.

12. Иногда у исследователей есть основания изобретать совершенно новые понятия, т. е. понятия, не имеющие дотеоретической коннотации. В таких случаях только критерии, связанные с удобством использования, ограничивают формирование понятий. Нынешняя практика, например, тот факт, что исследования счастья и интеллекта так популярны, предполагает, что такие ситуации не очень распространены в гуманитарных науках. Поэтому я не буду здесь на них сосредотачиваться.

13. Внеоперационные коннотации - это значения, выходящие за рамки отождествления понятия с проверочной операцией.

14. Подробнее о концептуальном плюрализме см. Chang (2017a) и Weiskopf (2009). О родственной идее концептуального контекстуализма см. Александрова (2017).

15. Лучше в смысле более удобного использования и/или лучшего включения внеоперационных значений.

16. Подробнее о взаимосвязи между реализмом, операционализмом и RO см. в следующем разделе этой статьи.

17. Короче говоря, я считаю, что определение - это вопрос полезности, а утверждения о природе сущностей, которые обозначает (временно) фиксированное определение, являются вопросом истины.

18. Это утверждение может показаться читателям странным, если они связывают операционализм с антиреализмом. Смотрите мои комментарии ниже.

Литература

Alexandrova, A. (2017). A philosophy for the science of well-being. Oxford University Press. Alexandrova, A., & Haybron, D.

M. (2016). Is construct validation valid? Philosophy of Science, 83(5), 1098-1109. https://doi.org/10.1086/687941 Angner, E. (2013). Is it possible to measure happiness? European Journal for Philosophy of Science, 3(2), 221-240.

https://doi.org/10.1007/s13194-013-0065-2 Bagby, R. M., Ryder, A. G., Schuller, D. R., & Marshall, M. B. (2004). The Hamilton depression rating scale: Has the gold standard become a lead weight? American Journal of Psychiatry, 161(12), 2163-2177. https://doi.org/10.1176/appi.ajp.161.12.2163 Boring, E. G. (1923). Intelligence as the tests test it. New Republic, 36, 35-37. https://brocku.ca/

MeadProject/sup/Boring_1923.html Borsboom, D. (2005). Measuring the mind: Conceptual issues in contemporarypsychometrics. Cambridge University Press. Borsboom, D. (2006). The attack ofthe psychometricians. Psychometrika, 71(3), 425-440. https:// doi.org/10.1007/s11336-006-1447-6

Borsboom, D., Mellenbergh, G. J., & van Heerden, J. (2003). The theoretical status of latent variables. Psychological Review,

110(2), 203-219. https://doi.org/10.1037/0033-295X.110.2.203 Bridgman, P. W. (1927). The logic of modern physics. Macmillan. Bridgman, P. W. (1959). The way things are. Harvard University Press.

Carnap, R. (1950a). Empiricism, semantics, and ontology. Revue Internationale de Philosophie, 4(11), 20-40.

https://www.jstor.org/stable/23932367?seq=1 Carnap, R. (1950b). Logical foundations ofprobability. University of Chicago Press.

Cartwright, N., & Hardie, J. (2017). Predicting what will happen when you intervene. Clinical Social Work Journal, 45(3), 270-279. https://doi.org/10.1007/s10615-016-0615-0

Chang, H. (2004). Inventing temperature: Measurement and scientific progress. Oxford University Press.

Chang, H. (2009). Operationalism. In E. N. Zalta (Ed.), The Stanford encyclopedia of philosophy (Fall 2009 ed.).

https://plato.stanford.edu/archives/win2019/entries/operationalism/ Chang, H. (2017a). Epistemic iteration and natural kinds: Realism and pluralism in taxonomy. In K. Kendler & J. Parnas (Eds.),

Issues in psychiatry IV: Classification of psychiatric illnesses (pp. 229-245). Oxford University Press. Chang, H. (2017b). Operationalism: Old lessons and new challenges. In N. MoBner & A. Nordmann (Eds.), Reasoning in

measurement (pp. 25-38). Routledge. Coolican, H. (2014). Research methods and statistics in psychology (6th ed.). Psychology Press. Cronbach, L. J., & Meehl, P. E. (1955). Construct validity in psychological tests. Psychological Bulletin, 52(4), 281-302. https://doi.org/10.1037/h0040957 Cronbach, L. J., Rajaratnam, N., & Gleser, G. C. (1963). Theory of generalizability: A liberalization ofreliability theory. British

Journal of Statistical Psychology, 16(2), 137-163. https:// doi.org/10.1111/j.2044-8317.1963.tb00206.x Douglas, H. (2015). Values in science. In P. Humphreys (Ed.), The Oxford handbook of philosophy of science. Oxford

University Press. https://doi.org/10.1093/oxfordhb/9780199368815.013.28 Dutilh Novaes, C. (2020). Carnapian explication and ameliorative analysis: A systematic comparison. Synthese, 197, 10111034. https://doi.org/10.1007/s11229-018-1732-9 Evans, A., & Rooney, B. J. (2011). Methods in psychological research (2nd ed.). SAGE.

Feest, U. (2005). Operationism in psychology: What the debate is about, what the debate should be about. Journal of the History

of the Behavioral Sciences, 41(2), 131-149. https://doi. org/10.1002/jhbs.20079 Fiske, D. W. (1971). Measuring the concepts of personality. Aldine.

Flanagan, O. J., Jr. (1980). Skinnerian metaphysics and the problem of operationism. Behaviorism, 8(1), 1-13. https://www.jstor.org/stable/27758948?seq=1

Frank, P. G. (1956). The validation of scientific theories. Beacon Press.

Garner, W., Hake, H., & Eriksen, C. (1956). Operationism and the concept of perception. Psychological Review, 63(3), 149159. https://doi.org/10.1037/h0042992 Gillies, D. A. (1972). Operationalism. Synthese, 25(1/2), 1-24. https://doi.org/10.1007/ BF00484997

Gould, S. J. (1981). The mismeasure of man. W.W. Norton & Company.

Green, C. D. (1992). Of immortal mythological beasts. Theory & Psychology, 2(3), 291-320.

https://doi.org/10.1177/0959354392023003 Gygi, J., A., H., Schweizer, F., & Grob, A. (2017). The predictive validity of four intelligence tests for school grades: A small

sample longitudinal study. Frontiers in Psychology, 8, Article 375. https://doi.org/10.3389/fpsyg.2017.00375 Hacking, I. (1983). Representing and intervening: Introductory topics in the philosophy of natural science. Cambridge University Press.

Hamilton, M. (1960). A rating scale for depression. Journal of Neurology, Neurosurgery, and Psychiatry, 23(1), 56-62.

https://doi.org/10.1136/jnnp.23.L56 Hamilton, M., & White, J. (1959). Clinical syndromes in depressive states. Journal of Mental Science, 105(441), 985-998.

https://doi.org/10.1192/bjp.105.441.985 Haslam, S. A., & McGarty, C. (2003). Research methods and statistics in psychology. SAGE. Hempel, C. G. (1950). Problems and changes in the empiricist criterion of meaning. Revue Internationale de Philosophie, 4(11), 41-63. https://www.jstor.org/stable/23932368?seq=1 Hempel, C. G. (1954). A logical appraisal of operationism. The Scientific Monthly, 79(4), 215-220.

https://www.jstor.org/stable/21072?seq=1 Hempel, C. G. (1966). Philosophy of natural science. Prentice-Hall. Hood, S. B. (2008). Latent variable realism in psychometrics. Indiana University Press.

Howick, J., Glasziou, P., & Aronson, J. K. (2013). Problems with using mechanisms to solve the problem of extrapolation.

Theoretical Medicine and Bioethics, 34(4), 275-291. https://doi. org/10.1007/S11017-013-9266-0 Hull, D. L. (1968). The operational imperative: Sense and nonsense in operationism. Systematic Zoology, 17(4), 438-457.

https://doi.org/10.2307/2412042 Hyman, S. E. (2010). The diagnosis of mental disorders: The problem of reification. Annual Review of Clinical Psychology, 6(1), 155-179. https://doi.org/10.1146/annurev. clinpsy.3.022806.091532

Kane, M. (1982). A sampling model for validity. Applied Psychological Measurement, 6(2), 125- 160.

https://doi.org/10.1177/014662168200600201 Kane, M. (2006). In praise of pluralism: A comment on Borsboom. Psychometrika, 71(3), 441- 445.

https://doi.org/10.1007/s11336-006-1491-2 Kane, M. (2013). Validating the interpretations and uses of test scores. Journal of Educational Measurement, 50(1), 1-73.

https ://doi.org/10.1111/j edm. 12000 Kane, M. T. (2016). Validity as the evaluation of the claims based on test scores. Assessment in Education: Principles, Policy

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

& Practice: Validity, 23(2), 309-311. https://doi.org/10.1080/ 0969594X.2016.1156645 Leahey, T. H. (1980). The myth of operationism. The Journal of Mind and Behavior, 1(2), 127- 143.

https://doi.org/10.2307/43852818 Loevinger, J. (1947). A systematic approach to the construction and evaluation of tests of ability. In J. F. Dashiell (Ed.),

Psychological monographs (Vol. 61). American Psychological Association. Lovett, B. J., & Hood, B. (2011). Realism and operationism in psychiatric diagnosis. Philosophical Psychology, 24(2), 207222. https://doi.org/10.1080/09515089.2011.558498 Machamer, P., Darden, L., & Craver, C. F. (2000). Thinking about mechanisms. Philosophy of Science, 67(1), 1-25.

https://doi.org/10.1086/392759 Maraun, M. D., & Gabriel, S. M. (2013). Illegitimate concept equating in the partial fusion of construct validation theory and latent variable modeling. New Ideas in Psychology, 31(1), 32-42.

https://doi.org/10.1016/J.NEWIDEAPSYCH.2011.02.006 Maul, A. (2017). Rethinking traditional methods of survey validation. Measurement: Interdisciplinary Research and

Perspectives, 15(2), 51-69. https://doi.org/10.1080/153663 67.2017.1348108 McClimans, L. (2013). The role of measurement in establishing evidence. Journal of Medicine and Philosophy, 38(5), 520538. https://doi.org/10.1093/jmp/jht041 McClimans, L., Browne, J., & Cano, S. (2017). Clinical outcome measurement: Models, theory, psychometrics and practice. Studies in History and Philosophy of Science, Part A(65-66), 67-73. https://doi.org/10.1016/j.shpsa.2017.06.004

McGrane, J. A. (2015). Stevens' forgotten crossroads: The divergent measurement traditions in the physical and psychological sciences from the mid-twentieth century. Frontiers in Psychology, 6, Article 431. https://doi.org/10.3389/fpsyg.2015.00431 Meehl, P. E. (1995). Bootstraps taxometrics: Solving the classification problem in psychopathology. American Psychologist,

50(4), 266-275. https://doi.org/10.1037/0003-066X.50.4.266 Michell, J. (1990). An introduction to the logic of psychological measurement. Lawrence Erlbaum Associates. Michell, J. (1997). Quantitative science and the definition of measurement in psychology. British Journal of Psychology, 88(3),

355-383. https://doi.org/10.1111Zj.2044-8295.1997.tb02641 Michell, J. (2008). Is psychometrics pathological science? Measurement: Interdisciplinary Research & Perspective, 6(1-2),

7-24. https://doi.org/10.1080/15366360802035489 Nersessian, N. J. (2008). Creating scientific concepts. MIT Press.

Peirce, C. S. (1878, January). Illustrations of the logic of science II: How to make our ideas clear. Popular Science Monthly,

12, 286-302. https://archive.org/details/popularsciencemo12newy Peterson, C. (2018). Methodological empiricism and the choice of measurement models in social sciences. European Journal for Philosophy of Science, 8(3), 831-854. https://doi.org/10.1007/s13194-018-0212-x

Rogers, T. (1989). Operationism in psychology: A discussion of contextual antecedents and an historical interpretation of its longevity. Journal of the History of the Behavioral Sciences, 25(2), 139-153. https://doi.org/10.1002/1520-6696(198904)25:2<139::AIDJHBS2300250204>3.0.C0;2-E Rozeboom, W. (2005). Meehl on metatheory. Journal of Clinical Psychology, 61(10), 1317-1354.

https://doi.org/10.1002/jclp.20184 Slaney, K., & Racine, T. (2013). What's in a name? Psychology's ever evasive construct. New Ideas in Psychology, 31(1), 412. https://doi.org/10.1016/J.NEWIDEAPSYCH.2011.02.003 Slife, B. D., Wright, C. D., & Yanchar, S. C. (2016). Using operational definitions in research: A best-practices approach. The Journal of Mind and Behavior, 37(2), 119-139. https://www.jstor.org/stable/44631540?seq=1

Stevens, S. S. (1934). The volume and intensity of tones. The American Journal of Psychology, 46(3), 397-408.

https://doi.org/10.2307/1415591 Stevens, S. S. (1935). The operational definition of psychological concepts. Psychological Review, 42(6), 517-527.

https://doi.org/http://dx.doi.org/10.1037/h0056973 Thase, M., Entsuah, A., & Rudolph, R. (2001). Remission rates during treatment with venlafaxine or selective serotonin

reuptake inhibitors. British Journal of Psychiatry, 178(03), 234-241. https://doi.org/10.1192/bjp.178.3.234 Trout, J. D. (1998). Measuring the intentional world: Realism, naturalism, and quantitative methods in the behavioral sciences.

Oxford University Press. van Fraassen, B. (1980). The scientific image. Oxford University Press.

Vessonen, E. (2019a). Operationalism and realism in psychometrics. Philosophy Compass, 14(10), Article e12624.

https://doi.org/10.1111/phc3.12624 Vessonen, E. (2019b). Representing and constructing: Psychometrics from the perspectives of measurement theory and concept formation [Doctoral dissertation, Cambridge University]. https://doi.org/10.17863/CAM.36695

Watson, J. B. (1913). Psychology as the behaviorist views it. Psychological Review, 20(2), 158- 177.

https://doi.org/10.1037/h0074428 Weiskopf, D. (2009). The plurality of concepts. Synthese, 169(1), 145-173. https://doi.org/10.1007/ s11229-008-9340-8 Worboys, M. (2013). The Hamilton rating scale for depression: The making of a "gold standard" and the unmaking of a chronic

illness, 1960-1980. Chronic Illness, 9(3), 202-219. https://doi. org/10.1177/1742395312467658 Yoakum, C., & Yerkes, R. (1920). Army mental tests. H. Holt & Company.

Zajac, J., Shrestha, A., Patel, P., & Poretsky, L. (2017). The main events in the history of diabetes mellitus. In L. Poretsky (Ed.), Principles of diabetes mellitus (3rd ed., pp. 3-19). Springer.

i Надоели баннеры? Вы всегда можете отключить рекламу.