ТЕСТЫ ИНТЕЛЛЕКТА, КРЕАТИВНОСТИ И ЭКСПЕРТНЫЕ ОЦЕНКИ
Д.В. УШАКОВ
Ушаков Дмитрий Викторович — заведующий лабораторией психологии и психофизиологии творчества Института психологии РАН, первый вице-президент Евроталанта (Европейского комитета по образованию одаренных и талантливых детей при Совете Европы), доктор психологических наук.
Автор книг «Интеллект: структурно-динамическая теория», «Рефлексивное развитие компетентности в совместном творчестве» (совместно с А.В. Растянниковым и С.Ю. Степановым), редактор учебного пособия «Когнитивная психология» (совместно с В.Н. Дружининым), книг «Познание. Общество. Развитие», «Одаренные дети: от теории к практике», «Социальный интеллект: теория, измерение, исследования» (совместно с Д.В. Люсиным). Контакты: [email protected]
В дискуссии, начатой столь профессиональными статьями, как это было в позапрошлом номере журнала, легко впасть в соблазн перейти на комплименты, тем более, что все статьи написаны осторожно и аккуратно, с пониманием острых углов и подводных камней непростой темы, так что может сложиться впечатление, будто авторы почти не противоречат друг другу. Однако, согласно французской пословице, «дьявол скрывается в деталях», и из, казалось бы, нюансов и акцентов после цепи рассуждений проистекают прямо противоположные для практики выводы.
Несмотря на согласие с 90% сказанного в открывающих дискуссию статьях, я сосредоточусь на 10%, с которыми я не согласен, поскольку именно концентрация на пунктах несогласия позволяет зафиксировать действительные проблемы, стоящие перед нами, и тем самым сделать шаг к разрешению этих проблем.
Тесты интеллекта: еще раз о прогностичности
По этому вопросу различные, чтобы не сказать противоположные, позиции были высказаны М.А. Холодной и автором этих строк (Ушаков, 2004; Холодная, 2004). Вопрос фактически распадается на два: численные оценки прогностической валидности тестов интеллекта и интерпретация этих численных оценок. Рассмотрим вопросы по порядку.
Обе статьи почти совпадают в численных оценках прогностической валидности психометрического интеллекта в отношении успеваемости. Прогностичность в отношении социального статуса, социальной мобильности и бытовых феноменов М.А. Холодная не обсуждает. Разногласия касаются только оценок прогностической валидности интеллекта в отношении успеха в профессиональной деятельности.
Думаю, что разрешить противоречие может применение следующих двух принципов отбора фактических данных для обоснования своего мнения.
Принцип первый: опора на первоисточники, а не на цитаты из них. Этот принцип понятен каждому, кто играл в детстве в «Испорченный телефон»: первый играющий шепчет слово на ухо второму, второй — третьему и т. д., а в результате сообщение искажается. К сожалению, психологи отнюдь не всегда правильно пересказывают первоисточники, причем не по злому умыслу, а просто ввиду сложности предмета. В результате после двух-трех туров цитирования исходное сообщение искажается до неузнаваемости1.
Принцип второй: ссылка на результат метаанализа приоритетна по отношению к ссылке на единичное исследование. Этот принцип требует несколько более подробного объяснения. Метаанализ — это направление математической статистики, которое развилось для того, чтобы помочь науке ориентироваться в данных, когда по одной и той же или сходной теме проведено большое количество исследований. Мета-анализ стал в последнее десятилетие одной из наиболее быстро развивающихся в западной психологии техник, поскольку там образовались
такие области, где на сходную тему выполнены десятки и даже сотни исследований. Одной из таких областей является изучение прогностической валидности психологических тестов в отношении профессиональных достижений. Таких работ уже не сотни, а тысячи. Конечно, когда в вашем распоряжении есть несколько сотен результатов исследований, вы можете выбрать из них те, где корреляции получились выше или ниже2. Можно найти исследования, где корреляция показателей интеллекта и профессионального успеха составляет 0.3, но можно указать и те, где такая корреляция — 0.8 (по поводу последних см., например: Gottfred-son, 1997). Кстати, по поводу корреляций уровня 0.8 вполне можно утверждать, что именно они самые точные, поскольку отражают взаимосвязь интеллекта с теми аспектами профессиональной деятельности, которые можно измерить объективно, а не на основе экспертных оценок.
По теме валидности психологических тестов в отношении успешности профессиональной деятельности мне известно три выполненных метаана-лиза. Это работы Дж. Хантера (Hunter, 1986), Э. Ханта (Hunt, 1995) и Л. Готтфридсон (Gottfredson, 1997). Все они приводят примерно к одним и тем же результатам, которые более подробно излагались в первой статье.
1Так, раскрыв статью Г. Троста (Трост, 1999), мы там находим только одну фразу о прогностической валидности тестов интеллекта в отношении профессиональной деятельности, которая обосновывается еще одной ссылкой.
2Следует учесть также, что корреляции имеют определенный доверительный интервал, который в психологических исследованиях оценивают очень редко. Обычно сообщается, что некоторая корреляция достоверна на уровне 1% или 5%, что означает лишь достоверность ее отличия от 0. Вероятность того, что эта корреляция меньше, например, чем 0.5, или больше, чем 0.7, обычно не сообщается.
Если Марина Александровна приведет примеры метааналитиче-ских исследований, которые покажут, что обобщенные цифры прогностической валидности для более или менее сложных профессий меньше, чем 0.5, то это будет поводом для меня пересмотреть взгляды на эту проблему. Однако все известные мне такого рода исследования приводят к более высоким показателям. Прогностическая валидность тестов интеллекта в отношении сложных видов профессий не ниже, а скорее несколько выше, чем в отношении обучения.
Следует еще, пожалуй, разъяснить приводимую М.А. Холодной ссылку на работы по так называемым «экспертам», где говорится, что их интеллект обычно не превышает 120 баллов. Я, к сожалению, не располагаю доступом к той работе 1993 г. Вольфганга Шнайдера, которую цитирует Марина Александровна, однако в моем распоряжении есть статья того же автора во втором издании цитируемой книги (Schneider, 2000), как и некоторые другие его труды. В более позднем переработанном варианте статьи нет численной оценки интеллекта экспертов, однако в ней ясно излагается, кого В. Шнайдер называет термином «expert». Хотя этим словом в литературе обозначают разных профессионалов от спортсменов до музыкантов, в его собственных исследованиях «экспертами» выступают дети и юноши — футболисты и игроки в теннис. Возникает вопрос: а почему интеллект игроков детско-юношеской футбольной команды должен систематически превышать 120 баллов? Кстати, 120 баллов — это
весьма высокий коэффициент интеллекта. Из свойств кривой нормального распределения интеллекта со средним в 100 и стандартным отклонением в 15 баллов следует, что лишь 16% населения превышают уровень интеллекта в 115 баллов и лишь 2 с небольшим процента — 130 баллов.
Более того, в той более поздней работе, которой я располагаю, В. Шнайдер делает совершенно очевидное утверждение, что интеллектуальный порог для «экспертов» разных профессий (минимальный уровень, необходимый для успешной деятельности) является разным «от много выше среднего (well above average) для областей/задач, где необходимыми компонентами являются сложная деятельность по решению задач и использование стратегий, до явно ниже среднего для менее сложных областей и задач, которые опираются в основном на автоматические процессы» (Schneider, 2000, p 174). По-моему, уже это является достаточно ясным признанием роли интеллекта в профессиональной деятельности «экспертов». Однако В. Шнайдер идет дальше и вообще высказывает сомнение в адекватности пороговой теории на том основании, что она не может объяснить вклад интеллектуальных способностей в успешность деятельности шахматистов и других «экспертов», интеллект которых превышает пороговые значения (Schneider, 2000, p 174).
Интерпретация: что такое
высокая и низкая валидность?
Пожалуй, однако, полемика в большей степени касается не фактов, а интерпретаций. Ведь, скажем,
цифру примерно в 0.5 как показатель прогностической валидности тестов интеллекта в плане обучения принимают, кажется, все стороны. Однако для кого-то эта цифра является убедительным свидетельством в пользу тестов, а для других — основанием считать, что тесты не справляются со своей функцией.
Зададимся вопросом: что такое высокая или низкая прогностическая валидность тестов интеллекта? Предлагаю следующий критерий ответа. Ум, или интеллект, отнюдь не единственное обстоятельство, определяющее успех в жизни и профессии. Этот успех зависит от случая, благоприятствования среды, физических (силы, красоты) и физиологических особенностей, других, кроме ума, психологических качеств. Мы можем попробовать примерно оценить, какую часть успеха (его дисперсии, выражаясь более наукообразным языком) могут объяснить внешние обстоятельства, другие индивидуальные качества, а какую — ум. Тогда прогностическая валидность может считаться высокой, если дисперсия успеха, объясняемая тестами интеллекта, примерно соответствует оценкам, полученным для роли ума в реальной жизни.
В то же время критикам тестов интеллекта, которые считают, что эти тесты не отражают реальный «ум» человека, нужно было бы доказать, что показатели тестов объясняют намного меньше феноменов из области профессиональной жизни и учебы (или из других областей реальной жизни), чем это можно было бы сделать, располагай мы более адекватными способами оценки человеческого ума.
Представляется, что те 30-35% дисперсии (что соответствует приводившейся в прошлый раз прогностической валидности на уровне 0.58), которые могут быть объяснены в успехе в сложной профессиональной деятельности тестами интеллекта, достаточно правдоподобно показывают реальное место интеллекта в жизни современного человека. Остальное приходится на долю жизненных обстоятельств (большая часть) и других индивидуальных особенностей (меньшая часть).
Зададимся вопросом: насколько большую роль в успехе человека в профессиональной деятельности и жизни вообще играют его личные достоинства, т. е. психологические качества, а какую роль — обстоятельства, случай? Очевидно, что роль случая велика. Молодой корсиканец Бонапарт не превратился бы в императора Наполеона, если бы ему не представились два счастливых случая — Тулон и 13-е вандемьера в Париже (Тарле, 1957). Более того, родись он на 100 лет раньше или позже и не застань времен Революции, вряд ли сегодня кто-то знал бы его имя. Но так же справедливо и то, что другой человек, не обладающий интеллектом, волей, работоспособностью и жаждой власти Бонапарта, не смог бы воспользоваться подвернувшимися возможностями. Таким образом, феноменальный взлет Бонапарта не был бы возможен как без его необычайных личных качеств, так и без воли случая (или судьбы — не в этом дело).
Пример Наполеона Бонапарта — это яркий, демонстративный случай. Жизнь большинства людей менее ярка, но закономерности остаются
теми же. Психология во многих случаях сумела зафиксировать влияние обстоятельств на профессиональный успех, как это было, например, сделано Д.К. Саймонтоном в отношении ученых (Simonton, 1988).
Большую роль в научном успехе, например, играет такое случайное обстоятельство, как место рождения. К. Берри (Berry, 1981, 1990) изучил культурное происхождение более чем 390 лауреатов Нобелевской премии в области науки. Он установил, что большая их часть происходит из больших городов. Так, 60% американских лауреатов происходило из Нью-Йорка или одного из городов Среднего Запада. В Германии люди, рожденные в Гамбурге, Мюнхене или Штуттгарте, в 10 раз чаще становятся лауреатами, чем выходцы из сельских районов.
Подобно этому, более половины американских выдающихся шахматистов происходит из районов Нью-Йорка, Сан-Франциско или Лос-Анджелеса (Gardner, 1982).
Большую роль играет религиозная принадлежность. Протестанты опережают католиков по вкладу в бизнес, науку и искусство таких стран, как США и Германия, где обе эти конфессии представлены (Knapp, Goodrich, 1952).
Большую роль играет также история ребенка в семье. Первенцы имеют существенно больше шансов добиться успеха в жизни (Cattell, Brim-hall, 1921; Roe, 1952).
Все эти факты говорят о большой роли внешних обстоятельств в жизненном успехе. Общество равных возможностей остается сегодня недостижимой утопией, а коммунизм в 1980 г. не состоялся. А раз это так, то
полного объяснения успеха в жизни на основе психологических особенностей личности в принципе быть не может.
Отсюда следует простой и ясный вывод: успех в жизни и профессии не может быть выведен из одних только индивидуальных качеств, там всегда присутствует и доля обстоятельств. Как распределяются между собой вклады этих двух факторов? Конечно, оценка здесь может быть лишь очень приблизительной, поскольку, с одной стороны, мы сегодня имеем еще слишком мало данных, с другой — соотношение этих вкладов — величина переменная, она зависит от общества, профессиональной ситуации и т. д. Все же можно сделать прикидки на основании размера эффекта влияния описанных выше средовых факторов (таких, как порядковый номер рождения в семье или место рождения) на достижение профессионального успеха. Эти прикидки показывают, что роль средовых факторов колеблется вокруг примерно 50%, оставляя другие 50% на долю индивидуальных особенностей людей.
Каково же место интеллекта среди других психологических свойств, влияющих на профессиональные достижения человека? Однозначного ответа на этот вопрос не может быть: все зависит от конкретных особенностей профессии. Можно выявить, однако, закономерности. Роль интеллекта тем больше, чем:
а) сложнее профессия,
б) больше вес отношений «человек—объект» и меньше — «человек—человек».
Сказанное можно проиллюстрировать результатами Армейского
проекта А, осуществленного в США, которые более подробно излагались в предыдущей статье. Обращение военнослужащих с современной техникой — это достаточно сложная деятельность, в которой наибольшую роль играют отношения «человек—объект». Дисперсия ее успешности, как легко вычислить на основании таблицы, приведенной в прошлой статье (Ушаков, 2004, с. 80), на 40% определяется интеллектом, на 2% — другими когнитивными осо-
бенностями и в совокупности на 1% личностными особенностями и мотивацией. 57% дисперсии при этом приходится на фактор внешних обстоятельств, непсихологические индивидуальные особенности и те психологические характеристики, которые ускользнули от примененных тестов. В целом эта доля дисперсии соответствует тому, что было сказано о роли обстоятельств в успехе человека. Наглядно результаты представлены на рисунке 1.
Рисунок 1
Предикторы обращения с техникой в рамках Армейского проекта А
I I Интеллект
□ □
Другие когнитивные способности
Личностные особенности и мотивация
Обстоятельства и необъясненная дисперсия
Если же мы возьмем такую сторону военной службы, как дисциплина, которая в меньшей степени основана на сложной когнитивной деятельности и в большей — на социальных отношениях, то результат окажется совершенно иным. Роль интеллекта там весьма мала и объясняет 2,5% дисперсии. Еще меньше вклад других когнитивных факторов. В то же время темпераментальные и личностные особенности могут объяснить чуть больше 10% вариации. Характерно, что необъясненная дисперсия оказывается выше в этом случае, чем в предыдущем, т. е. тогда, когда основную роль играют личностные
факторы, а не когнитивные. Это является косвенным свидетельством того, что тесты интеллекта отрабатывают свою роль много лучше, чем личностные тесты. Результаты представлены на рисунке 2.
Подведем итоги анализа. Представляется, что доля дисперсии профессионального и жизненного успеха, объясняемая психометрическим интеллектом, вполне соответствует разумным ожиданиям от роли, которую играет в жизни ум человека. Ум не решает всех проблем, иногда случается горе от ума, однако в целом он обеспечивает значительную долю успеха в современной жизни. Эти
Рисунок 2
Предикторы личной дисциплины в рамках Армейского проекта А
I | Интеллект
Другие когнитивные способности
Личностные особенности и мотивация
Обстоятельства и необъясненная дисперсия
□ □
характеристики ума достаточно хорошо отражаются в интеллекте, оцениваемом с помощью тестов. Конечно, любая операционализация латентной переменной не является идеальной, однако прогностическая валидность тестов интеллекта может быть оценена как очень высокая в контексте тех ожиданий, которые мы можем связывать с ролью ума в жизни современных людей.
Если мы описываем способности в терминах функциональных систем (Шадриков, 1994), то интеллект выступает как функциональный орган, играющий самую существенную роль во многих из этих систем. Тесты интеллекта в этом плане, если продолжать метафорический медицинский ряд, сознавая, конечно, всю его условность и неточность, можно сравнить не с термометром, а с исследованием типа УЗИ, оценивающим функционирование определенного органа. Конечно, исследованием не всей системы, а одного органа, но органа очень важного.
Тесты интеллекта и креативности
Завязавшаяся дискуссия затронула более широкий круг проблем, чем
только тесты интеллекта. В частности, Д.Б. Богоявленская подняла вопрос о тестах креативности. С ее критикой этого вида тестов вполне можно согласиться. Им по ряду параметров не хватает серьезности тестов интеллекта. Это касается прежде всего проблем с прогностической ва-лидностью. Исследования выявили парадоксальную ситуацию: тесты креативности в меньшей степени предсказывают то, на что они направлены,— продуктивность человека в реальном творчестве, чем тесты интеллекта.
Есть и некоторые другие проблемы. Для того чтобы повысить показатели тестов креативности, у испытуемых достаточно создать определенную установку, т. е. объяснить, что от них хотят и как будут оцениваться ответы. При этом, однако, возникает высокая корреляция с тестами интеллекта. Кроме того, в отличие от тестов интеллекта, имеющих большую генетическую обусловленность, тесты креативности ее не показывают. У психометрической креативности оказывается и довольно своеобразная возрастная динамика: происходит существенное снижение креативности в младшем
школьном возрасте по отношению к дошкольному. Все вместе сказанное приводит к гипотезе о том, что психометрическая креативность оценивает не столько стабильное свойство человека, сколько установку, которая может быть произвольно изменена.
Таким образом, с общей оценкой тестов креативности Д.Б. Богоявленской можно солидаризироваться, хотя и не всегда по тем основаниям, которые указывает автор. Вопросы, однако, возникают в связи с позитивной программой, предлагаемой в статье, а именно с использованием в качестве психодиагностического метода «Креативное поле».
Эта методика в ее главном варианте основана на цилиндрических шахматах, предложенных около века назад небезызвестным физиком Э. Махом. Д.Б. Богоявленская пишет, что проблема, «оборотная сторона» методики заключается в сложности и трудоемкости процедуры. Во многих случаях, однако, сложность и трудоемкость процедуры сегодня не является оборотной стороной. Для многих заказчиков «солидность» процедуры является скорее плюсом, создает видимость, обоснованную или нет, фундированности и серьезности метода и может служить оправданием высокой стоимости приобретаемого товара.
Проблема, однако, в другом. Диана Борисовна сообщает, что за 33 года существования методики было обследовано 7500 испытуемых (Богоявленская, 2004, с. 64). Однако ни в одной из двух ее книг не приводится необходимых данных о надежности методики (Богоявленская, 1983; 2002). Вызывает вопросы и способ оценки валидности (сообщение об
индивидуальных случаях вместо численных оценок прогностической валидности). Однако вопрос о ва-лидности имеет смысл ставить только после вопроса о надежности. Если методика ненадежна, то валидность не обсуждается. А.Г. Шмелев весьма образно разъясняет эту «аксиому теории измерения», как он выражается (Шмелев, 2004, с. 47), с помощью метафоры оружия, которое не обеспечивает кучности стрельбы.
Если бы Диана Борисовна сообщила о том, какова внутренняя согласованность ее методики и какова тест-ретестовая корреляция, то это открыло бы возможность обсуждать ее психодиагностические качества.
Тесты интеллекта и
экспертные оценки
А.Г. Шмелев внес в дискуссию важную проблему соотношения тестов с экспертными оценками и дополнения одних другими в рамках психодиагностической процедуры (Шмелев, 2004, с. 49-51). Представляется необходимым развести два аспекта проблемы. В первом случае экспертная оценка применяется для выявления того же свойства, что и тест. В случае тестов интеллекта такой подход вряд ли возможен, поскольку неоднократно показывалась неточность экспертных оценок интеллекта. В отношении же других свойств возникает следующее соображение: если мы имеем два метода оценки одного свойства и суммируем их, то полученная оценка будет, скорее всего, менее высокой, чем валид-ность лучшего из методов. Из этого следует, что, если эксперт и тест работают на одном поле, предпочтение
наиболее целесообразно отдать одной из двух процедур, той, которая более валидна. При этом непонятно, как «ассессмент центр», представляющий собой, насколько можно понять, комбинацию двух методов, оказывается более валидным, чем каждый из этих методов в отдельности. Приводимые А. Г. Шмелевым цифры оценки валидности экспертной процедуры и тестирования весьма любопытны, однако неясно, каким путем они получены.
А.Г. Шмелев говорит о тестах и экспертной оценке как о двух фильтрах в процессе отбора. Это оправданно в том случае, если мы не хотим пропустить тестируемых с показателями ниже какого-то порога, а даль-
нейшее повышение показателя нам безразлично. В более общем случае, однако, речь может идти об отборе из ограниченной выборки лиц, обладающих в наибольшей степени каким-то качеством или группой качеств. Тогда более оптимальным представляется второй вариант. Он состоит в том, что используются как тесты, так и экспертные оценки, причем экспертная оценка применяется для выявления того свойства, которое не доступно тесту. Говоря более профессиональным языком, принцип двух фильтров может повысить эффективность критериально-ориентированного тестирования, однако он не дает эффекта там, где тестирование ориентировано нормативно.
Литература
Богоявленская Д.Б. Интеллектуальная активность как проблема творчества. Ростов н/Д: Изд-во РГУ, 1983.
Богоявленская Д.Б. Психология творческих способностей. М.: Академия, 2002.
Богоявленская Д.Б. Что выявляют тесты интеллекта и креативности? // Психология. Журнал Высшей школы экономики. 2004. № 2. С. 54-65.
Тарле Е.В. Наполеон. М.: Изд-во АН СССР, 1957.
Трост Г. Возможность предсказаний выдающихся успехов в школе, университете, на работе // Иностр. психол. 1999. № 11. С. 19-27.
Ушаков Д.В. Тесты интеллекта, или горечь самопознания // Психология. Журнал Высшей школы экономики. 2004. № 2. С. 76-93.
Холодная М.А. Психологическое тестирование и право личности на собст-
венный вариант развития // Психология. Журнал Высшей школы экономики. 2004. № 2. С. 66-75.
Шадриков В.Д. Деятельность и способности. М.: Логос, 1994.
Шмелев А.Г. Тест как оружие // Психология. Журнал Высшей школы экономики. 2004. № 2. С. 40-53.
Berry C. The Nobel scientists and the origins of scientific achievement // Brit. J. of Sociology. 1981. 32. P. 381-391.
Berry C. On the origins of exceptional intellectual and cultural achievement // M.J.A. Howe (ed.). Encouraging the Development of Exceptional Abilities and Talents. Leicester: the British Psychological Society, 1990.
Cattell J., Brimhall D.R. American men of science. N. Y.: Science Press, 1921.
Gardner H. Art, Mind and Brain: a Cognitive Approach to Creativity. N. Y.: Basic Books, 1982.
Gottfredson L.G. Why g matters: The complexity of everyday life // Intelligence. 1997. 24 (1). P. 79-132.
Hunt E. The role of intelligence in modern society // American Scientist. 1995. 83 (4). P. 356-368.
Hunter J.E. Cognitive ability, cognitive aptitudes, job knowledge, and job performance // J. of Vocational Behav. 1986. 29. P. 340-362.
Knapp R.H., Goodrich H.B. Origins of American Scientists. Chicago: Chicago University Press, 1952.
Roe A. The making of a scientist. N. Y.: Dodd, Mead, 1952.
Schheider W. Giftedness, expertise and (exceptional) performance: a developmental perspective // K.A.Heller (ed.). International handbook of giftedness and talent. Oxford: Pergamon, 2000. P. 165-177.
Simonton D.K. Creativity, leadership, and chance // R.J. Sternberg (ed.). The nature of creativity. Cambridge: Cambridge University Press, 1988. P. 386-426.