Можно ли реорганизовать егэ? Или 10 тезисов, призванных помочь перейти от егэ к ега

Шмелев Александр

АЛЕКСАНДР ШМЕЛЕВ

Можно ли реорганизовать ЕгЗ?

(или 10 тезисов, призванных помочь перейти от егэ к ега)

О ЦЕЛЕВОЙ АУДИТОРИИ И ЖАНРЕ СТАТЬИ

Эта статья ориентирована на самый широкий круг читателей, интересующихся дискуссией вокруг ЕГЭ. Она во многом адресована и тем лицам, которые ныне отвечают за подготовку и проведение ЕГЭ, но написана не в жанре служебного (экспертного) доклада, а в более популярном жанре. Автор открыто апеллирует к здравому смыслу широкой аудитории.

татья была написано еще в конце 2008 года - накануне перехода к проведению ЕГЭ в штатном режиме. После этого уже произошло немало событий. Состоялся ЕГЭ-2009, была учреждена комиссия по ЕГЭ при Президенте РФ, подготовившая доклад, предполагающий необходимость определенных перемен в модели ЕГЭ (хотя и не таких быстрых и радикальных, как предлагается в этой статье). Автор статьи принял участие в создании, сборе и анализе данных серьезного опроса по стратегии модернизации ЕГЭ, который состоялся на сайте www.pedsovet.org и в котором приняло участие свыше 2200 работников образования.

Но все эти события не привели к тому, чтобы данная статья потеряла свою актуальность. Статья выдержана в достаточно стройной логике. Композиция ее выстроена на 10 авторских тезисах,

тесно связанных с выявленными в ходе дискуссии критическими аргументами против ЕГЭ.

Особое место в статье занимает параграф, в котором излагается логическая модель некоторой предлагаемой альтернативы для нынешнего ЕГЭ. Эта модель получила условное название ЕГА - «Единая Государственная Аттестация».

Основная мысль, составляющая суть авторского подхода к проблеме, заключается в том, что в ЕГЭ (в его нынешней модели) нарушена логика использования тестовых технологий и принятия решений по поводу аттестации учащихся. Тестовые технологии должны занять место вспомогательного инструмента, важного, но не единственного в системе ЕГА - Единой государственной аттестации (учащихся и абитуриентов).

ЛИЧНОСТНЫЙ КОНТЕКСТ СТАТЬИ

С переводом ЕГЭ в так называемый «штатный режим» явно обострилась общественная дискуссия вокруг этого проекта, ставшего самым заметным событием нашей образовательной реформы 2000-х годов, событием, приобретшим масштаб внутриполитического явле-ния1.

Увы, основные дефекты в аргументации и противников, и сторонников нынешней модели ЕГЭ не только сохранились, но, я бы сказал, с годами усугубились. С приходом ЕГЭ в столицу

1Я (автор статьи) был плотно вовлечен в дискуссии вокруг ЕГЭ еще со времен создания по моей инициативе и под моим руководством сайта информационной поддержки ЕГЭ www.ege.ru, а затем портала www.ege.edu.ru в 2001-2003 гг. В свое время я уже «выплеснулся», изложив немало аргументов в спорах с оголтелыми противниками ЕГЭ на открытых Интернет-форумах. Кстати, форумы на портале www.ege.edu.ru с тех пор, как я добровольно ушел с позиции его главреда, долгое время были попросту закрыты. А в кулуарах Минобразования, в составе вначале комиссии, а затем так называемой Рабочей экспертной группы, я изрядно «выплеснулся» в спорах с теми коллегами, которых впору назвать «оголтелыми сторонниками ЕГЭ». Ибо, поясню, главное в моей позиции: я поддерживаю принципиальную идею общенационального испытания, основанного на использовании тестовых технологий, но никогда не был согласен и остаюсь противником той модели ЕГЭ, которая ныне реализована.

дискуссия попала в фокус внимания центральных СМИ, но ее уровень после этого вовсе не вырос, а ЕЩЕ БОЛЕЕ ПОНИЗИЛСЯ. В ход пошли аргументы, уже совершенно далекие от всякого профессионального обсуждения, аргументы, характерные для грязных политических компаний, а не для научно-образовательных дискуссий. Хотелось бы оставить в стороне такие аргументы, которые базируются на новой волне обвинения чиновников в коррупции и особой алчности: мол, ЕГЭ - это изощренный инструмент выкачивания денег из родителей, инструмент уже не местного, а федерального масштаба. Мол, эпицентр коррумпированности переместился из школ и вузов в стены самих федеральных структур, организующих ЕГЭ... Это мы обсуждать не будем. Проблему коррупции давайте оставим для компетентных органов.

основные аргументы противников егэ

Приведем и попытаемся проанализировать перечень некоторых наиболее содержательных аргументов противников ЕГЭ. Может быть, их анализ поможет нам понять, как надо модифицировать нынешнюю модель ЕГЭ.

1) Натаскивание. ЕГЭ провоцирует переход школы от нормального образовательного процесса к «натаскиванию на тесты»; в результате ЕГЭ оказывается едва ли не ключевым фактором снижения уровня образования в стране, о чем свидетельствуют результаты самого ЕГЭ2.

2) Стресс. ЕГЭ нарушает права учащихся как неокрепших молодых организмов, так как создает чрезмерные перегрузки, приводит к нервным срывам.

3) Обезличивание. ЕГЭ, будучи стандартизованным и усредненным испытанием, не может раскрыть индивидуальность учащегося. В результате

Для того чтобы дискуссия была КОНСТРУКТИВНОЙ стороны должны быть точны и дисциплинированы в анализе аргументации своих оппонентов.

Россия теряет талантливых нестандартно мыслящих студентов.

4) Ошибки. ЕГЭ в своих заданиях содержит много ошибок и глупостей, эти ошибки - свидетельство того, что качество и уровень самих заданий ЕГЭ низок и это снижает планку образованности и учителей, и учащихся.

5) Дискриминация. ЕГЭ дает необоснованные преимущества для детей из

более обеспеченных семей, способных обеспечить доступ к репетиторским центрам, натаскивающим на сдачу ЕГЭ (а иногда и доступ к самим секретным вариантам ЕГЭ, хотя в такой модификации этот аргумент, конечно, весьма близок к лейтмотиву насчет коррупции).

6) Депрофилирование. Вузы, нуждающиеся в особой подготовке своих абитуриентов (элитные университеты, ориентированные на фундаментальную научную подготовку, медицинские вузы, вузы искусства и т.п.), не получают «своего студента», так как не могут через ЕГЭ предъявить к абитуриентам требования, отвечающие своему особому уровню, а главное - профилю (например, известны повышенные требования медицинских вузов к подготовке по биологии и химии, языковых вузов - к подготовке по иностранным языкам, юридических - к подготовке по обществозна-нию и т. п.).

7) Чрезмерная сложность заданий для одних учащихся и чрезмерная простота для других. Я намеренно не стал разделять эти два аргумента (про сложность и про простоту), ибо, очевидно, что взятые порознь они противоречат друг другу. Так как в основе ЕГЭ лежит идея соединения выпускного и вступительного экзамена, это и вызывает критику: как выпускной он оказывается слишком сложным, а как вступительный - слишком простым. То есть, критический аргумент направлен

2 Я не буду вводить в этот перечень критических замечаний явно абсурдные, вроде «ЕГЭ - это игра в угадайку». И дело не только в том, что среди заданий ЕГЭ немало заданий с открытом ответом, где угадать ответ невозможно. А дело еще и в том, что все тесты с выбором ответа (если они построены грамотно и содержат не 10-15 подобных заданий, а как положено - не менее 50) практически исключают получение высоких баллов с помощью угадывания (попробуйте-ка угадать хотя бы 40 из 50 исходов в игре «орел или решка», а ведь ответов в тестах предлагается не 2, а 4-5, что во много раз сокращает вероятность случайного угадывания).

об авторе

А.Г.Шмелев, доктор психологических наук, профессор МГУ, советник ФИРО, научный руководитель Центра тестирования и развития «Гуманитарные технологии»

Надо стараться понять, КАКИЕ именно черты нынешней модели ЕГЭ дают повод для КАКИХ именно аргументов противников ЕГЭ.

против того, что 2 разные задачи в ЕГЭ объединены, как говорится, «в одном флаконе».

8) Шкалы и баллы ЕГЭ - это какая-то «заумь и ахинея». Мало кто может осмыслить, почему, решив по одному предмету 80% заданий, учащийся может получить 60 очков по шкале стандартизированных баллов ЕГЭ. Примерно так происходит по русскому языку и соответствует школьной «четверке». При этом, решив по другому предмету только 60% заданий, учащийся получает 80 очков ЕГЭ. Примерно так происходит по математике и соответствует школьной «пятерке». Почему одни вузы на вступительных экзаменах присуждают «пятерку» за балл 70, а другие - за балл 95 дают только «четверку»?

9) Обязательный ЕГЭ - это принуждение, которое усиливает внутреннее отвращение учащихся к деятельности учения. Сторонники добровольности настаивают на том, что учащийся должен иметь свободу в выборе формы аттестации.

Казалось бы, чем не убедительный перечень?! В чем же проявляется низкий уровень дискуссии? А в том, что сторонники ЕГЭ почти ко всем этим аргументам, как правило, относятся как к... надуманным, но не сущностным. Мол, противникам ЕГЭ просто не выгоден ЕГЭ, поэтому они его и критикуют, а тут уж «любое лыко в строку». Хотя, впрочем, такой тип пренебрежительного отношения к оппонентам можно считать обоюдным: противники ЕГЭ считают сторонников опять-таки «материально-заинтересованными лицами», поэтому в суть критики традиционной системы экзаменов противники ЕГЭ тоже не вдумываются. Поэтому никакой точности и пунктуальности в дискуссии и не возникает.

В противовес каждому из этих аргументов сторонники выставляют, как правило, такой контраргумент, который НЕ имеет отношения точно к самому рассматриваемому аргументу. Важно подчеркнуть еще раз, что эта неразборчивость в споре носит обоюдный характер. Вот и получается: одни гово-

рят: «ЕГЭ - это стресс», другие отвечают: «Зато ЕГЭ - это объективное и независимое испытание». Одни говорят: «ЕГЭ - это натаскивание», другие отвечают: «Зато ЕГЭ снижает расходы на организацию вступительных экзаменов в вузах.» Спор в стиле: «а твоя машина - маломощная.» - «а зато твоя ест много бензина». То есть, как в детском саду: «А мой папа - сильный». - «Зато мой папа - умный».

Этот тип неконструктивной дискуссии я бы назвал ПРЕДВЗЯТО-РАЗНО-КРИТЕРИАЛЬНЫМ: каждая из сторон выбирает тот набор критериев для оценки вариантов решения проблемы, который более ей удобен, то есть, такой, который обосновывает предпочитаемое ей решение. При этом внимание широкой аудитории (большей части относительно нейтральных, непредвзятых наблюдателей) постоянно дефокусируется: оно не может никак сфокусироваться на одном, общем для двух сторон множестве критериев решения проблемы.

Теперь я могу сформулировать один из главных тезисов этой статьи.

Итак, ТЕЗИС НУЛЕВОЙ (он не

первый, так как далее хотелось бы сохранить нумерацию тезисов, соответствующую нумерации аргументов противников ЕГЭ).

Для того, чтобы дискуссия была КОНСТРУКТИВНОЙ, стороны должны быть точны и дисциплинированы в анализе аргументации своих оппонентов, должны обсуждать проблему в едином поле критериев, причем пытаться эти критерии ОПЕРАЦИОНАЛИЗИРОВАТЬ, сделать проверяемыми с помощью объективных данных.

Иными словами, надо стараться понять, КАКИЕ именно черты нынешней модели ЕГЭ дают повод для КАКИХ именно аргументов противников ЕГЭ. А, следовательно, поставить вопрос о том, КАК собрать объективную информацию о том, есть ли связь между указанными негативными явлениями и определенными особенностями нынешней модели ЕГЭ.

Далее я попробую дать хотя бы примерный образец хода рассуждений в указанных направлениях. Это приводит к следующему набору тезисов:

тезис первый. «натаскивание»

Оценка работы школ (и отдельных учителей) НЕ должна сводиться к баллам ЕГЭ.

Тот же В.А.Болотов (его можно и нужно критиковать за другое, но этого у него не отнять) неоднократно во множестве своих выступлений (не только публичных, но и на внутриведомственных совещаниях) открыто и директивно предостерегал против использования руководителями регионов баллов ЕГЭ для оценивания эффективности своих учреждений образования. Но это все равно произошло. И это привело уже по факту к тому, что натаскивание на вариантах ЕГЭ в некоторых школах (точные цифры не знает никто) действительно начало подменять нормальный образовательный процесс. И это действительно есть зло, и оно должно быть названо своим именем.

Я, как тестолог (специалист по тестовым технологиям), могу и ДОЛЖЕН открыто признать, что один из недостатков тестов состоит в том, что их нельзя часто предъявлять учащимся, так как они засоряют голову обрывочной и просто ложной информацией. В голове волей-неволей застревают так называемые «дистракторы» - ложные ответы из заданий с вынужденным выбором. Сами по себе тестовые задания (отдельные вопросы) внутри теста не образуют ясной логической связной структуры, они обрывочны и фрагментарны. И такой же обрывочной и фрагментарной, в результате, оказывается по факту структура знаний в голове у человека, который изучает только тесты, но не осваивает предмет как связную науку - как систему понятий, законов, принципов, фактов и методов их получения. Возьмем простой пример: Таблица 1.

можно ли лечить больного с помощью медицинских анализов? Можно ли лечить, в частности, с помощью рентгена? Очевидно, что само рентгеновское обследование - вредно, и его нельзя производить часто. Это метод анализа, а не лечения. Так и тесты - это метод контроля, но не метод обучения1.

Но обсуждая проблему натаскивания и даже открыто признавая обоснованность критики ЕГЭ в этом важнейшем аспекте, я бы, тем не менее, не стал ставить знак равенства между моим личным мнением и объективными статистическими данными. Очень важно, несмотря на наличие определенного мнения, отдельно взятого эксперта (даже если это мнение самокритичного сторонника тестовых технологий!), все равно поставить вопрос относительно поиска объективного и операционного способа проверить: А ДЕЙСТВИТЕЛЬНО ЛИ ИМЕННО ЕГЭ ПРИВОДИТ К НАТАСКИВАНИЮ? Надо всегда иметь в виду неочевидность этого утверждения, пока оно не подтверждено объективными фактами. А при добывании фактов мы должны всегда иметь в виду так называемую «полную комбинаторику условий»: должны рассматривать не узко ограниченное поле из двух событий - «ЕГЭ приводит к натаскиванию», «ЕГЭ не приводит к натаскиванию», но поле из четырех событий:

A) ЕГЭ приводит к натаскиванию;

B) ЕГЭ НЕ приводит к натаскиванию;

C) традиционные экзамены приводят к натаскиванию;

D) традиционные экзамены НЕ приводят к натаскиванию.

Эти четыре случая удобно изобразить в виде четырехклеточной логико-статистической таблицы (Таблица 1):

Школа (класс, регион) сдает ЕГЭ по данному предмету Школа (класс, регион) сдает обычный экзамен по данному предмету

Учитель натаскивает на тестах (на контрольных) А - процент (учителей, школ) В - процент (учителей, школ)

Учитель не сводит обучение к выполнению тестов (контрольных работ) С - процент (учителей, школ) D - процент (учителей, школ)

1 Кстати, сам по себе тезис о снижении качества образования в России по причине внедрения именно ЕГЭ нуждается, как минимум, в проверке. Многим понятно, что низкие баллы ЕГЭ отражают плоды неэффективной работы системы образования в течение многих лет до всякого ЕГЭ, о чем традиционная система экзаменов просто благополучно замалчивала. Так что тут уместно и поговорку известную вспомнить: «На зеркало неча пенять, коли рожа крива»...

Итак, что мы имеем на самом деле для заполнения такой таблицы? Имеем лишь экспертные мнения такого плана: А>С, а B<D, что в переводе на русский язык означает, что в случае ЕГЭ большинство учителей начинают натаскивать (A>C), а при традиционной системе экзаменов это делает меньшинство (B<D). А вот имеем ли мы объективные статистические данные? Кто-нибудь их систематически собирал? Кто-нибудь поставил задачу сбора этих данных как профессиональную социологическую задачу1?

Видите, как в данном контексте стоит вопрос. Вопрос не о том, КТО ПРАВЕЕ в данном случае. Я по многим другим вопросам не согласен с противниками ЕГЭ, но в данном вопросе я согласен. Я лишь ослабил бы утверждение насчет A>C, сформулировав сравнение не в пользу ЕГЭ так: отношение (или дробь) A/C > отношения B/D, что в переводе на русский язык означает следующее: в условиях ЕГЭ по сравнению с традиционным экзаменом относительно большая доля учителей скатилась к натаскиванию (хотя и не большинство учителей). Так что в данном случае между мной и оппонентами ЕГЭ и спора-то нет никакого! Мы фактически занимаем одну сторону в этом вопросе (с различиями в позиции скорее количественного плана, чем качественного).

Но главный вопрос - это вопрос о методах и способах аргументации. Для надежности и объективности своих выводов мы должны, строго говоря, организовать сбор массовой статистической информации и по этому вопросу тоже. Причем сделать это, конечно, непросто. Многие учителя, если их спросить прямо: «Натаскиваешь?», - ответят с определенной долей лукавства: «Да, натаскиваю». А лукавство у них проявится потому, что они - противники ЕГЭ, и знают, что «натаскивание» - это зло. Поэтому и таким способом (самым лобовым и дешевым) трудно собрать объективную информацию относительно влияния ЕГЭ на сам процесс обучения. Эта информация не будет достоверной, она будет искаженной. Надо использовать «нейтраль-

ные источники», а не искажающие. Сами учителя - это искажающие респонденты в таких вопросах. Нельзя получить с помощью учителей объективную информацию о ЕГЭ. Можно получить лишь информацию о том, как учителя ОТНОСЯТСЯ к ЕГЭ. И это давно и объективно установлено (тем же Центром социологии образования), что они относятся к ЕГЭ в большинстве своем плохо (почти две трети - против при колебаниях по разным регионам и по разным предметам). И этому плохому отношению есть вполне вразумительное объяснение: в ходе традиционных экзаменов учителя во многом сами оценивали результаты своего труда, кому же нравится, что им навязывают теперь внешнюю и независимую оценку? Посмотрите, как трудно внедрить любую систему аттестации персонала в любой отрасли, на любом предприятии2. Так что дело тут не в том, что ЕГЭ - тестовая технология. Любая внешняя (по отношению к учителям) экзаменационная технология, вызвала бы стремление учителей получше подготовить своих учеников к особенностям этой технологии.

Я был на встречах и с педагогами, и с руководителями региональных органов управления образованием. Вопросы задают с поразительной бесхитростной прямотой и «социалистической требовательностью»: «Сказали - будете проверять, так давайте заранее вопросы, которые будете задавать!».

Так что натаскивание-то оно было во все времена, только принимало отличную от нынешнего времени форму. Хотя, конечно, натаскивание на тесты более вредно, но. вспоминается классический анекдот советских времен про студента на экзамене по биологии, которого отчаявшиеся экзаменаторы (не чаявшие уже ничего услышать хотя бы на «тройку») подвели к двум скелетам - мужскому и женскому - и спросили: «Ну, а это кто? - Неужели Маркс и Энгельс?!» - воскликнул обрадовавшийся своей догадке студент. Было-было натаскивание в славные советские времена - в том числе на идеологические штампы и т. п.

Итак, повторюсь - на этом относительно (с моей точки зрения) бесспорном и понят-

1 Кстати, у нас есть Центр социологии образования в системе РАО, который уже собрал немало данных о том, как относятся разные участники образовательного процесса к ЕГЭ. Я слушал доклад директора этого Центра В.С.Собкина, но таких данных Центр точно еще не собирал - ни в инициативном плане, ни в плане кем-либо сформулированного задания. Упомянутый мной выше опрос на сайте www.pedsovet.org выявил такой факт, что «натаскивание» большинством учителей признается как «главный порок» ЕГЭ, но это лишь констатация субъективного (хотя и массового!) мнения, но не поведенческий, объективный факт как таковой.

2 См. статью Александра Крымова « Как вылечить оценку персонала ?», опубликованную в Интернете по адресу - http://www. ht.ru/press/a!tides/?view=a!t352.

ном вопросе про «натаскивание» я именно и хотел бы заострить вопрос о методах и логике ведения дискуссии: мы должны стремиться к объективным данным, к объективной информации.

Ну, а если говорить о том, как должна быть изменены нынешняя модель ЕГЭ, чтобы сократить вредный эффект натаскивания, то коротко обозначу некую идею (подробное ее обсуждение, как и вообще разговор об альтернативной модели ЕГЭ, - это не предмет настоящего параграфа). Как нельзя наказывать председателя колхоза за низкую урожайность почвы, доставшейся ему в силу объективных природных факторов (хотя жесткая капиталистическая экономика фермеров за это наказывает), так нельзя наказывать директора школы и учителей за низкий уровень образовательной культуры той общественной среды, в которую погружена данная школа. На баллы ЕГЭ влияет вовсе не только школа, но и родители, которые формируют или не формируют позитивную установку на учение у своих детей, материальная оснащенность региона (литературой, оборудованием), та же самая географическая и коммуникационная удаленность от центров культуры, уровень нравственного и физического здоровья населения (умственный, психический потенциал детей, как и родителей, может просто страдать от чудовищной экологии, неправильного питания, алкоголизма, наркомании, преступности и т.п.).

Какую прибавочную стоимость создает школа? Как измерить фон (аналог земельного кадастра), чтобы измерить точно эту прибавочную стоимость? С моей точки зрения, надо сравнивать баллы ЕГЭ (точнее баллы других, альтернативных образовательных тестов) и баллы объективного психологического измерения уровня развития умственных способностей детей (многие обстоятельства «образовательной экологии» проявляются в этом интегральном результативном показателе - уровне развития умственных способностей детей). Если школе достался «человеческий материал ниже среднего» (по уровню самих способностей), но она дала результаты ЕГЭ выше среднего, то это очевидный успех. Но если школа просто произвела «жесткую селекцию» (отчислив перед выпускными классами всех, кто заведомо снизит им балл ЕГЭ, набрав умненьких и ухоженных детишек из благополучных, обеспеченных

семей), то она вовсе и не обязательно покажет прирост в результатах образовательных тестов по сравнению с результатами психологических тестов. Скорее, наоборот - в рейтинге образовательных тестов она займет не столь высокое место, как в рейтинге психологических тестов. Вот тогда и получится гуманный разворот: школе будет выгоднее брать слабеньких детей, чтобы добиваться с ними хотя бы средних успехов, чем брать сильных детей, чтобы добиваться с ними успехов «едва выше средних».

Понимаю, мне могут возразить: а что меняется-то по существу, если тот показатель (средний балл ЕГЭ), который сейчас школа пытается максимизировать, вы превратите в числитель дроби? Все равно школы будут стараться максимизировать числитель (если не того хуже - минимизировать знаменатель)? Да, согласен, эта мера далеко не достаточная для противодействия риску натаскивания. Нужно еще и сам тестовый экзамен конструировать, проводить и учитывать так, чтобы самому среднему учителю было понятно, что натаскивание (избыточный тренинг в выполнении тестов) нанесет ущерб, а

не поднимет уровень ре- Надо правильно

зультатов.

Главную мысль следует сформулировать в общем виде: надо правильно вычленить, разделить, проанализировать различные управления обра-ФАКТОРЫ управления обра- зованием, чтобы, зованием, чтобы, наконец, наконец, научиться научиться им эффектив- ими эффективно

но управлять. Если в голо-

управлять.

ве управленцев вообще не дифференцируются ЗУНы (знания-умения-навыки) и способности (понятые как потенциал обучаемости вообще), то чего же ожидать? Если отечественная школа тестирования способностей была разгромлена еще в 30-е годы и до сих пор фактически не восстановлена, чего же ожидать? Если новомодные разговоры про «компетенции» замедлили осознание того, что такое «тесты способностей»?

тезис второй. «стресс»

Более высокий стресс на ЕГЭ - это во многом результат подмены понятий -вместо «единый» подставили понятие «единственный».

вычленить, разделить, проанализировать РАЗЛИЧНЫЕ ФАКТОРЫ

А может быть за годы, прошедшие со времен невежественной советской парт-госноменлактуры, хотя бы немножко «дураки перевелись»?

Итак, поговорим про стресс. Тут в дискуссиях публичного плана дело доходит нередко до слез и истерики. Мол, кто-то когда-то (даже под конкретным именем) совершил суицид на почве ЕГЭ и т. п. Правда, мало кто задается при этом вопросом: а если на устном экзамене «режут», задавая «небе-рущиеся вопросы» и невозмутимо глядят в глаза «зарезанному» - это не морально-психологический шок? Кто-нибудь подсчитывал количество суицидальных попыток в таких случаях? Впрочем, если больше половины абитуриентов идут на вступительных экзаменах к известному уже заранее знакомому экзаменатору (из числа репетиторов), то, конечно, стрессовость подобных поддельных экзаменов и впрямь оказывается ниже.

Можно, конечно, впасть тут в публицистический раж и подобрать «доходчивые» для широкой публики утверждения типа:

1) Люди боятся вообще любых экзаменов, если они не предопределены. Например, не превращены в формальное выставление заранее известных баллов - на основании годовых оценок, как это делается по факту на традиционных выпускных экзаменах.

2) Боятся тестовых экзаменов

Таблица 2.

прежде всего те, кто рассчитывает найти «особое понимание и заинтересованность» в глазах экзаменаторов на устном экзамене.

3) Боятся тестовых экзаменов те, кто научился списывать на обычных письменных экзаменах, но не научился «покупать ключи» к тестовым экзаменам.

и т. д., и т. п.

Но серьезный разговор о стрессе на экзаменах разных типов должен опираться не на подобные лозунги, а на исследования. Причем не надо путать такие исследования с опросами. Нередко сами учащиеся в ходе опросов неточно отражают свое физио-

логическое состояние накануне и в ходе экзамена. То, что привычнее, пугает меньше - это общая закономерность. Возьмите группу студентов, которая в ходе какого-то курса сдает промежуточные зачеты в тестовой форме, а потом предложите этой группе на выбор, что они предпочтут - устный экзамен или тест (я проводил такой педагогический эксперимент в реальных условиях много раз). У меня лично получалось так, что студенты предпочитали тестовый экзамен (абсолютное большинство студентов!). Кстати, в 1997-2001 годах, когда я проводил компьютеризированную Всероссийскую олимпиаду «Телетестинг», большинство участников этой массовой олимпиады (участвовали десятки тысяч человек) в ходе опросов голосовали в пользу тестового экзамена, причем, более способные (получившие более высокие баллы) чаще выражали предпочтение тестовой формы, чем менее способные. Но. и это все нечистые статистические данные. В них есть то, что самокритичные экспериментаторы называют «ошибка выборки». В «Телетестинге» участвовали далеко не все школьники, а более сильные (рассчитывавшие на победу и высокие баллы), добровольцы, согласившиеся на эту форму испытания.

Таким образом, опять-таки мы должны постараться для корректного ответа на поставленный вопрос о стрессе, организовать исследование (точнее - серию исследований в разных школах и вузах с участием разных экзаменаторов). Исследование, которое будет базироваться не на субъективных суждениях кого бы то ни было, а на объективных психофизиологических измерения показателей стресса у экзаменуемых во время тестовых и традиционных экзаменов. Причем, в тех условиях, когда у экзаменуемых нет выбора, и они вынуждены идти на экзамены в определенной форме. Вот как будет выглядеть логико-статистическая таблица в этом случае (Таблица 2):

Сдается ЕГЭ по данному предмету в ситуации вступительного конкурса Сдается традиционный экзамен в ситуации вступительного конкурса

Фиксируются объективные показатели деструктивного стресса на уровне тяжелой паники А - Процент экзаменуемых В - Процент экзаменуемых

Фиксируется умеренные показатели нормального мобилизационного стресса С - процент экзаменуемых D - Процент экзаменуемых

Конечно же, мы должны признать, что если правую строчку этой таблицы наполнять, исходя из «тепличных условий», которые раньше были на выпускных в школе, а левую - в ситуации серьезного конкурса в вузах, то мы получим влияние не фактора формы экзамена, а влияние фактора различий в мере ответственности экзамена.

Так что я хотел бы сформулировать следующее утверждение, которое обосновывает мою позицию в данном дискуссионном вопросе: нынешние критики-паникеры, которые запугивают детей «бабой ЕГой» (а некоторые учителя этим занимаются в наше время просто систематически), имеют ввиду вовсе не ту табличку чистого эксперимента, которая приведена выше, а некорректную модель для обоснования своей позиции (Таблица 3):

НЕТ никаких сомнений, что дробь A/C > B/D, но это связано вовсе не с формой экзамена (тестовая или устная), а с уровнем значимости экзамена для экзаменуемого.

Мне известны только исследования ситуации ЕГЭ с применением психофизиологических измерений, проведенные в Томском госуниверситете. Результаты таковы, что исследования НЕ выявляют более высокого стресса у абитуриентов при сдаче ЕГЭ по сравнению с традиционными вступительными экзаменами.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Есть одна положительная деталь, которую, при всех недостатках нынешней модели ЕГЭ, ее авторы заложили в структуру вариантов ЕГЭ: первые задания любого варианта по любому предмету очень простые, так что самые нервные экзаменуемые (и особенно те из них, которые подготовлены хорошо) после этих первых заданий вполне успокаиваются и предстартовая лихорадка у них заменяется на нормальное «боевое возбуждение» (мобилизационный стресс). Это, кстати, один из плюсов тестовой формы контроля: заданий в тесте гораздо больше, чем вопросов на письменном и устном экзамене (в билете), так что первые вопросы могут Таблица 3.

быть ободряюще простыми без потерь для надежности (точности) и валидности (прогностичности) результатов.

Таким образом, главный стрессиру-ющий фактор, который связан с нынешней моделью ЕГЭ, по моему убеждению, заключается вовсе не в форме экзамена (тестовая форма), а в том, что произошла подмена понятий. При сдаче ЕГЭ должно быть единство требований к экзаменуемым на всей территории страны (и по форме, и по содержанию заданий). Но это не обязательно проведение экзамена в один день по всей территории страны один раз в году!!! На самом первом заседании комиссии по ЕГЭ, еще под председательством В.М. Филиппова, я пытался возражать против такой подмены понятий, вступив в открытую полемику с министром. Но никто особенно слушать меня не хотел. Всем стратегам тогда очень понравился и показался убедительным такой популистский лозунг: «Ребята, не надо сдавать 2 раза в течение лета 2 экзамена по одному предмету, долой лишний экзамен». Ну, как же, кто любит экзамены? Чем меньше экзаменов надо сдавать, тем лучше. Не только дешевле для казны, но и меньше нервотрепки у детей и родителей. Как бы меньше...

На самом деле в ЕГЭ нервирует прежде всего отсутствие шанса на пересдачу и исправление случайного срыва. Почему в США тест SAT абитуриенты могут сдавать не один раз в году, а хоть 8 (восемь!) раз - в случае неудовлетворенности абитуриента своими результатами. Вначале они выбирают месяц. Могут начинать хоть с октября, если уже готовы. А потом можно каждый месяц пересдавать, пытаясь улучшить свой показатель. Вот в такой форме тестовый экзамен становится не стрессирующей обязаловкой, а инструментом, стимулирующим свободное стремление к достижениям. Такая подстраховка значительно снижает стресс

Сдается ЕГЭ по данному предмету в ситуации фактического вступительного конкурса Сдается традиционный мягкий выпускной экзамен, который НИКАК НЕ влияет на шансы поступить

Имеют внешние признаки деструктивного стресса на уровне тяжелой паники А - Процент экзаменуемых В - Процент экзаменуемых

Умеренные признаки нормального мобилизационного стресса С - процент экзаменуемых D - Процент экзаменуемых

Нельзя механически суммировать то, что противоречит друг другу! Это - азы логики использования независимых источников информации для комплексного (системного) решения!

во время выполнения тестового экзамена. Но для реализации такой схемы нужна совершенно другая организационная инфраструктура тестового экзамена, чем создана у нас в течение немалых лет по экспериментированию в области ЕГЭ. У нас аврал и мобилизация «всех и вся», включая учителей пения и физкультуры, которых расставляют в школьных классах для проведения ЕГЭ по математике и физике.

Куда уж тут рассуждать о соблюдении высоких стандартов в реализации непростой логистики (схемы информационных потоков и моделей безопасности) для осуществления профессионально-организованного тестирования?! Главный лозунг, как в советские времена: «Даешь рост поголовья проэкзаменованных по ЕГЭ!». Опережающий темп роста количественного охвата, в ущерб качеству. Повторение в течение уже восьми лет с малыми изменениями фактически одной модели ЕГЭ, которая не изучается интенсивно на предмет ее дефектов и способов их качественного исправления и улучшения, а постоянно «раскручивается» по кривой экстенсивного роста количественных показателей (количество регионов, количество участников, количество предметов, количество вариантов, количество пунктов проведения, количество экспертов по части «С», количество скан-неров, количество секьюрпаков), которые рассылаются по стране с помощью дорогой фельдъегерской почты, и т.п. Вместо качественного экспериментального мышления, направленного на критический анализ и объективное сравнение преимуществ и недостатков новой системы по сравнению с традиционной, мы видим настоящую, традиционную для еще советской бюрократической системы «процентоманию» -гонку за количественными показателями, как будто именно они и призваны убедить всех и вся в том, что эксперимент идет (и прошел) успешно. А, может, за годы, прошедшие со времен невежественной советской партгосноменлактуры, хотя бы немножко «дураки перевелись»? Может, новое руководство получило прививку в виде основ самостоятельного критического мышления, критического отношения к «магии больших цифр»?

И в США, и в других развитых странах тестовые экзамены проводят или специализированные подразделения хорошо оснащенных крупных образовательных учреждений на уровне вузов, или специализированные самостоятельные организации (региональные центры тестирования, которые чаще всего вырастают на базе вузов, а затем обособляются). Персонал этих организаций 365 дней в году борется за то, чтобы завоевывать доверие общества (различных потребителей) объективностью той информации, которую они порождают.

Конечно, хорошо, что с помощью ЕГЭ в определенной степени удалось поднять оснащенность каких-то школьных и межшкольных центров (хотя высокопроизводительные сканнеры им не слишком нужны, а компьютеры они получили по другой программе - программе информатизации). Но главный дефект - это отсутствие штатных подразделений, способных предлагать желающим проходить тестовый экзамен раз в месяц, а не раз в год! Такие штатные подразделения было бы и гораздо легче контролировать на предмет их методической, и финансовой чистоплотности в осуществлении своих функций. Вообще, вопрос созданной инфраструктуры ЕГЭ (начиная с федеральных ФЦТ и ФИПИ, а также РЦОИ - «региональных центров обработки информации») -это вопрос, который «прорастает» своими корнями во все обозначенные проблемы, а не только в проблему повышенной стрессогенности ЕГЭ.

В результате обсуждения двух первых проблем - «натаскивания» и «стрессоген-ности» - обозначен более обширный контекст, который нам пригодится при рассмотрении других проблем, связанных с ЕГЭ. Поэтому надеюсь, что их обсуждение окажется несколько более лаконичным. Кроме того, сама по себе проблема «стрессогенности» тесно увязана в системное единство с другими проблемами, в частности, с проблемой «обязательности - добровольности», но об этом ниже (см. тезис 9).

ТЕЗИС 3.

«ОБЕЗЛИЧИВАНИЕ»

ЕГЭ, как и олимпиады, не должен быть единственным источником аттестационной информации о выпускнике и абитуриенте.

Итак, теперь коснемся вопроса об «обезличивании». Чтобы снять с ЕГЭ статус единственного мерила, который угрожает нивелированием талантов, у нас уже не первый год много говорят об альтернативной траектории для попадания талантливых, неординарных студентов в вузы - системе предметных олимпиад. Как известно, она была создана еще в советское время, но особенно процветала в 90-е годы, когда вузы принялись превращать свои предварительные экзамены в предметные олимпиады. Мы не будем здесь делать акцента на том, чтобы олимпиады не превращались в лазейку для не самых достойных выпускников подшефных привузовских школ. Поговорим о другом: о логических недоработках и дефектах системы формирования и интеграции данных так называемого «портфолио» - общего множества сведений о достижениях учащегося за время получения среднего образования1.

У нас из-за привычного акцента во всех дискуссиях на размежевании и конфронтации вопрос ставится в разделительной манере «или-или»: или учитывать данные ЕГЭ, или учитывать данные Олимпиад, или учитывать данные вступительных экзаменов. Вот и получается, что одни абитуриенты зачисляются в вузы по результатам ЕГЭ, а другие - по результатам олимпиад. Для тех и других как бы формируются независимые квоты, они как бы не участвуют в общем конкурсе. А не пора ли поставить вопрос так: не логичнее ли учитывать и данные ЕГЭ, и данные олимпиад, и данные дополнительных (специфичных) вступительных экзаменов в вузы (там где у вузов есть силы и смысл их проводить), и данные внутришкольной четвертной (текущей) и годовой аттестации по формуле «И-И-И-И»?!

Вот тут мы подходим к обрисовке контуров альтернативной концепции ЕГЭ. Еще до оглашения министром образования В.М.Филипповым в 2001 году проекта ЕГЭ я опубликовал в газете «Первое сентября» (а эта газета была и инициатором, и спонсором олимпиады «Телетестинг» в течение пяти лет ее проведения) предложение о такой схеме интеграции «школьных оце-

нок» (годовых) и результатов независимого тестового испытания:

A) если нет значимого расхождения (расхождения остаются в пределах «плюс-минус балл» по пятибалльной шкале или два очка по десятибалльной шкале2), то школьнику присуждается более высокий балл (пусть тест сработает в его пользу, но не против него).

B) если есть значимое расхождение (более одного балла по пятибалльной шкале или более двух очков по десятибалльной), то проводится дополнительное испытание - традиционный (НЕтестовый!) экзамен с помощью независимой (внешкольной) комиссии.

Надо подчеркнуть, чем эта схема учета школьных баллов, отличается от того, что уже внедрялось еще в советские времена: в какие-то годы к баллу вступительных экзаменов вузы обязаны были приплюсовать средний балл школьного аттестата. Здесь речь идет не о механическом (арифметическом) суммировании, а логической взаимопроверке одним источником информации другого. Нельзя механически суммировать то, что противоречит друг другу! Это - азы логики использования независимых источников информации для порождения комплексного (системного) решения! Когда мы механически суммируем школьную «пятерку» и вузовскую «тройку» (разрыв подозрительный - более чем в один балл!), то это что-то вроде подсчета «средней температуры по палате». В этих случаях надо ставить вопрос о дополнительной проверке, а не о механическом суммировании, то есть, надо выяснять, какой из источников информации искажен. Либо завышает свою оценку школа, либо занижает вуз.

Эта моя идея, как мне говорил В.А. Болотов, повлияла на появление правила о присуждении более высокого балла при расхождении результатов ЕГЭ и школьной годовой в один балл, действовавшего все годы «экспериментального внедрения ЕГЭ», но от самого главного элемента этой

Ключевой тезис в отношении тестов: тесты - необходимый, но не достаточный инструмент оценивания учащихся.

1 С развитием Интернет-технологий разговор про «портфолио» в настоящее время из абстрактного превращается во вполне практический. В крупнейших социальных сетях (вроде vkontakte.ru) имеют уже персональные страницы едва ли не все студенты РФ и многие старшеклассники. Почему бы по сходной модели не создавать Веб-портфолио для каждого учащегося РФ? - Но... это предмет отдельного разговора.

2 Десятибалльная шкала на самом деле широко применяется в школе, только не объявляется и не осознается как десятибалльная: 10 - это «пятерка с плюсом», 9 - это просто «пятерка», 8 - это «пятерка с минусом» и так далее. Некоторые трактует эту шкалу даже как двенадцатибальную, но по факту крайне редко используются все 10 градаций оценок, не говоря про 12 градаций.

идеи мало что осталось. А именно: влияние по факту было установлено в одну сторону: балл ЕГЭ корректирует балл школьного выпускного аттестата, но годовая школьная оценка, увы, не повлияла на балл свидетельства по результатам ЕГЭ. А ведь в вузовские приемные комиссии идет именно свидетельство1!

Вот и получилось, что школьные учителя, которые знают своих учеников как никто другой, знают их нестандартные сильные стороны и слабости, - вот эти ключевые люди в системе образования оказались по факту отрезанными от влияния на тот балл, который абитуриент приносит в своем главном государственном документе в вузовскую приемную комиссию. В одном случае формула «И-И», казалось бы, сработала (в случае аттестата), но в более важном случае (для вузовской комиссии) сработала по факту формула «ИЛИ-ИЛИ».

Я не буду здесь говорить о том, насколько дорогой и насколько слабо-эффективной по соотношению «цена-качества» по реальной статистике является так называемая часть «С». Часть, требующая от экзаменуемого развернутый ответ на открытый вопрос - написать микроэссе, дать полное решение, то есть, выкладки при решении задачи математической или физической, то есть, фактически нестандартизирован-ная часть ЕГЭ2. Если тут еще начать обсуждать экономическую сторону ЕГЭ, то конца и края не будет и так продолжительному тексту.

Но кратко надо попытаться объяснить суть. Ибо сейчас благодаря, в частности, позиции А.А. Фурсенко снова возобновились разговоры про «портфолио», которые затихли на тот период, когда, казалось бы, ЕГЭ придавил все другие источники информации о качестве подготовки абитуриентов.

Итак, главный смысл портфолио заключается в таком тезисе: НЕТ ИДЕАЛЬНЫХ МЕТОДОВ ОЦЕНКИ КАЧЕСТВА ОБРАЗОВАНИЯ, ПОЭТОМУ НАДО УЧЕСТЬ РЕЗУЛЬТАТЫ МНОГИХ МЕТОДОВ. Наблюдение за учеником в течение нескольких лет - важнейший источник, который воплощается в документированные результаты (годовые оценки). Давайте его учитывать. Этот источник не идеален? Да, так как очень многие учителя, как правило, завышают оценки своих учеников (неизбежно смешивая эти оценки с самооценкой своей работы), а также могут иметь в классе любимчиков и «отверженных». Поэтому этот источник информации надо ДОПОЛНЯТЬ (не заменять, а ДОПОЛНЯТЬ) другим источником. Могут быть таким источником результаты олимпиад? Да, могут. Хотя, в свою очередь, и это не идеальный источник. И он тоже должен быть ДОПОЛНЕН. Какими другими источниками? Могут учитываться еще и результаты независимого тестирования. Они тоже не идеальны (так как тесты имеют свои недостатки). Итак, приходим постепенно к пониманию ключевого тезиса в отношении тестов: тесты - необходимый, но не достаточный инструмент оценивания учащихся.

Тесты объективнее и при правильной технологической организации лучше защищены от фальсификаций (труднее списать, подделать результат). Кстати, правильная технология тестирования предусматривает предъявление вовсе не 15-20, как это бывает в вариантах ЕГЭ, а не менее 50 заданий типа «А» (с выбором ответа из заданных вариантов), а лучше - ближе к 1003. Именно тогда сокращается негативный эффект «случайного угадывания» и повышается позитивный - «добыть шпаргалку» для такого большого количества вопросов очень трудно. Осо-

1 Отчасти это произошло в результате технического недоразумения, эффекта инерции. Дело в том, что главный исполнитель ЕГЭ Федеральный Центр Тестирования (ФЦТ) уже 10 лет до появления ЕГЭ, выдавал сертификаты по централизованному тестированию без всякого учета школьных баллов. Так и пошло дальше - в свидетельство ЕГЭ никто и не подумал включать какой-либо учет школьных баллов. Тут надо было внедрять в практику информационного обеспечения ФЦТ создание особой базы данных, в которой заносились бы школьные (годовые) оценки, но в этом направлении никто не стал работать.

2 Часть «С» - это часть, составлявшая и составляющая главную гордость главного методиста по структуре и содержанию ЕГЭ при Министерстве Г.С. Ковалевой - руководителя коллектива авторов, победившего на первом и фактически единственном конкурсе на модель ЕГЭ, проведенном в 2001 году. Коллектива из ИСО РАО (Института Содержания Образования Российской Академии Образования). Я был в 2001 году едва ли не единственном членом жюри этого конкурса, пытавшимся оспорить необходимость предъявления ВСЕМ экзаменуемым части «С», пытавшимся доказать, что рентабельнее и этичнее (политкорректнее, как сейчас принято говорить) будет предъявлять ее в другой день (позднее) и только тем, у кого разошлись школьные баллы и баллы по тестовой части ЕГЭ - части «А» (выбор ответа) и «В» (краткий свободный ответ).

3 Достаточно взглянуть на то, сколько заданий с выбором ответа используется в самых авторитетных международных сертификационных системах. Например, на первом этапе сертификация для получения сертификата CFA (chartered financial analyst) в течение сеанса за 4 часа экзаменуемому предъявляют 240 заданий с выбором ответа (см. http//analystnotes.com/ browse exams.php). На первом этапе сертификации для получения лицензии практического психолога в северной Америке испытуемому предъявляются 300 заданий с вынужденным выбором (см. http//www.ht.ru/press/articles/?view=art282). Но важно, что за этим этапом идут другие этапы - это письменный экзамен (эссе) и собеседование с комиссией (устный экзамен).

бенно хорошо защищены тесты при проведении компьютерного тестирования, порождающего уникальные варианты на компьютере с помощью алгоритмов так называемой «рандомизации» (случайной выборки заданий из большого банка заданий) и «автоматической подстановки» (подстановки разных новых данных в макет задания1). Но тесты довольно поверхностны и больше приспособлены для диагностики репродуктивных знаний, чем глубины и логической связанности структуры знания.

Я во многих своих выступлениях и пуб-ликациях2 предлагал сравнивать структуру знаний с деревом (есть, как известно, такие модели знаний в когнитивной психологии - концептуальные деревья). Тесты хорошо приспособлены для объективного измерения ширины дерева (как бы поверхностной кровли, это объем фактологических и терминологических знаний), но при этом тесты неваж-ненько оценивают стройность дерева (стройность ветвления), и еще слабее - глубину корневой системы (прочность и самодостаточность знаний для их саморазвития). Для оценки активных, продуктивных познавательных компетенций и способностей необходим опытный экзаменатор - для оценки умения обосновывать, излагать, искать, задавать вопросы, ориентироваться в неожиданных обстоятельствах.

Но опытный экзаменатор (тем более независимый и объективный) - это самый дорогой ресурс, его трудно найти и привлечь. Уж лучше и не затевать вовсе подобную работу, если «под руками» на местах мы имеем дело лишь с предвзятыми, заинтересованными экзаменаторами. Гораздо дешевле применять тесты и компьютеры. Поэтому не стоит тратиться на проведение и проверку части «С» и тем более на устное собеседование в очевидных случаях, когда нет никаких расхождений между результатами теста и «истори-

чески-накопленной оценкой» (эта сумма оценок, накопленных за годы обучения называется в тестологической литературе academic history score). Вот этот подход, который я пытаюсь еще раз обосновать именно в этой статье, и создает определенную предпосылку для перехода от ЕГЭ к ЕГА - системе «Единой государственной аттестации», в которой тесты оказываются лишь одним из элементов.

За годы проведения «Телетестинга» я убедился, что тестовый балл и обычная школьная оценка расходятся вовсе не так часто, чтобы перепроверять ВСЕХ ВСЕГДА В ПОЛНОМ ОБЪЕМЕ ПО САМОЙ ДОРОГОСТОЯЩЕЙ ОЦЕНОЧНОЙ ТЕХНОЛОГИИ^!). Больше половины (по некоторым предметам и регионам до 80%) учащихся в «Телестинге» получали ТУ ЖЕ САМУЮ оценку, что имели в школе, - получали по компьютерному тесту, в котором использовался такой мощный инструмент для обеспечения достоверности (защиты от фальсификаций), как рандомизация.

Рандомизацией мы называем автоматизированный случайный выбор компьютером в момент тестирования 50-70 заданий из банка в сотни и тысячи заданий. Дополнительный эффективный прием при этом - это случайное перемешивание ответов, так что правильный ответ предъявляется на экране компьютера в разных индивидуальных вариантах на разной позиции. Именно этот прием «убивает» массовые шпаргалки типа «номер вопроса - номер ответа»3.

Таким образом, по факту получается, что в большинстве случаев школьные учителя достаточно ОБЪЕКТИВНЫ. Так зачем же создавать стране дополнительные затраты на дополнительные проверки тех учеников, которые получили свою объективную оценку двумя самыми дешевыми способами - через сравнение «И-И» школьной оценки и дешевого по затратам компьютерного тестирования1

1 Американские тестологи называют такую технику автоматизированного клонирования тестовых заданий в ходе самого сеанса тестирования «on the fly» - «на лету».

2 См. Шмелев А.Г. (главный редактор) - Тесты для старшеклассников и абитуриентов. Телетестинг. - Ежегодное приложение к газете «Первое сентября». - М.: Первое сентября, 2000, - 137 стр.

3 В 2010 году принято уже решение отказаться от заданий типа «А» на едином экзамене по математике. Увы, это определенный «шаг назад» в плане обеспечения информационной безопасности. Качественных заданий типа «В» (на краткий ответ) невозможно создать так много, как можно создать заданий типа «А». Задания «В» не уничтожают существование шпаргалок для них. Если математики боялись, что задания «А» можно решать с помощью подстановки

(не требующего привлечения тысяч квалифицированных экспертов для проверки сотен тысяч микроээсее - решений задач в части «С»)?

Я уверен, что стране просто некуда деться, ей придется разрабатывать схему «портфо-лио» (немножко более по-русски это можно знавать «портфелем оценок») - и с целью оптимизации соотношения «цена-качество», и с целью дополнения и взаимопогашения методических недостатков разных методов оценки, и с целью восстановления нарушенного политического баланса в учете внутри-школьных и внешкольных оценок.

В этой статье я не пытаюсь навязать какую-то строго-определенную схему интеграции результатов разнотипных методов

- схему работы «портфолио». Я пытаюсь покорректнее сформулировать задачу

- корректнее, чем она ставится и звучит в пылу непрекращающихся неконструктивных споров. Я пытаюсь сформулировать логику подхода, который фактически еще никогда толком не применялся в российском образовании. Эта методология - не есть мое изобретение. Эта методология аттестации внедрена в передовых системах «оценки персонала» в крупных транснациональных корпорациях. Согласно этой методологии интегральный рейтинг качества специалиста формируется не на основе одного источника информации, не на основе механического суммирования данных из разных источников, но на основе сравнения непротиворечивости данных, полученных из разных источников. То есть, работа по выяснению степени согласованности независимых (друг от друга) инструментов соединена в данной методологии воедино с формированием комплексного (интегративного) оценочного рейтинга (рейтинг-балла).

Важно подчеркнуть, что даже в том случае, если человек получил диплом лауреата олимпиады, тестовый экзамен все-таки должен показать хотя бы «тройку» (зачет), а лучше всего, если он покажет балл в пределах «доверительного интервала» (с понижением не более одного балла по традиционной шкале). Слишком высокое своеобразие мышления у талантливого человека (в отсутствие базовых знаний, базовой адаптивности в выполнении простейших заданий) - ничего хорошего не предвещает. Такие люди будут явно не готовы к обучению в большинстве

современных вузов, которые требуют определенной дисциплины и технологичности: хотя бы усвоения текстов, предъявленных через Интернет, а значит и привычки «водить мышкой» (многие преподаватели вывешивают для своих студентов в Интернете программы занятий, методические указания, то, что раньше называлось «раздаточным материалом» и т.п.). Во многих вузах текущий контроль базируется на выполнении несложных компьютеризированных тестов. И что тогда будет делать в вузе этот своеобразный гиперталант? Опять под него придется проектировать индивидуальный план обучения? Он будет особым образом сдавать экзамены и зачеты и т.п.? Потом он поступит на работу, где будет ожидать опять-таки глубоко индивидуального подхода со стороны руководства: чтобы дали свободное посещение офиса, чтобы не требовали никаких отчетов о проделанной работе в стандартизированной, письменной форме и т.п.? А не проще ли задать определенные требования к минимальной социализации с самого начала? Значительная часть таких однобоких талантов тогда несомненно дисциплинируется, станет организованнее и ответственнее.

ТЕЗИС ЧЕТВЕРТЫЙ. «ОШИБКИ»

Сам ЕГЭ надо разбить на 2 этапа, это повысит контроль качества выполнения первого, тестового этапа, и в этом случае ошибок в ЕГЭ будет гарантировано меньше, чем при традиционной системе экзаменов.

Когда журналисты раздувают какую-нибудь нелепую ошибку в заданиях ЕГЭ (хотя нередко на поверку оказывается, что это вовсе и не задания ЕГЭ, а результат подделки «под ЕГЭ» со стороны каких-то недобросовестных издательств), то возникает вопрос: а каков сравнительный удельный вес таких ошибочных заданий в вариантах ЕГЭ и в вариантах традиционных письменных и устных экзаменов (в билетах хотя бы)?

В ЕГЭ ежегодно создаются по каждому предмету буквально ТЫСЯЧИ новых заданий. Потому что в ЕГЭ гораздо больше заданий (вопросов) внутри варианта (на порядок больше) и больше вариантов. Кроме того, задания традиционных экзаменов не публикуют и они не рас-

ходятся массовыми федеральными тиражами, так как их аудитория гораздо уже (только абитуриенты одного вуза или даже одного факультета, например). Почему никто не задается вопросом: сколько ошибок в заданиях традиционного типа? Просто потому, что эти задания не так видны, их трудно проанализировать и подсчитать число ошибок?

По моим прогнозам, если мы построим логико-статистическую табличку, которая позволяет сравнить качество заданий ЕГЭ и других экзаменов, то мы получим, скорее всего, сравнительные данные не против ЕГЭ, а в пользу ЕГЭ (Таблица 4):

Вот такая гипотетическая табличка могла бы содержать цифры (это мое предположение, а не факт), которые бы подтвердили бы значимое превосходство ЕГЭ по качеству заданий на достаточном уровне статистической надежности. Но кто и когда поставил задачу построить такую табличку? Если бы всю энергию, употребленную сотнями и тысячами людей на бесплодные споры по этому вопросу, употребить бы на создания подобной таблички, то все выглядело бы значительно более однозначно!

Почему я предполагаю, что удельный вес ошибок в банке заданий ЕГЭ меньше! Потому, что я знаю, что задания ЕГЭ проходят не идеальный, но гораздо более тщательный и более многосторонний отбор, чем традиционные задания (в этом, кстати, заслуга определенных вполне добросовестных специалистов, которые год от года совершенствуют эту систему фильтрации заданий в рамках ФИПИ - Федерального института Педагогических Измерений1).

Кстати, уж если говорить об ошибках, то в ЕГЭ действует более регламентированная и ясная практика корректировки результатов в случае их обнаружения уже на этапе проведенного экзамена: недостающие очки по этим заданиям (одно очко не более!) засчитывают-ся в пользу учащегося. А как работает

Таблица 4.

подобная практика в том случае, если в ходе устного экзамена экзаменатор с нечеткой дикцией вдруг не выговорил какое-то ключевое слово - ключевое для понимания абитуриентом данного вопроса? К сведению: из-за всяких дефектов устной процедуры, резко снижающих ее объективность, на Западе в большинстве вузов уже давно просто отказались от устных экзаменов и применяют только письменные (тут хотя бы судебные разборки в случае иска о нарушении объективности стоят дешевле - есть письменный документ, к которому могут обращаться независимые эксперты).

В ЕГЭ с вариантами есть другая более острая проблема, чем наличие ошибок в отдельных заданиях. Это проблема не обеспеченной эквивалентности вариантов по трудности. Так как из-за сложности защиты бланковой информации от утечки, приходится производить гораздо больше вариантов, чем это потребовалось бы при использовании компьютерного тестирования. Не хватает времени и других ресурсов, чтобы апробировать все эти десятки вариантов (иногда сотни производных вариантов, которые получаются в результате перемешивания). В результате индекс средней трудности заданий в бланковых вариантах ЕГЭ может различаться на 5%, а в определенных случаях различия доходят до 10. Компьютерная модель позволяет вычислять трудность заданий (по проценту правильных ответов), не разглашая сами задания (в виде печатных тестов) - задания промелькивают на экране и быстро сменяются другими заданиями (хотя, конечно, нужно чтобы дежурные в компьютерном классе не начали попросту фотографировать задания с экранов).

Конечно, я был и остаюсь сторонником именно компьютерной модели тестирования (неважно назовем ли мы это тестирование словом ЕГЭ, или «централизованное тестирование», или «Теле-

Варианты ЕГЭ Обычные варианты

Ошибочные задания 1 1

Безошибочные задания 1 000 50

1 Многие годы эту работу возглавляет А О. Татур, с которым автору данной статьи довелось сотрудничать еще в конце 90-х при проведении самых первых конкурсов для авторов тестовых заданий.

тестинг»). Я всегда и везде это заявлял и никогда не скрывал. Я не считал компьютерное тестирование таким массовым и общедоступным (хотя в последние годы количество компьютеров во всех учреждениях российского образования стало уже огромным), чтобы обеспечить всеобщий охват всех выпускников в обязательном порядке. Но я считал, что более высокая защищенность компьютерного тестирования от массовой утечки информации, позволит производить на его основе более качественные, хотя и более камерные эксперименты. Причем только на добровольцах - тех, кто хочет добровольно в этом участвовать, чувствует себя готовым. Опыт «Телетестинга» показал, что выборки при этом будут достаточно репрезентативными для самых серьезных выводов - уже десятки тысяч учащихся мы имели на рубеже 1990-2000-х годов, хотя и не сотни тысяч (как в случае бланковой модели). Но это создаст более прочную основу и более надежную и ясную перспективу

- без риска массовых подозрений, что кругом все торгует ключами к вариантам ЕГЭ. В случае «рандомизации» ключи как таковые «умирают»: уже невозможно создать компактную шпаргалку вида «номер вопроса - номер ответа», ибо в каждом сеансе компьютерного тестирования номера эти меняются (и ответ появляется на разной позиции на экране).

Но. никакая технология оценивания НЕ является идеальной. Честным профессионалом это хорошо понятно. Речь идет лишь о сокращении того, что профессионалы называют «риск ошибки измерения». Лучший способ сократить процент ошибок, а также и снизить стресс перед вероятным провалом

- это разделение тестового и экспертного этапов ЕГЭ. При этом надо поручить подготовку и проведение каждого этапа РАЗНЫМ организациям. Это будет и определенной прививкой от монополии, и позволит внутри каждого этапа реализовать в большей степени те наиболее выгодные аспекты каждой технологии оценивания, которые имеются, но сейчас не используются. Сейчас в ЕГЭ эти 2 технологии объ-

единены и скрадывают технологические преимущества каждой технологии (если не сказать резче - «пожирают друг другу»).

Приведем пример. Для тестовой технологии важнейший инструмент - жесткий контроль времени: в международной практике принято на разные последовательные блоки теста вводить свои лимиты времени (дело доходит до ограничений не в часах, а в минутах!). Так что у учащихся просто не хватает времени на то, чтобы «рыскать в шпаргалках», в своих «электронных банках данных» (если им даже удалось протащить с собой карманные компьютеры или коммуникаторы, хотя пункты проведения должны оборудоваться рамка-ми-металлоискателями). В экспертной технологии, в которой даются задания на сложность, а не на скорость, даются более свободные и продолжительные отрезки времени на экзамен в целом. Что же происходит в ЕГЭ? На весь экзамен - до 4 часов без дифференцированного контроля времени на части А, В и С. Вот так «скрестили ужа с ежом»1.

Сейчас на короткие задания с коротким ответом (особенно если их мало) экзаменуемые успевают получить подсказки, вырвавшись на перерыв в туалет (я это лично выяснял не только в ходе прямых инспекторских поездок по разным регионам, в которых проводился ЕГЭ, но и в тех сотнях анонимных сообщениях, которые приходили на форум ege.ru). Никогда тесты в мировой практике не затягивают так, чтобы возникла потребность выхода в туалеты. Это нонсенс! Тестовый сеанс эффективен, если продолжается до 90 минут (а для школьников лучше не затягивать далее 60 минут). Опыт «Телетестинга» показал, что можно получить настолько же валидные результаты за 40 минут компьютерного тестирования (при предъявлении от 50 до 70 заданий по предмету), что и за 90 минут бланкового централизованного тестирования.

Таким образом, разведение по разным дням тестовой и экспертных частей ЕГЭ позволит оптимизировать достижение следующих целей:

1 Более поздний опрос с участим тысяч пользователей сайта pedsovet.org еще раз доказал, что наши учителя в своей массе в тестовых технологий НИЧЕГО НЕ ПОНИМАЮТ: очень малый процент участников опроса проголосовал за то, чтобы ввести раздельный контроль времени по разным частям экзамена.

1) Проводимый на первом этапе Федеральный независимый тестовый экзамен (ФНТЭ) станет высоко-технологичным, максимально-компьютеризированным (будет происходить в компьютерных классах) и защищенным от фальсификаций. Главные исполнители на местах в этом случае - 1Т-специ-алисты, инженеры, обслуживающие компьютерные классы в пунктах проведения (лучше всего при крупных вузах или межшкольных центрах).

2) Проводимая на втором этапе Федеральная Независимая Экзаменационная Комиссия (ФНЭК) будет реализовать лучшие качества экспертных технологий оценивания знаний. Здесь более глубокие письменные задания с полным ответом, ориентированные на проверку независимыми экспертами. Здесь же возможно потребуется и проведение устных, апелляционных заседаний Комиссии - в режиме очного собеседования с экзаменуемыми по спорным вопросам в их письменных работах.

Понятно, что себестоимость проведения второго этапа (если его не сводить к профанации, а создавать комиссии из реально независимых специалистов) намного выше, чем себестоимость первого (и с прогрессом информационных технологий разрыв будет расти). Поэтому на второй этап целесообразно посылать не ВСЕХ выпускников, а тех, кто на первом этапе продемонстрировал противоречивые показатели - противоречащие накопленным баллам в ходе школьного обучения.

Подчеркнем, что в сложных драматических случаях Комиссия будет подстраховывать учащихся от неожиданных провалов в ходе тестового экзамена. Вдруг у кого-то просто заболела в момент тестового экзамена голова, и учащийся показал балл много ниже своих возможностей. Не фатально! Он попадает на комиссию и выполняет фактически традиционный письменный экзамен.

ТЕЗИС ПЯТЫЙ. «ДИСКРИМИНАЦИЯ»

Он затрагивает вопрос о дискриминации и гласит: «Рост авторитета любой системы экзаменов нельзя

обеспечить приказом, он достигается эволюционно - по мере накопления год от года общественного доверия к качеству подготовки тех, кто получил высокие баллы».

Против упомянутого мной выше «Телетестинга» в свое время (да и сейчас) прозвучало тоже немало острых возражений. И один из них фактически сводился к тезису о дискриминации: вводя компьютерную форму тестового экзамена, вы создаете неравные условия для тех, кто имеет в школе (и дома) компьютеры и для тех, кто их не имеет.

Да, казалось бы, массовый бланковый экзамен в этом смысле более демократичная форма, чем компьютерное тестирование. Работать с бумагой и ручкой умеют все выпускники, а вот жители отдаленных и бедных поселков и маленьких городков не имеют возможности постоянно тренироваться выполнять тесты за компьютером.

Да, казалось бы, звучит пафосно и архи-гуманно: «Надо заботиться о малоимущих детях!». Не буду сейчас обрушиваться на возможное лицемерие некоторых господ-товарищей, которые так заявляют (как будто они не знают расценки на довузовскую подготовку к сдаче экзаменов в традиционной форме). Важно проанализировать проблему объективно, а не голословно. Если бы мы опять организовали эксперимент и пригласили бы в нем участвовать городских и сельских детей (живущих вдалеке от Интернет-кафе, не имеющих в своих бедных сельских школах компьютеров вовсе), то на самом деле еще не известно, что бы мы получили в этом эксперименте. Нажать на четыре или пять кнопок (при четырех или пяти вариантах ответа) дети обучаются без всякого компьютерного опыта за 10-15 минут и дальше с удовольствием это делают так же быстро, как те, кто это делал уже много лет. Кроме того, тесты знаний - это не компьютерные игры на скорость в перестрелке. О спокойных и вполне довольных сельских детях мне радостно писали сельские учителя, привозившие своих сельских детей в город - участвовать в «Телетестинге». Но мы тогда не собрали точную объективную информацию. Хотя логико-статисти-

Таблица 5.

ческая табличка должна была бы выглядеть так (Таблица 5):

Здесь пришлось бы обрабатывать несколько иную информацию - не процентную, а средние баллы по тесту с учетом разброса (дисперсии). Впрочем, не будем уводить читателя в дебри дисперсионного анализа. Мне важно подчеркнуть, что такого рода данные позволили бы проверить мою гипотезу: в тесте простой моторной реакции выбора (из четырех клавиш) сельские дети после часовой репетиции вовсе не уступят городским (хотя они и не умеют быстро работать мышкой, но это и не требуется), или, если уступят, то меньше, чем в самом образовательном тесте, потому что различия между ними имеются скорее в уровне содержательной подготовки, чем в уровне готовности к компьютерному тестированию - как к особой форме тестирования. Только реальные объективные эксперименты - это путь противостояния той демагогии, которой, как вирусом, заражены едва ли не все наши дискуссии о путях развития российского образования.

Теперь о прогностичности экзаменов. Увы, в обывательских дискуссиях вокруг ЕГЭ даже само понятие «прогнос-тичность» (валидность), как правило, не фигурирует. Как же трудно сформировать у людей ориентировку на это понятие - в таком замусоренном смысловом пространстве!

Если преподаватели вуза, которые принимают экзамены у студентов на первом курсе, знают, кто прошел по результатам ЕГЭ (независимого тести-

рования), и если они настроены против этой системы, то от них можно ожидать, увы, не полной объективности в оценивании этих студентов. Преподаватели могут быть сознательно (или подсознательно) критически к ним настроены. И мы опять получим искажения, даже если решимся, наконец, просчитать статистическую связь (коэффициент корреляции) для двух (подчеркиваю двух, а не одной) формы экзамена - тестовой и традиционной. Вот как, по моему мнению, должна быть спроектирована логико-статистическая таблица для минимальной чистоты эксперимента по проверке прогностической валидности тестового экзамена (Таблица 6):

В этой таблице под «осведомленностью» вузовских экзаменаторов я подразумеваю, знают они или не знают, кто из студентов был зачислен по ЕГЭ, а кто - другим образом. Только сравнение между собой четырех разных коэффициентов корреляции позволит устранить возможный артефакт, связанный с фактором «осведомленности» преподавателя. Не исключено, что мы получим преимущество ЕГЭ в прогностичности лишь для группы «неосведомленных экзаменаторов». Но я не исключаю, что мы можем и не получить в таком эксперименте никакого преимущества ЕГЭ в прогностичности ВОВСЕ! Почему? Потому что нынешняя модель ЕГЭ имеет очень много недостатков. Некоторые обладатели очень высоких баллов ЕГЭ вызывают подозрения просто «невооруженным» глазом. Особенно приехавшие из тех регионов (городов и дере-

Простейший клавиатурный тест Сложный по содержанию образовательный тест (ЕГЭ)

Сельские дети (бескомпьютерные) Средний балл и дисперсия (разброс) Средний балл и дисперсия (разброс)

Городские дети (компьютерные) Средний балл и дисперсия (разброс) Средний балл и дисперсия (разброс)

Таблица 6.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Баллы зачетки за 1-й курс в ВУЗЕ, полученные от осведомленных экзаменаторов Баллы зачетки за 1-й курс в ВУЗЕ, полученные от НЕосведомленных экзаменаторов

Вступительные баллы абитуриентов, зачисленных по результатам ЕГЭ Коэффициент Корреляции Коэффициент Корреляции

Вступительные баллы абитуриентов, зачисленных по результатам традиционных экзаменов Коэффициент Корреляции Коэффициент Корреляции

вень), где вдруг «ни с того, ни с сего» на графике распределения тестовых баллов после «нуля» в интервале от 70 до 90 баллов появляются целые группы учащихся с баллами свыше 90. По всем нормам зарубежной тестологической практики такая конструкция графика распределения (с локальным экстремумом ближе к высокому правому полюсу шкалы тестовых баллов) считается свидетельством «утечки ключей к тесту»1.

Но и не это главное: никакими экспериментальными данными обществу не навяжешь на самом деле доверия к определенной форме тестирования. С помощью такой аргументации в лучшем случае в чем-то можно убедить узкий круг экспертов и лиц, принимающих решение (ЛПР), но не массу населения. Масса населения, если потеряно на много лет доверие к коррумпированной власти, все равно будет считать, что «своим» эти высоколобые толстосумы все равно подсунут на экране компьютера более легкий и известный вариант, чем чужим детям.

В том, что определенная система не производит дискриминации, надо убеждаться долго - отслеживая образовательную карьеру многих носителей высоких и низких результатов, полученных по этой системе. В науке это называют «схема проверки прогностической валидности». Но в реальной социальной жизни требуется еще больше лет и участников живого эксперимента, чем в науке.

Нужна другая система мотивации самого вузовского персонала (от руководителей до рядовых преподавателей и администраторов вспомогательных службы, норовящих ныне пристроить своих детишек тоже «поближе к себе»). Если вуз (как коллектив людей) не видит других возможностей поправить свое материальное положение, чем создавать трудности «на входе» для поступающих и вымогать тем самым у общества недостающие средства, то очень трудно заинтересовать такой вуз в том, чтобы искать и учить действительно перспективных студентов - тех, кто, завершив вуз, трудоустроится на

большую зарплату и будет ее получать устойчиво. Вот если бы нам удалось переориентировать вузы на то, как ему кормиться не «на входе», а «на выходе»

- не на поступающих, а на выпускниках. Это было бы куда как грамотнее и здоровее для общества. Но тогда и вузам пришлось бы побыстрее перестраиваться - в соответствии с постоянно растущими и меняющимися требованиями работодателей. Пока же фактическая организация финансовых потоков для многих вузов подрывает сами основы общественно-полезной мотивации в их деятельности.

тезис шестой. «депрофилирование»

Схема дополнения ЕГЭ (тестового экзамена) вузовскими профильными экзаменами должны быть создана, но должна быть обоснована и прозрачна.

Во многих вузах балл ЕГЭ, как и итоговый балл школы, - это не информация для зачисления, а лишь информация для допуска (приглашения) абитуриента к участию в конкурсе. В самом деле, зачем вузу тратиться на прием экзамена у абитуриента, у которого нет необходимой базы не только для сдачи вступительных экзаменов, но для главного

- для освоения вузовской программы. Правда, бывают ситуации (и, увы, нередко), когда вузу хочется «поднять конкурс». В высоком конкурсе многие вузы видят для себя не только престиж, но и инструмент давления на общество, недоплатившее вузу по квалификации его персонала. Но почему бы вузам не перестроиться для оглашения двух вполне официальных и публичных конкурсов (или двух этапов одного конкурса):

А) Заочного конкурса «портфолио», включающего результаты ЕГЭ и других испытаний (школьный аттестат, олимпиады и т.п.).

Б) Очного конкурса, включающего прием профильных экзаменов.

Что же такое профильный экзамен? Он, по мнению многих здравомыслящих людей (кстати, и В.А.Болотов часто высказывался в таком смысле) должен не дублировать по уровню и содержанию ЕГЭ и школу (все те же зада-

1 Некоторые выборочные проверки, особенно на грамотность в русском языке, проведенные осенью 2009 года в ряде вузов (в том числе на журфаке МГУ) подтвердили тот факт, что некоторые «стобалльники» получили на самом деле липовые свидетельства, ибо реально пишут безграмотно.

ния, только принимают экзамен другие люди), а должен отражать специфику вуза - должен иметь мотивированное ИНОЕ содержание. Например, такое, какое имеют творческие конкурсы в театральные и художественные вузы. Почему бы будущим медикам (и психологам, кстати) не предложить «этический тест» - на уровень рассуждения и мышления при решении этических задач-кейсов, моделирующих определенные жизненные коллизии.

И тут мы приходим к важной проблеме логики учета баллов заочного и очного вступительных конкурсов. Надо отчетливо различать:

A) Арифметическое суммирование. Даже если заочный и очный баллы суммируются с разными весами (например, заочный весит 60%, а очный - сорок), это все равно арифметический подход, имеющий свои дефекты в логике возможных исходов. При этом очень высокий очный балл может компенсировать совсем неудовлетворительный заочный балл абитуриента. И если таких случаев очень много, то я бы лично не стал доверять доброкачественности такой системы приема в таком вузе.

B) Поэтапный отсев. Это гораздо более ясная логика, которая, на мой взгляд, скорее вызовет рост доверия. Вначале абитуриент должен набрать какой-то определенный минимально-достойный балл на заочном этапе. Только после этого он допускается до очного этапа. Конечно, такой подход трудно применять вузам (факультетам), которые балансируют на грани с недобором.

C) Комбинация А и В: на втором этапе суммирование баллов происходит только для тех абитуриентов, которые прошли и А, и В1.

ТЕЗИС СЕДЬМОЙ. «ЧРЕЗМЕРНАЯ СЛОЖНОСТЬ ЗАДАНИЙ ДЛЯ ОДНИХ УЧАЩИХСЯ И ЧРЕЗМЕРНАЯ ПРОСТОТА ДЛЯ ДРУГИХ»

Уровень сложности заданий ЕГЭ (тестового экзамена) должен быть снижен.

Если, как мы видели из предыдущего параграфа, ЕГЭ занимает подобающее

ему место предваряющего заочного испытания-фильтра, то совсем нет необходимости «впихивать» в варианты ЕГЭ трудные задания, которые вышибают пот и слезы из учителей, и выпускников средних и слабых школ. Чтобы сдать такой у прощенный тестовый экзамен нужно лишь надежно разбираться в основах.

А стоит ли тут тратить слова, чтобы еще что-то комментировать? Упрощение заданий ЕГЭ снимает многие проблемы, включая необходимость натаскивания и страх перед стрессоген-нейшим из экзаменов.

А как же отбор в вузы? - спросят сторонники формирования контингента студентов на основе ЕГЭ. Отвечаю: для многих вузов (если не для большинства) достаточно доброкачественным контингентом будут выпускники школ, надежно и достоверно показавшие, что основы среднего образования у них есть. А вот вузам, выставляющим абитуриентам особые и повышенные требования, все равно придется применять дополнительные, профильные конкурсные испытания. Поэтому и нет никакого смысла «впихивать» в ЕГЭ сложные задания, которые теперь по цепочке вгоняют в истерику вначале школьных учителей, а затем и учеников.

ТЕЗИС ВОСЬМОЙ.«ШКАЛЫ И БАЛЛЫ ЕГЭ - ЭТО КАКАЯ-ТО «ЗАУМЬ И АХИНЕЯ»

Шкала баллов ЕГЭ должна быть сокращена вдвое и прозрачно увязана с традиционной школьной системой баллов.

В одной из своих статей, написанной совместно с М.Б.Челышковой и опубликованной в журнале «Вопросы обра-зования»2, я уже пытался обосновать непригодность нынешней шкалы ЕГЭ по ряду критериев, главный из которых - непрозрачность для широкой публики. Там я пытался предложить шкалу от 1 до 200 (выходящую за пределы 100), что уподобляет наше российское решение британской системе, принятой для тестов о полном среднем образовании. Такая система делает людей, получивших средний балл в районе 100, бо-

1 На самом деле «комбинированный» логико-арифметический подход - вполне типичный для наших традиционных конкурсных экзаменов в ВУЗы: те, кто получил «двойку», не участвуют в дальнейших конкурсных экзаменах, а для остальных производится суммирование набранных баллов.

2 Шкалирование результатов Единого экзамена: проблемы и перспективы. - В журнале «Вопросы образования», №4, с. 168-186.

лее спокойными в отношении к своей невысокой позиции по сравнению с теми, которые получают баллы выше 100. Заодно снимается путаница с процентами.

Но сейчас мне кажется, что шкала 1-200 - это опять-таки экзотика. А нашим согражданам нужно что-то попроще, попонятней и постабильней (то есть, поближе к привычным реалиям). Но опять-таки нельзя использовать 100-балльную шкалу, так как путаница с процентильной шкалой в этом случае будет ГАРАНТИРОВАНА (на эту путаницу сбиваются все, включая министров, которым трудно в пылу полемики упомнить, что здесь речь идет скорее про «градусы», чем про проценты).

В настоящее время людям было бы проще сориентироваться в шкале от 16 до 55 (точнее от 1.6 до 5.5), на которой десятки надо было бы просто-напросто связать с традиционными градациями на пятибалльной школьной шкале оценок:

от 4,6 до 5,5 - это разные градации школьной «пятерки» (так что 5,3 можно было бы интерпретировать как пятерку с тремя маленькими плюсами, а 4,8 - пятерку с двумя маленькими минусами);

от 3,6 до 4,5 - разные градации школьной «четверки»;

от 2,6 до 3,5 - разные градации школьной «тройки».

от 1,6 до 2,5 - разные градации школьной «двойки» (учащимся такие нюансы внутри категории «неуд» скорее всего не пригодятся практически, а для образовательной статистики они важны).

Можно и «кол» в этой системе ввести при желании (это предложение не раз высказывал на разных совещанием И.И.Калина), но дело не в этом.

Я убежден, что на фоне шкалы от 16 до 55 была бы востребована (а главное - осмыслена) как независимая информация процентильного характера, или, как ее иногда называют, «рейтинговый относительный балл»: информация о том, сколько процентов участников тестирования, набрали балл ниже данного участника. Я, кстати, много лет добивался, чтобы в свидетельство ЕГЭ были указаны 2 числа: сам результат (отражающий число решенных зада-

ний) и место, занятое абитуриентом по стране. Как в спорте: есть результат в секундах (сантиметрах, килограммах) и есть место в данном соревновании.

При шкале «16 - 55» было бы проще организовать интеграцию баллов тестирования со школьными итоговыми оценками - без всяких сложных пересчетов. Если школьная оценка «тройка», а за тестирование учащийся получил балл 36 (или 3,6 - три целых и шесть десятых), то все понятно «на пальцах»: разница менее 10 очков (менее 1 балла по обычной шкале) и присваивается итоговый балл в пользу учащегося, то есть, 36 читается как «четверка, хотя и с четырьмя маленькими минусами». А вот если по независимому тестированию школьник получил балл 19 (ниже тройки на 11 очков), то ему предстоит Независимая Комиссия, ибо не набрал не то что «двойку с плюсом», но получил просто «двойку с минусом» (одним маленьким минусом - балл 1,9 по пятибалльной шкале).

Все сложные пересчеты шкал, основанные на алгоритмах ШТ, надо оставить для кабинетных изысканий и ученых поисков оптимизированных математических прогностических моделей. А на широкую публику надо вывести простые, объявленные еще до всяких экзаменов таблицы соответствий сырых баллов (количество решенных заданий в тесте) и стандартизированных едино-масштабных баллов. Конкретно-визуальную логику табличного приведения сырых шкал к единому масштабу (при наличии в разнопредметных тестах разного количества заданий) ученики и учителя еще готовы осилить, а вот логику абстрактных формул - линейных, тем более нелинейных преобразований сырых баллов в стандартизованные - уже невозможно объяснить массам. Пробовал я когда-то объяснять обратный нормальный интеграл на форумах портала ЕГЭ и понял, что порождаю своими любыми словами лишь в лучшем случае тихую ярость.

Вот как может выглядеть априорная (то есть, объявленная еще до экзамена) конверсионная таблица (таблица перевода, если говорить русскими словами) по какому-нибудь предмету (не буду приводить здесь конкретный

предмет), в котором 60 тестовых заданий (Таблица 7).

И при этом следует заранее объявить для всех школ (и вузов) 2 вещи:

А) точные соотношения внутри интервалов будут объявлены предметной комиссией только после проведения массового тестирования;

Б) комиссия оставляет за собой право двигать границу между интервалами, но не больше, чем на 2 очка (многолетняя практика проведения ЕГЭ уже позволяет рискнуть давать такие обещания).

Предлагаемая шкала будет удобна и на этапе интеграции результатов такого модифицированного ЕГЭ с вузовскими дополнительными экзаменами: при суммировании двух баллов с равным весом 5,0 плюс 5,0 получится сумма 10,0. Конечно, в теоретических случаях возможен и балл 11,0 (сто десять), что означает «пять с пятью плюсами на двух экзаменах», но это уж какая-то редкость. Превышение над 5.0 - удобная цифровая семиотика для учета результатов на олимпиадах. Это, как правило, «пятерка» с многими плюсами.

Вот так можно получить формулу интегрального конкурсного балла абитуриента (КБА) из четырех источников (при равных весовых коэффициентах каждого источника):

КБА = Балл школы + Балл ЕГЭ + Балл олимпиады + Балл вступительного экзамена1.

Но важно добавить: использование этой формулы возможно лишь в тех случаях, если балл по каждому последующему источнику не противоречит предыдущему баллу (не расходится с ним более, чем на один балл). Как этого достичь? Очень просто. Суммируются только результаты тех абитуриентов, которые попадают на следующий этап вузовского конкурса: проходят заочный этап и попадают на очный.

ТЕЗИС ДЕВЯТЫЙ. «ОБЯЗАТЕЛЬНЫЙ ЕГЭ - ЭТО ПРИНУЖДЕНИЕ, КОТОРОЕ усИлИвАЕТ внуТрЕннЕЕ ОТВРАЩЕНИЕ УЧАЩИХСЯ К ДЕЯТЕЛЬНОСТИ УЧЕНИЯ»

Никого не надо заставлять получать балл ЕГЭ, если просто учитывать его с весом хотя бы 25% в конкурсном балле абитуриента, но зато обязательно учитывать!

Итак, приучаем абитуриентов-старшеклассников (и их родителей) к самостоятельным экономическим расчетам: «Если тебе хватает всего двух компонентов для проходного конкурсного балла (школьного балла и балла вступительного экзамена) и ты не видишь смысла мучиться-сдавать ЕГЭ, то не сдавай». Но если ты собираешься в вуз с высоким конкурсом, где каждое очко будет на вес золото, то придется сдавать, чтобы набирать очки - придется и в олимпиаде участвовать, и набирать баллы по всем зачетным предметам по максимуму.

Некоторые коллеги (та же Г.С.Ковалева) выступают против добровольности ЕГЭ, аргументируя это тем, что в результате на выборке одних только «добровольцев» мы получим смазанную (нерепрезентативную) картину уровня образования в стране. Но, я утверждаю, что навязывание ЕГЭ всем и вся ради репрезентативной статистики - это политическая ошибка. Порождение массового сопротивления ЕГЭ - это слишком дорогая цена за репрезентативную статистику.

И два слова насчет платности. Не надо смешивать добровольность с платностью ЕГЭ. А то у нас мыслят так: если вводим добровольность, то берем плату. Нет, предоставьте возможность выпускникам сдавать ЕГЭ (по крайней мере одну первую попытку в жизни) на бесплатной основе. Тогда будет меньше разговоров про дискриминацию и т.п.

Таблица 7.

Число решенных тестовых заданий 0 - 22 23 - 32 33 - 48 49 - 60

Стандартизированные баллы 1,6 - 2,5 (двойка) 2,6 - 3,5 (тройка) 3,6 - 4,5 (четверка) 4,6 - 5,5 (пятерка)

1 При этом баллы школы и ЕГЭ целесообразно суммировать только в том случае, если они хотя бы грубо близки, то есть, не опровергают друг друга (см. параграф 10). В случае грубого расхождения вместо «школьного балла» надо использовать результаты «второго контрольного тура» - результаты проведения ЕГЭ-2 в письменной форме с привлечением независимой комиссии для проверки результатов письменного экзамена (далее вводится для сокращения аббревиатура НЭК - Независимая Экспертная Комиссия).

тезис десятый. модель ега должна воспроизводить логику диагностического мышления.

Когда мы аттестуем или рейтингуем учащихся, мы не должны действовать механически. Мы должны исходить из того, что каждый источник информации может содержать погрешность и поэтому должны применять логику диагностического мышления. Вещь эта пока неведомая для наших образовательных управленцев, ибо такой предмет как «психодиагностика» им никто не преподавал. Поэтому придется формализовать определенную логику последовательного прохождения определенных этапов в рамках ЕГА выпускников и конкурсного отбора абитуриентов, которая мне видится правильной.

Итак, постараемся в заключительном параграфе познакомить читателя, наконец, со схемой предлагаемой альтернативы нынешнему ЕГЭ.

Единая Государственная Аттестация (ЕГА) должна, согласно логике диагностического мышления, базироваться не на доминировании ЕГЭ, а на использовании Федерального Экзаменационного Теста (ФЭТ) как одного из компонентов системы, как одного из источников информации о выпускнике и абитуриенте.

О том, как формируется балл ЕГЭ для выпускников можно увидеть на рис.1.

Конкурсный балл абитуриента целесообразно затем формировать по аналогичной логической схеме (см. рис.2.).

Из приведенных двух главных траекторий и для выпускника, и для абитуриента должны быть продуманы и утверждены особые исключения (для инвалидов, сирот, победителей международных олимпиад, для вузов, имеющих недобор абитуриентов, но готовящих необходимых для государства специалистов, и т.п.). Но главная логика должна быть понятной, хотя и многоэтапной.

Предложенные на рис.1 и 2 траектории следует воспринимать именно как иллюстративные схематичные идеи, но не как точный завершенный и математизированный алгоритм действий и подсчетов. Тут еще предстоит конкре-

тизировать (в случае принципиального запроса на подобную конкретизацию), такие вопросы:

1) Как формируется балл АБВ, если учащийся НЕ принимает участие в тестовом экзамене ФЭТ? Должен ли он при этом обязательно проходить внешкольный экзамен НЭК?

2) С каким весом входят в аттестационный балл выпускника (АБВ) баллы ИШБ, ФЭТ и НЭК в случае их несовпадении или отсутствия одного из ком-

Итоговый Школьный Балл (ИШБ)

Если ИШБ и ФЭТ совпадают в пределах доверительного интервала

Балл Федерального Теста (ФЭТ)

Переход на второй этап ЕГА

Более высокий из ИШБ и ФЭТ

Балл Независимой Экспертной Комиссии (НЭК)

Аттестационный Балл Выпускника (Балл АБВ)

Рис.1. Две главные траектории формирования баллов ЕГА для выпускников в схеме двухэтапного проведения ЕГЭ

понентов весового суммирования? То есть, означает ли отсутствие одного из компонентов присвоение ему значения «ноль» в формуле?

3) Аналогичный вопрос касается ин-тегративного Конкурсного Балла Абитуриента (КБА). С каким весом в него входит балл ПВО (олимпиадный балл) в случае несовпадения или неучастия абитуриента в олимпиаде?

Балл АБВ (Аттестационный

Предварительные Вузовские Олимпиады

Переход на очный

Суммирование АБВ и ПВО

Балл Независимой Экспертной Комиссии

Интегративный Конкурсные Балл

Рис. 2. Главные 2 траектории формирования конкурсного балла абитуриента в государственных вузах.

4) Важнейший вопрос: а не приведет ли такая схема к «протаскиванию» вузом определенных абитуриентов (выпускников так называемых «подшефных школ»): вначале этому абитуриенту завышают балл ПВО (в ходе вузовской предварительной олимпиады), а затем, игнорируя низкий балл АВО, ему же завышают балл на дополнительных вузовских вступительных испытаниях. Очевидно, что по крайней мере «двойка» по АВО (то есть, по ЕГА) должна быть таким фильтром, который ставит «шлагбаум» на пути таких абитуриентов, которых тянет вверх на «отцовском лифте» развращающая всех и вся денежная поддержка.

Задача автора настоящей статьи - аргументировать и, по возможности, разжевать саму содержательную логику подхода, а не навязывать конкретные формулы.

опыт АПРОБАЦИИ ПРЕДЛОЖЕННОГО ПОДХОДА

Логику предлагаемого подхода в определенной степени мне удалось апробировать в рамках эксперимента на родном факультете психологии МГУ им.М.В.Ломоносова - по внедрению тестового испытания в систему государственного экзамена по психологии для выпускников факультета (разумеется при содействии нынешнего декана факультета - Ю.П. Зинченко).

В ходе тестового испытания студентам предлагалась прямо на компьютере случайная выборка в 60 заданий с выбором ответа из большого банка отборных (прошедших независимую компьютеризированную экспертизу) 500 заданий. Строго лимитировалось время на сеанс тестирования - только 48 минут (хотя в западных сертификационных тестах психологам предлагают гораздо больше заданий - по 300 заданий за 4 часа!). Сравнительный анализ данных, накопленных за три года по тестовому и устному (традиционному) видам испытаний, показал, что тестовый контроль не только хорошо совпадает с традиционным экзаменом (особенно в обнаружении неподготовленных студентов), но

1 На материале этих объективных исследований под руководством автора статьи в 2007году АА.Чумаковым защищена кандидатская диссертация «Методика конструирования тестов профессиональных достижений с использованием Интернет-технологий».

См. также Шмелев А.Г. и коллектив. Методические рекомендации по разработке и внедрению системы оценки качества обучения по инновационным образовательным программам. М: Изд-во Моск.ун-та, 2007, 62 с.

даже превосходит его по внешней ва-лидности (выше корреляция с суммарным баллом по всем экзаменам за все годы обучения на факультете, в разные годы она достигает для крайних групп 0,83, тогда как для устного экзамена лишь 0,6 - 0,65). Почему же превосходит? Не хотелось бы загромождать статью статистическими таблицами и графиками, но все они иллюстрируют одну общую закономерность: на выпускных экзаменах в вузе, так же как и на выпускных экзаменах в школе, преподаватели-экзаменаторы просто завышают (в среднем на целый балл!) оценку своих воспитанников - получается этакий «напутственный подарок», как бы подбадривающая «путевка в жизнь». Обладатели оценки «отлично» по тесту практически НИ разу не опускались на устном экзамене (за три года было обследовано свыше 600 выпускников) на 2 балла - не получали «тройку» (это случилось только у одного студента на сотню отличников!). Также и «хорошисты» по тесту не опускались на «двойку». А вот подъем двоечников и троечников после теста резко вверх (устный экзамен следует за тестовым испытанием) происходил нередко - причем и на 2, и даже на 3 балла (с «двойки» за тест на «пятерку» в устном экзамене).

Эти данные объективно говорят о том, что правило контроля «приближенного совпадения» результатов тестового экзамена и среднего балла за все годы обучения с точностью до одного балла (по традиционной шкале) является вполне экспериментально-статистическим, то есть, научно обоснованным1.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Важно отметить, что формула «допустима разница лишь в один балл» теперь поддерживается большинством преподавателей факультета психологии (опросы проводились прямо на профессорском собрании факультета и выявили, что продолжение эксперимента поддерживают две трети преподавателей). За три года факультет прошел путь от малопродуктивных дискуссий, основанных на опасении, что «тестовый экзамен» грозит вытеснением обычного экзамена, к спокойному и рациональному

восприятию большинством преподавателей того факта, что различные формы контроля могут сосуществовать и существенно дополнять друг друга.

общие выводы

За годы проведения ЕГЭ (с 2001 по 2008) накоплен большой опыт и серьезный потенциал, достаточно серьезная инфраструктура. К этому опыту надо отнестись конструктивно, а к потенциалу - бережно и рачительно! Если ЕГЭ будет объявлен необязательным мероприятием, мы рискуем впасть в другую крайность - растерять тот потенциал, который накоплен. России нужна как воздух более современная система оценки качества образования. Без нее нет шансов стать конкурентоспособной державой.

Пусть ЕГЭ по всем предметам (включая математику и русский) станет добровольным для учащихся. Пусть ЕГЭ станет добровольной строкой в самоотчете школ при их аттестации. Но если ЕГЭ по ясной и прозрачной формуле будет востребован вузами, то большинство выпускников-абитуриентов не упустят возможности сдавать ЕГЭ, так как с помощью ЕГЭ они получат не меньше, а больше шансов для поступления!

Именно одновременное проведение и ЕГЭ, и традиционных экзаменов создает на фоне совместного учета их результатов, наконец, реальные предпосылки для проведения корректного научного социального эксперимента: измерения сравнительной прогностичности ЕГЭ и традиционных экзаменов.

ЕГЭ можно и нужно реорганизовать, чтобы его общественный авторитет не подвергался такой уничтожающей критике, которая обрушивается на ЕГЭ сейчас. Для этой реорганизации накоплен достаточный банк креативных идей и решений. Важно, чтобы инфраструктура, которая должна служить опорой для реализации этих идей, не растаяла в отсутствие должного государственного финансирования.

Что мешает реорганизации ЕГЭ? Мешает, по существу, одно главное обстоятельство: участники процесса, представляющие различные стороны (учащиеся, родители, учителя школ, преподаватели вузов, руководители образования разных уровней, включая федеральный, и т.п.), пока пытаются скорее конкурировать друг с другом за право монопольно решать вопрос о том, кто достоин, а кто не достоин учиться в хорошем вузе на бюджетных местах. Поэтому спор идет неконструктивный - о том, чтобы лишить другую сторону возможности влиять на это решение. А надо просто перейти к логике сотрудничества - к логике формирования интегрального конкурсного рейтинга подготовленности абитуриента из разных источников. Но «просто» - это только на словах, а на деле - это оказывается самой трудной задачей.

Уберегаясь от крайностей, которые мы испробовали уже в достаточном количестве (то все делается без всякого ЕГЭ, то одно только ЕГЭ), мы найдем системное, сбалансированное решение, которого заслуживает Россия - страна с выдающимися научно-образовательными традициями.

Можно ли реорганизовать егэ? Или 10 тезисов, призванных помочь перейти от егэ к ега Текст научной статьи по специальности «Науки об образовании»

Похожие темы научных работ по наукам об образовании , автор научной работы — Шмелев Александр

Текст научной работы на тему «Можно ли реорганизовать егэ? Или 10 тезисов, призванных помочь перейти от егэ к ега»