раздел третий. проекты изменений и преобразований в социальных системах
SECTION THREE. PROJECTS OF CHANGES AND TRANSFORMATIONS IN GOVERNANCE
ВЫБОР ШКАЛЫ ОЦЕНИВАНИЯ ЗНАНИЙ В ВУЗЕ В КОНТЕКСТЕ БОЛОНСКОГО ПРОЦЕССА1
Б.А.ГЛАДКИХ
Одной из основных целей Болонского процесса является введение Европейской системы перевода кредитов (European Credit Transfer System - ECTS) с присущей ей шкалой оценки знаний, которая значительно отличается от традиционной российской 4-балльной системы. В работе рассматриваются общие вопросы, связанные со шкалами оценивания и переводом оценок в этих шкалах в ECTS. Анализируются требования к шкалам, основанные на российских национальных традициях, рассматривается отечественный опыт и излагаются результаты эксперимента по введению расширенной шкалы оценок на факультете информатики ТГУ.
ПРОБЛЕМЫ ОЦЕНИВАНИЯ ЗНАНИЙ
Важнейшим элементом образовательного процесса является оценивание качества освоения образовательных программ, от правильного выбора системы оценивания существенно зависят мотивация обучающихся и, как следствие, конечные результаты обучения. Высшее учебное заведение осуществляет такое оценивание путем текущего контроля успеваемости (во время изучения дисциплин), промежуточной аттестации (по окончании изучения каждой дисциплины) и итоговой аттестации выпускников.
1 Эта публикация частично стала возможной благодаря гранту IREX (Совет по международным исследованиям и обменам), финансируемому Корпорацией Карнеги Нью-Йорка. За изложенные взгляды и утверждения отвечает исключительно автор.
Еще в недавнем прошлом учебные заведения СССР не могли выбирать систему оценивания, она определялась на правительственном уровне. В 1918 г. Народный комиссариат просвещения постановлением «Об отмене отметок», подписанным А.В Луначарским, вообще запретил «применение балльной системы для оценки познаний и поведения учащихся во всех без исключения случаях школьной практики», и только в 1935 г. совместным постановлением СНК СССР и ЦК ВКП(б) была восстановлена традиционная для России дифференцированная пятиступенная система оценки знаний.
Перестройка высшего образования в постсоветский период привела к значительному расширению прав вуза по выбору средств и методов обучения. Статья 15 Федерального закона об образовании, принятого в 1992 г., устанавливает, что «образовательное учреждение самостоятельно в выборе системы оценок, формы, порядка и периодичности промежуточной аттестации обучающихся»2. Таким образом, в руках педагогического коллектива оказалось мощное, хотя и очень деликатное, орудие воздействия на учебный процесс. В связи с этим в последнее десятилетие в ряде вузов начались эксперименты по внедрению нетрадиционных шкал и методов оценивания, имеющих целью более тонкое и дифференцированное оценивание знаний и умений обучающихся, создание стимулов для регулярной работы в течение семестра.
Аналогичный процесс начинается и в системе общего образования. Выступая 9 октября 2009 г. на Генеральной конференции ЮНЕСКО в Париже, министр образования и науки Российской Федерации А.А. Фурсен-ко сказал, что российской школе нужна более дифференцированная по сравнению с существующей шкалой оценивания знаний и призвал вузовскую общественность к диалогу и экспериментам [1].
Особую актуальность данная проблема приобрела в связи с внедряемым в России Болонским процессом, одно из направлений которого состоит в изучении и введении единой для Европы системы кредитов (зачетных единиц) ECTS и связанной с ней шкалы оценивания знаний.
Анализ систем оценивания представляет собой комплексную психолого-педагогическую проблему, которой посвящено множество научных исследований и практических рекомендаций. Не вдаваясь во все тонкости этого вопроса, перечислим две его стороны, существенные с точки зрения цели нашего исследования:
1) выбор шкалы оценивания;
2) сравнимость оценок в разных шкалах.
2 При этом система оценок для итоговой аттестации оставлена традиционной (приказ Минобразования РФ от 5 мая 2003 г. № 4490).
ШКАЛЫ ОЦЕНИВАНИЯ
Система оценки знаний баллами зародилась в ХУГ-ХУП веках и имела гуманную цель заменить принятые в те времена телесные наказания на поощрения [2]. Первая шкала оценок возникла в Германии в результате разделения всех учеников на три нумерованных разряда: лучших, средних и худших, при этом лучшие студенты имели ряд привилегий. Со временем средний разряд, к которому принадлежало наибольшее число учеников, разделили на три дополнительных подразряда, так сформировалась пятиступенная шкала, с помощью которых стали оценивать познания учащихся. До сих пор в Германии «1» - высшая оценка, а «5» - низшая.
Аналогичные процессы наблюдались в России. В списке студентов Киевской духовной академии (1737 г.) высшим разрядом отмечены очень хорошие успехи: «учения изрядного, надежного, доброго, честного, хорошего, похвального». Средний разряд обозначает показатели «учения посредственного, мерного, нехудого». Низший разряд характеризует результаты ниже среднего: «учения слабого, подлого, прехудого, безнадежного, ленивого». Постепенно словесная оценка становилась более лаконичной, она чаще заменялась цифровой, причем направление шкалы установилось противоположным германскому. В разное время в России применялись 3-, 5-, 8-, 10-, 12-балльные системы оценки знаний. Из них прижилась 5-балльная, которая и была в 1837 году официально установлена Министерством народного просвещения:. В течение XX века оценка «1» постепенно вышла из употребления, в результате 5-балльная система превратилась в современную 4-ступенную. Эта, традиционная для советского образования, система сейчас повсеместно применяется в России и многих странах постсоветского пространства, хотя в последние годы наметился отход от нее: Белоруссия перешла на 10-балльную шкалу, Прибалтика предпочла 100-балльную англосаксонскую систему и т. д.
В настоящее время в мире используется множество шкал оценивания знаний, некоторые из них приведены в табл. 1. Как видно, они сильно отличаются друг от друга как числом градаций, так и широтой охвата отдельных разрядов, взаимно однозначного соответствия оценок не существует. В некоторых шкалах принято использовать цифровые обозначения разрядов, причем допускаются дробные оценки, другие шкалы (например, американская) по традиции имеют дело с буквенными обозначениями. Между прочим, американская шкала также имеет численную интерпретацию, при которой высшим оценкам А и А+ соответствует балл 4.
Шкала оценивания - одна из самых проблемных и консервативных составляющих учебного процесса. Она должна быть по возможности объек-
Таблица 1
Примеры шкал оценивания
Словесная оценка СССР Франция Германия Голландия Италия США
Excellent, отлично 5 >17 0,5 >90 30 Lode А+ (4)
1 А (4)
1- А- (3,67)
Very good, очень хорошо 15-16,9 2+ 80-89 30 B+ (3,33)
4 14-14,9 2 29 в (3)
2- B- (2,67)
Good, хорошо 13-13,9 3+ 70-79 28 C+ (2,33)
12-12,9 3 27 C (2)
3- 23-26 C- (1,67)
Satisfactory, удовлетво- рительно 3 11-11,9 4+ 60-69 D+ (1,33)
4 D (1)
Pass, зачтено 10-10,9 4- 55-59 18-23 D- (0,67)
Fail, неудовлетворительно 2 8-9,9 5 55 <18 E (0)
тивной и понятной как преподавателям, так и студентам. Для повышения объективности делаются попытки сформулировать критерии выставления тех или иных оценок. Вот, например, (табл. 2) как интерпретируются оценки по 10-балльной шкале в Белорусском государственном университете3.
Из этого примера видно, что сформулировать строгие критерии выставления оценок очень непросто. Даже подробное описание, подобное приведенному, было бы недостаточным для российского читателя, если бы вместе с баллами в этой таблице не были бы приведены примерно соответствующие традиционные оценки, ставшие за долгие годы применения элементом национального менталитета.
3Приказ по БГУ от 06.12.2001 №233-ОД.
Таблица 2
Интерпретация шкалы оценивания в БГУ
Баллы Интерпретация критериев
10 (5+) Заслуживает студент, обнаруживший всестороннее, систематическое и глубокое знание учебного программного материала, самостоятельно выполнивший все предусмотренные программой задания, глубоко усвоивший основную и дополнительную литературу, рекомендованную программой, активно работавший на практических, семинарских, лабораторных занятиях, разбирающийся в основных научных концепциях по изучаемой дисциплине, проявивший творческие способности и научный подход в понимании и изложении учебного программного материала, ответ отличается богатством и точностью использованных терминов, материал излагается последовательно и логично
9 (5) Заслуживает студент, обнаруживший всестороннее, систематическое знание учебного программного материала, самостоятельно выполнивший все предусмотренные программой задания, глубоко усвоивший основную литературу и знаком с дополнительной литературой, рекомендованной программой, активно работавший на практических, семинарских, лабораторных занятиях, показавший систематический характер знаний по дисциплине, достаточный для дальнейшей учебы, а также способность к их самостоятельному пополнению, ответ отличается точностью использованных терминов, материал излагается последовательно и логично
8 (4+) Заслуживает студент, обнаруживший полное знание учебнопрограммного материала, не допускающий в ответе существенных неточностей, самостоятельно выполнивший все предусмотренные программой задания, усвоивший основную литературу, рекомендованную программой, активно работавший на практических, семинарских, лабораторных занятиях, показавший систематический характер знаний по дисциплине, достаточный для дальнейшей учебы, а также способность к их самостоятельному пополнению
7 (4) Заслуживает студент, обнаруживший достаточно полное знание учебно-программного материала, не допускающий в ответе существенных неточностей, самостоятельно выполнивший все предусмотренные программой задания, усвоивший основную литературу, рекомендованную программой, активно работавший на практических, семинарских, лабораторных занятиях, показавший систематический характер знаний по дисциплине, достаточный для дальнейшей учебы, а также способность к их самостоятельному пополнению
Продолжение таблицы 2
6 (4-) Заслуживает студент, обнаруживший достаточно полное знание учебно-программного материала, не допускающий в ответе существенных неточностей, самостоятельно выполнивший основные предусмотренные программой задания, усвоивший основную литературу, рекомендованную программой, отличавшийся достаточной активностью на практических (семинарских) и лабораторных занятиях, показавший систематический характер знаний по дисциплине, достаточный для дальнейшей учебы
5 (3+) Заслуживает студент, обнаруживший знание основного учебнопрограммного материала в объёме, необходимом для дальнейшей учебы и предстоящей работы по профессии, не отличавшийся активностью на практических (семинарских) и лабораторных занятиях, самостоятельно выполнивший основные предусмотренные программой задания, усвоивший основную литературу, рекомендованную программой, однако допустивший некоторые погрешности при их выполнении и в ответе на экзамене, но обладающий необходимыми знаниями для их самостоятельного устранения
4 (3) Заслуживает студент, обнаруживший знание основного учебнопрограммного материала в объёме, необходимом для дальнейшей учебы и предстоящей работы по профессии, не отличавшийся активностью на практических (семинарских) и лабораторных занятиях, самостоятельно выполнивший основные предусмотренные программой задания, усвоивший основную литературу, рекомендованную программой, однако допустивший некоторые погрешности при их выполнении и в ответе на экзамене, но обладающий необходимыми знаниями для устранения под руководством преподавателя допущенных погрешностей
3 (3-) Заслуживает студент, обнаруживший знание основного учебнопрограммного материала в объёме, необходимом для дальнейшей учебы и предстоящей работы по профессии, не отличавшийся активностью на практических (семинарских) и лабораторных занятиях, самостоятельно выполнивший основные предусмотренные программой задания, однако допустивший погрешности при их выполнении и в ответе на экзамене, но обладающий необходимыми знаниями для устранения под руководством преподавателя наиболее существенных погрешностей
2 Выставляется студенту, обнаружившему пробелы в знаниях или отсутствие знаний по значительной части основного учебнопрограммного материала, не выполнившему самостоятельно предусмотренные программой основные задания, допустившему принципиальные ошибки в выполнении предусмотренных программой заданий, не отработавшему основные практические
Продолжение таблицы 2
2 (семинарские), лабораторные занятия, допустившему существенные ошибки при ответе, и который не может продолжить обучение или приступить к профессиональной деятельности без дополнительных занятий по соответствующей дисциплине
1 Нет ответа (отказ от ответа, представленный ответ полностью не по существу содержащихся в экзаменационном задании вопросов)
Таблица 3
Интерпретация шкалы оценивания в СПбГу
Баллы Интерпретация
10 (5+) Полностью освоил программу курса, проявив творческое отношение к предмету
9 (5) Полностью освоил программу курса
8 (5-) Полностью освоил программу курса, не проявив творческого отношения к предмету
7 (4+) Освоил основное содержание курса, проявив творческое отношение к предмету
6 (4) Освоил основное содержание курса
5 (4-) Освоил основное содержание курса, не проявив творческого отношения к предмету
4 (3+) Освоил основные понятия курса, проявив творческое отношение к предмету
3 (3) Освоил основные понятия курса
2 (3-) Освоил основные понятия курса, не проявив творческого отношения к предмету
1 (2) Не освоил основные понятия курса
Приведем еще один пример (табл. 3) интерпретации оценок, рекомендованный для применения в Санкт-Петербургском государственном университете:
Здесь интерпретация основана на совершенно других критериях (творческое-нетворческое отношение к предмету), и снова преподавателю было бы непросто ею пользоваться, если бы рядом с баллами не стояли «родные» пятерки и четверки, пусть с плюсами и минусами.
ПЕРЕВОД ОЦЕНОК ИЗ ОДНОЙ ШКАЛЫ В ДРУГУЮ. СИСТЕМА ECTS
Приведенные выше два примера оценивания в одной и той же
10-балльной шкале, но с разными интерпретациями, показывают, что
перевод оценок из одной шкалы в другую представляет собой весьма непростую задачу. Для сравниваемых шкал должен существовать какой-то общий эталон, этим эталоном в приведенных ситуациях стала традиционная советская 4-ступенчатая система, широко распространенная на всем пространстве бывшего СССР, куда входит и Белоруссия.
Если же мы перешагнем границу постсоветского пространства, то сразу лишимся привычного эталона, проблема сопоставимости оценок в различных шкалах возникнет во всей своей сложности. Именно в таком положении оказались авторы Болонской декларации, когда перед ними встала задача не просто интуитивного сравнения, а официального перевода оценок, полученных в одной из 40 европейских стран, в любую другую. Интуитивный подход здесь неприемлем, так как интуиция в каждой культуре своя, требовалось опереться на какой-то объективный показатель, общий для всех стран.
Идея, заложенная в Европейскую систему перевода кредитов ECTS (European Credit Transfer System) очень проста: студенты во всех странах одинаковы, в национальных популяциях примерно одинаковый процент особо одаренных, просто умных, середнячков и бездарных учащихся. Возвращаясь к первоистокам шкал оценивания, генеральную совокупность оценок предлагается разбить на разряды, основываясь на статистическом подходе. Какова бы ни была национальная шкала, всегда можно построить статистическое распределение оценок в этой шкале и сопоставить его с эталонным распределением, принятым в ECTS. И хотя шкала европейских оценок (табл. 4) содержит некоторые критерии, но они служат только для общей ориентации, а не для практического применения, главное в системе - частотное распределение
Шкала ECTS является семиступенной, оценки, подобно американским, обозначаются буквами. Для пяти положительных ступеней A - E задается эталонное симметричное распределение частот, в котором по 10% отведено двум крайним A и E, 25% - двум промежуточным B и D, а оставшиеся 30% - средней оценке С. Несколько необычным представляется наличие двух неудовлетворительных оценок FX и F. Первая означает, что обучающийся чуть-чуть не дотянул до положительной оценки, ему может быть предоставлено право повторной сдачи экзамена без прохождения всего курса с начала до конца.
Принятый в ECTS статистический подход дает возможность приводить к единой шкале самые экзотические системы оценивания не только на уровне стран, но и на уровне отдельных вузов или даже специальностей (известно, что на гуманитарных специальностях средние оценки, как правило, выше, чем на физико-математических).
Пример 1. Пусть в вузе I применяется «цветная» шкала оценивания с
Таблица 4
Оценки ECTS
Оценка ECTS Процент оценок Интерпретация
A 10 EXCELLENT - выдающиеся знания с незначительными погрешностями
B 25 VERY GOOD - выше среднего уровня, с некоторыми ошибками
C 30 GOOD - обычная правильно выполненная работа с несколькими ошибками
D 25 SATISFACTORY- удовлетворительно, с заметными недостатками
E 10 SUFFICIENT - знания, удовлетворяющие минимальным критериям
FX - FAIL - неудовлетворительно, требуется некоторая дополнительная работа, прежде чем дисциплина будет зачтена
F - FAIL - неудовлетворительно, требуется значительная дальнейшая работа
12 градациями (красный - наилучший, черный - неудовлетворительно), а в вузе II - немецкая 13-ступенная система. Распределение положительных оценок, полученное по выборке за несколько лет обучения, приведено в табл. 5. Группируя снизу и сверху частоты в группы, соответствующие эталонному распределению 10% - 25% - 30% - 25% - 10%, получаем сопоставление обеих шкал с ECTS и, следовательно, друг с другом.
Отсюда видно, что желто-зеленым оценкам вуза I соответствует ступень «В» ECTS и двойки вуза II, голубым, лазурным и синим - оценка <Ю» ECTS, а также четверки и четверки с плюсом в вузе II и т. д. В данном примере мы специально использовали «удобные» значения для частот, на самом деле, точного совпадения с пороговыми частотами ECTS не будет, таким образом, перевод будет не точным, а приближенным. С другой стороны, если имеется достаточный статистический материал для сравнения детальных выборочных распределений, возможно и более подробное сопоставление оценок из разных шкал. Сами оценки ЕСТ^ здесь будут не при чем, важна сама идея статистического подхода.
Следует заметить, что изложенный метод перевода оценок свободен от смещений, которые вносятся в процедуру оценивания правилами аттестации. Если в некотором вузе (на факультете) высокие баллы станут доставаться слишком легко или, наоборот, будет принята очень строгая система оценивания, то частотные распределения оценок сдвинутся в ту
Таблица 5
Пример сопоставления оценок в разных шкалах с ECTS и дуг с другом
Оценка в вузе I Процент оценок в I Оценки ЕОТЭ Процент оценок в II Оценка в вузе II
Красная 4 А 3 0,5
Оранжевая 6 3 1
4 1-
Желтая 10 В 8 2+
Светло-зеленая 15 8 2
9 2-
Зеленая 15 О 10 3+
Темно-зеленая 15 10 3
10 3-
Голубая 10 D 15 4+
Лазурная 10 10 4
Синяя 5
Темно-синяя 7 Е 10 4-
Фиолетовая 3
или иную сторону, однако при сравнении с эталонным распределением границы межу соответствующими оценками ECTS также автоматически передвинутся 4.
ОПЫТ российских ВУЗОВ
Инициатором эксперимента по введению в российских вузах нетрадиционных шкал оценивания, приближенных к ECTS, выступил Нижегородский государственный университет. С 2002/03 учебного года в университете при соответствующем разрешении Минобразования России начат эксперимент по введению семиступенной системы экзаменационных оценок (табл. 6).
Как видно из сравнения табл. 6 и табл. 4, данная шкала является попыткой непосредственного введения европейских оценок, но с интерпре-
4Здесь уместно сделать замечание еще об одном источнике необъективности. Даже в пределах 4-балльной шкалы разные преподаватели совершенно по-разному ею пользуются. Чего стоят легенды о профессорах, которые считают, что на «отлично» предмет знает только Господь Бог, на «хорошо» - сам лектор, а студент по определению больше тройки не заслуживает. И наоборот, в добрых советских традициях принято было считать, что оценка «удовлетворительно» недостойна студента. Таким образом, четырехбалльная система фактически превращалась в трехступенную (отлично, хорошо, позорно).
Таблица 6
Шкала оценок в НГГУ
Оценки, обозначение и балл Определение Рекомендуемое распределение оценок Соответствие ЕОТЭ
Превосходно (прев.; 5,5) Превосходная подготовка с очень незначительными погрешностями 10 % А
Отлично (отл.; 5) Подготовка, уровень которой существенно выше среднего с некоторыми ошибками 25 % В
Очень хорошо (очхор.; 4,5) В целом хорошая подготовка с рядом заметных ошибок 30 % О
Хорошо (хор.; 4) Хорошая подготовка, но со значительными ошибками 25 % D
Удовлетворительно (уд.; 3) Подготовка, удовлетворяющая минимальным требованиям 10 % Е
Неудовлетворительно (неуд.; 2) Необходима дополнительная подготовка для успешного прохождения испытания - РХ
Плохо (плох.; 1) Подготовка совершенно недостаточная - Б
тацией их в терминах традиционной шкалы; именно этим объясняется введение оценки 5,5, поскольку в традиционной системе оценку «отлично» обычно получают значительно больше 10% экзаменующихся. Поскольку в европейской шкале 7 ступеней, а в расширенной - 8, то одной ступенью (3,5) пришлось пожертвовать, то есть в этом диапазоне шкала стала неравномерной. Зато обе неудовлетворительные европейские оценки остались, им присвоены баллы 2 и 1.
Было проведено развернутое социологическое исследование отношения студентов и преподавателей к новой шкале [3]. Оценивая ее преимущества, преподаватели чаще всего говорили о появившейся возможности более дифференцированно подходить к оценке студенческих знаний. Они поддержали тезис о том, что в рамках новой шкалы оценка становится более «чувствительной» в определении знаний, умений и способностей каждого студента. Высказанные замечания сводились в основном к не-
обходимости восстановления равномерности шкалы, то есть введения промежуточной оценки между 3 и 4, а также между 2 и 3. Что касается корректного перевода нижегородских оценок в европейские, то здесь возникла проблема несоответствия фактических частот рекомендованным эталонным, успеваемость российских студентов явно не соответствует шкале ECTS. Распределение оценок оказалось сильно смещенным в сторону низших баллов, возможно, от того, что выборка состояла из первокурсников, традиционно имеющих более низкие показатели успеваемости.
Вообще говоря, существуют два возможных способа согласования фактического распределения оценок с эталонным.
Первый заключается в проведении целенаправленной работы среди преподавателей с тем, чтобы процент выставляемых оценок действительно приближался к заданным нормативам. В своей высшей форме этот способ приводит к процедуре относительного оценивания. Суть его в том, что предварительно оценки в потоке экзаменующихся выставляются в некоторой многобалльной, например 100-балльной, шкале, а потом весь список оценок упорядочивается по убыванию. Заданный процент (10%) получает высшую оценку «А», следующие 25% - оценку «В» и т. д. Относительное оценивание довольно распространено в американских вузах, оно автоматически приводит к эталонному распределению частот и к тому же делает невыгодным списывание и подсказки. Действительно, помочь своему товарищу подсказкой - значит повысить его оценку, а, следовательно, понизить свою. Очень сомнительно, что относительное оценивание приживется в России, для этого придется ломать устоявшиеся у преподавателей стереотипы оценивания по абсолютному уровню знаний: «Знаешь предмет отлично - получай «отлично», каковы бы ни были оценки у остальной части группы». Да и у студентов неистребим традиционный российский дух коллективизма как в хорошем, так и в плохом его проявлении.
Второй способ состоит в том, что шкала, в которой ставятся оценки в данном вузе, выбирается с большим числом градаций по сравнению с ECTS. Преподавателям дается возможность ставить оценки по своему усмотрению. После накопления некоторого массива оценок строится их статистическое распределение, а затем, с учетом фактических частот, происходит группировка ступеней и составляется таблица перевода в ЕСТБ (как это мы делали в примере 1 гипотетического вуза с цветной шкалой оценивания). При этом чем больше в шкале ступеней, тем легче произвести подгонку фактического распределения к эталонному.
С учетом сказанного ряд вузов принял шкалу оценивания с 10-11 ступенями. Мы уже упоминали Санкт-Петербургский государственный
университет, где перешли на 10-ступенную шкалу (табл. 4), Белорусский государственный университет с 10-ступенной шкалой (табл. 3) и др. Целый ряд коммерческих вузов, демонстрируя близость к международным стандартам, пользуется 13-ступенной американской шкалой (табл. 2).
ТРЕБОВАНИЯ К ШКАЛЕ ОЦЕНИВАНИЯ
Прежде чем выбрать конкретную шкалу и рекомендовать ее для использования на практике, сформулируем общие требования к такой шкале, диктуемые соображениями практического удобства и совместимости с внешними системами оценивания. На наш взгляд, таких требований пять:
1) интуитивная понятность;
2) подходящее число ступеней;
3) равномерность ступеней;
4) удобство перевода в шкалу ЕСТ^.
5) удобство перевода в традиционную 4-ступенную шкалу
Требование интуитивной понятности исходит от реального консерватизма образовательной системы. Радикальным решением проблемы совместимости с ECTS было бы непосредственное введение этой системы в вузе, как, впрочем, и поступили в некоторых государствах Прибалтики. Возможно, в перспективе и Россия пойдет по такому же пути, однако в любом случает потребуется переходный период, учитывающий культурную традицию. В связи с этим нам представляется целесообразным рассматривать более мягкий эволюционный вариант, основанный на некотором расширении традиционной шкалы.
Вопрос о числе ступеней является неоднозначным и зависит от способа оценивания. Для констатирующего оценивания, например на устном экзамене, трудно использовать шкалы с числом градаций более 11-12. При большем числе ступеней происходит качественный переход к многобалльной шкале (20-100-1000 или другое число баллов). У этих шкал несколько иная сфера применения, они в основном используются в системах накопительного оценивания. С учетом этого представляется целесообразным иметь число ступеней не менее 7 (европейская шкала) и не более 12.
Важнейшим требованием к шкале оценивания является удобство перевода в оценки ECTS. Поскольку, как мы уже отмечали выше, непосредственное введение европейских оценок в российских вузах сопряжено с большими психологическими проблемами, промежуточная аттестация по дисциплинам может осуществляться в местной шкале, но при этом должен быть обеспечен адекватный перевод оценок в шкалу ЕСТ^. Согласно берлинской декларации уже с 2005 года в приложении к ди-
плому единого европейского образца должны быть указаны европейские оценки по всем изученным дисциплинам. Отсюда, в частности, следует, что из российских вузов должны исчезнуть недифференцированные зачеты, которые расхолаживают студентов и доля которых в настоящее время достигает 40 %.
Необходимость перевода в традиционную 4-ступенную шкалу возникает в нескольких случаях. Во-первых, согласно действующему законодательству (Положение об итоговой государственной аттестации выпускников высших учебных заведений Российской Федерации) в такой шкале должны оцениваться все результаты итоговой аттестации - государственные экзамены и дипломные работы. Во-вторых, традиционная шкала используется при решении вопроса о выдаче диплома с отличием, при назначении повышенной стипендии, при представлении к различным наградам и т. п. В-третьих, к традиционной шкале привязаны статистические показатели успеваемости (абсолютная и качественная успеваемость). Особенно актуальным является такой перевод в случае, когда на расширенную систему оценок переходит не весь вуз, а отдельные факультеты.
ТРАДИЦИОННАЯ ШКАЛА И ПУТИ ЕЕ РАСШИРЕНИЯ
Традиционная советская шкала оценивания, унаследованная от дореволюционной России, использует четыре ступени: 5 - «отлично», 4 - «хорошо», 3 - «удовлетворительно», 2 - «неудовлетворительно». За многие годы применения она въелась в плоть и кровь преподавателей и учащихся, в результате чего оценки интуитивно понятны каждому в России и не требуют особых пояснений.
Очевидный путь расширения системы - введение промежуточных градаций и, соответственно, дробных баллов. При этом можно ввести одну или несколько «сверхотличных», то есть больших 5,0, и несколько неудовлетворительных оценок. В принципе каждую ступень можно разделить на любое число промежуточных градаций, однако для практических целей субъективного оценивания их число не должно быть более двух-трех.
Если ограничиться двумя градациями и использовать все половинные баллы, мы приходим к равномерной 8-ступенной шкале с шестью градациями для положительных оценок и двумя отрицательными, которую можно проинтерпретировать легко воспринимаемыми словесными оценками (табл. 7).
При трех промежуточных градациях получается шкала, в которой разница между соседними ступенями составляет 0,33 балла. Казалось бы, пользоваться такой шкалой неудобно, однако на самом деле это не так.
Как раз наоборот, деление ступеней на три градации легко интерпретируется общепринятой и знакомой всем с детства символической системой плюсов и минусов: каждый школьник знает, что 5- лучше, чем 4+. В итоге приходим к 11-ступенной расширенной традиционной шкале. Она приведена в табл. 8, где для каждой градации, кроме символической оценки, указана словесная формулировка, применяемая для записи в зачетной книжке и ведомости, а также балльное значение, которое используется для расчета усредненных показателей успеваемости.
Данная шкала имеет 9 градаций для точного оценивания удовлетворительных ответов, кроме того, в ней не возникает проблем с округлением до целого числа баллов. Она интуитивно понятна как преподавателям, так и обучающимся и не требует дополнительных разъяснений: всем понятно, что тройка с минусом представляет минимальную положительную оценку, а двойка, хотя и с плюсом, остается двойкой.
В принципе, добавляя число градаций в виде четвертинок, восьмушек, десятых долей и т. д., либо в символическом виде с использованием многократных плюсов и минусов, традиционную шкалу можно расширять до бесконечности. Например, если ограничиться двумя плюсами-минусами, получаем 18-ступенную шкалу. Однако, как мы отмечали выше, пользоваться такими шкалами неудобно. Таким образом, имеет смысл рассматривать два варианта расширения традиционной шкалы оценивания: равномерная 8-ступенная с половинами баллов (табл. 7) и равномерная 11-ступенная с плюсами-минусами (табл. 8). Каждая из них имеет достаточно градаций для тонкого оценивания положительных ответов (6 и 9 соответственно) и по две ступени для неудовлетворительных оценок. Следовательно, предпочтение должно быть отдано той шкале, которая обеспечивает более удобный и адекватный перевод во внешние шкалы - традиционную и ECTS.
Таблица 7
Расширенная 8-ступенная традиционная шкала
Баллы Словесная формулировка Соответствие ECTS
5,5 Превосходно А
5 Отлично В
4,5 Очень хорошо С
4 Хорошо
3,5 Удовлетворительно D
3 Посредственно Е
2,5 Неудовлетворительно БХ
2 Плохо Б
Начнем с переводом в традиционную 4-ступенную систему оценок. Если в шкале с плюсами-минусами это происходит без проблем, плюсы и минусы просто отбрасываются, то в шкале с половинами баллов возникает неоднозначность, связанная с интерпретацией оценок 4,5 и 3,5 (оценка 2,5 в любом случае должна считаться неудовлетворительной). Если трактовать все сомнения в пользу студента и считать 4,5 эквивалентной «отлично», а 3,5 - «хорошо», то возникнет ситуация искусственного завышения успеваемости, что будет искажать статистическую отчетность и вызовет проблемы при выдаче дипломов с отличием. Если же совершать округление в меньшую сторону, то оценки 4,5 и 3,5 будут восприниматься как неполноценные, вызывать чувство неудовлетворения. Таким образом, 11-ступенная шкала с плюсами и минусами является предпочтительной с точки зрения перевода в традиционную 4-ступенную.
Теперь рассмотрим вопрос перевода оценок в шкалу ЕСТ^. Обе рассматриваемые расширенные шкалы имеют достаточно ступеней, могут быть составлены в достаточно логичные и симметричные таблицы сопоставления оценок (табл. 7 и 8), в частности, в табл. 7 отсутствует асимметрия, наблюдавшаяся в шкале перевода оценок Нижегородского государственного университета. Однако обе эти таблицы имеют только ориентирующий характер, поскольку перевод внутренних оценок в шкалу ECTS должен осуществляться не путем принудительного сопоставления, а на основании сравнения фактических частот внутренних оценок с эталонным распределением ECTS. С этой точки зрения шкала с большим
Таблица 8
Расширенная 11-ступенная традиционная шкала
Символическая оценка Словесная формулировка Баллы Соответствие ECTS
5+ Отл-плюс 5,33 А
5 Отлично 5 В
5- Отл-минус 4,67
4+ Хор-плюс 4,33 С
4 Хорошо 4
4- Хор-минус 3,67
3+ Уд-плюс 3,33 D
3 Удовлетворительно 3
3- Уд-минус 2,67 Е
2+ Неуд-плюс 0 РХ
2 Неудовлетвори- тельно 0 Р
числом градаций также предпочтительнее, так как при большем числе возможностей группировки интервалов имеется возможность осуществить более точное сопоставление фактических частот эталонным.
ЭКСПЕРИМЕНТ НА ФАКУЛЬТЕТЕ ИНФОРМАТИКИ ТГУ
Одним из направлений эксперимента по реорганизации учебного процесса в соответствии с направлениями Болонской декларации, проводимого на факультете информатики Томского государственного университета [4], является внедрение расширенной шкалы оценивания знаний. С учетом всего сказанного выше была выбрана расширенная традиционная
11-ступенная шкала с плюсами-минусами (табл. 8). Приказом ректора ТГУ от 11 июля 2005 г. № 521 эта шкала была введена в действие, за прошедшие с тех пор годы накопился достаточный опыт ее использования.
Прежде всего следует отметить, что новая система вошла в учебный процесс совершенно естественно, никаких проблем с интерпретацией расширенных оценок не возникало ни у студентов, ни у преподавателей. Этого и следовало ожидать, так как в ее основу был положен принцип интуитивной понятности.
Неоднократно проводимый опрос показал позитивное отношение к шкале не только преподавателей, что весьма предсказуемо, но и студентов. Как видно из рис 1, отрицательно воспринимают ее только 23% студентов, точнее, им не нравится не сама шкала, а тотальность ее использования, так как по всем дисциплинам, исключая физкультуру и некоторые другие бескредитные курсы, приходится зарабатывать дифференцированные баллы и невозможно спрятаться за безликой оценкой «зачтено».
Фактическое распределение положительных оценок за 4 учебных года приведено в табл. 9 и изображено в виде гистограммы на рис. 2. При их анализе обращают на себя внимание несколько закономерностей.
Во-первых, выражено преобладание целочисленных оценок (63%) над дробными (37%). Это значит, что значительная часть преподавателей еще не использует потенциальные возможности расширенной системы. Действительно, на обычном уст-
Отрицательное
9%
Скорее положи-телное 21%
Рис. 1. Отношение студентов к расширенной шкале оценок
Таблица 9
Фактическое распределение оценок на ФИнф ТГУ
Уч. год 5+ 5 5- 4+ 4 4- 3+ 3 3- Всего
2006/07 69 626 218 131 475 189 87 342 124 2261
2007/08 103 704 251 100 507 208 102 386 142 2503
2008/09 94 706 216 117 427 208 95 311 113 2287
2009/10 (I семестр) 51 381 151 87 325 152 44 177 86 1454
Всего 317 2417 836 435 1734 757 328 1216 465 8505
Про- цент 3,7 28,4 9,8 5,1 20,4 8,9 3,9 14,3 5,5 100
ном экзамене бывает трудно оценить ответ большим числом градаций. При переходе к письменным экзаменам либо при выставлении семестровых оценок по накопительному принципу доля дробных оценок будет увеличиваться.
Во-вторых, заметно преобладание минусов над плюсами. Причина та же - субъективное оценивание на устных экзаменах. Минус - это некоторый штраф за умеренную ошибку в ответе.
В-третьих, асимметрия распределения. Мы обсуждали этот феномен, рассматривая опыт Нижегородского университета. Там перекос был в сторону низших баллов, здесь - высших. Это объясняется тем, что в нашей генеральной совокупности значительную долю составляют оценки старшекурсников, удержавшихся на факультете после массового отсева студентов 1-2-го курсов. При переходе к накопительным системам оценивания этот перекос должен несколько уменьшиться, поскольку распределение суммы случайных слагаемых стремится к нормальному, однако существенных изменений здесь не предвидится из-за живучей традиции считать приемлемой оценкой четверку (трудно судить, хорошо это или плохо).
Хорошая формальная успеваемость может радовать, но она создает большие проблемы при корректном переводе оценок в шкалу ECTS. В качестве иллюстрации рассмотрим два рис. 2. Гистограмма распределения варианта сопоставления наших оце-
оценок
нок европейским. Они представлены на рис. 3, где заштрихованные гистограммы соответствуют эталонному распределению, а находящиеся слева от нее — распределениям пересчитанных оценок.
Вариант «а» соответствует правилу, при котором не учитываются фактические частоты, перевод осуществляется по грубому правилу сопоставления, указанному в табл. 8. При этом получается резкое расхождение с симметричным эталонным распределением, вызванное преобладанием четверок и явным дефицитом крайне высоких (5+) и крайне низких (3-) оценок.
Вариант «б» учитывает фактические частоты. Оценки А и D по-прежнему соответствуют «5+» и «3—», и их частоты не изменились, однако остальные оценки сопоставлены по-другому. Чистая пятерка перейдет в В (28%); «5-», «4+» и «4» отождествятся с оценкой С (в сумме 35%); «4-», «3+» и «3» отобразятся в D (в сумме 27%). Асимметрия пересчитанных оценок значительно уменьшилась.
Разумеется, этот пример слишком простой для того, чтобы делать окончательные выводы. Более того, возникает вопрос: по какой выборке следует строить фактическое распределение оценок: по вузу в целом, группе факультетов (физико-математические, естественнонаучные, социально-гуманитарные, творческие), отдельному факультету, направлению или даже конкретной дисциплине? Эта проблема требует дополнительного исследования с использованием методов математической статистики. По-видимому, если расхождение между подобранными выборочными распределениями для различных групп факультетов окажется несущественным, то следует использовать единое для данного вуза распределение, а если нет (этот вариант кажется более вероятным), то для каждой такой группы придется использовать свое фактическое распределение.
а) 6)
Рис. 3. Два варианта пересчета локальных оценок в оценки ECTS
В заключение остановимся на нескольких организационных моментах, связанных с введением расширенной шкалы.
Прежде всего об экзаменах и зачетах. Как известно, существует законодательное разделение форм контроля на экзамены и зачеты и ограничение на число экзаменов в сессию. По нашему мнению, это явный архаизм, но его легко обойти, установив форму семестрового контроля по остальным предметам как дифференцированный зачет (число оценок в сессию никто не ограничивал).
Далее, поскольку оценки выставляются по всем дисциплинам, то факультет, внедривший такую систему, и все его студенты оказываются в невыгодном положении по сравнению с теми, где имеется большое количество недифференцированных зачетов. Кого при этом считать отличником и хорошистом, кому назначать повышенную стипендию, как вычислить качественную успеваемость? Для того, чтобы уравнять их в правах, необходимо каким-то образом отличать экзаменационные оценки от оценок по дифференцированным зачетам. Для официальной статистики это сделать просто, достаточно заменить все положительные оценки по дифференцированным зачетам традиционными «зачтено», это делает сама информационная система при подведении итогов семестра. А для того, чтобы лица, не имеющие доступ к информационной системе (члены жюри, родители и т. п.), могли оценить успеваемость студента в традиционной системе понятий, предлагается несколько изменить порядок выставления оценок в зачетную книжку и ведомость.
Как известно, в российской зачетке имеется две стороны - левая и правая. Согласно инструкции, в левую сторону положено выставлять оценки по теоретическим курсам, а в правую - по практическим занятиям. Однако это разделение весьма условно, так как почти в каждой дисциплине есть теоретическая и практическая части, а в учебном плане соответствующей классификации дисциплин нет. Поскольку место записи оценки в настоящее время не несет никакой юридически значимой функции и нигде впоследствии не учитывается, преподаватели пишут куда кому нравится.
В рамках эксперимента мы предлагаем нагрузить место оценки в зачетной книжке новой функцией. Оценки по предметам, которые в учебном плане считаются экзаменационными, пишутся на левой стороне, а оценки, также дифференцированные, по предметам, отнесенным к зачетным, - на правой. Для того, чтобы преподаватель правильно сориентировался, на бланке экзаменационной (зачетной) ведомости по дисциплине печатается соответствующее напоминание. Таким образом, для суждения об успеваемости «по-старому» следует использовать только левую сторону зачетной книжки.
Несколько сложнее вопрос о выдаче диплома и приложения к нему. Здесь возможны различные варианты. Самый простой — округлить все оценки до целых значений и в таком виде перенести их в приложение к диплому. Решение о выдаче диплома с отличием также принять традиционным способом, посчитав только те оценки, которые были проставлены в левой стороне зачетной книжки. Непонятно только, как поступать, если при этом в правой стороне окажутся тройки. На худой конец, их можно заменить оценкой «зачтено». Формально нарушений не будет, хотя натяжка все-таки имеет место.
Более честный и современный подход, по нашему мнению, состоит в перечислении всех семестровых оценок в том виде, в котором они были получены, то есть в расширенной шкале. Закон этого также не запрещает, поскольку, как мы отмечали в самом начале статьи, «образовательное учреждение самостоятельно в выборе системы оценок промежуточной аттестации обучающихся». При этом потенциальные работодатели, увидев в приложении к диплому оценки с плюсами и минусами, также не будут озадачены. поскольку они воспитывались в той же культурной среде. Пройдет немало лет, пока европейские оценки будут восприниматься без дополнительных разъяснений.
Согласно действующему законодательству, вместе с дипломом российского образца выпускник имеет право на получение европейского приложения к диплому, в котором отражены все полученные оценки, пересчитанные в шкалу БСТ8. Многие вузы уже выдают такие приложения. По мере развития Болонского процесса в России такая практика станет повсеместной.
ЛИТЕРАТУРА
1. Эксперименты по «дроблению» оценок в школах РФ могут начаться в этом году - Фурсенко // РИА «Новости», 09.10.2009 (http://mon.gov. ru/press/smi/6252/).
2. Богуславский М. А. Школьный балл - проблемы и решения // Вестник образования. 2003. № 1 (http://www.vestnik.edu.ru/list.html).
3. Блонин В. А. Новая система экзаменационных оценок: первые
результаты и выводы // Вестник ННГУ Серия «Инновации в образовании». 2003. Вып. 1(4). С.72-82 (http://85.143.0.20/pages/e-library/
vestmk/99990199_West_inmv_2003_1(4)/13.pdf) .
4. Гладких Б. А. Опыт реорганизации учебного процесса в соответствии с направлениями Болонской декларации // Проблемы управления в социальных системах. 2009. Т. 1, вып. 2. С. 75-92 (http://www.inf.tsu.ru/ ИЬгагу/РиЬИсайош/20Ш/20Ш-Ш.4^и).