Что такое колоколообразная кривая на самом деле (μ, σ и эмпирическое правило)
Нормальное распределение — это классическая колоколообразная форма, и оно полностью задаётся двумя параметрами: средним значением μ, фиксирующим положение пика, и стандартным отклонением σ, определяющим ширину колокола (справочник NIST). Измените μ — и весь колокол сдвинется; измените σ — и он станет шире или уже, но форма и пропорции внутри него останутся прежними.
Эти фиксированные пропорции и есть эмпирическое правило: около 68.27% всех баллов попадают в пределах одного σ от среднего, около 95.45% — в пределах двух σ, и около 99.73% — в пределах трёх σ. Это означает, что лишь ~16% баллов превышают μ + 1σ, и лишь ~2,3% — μ + 2σ. Эти цифры — не приблизительные; они вдвое превышают площади стандартного нормального распределения, протабулированные NIST (площадь от 0 до z равна 0,34134 при z = 1, 0,47725 при z = 2 и 0,49865 при z = 3; удвоение даёт 0,6827, 0,9545 и 0,9973). Чтобы найти σ для реального набора оценок перед любым оцениванием по кривой, калькулятор стандартного отклонения выполнит это вычисление.
Подводный камень, скрытый правилом: реальные результаты экзамена не всегда подчиняются нормальному распределению. Они могут быть скошены (сложный тест скучивает баллы внизу) или быть двухмодальными (два кластера). Оценивание по кривой предполагает наличие колокола, которого может не быть, — и это первое, что нужно проверить, прежде чем доверять любому из приведённых ниже чисел.
Преобразование сырых баллов в буквенные оценки с помощью кривой
Нормо-ориентированное оценивание «определяет оценки согласно распределению баллов студентов» — оно присваивает каждую оценку в зависимости от того, где студент оказывается относительно остальных, а не на основании фиксированного порога (Johns Hopkins, The Innovative Instructor). Самый «чистый» вариант разрезает колокол по границам σ: выберите, где начинаются буквенные диапазоны в единицах стандартного отклонения, и прочитайте долю каждого диапазона непосредственно с кривой нормального распределения.
Широко преподаваемая симметричная схема помещает C в среднее значение и движется с шагом в одно σ: A выше μ + 1,5σ, B — от +0,5 до +1,5σ, C — от −0,5 до +0,5σ, D — от −1,5 до −0,5σ, и F ниже μ − 1,5σ. Эти точки разреза дают доли класса из таблицы ниже (вычислены по площадям стандартного нормального распределения NIST: Φ(0,5) = 0,6915 и Φ(1,5) = 0,9332) и объясняют определяющую черту кривой: количество пятёрок ограничено формой распределения, а не тем, насколько хорошо выступил каждый. Две разные схемы — с более широкими или узкими диапазонами, или C, смещённым на полступени выше среднего, — дадут совершенно разное распределение букв при одних и тех же баллах, а потому кривая — это выбор политики, а не факт. Калькулятор кривой оценок позволяет задать μ, σ и точки разреза диапазонов и посмотреть на получившиеся буквы; калькулятор оценки за тест и калькулятор итоговой оценки обрабатывают версию без кривой — с фиксированными пороговыми значениями для тех же баллов — для сравнения.
От z-оценки к процентилю и месту в классе
Z-оценка — это мост между сырым баллом и позицией: z = (x − μ) / σ. Z = 0 означает ровно среднее; z = +1 означает одно стандартное отклонение выше среднего; z = −1,5 — полтора ниже. Поскольку форма фиксирована, каждое z однозначно соответствует накопительному процентилю по таблице стандартного нормального распределения (NIST): z = 0 — это 50-й процентиль, z = +1 — около 84-го, z = −1 — около 16-го, а z = +2 — около 98-го.
Именно это и означает «топ 10%» или «98-й процентиль» в итоговой ведомости — z-оценка, прочитанная как ранг. Калькулятор процентиля классного рейтинга превращает балл и распределение класса точно в этот процентиль и позицию. Та же идея масштабируется на целые системы: исследование «Глобальная таблица эквивалентности GPA» выстраивает национальные шкалы оценивания рядом, и только процентильное мышление позволяет честно сравнить строгий 15/20 с мягким 90%, поскольку и то, и другое — лишь указание на то, где студент находится в распределении.
Когда кривая помогает, а когда вредит
Оценивание по кривой полезно для двух задач в особенности: оно выявляет выдающихся студентов внутри когорты и противодействует инфляции оценок, поскольку диапазоны привязаны к относительным результатам, а не к ползущему порогу (Johns Hopkins). Когда экзамен плохо откалиброван — слишком сложный или слишком лёгкий, — кривая также спасает ранговую информацию, которую сырые баллы иначе похоронили бы вблизи 0% или 100%.
Цена — справедливость и климат. Нормо-ориентированное оценивание оценивает студентов «исходя из их результатов относительно других студентов в классе», а университетские педагогические центры предупреждают, что конкурентная атмосфера не идёт на пользу каждому учащемуся: она может подавлять сотрудничество и означает, что сильная когорта наказывается, тогда как слабая получает незаслуженное преимущество (University of Illinois Chicago, CATE). Его противоположность — критериально-ориентированное оценивание — устанавливает планку для каждой оценки до проведения аттестации (например, 92 = A), так что студент измеряется по заданным целям, а не по сверстникам: каждый может получить пятёрку, или не получит никто. Большинство современных рекомендаций по оцениванию отдают предпочтение критериально-ориентированному подходу для курсов, основанных на освоении знаний, и резервируют оценивание по кривой для ранжирования больших когорт или стандартизированных экзаменов. Зная, в какой системе вы находитесь, вы понимаете: ваша оценка — это высказывание о вас или о ваших одноклассниках.
Кривая и взвешивание — две разные операции
«Оценивание по кривой» и «взвешивание» часто путают, но они делают противоположные вещи. Кривая перераспределяет оценки внутри одного набора баллов, смещая каждую оценку относительно класса. Взвешивание объединяет несколько баллов по их значимости — например, финальный экзамен стоит 40%, домашняя работа 20%, и так далее — и не зависит от чужих результатов вовсе. Можно взвешивать без кривой, применять кривую без взвешивания или делать и то, и другое последовательно.
Если ваш вопрос — «какова моя итоговая оценка за курс?», это задача взвешивания, а не кривой: калькулятор взвешенной оценки объединяет компоненты по их весам, а калькулятор накопительного GPA сворачивает взвешенные оценки за курс в GPA по кредитным часам. Прибегайте к калькулятору кривой оценок лишь тогда, когда вопрос действительно относителен — «с учётом распределения класса, какая буква соответствует моему баллу?». Смешение двух операций (применение кривой к взвешенной сумме или взвешивание буквенных оценок после кривой) — распространённый способ получить оценку, которая больше не означает то, что задумывалось ни одной из операций.