
В статистике большие массивы данных обычно имеют значение только в том случае, если после их сбора они обрабатываются и анализируются надлежащим образом. Вычисление медианы является важной частью этой процедуры. Вычисляя медиану, вы сводите данные к одной (или нескольким) цифрам, чтобы сложные взаимосвязи или факты можно было наглядно представить в виде таблиц и диаграмм. Мы объясним, как найти и интерпретировать медиану шаг за шагом.
Что такое медиана?
Медиана, также называемая центральным значением, — это среднее значение нескольких измерений после упорядочивания данных по размеру. В описательной статистике медиана также называется параметром положения и используется для выражения центральной тенденции набора данных.
Не следует путать медиану со средним или средним значением. Оно рассчитывается путем сложения всех значений и деления на количество значений. С помощью медианы вы концентрируетесь на центральном значении набора чисел.
Как вычисляется медиана?
При расчете медианы ряда данных можно использовать две формулы в зависимости от количества наблюдаемых значений. Общий символ для медианы — x ̃ (произносится как «x змея» или «x тильда»), n означает количество наблюдаемых значений, а x — значение из ряда данных.
Если у вас нечетное количество наблюдаемых значений, используйте следующую формулу:

Если же у вас четное число наблюдаемых значений, используйте следующую формулу:

Читайте далее для более подробного объяснения обоих вариантов.
Как найти медиану
Пример 1: Нечетное количество значений
В нашем первом примере у вас нечетное количество наблюдаемых значений. Представьте, что 11 участников учебного семинара спросили об их возрасте, и их ответы были следующими:
28, 34, 51, 19, 62, 43, 29, 38, 45, 26, 49
Сначала отсортируйте ответы в порядке возрастания:
19, 26, 28, 29, 34, 38, 43, 45, 49, 51, 62
Каждое значение теперь соответствует определенному значению x. То есть, 19 = , 26 = , 28 = , и т.д. Преимущество нечетного числа наблюдений заключается в том, что теперь вы можете напрямую определить медиану. В данном случае это = 38, так как это значение делит ряд чисел пополам. Здесь одна половина возрастов (19, 26, 28, 29, 34) меньше медианы, а другая половина (43, 45, 49, 51, 62) больше медианы.
Вы можете найти медиану, применив соответствующую формулу. представляет собой количество наблюдаемых значений — в нашем случае 11. Формула имеет вид:

Поскольку 38, мы получаем тот же результат. Следовательно, медиана данных о возрасте равна 38, поскольку это значение лежит в середине после того, как данные упорядочены по значению (обычно по возрастанию).
Пример 2: Четное количество значений
В случае четного числа значений медиану найти не так просто, поскольку медиана не занимает центральное положение в ряду данных.
Давайте представим, что к нашему семинару присоединился еще один кандидат, в результате чего общее число участников стало 12. Их возраст теперь составляет:
28, 34, 51, 19, 62, 43, 29, 38, 45, 26, 49, 33
Если отсортировать их ответы от меньшего к большему, то ряд чисел от до будет таким:
19, 26, 28, 29, 33, 34, 38, 43, 45, 49, 51, 62
При = 12 применяется формула для четных значений наблюдения:

Таким образом, медиана для данных о возрасте участников семинара равна 36.
Если вы работаете с программой электронных таблиц Excel, вам не нужно рассчитывать медиану вручную. Excel предлагает удобную функцию медианы для быстрого и безошибочного вычисления медианы.
Отличие от среднего арифметического и моды
Как уже упоминалось, медиану не следует путать со средним или средним значением. Также называемое средним арифметическим, оно используется, когда необходимо найти среднее значение данных. В нашем первом примере средний возраст составил бы 38,5 (сумма данных, деленная на количество участников). Мода — это еще один термин, часто используемый в статистике. Он указывает на наиболее часто встречающееся значение в наборе данных. В нашем примере каждое число является модой, поскольку каждое значение уникально.
Использование медианы
Когда же следует вычислять медиану и в каких случаях больше подходит среднее арифметическое или мода?
Это зависит от конкретной ситуации. Хотя среднее арифметическое обычно считается более точным и очень эффективным в статистике, оно также более чувствительно к выбросам. Это означает, что одно неверное измерение в наборе данных может исказить среднее значение. Хотя медиана не так точна и эффективна, как среднее арифметическое, она считается более надежной и поэтому часто используется в тех случаях, когда наборы данных загрязнены.
Режим, с другой стороны, используется, когда вы имеете дело не с числовыми значениями, а с нечисловыми характеристиками. Например, режим будет полезен, если вы продаете товар разных цветов и хотите выяснить, какой цвет является самым популярным.