Как найти медиану

В статистике большие массивы данных обычно имеют значение только в том случае, если после их сбора они обрабатываются и анализируются надлежащим образом. Вычисление медианы является важной частью этой процедуры. Вычисляя медиану, вы сводите данные к одной (или нескольким) цифрам, чтобы сложные взаимосвязи или факты можно было наглядно представить в виде таблиц и диаграмм. Мы объясним, как найти и интерпретировать медиану шаг за шагом.

Что такое медиана?

Медиана, также называемая центральным значением, — это среднее значение нескольких измерений после упорядочивания данных по размеру. В описательной статистике медиана также называется параметром положения и используется для выражения центральной тенденции набора данных.

Примечание

Не следует путать медиану со средним или средним значением. Оно рассчитывается путем сложения всех значений и деления на количество значений. С помощью медианы вы концентрируетесь на центральном значении набора чисел.

Как вычисляется медиана?

При расчете медианы ряда данных можно использовать две формулы в зависимости от количества наблюдаемых значений. Общий символ для медианы — x ̃ (произносится как «x змея» или «x тильда»), n означает количество наблюдаемых значений, а x — значение из ряда данных.

Если у вас нечетное количество наблюдаемых значений, используйте следующую формулу:

Если же у вас четное число наблюдаемых значений, используйте следующую формулу:

Читайте далее для более подробного объяснения обоих вариантов.

Как найти медиану

Пример 1: Нечетное количество значений

В нашем первом примере у вас нечетное количество наблюдаемых значений. Представьте, что 11 участников учебного семинара спросили об их возрасте, и их ответы были следующими:

28, 34, 51, 19, 62, 43, 29, 38, 45, 26, 49

Сначала отсортируйте ответы в порядке возрастания:

19, 26, 28, 29, 34, 38, 43, 45, 49, 51, 62

Каждое значение теперь соответствует определенному значению x. То есть, 19 = , 26 = , 28 = , и т.д. Преимущество нечетного числа наблюдений заключается в том, что теперь вы можете напрямую определить медиану. В данном случае это = 38, так как это значение делит ряд чисел пополам. Здесь одна половина возрастов (19, 26, 28, 29, 34) меньше медианы, а другая половина (43, 45, 49, 51, 62) больше медианы.

Вы можете найти медиану, применив соответствующую формулу. представляет собой количество наблюдаемых значений — в нашем случае 11. Формула имеет вид:

Поскольку 38, мы получаем тот же результат. Следовательно, медиана данных о возрасте равна 38, поскольку это значение лежит в середине после того, как данные упорядочены по значению (обычно по возрастанию).

Пример 2: Четное количество значений

В случае четного числа значений медиану найти не так просто, поскольку медиана не занимает центральное положение в ряду данных.

Давайте представим, что к нашему семинару присоединился еще один кандидат, в результате чего общее число участников стало 12. Их возраст теперь составляет:

28, 34, 51, 19, 62, 43, 29, 38, 45, 26, 49, 33

Если отсортировать их ответы от меньшего к большему, то ряд чисел от до будет таким:

19, 26, 28, 29, 33, 34, 38, 43, 45, 49, 51, 62

При = 12 применяется формула для четных значений наблюдения:

Таким образом, медиана для данных о возрасте участников семинара равна 36.

Примечание

Если вы работаете с программой электронных таблиц Excel, вам не нужно рассчитывать медиану вручную. Excel предлагает удобную функцию медианы для быстрого и безошибочного вычисления медианы.

Отличие от среднего арифметического и моды

Как уже упоминалось, медиану не следует путать со средним или средним значением. Также называемое средним арифметическим, оно используется, когда необходимо найти среднее значение данных. В нашем первом примере средний возраст составил бы 38,5 (сумма данных, деленная на количество участников). Мода — это еще один термин, часто используемый в статистике. Он указывает на наиболее часто встречающееся значение в наборе данных. В нашем примере каждое число является модой, поскольку каждое значение уникально.

Использование медианы

Когда же следует вычислять медиану и в каких случаях больше подходит среднее арифметическое или мода?

Это зависит от конкретной ситуации. Хотя среднее арифметическое обычно считается более точным и очень эффективным в статистике, оно также более чувствительно к выбросам. Это означает, что одно неверное измерение в наборе данных может исказить среднее значение. Хотя медиана не так точна и эффективна, как среднее арифметическое, она считается более надежной и поэтому часто используется в тех случаях, когда наборы данных загрязнены.

Режим, с другой стороны, используется, когда вы имеете дело не с числовыми значениями, а с нечисловыми характеристиками. Например, режим будет полезен, если вы продаете товар разных цветов и хотите выяснить, какой цвет является самым популярным.

Оцените статью
cdelat.ru
Добавить комментарий