Моменты распределения

Центральное значение, или расположение распределения, — первое, что надо знать о группе данных. Следующая величина, которая представляет интерес, — это изменчивость данных, или «ширина» относительно центрального значения. Мы назовем значение центральной тенденции первым моментом распределения.

Изменчивость точек данных относительно центральной тенденции называется вто- рым моментом распределения. Следовательно, второй момент измеряет разброс распределения относительно первого момента.

Как и в случае с центральной тенденцией, существует много способов изме- рения разброса. Далее мы рассмотрим семь из них, начиная с наименее распро- страненных вариантов и заканчивая самыми распространенными.

Широта (range) распределения — это просто разность между самым высоким и самым низким значением распределения. Таким же образом широта перценти- ля 10–90 является разностью между 90-й и 10-й точками. Эти первые две величи- ны измеряют разброс по крайним точкам. Остальные пять измеряют отклонение от центральной тенденции (т. е. измеряют половину разброса).

Семиинтерквартильная широта (seminterquartile range), или квартильное откло- нение (quartile deviation), равна половине расстояния между первым и третьим квартилями (25-й и 75-й перцентили). В отличие от  широты  перцентиля  10–90  здесь широта делится на два.

Полуширина (halfwidth) является наиболее распространенным способом изме- рения разброса. Сначала надо найти высоту распределения в его пике (моде), затем найти точку в середине высоты и провести через нее горизонтальную линию перпендикулярно вертикальной линии. Горизонтальная линия пересечет кривую распределения в одной точке слева и в одной точке справа. Расстояние между этими двумя точками называется полушириной.

Среднее абсолютное отклонение (mean absolute deviation), или просто среднее отклонение, является средним арифметическим абсолютных значений разности значения каждой точки и среднего арифметического значений всех точек. Другими словами (что и следует из названия), это среднее расстояние, на которое значение точки данных удалено от среднего. В математических терминах:

i =1 M = 1 / N å ABS (Xi – A),                                         (3.6)

где М — среднее абсолютное отклонение; N — общее число точек данных;

Xi — значение, соответствующее точке i; А — среднее арифметическое значений точек данных; ABS() — функция абсолютного значения.

Уравнение (3.6) дает нам совокупное среднее абсолютное отклонение. Вам следует знать, что можно рассчитать среднее абсолютное отклонение по выборке. Для расчета среднего абсолютного отклонения выборки замените 1 / N в уравнении (3.6) на 1 / (N – 1). Используйте эту версию, когда расчеты ведутся не по всей совокупности данных, а по некоторой выборке.

Самыми распространенными величинами для измерения разброса являются дисперсия и стандартное отклонение. Как и в случае со средним абсолютным отклонением, их можно рассчитать для всей совокупности и для выборки. Далее показана версия для всей совокупности данных, которую можно легко переделать в выборочную версию, заменив 1 / N на 1 / (N – 1).

Дисперсия (variance) чем-то напоминает среднее абсолютное отклонение, но при расчете дисперсии каждая разность значения точки данных и среднего значения возводится в квадрат. В результате нам не надо брать абсолютное значение каждой разности, так как мы автоматически получаем положительный результат независимо от того, была эта разность отрицательной или положительной.

Кроме того, так как в квадрат возводится каждая из этих величин, крайние выпадающие значения оказывают большее влияние на дисперсию, а не на среднее абсолютное отклонение. В математических терминах:

V = 1 / N å ((Xi – A) ^ 2),                                        (3.7)

i =1 где V — дисперсия;

N — общее число точек данных;

Xi — значение, соответствующее точке i;

А — среднее арифметическое значений точек данных.

Стандартное отклонение (standard deviation) тесно связано с дисперсией (и, следовательно, со средним абсолютным отклонением). Стандартное отклонение является квадратным корнем дисперсии.

Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)