Работа с нормальным распределением

При использовании нормального распределения часто требуется найти долю пло- щади под кривой распределения в данной точке на кривой. На математическом языке это называется интегралом функции, задающей кривую.

Таким же образом функция, которая задает кривую, является производной площади под кривой. Если у нас есть функция N(X), которая представляет процент площади под кривой в точке X, мы можем говорить, что производная этой функции N'(X) является функцией самой кривой в точке X.

Мы начнем с формулы самой кривой N'(X). Данная функция выглядит следующим образом:

N'(X) = 1 / (S * (2 * 3,1415926536) ^ (1/2)) *

* EXP (–((X – U) ^ 2) / (2 * S ^ 2)),  (3.14)

где U — среднее значение данных;

S — стандартное отклонение данных; X — наблюдаемая точка данных;

EXP () — экспоненциальная функция.

Эта формула даст нам значение для оси Y, или высоту кривой, при любом данном значении X.

Часто мы будем говорить о точке на кривой, ссылаясь на ее координату X,    и будем смотреть, на сколько стандартных отклонений она удалена от среднего. Таким образом, точка данных, которая удалена на одно стандартное отклонение от среднего, считается смещенной на одну стандартную единицу (standard units) от среднего.

Более того, часто имеет смысл из всех точек данных вычесть среднее. При этом центр распределения сместится в начало координат. В этом случае точка данных, которая смещена на одно стандартное отклонение вправо от среднего, имеет значение 1 на оси X.

Если мы вычтем среднее из точек данных, а затем разделим полученные зна- чения на стандартное отклонение точек данных, то преобразуем распределение   в нормированное нормальное (standardized normal). Это нормальное распределение со средним, равным 0, и дисперсией, равной 1. Теперь  N'(Z) даст нам значение  на оси Y (высота кривой) для любого значения Z:

N'(Z) = 1 / ((2 * 3,1415926536) ^ (1/2)) * EXP(–(Z ^ 2/2)) = 0,398942 * EXP (–Z ^ 2/2)),                               (3.15, а), где Z = (X – U) / S;                                              (3.16)

U — среднее значение данных;

S — стандартное отклонение данных; X — наблюдаемая точка данных; ЕХР() — экспоненциальная функция.

Уравнение (3.16) дает нам число стандартных единиц, которым соответствует точка данных; другими словами, число стандартных отклонений, на которое точка данных смещена от среднего. Когда уравнение (3.16) равно 1, оно называется стандартным нормальным отклонением (standard normal deviate) от среднего значения.

Стандартное отклонение, или стандартная единица, иногда называется сигмой (sigma). Таким образом, когда говорят о событии, которое было «событием пяти сигм», то речь идет о событии, вероятность которого находится за пределами пяти стандартных отклонений.

Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)