Тест Колмогорова–Смирнова
Тест хи-квадрат, без сомнения, является наиболее популярным из всех методов сравнения двух распределений. Так как многие ориентированные на рынок при- ложения помимо рассматриваемых в этой главе часто используют тест хи-квадрат, то он описан в приложении А.
Однако для наших целей наилучшим методом будет тест К-С. Этот очень эффективный тест применим к неячеистым распределениям, которые являются функцией одной независимой переменной (в нашем случае — прибыль за одну сделку).
Все функции распределения вероятности имеют минимальное значение 0 и максимальное значение 1. То, как они ведут себя между ними, и отличает их. Тест К-С измеряет очень простую переменную D, которая определяется как макси- мальное абсолютное значение разности между двумя функциями распределения вероятности.
Тест К-С достаточно прост. N объектов (в нашем случае — сделок) нормируются (вычитается среднее значение, и полученная разность делится на стандартное отклонение) и сортируются в порядке возрастания.
Когда мы проходим эти отсортированные и нормированные сделки, накопленная вероятность рассматриваемого количества сделок делится на N. Когда мы берем первую сделку в отсор- тированной последовательности с наименьшим стандартным значением, функция распределения вероятности (cumulative density function, далее — ФРВ) равна 1/N.
Для каждого стандартного значения, которое мы проходим, приближаясь к наибольшему стандартному значению, к числителю прибавляется единица. В конце последовательности наша ФРВ будет равна N/N, или 1.
Для каждого стандартного значения мы можем рассчитать теоретическое распределение. Таким образом, мы можем сравнить фактическую ФРВ с лю- бой теоретической ФРВ. Переменная D, или статистика К-С (K-C statistic), равна наибольшему расстоянию между значением нашей фактической ФРВ и значением теоретического распределения ФРВ при этом же стандартном значении.
Для того чтобы прояснить эту ситуацию, посмотрим на рис. 4.1. Отметьте, что в точке А фактическая кривая находится выше теоретической. Поэтому мы сравниваем текущее значение фактической ФРВ с текущим теоретическим значением для нахождения наибольшей разности.
Однако в точке В фактическая кривая находится ниже теоретической. Поэтому мы сравниваем предыдущее фактическое значение с текущим теоретическим значением. Идея состоит в том, что в результате мы выберем наибольшую разность.
Для каждого стандартного значения нам надо взять абсолютное значение разности между текущим значением фактической ФРВ и текущим значением теоретической ФРВ. Нам также надо взять абсолютное значение разности между предыдущим значением фактической ФРВ и текущим значением теоретической ФРВ. Повторив эту операцию для всех стандартных значений точек, где фактическая ФРВ делает скачок вверх на 1/N, и взяв наибольшую разность, мы опреде- лим переменную D.
- Оформление отчета по практике по ГОСТу 2021/2022
- Оформление ВКР по ГОСТу
- Как составить бизнес-план своими силами
- Оформление эссе по ГОСТу
- Оформление презентации по ГОСТу
- Оформление статьи по ГОСТу
- Оформление дипломной работы по ГОСТ 2021/2022
- Оформление курсовой работы по ГОСТу
- Оформление контрольной работы по ГОСТу