Форма распределения

Существует еще одна характеристика распределения данных, полученных по непрерывным шкалам, которую исследователь тоже должен обязательно учитывать. Это форма распределения.

Данные распределения старшеклассников по возрасту являются примером нормального распределения. Нормальным является такое распределение, при котором кри-вая построенного по его данным графика представляет собой колоколообразную симметричную кривую.

Например, если мы построим график по данным распределения старшеклассников по возрасту, то получим соответствующую колоколообразную кривую. Если же мы построим график по массиву третьеклассников и учителей, опрошенных в одной школе, мы получим две кривые.

Нормальное распределение — это теоретическая кривая. Практически любые эмпирические данные в той или иной степени отклоняются от нормального распределения вероятностей, закону которого подчиняются распределения случайных величин.

Но поскольку все расчеты, включающие значение среднего арифметического и “стандартного отклонения, основаны на теории вероятности, в аналитическую задачу исследователя входит оценка (по крайней мере, приблизительная) того, насколько правомерно использовать данный тип анализа к полученным результатам.

Поэтому даже на уровне описания (не говоря уже о множественном анализе), прежде чем приводить данные по их средним значениям (среднее арифметическое и стандартное отклонение), необходимо оценить характер формы распределения — в какой степени она приближается к нормальному распределению.

Для этого используют показатели скоса (ассиметрии, skewness) и эксцесса (kunosis). В скобках указываются термины, которые обычно у разных авторов используются для обозначения одних и тех же понятий. В частности, здесь при¬ведены англоязычные обозначения рассматриваемых характеристик, которые приводятся в компьютерной программе обработки и анализа социологических данных — SPSS. Показатель скоса (skewness) позволяет оценить степень и направленность ассиметрии кривой распределения.

В случае идеального нормального распределения ассиметрия равна нулю.
В эмпирической социологии идеальные нормальные распределения практически не встречаются. Но существуют методы оценки степени приближения полученного распределения к нормальному. Коэффициент скоса имеет числовое значение и знак, указывающий направленность скоса.

Чем больше величина отличается от нуля, тем большая асимметрия у полученного распределения, и, соответственно, большая погрешность может проявиться при применении коэффициентов статистического анализа, формула которых включает значения стандартного отклонения.

Существуют специальные процедуры оценки степени допустимости такой погрешности, а также искусственной нормализации шкалы. Исследователь может, при необходимости, осуществлять преобразование данных.

С различными способами преобразования данных можно ознакомиться в специальной справочной и учебной литературе, но исследователю необходимо обязательно оценить степень асимметрии. (Простейшим косвенным показателем, указывающим на асимметрию, является расхождение между значениями среднего арифметического, моды и медианы; при идеальном нормальном распределении все три показателя равны).
Показатель эксцесса (kurtosis) показывает, в какой степени «крутизна» полученной кривой приближается к нормальному распределению.

Показатели асимметрии и эксцесса необходимы исследователю в первую очередь для того, чтобы он мог установить — в какой степени в анализе может быть использовано стандартное отклонение.

Таким образом, на первом этапе анализа (описания данных), представляя данные, полученные с помощью не-прерывных шкал (метрических и интервальных), исследователь должен руководствоваться следующими правилами.

  1. Рассмотреть среднее арифметическое (mean), стандартное отклонение, коэффициент асимметрии и коэффициент эксцесса. Эти показатели позволяют решить, можно ли эти данные использовать в основном анализе или они требуют дополнительных преобразований.
  2. Если исследователь не овладел техникой преобразования данных, ему следует отказаться от представления полученных по этому показателю значений среднего арифметического в итоговом научном документе (отчете, статье, таблицах и т.п.). В противном случае, информация будет носить неадекзатный, искаженный характер.
  3. В тех случаях, когда эти показатели удовлетворительны, данные по метрическим шкалам обычно представляют в итоговых таблицах по следующим параметрам:
  • N (численность группы, по которой считалось среднее значение);
  • величина среднего арифметического;
  • величина стандартного отклонения. Эти параметры позволяют в дальнейшем при необходимости посчитать статистическую значимость различий между средними значениями у раз¬личных групп населения.

Допустим, если автор анализа приводит данные по средней заработной плате различных групп населения, то эти параметры позволят не только сравнить — насколько различается средняя заработная плата “у каких-либо двух категорий работников, представленных в таблице, но и оценить — является ли это различие статистически значимым (с какой степенью вероятности мы получим то же самое различие при повторных исследованиях на других аналогичных выборках).

Такое представление данных позволяет переходить на следующий уровень анализа — объяснение и интерпретация полученных данных.

Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)