Меры центральной тенденции

Если для шкал дискретного типа в качестве описательных статистик используются в основном частотные и процентные распределения, то для шкал непрерывного типа — статистики, позволяющие охарактеризовать среднее значение полученных данных. Напомним, что к непрерывным относятся метрические и порядковые шкалы (в тех случаях, когда у автора есть основания рассматривать порядковую шкалу как интерзальную).

Основными обобщающими характеристиками данных, полученных по непрерывным шкапам, являются средние величины или меры центральной тенденции: среднее арифметическое, мода и медиана. Меры центральной тенденции позволяют определить и описать наиболее типичную величину полученных данных.

Среднее арифметическое — величина, которую наиболее часто используют при характеристике изучаемого контингента людей по различным метрическим шкалам. Например, если в анкете задавался вопрос о заработной плате, то, характеризуя полученные данные, указывают среднюю заработную плату и т.п.

Для подсчета среднего арифметического значения выписываются ВСЕ значения полученной переменной (обычно в порядке возрастания) и напротив каждого значения указывается количество лиц, отметивших данный ответ в анкете. Приведем пример вычисления среднего арифметического значения возраста опрошенных старшеклассников (для удобства восприятия и расчетов ниже приводятся упрощенные вымышленные примеры). Результаты опроса выписываются следующим образом:

Среднее арифметическое вычисляется путем деления суммы произведений каждого значения признака на число лиц, обладающих данным признаком, на общее количество опрошенных:

6388 : 400 = 15.97

В данном случае средний возраст опрошенных старшеклассников составляет 15.97 лет. Существуют и другие средние показатели: мода и медиана.

Под модой подразумевается наиболее часто встречающееся в ряду распределения значение признака. В приведенном примере модой является значение 16 лет, так как такой возраст характерен для 200 человек (самое высокое значение). Под медианой подразумевается значение признака, которое находится в середине ранжированного ряда. В данном случае это значение тоже равно 16 годам.

Среднее арифметическое, мода и медиана — основные характеристики, позволяющие описать основное (типичное) свойство данных, полученных по массиву респондентов. В процессе описания данных перед исследователем стоит задача — какой из этих показателей выбрать. Это зависит от типа шкалы изучаемого признака.

Чем выше измерительный уровень шкалы, тем больше характеристик можно использовать для ее описания. Если для дискретных шкал можно пользоваться только такими характеристиками, как мода и медиана, то для непрерывных шкал можно считать среднее арифметическое.

Среднее арифметическое — величина, позволяющая получить определенную характеристику изучаемого объекта (например, по ней можно количественно сравнивать сотрудников разных предприятий по среднему возрасту, средней зарплате и т.п.).

Однако этот показатель сам по себе достаточно односторонний, что иногда возмущает людей, не только не имеющих специальных знаний в области математической статистики, но и даже с низким уровнем образования: «Как можно говорить о средней заработной плате у нас на предприятии (в стране), если я получаю так мало, а «начальство» имеет такую высокую зарплату!».

Чувство «социальной справедливости» даже на житейском уровне подсказывает, что нельзя говорить о том, что «в среднем» у населения высокий жизненный уровень, когда определенная часть получает «очень много», достаточно большая часть — «очень мало», и неизвестно сколько получает ту самую «среднюю величину». Здесь на интуитивном уровне определяется, что одного только среднего значения недостаточно, чтобы охарактеризовать картину по определенному показателю.

Но интуитивный житейский скептицизм срабатывает, к сожалению, тогда, когда речь идет о вещах, затрагивающих непосредственные интересы людей. При анализе достаточно «абстрактных» показателей начинающие социологи нередко не учитывают «достижения» статистики, в частности, необходимости дополнять данные по средним значениям полученных показателей такими характеристиками, как рассеяние (изменчивость, колеблемость) признака и форма распределения.

Используя вышеприведенный пример, проиллюстрируем значение показателей изменчивости признака. Мы рассчитывали данные по среднему возрасту обследованных старшеклассников. Среднее арифметическое значение указывает, что их средний возраст около 16 лет. Если читателю представить весь ряд распределения, то можно увидеть, что самый младший из опрошенных был 14 лет, а самый старший — 18, т.е. возраст изучаемого контингента отклонялся от средней величины максимум на два года.

Но по метрическим шкалам, включающим значительное число значений признака, общее распределение, как правило, не приводится, а одно лишь значение среднего арифметического может ввести в заблуждение, так как если бы мы в той же школе опросили 350 детей 9-10 лет и 50 учителей в возрасте 50-60 лет, то среднее арифметическое всех опрошенных тоже равнялось бы примерно 16 годам.

В данном случае совершенно разные контингенты опрошенных имели бы одинаковое значение этого параметра, так как во втором случае опрашивался неоднородный контингент, в частности, по такому показателю, как возраст.

Таким образом, для того, чтобы получить адекватное представление об изучаемом признаке, одного среднего значения явно недостаточно. В общем виде для отбора статистических процедур, используемых для описания одномерных распределений, в зависимости от типа шкалы можно руководствоваться следующей схемой.

Квалифицированный статистический анализ средних значений заключается в том, что, приводя значение среднего арифметического, исследователь должен привести и данные по значению изменчивости этого признака (вариации, рассеянию, колеблемости) — величины отклонений от среднего значения.

Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)