Установление связи между признаками

Те исследователи, которым приходилось интерпретировать результаты, представленные в двумерных таблицах, знают: чем больше вариантов ответов на вопросы, выступающие в таблице в качестве независимых и зависимых переменных, тем труднее проследить тенденции влияния одного признака на другой — обнаружить закономерность в изменении частот зависимой переменной с изменением характеристики независимой переменной.

В том случае, когда деление на группы по независимой переменной — дихотомическое (например, по полу или по самооценке материального статуса: «мало-обеспеченные» и «среднеобеспеченные»), и деление по зависимой переменной — также дихотомическое («доверяют президенту» — «не доверяют президенту», «удовлетворены жизнью» — «не удовлетворены жизнью»), то различия между группами сравнивать достаточно легко; можно даже дать количественную оценку — насколько больше доверяющих пре-зиденту в одной группе по сравнению с другой.

Но чем в таблице больше сравниваемых между собой групп, и чем больше вариантов ответа, по которым сравниваются эти группы, тем сложнее визуально установить закономерность изменения в характере ответов. Существует статистический критерий, позволяющий получить ответ на вопрос: есть ли связь между двумя при-знаками, представленными в таблице. Этот критерий называется «хи квадрат».

Установление величины этого коэффициента и его статистической значимости позволяет ответить на вопрос о наличии связи между исследуемыми признаками. Эти вычисления обычно входят в компьютерные программы об-работки данных (SPSS, OCA).

Если значение этого коэффициента статистически значимо, по крайней мере, на уровне 5%, то исследователь может сделать вывод о том, что между анализируемыми признаками есть определенная связь (чем выше значение данного коэффициента, тем более тесная связь между этими двумя признаками).

Если значение хиквадрата статистически не значимо на уровне 5%, то исследователь не может сделать определенных выводов о наличии связи между этими двумя параметрами. Расчетная формула данного коэффициента включает наполненность каждой из полученных в таблице подгрупп.

Иногда исследователь «забывает», что, производя группировку всей со¬вокупности, он фактически из одной достаточно большой совокупности получает много маленьких. Например, если опрошено 1000 человек, и исследователь хочет определить, как влияет на оценку того или иного социального явления род занятий, то он разбивает всю совокупность на группы по роду занятий.

Допустим,таких групп 10. Даже если они наполнены равномерно, то каждая подгруппа составляет 100 человек. Эти сто человек,давая ответ на вопрос о степени доверия президенту по пятибалльной шкале, в свою очередь, разбиваются на подгруппы в зависимости от выбранного варианта ответа.

Если они распределятся равномерно, то каждый вариант ответа отметят всего 20 человек (если какая-то социальная группа получается большей численности, или какой-либо вариант ответа отмечается большим числом респондентов этой группы, то, соответственно, численность других подгрупп уменьшается) Поэтому при расчете хи-квадрата исследователь должен осознавать два момента.

Первый — чем меньше градации анализируемых переменных, и, соответственно, чем больше численность полученных в результате кросс-табуляции подгрупп (на языке статистики они называются «степенями свободы»), тем более вероятно, что данный коэффициент покажет величину и значимость связи между изучаемыми признаками, если такая связь есть в объективной реальности.

Второй момент, который следует отметить, может быть полезен для тех социологов, которые хотели бы разобраться в содержательном значении данного коэффициента. Хи-квадрат рассчитывается, исходя из следующего предположения: если изменение одного признака не приводит к изменению другого, то все ответы распределятся равномерно (так, как мы описали в вышеприведенном примере, — в каждой подгруппе будет по 20 человек).

Чем больше влияние одного признака на другой, тем больше будет число и величина отклонений от такого линейного распределения, полученного в результате кросс-табуляции. Усредненное значение таких отклонений и лежит в основе расчета данного коэффициента. Таким образом, хиквадрат позволяет получить ответ на вопрос, есть ли связь между признаками.

Здесь следует подчеркнуть, что установленное наличие связи еще не говорит о ее направленности и, тем более, о причинности. Например, один исследователь выдвигает ги-потезу о том, что удовлетворенность работой влияет на удовлетворенность жизнью, а другой исследователь считает, что общая удовлетворенность жизнью влияет на удовлетворенность человека своей работой. При проверке каждой из гипотез, коэффициент связи будет одинаков, так как он показывает только взаимосвязанность признаков.

Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)