Трехмерный анализ: введение контрольной переменной

Приступая к логическому объяснению установленных взаимосвязей, следует учитывать, что обнаруженная связь может не только не являться причинно-следственной, но, более того, может ввести исследователя в заблуждение.

Например, в одном из исследований в процессе двухмерного анализа была установлена значимая связь между политическими ориентациями людей и уровнем их тревожности: сторонники социалистической и, особенно, коммунистической ориентации значимо отличались более высоким уровнем тревожности по сравнению с людьми, ориентирующимися на демократическое преобразование общества.

Если полученные данные начинать интерпретировать, не учитывая того обстоятельства, что, возможно, существует третий фактор, который, одновременно влияет и на политические ори-ентации, и на уровень тревожности, то только из одной этой двумерной таблицы можно было бы сделать далеко идущие выводы.

Однако предположение о том, что такой фактор существует, позволило установить, что в данном случае основным фактором того и другого показателей (политических ориентации и уровня тревожности) является возраст (со всеми социальными и психологическими особенностями, сопутствующими этой переменной): у молодых сторонников социализма уровень тревожности практически не отличался от уровня тревожности лиц, придерживающихся других политических взглядов.

Подобная картина наблюдалась и у пожилых людей с разными политическими ориентациями. Основная же причина обнаружения более высокого уровня тревожности в группе сторонников «левых сил» состояла в том, что в этой группе доля пожилых людей была существенно выше, чем в группе приверженцев идеи демократического преобразования общества. Введение в двумерный анализ контрольной переменной позволяет избежать ошибок объяснения установленных в результате, двумерного анализа связей.

В качестве контрольных переменных следует, в первую очередь, использовать те демографические характеристики, которые были заложены в основу подготовки репрезентативной выборки. Это объясняется тем, что когда исследователь обосновывает принципы отбора, он прежде всего заботится о том, чтобы выборочная совокупность репрезентировала генеральную по тем параметрам, которые в наибольшей степени могут влиять на показатели изучаемого явления.

Если изучается связь между исследуемым показателем и различными социально-демографическими факторами, и установлено, что в той или иной степени каждый из них влияет на исследуемый показатель, то иерархизируя их по величине связи, следует убедиться, что каждый из этих факторов оказывает влияние сам по себе, а не только опосредуется другими.

Введение контрольной переменной приводит к построению трехмерных таблиц.
Эти таблицы можно анализировать визуально, а можно и статистически. Визуальный просмотр таблицы позволяет «увидеть», действительно ли зависимая переменная изменяется с изменением независимой, если группы уравнены по третьему параметру.

В качестве примера введения третьей переменной приведем фрагмент анализа факторов самочувствия (самооценки здоровья). Допустим исследователь построил две двумерные таблицы: Таблица А (в качестве независимой переменной — пол, зависимой — самочувствие); и Таблица Б (в качестве независимой переменной — возраст, зависимой — самочувствие).

Визуальный обзор и сопоставление этих двух таблиц показывает, что на самочувствие влияют оба фактора: пол (среди женщин больше тех, кто чувствует себя плохо, и меньше тех, кто чувствует себя хорошо, по сравнению с мужчинами) и возраста (чем старше возрастная группа, тем больше доля «чувствующих себя плохо» и меньше — «чувствующих себя хорошо»).

Данные таблицы также позволяют «увидеть», что возраст оказывает более сильное влияние на самочувствие, чем пол: величина зависимой переменной в большей степени изменяется с изменением независимой в таблице Б. Статистическая проверка по хи-квадрату подтверждает вывод, сделанный на основе визуального сравнения: в таблице А хи-квадрат равен 67,3, в таблице Б — 197,4 (оба коэффициента значимы на уровне 0.01).

Внимательный аналитик не может не поставить перед собой вопрос: «Действительно ли пол сам по себе влияет на самочувствие. Может быть, поскольку продолжительность жизни женщин выше, их средний возраст выше, чем у мужчин, и в таблице А влияние пола опосредуется возрастным фактором?».

Поэтому, прежде чем делать окончательные выводы о влиянии пола на самочувствие, необходимо проверить, влияет ли пол на самочувствие независимо от возраста. Для проверки этой гипотезы строится трехмерная таблица, позволяющая нивелировать влияние возраста: самочувствие мужчин и женщин сравнивается в пределах каждой возрастной группы (см. таблицу С).

Визуальный обзор полученной трехмерной таблицы позволяет сделать вывод о том, что фактор пола оказывает влияние на самочувствие, так как женщины ниже оценивают состояние своего здоровья в каждой из возрастных групп.

В тех случаях, когда анализ факторов самочувствия не является основной и единственной целью эмпирического исследования, социолог может ограничиться констатацией этого факта и ранжировать факторы. Если же исследование не только невероятно трудоемкая, но и малоэффективная.

Глазную роль в отборе признаков, вводимых в анализ в качестве контрольной переменной, играет общая компетентность исследователя в изучаемой проблеме (объем его знаний и общая способность к логическому анализу).

Например, включая возраст в качестве контрольной переменной, исследователь мог исходить из знания о том, что продолжительность жизни женщин выше, чем у мужчин, а следовательно, в выборочной совокупности женщин удельный вес лиц старшего возраста выше, что и приводит к снижению самооценки здоровья в группе женщин в целом.

Трехмерный анализ позволил установить, что пол влияет на самочувствие независимо от возраста. А при анализе уровня тревожности у лиц с разной политической ориентацией, наоборот, введение возраста в качестве контрольной переменной позволило опровергнуть гипотезу о связи между этими переменными.

Как уже отмечалось, исследователь сам решает, какие признаки следует ввести в качестве контрольной переменной в процессе причинного анализа. Но если обратиться к общим рекомендациям, то следует обратить внимание начинающих социологов на такие признаки, как пол, возраст и уровень образования. Нередко введение в анализ именно этих параметров в качестве контрольных позволяет уточнить взаимосвязи между полученными данными.

Следует заметить, что достаточно распространенной ошибкой являются выводы, касающиеся апияния таких параметров, как тип поселения и национальность. Например, нередко в двумерных распределениях мнения (оценки, отношения) у украинцев и русских различаются, то же относится к различиям между городскими и сельскими жителями.

Трехмерный анализ в некоторых случаях подтверждает, что в основе различий лежит этнический или социо-культурный фактор; однако нередко обнаруживается, что причина различия в мнениях заключается не в национальности, а в уровне образования (в репрезентативной выборке уровень образования украинцев ниже, поскольку среди них больше жителей сел).

Выравненные группы по уровню образования нивелируют различие в ответах у разных этнических групп. Поэтому в случаях анализа таких факторов, как национальность и тип поселения, прежде чем делать категорические выводы об этнических и социокультурных различиях, следует обратить внимание на контроль по основным независимым переменным.

Если при введении контрольного признака связь между двумя перременными нивелируется, то такой признак называется объясняющей переменной, поскольку установленная между двумя показателями связь объясняется тем, что оба эти признака являлись следствием воздействия другого фактора (в нашем примере — возраста). Этот фактор остается латентным (скрытым) от глаз исследователя, когда он рассматривает связи только между парами при-знаков, т.е. осуществляет двумерный анализ.

Поиск латентных переменных (основных факторов влияния) лежит в основе многих статистических процедур многомерного анализа, в частности, латентно-структурного анализа, направленного на построение объясняющих переменных.

Если целью социологического исследования является поиск причин и закономерностей изучаемых явлений, то возможность осуществления многомерного анализа планируется на этапе подготовки проекта и программы исследования: выдвигаются гипотезы относительно латентных факторов и строятся шкалы, которые позволят применить соответствующие статистические процедуры.

Исследователь должен учитывать, что если латентно-структурный анализ он может проводить на основе дискретных шкал, то, например, факторный анализ предполагает, в основ-ном, использование непрерывных шкал.

Подводя итоги рассмотрения проблемы анализа результатов эмпирического социологического исследования, подчеркнем основные моменты, которые должен учитывать социолог, приступая к этому этапу работы.

Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)