Анализ различий с помощью SPSS

В ходе выполнения аналитической обработки маркетинговых данных проведение анализа различий является достаточно часто встречающимся видом анализа. Сюда подходят, например, ситуации, когда проверяется гипотеза разделении всей выборочной совокупности на определенные группы на основании одного или нескольких признаков.

Интересно
Обобщая, можно определить, что целью анализа различий является выявление групп респондентов, статистически значимо различающихся между собой. Респондентов сравнивают на основании средних значений переменных. Проводится сравнение на основании двух или более числовых переменных.

Получаемые первоначальные линейные распределения могут показывать, что исследуемые группы респондентов различаются. Самый простой пример, это наличие в выборке мужчин и женщин, количество которых всегда можно определить. При этом утверждать о наличии статистически значимого различия между группами нельзя. Для его выявления применяется такой вид анализа маркетинговых данных, как «Анализ различий».

Анализ различий между группами выполняется двумя методами. К первому относятся t-тесты, которые достаточно просты, поэтому часто используются, но имеют ограничение на количество тестируемых групп, что ограничивает их применение для решения всех задач при проведении маркетингового анализа.

Ко второму относится дисперсионный анализ, который преодолевает данное ограничение и является универсальной методикой для определения статистически значимых различий между любым числом групп респондентов. Таким образом, если требуется проанализировать три и более категории респондентов, то, следует прибегнуть к использованию дисперсионного анализа, который позволяет одновременно анализировать любое число групп.

Различают одномерный и многомерный дисперсионный анализ. Этот анализ может быть с повторными измерениями и без них. Для одномерного дисперсионного анализа существует только одна зависимая переменная, для многомерного — несколько. В таблице 7 приведены основные характеристики переменных, участвующих в различных видах дисперсионного анализа.

Как было сказано выше, одномерный дисперсионный анализ исследует влияние одной или нескольких независимых переменных на одну зависимую. Одномерный дисперсионный анализ может быть однофакторным или многофакторным. В первом случае есть только одна независимая переменная, во втором — несколько.

Однофакторный одномерный дисперсионный анализ можно проводить двумя способами: при помощи специальной процедуры «Однофакторный дисперсионный анализ»: меню «Анализ» → → «Сравнение средних» → «Однофакторный дисперсионный анализ» или посредством обобщенной линейной модели: меню «Анализ» → «Общая линейная модель» → «ОЛМ-одномерная».

Второй прием является более универсальным и обладает полным объемом функциональности первого, поэтому далее мы рассмотрим только ОЛМ. Необходимо отметить, что для проведения одномерного дисперсионного анализа на практике в маркетинговых исследованиях существует одно весьма существенное ограничение.

При увеличении количества факторов (то есть независимых переменных) в модели сложность интерпретации результатов расчета возра-стает многократно. Так, однофакторный анализ является наиболее простым. Его результаты понятны сразу при взгляде на итоговую таблицу.

Двухфакторный анализ намного сложнее в интерпретации — чтобы понять его результаты, приходится потратить много времени, разбираясь в таблицах и графиках. Для интерпретации результатов трехфакторного анализа необходимо обладать некоторым опытом в его проведении. Четырех- и мультифакторные модели в большинстве своем могут успешно интерпретироваться только квалифицированными специалистами.

Таким образом, для практических целей лучше воздержаться от исследования большого числа взаимодействий между факторами и ограничиться несколькими наиболее важными. Для примера последовательно рассмотрим одно-, двух- и трехфакторные модели одномерного дисперсионного анализа.

При этом будут использоваться следующие исходные данные:

  • исследуется покупательское поведение потребителей сметаны;
  • респонденты разделяются на целевые группы в зависимости
    от предпочтений упаковки сметаны (q3) и жирности сметаны (q7);
  • дним из вопросов анкеты является вопрос «Какую сметану Вы предпочитаете покупать?» (q3) с вариантами ответа:
  • упакованную производителем;
  • расфасованную в магазине;
  • затрудняюсь ответить.

Требуется выяснить, различается ли кратность покупки сметаны различными целевыми группами респондентов (по предпочтениям упаковки и объема сметаны).

Прежде всего проведем однофакторный одномерный дисперсионный анализ и установим, насколько значимо различается кратность покупок сметаны в зависимости от предпочтений респондентов (выбор по трем вариантам:

  • упакованную производителем;
  • расфасованную в магазине;
  • затрудняюсь ответить).

Диалоговое окно одномерного дисперсионного анализа запускается при помощи меню «Анализ» →«Общая линейная модель»→ → «ОЛМ-одномерная» (рис. 49). Из левого списка всех доступных переменных переместим в поле для зависимой переменной «Зависимая переменная» переменную q3 («Какую сметану Вы предпочитаете покупать?»).

Как видим, в качестве зависимой переменной в дисперсионном анализе выступает основание сегментирования респондентов по группам, то есть та переменная, которая и определяет различия между категориями независимой переменной.

В область для независимых переменных «Фиксированные фак-торы» поместим «Жирность» (q7). Следует обратить внимание на разницу между областями «Фиксированные факторы» (факторы с фиксированными эффектами) и «Случайные факторы» (факторы со случайными эффектами).

Фиксированными факторами называют переменные, уровни которых охватывают все возможные состояния этой переменной. Например, среди предпочтений могут быть опции: упакованную производителем; расфасованную в магазине; затрудняюсь ответить.

Для жирности сметаны соответственно позиции:

  • до 10 %;
  • от 11 до 15 %;
  • от 16 до 20 %;
  • от 21 до 25 %;
  • от 26 до 30 %;
  • более 30 %.

Случайные факторы представляют переменные, уровни которых охватывают лишь часть из всего многообразия возможных состояний. Так как в нашем случае переменная q7 («Жирность») содержит все возможные группы жирности сметаны, то поместим ее в область фиксированных факторов.

Если после этого щелкнем на кнопке «ОК», то получим только одну таблицу, из которой можно узнать лишь о наличии / отсутствии значимых различий между возрастными группами. Однако останется неизвестным, какие именно группы отличаются от других. Для того чтобы определить это, существуют дополнительные статистические тесты, задаваемые при помощи кнопки «Апостериорные». Соответствующее диалоговое окно представлено на рисунке 50.

Перенесем из области «Факторы» в область «Апостериорные» критерии для тех независимых переменных (факторы), которые необходимо подвергнуть тестированию на предмет установления различий между их группами.

В нашем случае есть всего одна факторная переменная q7, которую и следует перенести в область тестирования. Далее укажем релевантные дополнительные тесты для указанной переменной. SPSS выводит различные тесты для равных и неравных дисперсий («Предполагается равенство дисперсий» и «Равенство дисперсий не предполагается» соответственно).

Установить равенство/неравенство дисперсий позволяет тест Ливиня, вывод которого на экран мы покажем ниже. В общем случае мы не знаем, равны ли дисперсии и, соответственно, какую группу статистических тестов следует использовать.

Поэтому рекомендуется сразу вывести тесты для равных и неравных дисперсий, чтобы сократить количество итераций при проведении дисперсионного анализа. SPSS предлагает много различных дополнительных тестов, помогающих определить различия между группами исследуемых переменных.

Однако использовать их все нецелесообразно. Можно ограничиться наиболее популярным и универсальным тестом Шеффе для равных дисперсий и тестом Тамхейна T2 — для неравных дисперсий. Двигаемся далее и закрываем описываемое диалоговое окно щелчком на кнопке «Продолжить».

На необходимость проведения теста, позволяющем установить равенство / неравенство дисперсий (так же, как и многих других), можно указать в диалоговом окне «Параметры», вызываемом одно-именной кнопкой в главном диалоговом окне «ОЛМ-одномерная» (см. рис. 51). Для однофакторного дисперсионного анализа можно ограничиться только одним тестом Ливиня на равенство дисперсий (параметр «Критерии однородности»).

Следует отметить, что, если исследуемая независимая переменная имеет всего две категории (дихотомия), апостериорные тесты для нее не проводятся. Установить направление различия между категориями позволяет вывод средних значений зависимой переменной в каждой из двух категорий.

Для этого перенесем исследуемую независимую дихотомическую переменную из области «Факторы и их взаимодействия» в область «Вывести средние для». В данном случае единственная независимая переменная «Жирность» имеет больше двух категорий (6), и поэтому специально выводить для нее средние значения нет смысла (они будут выведены в таблице «Однородные Подмножества»).

Остальные кнопки главного диалогового окна «ОЛМ-одно-мерная» предназначены для многофакторного анализа, рассматриваемого ниже. Щелкнем на кнопке «ОК», чтобы запустить процедуру дисперсионного анализа. В окне SPSS «Вывод» будут выведены результаты расчетов.

Первой практически значимой таблицей является результат теста на равенство дисперсий зависимой и независимых переменных «Критерий равенства дисперсионных ошибок Ливиня» (рис. 52).

В столбце «Значимость» данной таблицы содержится единственное интересующее нас значение — это статистическая значимость тестовой статистики F. Если значение в данном столбце показывает незначимость F, значит, дисперсии равны, и в дальнейшем следует анализировать результаты расчета теста Шеффе, предполагающего равенство дисперсий.

В противном случае, если F-статистика значима, дисперсии не равны, и при анализе различий между группами следует использовать тест Тамхейна T2, предполагающий неравенство дисперсий.

Как видно по подсчитанному критерию равенства дисперсий ошибок Ливиня (см. рис. 52), статистика F незначима («Значимость» стоит 0,000) и, следовательно, можно сделать вывод о равенстве дисперсий.

Следующее представление — это «Критерии межгрупповых эффектов» (см. рис. 53). Данная таблица является центральной во выводимых результатах дисперсионного анализа и показывает наличие/отсутствие значимых различий между категориями исследуемых переменных.

Первое, на что следует обратить внимание при анализе описываемой таблицы, это величина R2, отражающая долю совокупной дисперсии в зависимой переменной, описываемой статистической моделью. Другими словами, это та часть вариации зависимой переменной, которую можно объяснить на основании независимой переменной. Естественно, что чем меньше независимых переменных, тем меньше величина R2, и наоборот.

Так, в данном случае есть только одна независимая перемен-ная q7 («Жирность»), и при этом R2 составляет 0,064. Для дисперсионного анализа значения R2 можно просто проигнорировать, так как они не важны для практического использования получен-ной модели.

Второе, на что следует обращать внимание исследователю при интерпретации таблицы «Критерии межгрупповых эффектов», это собственно значимость различий между группами независимой переменной. Этот вывод следует из значения на пересечении строки, содержащей соответствующую независимую переменную, и столбца «Значимость».

Как видно из рисунка 53, имеет место статистически высоко значимые различие между раз-личными группами в зависимости от предпочтений покупателей и жирностью сметаны (значимость F-статистики у переменной q7 < 0,001).

Обратите внимание, что, если тест Ливиня выявил факт неравенства дисперсий независимых и зависимых переменных, то следует поднять порог значимости со стандартного значения 0,05 до 0,01.

После того как установили наличие статистически значимого различия между группами респондентов в зависимости от их предпочтений и жирности сметаны, необходимо определить, какие из 6 имеющихся групп жирности сметаны отличаются от остальных и каким образом (в большую или в меньшую сторону).

В рассматриваемой ситуации на основании данного теста дисперсии оказались равными, и поэтому в таблице будем рассматривать только ту ее часть, в которой приведены расчеты по методу Шеффе (тест Тамхейна мы бы применили, если бы дисперсии были неравны).

Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)