Роль информационных технологий при проведении статистического анализа данных

Компьютеризованный статистический анализ данных в системе маркетинговых исследований в настоящее время играет одну из ведущих ролей, так как в современном мире появились возможности для сбора огромного количества информации. Наступает век больших данных, ручная обработка которых отнимала бы уйму времени, что непозволительно для современного бизнеса.

В любом случае анализ данных начинается с перевода сырых данных в осмысленную информацию и включает их введение в компьютер, проверку на предмет ошибок, кодирование, представление в матричной форме (табулирование). Все это называется преобразованием исходных данных.

Применение программных продуктов для анализа данных не искажает классическую структуру полевого маркетингового исследования в которой можно выделить три этапа (см. рис. 1).

Как видно из рисунка 1, основным результатом первого этапа является анкета для опроса целевой аудитории на втором этапе. Второй этап имеет сразу два результата. С одной стороны, в результате полевых работ на основании заполненных анкет происходит формирование базы данных первичной информации, которые затем вводятся в компьютер и анализируются при помощи статистических или других методов (отметим, что именно статистический анализ данных является неотъемлемой частью практически любого серьезного полевого маркетингового исследования).

В результате анализа данных происходит написание аналитического отчета по исследованию. И оба конечных элемента — база данных и аналитический отчет с результатами проведенного анализа — передаются заказчику, который, как правило, относится к руководящему составу компании, для принятия определенного управленческого решения.

Исходя из такого расклада, логично предположение о том, что чем качественней будет отработан каждый этап, тем большая вероятность нахождения эффективного управленческого решения. Распишем основные этапы, предшествующие непосредственно анализу, более подробно.

Первый этап — утверждение материалов, необходимых для анализа. В полевых маркетинговых исследованиях к ним обычно относятся: техническое задание на исследование, анкета для опроса целевой аудитории, а также структура будущего аналитического отчета. Данный шаг, как правило, проводится еще до начала анкетирования, сразу после того, как утверждено задание на исследование.

Второй этап — определение общих параметров выборки, то есть устанавливается уровень доверия к результатам исследования и рассчитывается статистическая ошибка всей выборки.

Интересно
Необходимо отметить, что данный шаг следует уже после окончания сбора данных, когда появляется возможность точно определить реально получившийся размер выборки, получить всю информацию о сборе первичных данных. Эта информация может в дальнейшем внести определенные коррективы в ход статистического анализа.

Например, если предварительно заказчиком были установлены квоты по опросу, а в реальности их выдержать не удалось, может потребоваться корректировка базы данных (удаление части анкет, дополнительный набор данных и т. п.).

Третий этап. Составляется так называемая схема кодировки вопросов и ответов анкеты. С учетом сведений, полученных от интервьюеров, проводивших анкетирование респондентов, исследователь кодирует вопросы и ответы анкеты, формализуя их в соответствии с требованиями, предъявляемыми программным продуктом. В нашем случае это будет пакет SPSS.

Четвертый этап. На основании имеющейся схемы кодировки анкеты выполняется ввод в компьютер анкет, заполненных в ходе полевых работ, и предварительное формирование базы данных в формате SPSS — создается файл данных с расширением .sav.

Пятый этап — это период окончательного формирования базы данных в SPSS, когда переменным и их значениям в полученном файле данных присваиваются вербальные метки.

На этом заканчивается деятельность по подготовке исходного файла для статистического анализа. После осуществления вышеописанных этапов у исследователя имеется полностью работоспособная база данных, содержащая все необходимые сведения для проведения статистического анализа. Однако остается еще один существенный шаг в рамках подготовки к анализу информации.

Шестой этап — модификация и отбор данных. Этот шаг позволяет аналитику производить предварительные (перед началом статистического анализа) манипуляции с имеющимися данными: перекодировать их, формировать условные и случайные выборки, сортировать, а также вычислять новые переменные на основании имеющихся закодированных вопросов анкеты.

Как правило, это требуется для поведения конкретного маркетингового анализа, соответствующего поставленной цели исследования. Действия, осуществляемые над базой данных в рамках описываемого шага, могут производиться не только непосредственно после ввода данных в компьютер, но и в продолжение всего процесса работы с ними.

В настоящей работе основное внимание уделено подготовке данных для анализа. Этому вопросу в справочной и обучающей литературе и по сей день уделяется мало внимания, что вызывает затруднения при освоении программного продукта, а как уже отмечалось выше, правильное кодирование данных, их ввод, очистка, группировка и т. п., закладывают большую вероятность получения достоверного результата, который становится основой для принятия управленческого решения.

Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)