Объем выборочной совокупности

Так сколько же человек необходимо опросить, чтобы можно было делать выводы обо всей исследуемой совокупности?

Конкретный ответ на .этот вопрос нетерпеливо ожидает заказчик, который готов платить за необходимую ему достоверную информацию. Даже неискушенный в исследованиях человек понимает, что, с одной стороны, «чем больше опрошено, тем лучше», а с другой, — «чем больше людей требуется опросить для получения достоверной информации, тем дороже общая стоимость исследования».

Ответ на этот вопрос не менее нетерпеливо ждет и начинающий социолог, понимая, что без обоснованного ответа он не может приступить к обсуждению проекта конкретного эмпирического исследования в целом.

Самым нетерпеливым сразу предоставляем возможность ознакомления с формулой расчета величины выборочной совокупности, осуществляемой одноступенчатым случайным бесповторным отбором.

где N — объем генеральной совокупности, n — объем выборочной совокупности, t — коэффициент нормированного отклонения; в социологической практике в основном употребляют три значения нормированного отклонения: t=l, t=2, t=3; с вероятностями соответственно Р=0.68, Р=0.95 и Р=0.99; эти значения интерпретируются следующим образом: если из генеральной совокупности извлечь 100 выборок одинаковым образом и с одинаковыми объемами, то можно гарантировать, что в 68 (95 или 99, соответственно) из них допустимая (граничная) ошибка не будет превышать среднюю ошибку;

  • Л — допустимая ошибка; в социологических исследованиях максимальная величина допустимой ошибки принята равной (плюс-минус) 5%; уменьшение абсолютной величины допустимой ошибки достигается увеличением объема выборочной совокупности;
  • 5— значение дисперсии признака, по которому рассчитывается репрезентативность в генеральной совокупности.

Если выборка многоступенчатая, то учитывается ошибка на каждой ступени. Разработаны формулы расчета объема выборочной совокупности для многоступенчатых комбинированных выборок. Социологам, предполагающим совершенствоваться в статистическом обосновании расчета объема выборки, прежде чём приступать к самостоятельным расчетам, следует внимательно ознакомиться с основами теории вероятности и математической статистики.

Особенности технологического подхода к освоению расчета объема выборки предполагают освоение основных правил и способов, позволяющих избежать грубых ошибок при формировании выборочной совокупности и интерпретации полученных на основе сформированной выборки данных. Практика социологических исследований показывает, что обычно обоснованный объем выборочной совокупности составляет от 400 до 2000 единиц наблюдения.

Из этого следует, что в стандартном исследовании двух тысяч опрошенных вполне достаточно, чтобы получить репрезентативную, надежную и обоснованную информацию (конечно, при условии соблюдения всех правил процедуры отбора). Но перед исследователем всегда стоит задача — по возможности сократить объем выборки для того, чтобы снизить организационную нагрузку и финансовую стоимость исследования.

Что должен учитывать автор проекта выборки, определяя минимальный объем выборочной совокупности, способной обеспечить достаточно обоснованный базис респондентов?

1. Однородность (неоднородность) исследуемого контингента. Чем более однороден контингент, с точки зрения влияния его характеристик на предмет исследования, тем меньший объем выборки может обеспечить качественную информацию. Однородность определяется, во-первых, числом характеристик, которые могут влиять на ответы респондентов, и, следовательно, должны учитываться при формировании выборки; во-вторых, разбросом значения каждой из этих характеристик в генеральной совокупности.

Например, если исследователь предполагает задать вопрос: «Хотите ли Вы, чтобы Вам повысили зарплату?», можно предположить, что различные характеристики объекта исследования (пол, возраст, образование и даже доход) не будут существенно-влиять на различия в ответах. Если же исследователь предполагает спросить: «Хотите ли Вы, чтобы предприятие, на котором Вы работаете, было приватизировано?», то прежде, чем приступить к формированию выборки, он должен задуматься, какие характеристики работников могут влиять на их отношение к приватизации.

Конечным результатом такого предварительного анализа объекта должен стать перечень этих характеристик, а также сведения о том, как по данным характеристикам распределяются люди, представляющие собой генеральную совокупность. Чем меньше рассеивается признак по своему значению, тем меньший объем выборки требуется для обеспечения репрезентативности.

В приведенной выше формуле расчета объема выборочной совокупности этот показатель называется дисперсией. Принимая во внимание, что формула расчета объема выборки учитывает только один признак, исследователь среди всех гипотетических признаков должен сначала отобрать самые «влияющие», с его точки зрения, а затем из их числа выбрать один — наиболее разбросанный.

2. Исследователь, в зависимости от задач проекта, может повышать допустимую ошибку и варьировать доверительный интервал. Работая над проблемой объема выборки, он может задавать вопрос (как заказчику, так и самому себе): «Что, если по данному пункту анкеты мы получим значение, на 1% отклоняющееся от истинного; это допустимо?», «Л если значение будет отклоняться на 5%?» Обычно в этих пределах социолог ищет ответы на поставленные вопросы и решает проблему допустимой ошибки и доверительного интервала.

3. Рассчитывая минимальный объем выборки, не следует забывать, что он обеспечивает статистической достоверностью лишь одномерные распределения. Если социолог предполагает представлять данные в виде многомерных распределений и анализировать причинно-следственные зависимости, он должен принимать во внимание аналитические требования к выборочной совокупности: наполненность всех подгрупп, которые образуются в процессе анализа.

Дополнительная задача выборки в таком случае формулируется следующим образом: «каков должен быть объем выборки для того, чтобы произвести с нею все необходимые аналитические манипуляции с достаточно большой устойчивостью или надежностью итоговых показателей?» С точки зрения аналитических возможностей, при определении объема выборки должен учитываться план анализа (составная часть программы исследования).

Прежде чем приступить к проектированию выборки, исследователь должен построить макеты основных аналитических таблиц и посчитать, сколько подгрупп будет образовано в результате кросс-табуляции. Допустим, исследователь предполагает проверить гипотезу о влиянии уровня образования на удовлетворенность жизнью.

Показатель предполагаемого фактора (уровня образования) включает четыре значения признака (неоконченное среднее, среднее общее, среднее специальное, высшее), а показатель изучаемого явления 5 значений (уровни удовлетворенности жизнью). Следовательно, макет аналитической таблицы (4×5) предполагает формирование 20 подгрупп.

Минимальная численность каждой подгруппы должна составлять 25-100 человек (в зависимости от доверительного интервала, определяемого исследователем). Соответственно, общий объем выборки может варьировать от 500 до 2000 человек, в зависимости от заданной исследователем точности. Чем больше градаций анализируемых признаков и выше желаемая точность измерений, тем больше должен быть объем выборки.

Бывают случаи, когда та или иная социальная группа обладает, по мнению исследователя, достаточно выраженными особенностями, представляющими принципиальный интерес с политической и социальной точек зрения (например, предприниматели, фермеры, военнослужащие и т.д.) для анализа той или иной социальной проблемы.

Результаты сравнительного анализа по различным параметрам стабильно подтверждают гипотезы исследователя об особенностях этой социальной группы. Но в репрезентативной региональной выборке представителей данной категории слишком мало, чтобы можно было сделать статистически обоснованные выводы. В таких случаях исследователь может обратиться к специальным выборкам, в частности, сформировать «выпуклую» выборку.

Выпуклая выборка включает основную (репрезентативную) совокупность, кроме того, составляется дополнительная подвыборка по интересующей исследователя категории. Минимальный объем дополнительной подвыборки должен составлять около 100 респондентов; оптимальный объем определяется особенностями предполагаемого анализа — количеством градаций в ответах на вопросы, но которым автор предполагает сравнивать исследуемые категории населения: чем больше градаций, тем больше должна быть выборка — как основная, так и дополнительная.

В случаях проведения исследования по «выпуклой» выборке, в процессе общего анализа полученных результатов дополнительная выборка исключается из массива данных. Это позволяет автору делать выводы, касающиеся распределений мнения населения в целом (т.к. основная выборка репрезентативна). В процессе сравнительного анализа, исследователь включает «дополнительную подсовокупность», увеличивая численность анализируемой категории.

В таком случае, полученные результаты смогут пройти статистическую экспертизу. Конечно, подготовка выпуклой выборки — процедура, требующая дополнительных средств (как финансовых, так и организационных). Но в таких ситуациях требуется идти на какие-то жертвы:

  • отказаться от анализа особенностей социальных групп, доля которых слишком мала для возможностей их характеристики в рамках репрезентативного опроса населения;
  • отказаться от репрезентативности и набирать выборку по группам и в процессе анализа сравнивать их между собой, но не иметь возможности судить о совокупном мнении населения ка кого-либо региона;
  • производить дополнительные затраты на подготовку выпуклой выборки.

Таким образом, можно видеть, что проблема объема выборочной совокупности решается всегда путем поиска компромиссного решения между точностью измерений и затратами на обеспечение этой точности.

Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)