С какой степенью точности следует приводить данные в процентах?

При оформлении результатов анализа данные процентных распределений приводят, как правило, с точностью максимум до одной десятой. При этом следует учитывать, что даже один десятичный знак затрудняет восприятие данных, так как потребитель информации, сравнивая цифры, мысленно производит округление.

Поэтому в тех случаях, когда можно отказаться даже от десятых, лучше производить округление до целых чисел. Следовательно, решая проблему округления, автор фактически должен выбрать один из двух вариантов: приводить данные в целых числах или указывать десятичные значения. Чем должен руководствоваться исследователь, решая эту проблему?

Общий принцип сводится к тому, что чем больше выборка, тем более вероятно, что десятые доли процента могут представлять значимое информационное значение.

При этом не следует забывать, что при представлении данных в таблице при небольших выборках (в несколько сотен единиц наблюдения) десятичные знаки не только затрудняют восприятие таблицы, но и могут вводить читателя в заблуждение.

Например, если автор анализа, приводя сравнительные данные о доверии населения различным политическим деятелям, указывает, что одному доверяют 11.5%, другому 11.9%, а третьему — 12.4% (при том, что выборку составляют 400 человек), то может сложиться впечатление, что существует определенное различие в уровне доверия этим политическим фигурам, тогда как при такой выборке эти различия статистически не значимы. Совсем другой вывод можно было бы сделать, если бы при этих же данных было опрошено 10 000 человек.

В каждом конкретном случае можно подсчитать — какая степень точности статистически обоснована, а какая — нет. Но если решать вопрос о точности округления в целом, то можно руководствоваться следующими общими правилами.

  1. Совершенно недопустимо, чтобы в одной таблице одни данные были представлены в целых числах, а другие — с точностью до десятых. Правило, которому необходимо следовать в любом случае, — все данные должны приводиться с одинаковой степенью точности.
  2. Никогда не следует забывать, что если процент берется от числа, значение которого меньше ста, то исследователь оперирует с условными процентами. Когда мы говорим «двадцать процентов населения поддерживают…», то подразумевается, что «поддерживают…» двадцать человек из каждых ста с определенной вероятностью. (Степень этой вероятности определяется численностью опрошенных и ее репрезентативностью по отношению к генеральной совокупности). Переходя к анализу различий в полученных данных, выраженных в процентах, и отвлекаясь от абсолютной численности анализируемой группы, автор анализа нередко забывает, что говорить о «двадцати процентах» от 10-20 человек просто смешно, потому что речь идет о мнении 2-4 человек, и любое случайное изменение (в опрос попал другой респондент данной группы; человек ответил, не подумав; в конце концов, оператор ошибся при вводе информации и т.п.) в итоге обусловит совершенно иную картину в процентном распределении.
  3. При объеме выборочной совокупности от 100 до 1000 человек данные процентных распределений обычно лучше приводить в целых числах. В этом случае различия
    в данных , приводимых в целых числах, или с указанием соответствующих десятых, не принципиальны, но воспринимать данные значительно удобнее в целых числах.
    Исключение составляет освещение результатов мониторинговых исследований. Например, в тех случаях, когда проводится ежемесячный (ежегодный) опрос по одним и тем же переменным, различия в результатах опроса от месяца к месяцу могут носить не значимый характер; однако фиксируемая устойчивая тенденция сама по себе представляет определенную информацию.
  4. При объеме выборочной совокупности более 1000 человек, данные в большинстве случаев лучше приводить с десятыми, так как в тех случаях, когда выборка составляет несколько тысяч человек, различие в десятых долях процента может
    быть не. только показательным, но и статистически значимым.

Эти правила носят достаточно общий характер и предназначены в качестве рекомендации исследователю, испытывающему затруднения, связанные с представлением результатов опроса. В каждом конкретном случае автор анализа может самостоятельно решать – с какой степенью точности ему следует представлять материал. Главное, чтобы это решение было достаточно осознанным и обоснованным.

Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)