logo
bilety - статистика+

13. Ошибки выборки. Расчет необходимой численности выборки. Влияние вида выборки на величину ошибки репрезентативности.

Неточности, неправильности в статистических данных, полученных при наблюдении, принято называть ошибками наблюдения. Эти ошибки подразделяются на два вида: ошибки регистрации и ошибки репрезентативности (представительности наблюдения).

Ошибки регистрации – это расхождения между сведениями, записанными в формуляры наблюдения и фактическим положением в исследуемой совокупности.

Ошибки репрезентативности (представительности) – это расхождение между характеристиками выборки и генеральной совокупности. Ошибка рассчитывается по формуле: ; .

Ошибки могут быть систематическими, если нарушается принцип отбора единиц, и случайными. Случайные ошибки объясняются недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности. В результате первой причины выборка легко может оказаться смещенной, так как при отборе каждой единицы допускается ошибка, всегда направленная в одну и ту же сторону. Эта ошибка получила название ошибки смещения. Ее размер может превышать величину случайной ошибки. Особенность ошибки смещения состоит в том, что, представляя собой постоянную часть ошибки репрезентативности, она увеличивается с увеличением объема выборки. Случайная же ошибка с увеличением объема выборки уменьшается. Кроме того, величину случайной ошибки можно определить, тогда как размер ошибки смещения непосредственно практически определить очень сложно, а иногда и невозможно. Поэтому важно знать причины, вызывающие ошибку смещения, и предусмотреть мероприятия по ее устранению.

Систематические ошибки подразделяются на преднамеренные и непреднамеренные. Преднамеренные – сознательные искажения (приписки). Непреднамеренные ошибки – допускаются неумышленно, это ошибки, связанные с неисправностями измерительных приборов, пропуском записей и т.д.

Непреднамеренные ошибки могут возникать на стадии подготовки выборочного наблюдения, формирования выборочной совокупности и анализа ее данных. Чтобы не допустить появления таких ошибок, необходима хорошая основа выборки, Основа выборки должна быть достоверной, полной и соответствовать цели исследования, а единицы отбора и их характеристики должны соответствовать действительному их состоянию на момент подготовки выборочного наблюдения. Нередки случаи, когда в отношении некоторых ед-ц, попавших в выборку, трудно собрать сведения из-за их отсутствия на момент наблюдения, нежелания дать сведения и т. п. В таких случаях эти ед приходится заменять др. Необходимо следить, чтобы замена осуществлялась равноценными ед.

Случайная ошибка выборки возникает в результате случайных различий между ед-ми, попавшими в выборку, и ед-ми генеральной совокупности, т. е. она связана со случайным отбором. случайная ошибка выборки возникает в результате случайных различий между ед-ми выборочной и генеральной совокупностей, при достаточно большом объеме выборки она будет мала. Различают среднюю (стандартную) и предельную ошибку выборки. Под средней (стандартной) ошибкой выборки понимают расхождение между средней выборочной и генеральной совокупностей. Предельной ошибкой выборки принято считать максимально возможное расхождение, т. е. максимум ошибки при заданной вероятности ее появления.

В математической теории выборочного метода сравниваются средние характеристики признаков выборочной и генеральной совокупностей и доказывается, что с увеличением объема выборки вероятность появления больших ошибок и пределы максимально возможной ошибки уменьшаются. Чем больше обследуется единиц, тем меньше будет величина расхождений выборочных и генеральных характеристик.

Рассчитывают 2 вида ошибок: среднюю (µ) и предельную (∆).

Способ отбора

Средняя ошибка, µ

для средней

для доли

Повторный

Бесповторный

С заданной вероятностью P(t) находится предельная ошибка выборки: ; ,

где t – коэффициент доверия, определяется исходя из вероятности исследования; ∆x – предельная ошибка выборки. На практике пользуются готовыми таблицами значений.

Доверительные пределы, в которых следует ожидать генеральную среднюю: .

Для определения необходимой численности выборки задается уровень точности выборочной совокупности с определенной вероятностью. Формула для расчета необходимой численности выборки выводится из формулы предельной ошибки. Поэтому, расчет необходимой численности выборки будет осуществляться исходя из способа отбора.

Однако каждая из формул численности показывает, что с увеличением предполагаемой ошибки выборки значительно уменьшается ее необходимый объем. Кроме того, для определения численности выборки необходимо также задать уровень колеблемости, выражаемый дисперсией или средним квадратическим отклонением. Способ выражения качественных признаков не позволяет рассчитать по ним средние значения, дисперсию и среднее квадратическое отклонение, поэтому оценка колеблемости производится исходя из долей единиц, обладающих значениями этих признаков, т.е. выборочных долей.

Если расчет проводится по качественному альтернативному признаку и не известна его доля в генеральной совокупности, то рекомендуется принять ее равной 0,5. Именно при этом значении дисперсия доли достигает своего максимума 0,25.

Заключительным этапом является распространение результатов выборочного обследования на генеральную совокупность. Вывод о возможности распространения зависит от полноты выборки. Под полнотой понимается наличие или представленность всех типов и групп данной генеральной совокупности в основе выборки.

Более точной основой суждения о распространении результатов является расчет относительной ошибки: для средней: ; для доли: .

Если величина относительной ошибки не превышает заранее установленного для данного обследования предельного значения, то данные выборочного наблюдения являются представительными и могут быть распространены на генеральную совокупность.

Достоверность рассчитанных по выборочным данным характеристик определяется репрезентативностью выборочной совокупности, которая зависит от способа отбора единиц. По виду различают индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при групповом – группы единиц, а при комбинированном отборе производится сочетание группового и индивидуального отбора.

Метод отбора определяет возможность продолжения участия отобранной единицы в процедуре отбора.

Бесповторным называется отбор, при котором попавшая в выборку единица не возвращается в генеральную совокупность. При повторном отборе – попавшая в выборку единица после регистрации наблюдаемых признаков возвращается в исходную совокупность и может снова участвовать в процедуре отбора.

Для получения объективных данных при выборочном обследовании необходимо иметь достаточное число отобранных единиц в связи с тем, что размер ошибки выборки зависит от численности выборочной совокупности n.

Для определения необходимой численности выборки надо знать уровень точности выборочной совокупности с определенной вероятностью.

В общем случае необходимая численность выборки прямо пропорциональна дисперсии признака и квадрату коэффициента доверия t2.

Формула для расчета необходимой численности выборки выводится из формулы предельной ошибки.Формулы расчета оптимальной численности выборки

Способ отбора

Необходима численность выборки, n

для средней

для доли

Повторный

Бесповторный

Конечная цель выборочного наблюдения заключается в распространении полученных данных на генеральную совокупность. Распространение выборочных результатов на генеральную совокупность производится с учетом закона больших чисел, который определяет с заданной вероятностью предел возможной ошибки различий средних.

Выборочный метод чаще всего применяется для получения характеристик генеральной совокупности по соответствующим показателям выборки. В зависимости от целей исследований это осуществляется или прямым пересчётом показателей выборки для генеральной совокупности, или посредством расчёта поправочных коэффициентов.

Способ прямого пересчета состоит в том, что показатели выборочной доли w, или средней х распространяются на генеральную совокупность с учетом ошибки выборки. Применяются формулы: ,

Способ поправочных коэффициентов применяется в случаях, когда целью выборочного метода является уточнение результатов сплошного учета. Рассчитывается поправочный коэффициент путем сопоставления данных контрольного выборочного наблюдения и показателей сплошного наблюдения. Затем величина объема генеральной совокупности корректируется на поправочный коэффициент.