13. Ошибки выборки. Расчет необходимой численности выборки. Влияние вида выборки на величину ошибки репрезентативности.
Неточности, неправильности в статистических данных, полученных при наблюдении, принято называть ошибками наблюдения. Эти ошибки подразделяются на два вида: ошибки регистрации и ошибки репрезентативности (представительности наблюдения).
Ошибки регистрации – это расхождения между сведениями, записанными в формуляры наблюдения и фактическим положением в исследуемой совокупности.
Ошибки репрезентативности (представительности) – это расхождение между характеристиками выборки и генеральной совокупности. Ошибка рассчитывается по формуле: ; .
Ошибки могут быть систематическими, если нарушается принцип отбора единиц, и случайными. Случайные ошибки объясняются недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности. В результате первой причины выборка легко может оказаться смещенной, так как при отборе каждой единицы допускается ошибка, всегда направленная в одну и ту же сторону. Эта ошибка получила название ошибки смещения. Ее размер может превышать величину случайной ошибки. Особенность ошибки смещения состоит в том, что, представляя собой постоянную часть ошибки репрезентативности, она увеличивается с увеличением объема выборки. Случайная же ошибка с увеличением объема выборки уменьшается. Кроме того, величину случайной ошибки можно определить, тогда как размер ошибки смещения непосредственно практически определить очень сложно, а иногда и невозможно. Поэтому важно знать причины, вызывающие ошибку смещения, и предусмотреть мероприятия по ее устранению.
Систематические ошибки подразделяются на преднамеренные и непреднамеренные. Преднамеренные – сознательные искажения (приписки). Непреднамеренные ошибки – допускаются неумышленно, это ошибки, связанные с неисправностями измерительных приборов, пропуском записей и т.д.
Непреднамеренные ошибки могут возникать на стадии подготовки выборочного наблюдения, формирования выборочной совокупности и анализа ее данных. Чтобы не допустить появления таких ошибок, необходима хорошая основа выборки, Основа выборки должна быть достоверной, полной и соответствовать цели исследования, а единицы отбора и их характеристики должны соответствовать действительному их состоянию на момент подготовки выборочного наблюдения. Нередки случаи, когда в отношении некоторых ед-ц, попавших в выборку, трудно собрать сведения из-за их отсутствия на момент наблюдения, нежелания дать сведения и т. п. В таких случаях эти ед приходится заменять др. Необходимо следить, чтобы замена осуществлялась равноценными ед.
Случайная ошибка выборки возникает в результате случайных различий между ед-ми, попавшими в выборку, и ед-ми генеральной совокупности, т. е. она связана со случайным отбором. случайная ошибка выборки возникает в результате случайных различий между ед-ми выборочной и генеральной совокупностей, при достаточно большом объеме выборки она будет мала. Различают среднюю (стандартную) и предельную ошибку выборки. Под средней (стандартной) ошибкой выборки понимают расхождение между средней выборочной и генеральной совокупностей. Предельной ошибкой выборки принято считать максимально возможное расхождение, т. е. максимум ошибки при заданной вероятности ее появления.
В математической теории выборочного метода сравниваются средние характеристики признаков выборочной и генеральной совокупностей и доказывается, что с увеличением объема выборки вероятность появления больших ошибок и пределы максимально возможной ошибки уменьшаются. Чем больше обследуется единиц, тем меньше будет величина расхождений выборочных и генеральных характеристик.
Рассчитывают 2 вида ошибок: среднюю (µ) и предельную (∆).
Способ отбора | Средняя ошибка, µ | |
для средней | для доли | |
Повторный |
|
|
Бесповторный |
|
|
С заданной вероятностью P(t) находится предельная ошибка выборки: ; ,
где t – коэффициент доверия, определяется исходя из вероятности исследования; ∆x – предельная ошибка выборки. На практике пользуются готовыми таблицами значений.
Доверительные пределы, в которых следует ожидать генеральную среднюю: .
Для определения необходимой численности выборки задается уровень точности выборочной совокупности с определенной вероятностью. Формула для расчета необходимой численности выборки выводится из формулы предельной ошибки. Поэтому, расчет необходимой численности выборки будет осуществляться исходя из способа отбора.
Однако каждая из формул численности показывает, что с увеличением предполагаемой ошибки выборки значительно уменьшается ее необходимый объем. Кроме того, для определения численности выборки необходимо также задать уровень колеблемости, выражаемый дисперсией или средним квадратическим отклонением. Способ выражения качественных признаков не позволяет рассчитать по ним средние значения, дисперсию и среднее квадратическое отклонение, поэтому оценка колеблемости производится исходя из долей единиц, обладающих значениями этих признаков, т.е. выборочных долей.
Если расчет проводится по качественному альтернативному признаку и не известна его доля в генеральной совокупности, то рекомендуется принять ее равной 0,5. Именно при этом значении дисперсия доли достигает своего максимума 0,25.
Заключительным этапом является распространение результатов выборочного обследования на генеральную совокупность. Вывод о возможности распространения зависит от полноты выборки. Под полнотой понимается наличие или представленность всех типов и групп данной генеральной совокупности в основе выборки.
Более точной основой суждения о распространении результатов является расчет относительной ошибки: для средней: ; для доли: .
Если величина относительной ошибки не превышает заранее установленного для данного обследования предельного значения, то данные выборочного наблюдения являются представительными и могут быть распространены на генеральную совокупность.
Достоверность рассчитанных по выборочным данным характеристик определяется репрезентативностью выборочной совокупности, которая зависит от способа отбора единиц. По виду различают индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при групповом – группы единиц, а при комбинированном отборе производится сочетание группового и индивидуального отбора.
Метод отбора определяет возможность продолжения участия отобранной единицы в процедуре отбора.
Бесповторным называется отбор, при котором попавшая в выборку единица не возвращается в генеральную совокупность. При повторном отборе – попавшая в выборку единица после регистрации наблюдаемых признаков возвращается в исходную совокупность и может снова участвовать в процедуре отбора.
Для получения объективных данных при выборочном обследовании необходимо иметь достаточное число отобранных единиц в связи с тем, что размер ошибки выборки зависит от численности выборочной совокупности n.
Для определения необходимой численности выборки надо знать уровень точности выборочной совокупности с определенной вероятностью.
В общем случае необходимая численность выборки прямо пропорциональна дисперсии признака и квадрату коэффициента доверия t2.
Формула для расчета необходимой численности выборки выводится из формулы предельной ошибки.Формулы расчета оптимальной численности выборки
-
Способ отбора
Необходима численность выборки, n
для средней
для доли
Повторный
Бесповторный
Конечная цель выборочного наблюдения заключается в распространении полученных данных на генеральную совокупность. Распространение выборочных результатов на генеральную совокупность производится с учетом закона больших чисел, который определяет с заданной вероятностью предел возможной ошибки различий средних.
Выборочный метод чаще всего применяется для получения характеристик генеральной совокупности по соответствующим показателям выборки. В зависимости от целей исследований это осуществляется или прямым пересчётом показателей выборки для генеральной совокупности, или посредством расчёта поправочных коэффициентов.
Способ прямого пересчета состоит в том, что показатели выборочной доли w, или средней х распространяются на генеральную совокупность с учетом ошибки выборки. Применяются формулы: ,
Способ поправочных коэффициентов применяется в случаях, когда целью выборочного метода является уточнение результатов сплошного учета. Рассчитывается поправочный коэффициент путем сопоставления данных контрольного выборочного наблюдения и показателей сплошного наблюдения. Затем величина объема генеральной совокупности корректируется на поправочный коэффициент.
- 5. Понятие, задачи и организация статистической сводки.
- Структурные средние (мода и медиана)
- 11. Понятие вариации массовых явлений. Показатели вариации, их свойства, формулы расчета и экономический смысл.
- Правило сложения дисперсии и его использование в анализе взаимосвязей
- 12. Сущность выборочного метода наблюдения, сферы применения, виды выборки и способы формирования выборочной совокупности.
- 13. Ошибки выборки. Расчет необходимой численности выборки. Влияние вида выборки на величину ошибки репрезентативности.
- 14.Понятие о рядах динамики, их виды, элементы ряда и правила построения.
- 20. Индексы с постоянными и переменными весами. Индексы структуры.
- Индексы структурных сдвигов.
- 21. Виды и формы связей. Основные статистические методы изучения связей.
- Основные статистические методы выявления корреляционной связи
- 22. Выбор формы связей. Уравнение регрессии, вычисление и интерпретация его параметров
- 23. Основные показатели измерения тесноты связи между признаками.
- 24.Изучение численности и состава населения. Основные источники статистической информации о населении.
- 25. Методы расчета численности населения и трудовых ресурсов на перспективу.
- 27. Статистика занятости и безработицы. Классификация рабочей силы по экономической активности и статусу в занятости.
- 29. Понятие национального богатства. Изучение его объема и структуры.
- 31 .Изучение динамики и использования основных фондов.
- 32.Балансы основных фондов. Методы оценки основных фондов.
- 34. Статистика продукции сельского хозяйства. ( Статистика растениеводства, животноводства, урожая и урожайности, посевных площадей.)
- 37. Производительность труда. Основные показатели и методы расчета.
- 41. Показатели статистики издержек обращения.
- В настоящее время используется следующая номенклатура статей издержек обращения:
- Основные задачи анализа издержек обращения:
- 43. Основные показатели рентабельности, их сущность и способы расчета.
- 44. Сущность и методы исчисления валового внутреннего продукта.
- 45. Сущность и методы расчета национального дохода
- Показатели образования доходов
- 46. Система показателей национальных счетов
- Показатели распределения первичных доходов. Определение валового и чистого национального дохода
- 48. Статистика денежного обращения
- Наиболее важными показателями в анализе кредитных отношений являются:
- 17.3.Атистика банковской и биржевой деятельности