4.2. Виды отбора при выборочном наблюдении
Процесс образования выборки называется отбором, который осуществляется в порядке беспристрастного, случайного отбора единиц из генеральной совокупности.
Основным условием проведения выборочного наблюдения является предупреждение возникновения систематических (тенденциозных) ошибок, возникающих вследствие нарушения принципа равных возможностей попадания в выборку каждой единицы совокупности. Предупреждение систематических ошибок достигается в результате применения научно обоснованных способов формирования выборочной совокупности. Существуют различные способы отбора: индивидуальный, групповой (серийный), комбинированный, повторный (возвратный), бесповторный (безвозвратный),одноступенчатый, многоступенчатый, собственно–случайный, механический, типический, двухфазный и многофазный отбор
При индивидуальном отборе в выборку отбираются отдельные единицы совокупности. Отбор повторяется столько раз, сколько необходимо отобрать единиц.
Групповой (серийный) отбор заключается в отборе серий (например, отбор изделий для проверки их целыми партиями). Если обследованию подвергаются все единицы отобранных серий, отбор называется серийным, а если обследуется только часть единиц каждой серии, отбираемых в индивидуальным порядке из серии, то – комбинированным.
Если в процессе отбора отобранная единица не исключается из совокупности, т.е. возвращается в совокупность, и может быть повторно отобранной, то такой отбор называется повторным или возвратным, в противном случае – бесповторным или безвозвратным. Серийный отбор, как правило, безвозвратный.
При повторном отборе вероятность попадания в выборочную совокупность всех единиц генеральной совокупности остается одинаковой. При бесповторном - для оставшихся единиц совокупности вероятность попадания в выборку увеличивается.
При одноступенчатом отбираются единицы совокупности (или серии) непосредственно для наблюдения. При многоступенчатом отбираются сначала крупные серии единиц (первая ступень отбора), наблюдению они не подвергаются. Затем из них отбираются серии, меньшие по численности единиц (вторая ступень), наблюдению не подвергаются, и так до тех пор, пока не будут отобраны те единицы совокупности (серии), которые будут подвергнуты наблюдению.
Собственно–случайный отбор состоит в отборе единиц (серий) из всей генеральной совокупности в целом посредством жеребьевки или на основании таблиц случайных чисел.
Жеребьевка состоит в том, что на каждую единицу отбора составляется карточка, которой присуждается порядковый номер. После тщательного перемешивания по очереди извлекаются карточки, пока не будет отобрано требуемое число единиц.
Случайными числами называются ряды чисел, являющихся реализациями последовательности взаимно независимых и одинаково распределенных случайных величин. Эти последовательности чисел получаются либо с помощью физических генераторов (подбрасывание кубиков с нанесенными на их сторонами цифрами; вытягиванием из урны карточек с написанными на них цифрами, преобразование случайных сигналов и др. физико–технические процессы), либо с помощью программных генераторов (аналитическим методом с помощью программ для ЭВМ). Числа, являющиеся результатами соответствующей вычислительной процедуры, называются псевдослучайными числами. Последовательность псевдослучайных чисел носит детерминированный характер, но в определенных границах она удовлетворяет свойствам равномерного распределения и свойству случайности.
Случайные числа могут быть выбраны по таблице случайных чисел (приложение 1), которая содержит 2000 случайных чисел, объединенных для удобства пользования таблицей в 500 блоков по 4 значения) Например,
5489, 5583, 3156, 0835, 1988, 3912.
Применение комбинаций этих цифр зависит от размера совокупности: если в генеральной совокупности 1000 единиц, то порядковый номер каждой единицы должен состоять из двух цифр от 000 до 999. В этом случае первые 8 номеров единиц выборочной совокупности следующие:
548, 955, 833, 156, 083, 519, 883, 912.
При произвольном объеме генеральной совокупности, отличающегося от 100, 1000, 10000 могут использоваться псевдослучайные числа, сформированные на ЭВМ, или из таблицы случайных чисел формируется последовательность случайных величин, распределенных в интервале от 0 до 1. Например, в приведенном выше примере
0,5489; 0,5583; 0,3156; 0,0835; 0,1988; 0,3912 и т.д.
Если генеральная совокупность состоит из 2000 единиц, то в выборочную совокупность должны войти единицы с номерами:
2000 Ч 0,5489 = 1097,8 или 1099;
2000 Ч 0,5583 = 1116,6 или 1117;
2000 Ч 0,3156 = 631,2 или 631;
2000 Ч 0,0835 = 167,0 или 167;
2000 Ч 0,1988 = 397,6 или 398;
2000 Ч 0,3912 = 782,4 или 782.
Процесс формирования случайных чисел и определения номера отбираемой единицы продолжается до тех пор, пока не будет получен заданный объем выборочной совокупности.
Можно предложить другой способ случайного отбора единиц в выборку. Допустим, что выборка состоит из 75 единиц, а генеральная совокупность - из 780. Из таблицы случайных чисел выбираются, например, следующие
5489, 5583, 3156, 0835, 1988, 3912.
В выборку могут войти только единицы, порядковые номера которых равны трехзначным числам меньше 780. Поэтому, используя только три последние цифры каждого числа, отбирается необходимые 75 номеров: 489, 583, 156 и т.д. Можно использовать и первые три цифры каждого числа, тогда отобранные номера: 548, 558, 315, 83, 198, 391. Можно разбить случайные четырехзначные случайные числа на ряд, состоящий из трехзначных чисел:
548, 955, 833, 156, 083, 519, 883, 912
и отобрать из них номера, которые меньше 780, а именно: 548, 156, 83, 519.
Механический отбор заключается в том, что составляется список единиц генеральной совокупности и в зависимости от числа отбираемых единиц (серий) устанавливается шаг отбора, т.е. через какой интервал следует брать для наблюдения единицы (серии). Например, в простейшем случае, при 10%–м отборе, отбирается каждая десятая единица по этому списку, т.е. если первой взята единица за № 1, то следующими отбираются 11–я, 21–я и т.д. В такой последовательности производится отбор, если единицы совокупности расположены в списке без учета их “рангов”, т.е. значимости по изучаемым признакам. Начало отбора в этом случае не имеет значения, его можно начать в приведенном примере от любой единицы из первого десятка. При расположении единиц совокупности в ранжированном порядке за начало отбора должна быть принята середина интервала (шага отбора) во избежание систематической ошибки выборки.
При достаточно большой совокупности этот способ отбора близок к собственно случайному, при условии, что применяемый список не составлен таким образом, чтобы какие-то единицы совокупности имели больше шансов попасть в выборку.
При типическом отборе генеральная совокупность разбивается на типические группы единиц по какому–либо признаку (формируются однородные совокупности), а затем из каждой из них производится механический или собственно–случайный отбор. Отбор единиц из типов производится тремя методами: пропорционально численности единиц типических групп, непропорционально численности единиц типических групп и пропорционально колеблемости признака в группах.
В целях экономии средств данные по некоторым интересующим исследователя признакам можно анализировать на основании изучения всех единиц выборочной совокупности, а по другим признакам - на основании части единиц выборочной совокупности, которые представляют подвыборку из единиц первоначальной выборки. Этот метод называется двухфазным отбором. При наличии нескольких подвыборок - метод многофазного отбора.
Многофазный отбор по своей структуре отличается от многоступенчатого отбора, так при многофазном отборе используются на каждой фазе одни и те же отобранные единицы, при многоступенчатом отборе на разных ступенях применяются единицы отбора разных порядков. Многофазным отбором чаще всего пользуются в тех случаях, когда различно число единиц, необходимых для определения отдельных показателей с заданной точностью. Это связано как с различиями в степени колеблемости признаков, так и с разной точностью, требуемой для расчетов. Ошибки при многофазной выборке рассчитываются на каждой фазе отдельно.
Все виды отбора, поскольку они могут быть повторными или бесповторными, имеют разновидности (табл.1)
Таблица1
Вид отбора | Разновидности отбора в зависимости от | |
повторяемости отбора единиц совокупности | от величины серий или пропорциональности отбора единиц совокупности в группах | |
Собственно случайный | 1. Собственно случайный повторный 2. Собственно случайный бесповторный | |
Механический | 1. Механический повторный 2. Механический бесповторный | |
Серийный | 1. Серийный с повторным отбором серий 2. Серийный с бесповтор- ным отбором серий | 1.1. Серийный с повторным отбором равновеликих серий 1.2. Серийный с повторным отбором неравновеликих серий 2.1. Серийный с бесповторном отбором равновеликих серий 2.2. Серийный с бесповторном отбором неравновеликих серий |
Комбиниро-ванный | 1. Комбинированный с повторным отбором серий 2. Комбинированный с бесповторным отбором серий | 1.1. Комбинированный с повторным отбором равновеликих серий 1.2. Комбинированный с повторным отбором неравновеликих серий 2.1. Комбинированный с бесповторным отбором равновеликих серий 2.2. Комбинированный с бесповторным отбором неравновеликих серий |
Типический | 1. Типический с повторным случайном отборе внутри групп 2. Типический при бесповторном случайном отборе внутри групп | 1.1. Типический с повторным случайном отборе внутри групп, пропорциональ- ном объему групп 1.2. Типический с повторным случайном отборе внутри групп, непропорцио- нальном объему групп 1.3. Типический с повторным случайном отборе внутри групп, пропорциональ- ном колеблемости в группах 2.1. Типический с бесповторным случайном отборе внутри групп, пропорциональ- ном объему групп 2.2. Типический с бесповторным случайном отборе внутри групп, непропорцио- нальном объему групп 2.3. Типический бесповторным случайном отборе внутри групп, пропорциональ- ном колеблемости в группах |
4.3. Ошибки выборочного отбора
Разность между показателями выборочной и генеральной совокупности называется ошибкой выборки. Ошибки выборки подразделяются на ошибки регистрации и ошибки репрезентативности.
Ошибки регистрации возникают из-за неправильных или неточных сведений. Источниками таких ошибок могут быть непонимание существа вопроса, невнимательность регистратора, пропуск или повторный счет некоторых единиц совокупности, описки при заполнении формуляров и т.д.
Среди ошибок регистрации выделяются систематические, обусловленные причинами, действующими в каком-то одном направлении и искажающими результаты работы (например, округление цифр, тяготение к полным пятеркам, десяткам и т.д.), и случайные, проявляющиеся в различных направлениях, уравновешивающие друг друга и лишь изредка дающие заметный суммарный итог.
Расхождение между значениями изучаемого признака выборочной и генеральных совокупностей является ошибкой репрезентативности (представи-тельности). Она может быть случайной и систематической. Случайная возникает в силу того, что выборочное статистическое наблюдение является несплошным наблюдением, и выборка недостаточно точно воспроизводит (репрезентирует) генеральную совокупность.
Систематические ошибка репрезентативности возникают из-за неправильного, тенденциозного отбора единиц, при котором нарушается основной принцип научно организованной выборки - принцип случайности.
При определении величины репрезентативной ошибки предполагается, что ошибка регистрации равна нулю. Определение ошибки производится по формулам ошибки выборочной доли и ошибки выборочной средней. Систематическая ошибка репрезентативности возникает вследствие нарушения правил отбора единиц генеральной совокупности, в частности принципа беспристрастного, непреднамеренного отбора. Систематическая ошибка может привести к полной непригодности результатов наблюдений.
Рассмотрим на примере, насколько отличаются выборочные и генеральные показатели по данным об успеваемости студентов (две 10%-е выборки):
Оценка | Число студентов, чел | ||
Генеральная совокупность | Первая выборка | Вторая выборка | |
2 3 4 5 | 100 300 520 80 | 9 27 54 10 | 12 29 52 7 |
Итого | 1000 | 100 | 100 |
Средний балл для генеральной совокупности
по первой выборке
по второй выборке
Доля студентов, получивших оценки "4" и "5":
по генеральной совокупности
по первой выборке
по второй выборке
Разность между показателями выборочной и генеральной совокупности является случайной ошибкой репрезентативности (ошибкой выборки).
Ошибки репрезентативности:
Как видно из расчетов, выборочная средняя и выборочная доля являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку.
... будут находиться характеристики генеральной совокупности. 9. Формулы для расчета необходимого объема выборки. 10. Сущность теорем П.Л. Чебышева и А.М. Ляпунова. 11. Распространение результатов выборочного наблюдения на генеральную совокупность. 2.5. Тесты 1. Совокупность, из которой производится отбор единиц для выборочного наблюдения называется: а) выборочной; б) генеральной; ...
... 1. Сущность и виды обобщающих статистических показателей. 2. Абсолютные статистические показатели, их значение в статистике и единицы измерения. 3. Виды относительных величин, техника их расчета и формы выражения. 4. Зависимость между относительными величинами динамики и планового задания. 5. Что выражают относительные величины структуры и координации. 6. Для характеристики каких ...
... Таблица 1 Среднее значение интервала, тыс. грн Фактическое количество предприятий 16 9 20 45 24 16 28 24 32 18 36 12 40 6 Всего 100 Тесты для закрепления материала Тест 1 В статистике критерий Стьюдента обозначается: а) критерий; б) ; в) критерий. Тест 2 Мощность критерия – это: а) вероятность отклонения испытуемой нулевой гипотезы, когда правильною является ...
... учитывается по месту жительства, а не по месту работы [4, 6]. Наблюдение может проводиться собственными силами или организациями, специализирующимися на проведении наблюдений. Проводят наблюдение как органы государственной, так и ведомственной статистики. Рис.2. Органы, которые могут проводить наблюдение [1] В зависимости от особенностей объекта при организации статистического наблюдения ...
0 комментариев