1.7 Малая выборка

 

Таблицы интеграла вероятностей используются для выборок большого объема из бесконечно большой генеральной совокупности. Но уже при п < 100 возникает несоответствие между табличными данными и вероятностью предела; при п < 30 погрешность становится значительной. Несоответствие обусловлено главным образом характером распределения единиц генеральной совокупности. При большом объеме выборки особенность распределения в генеральной совокупности не имеет значения, так как распределение отклонений выборочного показателя от генеральной характеристики при большой выборке всегда оказывается нормальным.

В выборках небольшого объема п < 30 характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибки выборки при небольшом объеме наблюдения (уже менее 100 единиц) отбор должен проводиться из совокупности, имеющей нормальное распределение.


1.8 Примеры применения выборочного метода

 

Потребность в использовании выборочного метода, выработке вероятностных суждений в современной отечественной практике непрерывно расширяется. В государственной статистике основными направлениями использования выборочного метода традиционно являются бюджетные обследования домо-хозяйств, выборочные переписи населения, контрольные обходы и проверки после проведения сплошных обследований. Создание ЕГРПО, в котором фиксируются все хозяйствующие субъекты на территории Российской Федерации всех форм собственности, открывает возможность проведения разнообразных выборочных обследований в области экономики.

В области социальных исследований для государственной статистики главным является бюджетное обследование, которое охватывает примерно 45 тыс. домохозяйств. Оно основано на многоступенчатом отборе. Общий объем выборки распределяется по сферам занятости (для работающих) и территориям. Затем для работающих проводится отбор предприятий в пределах каждой отрасли в отобранной территории. Если, например, нужно отобрать 100 рабочих, занятых в определенной отрасли, для обследования семейных бюджетов так, чтобы на каждом отобранном предприятии было не менее 20 бюджетов, включающих рабочих с разным уровнем заработной платы, то, значит, должно быть отобрано: 100 : 20 = 5 предприятий. Отбор предприятий проводят по списку, в котором предприятия располагаются в порядке убывания средней заработной платы рабочих, указываются общее число рабочих, их суммарная заработная плата. Шаг отбора определяется делением общего числа рабочих на предприятиях данной отрасли на число отбираемых предприятий. Если всего на предприятиях данной отрасли в области занято 30525 человек, то шаг отбора равен: 30525 : 5 = 6105. По данным кумулятивной численности рабочих с рассчитанным шагом отбора проводится отбор предприятий, которые затем проверяются на репрезентативность по показателю средней месячной заработной платы. Следующая стадия связана с отбором рабочих на выбранных предприятиях: среди 20 бюджетов должны быть пропорционально представлены бюджеты семей малоквали- фицированных и высококвалифицированных рабочих, а среди этих категорий отбор проводится механически по спискам рабочих, составленным в порядке убывания средней месячной заработной платы, Выборочная совокупность при бюджетных обследованиях включает и семьи неработающих (пенсионеров, студентов, инвалидов) и одиночек.

Задачей статистики в области бюджетных обследований являются обеспечение представительства всех социальных групп и учет всех источников дохода. Наиболее общим показателем уровня благосостояния населения являются денежные доходы, поступающие в семью в виде заработной платы, премий, единовременных выплат, гонораров, предпринимательского дохода или дохода от собственности, компенсационных выплат и дотаций. В совокупные доходы семьи включаются также натуральная оплата труда, доходы, полученные от реализации и потребления продукции личного подсобного хозяйства (садового участка, коллективного огорода). Для характеристики обеспеченности семей следует учитывать их накопления, а также валютные поступления. Возрастает значение анализа личного потребления. Для изучения структуры рабочего времени работников разных категорий, особенно рабочих, а также для характеристики использования машин и оборудования используется метод моментных наблюдений. Этот метод состоит в регистрации вида затрат времени в определенные, заранее выбранные моменты. Предварительно составляется список всех возможных состояний или видов затрат времени. Подсчитывается доля отметок о каждом состоянии, и оценивается доверительный интервал доли времени, затраченного на тот или иной вид работы. Отбор моментов выборки может быть проведен либо по схеме механической выборки — через равные промежутки времени, либо по схеме случайной выборки с использованием таблицы случайных чисел. Необходимая численность моментов наблюдения рассчитывается как Если при проверке отобранных документов ошибок не обнаружено, то с принятой доверительной вероятностью мы можем распространить результаты выборки на всю генеральную совокупность и считать, что итог по генеральной совокупности завышен не более чем на величину предельно допустимой ошибки. Если же обнаружена по крайней мере одна ошибка, то первоначальная гипотеза относительно отсутствия ошибок, которая закладывалась при планировании выборки, оказывается несостоятельной. В этом случае должны быть пересмотрены либо значение коэффициента надежности, либо величина предельно допустимой ошибки (точность), либо и то, и другое. Если ошибки выявлены в операциях, значение которых превышает величину шага отбора, то можно быть уверенным в отношении абсолютного размера ошибок в таких операциях, так как каждая из них проверялась полностью. В этом случае нужно решить вопрос о распространении абсолютного размера выявленных ошибок на операции, значение которых меньше шага отбора. Все ошибки группируются в два класса: завышение суммы и ее занижение. Для всех операций, значение которых превышает шаг отбора, выявленная ошибка является точным размером завышения или занижения. Для операций, значение которых меньше шага отбора, размер выявленной ошибки относится к значению операции, и полученная относительная ошибка умножается на шаг отбора, т.е. распространяется на весь интервал. После определения суммарного размера ожидаемой ошибки по всем интервалам выборки (т.е. шагам отбора) проводится сравнение с допустимым размером суммарной ошибки, и если рассчитанная суммарная ошибка превосходит допустимую величину, то, подставляя последнюю в формулу объема выборки, определяют, с каким коэффициентом надежности и соответственно с какой доверительной вероятностью могут гарантироваться результаты данного выборочного исследования: данных не в целом по единице наблюдения, а лишь по некоторым пунктам формуляра наблюдения. К частичным пропускам относят также ошибочные и некорректные ответы, которые могут быть внесены в бланк с данными в силу непонимания вопроса, неточности или просто невнимательности. Для обработки полных не ответов респондентов совокупность не ответивших предприятий должна быть разделена на три следующие группы:

• • первая — предприятия, данные по которым восстанавливаться не будут. К ним относятся предприятия, ликвидированные или находящиеся в стадии ликвидации, так называемые спящие, т.е. приостановившие свою деятельность в силу различных причин;

• • вторая — предприятия, о которых достоверно известно, что они, несмотря на отсутствие отчета, активны, ведут финансово-хозяйственную деятельность;

• • третья — предприятия, по которым нет никаких данных и даже сведений, действующие они или нет. К каждой группе полных неответов применяется свой метод коррекции и восстановления данных. Используются следующие методы восстановления пропусков:

• • заполнение с пристрастным подбором;

• заполнение по предыдущему значению;

• заполнение без подбора;

• • заполнение средними;

• • заполнение с помощью регрессии;

• замена.

Заполнение с пристрастным подбором означает поиск данных, относящихся к единицам определенного типа. Заполнение по предыдущему значению часто используется в современной практике. Но этот метод не рекомендуется применять при большом количестве пропусков, а также при наличии тенденции изменения показателя и значительном сроке со дня последней регистрации значения. Заполнение безусловными средними. По имеющимся наблюдениям рассчитываются средние, и существующий пропуск заполняется средними значениями. Этот метод эффективен при однородности анализируемой совокупности и небольшом количестве пропусков.

Заполнение с помощью регрессии состоит в заполнении пропусков значениями, предсказываемыми регрессией пропущенных для данного объекта переменных на основе присутствующих. Регрессия вычисляется по объектам с полной информацией. Этот метод выдвигает ряд серьезных требований к данным: однородность, поскольку известно, что при использовании метода наименьших квадратов небольшое число грубых ошибок может весьма существенно исказить значение характеристики распределения; подчинение теоретическому нормальному распределению, что требует дополнительной обработки информации.

5. Досчет на вновь зарегистрированные предприятия. Записи о вновь зарегистрированных предприятиях добавляются к выборочной совокупности, и коэффициент увеличения численности используется как коэффициент досчета по всем показателям.

6. Распространение результатов выборочного наблюдения на генеральную совокупность проводится по методике, рассмотренной выше.

7. Анализ и экспертная корректировка полученных результатов. За качество передаваемой на федеральный уровень информации отвечает соответствующая территория (субъект РФ или федеральный округ). Достоверность отчетности зависит только от квалификации исполнителя и желания добросовестно сделать свою работу. Решению проблем, связанных прежде всего с проблемами организации и проведения выборочных обследований малых предприятий на региональном уровне, посвящена разработка подпроекта Программы TACIS «Статистика-3». Особое внимание уделялось вопросам подготовки анкеты выборочного наблюдения, составу и структуре содержащихся в ней показателей, а также концепциям формирования выборки на региональном уровне. Большая проблема для российской статистики состоит в выявлении и обработке данных нетипичных единиц наблюдения. Несмотря на достаточно эффективный план выборки проводимого обследования, при детальном анализе данных на региональном и федеральном уровнях неоднократно выявлялись единицы, включение (или исключение) которых в выборочную совокупность сильно влияет на итоговое значенительным контролем при разработке итогов обследований малых предприятий.

Выборочный метод широко используется при проведении конъюнктурных опросов. Конъюнктурные опросы рекомендуется проводить по постоянной выборке, т.е. по панели предприятий. Это обеспечивает существенные преимущества при организации опросов и анализе результатов. Достоинства панельной организации опросов. Во-первых, регулярное получение ответов от одной и той же совокупности предприятий создает уникальную возможность экономического анализа на микроуровне.

Во-вторых, при разумной и дальновидной организации хранения и накопления результатов панельных опросов появляется возможность многократного и всестороннего использования результатов опросов. При этом аналитические результаты могут быть получены без проведения новых опросов, а только за счет применения новых методов или моделей к уже накопленным данным. Новые опросы на той же панели могут в этом случае проводиться для расширения уже существующих первичных данных.

В-третьих, регулярный (ежемесячный или ежеквартальный) характер бизнес-обследований позволяет организаторам при необходимости регулярно совершенствовать вопросы анкеты и получать таким образом все более точные данные об исследуемых явлениях.

В-четвертых, создание панели и накопление панельных данных позволяют использовать специфические статистические методы и эконометрические модели, не применимые к другим типам данных. Эти методы и модели способны обеспечить получение принципиально новых результатов.

В настоящее время на регулярной основе проводятся обследования предпринимательских намерений в промышленности, строительстве, сельском хозяйстве, оптовой торговле, а также в банковском и страховом секторах и в инновационной сфере.

Обследования базовых предприятий промышленности проводятся ежемесячно; по промышленности в целом — ежеквартально; строительных организаций, оптовой торговли и в инновационной сфере — ежеквартально; в банковском и страховом секторах — два раза в год.

Выборочное наблюдение широко используется при изучении качества готовой продукции. Отбор готовых изделий для установления их качества проводится главным образом механически (5-е, 10-е, 15-е изделие и т.д.). Если изделия в таре, то в большинстве случаев осуществляется серийный отбор (единица отбора = единице тары). Это так называемый приемочный или последующий контроль, основанный на проверке качества уже выработанных изделий; он не в состоянии предупредить появление брака.

Большое распространение получил непрерывный текущий статистический контроль за качеством изготовляемой продукции, осуществляемый в форме отбора проб в ходе производственного процесса непосредственно у рабочих мест.

Такой контроль обеспечивает систематическое наблюдение не только за качеством продукции, но и за самим производственным процессом. Текущий контроль в ходе отбора и анализа проб позволяет своевременно обнаружить неполадки в работе, сигнализировать о них и тем самым предупредить возникновение брака.

Значительной сферой применения выборочного наблюдения являются маркетинговые исследования, проводимые с целью оценки мощности рынков товаров и услуг, определения специфических сегментов рынка.


Заключение

 

Выборочное наблюдение проводится с целью повышения точности и оперативности данных, экономии материальных, трудовых и финансовых ресурсов.

Для того чтобы по выборке можно было делать вывод о свойствах генеральной совокупности, выборка должна быть репрезентативной. Репрезентативность выборки может быть обеспечена объективным отбором данных. Используют три способа отбора: случайный, механический, сочетание первого и второго способов.

Если отбор проводится из генеральной совокупности, предварительно разделенной на типы (районы, слои или страты), то такая выборка называется типической (районированной, расслоенной или стратифицированной).

Единицей отбора может быть единица наблюдения или группа единиц. В последнем случае выборка называется серийной или гнездовой. В социально-экономических исследованиях используется схема бесповторной выборки.

Ошибки выборочного наблюдения подразделяются на случайные и неслучайные. Случайные ошибки подчиняются вероятностным законам. К случайным относится ошибка выборки, называемая ошибкой репрезентативности.

Рассчитываются ошибки выборки для выборочных средних и выборочных относительных величин. На величину ошибки выборки влияет вид выборки: если районы существенно отличаются друг от друга, то ошибка районированной выборки будет меньше, чем нерайонированной выборки; применение гнездовой выборки при прочих равных условиях приводит к увеличению ошибки выборки. На практике часто используют сочетание районированной выборки с гнездовым отбором. Применение выборочного метода связано с решением трех задач:

• определение объема выборки, обеспечивающего требуемую точность результатов с принятой вероятностью;

• расчет предельной ошибки репрезентативности, гарантированный с принятой вероятностью, и сравнение его с величиной допустимой погрешности;

• определение вероятности того, что ошибка выборки не превысит допустимой погрешности.

Первая задача связана с распространением данных выборки на генеральную совокупность. На основе выборочных характеристик даются интервальные оценки генеральных параметров. Могут быть получены и оценки значения подсчетов в генеральной совокупности.

Определенные особенности имеют организация и проведение малых выборок (при п < 30 единиц). Выборочный метод все шире применяется как в официальной статистике, так и в научных исследованиях, и в бизнесе.


Приложение

 

Задача № 1

Для определения скорости расчетов с кредиторами предприятий одного треста была проведена случайная выборка 50 платежных документов, по которым средний срок перечисления денег оказался равен 28,2 дня со стандартным отклонением 5,4 дня. Определим средний срок прохождения всех платежей в течение данного года с доверительной вероятностью F(t)= 0,95, Тогда t= 1,96; скорректированная дисперсия средняя ошибка выборки

Отклонение выборочной средней от генеральной с вероятностью 0,95 составит; = 1,96 x 0,77 = ±1,51 дня.

Величина  называется доверительной ошибкой выборки или предельной ошибкой выборки. Рассчитав величину , мы можем записать следующее неравенство:

28,2 - 1,51 28,2 + 1,51;

26,7 дня  29,7 дня.

Таким образом, с вероятностью 0,95 можно утверждать, что средняя продолжительность расчетов предприятия данного треста с кредиторами составляет неменее26,7дняинеболее29,7дня.

 


Задача № 2

 

По данным выборочного изучения 100 платежных документов предприятий одного треста оказалось, что в шести случаях сроки расчетов с кредиторами были превышены. С вероятностью 0,954 требуется установить доверительный интервал доли платежных документов треста без нарушения сроков:

Генеральная доля платежных документов , не выходящих за установленные сроки, с вероятностью 0,954 находится в интервале

0,892    0,988, или 89,2%    98,8%.

 

Задача №3

 

Для изучения интенсивности труда было организовано наблюдение за 10 отобранными рабочими. Доля работавших все время была равном 0,40, дисперсия; 0,4 • 0,6 = 0,24, По табл. П,2 приложения находим; F(t) = 0,95 и d.f. = n - 1 = 9, t =2,26. Рассчитаем среднюю ошибку выборки доли работавших все время:


Тогда предельная ошибка выборки =2,26 • 0,16 = ±0,36. Таким образом, с вероятностью 0,95 доля рабочих, работавших без простоев, в данном цехе предприятия находится в пределах 4%    72%.

Если бы мы использовали для расчета доверительных границ генерального параметра таблицу интеграла вероятностей, то t было бы равно 1,96 и = ±0,31, т.е. доверительный интервал был бы несколько уже, но тем не менее неопределенность оценки очень велика. Следовательно, в данном случае малая выборка такого объема нецелесообразна.


Список литературы

 

1. И.И.Елисеева, М.М.Юзбашев ОБЩАЯ ТЕОРИЯ СТАТИСТИКИ Под редакцией члена-корреспондента Российской Академии наук И.И.Елисеевой ПЯТОЕ ИЗДАНИЕ, ПЕРЕРАБОТАННОЕ И ДОПОЛНЕННОЕ Рекомендовано Министерством образования Российской Федерации в качестве учебника для студентов высших учебных заведений, обучающихся по направлению и специальности "Статистика" Москва "Финансы и статистика" 2004г.


Информация о работе «Выборочное наблюдение. Испытание статистических гипотез»
Раздел: Экономика
Количество знаков с пробелами: 47092
Количество таблиц: 0
Количество изображений: 0

Похожие работы

Скачать
85564
28
20

... 2272 9862 МИНИСТЕРСТВО ОБЩЕГО И ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ Санкт-Петербургский государственный университет аэрокосмического приборостроения СТАТИСТИКА Выборочные наблюдения Методические указания к практическим занятиям Санкт-Петербург 1999 Составитель Н.А. Богородская Рецензент кандидат экономических наук доцент Л.Г.Фетисова Методические ...

Скачать
11127
1
3

... mx , соответствующий доверительной вероятности b. Действительно, так как  то Пользуясь таблицей значений интеграла по значению b найдем величину а следовательно, и сам доверительный интервал le = 2.  Проверка статистических гипотез   Принятие решения о параметрах генеральной совокупности играет исключительно важную роль на практике. Рассмотрим вопрос о принятии решения на примере ...

Скачать
22002
7
0

... 0,997 С вероятностью 0,997 можно утверждать, что средний разряд рабочих механического цеха находится в пределах , . 4 Определение необходимой численности выборки В практике проведения выборочного наблюдения возникает потребность в определении численности выборки, которая необходима для обеспечения определенной точности расчета генеральных характеристик – средней и доли. Формально вопрос ...

Скачать
94210
3
0

... данных и по внедрению накопленного арсенала современных методов прикладной статистики. По нашему мнению, широкого внедрения заслуживают, в частности, методы многомерного статистического анализа, планирования эксперимента, статистики объектов нечисловой природы. Очевидно, рассматриваемые работы должны быть плановыми, организационно оформленными, проводиться мощными самостоятельными организациями и ...

0 комментариев


Наверх