1.2. Выбор критериев для проверки статистических гипотез

Проверка статистических гипотез осуществляется с помощью статистического критерия (назовем его в общем виде К), являющегося функцией от результатов наблюдения.

Статистический критерий – это правило (формула), по которому определяется мера расхождения результатов выборочного наблюдения с высказанной гипотезой Н0.

Как уже отмечалось выше, следует иметь в виду, что статистическая проверка гипотез имеет вероятностный характер, так как принимаемые вывод основываются на изучении свойств распределения случайной переменной по данным выборки, а потому всегда существует риск допустить ошибку. Однако с помощью статистической проверки гипотез можно определить вероятность принятия ложного решения. Если вероятность последнего невелика, то можно считать, что применяемый критерий обеспечивает малый риск ошибки.

При проведении проверки статистических гипотез в первую очередь приходится решать задачи статистической проверки гипотез о:

1) принадлежности «выделяющихся» единиц исследуемой выборочной совокупности генеральной совокупности;

2) виде распределения изучаемых признаков;

3) величине средней арифметической и доли;

4) наличии и тесноте связи между изучаемыми признаками;

5) о форме корреляционной связи.

При проверке гипотез имеется возможность совершить ошибку двоякого рода:

а) ошибка первого рода - проверяемая гипотеза (нулевая гипотеза Н0) является в действительности верной, но результаты проверки приводят к отказу от нее;

б) ошибка второго рода - проверяемая гипотеза в действительности является ошибочной, но результаты проверки приводят к принятию.

В статистике в настоящее время имеется большое число критериев для проверки практически любых гипотез. Притом основные принципы их построения и применения являются общими. Для построения статистического критерия, позволяющего проверить некоторую гипотезу, необходимо следующее:

1) сформулировать проверяемую гипотезу Н0. Наряду с проверяемой гипотезой формулируется также конкурирующая (альтернативная) гипотеза;

2) выбрать уровень значимости, контролирующий допустимую вероятность ошибки первого рода;

3) определить область допустимых значений и так называемую критическую область;

4) принять то или иное решение на основе сравнения фактического и критического значений критерия.

Проверка статистических гипотез складывается из следующих этапов:

- формулируется в виде статистической гипотезы задача исследования;

- выбирается статистическая характеристика гипотезы;

- выбираются испытуемая и альтернативная гипотезы на основе анализа возможных ошибочных решений и их последствий;

- определяются область допустимых значений, критическая область, а также критическое значение статистического критерия (t, F) по соответствующей таблице;

- вычисляется фактическое значение статистического критерия;

- проверяется испытуемая гипотеза на основе сравнения фактического и критического значений критерия, и в зависимости от результатов проверки гипотеза либо отклоняется, либо не отклоняется.

Уровнем значимости будет называться такое малое значение вероятности попадания критерия в критическую область при условии справедливости гипотезы, что появление этого события может расцениваться как следствие существенного расхождения выдвинутой гипотезы и результатов выборки. Обычно уровень значимости принимают равным 0,05 или 0,01. Исходя из величины уровня значимости, можно определить критическую область, под которой понимается такая область значений выборочной характеристики, попадая в которую они будут свидетельствовать о том, что проверяемая гипотеза должна быть отвергнута. К критической области относятся те значения, появление которых при условии верности гипотезы было бы маловероятным.

Допустим, что рассчитанное по эмпирическим данным значение критерия попало в критическую область, тогда при условии верности проверяемой гипотезы Н0 вероятность этого события будет не больше уровня значимости. Поскольку выбирается достаточно малым, то такое событие является маловероятным и, следовательно, проверяемая гипотеза Н0 может быть отвергнута.

Если же наблюдаемое значение характеристики не принадлежит к критической области и, следовательно, находится в области допустимых значений, то проверяемая гипотеза Н0 не отвергается. Вероятность попадания критерия в область допустимых значений при справедливости проверяемой гипотезы Н0 равна 1.

Чем меньше уровень значимости, тем меньше вероятность браковать проверяемую гипотезу, когда она верна, т.е. меньше вероятность совершить ошибку первого рода. Но при этом расширяется область допустимых значений и, значит, увеличивается вероятность совершения ошибки второго рода.

Все значения рассматриваемой характеристики, не принадлежащие к критической области образуют так называемую область допустимых значений. Если наблюдаемое значение характеристики находится в области допустимых значений, то проверяемая гипотеза принимается с вероятностью.

Выбор критерия для проверки статистических гипотез может осуществляться на основании различных принципов. Чаще всего для этого пользуются принципом отношения правдоподобия, который позволяет построить критерий, наиболее мощный среди всех возможных критериев. Суть его сводится к выбору такого критерия К с известной функцией плотности f(k) при условии справедливости гипотезы Н0, чтобы при заданном условии значимости можно было бы найти критическую точку Ккр распределения f(k), которая распределила бы область допустимых значений, в которой результаты выборочного наблюдения выглядят наиболее правдоподобными, и критическую область, в которой результаты выборочного наблюдения выглядят менее правдоподобными в отношении нулевой гипотезы Н0.

Если такой критерий К выбран, и известна плотность его распределения, то задача проверки статистической гипотезы сводится к тому, чтобы при заданном уровне значимости рассчитать по выборочным данным наблюдаемое значение критерия Кнабл и определить, является ли оно наиболее или наименее правдоподобным в отношении нулевой гипотезы Н0.

Проверка каждого типа статистических гипотез осуществляется с помощью соответствующего критерия, являющегося наиболее мощным в каждом конкретном случае.

Как уже отмечалось ранее, проверка статистических гипотез применяется в разных областях для изучения массовых явлений. Изучение массовых явлений, как правило, осуществляется по неполной информации. В составе собранных данных могут встречаться единичные наблюдения, у которых отдельные значения изучаемых признаков заметно отличаются от общей тенденции изменения большинства значений. Причины таких отличий могут быть разными:

1) из-за ошибок наблюдения;

2) вследствие случайного стечения различных обстоятельств, каждый из которых в отдельности несущественный, но совокупное их влияние привело к таким резко выделяющимся от общей картины значениям признаков;

3) как следствие нарушения однородности изучаемой совокупности.

В общем случае все значения изучаемых признаков фиксируются по известным единицам совокупности по их части, отобранной с учетом всех требований. Следовательно, первичные статистические данные, включая и резко «выделяющемся», соответствуют конкретным случаям проявления изучаемого явления. Следовательно, субъективное отбрасывание «выделяющихся» единиц недопустимо.

Рассмотрим использование критериев для проверки статистических гипотез на примере закона нормального распределения. Закон нормального распределения лежит в основе многих теорем и методов статистики

- при оценке репрезентативности выборки (расчете ошибки выборки и распространении характеристик выборки на генеральную совокупность);

- измерении степени тесноты связи и составлении модели регрессии;

- построении и использование статистических критериев и др.

Как показывают многочисленные статистические исследования, частоты (частости) эмпирических распределений за редким исключением будут отличаться от значений теоретического распределения. Расхождения между частотами (частостями) эмпирического и теоретического распределения могут быть несущественными и объяснены случайностями выборки и существенными при несоответствии выбранного и эмпирического законов распределения.

Для проверки гипотезы о соответствии эмпирического распределения теоретическому закону нормального распределения используются особые статистические показатели-критерии согласия (или критерии соответствия). К ним относятся критерии К.Пирсона, А.Н. Колмогорова, Романовского, Ястремского и др.

Большинство критериев согласия базируется на использовании отклонений эмпирических частот от теоретических. Очевидно, что чем больше эти отклонения, тем хуже теоретическое распределение соответствует эмпирическому. Статистические характеристики таких критериев согласия являются некоторыми функциями этих отклонений.


Информация о работе «Процесс и критерии проверки статистических гипотез»
Раздел: Экономика
Количество знаков с пробелами: 57287
Количество таблиц: 7
Количество изображений: 9

Похожие работы

Скачать
37952
23
9

... как c2.набл.> c2.кр., то мнения экспертов согласованны.  åаij  0  10    20      30 X  X3 X1 X2 X5 X4 X6 Рис.2. Ранжировочная гистограмма.   8. Уравнение линейной регрессии. Коэффициент корреляции. Проверка гипотезы о значимости коэффициента корреляции После отсеивания незначимых факторов проверяется наличие корреляционных связей между факторами и между факторами ...

Скачать
94210
3
0

... данных и по внедрению накопленного арсенала современных методов прикладной статистики. По нашему мнению, широкого внедрения заслуживают, в частности, методы многомерного статистического анализа, планирования эксперимента, статистики объектов нечисловой природы. Очевидно, рассматриваемые работы должны быть плановыми, организационно оформленными, проводиться мощными самостоятельными организациями и ...

Скачать
71569
0
3

... гипотезу. Вроде бы это надо делать так:     Теперь результаты наблюдений над выручкой G можно представить в виде четырех наблюдений над U: –11,+1,+3,+7. Теория математической статистики предлагает следующий, т.н. биномиальный критерий проверки гипотез в подобных ситуациях. Предполагается, что распределение вероятностей наблюдаемой величины U симметрично относительно значения математического ...

Скачать
69385
2
3

... исходить из вида обрабатываемых данных. В соответствии с современными воззрениями делим эконометрику и прикладную статистику на четыре области: - статистика случайных величин (одномерная статистика); - многомерный статистический анализ; - статистика временных рядов и случайных величин; - статистика объектов нечисловой природы. В первой области элемент выборки - число, во второй - вектор, в ...

0 комментариев


Наверх