2.1 Проверка гипотезы о законе распределения генеральной совокупности с использованием критерия Пирсона

Использование этого критерия основано на применении такой меры (статистики) расхождения между теоретическим F(x) и эмпирическим распределением Fn(x), которая приближенно подчиняется закону распределения. Гипотеза Н0 о согласованности распределений проверяется путем анализа распределения этой статистики. Применение критерия требует построения статистического ряда. (Приложение 1).

Пример 1. В 7 случаях из 10 фирма-конкурент компании «А» действовала на рынке так, как будто ей заранее были известны решения, принимаемые фирмой «А». На уровне значимости 0,05 определите, случайно ли это, или в фирме «А» работает осведомитель фирмы-конкурента?

Решение. Для того чтобы ответить на поставленный вопрос, необходимо проверить статистическую гипотезу о том, совпадает ли данное эмпирическое распределение числа действий фирмы-конкурента с равномерным теоретическим распределением?

Если ходы, предпринимаемые конкурентом, выбираются случайно, т. е. в фирме «А» – нет осведомителя (инсайдера), то число «правильных» и «неправильных» ее действий должно распределиться поровну, т. е. по 5 (10/2), а это и есть отличительная особенность равномерного распределения.

Этот вид статистических гипотез относится к гипотезам о виде закона распределения генеральной совокупности.

Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.

Н0: X ~ R(а; b) – случайная величина X подчиняется равномерному распределению с параметрами (а; b) (в контексте задачи – «В фирме «А» –нет осведомителя (инсайдера)»; «Распределение числа удачных ходов фирмы-конкурента – случайно»);

Н1: случайная величина X не подчиняется равномерному распределению (в контексте задачи – «В» фирме «А» – есть осведомитель (инсайдер)»; «Распределение числа удачных ходов фирмы-конкурента – неслучайно»).

В качестве критерия для проверки статистических гипотез о неизвестном законе распределения генеральной совокупности используется случайная величина %2. Этот критерий называют критерием Пирсона.

Его наблюдаемое значение (2набл) рассчитывается по формуле

 

где m(эмп) i – эмпирическая частота i-й группы выборки; m(теор) i – теоретическая частота i -й группы выборки.

Составим таблицу распределения эмпирических и теоретических частот (таблица 2).

Таблица 2

m(эмп) i

7 3

m(теор) i

5 5

Найдем наблюдаемое значение 2набл

 

Критическое значение (2кр) следует определять с помощью таблиц распределения 2 по уровню значимости и числу степеней свободы k.

По условию = 0,05, а число степеней свободы рассчитывается по формуле

 

k = n – l – 1

где k - число степеней свободы; n – число групп выборки; l – число неизвестных параметров предполагаемой модели, оцениваемых по данным выборки (если все параметры предполагаемого закона известны точно, то l = 0).

По условию задачи, число групп выборки (n) равно 2, так как могут быть только 2 варианта действий фирмы-конкурента: «удачные» и «неудачные», а число неизвестных параметров равномерного распределения (l) равно 0.

Отсюда k = 2- 0-1 = 1.

Найдем 2кр по уровню значимости а = 0,05 и числу степеней свободы k = 1:

2кр(a=0,05;k=1)=3,8

2набл < 2кр, следовательно, на данном уровне значимости нулевую гипотезу нельзя отклонить, расхождения эмпирических и теоретических частот - незначимые. Данные наблюдений согласуются с гипотезой о равномерном распределении генеральной совокупности.

Это означает, что для утверждения о том, что действия фирмы-конкурента на рынке неслучайны, нет оснований и на уровне значимости = 0,05 можно утверждать, что в фирме «А» нет платного осведомителя фирмы-конкурента.

Ответ. На уровне значимости = 0,05 можно утверждать, что в фирме «А» нет платного осведомителя фирмы-конкурента.

Пример 2. На уровне значимости = 0,025 проверить гипотезу о нормальном распределении генеральной совокупности, если известны эмпирические и теоретические частоты (табл. 3):


Таблица 3

m(эмп) i

5 10 20 25 14 3

m(теор) i

6 14 28 18 8 3

Решение. Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.

Н0: X ~ N(2) - случайная величина X подчиняется нормальному закону распределения с параметрами и 2.

Н1: случайная величина X не подчиняется нормальному закону распределения с параметрами и 2.

В качестве критерия для проверки нулевой гипотезы используем критерий Пирсона 2.

Найдем наблюдаемое значение (2набл ):

Найдем критическое значение критерия (2кр) по таблице распределения 2кр по уровню значимости и числу степеней свободы k.

По условию = 0,025; число степеней свободы найдем по формуле

k = n – l – 1

где k – число степеней свободы; n - число групп выборки; l –число неизвестных параметров предполагаемой модели, оцениваемых по данным выборки.

По условию задачи число групп выборки (n) равно 6, а число неизвестных параметров нормального распределения (l) равно 2.

Отсюда k = 6- 2-1 = 3.

Найдем 2кр по уровню значимости = 0,025 и числу степеней свободы k = 3:

 

2кр(=0,025; k=3) = 9,4

2набл > 2кр, следовательно, на данном уровне значимости нулевая гипотеза отклоняется в пользу конкурирующей, расхождения эмпирических и теоретических частот – значимые. Данные наблюдений не согласуются с гипотезой о нормальном распределении генеральной совокупности.

Ответ. На уровне значимости = 0,025 данные наблюдений не согласуются с гипотезой о нормальном распределении генеральной совокупности.

 

2.2 Проверка гипотезы с неизвестной дисперсией генеральной совокупности согласно критерию Стьюдента

Цель использования критерия Стьюдента - выявление достоверности различия между данными двух выборок одной и той же генеральной совокупности

Метод Стьюдента применяется для сравнения двух выборок, взятых из одной и той же генеральной совокупности, или двух различных состояний одной и той же выборочной совокупности.

При этом могут представиться следующие случаи:

1. По объему:

а) обе группы большие (n>30);

б) обе группы малые http://www.kgafk.ru/www/kgufk.nsf/0ac94bfb045560d4c3256d440047e09a/8099502933396a28c3256e9a004841dd/body/0.5AA!OpenElement&amp;FieldElemFormat=gif;

в) одна - большая, вторая - малая.

2. По составу:

а) группы с попарно-зависимыми вариантами, когда i- варианта первой группы сравнивается с i- вариантой второй группы http://www.kgafk.ru/www/kgufk.nsf/0ac94bfb045560d4c3256d440047e09a/8099502933396a28c3256e9a004841dd/body/0.7E6!OpenElement&amp;FieldElemFormat=gif;

б) группы с попарно-независимыми вариантами (можно менять варианты местами внутри группы).

Пример. Техническая норма предусматривает в среднем 40 с на выполнение определенной технологической операции на конвейере по производству часов. От работающих на этой операции поступили жалобы, что они в действительности затрачивают на нее больше времени. Для проверки данной жалобы произведены хронометрические измерения времени выполнения этой технологической операции у 16 работниц, занятых на ней, и получено среднее время выполнения операции X = 42 с. Можно ли по имеющимся хронометрическим данным на уровне значимости = 0,01 отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме, если:

а) исправленное выборочное среднее квадратическое отклонение s – 3,5 с;

б) выборочное среднее квадратическое отклонение 3,5 с?

Решение, а) Для решения данной задачи необходимо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна определенному числу, когда дисперсия генеральной совокупности неизвестна (выборка мала, так как n = 16 меньше 30).

Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.

Н0: а = а0 = 40 – неизвестное математическое ожидание а (нормально распределенной генеральной совокупности с неизвестной дисперсией) равно гипотетически предполагаемому числовому значению а0 (применительно к условию данной задачи - время выполнения технологической операции соответствует норме).

Н1: а > 40 – неизвестное математическое ожидание а (нормально распределенной генеральной совокупности с неизвестной дисперсией) больше числового значения а0 (применительно к условию данной задачи – время выполнения технологической операции больше установленной нормы).

Так как конкурирующая гипотеза – правосторонняя, то и критическая область – правосторонняя.

В качестве критерия для сравнения неизвестного математического ожидания а (нормально распределенной генеральной совокупности с неизвестной дисперсией) с гипотетическим числовым значением а0 используется случайная величина t-критерий Стьюдента. (Приложение 2).

Его наблюдаемое значение (t набл) рассчитывается по формуле

где X – выборочная средняя; а0 – числовое значение генеральной средней; s – исправленное среднее квадратическое отклонение; n – объем выборки.

Найдем наблюдаемое значение t набл

Критическое значение (tкр) следует находить с помощью таблиц распределения Стьюдента (приложение 2) по уровню значимости и числу степеней свободы k.

По условию = 0,01; число степеней свободы найдем по формуле

k = n - 1,

где k - число степеней свободы; n - объем выборки.

k = 16 - 1 = 15.

Найдем tкр по уровню значимости = 0,01 (для односторонней критической области) и числу степеней свободы k = 15:

tкр( k=15)= 2,6


Заметим, что при левосторонней конкурирующей гипотезе Н1:а < 40tкр следует находить по таблицам распределения Стьюдента (приложение 2) по уровню значимости (для односторонней критической области) и числу степеней свободы k = n – 1 и присваивать ему знак «минус».

При двусторонней конкурирующей гипотезе Н1: а≠40t следует находить по таблицам распределения Стьюдента (приложение 2) по уровню значимости а (для двусторонней критической области) и числу степеней свободы k = n – 1.

t набл < tкр следовательно, на данном уровне значимости нет оснований отклонить нулевую гипотезу.

Ответ. По имеющимся хронометрическим данным на уровне значимости а = 0,01 нельзя отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме. Следовательно, жалобы работниц - необоснованны.

Наблюдаемое значение критерия попадает в область допустимых значений (рисунок 4), следовательно, нет оснований отклонить нулевую гипотезу.

Рисунок 4

б) Для решения данной задачи необходимо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна определенному числу, когда дисперсия генеральной совокупности неизвестна.

Алгоритм решения задачи будет тот же, что и в первом случае. Однако наблюдаемое значение t набл рассчитывается по формуле

где X - выборочная средняя; а0 - числовое значение генеральной средней; выб - выборочное среднее квадратическое отклонение; n - объем выборки.

Найдем наблюдаемое значение (t набл)

Критическое значение (tкр) следует находить находить по таблице распределения Стьюдента (приложение 2) по уровню значимости а и числу степеней свободы k.

t набл < t кр, следовательно, на данном уровне значимости нет оснований отвергнуть нулевую гипотезу, жалобы работниц - необоснованны.

Ответ. По имеющимся хронометрическим данным на уровне значимости а = 0,01 нельзя отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме, жалобы работниц - необоснованны.


Информация о работе «Процесс и критерии проверки статистических гипотез»
Раздел: Экономика
Количество знаков с пробелами: 57287
Количество таблиц: 7
Количество изображений: 9

Похожие работы

Скачать
37952
23
9

... как c2.набл.> c2.кр., то мнения экспертов согласованны.  åаij  0  10    20      30 X  X3 X1 X2 X5 X4 X6 Рис.2. Ранжировочная гистограмма.   8. Уравнение линейной регрессии. Коэффициент корреляции. Проверка гипотезы о значимости коэффициента корреляции После отсеивания незначимых факторов проверяется наличие корреляционных связей между факторами и между факторами ...

Скачать
94210
3
0

... данных и по внедрению накопленного арсенала современных методов прикладной статистики. По нашему мнению, широкого внедрения заслуживают, в частности, методы многомерного статистического анализа, планирования эксперимента, статистики объектов нечисловой природы. Очевидно, рассматриваемые работы должны быть плановыми, организационно оформленными, проводиться мощными самостоятельными организациями и ...

Скачать
71569
0
3

... гипотезу. Вроде бы это надо делать так:     Теперь результаты наблюдений над выручкой G можно представить в виде четырех наблюдений над U: –11,+1,+3,+7. Теория математической статистики предлагает следующий, т.н. биномиальный критерий проверки гипотез в подобных ситуациях. Предполагается, что распределение вероятностей наблюдаемой величины U симметрично относительно значения математического ...

Скачать
69385
2
3

... исходить из вида обрабатываемых данных. В соответствии с современными воззрениями делим эконометрику и прикладную статистику на четыре области: - статистика случайных величин (одномерная статистика); - многомерный статистический анализ; - статистика временных рядов и случайных величин; - статистика объектов нечисловой природы. В первой области элемент выборки - число, во второй - вектор, в ...

0 комментариев


Наверх