2.1 Проверка гипотезы о законе распределения генеральной совокупности с использованием критерия Пирсона
Использование этого критерия основано на применении такой меры (статистики) расхождения между теоретическим F(x) и эмпирическим распределением Fn(x), которая приближенно подчиняется закону распределения. Гипотеза Н0 о согласованности распределений проверяется путем анализа распределения этой статистики. Применение критерия требует построения статистического ряда. (Приложение 1).
Пример 1. В 7 случаях из 10 фирма-конкурент компании «А» действовала на рынке так, как будто ей заранее были известны решения, принимаемые фирмой «А». На уровне значимости 0,05 определите, случайно ли это, или в фирме «А» работает осведомитель фирмы-конкурента?
Решение. Для того чтобы ответить на поставленный вопрос, необходимо проверить статистическую гипотезу о том, совпадает ли данное эмпирическое распределение числа действий фирмы-конкурента с равномерным теоретическим распределением?
Если ходы, предпринимаемые конкурентом, выбираются случайно, т. е. в фирме «А» – нет осведомителя (инсайдера), то число «правильных» и «неправильных» ее действий должно распределиться поровну, т. е. по 5 (10/2), а это и есть отличительная особенность равномерного распределения.
Этот вид статистических гипотез относится к гипотезам о виде закона распределения генеральной совокупности.
Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.
Н0: X ~ R(а; b) – случайная величина X подчиняется равномерному распределению с параметрами (а; b) (в контексте задачи – «В фирме «А» –нет осведомителя (инсайдера)»; «Распределение числа удачных ходов фирмы-конкурента – случайно»);
Н1: случайная величина X не подчиняется равномерному распределению (в контексте задачи – «В» фирме «А» – есть осведомитель (инсайдер)»; «Распределение числа удачных ходов фирмы-конкурента – неслучайно»).
В качестве критерия для проверки статистических гипотез о неизвестном законе распределения генеральной совокупности используется случайная величина %2. Этот критерий называют критерием Пирсона.
Его наблюдаемое значение (2набл) рассчитывается по формуле
где m(эмп) i – эмпирическая частота i-й группы выборки; m(теор) i – теоретическая частота i -й группы выборки.
Составим таблицу распределения эмпирических и теоретических частот (таблица 2).
Таблица 2
m(эмп) i | 7 | 3 |
m(теор) i | 5 | 5 |
Найдем наблюдаемое значение 2набл
Критическое значение (2кр) следует определять с помощью таблиц распределения 2 по уровню значимости и числу степеней свободы k.
По условию = 0,05, а число степеней свободы рассчитывается по формуле
k = n – l – 1
где k - число степеней свободы; n – число групп выборки; l – число неизвестных параметров предполагаемой модели, оцениваемых по данным выборки (если все параметры предполагаемого закона известны точно, то l = 0).
По условию задачи, число групп выборки (n) равно 2, так как могут быть только 2 варианта действий фирмы-конкурента: «удачные» и «неудачные», а число неизвестных параметров равномерного распределения (l) равно 0.
Отсюда k = 2- 0-1 = 1.
Найдем 2кр по уровню значимости а = 0,05 и числу степеней свободы k = 1:
2кр(a=0,05;k=1)=3,8
2набл < 2кр, следовательно, на данном уровне значимости нулевую гипотезу нельзя отклонить, расхождения эмпирических и теоретических частот - незначимые. Данные наблюдений согласуются с гипотезой о равномерном распределении генеральной совокупности.
Это означает, что для утверждения о том, что действия фирмы-конкурента на рынке неслучайны, нет оснований и на уровне значимости = 0,05 можно утверждать, что в фирме «А» нет платного осведомителя фирмы-конкурента.
Ответ. На уровне значимости = 0,05 можно утверждать, что в фирме «А» нет платного осведомителя фирмы-конкурента.
Пример 2. На уровне значимости = 0,025 проверить гипотезу о нормальном распределении генеральной совокупности, если известны эмпирические и теоретические частоты (табл. 3):
Таблица 3
m(эмп) i | 5 | 10 | 20 | 25 | 14 | 3 |
m(теор) i | 6 | 14 | 28 | 18 | 8 | 3 |
Решение. Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.
Н0: X ~ N(2) - случайная величина X подчиняется нормальному закону распределения с параметрами и 2.
Н1: случайная величина X не подчиняется нормальному закону распределения с параметрами и 2.
В качестве критерия для проверки нулевой гипотезы используем критерий Пирсона 2.
Найдем наблюдаемое значение (2набл ):
Найдем критическое значение критерия (2кр) по таблице распределения 2кр по уровню значимости и числу степеней свободы k.
По условию = 0,025; число степеней свободы найдем по формуле
k = n – l – 1
где k – число степеней свободы; n - число групп выборки; l –число неизвестных параметров предполагаемой модели, оцениваемых по данным выборки.
По условию задачи число групп выборки (n) равно 6, а число неизвестных параметров нормального распределения (l) равно 2.
Отсюда k = 6- 2-1 = 3.
Найдем 2кр по уровню значимости = 0,025 и числу степеней свободы k = 3:
2кр(=0,025; k=3) = 9,4
2набл > 2кр, следовательно, на данном уровне значимости нулевая гипотеза отклоняется в пользу конкурирующей, расхождения эмпирических и теоретических частот – значимые. Данные наблюдений не согласуются с гипотезой о нормальном распределении генеральной совокупности.
Ответ. На уровне значимости = 0,025 данные наблюдений не согласуются с гипотезой о нормальном распределении генеральной совокупности.
2.2 Проверка гипотезы с неизвестной дисперсией генеральной совокупности согласно критерию Стьюдента
Цель использования критерия Стьюдента - выявление достоверности различия между данными двух выборок одной и той же генеральной совокупности
Метод Стьюдента применяется для сравнения двух выборок, взятых из одной и той же генеральной совокупности, или двух различных состояний одной и той же выборочной совокупности.
При этом могут представиться следующие случаи:
1. По объему:
а) обе группы большие (n>30);
б) обе группы малые ;
в) одна - большая, вторая - малая.
2. По составу:
а) группы с попарно-зависимыми вариантами, когда i- варианта первой группы сравнивается с i- вариантой второй группы ;
б) группы с попарно-независимыми вариантами (можно менять варианты местами внутри группы).
Пример. Техническая норма предусматривает в среднем 40 с на выполнение определенной технологической операции на конвейере по производству часов. От работающих на этой операции поступили жалобы, что они в действительности затрачивают на нее больше времени. Для проверки данной жалобы произведены хронометрические измерения времени выполнения этой технологической операции у 16 работниц, занятых на ней, и получено среднее время выполнения операции X = 42 с. Можно ли по имеющимся хронометрическим данным на уровне значимости = 0,01 отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме, если:
а) исправленное выборочное среднее квадратическое отклонение s – 3,5 с;
б) выборочное среднее квадратическое отклонение 3,5 с?
Решение, а) Для решения данной задачи необходимо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна определенному числу, когда дисперсия генеральной совокупности неизвестна (выборка мала, так как n = 16 меньше 30).
Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.
Н0: а = а0 = 40 – неизвестное математическое ожидание а (нормально распределенной генеральной совокупности с неизвестной дисперсией) равно гипотетически предполагаемому числовому значению а0 (применительно к условию данной задачи - время выполнения технологической операции соответствует норме).
Н1: а > 40 – неизвестное математическое ожидание а (нормально распределенной генеральной совокупности с неизвестной дисперсией) больше числового значения а0 (применительно к условию данной задачи – время выполнения технологической операции больше установленной нормы).
Так как конкурирующая гипотеза – правосторонняя, то и критическая область – правосторонняя.
В качестве критерия для сравнения неизвестного математического ожидания а (нормально распределенной генеральной совокупности с неизвестной дисперсией) с гипотетическим числовым значением а0 используется случайная величина t-критерий Стьюдента. (Приложение 2).
Его наблюдаемое значение (t набл) рассчитывается по формуле
где X – выборочная средняя; а0 – числовое значение генеральной средней; s – исправленное среднее квадратическое отклонение; n – объем выборки.
Найдем наблюдаемое значение t набл
Критическое значение (tкр) следует находить с помощью таблиц распределения Стьюдента (приложение 2) по уровню значимости и числу степеней свободы k.
По условию = 0,01; число степеней свободы найдем по формуле
k = n - 1,
где k - число степеней свободы; n - объем выборки.
k = 16 - 1 = 15.
Найдем tкр по уровню значимости = 0,01 (для односторонней критической области) и числу степеней свободы k = 15:
tкр( k=15)= 2,6
Заметим, что при левосторонней конкурирующей гипотезе Н1:а < 40tкр следует находить по таблицам распределения Стьюдента (приложение 2) по уровню значимости (для односторонней критической области) и числу степеней свободы k = n – 1 и присваивать ему знак «минус».
При двусторонней конкурирующей гипотезе Н1: а≠40t следует находить по таблицам распределения Стьюдента (приложение 2) по уровню значимости а (для двусторонней критической области) и числу степеней свободы k = n – 1.
t набл < tкр следовательно, на данном уровне значимости нет оснований отклонить нулевую гипотезу.
Ответ. По имеющимся хронометрическим данным на уровне значимости а = 0,01 нельзя отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме. Следовательно, жалобы работниц - необоснованны.
Наблюдаемое значение критерия попадает в область допустимых значений (рисунок 4), следовательно, нет оснований отклонить нулевую гипотезу.
Рисунок 4
б) Для решения данной задачи необходимо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна определенному числу, когда дисперсия генеральной совокупности неизвестна.
Алгоритм решения задачи будет тот же, что и в первом случае. Однако наблюдаемое значение t набл рассчитывается по формуле
где X - выборочная средняя; а0 - числовое значение генеральной средней; выб - выборочное среднее квадратическое отклонение; n - объем выборки.
Найдем наблюдаемое значение (t набл)
Критическое значение (tкр) следует находить находить по таблице распределения Стьюдента (приложение 2) по уровню значимости а и числу степеней свободы k.
t набл < t кр, следовательно, на данном уровне значимости нет оснований отвергнуть нулевую гипотезу, жалобы работниц - необоснованны.
Ответ. По имеющимся хронометрическим данным на уровне значимости а = 0,01 нельзя отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме, жалобы работниц - необоснованны.
... как c2.набл.> c2.кр., то мнения экспертов согласованны. åаij 0 10 20 30 X X3 X1 X2 X5 X4 X6 Рис.2. Ранжировочная гистограмма. 8. Уравнение линейной регрессии. Коэффициент корреляции. Проверка гипотезы о значимости коэффициента корреляции После отсеивания незначимых факторов проверяется наличие корреляционных связей между факторами и между факторами ...
... данных и по внедрению накопленного арсенала современных методов прикладной статистики. По нашему мнению, широкого внедрения заслуживают, в частности, методы многомерного статистического анализа, планирования эксперимента, статистики объектов нечисловой природы. Очевидно, рассматриваемые работы должны быть плановыми, организационно оформленными, проводиться мощными самостоятельными организациями и ...
... гипотезу. Вроде бы это надо делать так: Теперь результаты наблюдений над выручкой G можно представить в виде четырех наблюдений над U: –11,+1,+3,+7. Теория математической статистики предлагает следующий, т.н. биномиальный критерий проверки гипотез в подобных ситуациях. Предполагается, что распределение вероятностей наблюдаемой величины U симметрично относительно значения математического ...
... исходить из вида обрабатываемых данных. В соответствии с современными воззрениями делим эконометрику и прикладную статистику на четыре области: - статистика случайных величин (одномерная статистика); - многомерный статистический анализ; - статистика временных рядов и случайных величин; - статистика объектов нечисловой природы. В первой области элемент выборки - число, во второй - вектор, в ...
0 комментариев