Содержание
Введение
Глава 1. Общие понятия проверки статистических гипотез
1.1 Сущность и виды проверки статистических гипотез
1.2 Выбор критериев для проверки статистических гипотез
1.3 Основные принципы расчета критериев для проверки статистических гипотез
Глава 2. Проверка различных типов статистических гипотез
2.1 Проверка гипотезы о законе распределения генеральной совокупности с использованием критерия Пирсона
2.2 Проверка гипотезы с неизвестной дисперсией генеральной совокупности согласно критерию Стьюдента
2.3. Проверка гипотезы о законе распределения генеральной совокупности с использованием функции Лапласа
2.4 Проверка гипотезы о законе распределения генеральной совокупности с использованием критерия Фишера-Снедекора
Заключение
Список литературы
Приложение 1
Приложение 2
Приложение 3
Приложение 4
Введение
Актуальность. Последние годы отмечены стремительным расширением области применения теоретико-вероятностных и статистических методов. Они применяются в различных науках: физике, техники, геологии, биологии, лингвистике, медицине, социологии, управлении и т. д. Один из основных разделов статистики - теория проверки статистических гипотез. Понятие практической статистики, процедура обоснованного сопоставления высказанной гипотезы относительно природы или величины неизвестных статистических параметров анализируемого явления с имеющимися в распоряжении исследователя выборочными данными (выборкой).
Статистическая проверка гипотез проводится с помощью некоторого статистического критерия по общей логической схеме, включающей нахождение конкретного вида функции от результатов наблюдения (критической статистики), на основании которой принимается окончательное решение. Например, могут рассматриваться гипотезы об общем законе распределения исследуемой случайной величины, об однородности двух или нескольких обрабатываемых выборок, о числовых значениях параметров исследуемой генеральной совокупности и др. Результат проверки может быть либо отрицательным (данные наблюдения противоречат высказанной гипотезе), либо неотрицательным. В первом случае гипотеза ошибочна, во втором – ее нельзя считать доказанной: просто она не противоречит имеющимся выборочным данным, однако таким же свойством могут наряду с ней обладать и другие гипотезы. Для статистической проверки гипотез используются разные критерии. В частности, когда проверяется согласие между выборочным и гипотетическим распределениями, используется критерий согласия, например, критерий Пирсона «хи-квадрат», критерий Колмогорова-Смирнова и др.
Статистические критерии приводятся вместе с указанием как тех областей, где их применение вполне оправдано, так и тех областей, где применение требует осторожности. Большое внимание уделено построению критериев, в том или ином смысле наилучших.
Цель работы: ознакомиться с процессом проверки статистических гипотез.
Поставленная цель определила задачи работы:
1. Определить сущность, понятие проверки статистических гипотез.
2. Рассмотреть этапы проверки статистических гипотез.
3. Рассмотреть критерии проверки статистических гипотез.
4. Ознакомиться с различными проверками статистических гипотез.
Структура работы: данная работа состоит из введения, двух глав, заключения, списка литературы и приложения. Во введении изложен ход предстоящей работы. 1 глава содержит теоретическое описание общих понятий проверки статистических гипотез. Во 2 главе приведены расчеты проверок различных типов статистических гипотез. В заключении подведены итоги работы, сделаны выводы. Список литературы включает литературные источники, используемые в ходе работы. В приложении представлен материал, необходимый для проверки статистических гипотез.
Глава 1. Общие понятия проверки статистических гипотез
1.1 Сущность и виды проверки статистических гипотез
В процессе статистического анализа иногда бывает необходимо сформулировать и проверить предположения (гипотезы) относительно величины независимых параметров или закона распределения изучаемой генеральной совокупности (совокупностей).
Например, исследователь выдвигает гипотезу о том, что «выборка извлечена из нормальной генеральной совокупности» или «генеральные средние двух анализируемых совокупностей равны». Такие предположения называются статистическими гипотезами.
Сопоставление высказанной гипотезы относительно генеральной совокупности с имеющимися выборочными данными, сопровождаемое количественной оценкой степени достоверности получаемого вывода и осуществляемое с помощью того или иного статистического критерия, называется проверкой статистических гипотез.
Под статистической гипотезой понимаются различного рода предположения относительно характера или параметров распределения случайной переменной, которые можно проверить, опираясь на результаты наблюдений в случайной выборке.
Иными словами, статистической гипотезой называется предположение о свойстве генеральной совокупности, которое можно проверить, опираясь на данные выборки. Обозначается гипотеза буквой Н. Так, может быть выдвинута гипотеза о том, что средняя в генеральной совокупности равна некоторой величине.
Смысл проверки статистической гипотезы состоит в том, чтобы по имеющимся статистическим данным принять или отклонить статистическую гипотезу с минимальным рисков ошибки. Эта проверка осуществляется по определенным правилам.
Следует иметь в виду, что статистическая проверка гипотез имеет вероятностный характер. С помощью статистической проверки гипотез можно определить вероятность принятия ложного решения по тем или иным результатам статистического изучения данного явления. Если вероятность ошибки невелика, то статистические показатели исчисленные при изучении явления, могут быть использованы для практических целей при малом риске ошибки.
Гипотезы в свою очередь классифицируются на:
- простые и сложные;
- параметрические и непараметрические;
- основные (высказанные) и альтернативные (конкурирующие).
Если выдвигаемая гипотеза сводится к утверждению о том, что значение некоторого неизвестного параметра генеральной совокупности в точности равно заданной величине, то эта гипотеза называется простой.
Например: «Среднедушевой совокупный доход населения России составляет 10000 рублей в месяц»; «Уровень безработицы (доля безработных в численности экономически активного населения) в России равен 9%».
Сложной называют гипотезу, которая состоит из конечного или бесконечного множества простых гипотез, при этом указывается некоторая область вероятных значений параметра.
Гипотезы о параметрах генеральной совокупности называются параметрическими, о распределениях - непараметрическими.
Выдвинутая гипотеза называется нулевой (основной). Ее принято обозначать Н0. При этом предполагается, что действительное различие сравниваемых величин равно нулю, а выявленное по данным отличие от нуля носит случайный характер. Нулевая гипотеза отвергается тогда, когда по выборке получается результат, который при истинности выдвинутой нулевой гипотезы маловероятен.
По отношению к высказанной (основной) гипотезе всегда можно сформулировать альтернативную (конкурирующую), противоречащую ей. Альтернативную (конкурирующую) гипотезу принято обозначать Н1.
В качестве нулевой гипотезы Н0 принято выдвигать простую гипотезу, так как обычно бывает удобнее проверять более строгое утверждение.
По своему содержанию статистические гипотезы можно подразделить на несколько основных типов:
- гипотезы о виде закона распределения исследуемой случайной величины;
- гипотезы о числовых значениях параметров исследуемой генеральной совокупности;
- гипотезы об однородности двух или нескольких выборок или некоторых характеристик анализируемых совокупностей;
- гипотезы об общем виде модели, описывающей статистическую зависимость между признаками; и др.
Так как проверка статистических гипотез осуществляется на основании выборочных данных, т.е. ограниченного ряда наблюдений, решения относительно нулевой гипотезы Н0 имеют вероятностный характер. Другими словами, такое решение неизбежно сопровождается некоторой, хотя возможно и очень малой, вероятностью ошибочного заключения как в ту, так и в другую сторону.
Так, в какой-то небольшой доле случаев а нулевая гипотеза Н0 может оказаться отвергнутой, в то время как в действительности в генеральной совокупности она является справедливой. Такую ошибку называют ошибкой 1-го рода, а ее вероятность – уровнем значимости и обозначают.
Наоборот, в какой-то небольшой доле случаев (нулевая гипотеза Н0 принимается, в то время как на самом деле в генеральной совокупности она ошибочна, а справедлива альтернативная гипотеза Нх. Такую ошибку называют ошибкой 2-го рода. Вероятность ошибки 2-го рода обозначается как Вероятность 1 - называют мощностью критерия.
При фиксированном объеме выборки можно выбрать по своему усмотрению величину вероятности только одной из ошибок. Увеличение вероятности одной из них приводит к снижению другой.
Принято задавать вероятность ошибки 1-го рода уровень значимости. Как правило, пользуются некоторыми стандартными значениями уровня значимости: 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Тогда, очевидно, из двух критериев, характеризующихся одной и той же вероятностью а (отклонить правильную в действительности гипотезу Н0), следует принять тот, которому соответствует меньшая ошибка 2-го рода, т.е. большая мощность. Снижения вероятностей обеих ошибок и можно добиться путем увеличения объема выборки.
Правильное решение относительно нулевой гипотезы Н0 также может быть двух видов:
- будет принята нулевая гипотеза Н0, когда в генеральной совокупности верна нулевая гипотеза Н0; вероятность такого решения 1;
- нулевая гипотеза Н0 будет отклонена в пользу альтернативной Н1, когда в генеральной совокупности нулевая гипотеза Н0 отклоняется в пользу альтернативной Н1; вероятность такого решения 1 мощность критерия.
Результаты решения относительно нулевой гипотезы можно проиллюстрировать с помощью таблицы 1.
статистический гипотеза проверка лаплас
Таблица 1
Нулевая гипотеза Н0 | Результаты решения относительнонулевой гипотезы Н0 | |
Отклонена | Принята | |
Верна | Ошибка 1-го рода, ее вероятность Р(Н1/ Н0) = | Правильное решение, его вероятность Р(Н0/ Н0) = 1 - |
Неверна | Правильное решение, его вероятность Р(Н1/ Н1) = 1- | Ошибка 2-го рода, ее вероятность Р((Н0/ Н0)= |
В отношении свойств генеральной совокупности могут выдвигаться некоторые гипотезы о величине средней, дисперсии, характере распределения, форме и тесноте связи между переменными.
Проверка гипотезы осуществляется на основе выявления согласованности эмпирических данных с гипотетическими (теоретическими). Если расхождение между сравниваемыми величинами не выходит за пределы случайных ошибок, гипотезу принимают. При этом не делается никаких заключений о правильности самой гипотезы, речь идет лишь о согласованности сравниваемых данных.
Основой проверки статистических гипотез являются данные случайных выборок, При этом безразлично, оцениваются ли гипотезы в отношении реальной или гипотетической генеральной совокупности. Последнее открывает путь применения этого метода за пределами собственно выборки: при анализе результатов эксперимента, данных сплошного наблюдения, но малой численности. В этом случае рекомендуется проверить, не вызвана ли установленная закономерность стечением случайных обстоятельств, насколько она характерна для того комплекса условий, в которых находится изучаемая совокупность.
Особенно часто процедура проверки статистических гипотез проводится для оценки существенности расхождений сводных характеристик отдельных совокупностей (групп): средних, относительных величин. Такого рода задачи, как правило, возникают в социальной статистике. Трудоемкость статистико-социологических исследований приводит к тому, что почти все они строятся на несплошном учете. Поэтому проблема доказательности выводов в социальной статистике стоит особенно остро. Применяя процедуру проверки статистических гипотез, следует помнить, что она может гарантировать результаты с определенной вероятностью лишь по «беспристрастным» выборкам, на основе объективных данных.
... как c2.набл.> c2.кр., то мнения экспертов согласованны. åаij 0 10 20 30 X X3 X1 X2 X5 X4 X6 Рис.2. Ранжировочная гистограмма. 8. Уравнение линейной регрессии. Коэффициент корреляции. Проверка гипотезы о значимости коэффициента корреляции После отсеивания незначимых факторов проверяется наличие корреляционных связей между факторами и между факторами ...
... данных и по внедрению накопленного арсенала современных методов прикладной статистики. По нашему мнению, широкого внедрения заслуживают, в частности, методы многомерного статистического анализа, планирования эксперимента, статистики объектов нечисловой природы. Очевидно, рассматриваемые работы должны быть плановыми, организационно оформленными, проводиться мощными самостоятельными организациями и ...
... гипотезу. Вроде бы это надо делать так: Теперь результаты наблюдений над выручкой G можно представить в виде четырех наблюдений над U: –11,+1,+3,+7. Теория математической статистики предлагает следующий, т.н. биномиальный критерий проверки гипотез в подобных ситуациях. Предполагается, что распределение вероятностей наблюдаемой величины U симметрично относительно значения математического ...
... исходить из вида обрабатываемых данных. В соответствии с современными воззрениями делим эконометрику и прикладную статистику на четыре области: - статистика случайных величин (одномерная статистика); - многомерный статистический анализ; - статистика временных рядов и случайных величин; - статистика объектов нечисловой природы. В первой области элемент выборки - число, во второй - вектор, в ...
0 комментариев