Міністерство освіти і науки України
Національний Університет "Львівська Політехніка"
Інститут прикладної математики та фундаментальних наук
Кафедра прикладної математики
Курсова робота
з курсу математичної статистики
на тему:
"Критерій відношення правдоподібності для великих вибірок"
Керівник роботи
доц. каф. ПМ Ружевич Н. А.
Виконав студент гр. ПМ-41
Новосад Н.
Львів – 2009
Розглянуто один із методів перевірки параметричних статистичних гіпотез – метод відношення правдоподібності для великих вибірок. Наведено теоретичне обґрунтування даного методу, проілюстровано його застосування до розв’язку практичних задач. Виконано програмну реалізацію методу.
Зміст
Вступ
1. Основні поняття
2. Критерій відношення правдоподібності для великих вибірок
3. Приклади застосування критерію відношення правдоподібності для великих вибірок
4. Опис програми
Висновки
Список використаної літератури
Додаток А. Використані статистичні таблиці
Додаток B. Текст програми, що реалізує застосування критерію відношення правдоподібності для великих вибірок
Додаток C. Результати виконання програми
Математична статистика – це один з розділів математики, що має широке прикладне значення в науці і техніці. Зокрема, методи математичної статистики широко використовуються в теорії масового обслуговування, теорії надійності, теорії інформації, стохастичній апроксимації та інших дисциплінах.
Одним із основних інструментів математичної статистики є теорія перевірки статистичних гіпотез. Причиною виникнення цієї теорії стала проблема визначення закономірностей розподілу випадкових величин( їхніх функцій та щільностей розподілу), основних характеристик( математичного сподівання, дисперсії та ін.), залежностей між випадковими величинами.
Як зрозуміло із самої назви, теорія перевірки статистичних гіпотез займається розробкою та обґрунтуванням методів перевірки статистичних гіпотез. Під статистичною гіпотезою розуміють припущення щодо виду розподілу випадкової величини, незалежності випадкових величин, значень невідомих параметрів розподілу та ін. на основі експериментальних статистичних даних.
На сьогоднішній день розроблено багато методів перевірки гіпотез( критеріїв згоди), що застосовуються на практиці. Одним із таких критеріїв є критерій відношення правдоподібності для великих вибірок. Саме цей метод розглянуто у даній курсовій роботі.
Структуру курсової роботи складають п’ять розділів і чотири додатки. У розділі "Основні поняття" введено необхідні поняття та позначення, які будуть використовуватись у подальшому. У розділі "Критерій відношення правдоподібності для великих вибірок" описано суть критерію. У розділі "Приклади застосування критерію відношення правдоподібності для великих вибірок" на декількох прикладах проілюстровано застосування цього критерію до практичних задач. У пункті "Висновки" обговорюється практична цінність критерію, а також його недоліки. Далі наводиться список використаної літератури і статистичних таблиць, дані з яких використовувались. У додатках В , С та D наводиться опис, код та результати роботи програми, яка реалізує перевірку гіпотези на основі розглянутого критерію.
1. Основні поняття
Введемо ряд понять та означень, які будемо використовувати в подальшому.
Через  будемо позначати функцію, що визначена на деякому ймовірнісному просторі
 будемо позначати функцію, що визначена на деякому ймовірнісному просторі  і називається випадковою величиною, де
 і називається випадковою величиною, де  це непорожня множина, що називається простором елементарних подій, а елементи
це непорожня множина, що називається простором елементарних подій, а елементи  називаються елементарними подіями(вважається, що
 називаються елементарними подіями(вважається, що  складається з усіх можливих результатів експерименту і результатом будь-якого експерименту може бути лише один елемент
 складається з усіх можливих результатів експерименту і результатом будь-якого експерименту може бути лише один елемент  );
);  це деяка система підмножин
це деяка система підмножин  , яка утворює
, яка утворює  алгебру, тобто для неї виконується така система умов:
 алгебру, тобто для неї виконується така система умов:
1)  
2)  
3)  
4)
5)  Тоді множини  називаються подіями.
 називаються подіями.  це відображення подій
це відображення подій  на інтервал
 на інтервал  , яке задовольняє наступним аксіомам:
, яке задовольняє наступним аксіомам:
1)   поставлено у відповідність число
 поставлено у відповідність число  і називається ймовірністю події
 і називається ймовірністю події 
2)  
3)  
Відображення  називається ймовірністю простору
 називається ймовірністю простору  .
.
Нехай в результаті проведення експерименту спостерігаються значення  випадкових величин
 випадкових величин  Тоді вектор, компонентами якого є ці випадкові величини
 Тоді вектор, компонентами якого є ці випадкові величини  , називається вибіркою, а
, називається вибіркою, а  об’ємом вибірки. Вектор
об’ємом вибірки. Вектор  де
 де  це значення, яке набула випадкова величина
це значення, яке набула випадкова величина  внаслідок проведення експерименту, називається реалізацією вибірки. Множина всіх можливих реалізацій вибірки
 внаслідок проведення експерименту, називається реалізацією вибірки. Множина всіх можливих реалізацій вибірки  називається вибірковим простором.
 називається вибірковим простором.
Нехай  випадкова величина і
випадкова величина і  деяке дійсне значення. Тоді ймовірність того, що випадкова величина
деяке дійсне значення. Тоді ймовірність того, що випадкова величина  приймає значення менше за
 приймає значення менше за  називається функцією розподілу ймовірностей випадкової величини
називається функцією розподілу ймовірностей випадкової величини  і позначається
 і позначається  Якщо функція розподілу залежить від деякого параметра
 Якщо функція розподілу залежить від деякого параметра  , то писатимемо
, то писатимемо  Клас функцій розподілу
 Клас функцій розподілу  називатимемо класом допустимих розподілів спостережуваної випадкової величини
 називатимемо класом допустимих розподілів спостережуваної випадкової величини  і позначатимемо
 і позначатимемо  . Множина
. Множина  така, що
 така, що  і називається параметричною множиною. Той факт, що випадкова величина
 і називається параметричною множиною. Той факт, що випадкова величина  має функцію розподілу з класу
 має функцію розподілу з класу  будемо позначати
 будемо позначати  і називати розподілом випадкової величини. Статистичною моделлю експерименту називається впорядкована пара
 і називати розподілом випадкової величини. Статистичною моделлю експерименту називається впорядкована пара  де
 де  вибірковий простір випадкової величини
вибірковий простір випадкової величини  клас розподілів цієї випадкової величини. Статистикою називають будь-яку випадкову величину, що залежить лише від вибірки
клас розподілів цієї випадкової величини. Статистикою називають будь-яку випадкову величину, що залежить лише від вибірки  . Статистика
. Статистика  називається оцінкою невідомого параметра
 називається оцінкою невідомого параметра  розподілу
 розподілу  , якщо для кожної реалізації вибірки
 , якщо для кожної реалізації вибірки значення
 значення  приймається за наближене значення параметра
 приймається за наближене значення параметра  . Статистика
. Статистика  називається незміщеною оцінкою параметра
 називається незміщеною оцінкою параметра  , якщо
, якщо  (тут
(тут  - це математичне сподівання, тобто
 - це математичне сподівання, тобто  , якщо випадкова величина
, якщо випадкова величина  має неперервну функцію розподілу( у цьому випадку
 має неперервну функцію розподілу( у цьому випадку  у точках існування похідної, і називається функцією щільності
 у точках існування похідної, і називається функцією щільності  ), і
), і  у дискретному випадку( тобто
 у дискретному випадку( тобто  набуває не більш, ніж зліченної кількості значень
 набуває не більш, ніж зліченної кількості значень  відповідно з ймовірностями
 відповідно з ймовірностями  ,
,  не більш, ніж зліченна множина і
не більш, ніж зліченна множина і  )). Позначимо через
 )). Позначимо через  клас незміщених оцінок для параметра
клас незміщених оцінок для параметра  . Тоді, оптимальною оцінкою параметра
. Тоді, оптимальною оцінкою параметра  називається така статистика
 називається така статистика  , що
, що

де  і називається дисперсією випадкової величини
 і називається дисперсією випадкової величини  .
.
Нехай  щільність розподілу випадкової величини
щільність розподілу випадкової величини ( або ймовірність – у дискретному випадку),
 ( або ймовірність – у дискретному випадку),  вибірка з розподілу
вибірка з розподілу  ( тобто всі
( тобто всі  мають розподіл
 мають розподіл  і є незалежними випадковими величинами),
 і є незалежними випадковими величинами),  реалізація вибірки. Функція
реалізація вибірки. Функція  є щільністю розподілу випадкового вектора
 є щільністю розподілу випадкового вектора  . Якщо
. Якщо  розглядається при фіксованому значенні
розглядається при фіксованому значенні  , то така функція параметра
, то така функція параметра  називається функцією правдоподібності. Оцінкою максимальної правдоподібності невідомого параметра
 називається функцією правдоподібності. Оцінкою максимальної правдоподібності невідомого параметра  називається таке значення
 називається таке значення  , при якому
, при якому  для заданого
 для заданого  .
.
Статистичною гіпотезою( або просто гіпотезою) називають будь-яке твердження щодо виду чи властивостей розподілу спостережуваної випадкової величини. Статистичні гіпотези надалі позначатимемо так:  . Статистичною параметричною гіпотезою називається припущення про значення невідомого параметра
. Статистичною параметричною гіпотезою називається припущення про значення невідомого параметра  розподілу
 розподілу  Наведемо приклади параметричних гіпотез:
 Наведемо приклади параметричних гіпотез:
1)  
2)  
3)   де
 де  взагалі кажучи, деяка векторна функція
взагалі кажучи, деяка векторна функція  ,
,  стала.
стала.
В загальному випадку параметрична гіпотеза задається деякою підмножиною  , до якої, за припущенням, належить невідомий параметр
, до якої, за припущенням, належить невідомий параметр  . Тоді параметрична гіпотеза записується так:
. Тоді параметрична гіпотеза записується так:  . Альтернативна гіпотеза має вигляд:
. Альтернативна гіпотеза має вигляд:  ; точки
; точки називаються альтернативами. Якщо множина
 називаються альтернативами. Якщо множина  містить лише одну точку, то гіпотезу
 містить лише одну точку, то гіпотезу ( альтернативу
( альтернативу  ) називають простою; у протилежному випадку гіпотезу( альтернативу) називають складною.
) називають простою; у протилежному випадку гіпотезу( альтернативу) називають складною.
Правило, згідно якого висунута гіпотеза  приймається або відкидається, називається статистичним критерієм( або просто критерієм) перевірки гіпотези
 приймається або відкидається, називається статистичним критерієм( або просто критерієм) перевірки гіпотези  .
.
Нехай  вибірка з розподілу
вибірка з розподілу  і висунута параметрична гіпотеза
 і висунута параметрична гіпотеза  (
( може бути як скаляром, так і вектором і надалі будемо вважати його вектором, якщо не обумовлено протилежне). Потрібно визначити чи узгоджується запропонована гіпотеза із результатами проведеного експерименту. У такому випадку поступають наступним чином: будують таке правило( критерій), яке дозволяє на основі отриманих реалізацій вибірки
 може бути як скаляром, так і вектором і надалі будемо вважати його вектором, якщо не обумовлено протилежне). Потрібно визначити чи узгоджується запропонована гіпотеза із результатами проведеного експерименту. У такому випадку поступають наступним чином: будують таке правило( критерій), яке дозволяє на основі отриманих реалізацій вибірки  зробити висновок: прийняти гіпотезу
 зробити висновок: прийняти гіпотезу  чи відхилити її( прийняти альтернативу
 чи відхилити її( прийняти альтернативу  ). Отже, критерій розбиває вибірковий простір
). Отже, критерій розбиває вибірковий простір  на дві множини
 на дві множини  такі, що
 такі, що  , де
, де  складається із тих точок, для яких гіпотеза
 складається із тих точок, для яких гіпотеза  приймається, а множина
 приймається, а множина  із точок, для яких
із точок, для яких  відхиляється. Множина
 відхиляється. Множина  називається областю прийняття гіпотези, а множина
 називається областю прийняття гіпотези, а множина  називається областю відхилення гіпотези, або критичною областю.
 називається областю відхилення гіпотези, або критичною областю.
У процесі перевірки гіпотези  можна прийти до правильного висновку або допустити помилку першого роду – відхилити
 можна прийти до правильного висновку або допустити помилку першого роду – відхилити  , коли гіпотеза вірна, чи помилку другого роду – прийняти
, коли гіпотеза вірна, чи помилку другого роду – прийняти  , коли вона хибна.
, коли вона хибна.
Ймовірності цих двох помилок можна виразити через функцію потужності  критерію
 критерію  :
:  . А саме: ймовірність похибки першого роду рівна
. А саме: ймовірність похибки першого роду рівна  , а ймовірність похибки другого роду рівна
, а ймовірність похибки другого роду рівна  .
.
Число  називають рівнем значущості критерію, якщо
 називають рівнем значущості критерію, якщо  .
.
Нехай  , тоді
, тоді  квантилем
квантилем  розподілу
 розподілу  називається корінь рівняння
 називається корінь рівняння  . Якщо функція
. Якщо функція  строго монотонна, то це рівняння має єдиний корінь; у протилежному випадку це рівняння має декілька коренів, і тоді
 строго монотонна, то це рівняння має єдиний корінь; у протилежному випадку це рівняння має декілька коренів, і тоді  квантилем називають мінімальний серед коренів рівняння.
квантилем називають мінімальний серед коренів рівняння.
... і переробки суб’єкт (організація) створює нову, вже внутрішню інформацію, що призначена для власного споживання. [9, с. 70-73] Класифікують джерела інформації через необхідність їх раціонального використання, бо для підготовки та прийняття управлінських рішень доводиться користуватися найрізноманітнішими джерелами інформації. Мета будь-якої класифікації – адекватно відобразити головні, ...
... программного обеспечения: критерии, оценки, метод выбора // НТУУ КПІ, 2005, VII МНПК “Системний аналіз та інформаційні технології”, Київ, 2005. С.189. АНОТАЦІЯ Дідковська М. В. Методи оцінки та засоби підвищення надійності програмного забезпечення. – Рукопис. Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – “Автоматизовані системи управління та ...
... концепціями історії Дж. Віко, І. Гердера і Г. Гегеля. Більшість культурологів сходяться на тому, що у розвитку культурології можна виділити кілька основних теоретичних концепцій або парадигм як більш менш відрефлексованих теоретичних і методичних положень, на які спираються культурологічні дослідження. Основні теоретичні концепції або парадигми: 1. циклічна концепція (або концепція циклічних ...
... пошуку інформації, а також надають можливість фахівцям користуватися не тільки вітчизняною інформацією, а й більшістю зарубіжної. Розділ 2. Моделювання галузевих документальних потоків культури і мистецтва 2.1 Характеристика галузі культури і мистецтва Культура походить від colo, colere – вирощування, обробіток землі. З 18 ст. – виховання, вирощування людини, “оброблення людської душі”, ...
0 комментариев