1.3 Лінійна одновимірна регресія

Нехай Yi = β0 + β1xi + εi (i = 1,2, …, n) і ми хочемо перевірити гіпотезу H: β1 = 0. Тоді X = (In, x),

, ,

Підставляючи ці вирази у формулу  = (X’X)-1X’Y, після деяких спрощень одержуємо

0 = (1.3.1)

 = 0 + 1xi =  (1.3.2)

Нарешті, знаходимо вираз для F- статистики

(1.3.3)

Де

Помітимо, що з (1.3.4) випливає, що


Де

є квадратом вибіркового коефіцієнта кореляції між Y і х. Відношення r є мірою ступені лінійності зв'язку меж Y і х, оскільки, згідно з (1.3.5),

RSS =  (1.3.6)

Отже, чим більше значення г2, тим менше RSS і, тим краще підібрана пряма відповідає спостереженням.

1.4 Порівняння прямих регресій. Критерій паралельності прямих. Критерій збігу прямих

Нехай необхідно порівняти K ліній регресій

Y = αk+ βkxk + ε (k =1, 2, ..., K),

де M[ε] = 0 і дисперсії D[ε] = σ2 однакові для всіх K ліній. Якщо для k-й лінії є nk пар спостережень (xki, Yki ) (i = 1, 2, ..., nk), то модель приймає вигляд

Yki = αk+ βkxki + εki(k =1, 2, ..., nk), (1.4.1)


де εki - незалежні випадкові величини з розподілом N(0, σ2).

Введемо позначення Y' = (Y11, Y12, …, Y1n1, …, YKn1, …, YKnk) запишемо модель у вигляді Y = Xγ + ε, де

Тут X -матріца розміру N×2K рангу 2К, а N = .

Використовуючи загальну теорію підрозділу 1.2, можна перевірити будь-яку гіпотезу вигляду Н:Аγ = с. Дві гіпотези такого роду розглядаються нижче.

Критерій паралельності прямих

Розглянемо задачу перевірки паралельності всіх K ліній. Тоді гіпотеза

Н:Аγ = с має вигляд H1: β1 = β2 = . . . = βK = β, або β1- βK = β2 – βK = ... = βK-1 - - βK= 0. У матричній формі H1 приймає вигляд

або Аγ = 0, де А-матрица розміру (К- 1)×2K рангу K-1. Використовуючи загальну теорію регресії з q = K-1, n = N і р = 2К, одержуємо, що статистика критерія для перевірки гіпотези H1, має вигляд

 (1.4.2)

Для знаходження RSS необхідно мінімізувати

S = ε'ε = .

Продиференціюємо S по αk та βk

З перших K рівнянь системи знаходимо, що

Підставляємо αk в (1.4.4)

 (1.4.5)

Тоді  Підставляємо оцінки  в S. Знаходимо

RSS =

 

 (1.4.6)

Для знаходження  мінімізуємо суму S = відносно α і β. Продиференціюємо S по αk та β

 (k = 1, 2, …, K)

З перших K рівнянь системи знаходимо

Підставляємо знайдені αk в друге рівняння системи

Тоді

Підставляючи оцінки  в S, знаходимо

Отже, гіпотезу H1: β1 = β2 = . . . = βK = β відхиляємо при

і не відхиляємо в супротивному разі. Рівень значущості критерію α.

Критерій збігу прямих

Для вирішення питання про збіг всіх K ліній регресії розглянемо гіпотезу H2: α1 = α2 = ... = αK і β1 = β1 = ... = βK, або, що те ж саме, H2: α1- αK = = α2 - αK = ... = αK-1 - αK = 0 і β1 - βK= ... = βK-1 - βK = 0.

В матричній формі гіпотеза H2 приймає вигляд:Aγ = 0, зокрема


Матриця А має розмір (2K-2) рядків, 2K стовпців (ранг 2М – 2).

F – статистика для перевірки гіпотези H2 має вигляд

(1.4.7)

Знайдемо RSSH2. Для знаходження RSSH2 необхідно мінімізувати суму по α і β, одержуємо

Із першого рівняння знаходимо

Підставляючи α в перше рівняння системи одержуємо β


Тоді

Отже,

Отже, гіпотезу H21 = α2 = ... = αK і β1 = β1 = ... = βKвідхиляємо при

 > Fα,(2K-2),(N-2K)

і не відхиляємо в супротивному разі. Рівень значущості критерію α.

На практиці спочатку застосовують критерій паралельності прямих, а потім вже, якщо гіпотеза Н1 не відхиляється, перевіряють гіпотезу H2 (вважаючи, що гіпотеза H1 справелива), використовуючи статистику

.


РОЗДІЛ 2. ДОСЛІДЖЕННЯ ЗАХВОРЮВАНОСТІ НА ТУБЕРКУЛЬОЗ, РАК, СНІД, ГЕПАТИТ А, ГЕПАТИТ Б

 


Информация о работе «Статистичний аналіз тенденцій захворюваності в Україні»
Раздел: Математика
Количество знаков с пробелами: 179723
Количество таблиц: 6
Количество изображений: 246

Похожие работы

Скачать
138713
9
0

... притягають до себе різних кримінальних особистостей. І не випадково саме повії нерідко стають жертвами рекетирів, використовуються організованою злочинністю. Розділ 3. Соціологічний аналіз молодіжної наркоманії в Україні Сьогодні соціологи фіксують вагоме помолодіння різних форм девіантної поведінки. Тому виникає необхідність більш розгорнуто обдивиться проблему молодіжної наркоманії. ...

Скачать
49793
18
5

... навантаження поділяються на показники антро­погенного та природного навантаження. Щоб оцінити антропо­генне навантаження на довкілля, застосовують показники: ·  видобутку (збору врожаю) окремих природних ресурсів; ·  що характеризують кiлькiсть викидів і скидів забруднюючих речовин та вiдходiв у атмосферне повітря, водні ресурси та в землю; ·  що характеризують кiлькiсть використовуваних ...

Скачать
56321
2
4

... інгових тестів) та спільно з психотерапевтами коригувати тривожно-депресивні стани. СПИСОК ОПУБЛІКОВАНИХ ПРАЦЬ ЗА ТЕМОЮ ДИСЕРТАЦІЇ 1. Малацківська О.В. Динаміка профілю ризику серцево-судинних захворювань в жіночій популяції за 25-річний період // Кровообіг та гемостаз.– № 3. – 2006. – С. 49-52. 2. Малацківська О.В., Горбась І.М. Зв’язок традиційних факторів ризику серцево-судинних ...

Скачать
51422
0
0

... А. В. Борисенко, О. О. Шекера // Матеріали ІІІ (Х) з’їзду Асоціації стоматологів України. – Полтава, 2008. – С. 136 АНОТАЦІЯ   Шекера О. О. Особливості клініки, діагностики, профілактики та лікування захворювань пародонта у вагітних із акушерською патологією. – Рукопис. Дисертація на здобуття наукового ступеня кандидата медичних наук за спеціальністю 14.01.22 – стоматологія. – Національний ...

0 комментариев


Наверх