1.3 Лінійна одновимірна регресія
Нехай Yi = β0 + β1xi + εi (i = 1,2, …, n) і ми хочемо перевірити гіпотезу H: β1 = 0. Тоді X = (In, x),
, ,
Підставляючи ці вирази у формулу = (X’X)-1X’Y, після деяких спрощень одержуємо
0 = (1.3.1)
= 0 + 1xi = (1.3.2)
Нарешті, знаходимо вираз для F- статистики
(1.3.3)
Де
Помітимо, що з (1.3.4) випливає, що
Де
є квадратом вибіркового коефіцієнта кореляції між Y і х. Відношення r є мірою ступені лінійності зв'язку меж Y і х, оскільки, згідно з (1.3.5),
RSS = (1.3.6)
Отже, чим більше значення г2, тим менше RSS і, тим краще підібрана пряма відповідає спостереженням.
1.4 Порівняння прямих регресій. Критерій паралельності прямих. Критерій збігу прямих
Нехай необхідно порівняти K ліній регресій
Y = αk+ βkxk + ε (k =1, 2, ..., K),
де M[ε] = 0 і дисперсії D[ε] = σ2 однакові для всіх K ліній. Якщо для k-й лінії є nk пар спостережень (xki, Yki ) (i = 1, 2, ..., nk), то модель приймає вигляд
Yki = αk+ βkxki + εki(k =1, 2, ..., nk), (1.4.1)
де εki - незалежні випадкові величини з розподілом N(0, σ2).
Введемо позначення Y' = (Y11, Y12, …, Y1n1, …, YKn1, …, YKnk) запишемо модель у вигляді Y = Xγ + ε, де
Тут X -матріца розміру N×2K рангу 2К, а N = .
Використовуючи загальну теорію підрозділу 1.2, можна перевірити будь-яку гіпотезу вигляду Н:Аγ = с. Дві гіпотези такого роду розглядаються нижче.
Критерій паралельності прямих
Розглянемо задачу перевірки паралельності всіх K ліній. Тоді гіпотеза
Н:Аγ = с має вигляд H1: β1 = β2 = . . . = βK = β, або β1- βK = β2 – βK = ... = βK-1 - - βK= 0. У матричній формі H1 приймає вигляд
або Аγ = 0, де А-матрица розміру (К- 1)×2K рангу K-1. Використовуючи загальну теорію регресії з q = K-1, n = N і р = 2К, одержуємо, що статистика критерія для перевірки гіпотези H1, має вигляд
(1.4.2)
Для знаходження RSS необхідно мінімізувати
S = ε'ε = .
Продиференціюємо S по αk та βk
З перших K рівнянь системи знаходимо, що
Підставляємо αk в (1.4.4)
(1.4.5)
Тоді Підставляємо оцінки в S. Знаходимо
RSS =
(1.4.6)
Для знаходження мінімізуємо суму S = відносно α і β. Продиференціюємо S по αk та β
(k = 1, 2, …, K)
З перших K рівнянь системи знаходимо
Підставляємо знайдені αk в друге рівняння системи
Тоді
Підставляючи оцінки в S, знаходимо
Отже, гіпотезу H1: β1 = β2 = . . . = βK = β відхиляємо при
і не відхиляємо в супротивному разі. Рівень значущості критерію α.
Критерій збігу прямих
Для вирішення питання про збіг всіх K ліній регресії розглянемо гіпотезу H2: α1 = α2 = ... = αK і β1 = β1 = ... = βK, або, що те ж саме, H2: α1- αK = = α2 - αK = ... = αK-1 - αK = 0 і β1 - βK= ... = βK-1 - βK = 0.
В матричній формі гіпотеза H2 приймає вигляд:Aγ = 0, зокрема
Матриця А має розмір (2K-2) рядків, 2K стовпців (ранг 2М – 2).
F – статистика для перевірки гіпотези H2 має вигляд
(1.4.7)
Знайдемо RSSH2. Для знаходження RSSH2 необхідно мінімізувати суму по α і β, одержуємо
Із першого рівняння знаходимо
Підставляючи α в перше рівняння системи одержуємо β
Тоді
Отже,
Отже, гіпотезу H2:α1 = α2 = ... = αK і β1 = β1 = ... = βKвідхиляємо при
> Fα,(2K-2),(N-2K)
і не відхиляємо в супротивному разі. Рівень значущості критерію α.
На практиці спочатку застосовують критерій паралельності прямих, а потім вже, якщо гіпотеза Н1 не відхиляється, перевіряють гіпотезу H2 (вважаючи, що гіпотеза H1 справелива), використовуючи статистику
.
РОЗДІЛ 2. ДОСЛІДЖЕННЯ ЗАХВОРЮВАНОСТІ НА ТУБЕРКУЛЬОЗ, РАК, СНІД, ГЕПАТИТ А, ГЕПАТИТ Б
... притягають до себе різних кримінальних особистостей. І не випадково саме повії нерідко стають жертвами рекетирів, використовуються організованою злочинністю. Розділ 3. Соціологічний аналіз молодіжної наркоманії в Україні Сьогодні соціологи фіксують вагоме помолодіння різних форм девіантної поведінки. Тому виникає необхідність більш розгорнуто обдивиться проблему молодіжної наркоманії. ...
... навантаження поділяються на показники антропогенного та природного навантаження. Щоб оцінити антропогенне навантаження на довкілля, застосовують показники: · видобутку (збору врожаю) окремих природних ресурсів; · що характеризують кiлькiсть викидів і скидів забруднюючих речовин та вiдходiв у атмосферне повітря, водні ресурси та в землю; · що характеризують кiлькiсть використовуваних ...
... інгових тестів) та спільно з психотерапевтами коригувати тривожно-депресивні стани. СПИСОК ОПУБЛІКОВАНИХ ПРАЦЬ ЗА ТЕМОЮ ДИСЕРТАЦІЇ 1. Малацківська О.В. Динаміка профілю ризику серцево-судинних захворювань в жіночій популяції за 25-річний період // Кровообіг та гемостаз.– № 3. – 2006. – С. 49-52. 2. Малацківська О.В., Горбась І.М. Зв’язок традиційних факторів ризику серцево-судинних ...
... А. В. Борисенко, О. О. Шекера // Матеріали ІІІ (Х) з’їзду Асоціації стоматологів України. – Полтава, 2008. – С. 136 АНОТАЦІЯ Шекера О. О. Особливості клініки, діагностики, профілактики та лікування захворювань пародонта у вагітних із акушерською патологією. – Рукопис. Дисертація на здобуття наукового ступеня кандидата медичних наук за спеціальністю 14.01.22 – стоматологія. – Національний ...
0 комментариев