4.1 Рангова кореляція – розрахунок коефіцієнта Спірмена (коефіцієнт кореляційних рангів)
Нехай і вибірки з безперервних розподілів (розподіл відмінний від нормального). Кожному значенню поставимо у відповідність його ранг у варіаційному рядові . Аналогічно, кожному значенню поставимо у відповідність його ранг у варіаційному рядові .
Ранговий коефіцієнт кореляції Спирмена , як і звичайний коефіцієнт кореляції, характеризує залежність між вибірками випадкових величин. Вибірковим значенням рангового коефіцієнта кореляції Спирмена називають величину
(4.1)
Коефіцієнт – непараметрична міра залежності між і .
Гіпотеза при альтернативній гіпотезі перевіряється за допомогою статистики
(4.2)
Якщо , то гіпотеза відхиляється (тобто між і існує рангова кореляційна залежність), і не відхиляється в противному випадку. Рівень значимості критерію .
Порахуємо коефіцієнт Спирмена між Xi і Y в таблиці 2.1 з використанням спеціалізованої програми «Статистика».
N – обсяг вибірок
Spearman R – коефіцієнт рангової кореляції Спирмена
t (N‑2) – статистика для перевірки гіпотези
p-level – р-уровень
Тому що , то гіпотеза відхиляється (або, що те ж р-level<0,05, тому гіпотеза відхиляється).
Ранговий кореляційний зв'язок між Xi і Y є значимим.
Порахуємо коефіцієнт Спирмена між Xj і Y в таблиці 2.1 з використанням спеціалізованої програми «Статистика».
Тому що , то гіпотеза відхиляється (або, що те ж р-level<0,05, тому гіпотеза відхиляється).
Ранговий кореляційний зв'язок між Xj і Y є значимим.
На основі наведених даних спостережень будуються лінійна одновимірні Y=f(Xi) та багатовимірні Y=f (Xi, Xj) регресійні моделі, які встановлюютьє залежність результативної ознаки Y – середньорічного рівня надою молока від факторних ознак – Xi (кількості кормів на одну корову) та Xj (рівня приплоду телят на 100 корів) по 30 хазяйствам.
Одновимірна лінійна регресійна модель представляється як:
, (4.3)
де – постійна складова доходу (початок відліку);
– коефіцієнт регресії;
– відхилення фактичних значень надою від оцінки (математичного сподівання) середньої величини надою в і-тому хазяйстві.
Існують різні способи оцінювання параметрів регресії. Найпростішим, найуніверсальнішим є метод найменших квадратів [48]. За цим методом параметри визначаються виходячи з умови, що найкраще наближення, яке мають забезпечувати параметри регресії, досягається, коли сума квадратів різниць між фактичними значеннями доходу та його оцінками є мінімальною, що можна записати як
. (4.4)
Відмітимо, що залишкова варіація (4.4) є функціоналом від параметрів регресійного рівняння:
(4.5)
За методом найменших квадратів параметри регресії і є розв’язком системи двох нормальних рівнянь [48]:
, (4.6)
.
Розв’язок цієї системи має вигляд:
, (4.7)
.
Середньоквадратична помилка регресії, знаходиться за формулою
, (4.8)
Коефіцієнт детермінації для даної моделі
(4.9)
повинен дорівнювати: >0,75 – сильний кореляційний зв’зок, 0,36>>0,75 – кореляційний зв’язок середньої щільності; <0,36 – кореля-ційній зв’язок низької щільності [48].
Для характеристики кореляційного зв’язку між факторною і результативною ознаками побудуємо графік кореляційного поля та теоретичну лінію регресії, визначимо параметри лінійного рівняння регресії.
Для перевірки істотності зв’язку потрібно порівняти фактичне значення статистики Фішера (F-критерій) з його критичним (табличним) значенням, яке потрібно визначити з урахуванням умов аналітичного групування і заданого рівня істотності, скориставшись таблицею.
При виконанні процедури перевірки значущості коефіцієнта детермінації висувається нульова гіпотеза H0 проти альтернативи H1, котрі полягають в наступному:
H0: істотної різниці між вибірковим коефіцієнтом детермінації та коефіцієнтом детермінації генеральної сукупності не існує. Ця гіпотеза рівносильна гіпотезі H0: b=0, тобто змінні X не впливають суттєво на залежну змінну Y. Для оцінки істотності коефіцієнта детермінації використовується статистика:
(4.10)
що має F-розподіл Фішера з f1=1 та f2=n‑2=30–2=28 ступенями вільності.
Значення статистики порівнюється з критичним значенням цієї статистики, знайденим за таблицею при заданому рівні значущості a=0,05 та відповідному числі ступенів вільності. Якщо F>F1,n-2,a, то обчислений коефіцієнт детермінації істотно відрізняється від нуля. Цей висновок забезпечується з ймовірністю 1-a. Рівень істотності a=0,05. Кількість ступенів вільності наступна: f1=1, f2=28.
Для лінійного зв’язку використовується лінійний коефіцієнт кореляції (Пірсона):
(4.11)
який набуває значень у межах +-1, тому характеризує не лише щільність, а й напрямок зв’язку. Додатне значення свідчить про прямий зв’язок, а від’ємне – про зворотний.
Щільність зв’язку оцінюється індексом детермінації: R=, проте інтерпретується тільки R2. Якщо коефіцієнт детермінації більше 0,6, то 60% варіації залежної величини пояснюється варіацією незалежного параметра кореляції і зв’язок є щільним.
На рис. 3.1 – 3.4 наведені лінійні та нелінійні регресійні одномірні моделі кореляційного зв’язку Y=F(Xi) та Y=f(Xj).Як видно з графіків рис. 3.1 – 3.2 коефіцієнт детермінації R2 для лінійної кореляції знаходиться в діапазоні 0,35 – 0,5, тобто лінійний одномірний кореляційний зв’язок є слабої сили. При побудові нелінійних одномірних рівнянь регресії (рис. 3.3 – 3.4) коефіцієнт детермінації R2 для нелінійної кореляції знаходиться в діапазоні 0,5 – 0,7, тобто нелінійний одномірний кореляційний зв’язок є сильним.
Рис. 3.1. – Побудова лінійної одномірної регресії Y=f(Xi) з використанням «електронних таблиць» Excel-2000
Рис. 3.2. – Побудова лінійної одномірної регресії Y=f(Xj) з використанням «електронних таблиць» Excel-2000
Рис. 3.3. – Побудова нелінійної одномірної регресії Y=f(Xi) з використанням «електронних таблиць» Excel-2000
Рис. 3.4. – Побудова нелінійної одномірної регресії Y=f(Xj) з використанням «електронних таблиць» Excel-2000
... показників ефективності виробництва м’яса ВРХ [13]. 2. Ефективність виробництва ВРХ у підприємстві 2.1 Характеристика природно-економічних умов підприємства Сільськогосподарське підприємство ТОВ «Аграрій СВПП» розташоване в с. Краснопілка, Уманського району, Черкаської області. Природно-кліматичні умови обумовлюються його місцезнаходженням в Лісостеповій зоні. Так середньорічна кільк ...
... : факторну і результативну. Факторною називається така ознака, під впливом якої змінюється інша ознака, що називається результативною. У табл.2.1.1 наведено статистичне вивчення виручки від реалізації молока Таблиця 2.1.1. Статистичне вивчення виручки від реалізації молока № Виробництво тонн Ціна за 1 тонну Виручка від реалізації, тис.грн 1 362,1 95,9 34,73 2 359,6 91,4 32,87 3 ...
... в сільському господарстві у просторово-часових границях. Статистика сільського господарства має справу, по перше, з різними видами характеристик, які в певній мірі пов'язані між собою. Це означає: статистика сільського господарства займається класифікацією цих характеристик (показників). По друге, сукупність характеристик (показників) відноситься до сільського господарства, яке включає виробничі ...
... підприємства. На основі цього можна визначитися в можливих обсягах виробництва продукції кожного виду і з'ясувати резерви зростання її обсягів. Важливим моментом є визначення каналів реалізації кожного виду продукції птахівництва. Більш ефективною є реалізація її підприємством через фірмові магазини, ларкі та на ринках. Можлива також реалізація через оптові торговельні організації. Потрібно ...
0 комментариев