3.6. Многофакторный корреляционно - регрессионный анализ
Таблица 4. Исходные данные.
год | уровень | доход | индекс | индекс |
1995 | 12,7 | 83,7 | 278,2 | 86,2 |
1996 | 14,9 | 89,6 | 235,2 | 93,5 |
1997 | 21,3 | 130,5 | 124 | 102,2 |
1998 | 22,2 | 72,2 | 107,9 | 94,2 |
1999 | 17,3 | 99,9 | 163,7 | 108 |
2000 | 19,1 | 111,2 | 144,6 | 104,9 |
2001 | 18,4 | 110,2 | 120,3 | 106,4 |
2002 | 15,4 | 121,5 | 110,6 | 106,4 |
2003 | 16,8 | 104,5 | 114,2 | 106,7 |
2004 | 15,3 | 104,4 | 114,7 | 103,7 |
2005 | 12 | 111,3 | 115,1 | 104,8 |
итого | 185,4 | 1139 | 1628,5 | 1117 |
средн | 16,86 | 103,55 | 148,046 | 101,55 |
Для анализа необходимо из нескольких факторов произвести предварительный отбор факторов для регрессионной модели. Сделаем это по итогам расчета коэффициента корреляции, т.е. возьмем те факторы, связь которых с результативным признаком будет выражена в большей степени. Рассмотрим следующие факторы:
- Доход на душу населения – x1 (%)
- Индекс потребительских цен – x2 (%)
- Индекс ВРП - x3 (%)
Рассчитаем коэффициент корреляции для линейной связи и для имеющихся факторов - x1, x2 и x3:
Для фактора x1 получаем коэффициент корреляции: r1= 0,042
Для фактора x2 получаем коэффициент корреляции: r2 =0,437
Для фактора x3 получаем коэффициент корреляции: r3=0,151
По полученным данным можно сделать вывод о том, что:
1)Связь между x1 и y отсутствует, так как коэффициент корреляции меньше 0,15. Таким образом, возникает необходимость исключить данный фактор из дальнейших исследований.
2)Связь между x2 и y прямая (так как коэффициент корреляции положительный) и умеренная, так как она находится между 0,41 и 0,50. Поэтому, будем использовать фактор в дальнейших расчётах.
3)Связь между x3 и y прямая (так как коэффициент корреляции положительный) и слабая. Тем не менее, будем использовать фактор в дальнейших расчетах.
Таким образом, два наиболее влиятельных фактора – Индекс потребительских цен – x2 и индекс ВРП - x3. Для имеющихся факторов x2 и x3 составим уравнение множественной регрессии.
Проверим факторы на мультиколлинеарность, для чего рассчитаем коэффициент корреляции rx2x3. Подставив имеющиеся данные (из таблицы 10) в формулу, имеем следующее значение: rx2x3=0,747.Полученный коэффициент говорит об очень высокой связи, поэтому дальнейший анализ по обоим факторам вестись не может. Однако в учебных целях продолжим анализ.
Проводим оценку существенности связи с помощью коэффициента множественной корреляции: R=0,512
Так как R < 0,8, то связь признаем не существенной, но, тем не менее, в учебных целях, проводим дальнейшее исследование.
Для определения параметров уравнения необходимо решить систему:
Решив систему, получим уравнение: Ŷ=41,57-0,042 x1-0,183x3
Для данного уравнения найдем ошибку аппроксимации:
A=15,12
А> 5%, то данную модель нельзя использовать на практике.
Проведем оценку параметров на типичность. Рассчитаем значения величин:
S2=28,039
ma=0,886; mb=0,0003; mс=0,017;
ta=41,57/0,886=46,919; tb=-0,042/0,0003=-140; tc=-0,183/0,017=-10,77.
Сравним полученные выше значения t для α = 0,05 и числа степеней свободы (n-2) с теоретическим значением t-критерия Стьюдента, который tтеор = 2,1788. Расчетные значения tbи tс < tтеор, значит данные параметры не значимы и данное уравнение не используется для прогнозирования.
Далее оценим существенность совокупного коэффициента множественной корреляции на основе F-критерия Фишера по формуле:
где: n – число уровней ряда; к – число параметров; R – коэффициент множественной корреляции.
После расчета получаем: F=1,41
Сравним Fрасч с Fтеор для числа степеней свободы U1 = 9 и U2 = 2, видим, что 1,41 < 19,40, то есть Fрасч < Fтеор - связь признаётся не существенной, то есть корреляция между факторами x2, x3 и у не существенна.
... степень сбалансированности системы подготовки кадров с потребностью экономики в квалифицированных работниках. 6.2. Статистика занятости и безработицы Занятость - одна из важнейших социально-экономических проблем рыночной экономики. Ее статистическое отражение неоднократно обсуждалось на международных конференциях статистиков труда (1949, 1957, 1982, 1993 гг.), проводимых Международным бюро ...
... с распространением явления неполная занятость: , (1.11) где ТНЗ– численность занятых неполное рабочее время [1]. 2 ПРОЕКТНАЯ ЧАСТЬ В курсовом проекте для проведения анализа и прогнозирования рынка труда применяются динамические ряды, тренды, а также алгоритмы и блок-схемы. Для начала необходимо провести анализ требований к данной модели. 2.1 Анализ ...
... и сельского хозяйства. Хотя и наблюдается рост средней продолжительности поисков работы, что 60-80 % трудоустраивающихся находят работу менее чем за 4 месяца 3 Статистический анализ занятости населения 3.1 Анализ динамики уровня безработицы Анализ динамики явления производится на основе рядов динамики. Ряд динамики, или временной ряд – это последовательность упорядоченных во времени ...
... полномочий; · методологическое и организационное обеспечение формирования показателей, характеризующих уровень достижения целей социально-экономического развития государства, и показателей деятельности федеральных органов исполнительной власти; · интеграцию статистических информационных ресурсов на основе методологической и технологической совместимости для эффективного их использования при ...
0 комментариев