4. Оценка качества однофакторных линейных моделей

 

Качество модели регрессии связывают с адекватностью модели наблюдаемым (эмпирическим) данным. Проверка адекватности (или соответствия) модели регрессии наблюдаемым данным проводится на основе анализа остатков - .

После построения уравнения регрессии мы можем разбить значение у, в каждом наблюдении на две составляющих - и ;  (4.1)

Остаток  представляет собой отклонение фактического значения зависимой переменной от значения данной переменной, полученное расчетным путем:  (). Если (), то для всех наблюдений фактические значения зависимой переменной совпадают с расчетными (теоретическими) значениями. Графически это означает, что теоретическая линия регрессии (линия, построенная по функции ) проходит через все точки корреляционного поля, что возможно только при строго функциональной связи. Следовательно, результативный признак  полностью обусловлен влиянием фактора .

На практике, как правило, имеет место некоторое рассеивание точек корреляционного поля относительно теоретической линии регрессии, т. е. отклонения эмпирических данных от теоретических (). Величина этих отклонений и лежит в основе расчета показателей качества (адекватности) уравнения.

При анализе качества модели регрессии используется основное положение дисперсионного анализа , согласно которому общая сумма квадратов отклонений зависимой переменной от среднего значения  может быть разложена на две составляющие — объясненную и необъясненную уравнением регрессии дисперсии:

 (4.2)

где - значения y, вычисленные по модели .

Разделив правую и левую часть (4.2) на

 

.

Коэффициент детерминации определяется следующим образом:

 (4.3)

 

Коэффициент детерминации показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, т. е. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов.

Чем ближе  к 1, тем выше качество модели.

Для оценки качества регрессионных моделей целесообразно также использовать коэффициент множественной корреляции (индекс корреляции

 

R R = =  (4.4)

 

Данный коэффициент является универсальным, так как он отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных.

При построении однофакторной модели он равен коэффициенту линейной корреляции

Очевидно, что чем меньше влияние неучтенных факторов, тем лучше модель соответствует фактическим данным. Также для оценки точности регрессионных моделей целесообразно использовать среднюю относительную ошибку аппроксимации:  

 ( 4.5)

Чем меньше рассеяние эмпирических точек вокруг теоретической линии регрессии, тем меньше средняя ошибка аппроксимации. Ошибка аппроксимации меньше 7 % свидетельствует о хорошем качестве модели.

После того как уравнение регрессии построено, выполняется проверка значимости построенного уравнения в целом и отдельных параметров.

Оценить значимость уравнения регрессии – это означает установить, соответствует ли математическая модель, выражающая зависимость между Y и Х, фактическим данным и достаточно ли включенных в уравнение объясняющих переменных Х для описания зависимой переменной Y

Оценка значимости уравнения регрессии производится для того, чтобы узнать, пригодно уравнение регрессии для практического использования (например, для прогноза) или нет. При этом выдвигают основную гипотезу о незначимости уравнения в целом, которая формально сводится к гипотезе о равенстве нулю параметров регрессии, или, что то же самое, о равенстве нулю коэффициента детерминации: . Альтернативная ей гипотеза о значимости уравнения — гипотеза о неравенстве нулю параметров регрессии.

Для проверки значимости модели регрессии используется F-критерий Фишера, вычисляемый как отношение дисперсии исходного ряда и несмещенной дисперсии остаточной компоненты. Если расчетное значение с n1= k и n2 = (n - k - 1) степенями свободы, где k – количество факторов, включенных в модель, больше табличного при заданном уровне значимости, то модель считается значимой. Для модели парной регрессии:

 

 (4.6)

В качестве меры точности применяют несмещенную оценку дисперсии остаточной компоненты, которая представляет собой отношение суммы квадратов уровней остаточной компоненты к величине (n- k -1), где k – количество факторов, включенных в модель. Квадратный корень из этой величины () называется стандартной ошибкой оценки.

 

  (4.7)


Для модели парной регрессии

 

 

Анализ статистической значимости параметров модели парной регрессии

Значения , соответствующие данным  при теоретических значениях  и  являются случайными. Случайными являются и рассчитанные по ним значения коэффициентов  и .

Надежность получаемых оценок  и  зависит от дисперсии случайных отклонений (ошибок). По данным выборки эти отклонения и, соответственно, их дисперсия не оцениваются – в расчетах используются отклонения зависимой переменной от ее расчетных значений : . Так как ошибки (остатки)  нормально распределены, то среднеквадратическое отклонение ошибок используется для измерения этой вариации. Среднеквадратические отклонения коэффициентов известны как стандартные ошибки (отклонения):

 (4.8)


где  - среднее значение независимой переменной х;

 стандартная ошибка, вычисляемая по формуле (4.8);

.

Проверка значимости отдельных коэффициентов регрессии связана с определением расчетных значений t-критерия (t–статистики) для соответствующих коэффициентов регрессии:

 (4.9)

Затем расчетные значения  сравниваются с табличными tтабл. Табличное значение критерия определяется при (n-2) степенях свободы (n - число наблюдений) и соответствующем уровне значимости a (0,1; 0,05)

Если расчетное значение t-критерия с (n - 2) степенями свободы превосходит его табличное значение при заданном уровне значимости, коэффициент регрессии считается значимым. В противном случае фактор, соответствующий этому коэффициенту, следует исключить из модели (при этом ее качество не ухудшится).

По имеющейся информации о результатах деятельности 19 Российских предприятий, стоящих по рейтингу на первых позициях, построить уравнение линейной зависимости прибыли предприятий от размера собственного капитала.

Собранный статистический материал представлен в таблице 1.


Таблица 1. Данные о величине собственного капитала и прибыли Российских предприятий за 2005

Рейтинг Название предприятия Собственный капитал, млн. руб. Прибыль, млн. руб.

1

2

3

4

1 "Газпром" 2772000 348400
2 РЖД 1851000 237545
3 ОАО "Сургутнефтегаз" 707913 214479
4 РАО "ЕЭС России" 386200 203448
5 Нефтяная компания "ЛУКойл" 222156 126326
6 ГМК "Норильский никель" 208143 118159
7 ТНК-ВР 165000 110400
8 "Связьинвест" 167572 95700
9 Нефтяная компания "Сибнефть" 153000 84800
10 АФК "Система" 150844 76503
11 Сбербанк России 148000 62929
12 “Татнефть” 103653 36876
13 "Северсталь" 103275 34312
14 Нефтегазовая компания "Славнефть" 101270 29923
15 Евраз Груп 77558 29517
16 "Русал" 75600 28512
17 АК "Транснефть" 46629 4608
18 АвтоВАЗ http://www.tatneft.ru/ 43308 1400
19 Магнитогорский металлургический комбинат 28500 1345

На основании имеющихся данных найдем:

1)уравнение прямой регрессии У = а + bX , где У – прибыль предприятий (результативный признак), Х – размер собственного капитала (факторный признак).

2)тесноту связи между прибылью предприятий с помощью линейного коэффициента корреляции rху.

Получили, что коэффициенты регрессии а = 51,61 и b = 0,115. Таким образом, уравнение зависимости прибыли предприятий (У) от величины собственного капитала (Х) имеет вид: У = 51,61 + 0,115Х, т.е. при увеличении размера собственного капитала на 1 млн. руб. прибыль предприятий в среднем увеличивается на 115 тыс. руб.

Коэффициент корреляции rху = 0,867 свидетельствует о сильной и прямой связи между размером собственного капитала и прибылью организации.

Изобразим графически исходные данные о прибыли и размере собственного капитала и полученную прямую зависимости данных признаков.

 


Информация о работе «Социально-экономические явления и методы исследования связей между ними»
Раздел: Экономика
Количество знаков с пробелами: 27787
Количество таблиц: 1
Количество изображений: 2

Похожие работы

Скачать
17053
0
0

... тот специфический для данной науки круг вопросов, которые подлежат исследованию при изучении наукой своего объекта познания. Принципы, методы и приемы изучения предмета науки образуют методологию этой науки. Объектом изучения социально-экономической статистики является общество во всем многообразии его форм и проявлений. Это связывает социально-экономическую статистику со всеми другими науками, ...

Скачать
39643
0
0

... усиливает актуальность этого вопроса. 5.         Преодоление существующей несопоставимости показателей социальной статистики и показателей, представленных в других отраслевых статистиках. 6.         Моделирование социально-экономических связей с целью обнаружения механизмов взаимодействия в общественной системе. На макроуровне представлен ряд объективно существующих ограничительных факторов, ...

Скачать
60033
8
5

... уравнения для оценки неизвестных значении зависимой переменной. Решение названных задач опирается на соответствующие приемы, алгоритмы, показатели, применение которых дает основание говорить о статистическом изучении взаимосвязей. Следует заметить, что традиционные методы корреляции и регрессии широко представлены в разного рода статистических пакетах программ для ЭВМ. Исследователю остается ...

Скачать
48924
12
3

... агрегатный индекс производительности труда – Уt= . Наиболее типичным общим индексом количественных показателей является индекс физического объема, который записывается в виде формулы: Уq= . В экономико-статистическом анализе приходится сравнивать в динамике такие обобщающие показатели качественных характеристик, как средняя цена, средняя себестоимость, средняя производительность труда и другие. ...

0 комментариев


Наверх