8.  Сделать выводы по полученным результатам.

Решение:

Для удобства вычислений в ходе решения будем достраивать исходную таблицу данных до вспомогательной (см. Приложение 1), округляя и занося в расчетную таблицу промежуточные результаты.

1.  Построим поле корреляции:

 

Визуальный анализ полученного графика показывает, что точки поля корреляции располагаются вдоль некоторой воображаемой прямой линии, но не очень плотно, рассеиваясь около неё. Поэтому делаем предположение о линейном виде уравнения регрессии. Нельзя сказать, что прослеживается тесная зависимость, но заметно, что с увеличением размера жилой площади х наблюдается тенденция к увеличению стоимости квартир у. Можно предположить, что связь размера жилой площади и ее стоимости положительная, не очень тесная, и на цену квартир оказывают влияние и другие факторы (район места ее расположения, этаж, наличие коммуникаций, состояние квартиры и т.п.).

2.  Построим в соответствии с выбранным линейным видом уравнение регрессии:

Чтобы определить параметры линейной модели с помощью метода наименьших квадратов, решим систему уравнений на основе исходных и расчетных данных:

Рассчитав на основе исходных данных необходимые значения (графы 3, 5 таблицы Приложения 1), получаем систему:

Решив полученную систему уравнений при помощи надстройки «Поиск решения» приложения MS Excel, находим:

b0 = 9,308595

b1 = 0,52076

Составим уравнение парной линейной регрессии:


В декартовой системе координат ХОУ на поле корреляции строим график линии регрессии по найденному уравнению (рис.1).

3.  Для оценки влияния фактора на исследуемый показатель вычислим линейный коэффициент корреляции и коэффициент детерминации.

Используя надстройку приложения MS Excel «Пакет анализа» - инструмент «Корреляция», находим величину линейного коэффициента корреляции.

Столбец 1 Столбец 2
Столбец 1 1
Столбец 2 0,8559571 1

По величине коэффициента корреляции , принадлежащей интервалу (0,7; 1), оценим качественную характеристику связи как сильную прямую.

Находим парный коэффициент детерминации:

Изменение У примерно на 74 % определяется вариацией фактора х, на 26 % - влиянием других факторов. То есть изменения величины стоимости жилой площади на 74% обусловлены колебаниями ее размеров, и на 26 % - колебаниями и изменениями других факторов и условий.

4.  Оценим качество построенной модели

Производим расчеты данных для граф 6-10 вспомогательной таблицы (Приложение 1).

Оценим качество построенной модели с точки зрения адекватности. Для этого проверим выполнение следующих требований:

1)  Уровни ряда остатков имеют случайный характер. Для проверки выполнения данного требования воспользуемся критерием поворотных точек (пиков).

-3,829 -3,4095 -4,145 -4,629 -2,797 -4,7313 -6,0229 -5,7565 -2,4402 3,4693 2,4879 10,3183 7,4092 13,9416
+ - + + - - + - + + + +

Число поворотных точек р = 8

Поскольку р > 5, требование считаем выполненным.

2)  Математическое ожидание уровня ряда остатков равно нулю.

Поскольку полученное значение близко к 0, требование считаем выполненным.

3)  Дисперсия каждого отклонения одинакова для всех х. Для проверки выполнения данного требования используем критерий Гольдфельда-Квандта. Исходные значения х расположим в возрастающем порядке:

Жилая площадь, х Цена кв., у.
16 13,5
17,7 22
20 15,9
20 15,1
21,4 34,4
28 21,1
31,1 28
40,5 27
45,9 27,2
46,3 28,7
47,5 28,3
48,7 45
65,8 51
87,2 52,3

Делим полученную таблицу на 2 равные части

Жилая площадь, х Цена кв., у Жилая площадь, х Цена кв., у
16 13,5 40,5 27
17,7 22 45,9 27,2
20 15,9 46,3 28,7
20 15, 47,5 28,3
21,4 34,4 48,7 45
28 21,1 65,8 51
31,1 28 87,2 52,3

По каждой группе строим уравнение регрессии:

Жилая площадь, х Цена кв., у

16 13,5 256 216
17,7 22 313,29 389,4
20 15,9 400 318
20 15,1 400 302
21,4 34,4 457,96 736,16
28 21,1 784 590,8
31,1 28 967,21 870,8

154,2

150

3578,46

3423,16

Чтобы определить параметры линейной модели с помощью метода наименьших квадратов, решим систему уравнений:


Решив полученную систему уравнений при помощи надстройки «Поиск решения» приложения MS Excel, находим:

b0= 7,01310810173176

b1= 0,65439846490193

Составим уравнение парной линейной регрессии:

На его основе найдем расчетные значения результативного показателя, а также ряд остатков и остаточные суммы квадратов для первой группы:

Жилая площадь, х Цена кв, у

()2

16 13,5 256 216 17,477 -3,977 15,816529
17,7 22 313,29 389,4 18,5888 3,4112 11,636285
20 15,9 400 318 20,093 -4,193 17,581249
20 15,1 400 302 20,093 -4,993 24,930049
21,4 34,4 457,96 736,16 21,0086 13,3914 179,3296
28 21,1 784 590,8 25,325 -4,225 17,850625
31,1 28 967,21 870,8 27,3524 0,6476 0,4193858

154,2

150

3578,46

3423,16

176,0978

0,0622

267,5637

Рассчитаем аналогичные параметры для второй группы данных:

Жилая площадь, х Цена кв, у

()2

40,5 27 1640,25 1093,5 28,6765 -1,6765 2,81065225
45,9 27,2 2106,81 1248,48 31,9003 -4,7003 22,0928201
46,3 28,7 2143,69 1328,81 32,1391 -3,4391 11,8274088
47,5 28,3 2256,25 1344,25 32,8555 -4,5555 20,7525803
48,7 45 2371,69 2191,5 33,5719 11,4281 130,60147
65,8 51 4329,64 3355,8 43,7806 7,2194 52,1197364
87,2 52,3 7603,84 4560,56 56,5564 -4,2564 18,116941

381,9

259,5

22452,17

15122,9

259,480

0,0197

258,3216

Решив полученную систему уравнений

при помощи надстройки «Поиск решения» приложения MS Excel, находим:

b0= 4,49765806824428

b1= 0,59705785159018

Составим уравнение парной линейной регрессии:

По критерию Гольдфельда-Квандта найдем расчетное значение

 

(табличные значения критерия Фишера – в Приложении 5).

Поскольку <, то условие гомоскедастичности выполнено.

4)  Значения уровней ряда остатков независимы друг от друга. Проверку на отсутствие автокорреляции осуществим с помощью d-критерия Дарбина-Уотсона:

Поскольку d< d1 0,31<1,08 (табличные значения критерия – в Приложении 2), то гипотеза об отсутствии автокорреляции отвергается, и имеется значительная автокорреляция.

5)  Уровни ряда остатков распределены по нормальному закону. Проверку выполнения требования проведем по RS-критерию:

Для объема генеральной совокупности, равного 14, и уровня вероятности ошибки в 5 %, табличные значения нижней и верхней границ RS-критерия равны соответственно 2,92 и 4,09 (табличные значения критерия – в Приложении 3). Поскольку рассчитанное значение критерия не попадает в интервал табличных значений, гипотеза о нормальном распределении отвергается.

Оценим качество построенной модели с точки зрения точности. Для этого используем среднюю относительную ошибку аппроксимации, рассчитав данные для графы 11 вспомогательной таблицы (Приложение 1).

В среднем смоделированные значения стоимости квартир отклоняются от фактических на 19,8 %. Подбор модели к фактическим данным можно оценить как не очень точный, отклонения фактических значений от теоретических заметные.


Информация о работе «Линейный множественный регрессивный анализ»
Раздел: Экономико-математическое моделирование
Количество знаков с пробелами: 47795
Количество таблиц: 19
Количество изображений: 14

Похожие работы

Скачать
48813
19
4

... , что найденный вариант является наилучшим. В современных условиях даже не значительные ошибки могут привести к огромным потерям. В связи с этим возникла необходимость привлечения к анализу и синтезу экономических систем оптимизационных экономико-математических методов и ЭВМ, что создает основу для принятия научно обоснованных решений. Такие методы объединяют в одну группу под общим названием « ...

Скачать
181126
20
0

... -   Социальное развитие – 107,3 тыс. грн. -   Материальное поощрение – 422,8 тыс. грн. -   Другие цели – 51,4 тыс. грн. Вывод Анализ хозяйственной деятельности института позволяет сделать следующие выводы: Институт ЮжНИИгипрогаз является акционерным обществом открытого типа уставный фонд которого сформирован за счет выпуска акций суммарной номинальной стоимостью 1628,7 тыс. грн.; Институт ...

Скачать
47467
13
4

... до 30,4 ц. Значение стандартной ошибки апраксимаци значительно, поэтому прогноз будет носить условный характер. Заключение Статистико-экономический анализ удоя молока от одной коровы по 30 хозяйствам подтвердил сложную экономическую ситуацию, сложившуюся в России в молочном животноводстве. Низкая продуктивность животных, большие затраты на средства производства, топлива и энергию приводят к ...

Скачать
47013
16
13

... между варьирующими признаками, определению неизвестных причинных связей и оценке факторов оказывающих наибольшее влияние на результативный признак. Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значении зависимой переменной. Решение названных задач опирается на соответствующие приемы, ...

0 комментариев


Наверх