8. Сделать выводы по полученным результатам.
Решение:
Для удобства вычислений в ходе решения будем достраивать исходную таблицу данных до вспомогательной (см. Приложение 1), округляя и занося в расчетную таблицу промежуточные результаты.
1. Построим поле корреляции:
Визуальный анализ полученного графика показывает, что точки поля корреляции располагаются вдоль некоторой воображаемой прямой линии, но не очень плотно, рассеиваясь около неё. Поэтому делаем предположение о линейном виде уравнения регрессии. Нельзя сказать, что прослеживается тесная зависимость, но заметно, что с увеличением размера жилой площади х наблюдается тенденция к увеличению стоимости квартир у. Можно предположить, что связь размера жилой площади и ее стоимости положительная, не очень тесная, и на цену квартир оказывают влияние и другие факторы (район места ее расположения, этаж, наличие коммуникаций, состояние квартиры и т.п.).
2. Построим в соответствии с выбранным линейным видом уравнение регрессии:
Чтобы определить параметры линейной модели с помощью метода наименьших квадратов, решим систему уравнений на основе исходных и расчетных данных:
Рассчитав на основе исходных данных необходимые значения (графы 3, 5 таблицы Приложения 1), получаем систему:
Решив полученную систему уравнений при помощи надстройки «Поиск решения» приложения MS Excel, находим:
b0 = 9,308595
b1 = 0,52076
Составим уравнение парной линейной регрессии:
В декартовой системе координат ХОУ на поле корреляции строим график линии регрессии по найденному уравнению (рис.1).
3. Для оценки влияния фактора на исследуемый показатель вычислим линейный коэффициент корреляции и коэффициент детерминации.
Используя надстройку приложения MS Excel «Пакет анализа» - инструмент «Корреляция», находим величину линейного коэффициента корреляции.
Столбец 1 | Столбец 2 | |
Столбец 1 | 1 | |
Столбец 2 | 0,8559571 | 1 |
По величине коэффициента корреляции , принадлежащей интервалу (0,7; 1), оценим качественную характеристику связи как сильную прямую.
Находим парный коэффициент детерминации:
Изменение У примерно на 74 % определяется вариацией фактора х, на 26 % - влиянием других факторов. То есть изменения величины стоимости жилой площади на 74% обусловлены колебаниями ее размеров, и на 26 % - колебаниями и изменениями других факторов и условий.
4. Оценим качество построенной модели
Производим расчеты данных для граф 6-10 вспомогательной таблицы (Приложение 1).
Оценим качество построенной модели с точки зрения адекватности. Для этого проверим выполнение следующих требований:
1) Уровни ряда остатков имеют случайный характер. Для проверки выполнения данного требования воспользуемся критерием поворотных точек (пиков).
-3,829 | -3,4095 | -4,145 | -4,629 | -2,797 | -4,7313 | -6,0229 | -5,7565 | -2,4402 | 3,4693 | 2,4879 | 10,3183 | 7,4092 | 13,9416 |
+ | - | + | + | - | - | + | - | + | + | + | + |
Число поворотных точек р = 8
Поскольку р > 5, требование считаем выполненным.
2) Математическое ожидание уровня ряда остатков равно нулю.
Поскольку полученное значение близко к 0, требование считаем выполненным.
3) Дисперсия каждого отклонения одинакова для всех х. Для проверки выполнения данного требования используем критерий Гольдфельда-Квандта. Исходные значения х расположим в возрастающем порядке:
Жилая площадь, х | Цена кв., у. |
16 | 13,5 |
17,7 | 22 |
20 | 15,9 |
20 | 15,1 |
21,4 | 34,4 |
28 | 21,1 |
31,1 | 28 |
40,5 | 27 |
45,9 | 27,2 |
46,3 | 28,7 |
47,5 | 28,3 |
48,7 | 45 |
65,8 | 51 |
87,2 | 52,3 |
Делим полученную таблицу на 2 равные части
Жилая площадь, х | Цена кв., у | Жилая площадь, х | Цена кв., у |
16 | 13,5 | 40,5 | 27 |
17,7 | 22 | 45,9 | 27,2 |
20 | 15,9 | 46,3 | 28,7 |
20 | 15, | 47,5 | 28,3 |
21,4 | 34,4 | 48,7 | 45 |
28 | 21,1 | 65,8 | 51 |
31,1 | 28 | 87,2 | 52,3 |
По каждой группе строим уравнение регрессии:
Жилая площадь, х | Цена кв., у | ||
16 | 13,5 | 256 | 216 |
17,7 | 22 | 313,29 | 389,4 |
20 | 15,9 | 400 | 318 |
20 | 15,1 | 400 | 302 |
21,4 | 34,4 | 457,96 | 736,16 |
28 | 21,1 | 784 | 590,8 |
31,1 | 28 | 967,21 | 870,8 |
154,2 | 150 | 3578,46 | 3423,16 |
Чтобы определить параметры линейной модели с помощью метода наименьших квадратов, решим систему уравнений:
Решив полученную систему уравнений при помощи надстройки «Поиск решения» приложения MS Excel, находим:
b0= 7,01310810173176
b1= 0,65439846490193
Составим уравнение парной линейной регрессии:
На его основе найдем расчетные значения результативного показателя, а также ряд остатков и остаточные суммы квадратов для первой группы:
Жилая площадь, х | Цена кв, у | ()2 | ||||
16 | 13,5 | 256 | 216 | 17,477 | -3,977 | 15,816529 |
17,7 | 22 | 313,29 | 389,4 | 18,5888 | 3,4112 | 11,636285 |
20 | 15,9 | 400 | 318 | 20,093 | -4,193 | 17,581249 |
20 | 15,1 | 400 | 302 | 20,093 | -4,993 | 24,930049 |
21,4 | 34,4 | 457,96 | 736,16 | 21,0086 | 13,3914 | 179,3296 |
28 | 21,1 | 784 | 590,8 | 25,325 | -4,225 | 17,850625 |
31,1 | 28 | 967,21 | 870,8 | 27,3524 | 0,6476 | 0,4193858 |
154,2 | 150 | 3578,46 | 3423,16 | 176,0978 | 0,0622 | 267,5637 |
Рассчитаем аналогичные параметры для второй группы данных:
Жилая площадь, х | Цена кв, у | ()2 | ||||
40,5 | 27 | 1640,25 | 1093,5 | 28,6765 | -1,6765 | 2,81065225 |
45,9 | 27,2 | 2106,81 | 1248,48 | 31,9003 | -4,7003 | 22,0928201 |
46,3 | 28,7 | 2143,69 | 1328,81 | 32,1391 | -3,4391 | 11,8274088 |
47,5 | 28,3 | 2256,25 | 1344,25 | 32,8555 | -4,5555 | 20,7525803 |
48,7 | 45 | 2371,69 | 2191,5 | 33,5719 | 11,4281 | 130,60147 |
65,8 | 51 | 4329,64 | 3355,8 | 43,7806 | 7,2194 | 52,1197364 |
87,2 | 52,3 | 7603,84 | 4560,56 | 56,5564 | -4,2564 | 18,116941 |
381,9 | 259,5 | 22452,17 | 15122,9 | 259,480 | 0,0197 | 258,3216 |
Решив полученную систему уравнений
при помощи надстройки «Поиск решения» приложения MS Excel, находим:
b0= 4,49765806824428
b1= 0,59705785159018
Составим уравнение парной линейной регрессии:
По критерию Гольдфельда-Квандта найдем расчетное значение
(табличные значения критерия Фишера – в Приложении 5).
Поскольку <, то условие гомоскедастичности выполнено.
4) Значения уровней ряда остатков независимы друг от друга. Проверку на отсутствие автокорреляции осуществим с помощью d-критерия Дарбина-Уотсона:
Поскольку d< d1 0,31<1,08 (табличные значения критерия – в Приложении 2), то гипотеза об отсутствии автокорреляции отвергается, и имеется значительная автокорреляция.
5) Уровни ряда остатков распределены по нормальному закону. Проверку выполнения требования проведем по RS-критерию:
Для объема генеральной совокупности, равного 14, и уровня вероятности ошибки в 5 %, табличные значения нижней и верхней границ RS-критерия равны соответственно 2,92 и 4,09 (табличные значения критерия – в Приложении 3). Поскольку рассчитанное значение критерия не попадает в интервал табличных значений, гипотеза о нормальном распределении отвергается.
Оценим качество построенной модели с точки зрения точности. Для этого используем среднюю относительную ошибку аппроксимации, рассчитав данные для графы 11 вспомогательной таблицы (Приложение 1).
В среднем смоделированные значения стоимости квартир отклоняются от фактических на 19,8 %. Подбор модели к фактическим данным можно оценить как не очень точный, отклонения фактических значений от теоретических заметные.
... , что найденный вариант является наилучшим. В современных условиях даже не значительные ошибки могут привести к огромным потерям. В связи с этим возникла необходимость привлечения к анализу и синтезу экономических систем оптимизационных экономико-математических методов и ЭВМ, что создает основу для принятия научно обоснованных решений. Такие методы объединяют в одну группу под общим названием « ...
... - Социальное развитие – 107,3 тыс. грн. - Материальное поощрение – 422,8 тыс. грн. - Другие цели – 51,4 тыс. грн. Вывод Анализ хозяйственной деятельности института позволяет сделать следующие выводы: Институт ЮжНИИгипрогаз является акционерным обществом открытого типа уставный фонд которого сформирован за счет выпуска акций суммарной номинальной стоимостью 1628,7 тыс. грн.; Институт ...
... до 30,4 ц. Значение стандартной ошибки апраксимаци значительно, поэтому прогноз будет носить условный характер. Заключение Статистико-экономический анализ удоя молока от одной коровы по 30 хозяйствам подтвердил сложную экономическую ситуацию, сложившуюся в России в молочном животноводстве. Низкая продуктивность животных, большие затраты на средства производства, топлива и энергию приводят к ...
... между варьирующими признаками, определению неизвестных причинных связей и оценке факторов оказывающих наибольшее влияние на результативный признак. Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значении зависимой переменной. Решение названных задач опирается на соответствующие приемы, ...
0 комментариев