S.E. of regression 498.9476 Akaike info criterion 12.43020
Sum squared resid 5.23E+08 Schwarz criterion 12.45965
Log likelihood -16112.09 F-statistic 86.15859
Durbin-Watson stat 1.538076 Prob(F-statistic) 0.000000
Таблица 4
Условные обозначения, используемые в работе. Наличие | Площадь участка | Расстояние от МКАД | Цена предложения | Совместное влияние | Направление | ||||||||||
Электричества | Водопровода | Магистрального газа | Канализации | Телефона | Дороги с твердым покрытием | Леса | Водоема | Электричество + водопровод | Электричество + газ | Электричество + водопровод + газ | Электричество + водопровод + газ + дорога | ||||
EL | WAT | GAS | WC | TEL | ROAD | FOREST | RIVER | SQU | MKAD | PRICE | EW | EG | EWG | EWGR | Все данные |
SER1 | SER2 | SER3 | SER4 | SER5 | SER6 | SER7 | SER8 | SER9 | SER10 | SER11 | SER12 | SER13 | SER14 | SER15 | Белорусское (BEL) |
SER16 | SER17 | SER18 | SER19 | SER20 | SER21 | SER22 | SER23 | SER24 | SER25 | SER26 | SER27 | SER28 | SER29 | SER30 | Ярославское (YAR) |
SER31 | SER32 | SER33 | SER34 | SER35 | SER36 | SER37 | SER38 | SER39 | SER40 | SER41 | SER42 | SER43 | SER44 | SER45 | Казанское (KAZ) |
SER46 | SER47 | SER48 | SER49 | SER50 | SER51 | SER52 | SER53 | SER54 | SER55 | SER56 | SER57 | SER58 | SER59 | SER60 | Киевское (KIEV) |
SER61 | SER62 | SER63 | SER64 | SER65 | SER66 | SER67 | SER68 | SER69 | SER70 | SER71 | SER72 | SER73 | SER74 | SER75 | Курское (KUR) |
SER76 | SER77 | SER78 | SER79 | SER80 | SER81 | SER82 | SER83 | SER84 | SER85 | SER86 | SER87 | SER88 | SER89 | SER90 | Ленинградское (LEN) |
SER91 | SER92 | SER93 | SER94 | SER95 | SER96 | SER97 | SER98 | SER99 | SER100 | SER101 | SER102 | SER103 | SER104 | SER105 | Горьковское (GOR) |
SER106 | SER107 | SER108 | SER109 | SER110 | SER111 | SER112 | SER113 | SER114 | SER115 | SER116 | SER117 | SER118 | SER119 | SER120 | Павелецкое (PAV) |
SER121 | SER122 | SER123 | SER124 | SER125 | SER126 | SER127 | SER128 | SER129 | SER130 | SER131 | SER132 | SER133 | SER134 | SER135 | Рижское (RIZH) |
SER136 | SER137 | SER138 | SER139 | SER140 | SER141 | SER142 | SER143 | SER144 | SER145 | SER146 | SER147 | SER148 | SER149 | SER150 | Рязанское (RYAZ) |
SER151 | SER152 | SER153 | SER154 | SER155 | SER156 | SER157 | SER158 | SER159 | SER160 | SER161 | SER162 | SER163 | SER164 | SER165 | Савеловское (SAV) |
Коэффициент детерминации (R2) представляет собой процент дисперсии цен предложения, объясняемый регрессионной моделью (R2=RSS/TSS). Использование R2 имеет два недостатка. Во-первых, при добавлении в регрессионную модель новых переменных R2 либо увеличивается, либо остается неизменным, что может привести к завышению критерия согласия, если в уравнение введены несущественные переменные или когда число переменных велико по сравнению с количеством рассматриваемых продаж. R2 может принимать значения в интервале от 0 до 1, чем ближе R2 к 1, тем лучше качество подгонки. Первый недостаток можно учесть, скорректировав величину R2 по числу независимых переменных, в результате получим величину приведенного R2 (Adjusted R2),
n – объем выборки, k – число регрессоров.
Второй недостаток R2 (присущий также приведенному R2) относится больше к вопросу осторожности при интерпретации. R2 является мерой той части дисперсии цен, которая объясняется регрессионной моделью. В массовой оценке мы часто расслаиваем множество объектов недвижимости на однородные страты и в рамках каждой страты рассчитываем отдельные уравнения. Поскольку эта процедура уменьшает дисперсию цен внутри каждой страты, не следует ожидать, что в этом случае МРА объяснит такой же большой процент отклонений, как и при использовании единого уравнения для аппроксимации продаж во всей юрисдикции. Например, значения R2=0,8, 0,85 и 0,9 для трех отдельных направлений могут соответствовать регрессионным моделям с лучшей предикативной способностью (что видно по величине ) по сравнению с единой моделью для трех направлений, для которой R2 может быть равен, скажем, 0.95. В нашей регрессии R2=0.29, что говорит о слабой объяснительной силе модели.
Критерий Стъюдента показывает меру значимости (или весомости) переменной регрессии для объяснения различий в величине зависимой переменной. Она вычисляется как отношение коэффициента регрессии к его среднеквадратичной ошибке. При достаточно большом объеме выборки (не менее 50 объектов) значения t-статистики, превышающие 1.98, указывают на то, что с вероятностью 0.95 соответствующий коэффициент Аj0 и, следовательно, Xj является значимой переменной при прогнозировании V. Из анализа t-статистик видно, что коэффициенты при EL, TEL, ROAD, FOREST, RIVER, SQU незначимы на 95%-доверительном интервале. Таким образом, переменные, показывающие наличие электричества, телефона, дороги, леса, водоема, а также площадь участка являлись не существенными при прогнозе в этой модели.
Коэффициент при MKAD равный –5.9, означает, что увеличение расстояния от Москвы на 1%, уменьшает цену на 0.51%. Иначе говоря, эластичность цены земельного участка по расстоянию от МКАД равна –0.51. Это значение вычисляется по следующей формуле , где и – выборочные средние величины, соответственно, объясняющей переменной МKAD и результирующего показателя PRICE.
Положительные коэффициенты при WAT, GAS, WC говорят о том, что цена земельного участка возрастает при возможном наличии на территории участка водопровода, магистрального газа и канализации.
Критерий Фишера (F-статистика) связан с критерием Стъюдента и также используется для определения того, является ли та или иная переменная регрессии значимой при прогнозировании зависимой переменной. F-статистика вычисляется по отношению: Дополнительная дисперсия, обусловленная Хn / Необъяснимая регрессия. Как и в случае критерия Стъюдента, критерий Фишера является мерой предельной весомости отдельной переменной при определении величины зависимой переменной, с учетом влияния и всех других переменных (за счет включения их в уравнение регрессии). В общем, случае при достаточно большом объеме выборки F-статистика, превышающая 4,0, указывает на то, что переменная значима при прогнозировании P с достоверностью 95%. В нашем примере значения F-статистики значительно превышают табличные, что свидетельствует о существовании очевидной связи между PRICE и факторами, влияющими на цену (EL, WAT, … , MKAD).
Имеющаяся база данных была исследована по 11 вышеуказанным направлениям для которых были построены такие же регрессии. R2 построенных регрессий колеблется в пределах 0.3-0.4, что говорит о слабой объяснительной силе построенных моделей. Аномально низкие значения R2 получены для Курского, Ленинградского, Горьковского и Павелецкого направлений, интересно заметить, что по этим направлениям были получены наиболее низкие величины стандартных отклонений. Анализ t-статистик показал, что лишь одна переменная значима для всех направлений – это расстояние от МКАД. В 6 регрессиях из 11 значимым было наличие магистрального газа, в 4 из 11 значимыми были площадь участка и наличие канализации. Коэффициент при переменной площади участка имел, как правило, положительный знак (хороший пример – Киевское и Ярославское направления), что соответствует, в принципе, общей тенденции, характерной для США (Д.Фридман, Н.Ордуэй, 1997): чем больше участок – тем выше его цена единицы его площади (неслучайно покупка крупных земельных владений происходит одним заинтересованным физическим лицом, используя несколько юридических). Для России, вероятно, может наблюдаться и другая тенденция: выгода от конкретной сделки важнее всего, поэтому желание продать большой участок земли и быстрее получить денежное вознаграждение за совершенную сделку пересиливает желание заработать больше за счет продажи участка по частям. Кроме того, в России еще не так высок платежеспособный спрос на крупные земельные участки, а оценка потенциальной стоимости земли (даже для Московской области) еще достаточно низка у российских покупателей: земли у нас в стране много, поэтому, зачем ее скупать, вкладывать в нее деньги.
Рассмотрим влияние остальных факторов. Важность канализации в пределах участка говорит видимо о нежелании российских покупателей рыть выгребные ямы или о высоких ценах на биотуалеты. Интересно заметить, что незначимыми почти для всех регрессий оказались такие на первый взгляд важные параметры как наличие подъездной дороги, телефона, леса, водоема. Отсутствие телефона, леса и водоема легко объяснить: стационарная телефонная связь легко может быть заменена на мобильную (благо цены на рынке мобильной связи постоянно снижаются, а издержки на установку стационарного телефона достаточно велики); отсутствие влияния леса и водоема говорит либо о неправильно установленном расстоянии при сборе информации (в базе данных отсутствием считалось расстояние до леса или водоема порядка 1,5км), либо способностью людей добраться до ближайшего леса или водоема пешком или на автомобиле (большая часть людей, покупающих участки под ИЖС наверняка обладают доходом выше среднего и имеют автомобили) без потери полезности. Незначимость подъездной дороги объясняется скорее всего тем, что в Московской области все-таки сложно найти место, где нельзя проехать на автомобиле и наличие дороги с твердым покрытием – не такой уж важный фактор. Незначимость электричества мы можем объяснить следующим образом: при покупке участка, газ - наиболее важный фактор, ведь его наличие – это тепло и возможность приготовления пищи, электричество нужно лишь для света. Издержки на проведение газа гораздо выше при покупке земли по сравнению с издержками на подведение электричества, поэтому покупатель интересуется в первую очередь наличием газа и на обещание продавца провести электричество в ближайшем будущем покупатель соглашается, если предлагать наоборот – сделка скорее всего не состоится.
С целью улучшения качества модели автором был произведен пошаговый регрессионный анализ данных. Одним из преимуществ пошагового МРА является то, что он дает аналитику возможность сравнивать результаты, получаемые на каждом шаге. В прямом пошаговом МРА первая вводимая переменная, например Х1, является переменной, которая сильнее всего коррелирует с Р. Проводится регрессионный анализ суммы наименьших квадратов Р по Х1. Затем осуществляется поиск с целью нахождения переменной, корреляция которой с остаточной ошибкой будет теперь максимальной. Предположим, что это переменная Х4. Далее проводится регрессионный анализ Х1 и Х4 в качестве независимых переменных. Осуществляется поиск переменной для нахождения наиболее сильно коррелирующего с остаточной ошибкой второй регрессии. Эта переменная, скажем, Х6, включается затем в третью регрессию. Процесс продолжается до тех пор, пока не будет исчерпан весь набор переменных. При этом не включенными останутся те переменные, t и F-статистики которых будут ниже некоторого заранее определенного уровня значимости. На каждом шаге алгоритм может либо добавить новую переменную, либо исключить переменную, которая оказывается ниже установленного уровня значимости. Алгоритм предотвращает усложнение модели сверх необходимости путем отсеивания избыточных и несущественных переменных. Переменные TEL, ROAD, RIVER, FOREST были исключены из анализа в связи с их явной незначимостью определенной в таблице 5. Полученные результаты приведены в таблице 6, 7, 8.
Таблица 6Результаты оценивания при пошаговом МРА для всех участков Московской области.
Model Summary
Model | R Square | Adjusted R Square | Std. Error of the Estimate | Change Statistics | Durbin-Watson | |
R Square Change | F Change | |||||
1 | .198 | .198 | 529.4785 | .198 | 520.778 | |
2 | .261 | .260 | 508.3659 | .063 | 179.897 | |
3 | .283 | .282 | 500.8367 | .022 | 64.887 | |
4 | .286 | .285 | 499.8362 | .003 | 9.447 | 1.522 |
a Predictors: (Constant), MKAD
b Predictors: (Constant), MKAD, GAS
c Predictors: (Constant), MKAD, GAS, WC
d Predictors: (Constant), MKAD, GAS, WC, WAT
e Dependent Variable: PRICE
Таблица 7
Коэффициенты, полученные при пошаговом МРА для всех участков Московской области.
Coefficients
Model | Independent | Coefficients | Std. Error | t-статистика |
Variable | ||||
1 | (Constant) | 886.466 | 19.603 | 45.222 |
MKAD | -8.007 | .351 | -22.821 | |
2 | (Constant) | 693.169 | 23.705 | 29.242 |
MKAD | -6.127 | .365 | -16.794 | |
GAS | 346.686 | 25.848 | 13.413 | |
3 | (Constant) | 678.709 | 23.423 | 28.976 |
MKAD | -5.930 | .360 | -16.458 | |
GAS | 311.421 | 25.839 | 12.053 | |
WC | 506.187 | 62.839 | 8.055 | |
4 | (Constant) | 655.821 | 24.533 | 26.732 |
MKAD | -5.978 | .360 | -16.610 | |
GAS | 287.669 | 26.920 | 10.686 | |
WC | 493.690 | 62.845 | 7.856 | |
WAT | 70.648 | 22.985 | 3.074 |
a Dependent Variable: PRICE
Таблица 8
Корреляционная матрица, полученные при пошаговом МРА для всех участков Московской области.
Coefficient Correlations
Model | MKAD | GAS | WC | WAT | |
1 | MKAD | 1.000 | |||
2 | MKAD | 1.000 | .384 | ||
GAS | .384 | 1.000 | |||
3 | MKAD | 1.000 | .366 | .068 | |
GAS | .366 | 1.000 | -.169 | ||
WC | .068 | -.169 | 1.000 | ||
4 | MKAD | 1.000 | .363 | .071 | -.044 |
GAS | .363 | 1.000 | -.143 | -.287 | |
WC | .071 | -.143 | 1.000 | -.065 | |
WAT | -.044 | -.287 | -.065 | 1.000 |
a Dependent Variable: PRICE
По результатам анализа лучшая из регрессий будет выглядеть следующим образом:
PRICE = 655.8 - 5.98*MKAD + 287.7*GAS + 493.7*WC + 70.6*WAT
Все коэффициенты значимы, но объяснительная сила модели все же невысока R2=0.29.
На следующем этапе была предпринята попытка построить мультипликативную модель МРА. Эта модель имеет следующий вид:
P = A0 * X1 A1* ... * XnAn, где (Х1 ... Хn) - характеристики объекта недвижимости, An - численные коэффициенты при переменных характеристиках объекта, показывающие вклад соответствующих характеристик в стоимость.
Эту модель можно калибровать, взяв натуральный логарифм от обеих частей уравнения: ln(P)= ln(A0)+A1*ln(X1)+…+An*ln(Xn).
Мультипликативные модели не требуют от разработчика заботиться о соблюдении условия аддитивности. Кроме того, когда цены продажи варьируют в широком диапазоне, логарифмирование позволяет нормализовать распределение, уравнивая, таким образом, веса, присваемые объектам. С другой стороны, мультипликативная структура модели делает невозможным введение в модель аддитивных соотношений.
Мультипликативная модель МРА для всех участков Московской области.
ln(PRICE) = 7.6643262 + 0.12213441*EL + 0.11659094*WAT + 0.35958211*GAS + 0.45370688*WC + 0.017970609*TEL - 0.020494465*ROAD + 0.0060355887*FOREST - 0.061245452*RIVER - 0.075985731*ln(SQU) - 0.56319586*ln(MKAD)
Модель можно привести к первоначальному виду, взяв экспоненту от обеих частей уравнения:
PRICE = 2131 * 1.13EL * 1.12WAT * 1.43GAS * 1.57WC * 1.02TEL * 0.98ROAD * 1.01FOREST * 0.94RIVER * SQU-0.08 * MKAD-0.56
Результаты представлены в таблице 9.
Таблица 9
Оценивание мультипликативной модели МРА для всех участков Московской области.
LS // Dependent Variable is ln(PRICE)
Sample(adjusted): 1 2112
Variable Coefficient Std. Error t-Statistic Prob.
C 7.664326 0.104975 73.01077 0.0000
EL 0.122134 0.044154 2.766099 0.0057
WAT 0.116591 0.038586 3.021593 0.0025
GAS 0.359582 0.046065 7.805986 0.0000
WC 0.453707 0.103441 4.386131 0.0000
TEL 0.017971 0.109060 0.164778 0.8691
ROAD -0.020494 0.038144 -0.537298 0.5911
FOREST 0.006036 0.038511 0.156725 0.8755
RIVER -0.061245 0.038488 -1.591274 0.1117
ln(SQU) -0.075986 0.032790 -2.317361 0.0206
ln(MKAD) -0.563196 0.019532 -28.83467 0.0000
R-squared 0.435339 Mean dependent var 5.765975
Adjusted R2
... при этом рыночная стоимость как база оценки, на основе которой могут определяться производные от неб вилы стоимости. Государственная кадастровая оценка сельскохозяйственных угодий (Государственная кадастровая оценка земель в субъеетах РФ на уровне земельного участка и муниципальных образований) осуществляется для получения по каждому земельному участку сельскохозяйственных земель комплекса ...
... данного документа. Путем генерализации (укрупнения) поквартальной оценки может быть сформирована схема территориально-экономического зонирования города или региона, используемая для целей, отличных от налогообложения, в первую очередь – для целей принятия крупномасштабных решений городского или регионального развития. Оценочная стоимость единичного земельного участка населенного пункта — это ...
... функционально-пространственного развития города, сформулирован методически обоснованный подход и предложена 10 перспективная модель кадастровой оценки земель в городском секторе экономики, способствующая развитию предпринимательства в сфере управления земельными отношениями. Результаты, выносимые на защиту. В ходе проведенных исследований получены и выносятся на защиту следующие результаты: ...
... многих странах (в том числе развитых) применение компьютеров в управлении городскими территориями, ведении кадастра, анализе рыночных тенденций в рамках города весьма ограничено. В связи с этим выделим причины, по которым автоматизация решения типовых задач управления региональной недвижимостью Тульской области, как, впрочем, и других городов России, представляется весьма разумной: все материалы ...
0 комментариев