4. Анализ данных и интерпретация

Для начала я проанализирую распределения тех переменных, которые я планирую использовать в регрессионных моделях. Это доход, число членов семьи, число источников дохода, городская/сельская местность, а также – показатели владения товарами длительного пользования.

Распределение домохозяйств по доходу

Число домохозяйств Минимальный доход, руб. Максимальный доход, руб. Средний доход, руб. Медиана дохода, руб. Ст. откл. дохода, руб.
4711 0 706964 10005 6400 22237

Графа «число домохозяйств» показывает, сколько домохозяйств согласились раскрыть свои доходы. Медиана меньше среднего, это означает, что на среднее значение дохода сильно повлияли семьи с большими доходами, резко отличающимися от доходов основной массы опрошенных.

Минимальный и максимальный (и даже средний) доходы еще далеко не все говорят о распределении переменной, поэтому лучшее представление о распределение дохода дает понять гистограмма распределения дохода.



 Гистограмма распределения респондентов по доходу

Поскольку имеется незначительное число больших доходов, гистограмма не очень удачная получилась. Рассмотрим лучше квартили распределения дохода, которые скажут, с какой величины начинаются 25% минимальных доходов, медиану и с какой величины начинаются 25% самых крупных. Вот они:

Квартили распределения дохода I II III
3100 6400 12000

 

Как видно, 50% срединных из всех наблюдаемых доходов находится в пределах от 3100 до 12000 руб.

Далее надо посмотреть, какие ТДП вообще есть в домохозяйствах. Вот их встречаемость:


Встречаемость наличия ТДП

Вид ТДП

Количество семей

% от общего числа семей

Холодильник 4433 94,1
Отдельная морозильная камера 325 6,9
Стиральная машина 3800 80,7
ч/б телевизор 584 12,4
цв. телевизор 4180 88,7
Видеомагнитофон/видеоплеер 2225 47,2
Компьютер 823 17,5
Легковой автомобиль 1322 28,3
Грузовой автомобиль 89 1,9
Мотоцикл, мотороллер, моторная лодка 180 3,8
Трактор/ минитрактор 61 1,3
Дача, другой дом, часть дома, садовый домик 995 21,1
Другая квартира / часть квартиры 271 5,8

Как видно, наиболее распространенным ТДП из данного перечня является холодильник (он есть почтив каждом домохозяйстве), а наименее распространенными следует признать тракторы, грузовые автомобили, мотоциклы и мотороллеры. Суммарный процент, естественно, превосходит 100%, поскольку одно и то же домохозяйство может владеть несколькими ТДП одновременно. Эти цифры, в принципе, соответствуют тем, что предоставляет Госкомстат России, говоря об обеспеченности домашних хозяйств товарами длительного пользования. Но они рассчитывают обеспеченность в количестве единиц на 100 домохозяйств, поэтому представление данных немного другое. Например, в 2004 году на 100 домохозяйств в РФ приходилось: телевизоров – 135 шт., видеомагнитофонов/камер: 62 шт., персональных компьютеров: 28 шт., холодильников/морозильников: 114 шт., стиральных машин: 94 шт.

В модель также будет включена переменная, которая показывает, в каком типе населенного пункта проживает домохозяйство, т.к. как правило, в больших развитых городах, уровень благосостояния домохозяйств, проживающих там, значительно выше, что в свою очередь влияет на наличие ТПД в этих домохозяйствах.

 

Распределение по типу населенного пункта, в котором проживает домохозяйство

  Частота Процент
Областной центр 2017 42,8
  Город 1249 26,5
  ПГТ 292 6,2
Село 1153 24,5
Всего 4711 100

Переменная типа населенного пункта где проживает домохозяйство, будет представлена в модели дихотомизированной, с двумя значениями - город (код 1, 69,3% опрошенных домохозяйств) и соответственно населенный пункт сельского типа (код 0, 30,7% опрошенных). Это нужно для того, чтобы включить данную качественную переменную в количественный анализ, т.е в регрессионную модель. Коэффициент перед данной переменной в модели будет показывать, как влияет проживание в городе на наличие ТДП.

Распределение по числу членов домохозяйства таково. Примерно 19% домохозяйств состоят из 1 человека, еще почти 28% - из 2-х человек, еще столько же – из 3-х, еще 16,5% - из 4-х. Все прочие (более крупные) домохозяйства дают, в целом, 10%.

Наконец, в модели будет присутствовать переменная, характеризующая число источников дохода. Минимальное значение данной переменной: 0, максимальное – 8. В среднем российское домохозяйство имеет 2,4 источника дохода из тех, что были представлены в анкете RLMS. Стандартное отклонение: 1,2. Если говорить в процентах, то не имеют источников дохода, примерно, 1,5% домохозяйств, 1 источник имеют 24,6%, 2 – 32%, 3 – 24,7%. Это наиболее распространенные показатели. Большее число источников имеют, в целом, не более 17% домохозяйств.

Чтобы посмотреть как влияют рассмотренные переменные на владение товарами длительного пользования, необходим показатель, который бы вобрал в себя эту информацию. В данном эссе я предлагаю 3 варианта вычисления такого показателя на основе сведений, которые имеются в анкете.

Первый вариант расчета показателя самый сложный. Допустим, у нас есть сведения о 13 ТДП (см. выше). Известно, есть тот или иной товар в семье, или нет, а также – известно, сколько лет этому товару. Мне кажется, имеет смысл не только подсчитывать суммарный индекс как число товаров, которое есть в домохозяйстве, но и попытаться учесть разную стоимость этих товаров и разный срок их службы. В самом деле, автомобиль, выпущенный в середине 1990-х гг и автомобиль, выпущенный в прошлом году – не одно и то же. Чтобы получить итоговый показатель, я суммирую следующие произведения отдельно по каждому виду ТДП:

«есть (1) или нет (0) товар в домохозяйстве» * «вес товара» *
максимум из «0 и разности (10 – возраст товара)».

С первой частью ясно. Если товар есть, мы ставим вместо этой части 1, если нет – 0. Вес товара определяем так, что дополнительная квартира имеет вес, равный 1, автомобиль – вес, равный 0,1, компьютер – вес, равный 0,04 и т.д. Веса я сама предложила, исходя из примерного соотношения стоимостей этих ТДП. Таким образом, иметь, Например, компьютер и автомобиль – не одно и то же, что иметь дополнительную квартиру, в общем случае. Последняя составляющая нужна для того, чтобы учесть возраст товара, и приписать больший вес товарам, которые много моложе 10 лет. Если же товар 10 лет и старше, то разность может быть меньше нуля. И чтобы не делать индекс отрицательным, мы выбираем максимум из 0 и возможного отрицательного значения, то есть, зануляем слагаемое для данного товара. Так мы складываем эти результаты по всем товарам.

Мне кажется, это довольно трезвый способ расчета индекса обеспеченности ТДП, полностью учитывающий всю информацию о них, которая есть в анкете. Максимум этот индекс приобретает в том случае, если семья обеспечена всеми товарами, но в первую очередь – самыми дорогостоящими, и к тому же, если эти товары относительно новые.

Еще 2 варианта расчета показателя я предложила, честно говоря, после того, как эксперименты с первым показателем обнаружили не очень хорошую объясняющую способность регрессионных моделей.

Второй вариант заключается в том, что веса товаров принимаются за единицу (или не учитываются), но возраст продолжает учитываться. Т.е. мы изымаем вторую часть формулы, представленной выше.

Третий, самый простой способ расчета этого показателя заключается в том, все веса принимаются за единицу, а возраст товара не учитывается. Т.е. это просто – число товаров из списка вещей, которыми владеет семья.

Показатели называются indexTDP1, indexTDP2 и indexTDP3, соответственно. Рассмотрим их распределения.

Описательная статистика показателей обеспеченности ТДП

  N Minimum Maximum Mean Std. Deviation
indexTDP1 4711 .00 11.84 .6333 1.01381
indexTDP2 4711 .00 63.00 13.2815 11.65379
indexTDP3 4711 .00 10.00 4.0964 1.64273

Есть семьи, где рассчитанный показатель наличия ТДП равен нулю, это говорит о том, что у этих домохозяйств вовсе отсутствуют перечисленные товары, либо они довольно старые (либо они просто не аккуратно ответили на данный вопрос анкеты).

Гистограммы распределения показателей следующие:

Как видно, для первого и второго показателей присутствует большая группа семей, для которых они равны 0 (или около того). Это происходит, скорее всего, потому, что вещи есть, но они достаточно старые (старше 9 лет), поэтому индексы их учитывают как будто бы их нет вовсе.

Наконец, для изучения зависимости между потреблением ТДП от дохода и других социально-экономических факторов строятся несколько регрессионных моделей.

Ниже отдельно для каждого из трех показателей приводится отдельная таблица, содержащая 3 или 4 модели. Первая модель всегда содержит только одну независимую переменную, вторая – две и так далее. Такое представление результатов позволяет показать, как добавление последующей объясняющей переменной отражается на качестве модели. Для добавления переменных в модель был использован алгоритм Stepwise программы SPSS. Значки Sig. показывают значимость модели в целом и коэффициентов по отдельности. Считается, что если Sig. близок к 0, то модель значима, то есть, имеет смысл.

Рассмотрим модели с первым показателем. Качество моделей (хотя они и значимы) очень низкое. Так как показатель R2 близок к 0. То есть, независимые переменные (доход, число источников дохода и проч.) плохо объясняют изменения переменной индекса владения ТДП. Максимум – на 7%. В первую очередь программа включила в модель число членов семьи, затем – двоичную переменную город/село, затем – суммарный доход и, наконец, число источников дохода. Интерпретация для 4-й модели, например, такая: каждый дополнительный член домохозяйства, при прочих равных условиях, увеличивает индекс потребления ТДП, в среднем, на 0,148 единиц. Иными словами, более крупные семьи, обычно, владеют большим набором ТДП. Что естественно. Аналогично, если домохозяйство из городской среды, то нужно увеличить прогноз индекса на 0,269. Каждый доп. рубль суммарного дохода домохозяйства увеличивает индекс на 0,00000514 единиц. А вот чем больше источников дохода, тем меньше как бы становится индекс. В части выводов причина этого обсуждается.


Регрессионные модели потребления ТДП (первый вариант)

Модель №

1

2

3

4

Константа

0,223
(Sig.=0,000)

0,013
(Sig.=0,741)

0,016
(Sig.=0,688)

0,077
(Sig.=0,074)

Число членов семьи

0,148
(Sig.=0,000)

0,154
(Sig.=0,000)

0,140
(Sig.=0,000)

0,148
(Sig.=0,000)

Городская местность проживания

0,279
(Sig.=0,000)

0,254
(Sig.=0,000)

0,269
(Sig.=0,000)

Суммарный доход домохозяйства за последние 30 дней

5,10Е-006
(Sig.=0,000)

5,14Е-006
(Sig.=0,000)

Число источников дохода за последнее время

–0,039
(Sig.=0,001)

0,043

0,059

0,071

0,073

Значимость модели (Sig.)

0,000

0,000

0,000

0,000

Модель с использованием второго варианта индекса (без учета весов ТДП) кажется более удачной. Но и здесь объясняющая способность не превышает 16% для 4-х объясняющих переменных. Суть коэффициентов остается той же. Но они теперь чуть-чуть побольше, поскольку второй индекс имеет больший масштаб изменений.

Регрессионные модели потребления ТДП (второй вариант)

Модель №

1

2

3

4

Константа

5,969
(Sig.=0,000)

2,623
(Sig.=0,000)

2,662
(Sig.=0,000)

3,574
(Sig.=0,000)

Число членов семьи

2,629
(Sig.=0,000)

2,725
(Sig.=0,000)

2,533
(Sig.=0,000)

2,639
(Sig.=0,000)

Городская местность проживания

4,443
(Sig.=0,000)

4,087
(Sig.=0,000)

4,314
(Sig.=0,000)

Суммарный доход домохозяйства за последние 30 дней

7,41Е-005
(Sig.=0,000)

7,46Е-005
(Sig.=0,000)

Число источников дохода за последнее время

–0,572
(Sig.=0,000)

0,103

0,133

0,153

0,156

Значимость модели (Sig.)

0,000

0,000

0,000

0,000

Третий вариант индекса наилучшим образом подходит для моделирования (см. табл. ниже). Но и здесь 3-я модель объясняет лишь 18,7% колеблемости индекса. Число источников дохода здесь включать было излишне и SPSS не включил.

Регрессионные модели потребления ТДП (третий вариант)

Модель №

1

2

3

Константа

2,966
(Sig.=0,000)

2,412
(Sig.=0,000)

2,418
(Sig.=0,000)

Число членов семьи

0,407
(Sig.=0,000)

0,422
(Sig.=0,000)

0,394
(Sig.=0,000)

Городская местность проживания

0,735
(Sig.=0,000)

0,683
(Sig.=0,000)

Суммарный доход домохозяйства за последние 30 дней

1,09Е-005
(Sig.=0,000)

0,124

0,1166

0,187

Значимость модели (Sig.)

0,000

0,000

0,000

Итак, поставленная цель была достигнута. Регрессионные модели построены. Они не очень хорошо объясняют все три варианта индекса, видимо, потому, что все-таки наличи в домохозяйстве ТДП объясняется, в основном, не этими переменными, а теми, что я не учла в анализе.

В следующем разделе обсуждаются некоторые выводы, которые можно из всего этого сделать.



Информация о работе «Факторы обеспеченности российских домохозяйств товарами длительного пользования»
Раздел: Социология
Количество знаков с пробелами: 35182
Количество таблиц: 9
Количество изображений: 4

Похожие работы

Скачать
50995
9
3

... статистики, определяющий соотношение в расходах населения на покупку товаров и услуг и на сбережения; • статистика деятельности предприятий и хозяйств, участвующих в формировании и использовании продовольственных ресурсов. На ее базе строятся балансы продовольственных ресурсов, определяется фонд потребления населением основных продуктов питания, и рассчитываются натуральные среднедушевые ...

Скачать
274954
11
7

... перестройки еще неустоявшихся социально-экономических отношений в нашем обществе. Поэтому по примеру США в условиях рыночной экономики Российское государство должно принять на себя общую социально-экономическую ответственность за комплексную систему социального обеспечения населения в общенациональном масштабе, которую сам по себе рынок создать не в состоянии. Общая социально-экономическая ...

Скачать
187188
9
6

... социальная политика области на этапе стабилизации и перехода к экономическому росту существенно будет зависеть от политики, проводимой Правительством Российской Федерации в соответствии с общим ходом экономических реформ. 3.2 Проблемы и перспективы повышения уровня и качества жизни населения России Анализ показывает, что главные проблемы социально сферы России в настоящее время связаны с ...

Скачать
76337
15
21

... 2002г. 2003г. 2004г. 2005г. За 9 мес. 2006г. всего совокупных расходов, грн 541,3 607,0 658,3 736,8 903,5 1229,4 1428,3 Процентов потребительские совокупные расходы 93,3 93,7 92,8 93,3 92,6 91,1 90,5 продовольственные товары (включая питание вне дома, алкогольные напитки и табачные изделия) 67,9 65,4 62,8 62,7 61,7 61,0 58,1 ...

0 комментариев


Наверх