2.4 Дисперсионный анализ.
Для оценки достоверности различий между тремя и более средними величинами целесообразно применить дисперсионный анализ. Модель дисперсионного анализа, используемая в работе - двухфакторный дисперсионный анализ со смешанным эффектом факторов и случайным распределением единиц неравной численности в группах. Данный метод позволяет оценить влияние группировочного признака (фактора) на изменение результативного признака.
Дисперсионный анализ, проводимый по критерию F Фишера, основан на законе сложения (разложения) дисперсий. Согласно этому закону общая дисперсия по всей совокупности единиц наблюдения при их группировке раскладывается на систематическую (межгрупповую) и остаточную (случайную) дисперсии. [17, c.130]
В разделе 2.2 построена комбинационная группировка по численности экономически активного населения, численности мужчин в трудоспособном возрасте и ВРП на душу населения по регионам России. На основе полученной группировки построим двухфакторную комбинационную группировку с целью оценки влияния факторов на занятость населения. Результаты группировки представлены в таблице 2.4.1.
Особенностями данной задачи являются: разный эффект факторов, положенных в основание группировки, разная численность групп. Первый фактор относится к факторам постоянного эффекта, поэтому фактическое значение критерия F определяется как отношение вариации по фактору к остаточной дисперсии, в то время как по второму фактору со случайным эффектом расчет фактического значения критерия проводим как отношение дисперсии по этому фактору к дисперсии взаимодействия факторов. Разная численность единиц в группах и подгруппах нарушает равенство между общей суммой квадратов отклонений и составляющими ее компонентами, поэтому расчет объемов вариаций имеет специфику. Рассмотрим последовательность работ поэтапно. В соответствии с общей схемой проверки статистических гипотез сначала следует выдвинуть нулевую и альтернативную гипотезы.
Нулевая гипотеза: между средними величинами в генеральных совокупностях нет достоверных различий, следовательно, факторы не оказывают существенного влияния на занятость населения: .
Альтернативная гипотеза: между средними величинами в генеральных совокупностях есть достоверные различия, следовательно, факторы оказывают существенное влияние на занятость населения: .
Таким образом, проверка гипотезы о равенстве групповых средних сводится к проверке различий найденных дисперсий. Поэтому этот метод называют дисперсионным анализом.
Определим фактическое значение критерия F- распределения.
Факторы и способы формирования выборок определили тип модели. В соответствии со схемой при этом типе модели общий объем вариации может быть представлен как сумма:
Wобщ = Wфакт А + Wфакт В + Wфакт АВ + Wост.
Расчет объемов вариаций проводим в два этапа:
- на первом этапе обеспечим разложение W0 = Wфакт + Wост,
- на втором этапе – разложение Wфакт = WВРП + Wэк.акт. + Wвзаим.
Рассчитаем объемы вариаций, предусмотренные первым этапом разложения:
Wост = Wобщ - Wфакт = 0,1614 – 0,1179 = 0,0435.
Рассчитаем объем вариаций, предусмотренные вторым этапом разложения, предварительно представив данные по отдельным факторам в таблице шахматной формы (табл. 2.4.2).
Таблица 2.4.2
Зависимость среднегодовой численности занятого населения от численности экономически активного населения и ВРП на душу населения
Группы регионов по уровню численности экономически активного населения в общей численности постоянного населения | Подгруппы регионов по ВРП на душу населения, руб. | Средняя | ||
29903,7-203345,07 | 203345,07-376786,44 | 376786,44-550227,81 | ||
1 | 0,2136 | 0,0000 | 0,0000 | 0,2136 |
2 | 0,4498 | 0,0000 | 0,0000 | 0,4498 |
3 | 0,4700 | 0,4981 | 0,5623 | 0,4795 |
В среднем | 0,4515 | 0,4981 | 0,5623 | 0,4579 |
Средние величины, отражая зависимость от внесения минеральных удобрений и качества почвы, испытывают также влияние неравномерности распределения единиц в группах. На средние по группам (подгруппам) оказывает влияние распределение единиц по этому фактору. Чтобы устранить это влияние, представим данные по группам (подгруппам) как единичные наблюдения и рассчитаем по ним средние простые (табл. 2.4.3).
Таблица 2.4.3
Зависимость среднегодовой численности занятого населения от численности экономически активного населения и ВРП на душу населения
(средние простые)
Группы регионов по уровню численности экономически активного населения в общей численности постоянного населения | Подгруппы регионов по ВРП на душу населения, руб. | Средняя | |||
29903,7-203345,07 | 203345,07-376786,44 | 376786,44-550227,81 | |||
1 | 0,2136 | 0,0000 | 0,0000 | 0,2136 | 0,0712 |
2 | 0,4498 | 0,0000 | 0,0000 | 0,4498 | 0,149933 |
3 | 0,4700 | 0,4981 | 0,5623 | 1,5304 | 0,510133 |
1,1334 | 0,4981 | 0,5623 | 2,1938 | - | |
В среднем | 0,3778 | 0,166033 | 0,187433 | - | 0,243756 |
Сопоставление таблиц 2.4.2 и 2.4.3 показывает, что данные в них различны. В таблице 2.4.2 исключено влияние неравномерности распределения и отражено влияние первого и второго факторов, а также их возможного взаимодействия. Общая сумма квадратов, отклонений урожайности, связанная с группировочным признаками, равна:
Wфакт = Wэк.акт. + WВРП + Wвзаим.
Полученные сумы квадратов отклонений первого этапа, а главное Wост, непосредственно несопоставимы с суммами квадратов отклонений второго этапа расчетов.
Для обеспечения сопоставимости следует вычислить Wост, скорректированную на среднюю численность единиц в группах. Средняя численность определяется по формуле средней гармонической:
Разделив Wост на среднюю численность, получаем скорректированную остаточную вариацию, которую следует использовать для анализа дисперсий: 0,0435 : 4,5315 = 0,0096.
Определим для каждого объема вариации число степеней свободы:
v0 = n - 1 = 24 – 1 = 23,vВРП = 3 – 1 = 2,
vф = mk - 1 = 3·3 - 1 = 8,vэк.акт. = 3 – 1 = 2,
vвзаим = v0 - vф = 23 – 8 = 15.
Определим дисперсии:
Фактическое значение критерия F-распределения по фактору А (численность экономически активного населения) равно:
Фактическое значение критерия F-распределения по фактору В (ВРП на душу населения) составит:
Фактическое значение критерия F-распределения по взаимодействию факторов А и В будет равно:
Fтабл найдем по таблице Фишера – Снедекора (приложение 9). Данные запишем в таблицу 2.4.4.
Таблица 2.4.4
Анализ дисперсий
Источник вариации | Объем вариации Wi | Число степеней свободы vi | Дисперсия | Отношение дисперсий | |
Fфакт | Fтабл | ||||
Численность экономически активного населения | 0,3286 | 2 | 0,1643 | 3,79 | 3,68 |
ВРП на душу населения | 0,0815 | 2 | 0,0408 | 15,27 | 3,68 |
Взаимодействие факторов | 0,0882 | 4 | 0,0221 | 2,05 | 3,06 |
Остаточная вариация | 0,0435 | 15 | 0,0108 | 1 | х |
Итого: | 0,5418 | 23 | х | х | х |
Из данной таблицы видно, что Fфакт (эк.акт.) > Fтабл, Fфакт (ВРП) > Fтабл, следовательно, есть основания отвергнуть нулевую гипотезу, т.е. с вероятностью 95 % можно утверждать, что численность экономически активного населения и ВРП на душу населения оказывают существенно влияние на занятость населения. Влияние же взаимодействия двух факторов не доказано.
... показателей эффективности использования фондов снизился на 9,5%; 14. Уровень рентабельности вырос на 0,6%; 15. норма рентабельности снизилась на 28,6%. Глава 3 Статистический анализ трудовых ресурсов 3.1 Статистический анализ и использование трудовых ресурсов в Райпо Трудовые ресурсы – это часть населения обоего пола в трудоспособном возрасте за вычетом неработающих, нетрудоспособных и ...
... существования общества. Статистика труда тесно связана с другими областями статистики: статистической производственных отраслей, системой национальных счетов, демографией статистической культуры, здравоохранения и другие. 2. Статистический анализ наличия, состава и использования трудовых ресурсов в хозяйстве 2.1 Монографическое описание хозяйства Сельскохозяйственный производственный ...
... , нормативная, проектная (сметная), прогнозируемая; по масштабам охватываемого объекта - цех, предприятие, группа предприятий, отрасль, промышленность и т.п. [9;162] 2. Статистико-экономический анализ себестоимости продукции 2.1. Характеристика структуры затрат на производство На основе группировки затрат по экономическим элементам можно охарактеризовать структуру себестоимости продукции ...
... сил (неолитическая, промышленная, научно-техническая) знаменуют качественные этапы повышения производительности труда. 1.2 Показатели производительности труда Статистика сельского хозяйства изучает уровень и динамику производительности труда. Выявляется и измеряется влияние важнейших природно-экономических факторов на уровень производительности труда. Для характеристики уровня и динамики ...
0 комментариев