3.3 Парная регрессия. Вероятностная природа регрессионных моделей.

Если рассмотреть задачу анализа расходов на питание в группах с одинаковыми доходами, например в $10.000(x), то это детерминированная величина. А вот Y - доля этих денег, затрачиваемая на питание - случайна и может меняться от года к году. Поэтому для каждого i-го индивида:

где εi- случайная ошибка;

 α и β - константы (теоретически), хотя могут меняться от модели к модели.

Предпосылки для парной регрессии:

- X и Y связаны линейно;

- Х - неслучайная переменная с фиксированными значениями;

- ε - ошибки нормально распределены N(0,σ2);

- ;

- .

На рисунке 3.1 представлена модель парной регрессии.

Рисунок 3.1 – Модель парной регрессии

Эти предпосылки описывают классическую линейную регрессионную модель.

Если ошибка имеет ненулевое среднее, исходная модель будет эквивалентна новой модели и другим свободным членом, но с нулевым средним для ошибки.

Если выполняются предпосылки, то МНК оценки  и  являются эффективными линейными несмещенными оценками

Если обозначить:

то что математическое ожидание и дисперсии коэффициентов  и  будут следующие:

Ковариация коэффициентов:

Если  то и  распределены тоже нормально:

Отсюда следует, что:

- Вариация β полностью определяется вариацией ε;

- Чем выше дисперсия X - тем лучше оценка β.

Полная дисперсия определяется по формуле:

Дисперсия отклонений в таком виде - несмещенная оценка и называется стандартной ошибкой регрессии. N-2 - может быть интерпретировано как число степеней свободы.

Анализ отклонений от линии регрессии может представить полезную меру того, насколько оцененная регрессия отражает реальные данные. Хорошая регрессия та, которая объясняет значительную долю дисперсии Y и наоборот плохая регрессия не отслеживает большую часть колебаний исходных данных. Интуитивно ясно, что всякая дополнительная информация позволит улучшить модель, то есть уменьшить необъясненную долю вариации Y. Для анализа регрессионной модели проводят разложение дисперсии на составляющие, определяют коэффициент детерминации R2.

Отношение двух дисперсий распределено по F-распределению, т. е. если проверить на статистическую значимость отличия дисперсии модели от дисперсии остатков, можно сделать вывод о значимости R2.

Проверка гипотезы о равенстве дисперсий этих двух выборок:

Если гипотеза Н0 (о равенстве дисперсий нескольких выборок) верна, t имеет F-распределение с (m1,m2)=(n1-1,n2-1) степенями свободы.

Посчитав F – отношение как отношение двух дисперсий и сравнив его с табличным значением, можно сделать вывод о статистической значимости R2 /2/, /19/.

Заключение

Современные приложения дисперсионного анализа охватывают широкий круг задач экономики, биологии и техники и трактуются обычно в терминах статистической теории выявления систематических различий между результатами непосредственных измерений, выполненных при тех или иных меняющихся условиях.

Благодаря автоматизации дисперсионного анализа исследователь может проводить различные статистические исследования с применение ЭВМ, затрачивая при этом меньше времени и усилий на расчеты данных. В настоящее время существует множество пакетов прикладных программ, в которых реализован аппарат дисперсионного анализа. Наиболее распространенными являются такие программные продукты как:

- MS Excel;

- Statistica;

- Stadia;

- SPSS.

В современных статистических программных продуктах реализованы большинство статистических методов. С развитием алгоритмических языков программирования стало возможным создавать дополнительные блоки по обработке статистических данных.

Дисперсионный анализ является мощным современным статистическим методом обработки и анализа экспериментальных данных в психологии, биологии, медицине и других науках. Он очень тесно связан с конкретной методологией планирования и проведения экспериментальных исследований.

Дисперсионный анализ применяется во всех областях научных исследований, где необходимо проанализировать влияние различных факторов на исследуемую переменную.

Список литературы

1  Кремер Н.Ш. Теория вероятности и математическая статистика. М.: Юнити – Дана, 2002.-343с.

2  Гмурман В.Е.  Теория вероятностей и математическая статистика. – М.: Высшая школа, 2003.-523с.

3  www.sutd.ru

4  www.conf.mitme.ru

5  www.pedklin.ru

6  www.webcenter.ru

7  www.infections.ru

8  www.encycl.yandex.ru

9  www.infosport.ru

10 www.medtrust.ru

11 www.flax.net.ru

12 www.jdc.org.il

13 www.big.spb.ru

14 www.bizcom.ru

15 Гусев А.Н. Дисперсионный анализ в экспериментальной психологии. – М.: Учебно-методический коллектор «Психология», 2000.-136с.

16 www.gpss.ru

17 www.econometrics.exponenta.ru

18 www.optimizer.by.ru

19 www2.econ.msu.ru


Информация о работе «Дисперсионный анализ»
Раздел: Математика
Количество знаков с пробелами: 75320
Количество таблиц: 5
Количество изображений: 6

Похожие работы

Скачать
31285
14
4

... (от e) Общая m – число данных в строке (число повторов в ячейке), - число столбцов, - число строк. 3. Дисперсионный анализ в системе MINITAB Для проведения дисперсионного анализа в системе MINITAB необходимо выбрать из меню Stat > ANOVA. Различные возможности проведения дисперсионного анализа представлены следующими командами. ...

Скачать
25884
9
3

... отклика является смертность населения в конкретной возрастной группе, а факторами, влияющими на ее изменение, являются классы заболеваний. 2.2. Дисперсионный анализ Методом дисперсионного анализа, выясним, оказывает ли влияние различные заболевания на показатель смертности населения. То есть, проверим, выполняется ли гипотеза о равенстве математических ожиданий (Н0: М(Х1) = М(Х2) = … = ...

Скачать
35493
43
14

... товаров на рынок и объемом товарооборота предприятия торговли; Rxz = -0,96 корреляция расходами предприятия на рекламу и продвижение товаров на рынок и прибылью предприятия. Задача 2. Однофакторный дисперсионный анализ При уровне значимости a=0.05 определите статистическую достоверность влияния фактора А на динамику величины Х. № испытания A1 A2 A3 A4 1 2 2 6 7 ...

Скачать
68483
39
29

... можно предположить что при 5% уровне значимости ВАШСП не зависит от инфекции вызывающей реактивный артрит. В связи с тем что не один из показателей активности заболевания а также показатели ВАШ не зависят от инфекции предшествующей реактивному артриту дальнейшее разделение данных на группы можно считать не целесообразным.   2 Множественная линейная регрессия   Общее назначение множественной ...

0 комментариев


Наверх