2 Предварительный анализ исходных данных
Прежде чем применить к имеющимся у нас исходным данным метод регрессионного анализа, необходимо провести некоторый предварительный анализ имеющихся в нашем распоряжении выборок. Это позволит сделать выводы о качестве имеющихся в нашем распоряжении данных, а именно: о наличии или отсутствии тренда, нормальном законе распределения выборки, оценить некоторые статистические характеристики и т.д.
Для всех последующих расчетов примем уровень значимости 0.05, что соответствует 5% вероятности ошибки.
2.1 Исследование выборки по прибыли (Y).
Математическое ожидание (арифметическое среднее)
34,91761905.
Доверительный интервал для математического
ожидания (22,75083;47,08441).
Дисперсия (рассеивание) 714,402159.
Доверительный интервал для дисперсии (439,0531; 1564,384).
Средне квадратичное отклонение (от среднего) 26,72830258.
Медиана выборки 24,14.
Размах выборки 79,89.
Асимметрия (смещение от нормального распределения) 0,370221636.
Эксцесс выборки (отклонение от нормального распределения)
-1,551701276.
Коэффициент вариации (коэффициент представительности среднего) 77%.
Проверка статистической независимости выборки (проверка наличия тренда) методом критерия серий. Результаты проверки представлены в таблице 2.1 (2-й столбец). Сумма серий равняется 5. Поскольку данное значение попадает в доверительный интервал (табличные значения) от 5 до 15, следовательно, гипотеза о статистической независимости и отсутствии тренда подтверждается.
Проверка статистической независимости выборки (проверка наличия тренда) методом критерия инверсий. Количество инверсий представлено в таблице 2.1 (3-й столбец). Сумма инверсий равняется 81. Поскольку данное значение попадает в доверительный интервал (табличные значения) от 64 до 125, следовательно, гипотеза о статистической независимости и отсутствии тренда подтверждается.
Таблица 2.1 – Критерии серий и инверсий.
Прибыль Y % | Критерий серий | Критерий инверсий |
1,99 | - | 0 |
12,21 | - | 5 |
23,07 | - | 7 |
24,14 | + | 7 |
35,05 | + | 7 |
36,87 | + | 7 |
4,7 | - | 0 |
58,45 | + | 6 |
59,55 | + | 6 |
61,42 | + | 6 |
61,51 | + | 6 |
61,95 | + | 6 |
71,24 | + | 6 |
71,45 | + | 6 |
81,88 | + | 6 |
10,08 | - | 0 |
Продолжение таблицы 2.1
10,25 | - | 0 |
10,81 | - | 0 |
11,09 | - | 0 |
12,64 | - | 0 |
12,92 | - | 0 |
Итого | 5 | 81 |
Проверка гипотезы о нормальном законе распределения выборки с применением критерия . Разобьем выборку на интервалы группировки длиной 0,4*среднеквадратичное отклонение = 10,69132103. Получим следующее количество интервалов группировки размах/длина интервала=7.Все данные о границах интервалов, теоретических и эмпирических частотах приведены в таблице 2.2.
Таблица 2.2 – Критерий .
Интервалы группировки | Теоретическая частота | Расчетная частота |
12,68132103 | 0,221751084 | 4 |
23,37264207 | 0,285525351 | 2 |
34,0639631 | 0,313282748 | 1 |
44,75528414 | 0,2929147 | 2 |
55,44660517 | 0,233377369 | 0 |
66,1379262 | 0,158448887 | 5 |
76,82924724 | 0,091671119 | 2 |
Результирующее значение критерия 2,11526E-55 значительно меньше табличного 12,6 – следовательно, гипотеза о нормальности закона распределения принимается с уровнем значимости 0,05.
Исследование выборки по коэффициенту качества продукции (Х1).
Математическое ожидание (арифметическое среднее) 2,29.
Доверительный интервал для математического ожидания (1,905859236; 2,674140764).
Дисперсия (рассеивание) 0,71215.
Доверительный интервал для дисперсии (0,437669008; 1,559452555).
Средне квадратичное отклонение (от среднего) 0,843889803.
Медиана выборки 2,09.
Размах выборки 2,54.
Асимметрия (смещение от нормального распределения) 0,290734565.
Эксцесс выборки (отклонение от нормального распределения)
-1,161500717.
Коэффициент вариации (коэффициент представительности среднего) 37%.
Проверка статистической независимости выборки (проверка наличия тренда) методом критерия серий. Результаты проверки представлены в таблице 2.3 (2-й столбец). Сумма серий равняется 11. Поскольку данное значение попадает в доверительный интервал (табличные значения) от 5 до 15, следовательно, гипотеза о статистической независимости и отсутствии тренда подтверждается.
Проверка статистической независимости выборки (проверка наличия тренда) методом критерия инверсий. Количество инверсий представлено в таблице 2.3 (3-й столбец). Сумма инверсий равняется 89. Поскольку данное значение попадает в доверительный интервал (табличные значения) от 64 до 125, следовательно, гипотеза о статистической независимости и отсутствии тренда подтверждается.
Таблица 2.3 – Критерии серий и инверсий.
Коэффициент качества продукции Х1 | Критерий серий | Критерий инверсий |
1,22 | - | 1 |
1,45 | - | 3 |
1,9 | - | 5 |
2,53 | + | 9 |
3,41 | + | 13 |
1,96 | - | 5 |
2,71 | + | 10 |
1,76 | - | 4 |
2,09 | + | 4 |
1,1 | - | 0 |
3,62 | + | 9 |
3,53 | + | 8 |
2,09 | + | 3 |
1,54 | - | 2 |
2,41 | + | 2 |
3,64 | + | 5 |
2,61 | + | 2 |
2,62 | + | 2 |
3,29 | + | 2 |
1,24 | - | 0 |
1,37 | - | 0 |
Итого | 11 | 89 |
Проверка гипотезы о нормальном законе распределения выборки с применением критерия . Разобьем выборку на интервалы группировки длиной 0,4*среднеквадратичное отклонение = 0,337555921. Получим следующее количество интервалов группировки размах/длина интервала=7.Все данные о границах интервалов, теоретических и эмпирических частотах приведены в таблице 2.4.
Таблица 2.4 – Критерий .
Интервалы группировки | Теоретическая частота | Расчетная частота |
1,437555921 | 5,960349765 | 4 |
1,775111843 | 8,241512255 | 3 |
2,112667764 | 9,71079877 | 4 |
2,450223685 | 9,750252967 | 1 |
2,787779606 | 8,342374753 | 4 |
3,125335528 | 6,082419779 | 0 |
3,462891449 | 3,778991954 | 2 |
Результирующее значение критерия 0,000980756 значительно меньше табличного 12,6 – следовательно, гипотеза о нормальности закона распределения принимается с уровнем значимости 0,05.
... несколько уравнений, а в каждом уравнении - несколько переменных. Задача оценивания параметров такой разветвленной модели решается с помощью сложных и причудливых методов. Однако все они имеют одну и ту же теоретическую основу. Поэтому для получения начального представления о содержании эконометрических методов мы ограничимся в последующих параграфах рассмотрением простой линейной регрессии. ...
... ПО “Уралмаш”, “АвтоВАЗ”, МИИТ, Казахского политехнического института, Донецкого государственного университета и многих других. Затем Институт в качестве Лаборатории эконометрических исследований разрабатывал эконометрические методы анализа нечисловых данных, а также процедуры расчета и прогнозирования индекса инфляции и валового внутреннего продукта. Институт высоких статистических технологий и ...
... на задний план традиционными постановками. Несколько лет назад при описании современного этапа развития статистических методов нами были выделены [29] пять актуальных направлений, в которых развивается современная прикладная статистика, т.е. пять "точек роста": непараметрика, робастность, бутстреп, интервальная статистика, статистика объектов нечисловой природы. Обсудим их. 5. ...
... и боятся бедности и как следствие воспитывают своих детей в такой же привычке к труду и благосостоянию, а удача доставляет удовлетворение их родительским чувствам и самолюбию. Принадлежит первое в истории экономической мысли достаточно глубокое теоретическое обоснование положений о капитале. Считал, “что деньги сами по себе представляют собой бесплодное богатство, которое ничего не производит”. ...
0 комментариев