1.2 Дисперсионный анализ
Дисперсионный анализ – это метод статистической оценки надежности проявления зависимости результативного признака от одного или нескольких факторов. На основе дисперсионного анализа решаются задачи:
1)общая оценка достоверности различия средних при группировке единиц по одному фактическому признаку или нескольким;
2)оценка достоверности взаимодействия между 2-мя или большим числом факторов;
3)оценка частных различий между парами средних.
Статистическая оценка достоверности показателей осуществляется по выборочным данным. Следовательно, дисперсионный анализ является методом оценки выборочных характеристик связи между факторами.
Этапы дисперсионного анализа:
1)формулировка статистической задачи: дисперсионный анализ предполагает наличие аналитической группировки по одному или более фактических признаков. Результаты дисперсионного анализа зависят от правильности проведения группировки: количество интервалов; границы интервалов; рельефность отличия средних групповых величин;
2)теоретический анализ: применению дисперсионного анализа предшествует широкий теоретический анализ сущности изучаемого явления и процесса, возможности наличия связей между факторами с точки зрения здравого смысла и исследуемой науки;
3)выражение изучаемой взаимосвязи в виде модели: на основе поставленной задачи проводится отбор наиболее значимых факторов и формируется гипотеза относительно их взаимодействия, а затем начинается математическая обработка данных, т. е. строится математическая модель, которую можно представить в виде математического уравнения или в виде строгой схемы взаимодействия факторов;
4)анализ и интерпретация рассчитываемых характеристик связей и окончательные выводы относительно выдвинутой нулевой гипотезы.
Для того, чтобы провести дисперсионный анализ в Excel, необходимо активировать команду «Анализ данных». Для этого проходится следующий путь: Сервис -> Надстройки -> Пакет анализа. После этого в меню «Сервис» появляется команда «Анализ данных» и выбирается команда «Однофакторный дисперсионный анализ».
Далее необходимо заполнить окно «Однофакторный дисперсионный анализ»:
«Входной интервал» - вводится ссылка на диапазон, содержащий анализируемые данные. Ссылка должна состоять не менее чем из двух смежных диапазонов данных, данные в которых расположены по строкам или столбцам.
«Группирование» - установите переключатель в положение. По столбцам или По строкам в зависимости от расположения данных во входном диапазоне.
«Метки в первой строке/Метки в первом столбце» - если первая строка исходного диапазона содержит названия столбцов, установите переключатель в положение Метки в первой строке. Если названия строк находятся в первом столбце входного диапазона, установите переключатель в положение Метки в первом столбце. Если входной диапазон не содержит меток, то необходимые заголовки в выходном диапазоне будут созданы автоматически.
«Альфа» - введите уровень значимости, необходимый для оценки критических параметров F-статистики. Уровень альфа связан с вероятностью возникновения ошибки типа I (опровержение верной гипотезы).
«Выходной диапазон» - введите ссылку на левую верхнюю ячейку выходного диапазона. Размеры выходной области будут рассчитаны автоматически, и соответствующее сообщение появится на экране в том случае, если выходной диапазон занимает место существующих данных или его размеры превышают размеры листа.
«Новый лист» - установите переключатель, чтобы открыть новый лист в книге и вставить результаты анализа, начиная с ячейки A1. Если в этом есть необходимость, введите имя нового листа в поле, расположенном напротив соответствующего положения переключателя.
«Новая книга» - установите переключатель, чтобы открыть новую книгу и вставить результаты анализа в ячейку A1 на первом листе в этой книге.
Интерпретация результатов:
«Группы» - данные по выработке в первую и вторую смены.
«Счет» - количество наблюдений в каждой из групп.
«Сумма» - сумма элементов каждой из групп.
«Среднее» - средняя выработка в каждой из групп.
«Дисперсия» - рассчитывается дисперсия по каждой из групп;
SS - сумма квадратов;
df - число степеней свободы;
MS – средний квадрат;
F – расчетное значение отношения Фишера;
P - уровень значимости для вычисленного F;
F критическое – табличное значение отношения Фишера.
Результаты расчетов аналогичны результатам, полученным при расчетах вручную.
1.3 Корреляционно-регрессионный анализ
Регрессионный и корреляционный анализы — это эффективные методы, которые разрешают анализировать значительные объемы информации с целью исследования вероятной взаимосвязи двух или больше переменных.
Корреляционной связью называют важнейший частный случай статистической связи, состоящий в том, что разным значениям одной переменной соответствуют различные средние значения другой. С изменением значения признака х закономерным образом изменяется среднее значение признака у; в то время как в каждом отдельном случае значение признака у (с различными вероятностями) может принимать множество различных значений.
В регрессионном анализе рассматривается связь между одной переменной, которая называется зависимой переменной, или признаком, и несколькими другими, которые называются независимыми переменными.
Эта связь представляется с помощью математической модели, то есть уравнением, которое связывает зависимую переменную (у) с независимыми (х) с учетом множества соответствующих предположений.
Поскольку целью регрессионного анализа есть выявление влияния переменных Х на значение переменной У, последнюю еще называют откликом, или результативным фактором, а переменные х — факторами, которые влияют на отклик.
Регрессионный анализ используется по двум причинам.
Во-первых, так как описание зависимости между переменными помогает установить наличие возможной причинной связи.
Во-вторых, получение аналитической зависимости между переменными дает возможность предусматривать будущие значения зависимой переменной по значениям независимых переменных.
Применение метода корреляции для анализа связи складывается из следующих последовательно решаемых вопросов:
- Установление причин связи;
- Отбор наиболее существенных признаков для анализа;
- Определение формы связи и подбор математического уравнения для выражения существенных связей;
- Расчет числовых характеристик корреляционной связи.
Уравнение, с помощью которого выражается аналитическая связь называется уравнением регрессии.
При проведении корреляционно – регрессионного анализа нужно соблюдать этапы его проведения:
1.Качественный анализ сущности изучаемого явления
2.Постановка задач и выбор факторных и результативных признаков
3.Сбор статистического материала, его контроль
4.Установление аналитической формы связи, расчет параметров уравнения связи и других количественных характеристик
5.Определение тесноты связи
6.Оценка статистической надежности выборочных показателей связи
7.Интерпретация полученных характеристик, оформление результатов в виде таблиц и графиков.
В соответствии с сущностью корреляционной связи ее изучение имеет две цели:
измерение параметров уравнения, выражающего связь средних значений зависимой переменой со значениями независимой переменной (зависимость средних величин результативного признака от значений одного или нескольких факторных признаков);
измерение тесноты связи двух (или большего числа) признаков между собой.
Вторая задача специфична для статистических связей, а первая разработана для функциональных связей и является общей. Основным методом решения задачи нахождения параметров уравнения связи является метод наименьших квадратов (МНК).
Существуют также другие специфические задачи корреляционно-регрессионного метода, имеющих не формально математический, а содержательный характер:
задача выделения важнейших факторов, влияющих на результативный признак. Эта задача решается в основном на базе мер тесноты связи факторов с результативными признаками;
задача оценки хозяйственной деятельности по эффективности использования имеющихся факторов производства. Эта задача решается путем расчета для каждой единицы совокупности тех величин результативного признака, которые были бы получены при средней по совокупности эффективности использования факторов и сравнения их с фактическими результатами производства;
задача прогнозирования возможных значений результативного признака при задаваемых значениях факторных признаков. Такая задача решается путем подстановки ожидаемых, или планируемых, или возможных значений факторных признаков в уравнение связи и вычисления ожидаемых значений результативного признака;
задача подготовки данных, необходимых в качестве исходных для решения оптимизационных задач.
Для проведения регрессионного анализа используется статистическая функция ЛИНЕЙН.
Одновременно с вычислением параметров линейного уравнения регрессии (в том числе и множественной) функция ЛИНЕЙН может возвращать дополнительную регрессионную статистику.
В эту статистику входят:
SE1,...,SEn — стандартные значения ошибок для коэффициентов m1,..., mn ;
SEb — стандартное значение ошибки для постоянной b;
R2 - величина достоверности аппроксимации (коэффициентов детерминированности);
SEy — стандартная ошибка для оценки Y;
F — F-статистика, или F-отношение;
df — количество степеней свободы (N-m-1);
SSрег — регрессионная сумма квадратов;
SSост. — остаточная сумма квадратов.
Для получения этой статистики нужно выделить диапазон клеток из пяти строк и количеством колонок, которое на единицу больше количества независимых переменных.
Кроме того, четвертый параметр функции ЛИНЕЙН может равняться единице.
После введения параметров надо, держа нажатыми клавиши Сtrl и Shift, нажать клавишу Еnter.
Ниже демонстрирует последовательность, в которой возвращается дополнительная регрессионная статистика в клетки рабочего листа при введении формулы с функцией ЛИНЕЙН в верхний левый угол этого диапазона.
mnmn-1…m2m1b
sensen-1…se2se1seb
R2sey
Fdf
SSрег.SSост.
Для более удобного расчета регрессионного анализа можно использовать надстройка Анализ данных / Регрессия.
Также зависимость между признаками можно изобразить графически при помощи Мастера диаграммы, выбрать точечный вид и добавить линию тренда.
Графические изображения используются прежде всего для наглядного представления статистических данных, благодаря им существенно облегчается их восприятие и понимание. Существенна их роль и тогда, когда речь идет о контроле полноты и достоверности исходного статистического материала, используемого для обработки и анализа.
Графическое представление статистических данных является не только средством иллюстрации статистических данных и контроля их правильности и достоверности. Благодаря своим свойствам оно является важным средством толкования и анализа статистических данных, а в некоторых случаях - единственным и незаменимым способом их обобщения и познания. В частности, оно незаменимо при одновременном изучении нескольких взаимосвязанных экономических явлений, так как позволяет с первого взгляда установить существующие между ними соотношения и связи, различие и подобие, а также выявить особенности их изменений во времени.
... з базисним роком збільшився на 76,73%, у тому числі в результаті зростання фізичного обсягу продукції на 17,41% при збільшенні цін реалізації на 50,52%. 8. Шляхи підвищення ефективності виробництва зернових культур В період переходу до ринкової економіки перед аграрним сектором коштує загальнодержавного завдання - розвиток виробництва і підвищення його ефективності, поліпшення соціально- ...
0 комментариев