3 Дисперсионный анализ в контексте статистических методов
Статистические методы анализа – это методология измерения результатов деятельности человека, то есть перевода качественных характеристик в количественные.
Основные этапы при проведении статистического анализа:
- содержательный анализ исследуемого объекта, системы или процесса. На этом этапе определяется набор входных и выходных параметров (X1 ,..., Xp; Y1 ,..., Yq);
- составление плана сбора исходных данных - значений входных переменных (X1,...,Xp), числа наблюдений n. Этот этап выполняется при активном планировании эксперимента.
- получение исходных данных и ввод их в компьютер. На этом этапе формируются массивы чисел (x1i ,..., xpi ; y1i ,..., yqi), i=1,..., n, где n - объем выборки.
- первичная статистическая обработка данных. На данном этапе формируется статистическое описание рассматриваемых параметров:
а) построение и анализ статистических зависимостей;
б) корреляционный анализ предназначен для оценивания значимости влияния факторов (X1,...,Xp) на отклик Y;
в) дисперсионный анализ используется для оценивания влияния на отклик Y неколичественных факторов (X1,...,Xp) с целью выбора среди них наиболее важных;
г) регрессионный анализ предназначен для определения аналитической зависимости отклика Y от количественных факторов X;
- интерпретация результатов в терминах поставленной задачи /13/.
В таблице 3.1 приведены статистические методы, с помощью которых решаются аналитические задачи. В соответствующих ячейках таблицы находятся частоты применения статистических методов:
- метка «-» - метод не применяется;
- метка «+» - метод применяется;
- метка «++» - метод широко применяется;
- метка «+++» - применение метода представляет особый интерес /14/.
Дисперсионный анализ подобно t-критерию Стьюдента, позволяет оценить различия между выборочными средними; однако, в отличие от t-критерия, в нем нет ограничений на количество сравниваемых средних. Таким образом, вместо того, чтобы поставить вопрос о различии двух выборочных средних, можно оценить, различаются ли два, три четыре, пять или k средних.
Дисперсионный анализ позволяет иметь дело с двумя или более независимыми переменными (признаками, факторами) одновременно, оценивая не только эффект каждой из них по отдельности, но и эффекты взаимодействия между ними /15/.
Таблица 3.1 – Применение статистических методов при решении аналитических задач
Аналитические задачи, возникающие в сфере бизнеса, финансов и управления | Методы описательной статистики | Методы поверки статисти-ческих гипотез | Методы регресси-онного анализа | Методы дисперси-онного анализа | Методы анализа категории-альных данных | Методы много-мерного анализа | Методы дискриминантного анализа | Методы кластер-ного анализа | Методы анализа выжива-емости | Методы анализа и прогноза временных рядов |
Задачи горизонталь-ного (временного) анализа | ++ | + | - | + | + | - | - | - | - | - |
Задачи вертикального (структурного) анализа | ++ | - | - | + | ++ | ++ | + | + | - | - |
Задачи трендового анализа и прогноза | ++ | - | +++ | ++ | - | - | - | - | ++ | +++ |
Задачи анализа относительных показателей | ++ | + | + | - | + | +++ | ++ | ++ | - | ++ |
Задачи сравнительного (пространствен-ного) анализа | ++ | - | + | + | ++ | +++ | ++ | ++ | - | + |
Задачи факторного анализа | + | + | ++ | - | ++ | +++ | + | ++ | - | + |
К большинству сложных систем применим принцип Парето, согласно которому 20 % факторов определяют свойства системы на 80 %. Поэтому первоочередной задачей исследователя имитационной модели является отсеивание несущественных факторов, позволяющее уменьшить размерность задачи оптимизации модели.
Анализ дисперсии оценивает отклонение наблюдений от общего среднего. Затем вариация разбивается на части, каждая из которых имеет свою причину. Остаточная часть вариации, которую не удается связать с условиями эксперимента, считается его случайной ошибкой. Для подтверждения значимости используется специальный тест - F-статистика.
Дисперсионный анализ определяет, есть ли эффект. Регрессионный анализ позволяет прогнозировать отклик (значение целевой функции) в некоторой точке пространства параметров. Непосредственной задачей регрессионного анализа является оценка коэффициентов регрессии /16/.
Слишком большая размерность выборок затрудняет проведение статистических анализов, поэтому имеет смысл уменьшить размер выборки.
Применив дисперсионный анализ можно выявить значимость влияния различных факторов на исследуемую переменную. Если влияние фактора окажется несущественным, то этот фактор можно исключить из дальнейшей обработки.
... (от e) Общая m – число данных в строке (число повторов в ячейке), - число столбцов, - число строк. 3. Дисперсионный анализ в системе MINITAB Для проведения дисперсионного анализа в системе MINITAB необходимо выбрать из меню Stat > ANOVA. Различные возможности проведения дисперсионного анализа представлены следующими командами. ...
... отклика является смертность населения в конкретной возрастной группе, а факторами, влияющими на ее изменение, являются классы заболеваний. 2.2. Дисперсионный анализ Методом дисперсионного анализа, выясним, оказывает ли влияние различные заболевания на показатель смертности населения. То есть, проверим, выполняется ли гипотеза о равенстве математических ожиданий (Н0: М(Х1) = М(Х2) = … = ...
... товаров на рынок и объемом товарооборота предприятия торговли; Rxz = -0,96 корреляция расходами предприятия на рекламу и продвижение товаров на рынок и прибылью предприятия. Задача 2. Однофакторный дисперсионный анализ При уровне значимости a=0.05 определите статистическую достоверность влияния фактора А на динамику величины Х. № испытания A1 A2 A3 A4 1 2 2 6 7 ...
... можно предположить что при 5% уровне значимости ВАШСП не зависит от инфекции вызывающей реактивный артрит. В связи с тем что не один из показателей активности заболевания а также показатели ВАШ не зависят от инфекции предшествующей реактивному артриту дальнейшее разделение данных на группы можно считать не целесообразным. 2 Множественная линейная регрессия Общее назначение множественной ...
0 комментариев