2 Применение дисперсионного анализа в различных процессах и исследованиях
2.1 Использование дисперсионного анализа при изучении миграционных процессов
Миграция - сложное социальное явление, во многом определяющее экономическую и политическую стороны жизни общества. Исследование миграционных процессов связано с выявлением факторов заинтересованности, удовлетворенности условиями труда, и оценкой влияния полученных факторов на межгрупповое движение населения.
λij=ciqijaj,
где λij – интенсивность переходов из исходной группы i (выхода) в новую j (входа);
ci – возможность и способности покинуть группу i (ci≥0);
qij – привлекательность новой группы по сравнению с исходной (0≤qij≤1);
aj – доступность группы j (aj≥0).
Если считать численность группы i равной ni, то оценкой случайной величины νij - числа переходов из i в j – будет niciqijaj:
νij≈ niλij=niciqijaj. (16)
На практике для отдельного человека вероятность p перехода в другую группу мала, а численность рассматриваемой группы n велика. В этом случае действует закон редких событий, то есть пределом νij является распределение Пуассона с параметром μ=np:
.
С ростом μ распределение приближается к нормальному. Преобразованную же величину √νij можно считать нормально распределенной.
Если прологарифмировать выражение (16) и сделать необходимые замены переменных, то можно получить модель дисперсионного анализа:
ln√νij=½lnνij=½(lnni+lnci+lnqij+lnaj)+εij,
Xi,j=2ln√νij-lnni-lnqij,
Ci=lnci,
Aj=lnaj,
Xi,j=Ci+Aj+ε.
Значения Ci и Aj позволяют получить модель двухфакторного дисперсионного анализа с одним наблюдением в клетке. Обратным преобразованием из Ci и Aj вычисляются коэффициенты ci и aj.
При проведении дисперсионного анализа в качестве значений результативного признака Y следует взять величины:
Yij=Xi,j-X,
Х=(Х1,1+Х1,2+:+Хmi,mj)/mimj,
где mimj- оценка математического ожидания Хi,j;
Хmi и Хmj - соответственно количество групп выхода и входа.
Уровнями фактора I будут mi групп выхода, уровнями фактора J - mj групп входа. Предполагается mi=mj=m. Встает задача проверки гипотез HI и HJ о равенствах математических ожиданий величины Y при уровнях Ii и при уровнях Jj, i,j=1,…,m. Проверка гипотезы HI основывается на сравнении величин несмещенных оценок дисперсии sI2 и so2. Если гипотеза HI верна, то величина F(I)= sI 2/so2 имеет распределение Фишера с числами степеней свободы k1=m-1 и k2=(m-1)(m-1). Для заданного уровня значимости α находится правосторонняя критическая точка xпр,αкр. Если числовое значение F(I)чис величины попадает в интервал(xпр,αкр, +∞), то гипотеза HI отвергается и считается, что фактор I влияет на результативный признак. Степень этого влияния по результатам наблюдений измеряется выборочным коэффициентом детерминации, который показывает, какая доля дисперсии результативного признака в выборке обусловлена влиянием на него фактора I. Если же F(I)чис<xпр,αкр, то гипотеза HI не отвергаются и считаются, что влияние фактора I не подтвердилось. Аналогично проверяется гипотеза HJ о влиянии фактора J /4/.
2.2 Принципы математико-статистического анализа данных медико-биологических исследований
В зависимости от поставленной задачи, объема и характера материала, вида данных и их связей находится выбор методов математической обработки на этапах как предварительного (для оценки характера распределения в исследуемой выборке), так и окончательного анализа в соответствии с целями исследования. Крайне важным аспектом является проверка однородности выбранных групп наблюдения, в том числе контрольных, что может быть проведено или экспертным путем, или методами многомерной статистики (например, с помощью кластерного анализа). Но первым этапом является составление вопросника, в котором предусматривается стандартизованное описание признаков. В особенности при проведении эпидемиологических исследований, где необходимо единство в понимании и описании одних и тех же симптомов разными врачами, включая учет диапазонов их изменений (степени выраженности). В случае существенности различий в регистрации исходных данных (субъективная оценка характера патологических проявлений различными специалистами) и невозможности их приведения к единому виду на этапе сбора информации, может быть затем осуществлена так называемая коррекция ковариант, которая предполагает нормализацию переменных, т.е. устранение ненормальностей показателей в матрице данных. "Согласование мнений" осуществляется с учетом специальности и опыта врачей, что позволяет затем сравнивать полученные ими результаты обследования между собой. Для этого могут использоваться многомерный дисперсионный и регрессионный анализы.
Признаки могут быть как однотипными, что бывает редко, так и разнотипными. Под этим термином понимается их различная метрологическая оценка. Количественные или числовые признаки - это замеренные в определенной шкале и в шкалах интервалов и отношений (I группа признаков). Качественные, ранговые или балльные используются для выражения медицинских терминов и понятий не имеющих цифровых значений (например, тяжесть состояния) и замеряются в шкале порядка (II группа признаков). Классификационные или номинальные (например, профессия, группа крови) - это замеренные в шкале наименований (III группа признаков).
Во многих случаях делается попытка анализа крайне большого числа признаков, что должно способствовать повышению информативности представленной выборки. Однако выбор полезной информации, то есть осуществление отбора признаков является операцией совершенно необходимой, поскольку для решения любой классификационной задачи должны быть отобраны сведения, несущие полезную для данной задачи информацию. В случае, если это не осуществлено по каким-то причинам исследователем самостоятельно или отсутствуют достаточно обоснованные критерии для снижения размерности пространства признаков по содержательным соображениям, борьба с избыточностью информации осуществляется уже формальными методами путем оценки информативности.
Дисперсионный анализ позволяет определить влияние разных факторов (условий) на исследуемый признак (явление), что достигается путем разложения совокупной изменчивости (дисперсии, выраженной в сумме квадратов отклонений от общего среднего) на отдельные компоненты, вызванные влиянием различных источников изменчивости.
С помощью дисперсионного анализа исследуются угрозы заболевания при наличии факторов риска. Концепция относительного риска рассматривает отношение между пациентами с определенной болезнью и не имеющими ее. Величина относительного риска дает возможность определить, во сколько раз увеличивается вероятность заболеть при его наличии, что может быть оценено с помощью следующей упрощенной формулы:
r' = a*d / b*c,
где a - наличие признака в исследуемой группе;
b - отсутствие признака в исследуемой группе;
c - наличие признака в группе сравнения (контрольной);
d - отсутствие признака в группе сравнения (контрольной).
Показатель атрибутивного риска (rA) служит для оценки доли заболеваемости, связанной с данным фактором риска:
,
где Q - частота признака, маркирующего риск, в популяции;
r' - относительный риск.
Выявление факторов, способствующих возникновению (проявлению) заболевания, т.е. факторов риска может осуществляться различными способами, например, путем оценки информативности с последующим ранжированием признаков, что однако не указывает на совокупное действие отобранных параметров, в отличие от применения регрессионного, факторного анализов, методов теории распознавания образов, которые дают возможность получать "симптомокомплексы" риск-факторов. Кроме того, более сложные методы позволяют анализировать и непрямые связи между факторами риска и заболеваниями /5/.
2.3 Биотестирование почвы
Многообразные загрязняющие вещества, попадая в агроценоз, могут претерпевать в нем различные превращения, усиливая при этом свое токсическое действие. По этой причине оказались необходимыми методы интегральной оценки качества компонентов агроценоза. Исследования проводили на базе многофакторного дисперсионного анализа в 11-ти польном зернотравянопропашном севообороте. В опыте изучалось влияние следующих факторов: плодородие почвы (А), система удобрений (В), система защиты растений (С). Плодородие почвы, система удобрений и система защиты растений изучались в дозах 0, 1, 2 и 3. Базовые варианты были представлены следующими комбинациями:
000 - исходный уровень плодородия, без применения удобрений и средств защиты растений от вредителей , болезней и сорняков;
111 - средний уровень плодородия почвы, минимальная доза удобрения, биологическая защита растений от вредителей и болезней;
222 - исходный уровень плодородия почвы, средняя доза удобрений, химическая защита растений от сорняков;
333 - высокий уровень плодородия почвы, высокая доза удобрений, химическая защита растений от вредителей и болезней.
Изучались варианты, где представлен только один фактор:
200 – плодородие:
020 – удобрения;
002 - средства защиты растений.
А также варианты с различным сочетанием факторов - 111, 131, 133, 022, 220, 202, 331, 313, 311.
Целью исследования являлось изучение торможения хлоропластов и коэффициента мгновенного роста, как показателей загрязнения почвы, в различных вариантах многофакторного опыта.
Торможение фототаксиса хлоропластов ряски малой исследовали в различных горизонтах почвы: 0-20, 20-40 см. Анализ изменчивости фототаксиса в разных вариантах опыта показал достоверное влияние каждого из факторов (плодородия почвы, системы удобрений и системы защиты растений). Доля в общей дисперсии плодородия почвы составила 39,7%, системы удобрений - 30,7%, системы защиты растений - 30,7 %.
Для исследования совокупного влияния факторов на торможение фототаксиса хлоропластов использовались различные сочетания вариантов опыта: в первом случае - 000, 002, 022, 222, 220, 200, 202, 020, во втором случае - 111, 333, 331, 313, 133, 311, 131.
Результаты двухфакторного дисперсионного анализа свидетельствуют о достоверном влиянии взаимодействующих системы удобрений и системы защиты растений на различия в фототаксисе для первого случая (доля в общей дисперсии составила 10,3%). Для второго случая обнаружено достоверное влияние взаимодействующих плодородия почвы и системы удобрений (53,2%).
Трехфакторный дисперсионный анализ показал в первом случае достоверное влияние взаимодействия всех трех факторов. Доля в общей дисперсии составила 47,9%.
Коэффициент мгновенного роста исследовали в различных вариантах опыта 000, 111, 222, 333, 002, 200, 220. Первый этап тестирования - до внесения гербицидов на посевах озимой пшеницы (апрель), второй этап - после внесения гербицидов (май) и последний - на момент уборки (июль). Предшетвенники - подсолнечник и кукуруза на зерно.
Появление новых листецов наблюдали после короткой лаг-фазы с периодом суммарного удвоения сырой массы 2 - 4 суток.
В контроле и в каждом варианте на основании полученных результатов рассчитывали коэффициент мгновенного роста популяции r и далее рассчитывали время удвоения численности листецов (t удв ).
tудв=ln2/r.
Расчет этих показателей был проведен в динамике с анализом почвенных образцов. Анализ данных показал, что время удвоения популяции рясок до обработки почвы было наименьшем по сравнению с данными после обработки и на момент уборки. В динамике наблюдений больший интерес вызывает отклик почвы после внесения гербицида и на момент уборки. Прежде всего взаимодействие с удобрениями и уровнем плодородия.
Подчас получить прямой отклик на внесение химических препараратов может быть осложнено взаимодействием препарата с удобрениями, как органическими, так и минеральными. Полученные данные позволили проследить динамику отклика вносимых препаратов, во всех вариантах с химическими средствами защиты, где отмечается приостановка роста индикатора.
Данные однофакторного дисперсионного анализа показали достоверное влияние каждого показателя на темпы роста ряски малой на первом этапе. На втором этапе эффект различий по плодородию почвы составил 65,0 %, по системе удобрений и системе защиты растений - по 65,0%. Факторы показали достоверные различия среднего по коэффициенту мгновенного роста варианта 222 и вариантов 000, 111, 333. На третьем этапе доля в общей дисперсии плодородия почвы составила 42,9%, системы удобрений и системы защиты растений - по 42,9%. Отмечено достоверное различие по средним значениям вариантов 000 и 111, вариантов 333 и 222.
Исследуемые образцы почвы с вариантов полевого мониторинга отличаются друг от друга по показателю торможение фототаксиса. Отмечено влияние факторов плодородия, система удобрений и средства защиты растений с долями 30,7 и 39,7% при однофакторном анализе, при двух факторном и трехфакторном - зарегистрировали совместное влияние факторов.
Анализ результатов опыта показал незначительные различия между горизонтами почвы по показателю - торможение фототаксиса. Отличия отмечены по средним значениям.
На всех вариантах, где имеются средства защиты растений наблюдается изменения положения хлоропластов и приостановка роста ряски малой /6/.
... (от e) Общая m – число данных в строке (число повторов в ячейке), - число столбцов, - число строк. 3. Дисперсионный анализ в системе MINITAB Для проведения дисперсионного анализа в системе MINITAB необходимо выбрать из меню Stat > ANOVA. Различные возможности проведения дисперсионного анализа представлены следующими командами. ...
... отклика является смертность населения в конкретной возрастной группе, а факторами, влияющими на ее изменение, являются классы заболеваний. 2.2. Дисперсионный анализ Методом дисперсионного анализа, выясним, оказывает ли влияние различные заболевания на показатель смертности населения. То есть, проверим, выполняется ли гипотеза о равенстве математических ожиданий (Н0: М(Х1) = М(Х2) = … = ...
... товаров на рынок и объемом товарооборота предприятия торговли; Rxz = -0,96 корреляция расходами предприятия на рекламу и продвижение товаров на рынок и прибылью предприятия. Задача 2. Однофакторный дисперсионный анализ При уровне значимости a=0.05 определите статистическую достоверность влияния фактора А на динамику величины Х. № испытания A1 A2 A3 A4 1 2 2 6 7 ...
... можно предположить что при 5% уровне значимости ВАШСП не зависит от инфекции вызывающей реактивный артрит. В связи с тем что не один из показателей активности заболевания а также показатели ВАШ не зависят от инфекции предшествующей реактивному артриту дальнейшее разделение данных на группы можно считать не целесообразным. 2 Множественная линейная регрессия Общее назначение множественной ...
0 комментариев