2.1 Получение исходного материала
В данной работе использовались метеорологические данные о грозовой деятельности по семи станциям республики Татарстан : Тетюши (1940-1980), Лаишево (1950-1980), Казань-Опорная (1940-1967), Кайбицы (1940-1967), Арск (1940-1980), Агрыз (1955-1967) и метеорологической станции Казанского Государственного Университета (1940-1980). Данные приводятся с декадной дискретизацией. В качестве индексов грозовой активности бралось число дней с грозой в декаду. А так же ежемесячные данные о солнечной активности – числа Вольфа за 1940-1980 г.г.
По данным за указанные годы рассчитаны основные статистические характеристики для индексов грозовой активности.
2.2 Основные статистические характеристики
Метеорология имеет дело с огромными массивами наблюдений, которые нужно анализировать для выяснения закономерностей, существующих в атмосферных процессах. Поэтому в метеорологии широко применяются статистические методы анализа больших массивов наблюдений. Применение мощных современных статистических методов помогает яснее представить факты и лучше обнаружить связь между ними.
Среднее значение временного ряда рассчитывается по формуле
Ḡ = ∑Gi / N
где 1< i <n, N-число данных (объем выборки). В метеорологии используется средняя специального типа, которую называют нормой.
Дисперсия показывает разброс данных относительно среднего значения и находится по формуле
Ϭ² = ∑(Gi - Ḡ)² / N , где 1< i <n
Величина, называемая среднеквадратическим отклонением, представляет собой квадратный корень из дисперсии.
Ϭ = ∑(Gi - Ḡ)² / N , где 1< i <n
Все большее применение в метеорологии находит наиболее вероятное значение случайной переменной – мода.
Также для характеристики метеовеличин используют асиметрию и эксцесс.
Если среднее значение больше моды, то распределение частот называют положительно асиметричным. Если среднее значение меньше моды, то отрицательно асиметричным. Коэффициент асимметрии вычисляется по формуле
A = ∑(Gi - Ḡ)³ / NϬ³ , где 1< i <n
Асиметрия считается малой, если коэффициент асиметрии |A|≤0.25. Асиметрия умеренная, если 0,25<|А|>0.5. Асиметрия большая, если 0,5<|А|>1,5. Исключительно большая асиметрия, если |А|>1,5. Если |А|>0 , то распределение имеет правостороннюю асиметрию, если |А|<0, то левостороннюю асиметрию.
Для распределения частот, имеющих одинаковые значения средней, асиметрии могут отличаться величиной эксцесса
Е = ∑(Gi - Ḡ)⁴ / NϬ⁴ , где 1< i <n
Эксцесс считается малым, если |E|≤0.5; умеренным, если 1≤|E|≤3 и большим, если |E|>3. Если -0.5≤Е≤3, то эксцесс приближается к нормальному.
Коэффициент корреляции – это величина, показывающая взаимосвязь между двумя коррелируемыми рядами.
Формула коэффициента корреляции имеет следующий вид :
R = ∑((Xi-X)*(Yi-Y))/ ϬxϬy
где X и Y – средние величины, Ϭx и Ϭy – среднеквадратические отклонения.
Свойства коэффициента корреляции :
1. Коэффициент корреляции независимых величин равен нулю.
2. Коэффициент корреляции не изменяется от прибавления к x и y каких-либо постоянных (неслучайных) слагаемых, а также не изменяется от умножения величин x и y на положительные числа (постоянные).
3. Коэффициент корреляции не изменяется при переходе от x и y к нормированным величинам.
4. Диапазон изменения от -1 до 1.
Необходимо делать проверку надежности наличия связи, надо оценить значимость отличия коэффициента корреляции от нуля.
Если для эмпирического R произведение │R│√N-1 окажется больше некоторого критического значения, то с надежностью S можно утверждать, что коэффициент корреляции будет достоверен (достоверно отличатся от нуля).
Корреляционный анализ позволяет установить значимость (неслучайность) изменения наблюдаемой, измеряемой случайной величины в процессе испытаний, позволяет определить форму и направление существующих связей между признаками. Но ни коэффициент корреляции, ни корреляционное отношение не дают сведений о том, насколько может изменяться варьирующий, результативный признак при изменении связанного с ним факториального признака.
Функция, позволяющая по величине одного признака при наличии корреляционной связи находить ожидаемые значения другого признака, называется регрессией. Статистический анализ регрессии называется регрессионным анализом. Это более высокая ступень статистического анализа массовых явлений. Регрессионный анализ позволяет предвидеть Y по признаку X :
Yx-Y=(Rxy* Ϭy*(X-X))/ Ϭx (2.1)
Xy-X=(Rxy* Ϭx*(Y-Y))/ Ϭy (2.2)
где X и Y – соответствуют среднему, Xy и Yx – частные средние, Rxy – коэффициент корреляции.
Уравнения (2.1) и (2.2) можно записать в виде :
Yx=a+by*X (2.3)
Xy=a+bx*Y (2.4)
Важной характеристикой уравнений линейной регрессии является средняя квадратическая погрешность. Она имеет следующий вид :
для уравнения (2.3) Sy= Ϭy*√1-R²xy (2.5)
для уравнения (2.4) Sx= Ϭx*√1-R²xy (2.6)
Ошибки регрессии Sx и Sy позволяют определить вероятную (доверительную) зону линейной регрессии, в пределах которой находится истинная линия регрессии Yx ( или Xy), т.е. линия регрессии генеральной совокупности.
Глава 3. Анализ расчетов
0 комментариев