13. Нормальное распределение.

Нормальное распределение – это наиболее важный вид распределения в статистике.

Нормально распределяются значения признака под воздействием множества различных причин, которые практически не взаимосвязаны друг с другом и влияние каждой из которых сравнительно мало, по сравнению с действием всех остальных факторов.

Нормальное распределение отражает вариацию значений признака у единиц однородной совокупности. Подобное распределение наблюдается преимущественно в естественно-научных испытаниях (измерение роста, веса).

В социально-экономических явлениях нормального распределения данные встречаются редко. Здесь всегда присутствуют причины существенным образом влияющие на уровень изучаемого признака (результат управленческого воздействия).

Тем не менее, гипотеза о нормальном распределении исходных данных лежит в основе методологии анализа взаимосвязей выборочного метода и многих других статистических методов.

При достаточно большом числе испытаний нормальная кривая служит пределом, к которому стремятся многие виды распределения, в том числе биномиальное и гипергеометрическое.

Нормальное распределение выражается функцией вида:

Данная функция характеризует плотность нормального распределения вероятности, ее математическое ожидание , а показатель степени – стандартное значение отклонений эмпирических данных от среднеарифметических.

Масштабирование данных кривой по оси x осуществляется величинами среднеквадратического отклонения . Так как показатель степени функции возведет в четную степень, функция положительна, кривая симметрична относительно средней, то есть показатель асимметрии равен . Показатель эксцесса кривой нормального распределения так же равен 0.

Значения параметров  и  влияют на форму и положение графика на координатной плоскости. С изменением  при  кривая скользит вдоль оси x. С изменением  при  чем больше  тем более плосковершинной становится нормальная кривая. Нормальная кривая имеет точки перегиба с координатами . Площадь, ограниченная функцией и ординатами, проведенными из точек с координатами:

  составляет 0,6827 площади всей кривой;

 - 0,9545 площади всей кривой;

 - 0,9973 площади всей кривой.

14. Сравнительная оценка параметров эмпирического и нормального распределений. Критерий Пирсона.

Нормальный характер распределения свидетельствует о количественной однородности статистических данных и об отсутствии каких-либо причин существенным образом определяющих вариацию изучаемого явления.

Поэтому статистический анализ нередко начинается с проверки того, как фактически (эмпирически) данные ложатся на идеальную теоретическую кривую или апроксимируются (то есть выражение данных какой-либо кривой) сравнение эмпирических и теоретических данных. Производится путем оценки гипотезы нормального характера распределения. Вероятностные статистические предположения выдвигаются в виде нулевой гипотезы. Отклонения данных эмпирических от нормальных носят случайный характер. Оценку нулевой гипотезы в данном случае осуществляют графическим методом или путем расчета специальных обобщающих показателей сходства, называемых критериями согласия.

Независимо от выбранного метода генеральные ряды распределения преобразуются в дискретные и стандартизируются.

Пример: Известно, что среднемесячная заработная плата всех рабочих =1402,42 руб., среднеквадратическое отклонение =338,58 руб.

Данные распределения среднемесячной заработной платы.

Средне-месячная заработная плата

Число раб-ков,  (эмпир.)

(теор.)

До 700 16 600 -2,37 -2,81 0,0241 12,93 3,07 9,41 0,73
700,1-900 56 800 -1,78 -1,58 0,0819 44,04 11,96 142,95 3,25
900,1-1100 89 1000 -1,19 -0,71 0,1969 105,82 -16,82 282,90 2,67
1100,1-1300 172 1200 -0,60 -0,18 0,3337 179,35 -7,35 54,05 0,30
1300,1-1500 244 1400 -0,01 0,00 0,3989 214,44 29,56 873,70 4,07
1500,1-1700 163 1600 0,58 -0,17 0,3365 180,87 -17,87 319,44 1,77
1700,1-1900 93 1800 1,17 -0,69 0,2002 107,62 -14,62 213,80 1,99
1900,1-2100 64 2000 1,76 -1,56 0,0840 45,17 18,83 354,42 7,85
Свыше 2100,1 13 2200 2,36 -2,77 0,0249 13,38 -0,38 0,14 0,01
Итого 910 22,63

В связи с тем, что табличные значения рассчитаны для непрерывно изменяющегося признака с дисперсией равной 1, необходимо скорректировать полученные частости на фактическую величину интервала и среднеквадратическое отклонение.

, где  величина интервала. Так как все интервалы равны , тогда .

Графики не позволяют определить насколько существенны отклонения, поэтому более точным считается способ расчета критериев согласия. Наиболее известный из них:

В соответствии с формулой, чем сильнее совпадение кривых, тем меньше величина . При отсутствии отклонений , но даже при небольших отклонениях величина  зависит от числа слагаемых (то есть от числа групп). Если >0, то необходима его вероятностная оценка (стр. 368).

 - число степеней свободы и заданная вероятность несущественности отклонений эмпирических данных и теоретических. r – число групп, k - число параметров, которые нельзя изменить.

Поскольку фактическое значение  (22,63) гораздо больше табличного (5,348) даже для вероятности 0,5, гипотеза о случайном характере отклонений эмпирических данных от теоретических отклоняется.


Информация о работе «Теория вероятности»
Раздел: Статистика
Количество знаков с пробелами: 28943
Количество таблиц: 3
Количество изображений: 0

Похожие работы

Скачать
59066
6
49

... Доказать: По определению второй смешанной производной. Найдем по двумерной плотности одномерные плотности случайных величин X и Y. Т.к. полученное равенство верно для всех х, то подинтегральные выражение аналогично В математической теории вероятности вводится как базовая формула (1) ибо предлагается, что плотность вероятности как аналитическая функция может не существовать. Но т.к. в нашем ...

Скачать
25559
0
0

... равна 0,515). Конец 19 в. и 1-я половина 20 в. отмечены открытием большого числа статистических закономерностей в физике, химии, биологии и т.п. Возможность применения методов теории вероятностей к изучению статистических закономерностей, относящихся к весьма далёким друг от друга областям науки, основана на том, что вероятности событий всегда удовлетворяют некоторым простым соотношениям, о ...

Скачать
125259
9
8

... {ξn (ω )}¥n=1 . Поэтому, во-первых, можно говорить о знакомой из математического анализа (почти) поточечной сходимости последовательностей функций: о сходимости «почти всюду», которую в теории вероятностей называют сходимостью «почти наверное». Определение 46. Говорят, что последовательность с. в. {ξn } сходится почти наверное к с. в. ξ при n ® ¥ , и пишут: ξn ...

Скачать
34707
0
6

... ничего другого, кроме как опять же события и . Действительно, имеем: *=, *=, =, =. Другим примером алгебры событий L является совокупность из четырех событий: . В самом деле: *=,*=,=,. 2.Вероятность. Теория вероятностей изучает случайные события. Это значит, что до определенного момента времени, вообще говоря, нельзя сказать заранее о случайном событии А произойдет это событие или нет. Только ...

0 комментариев


Наверх