Введение

В практических наблюдениях мы обычно имеем совокупность наблюдений х1, х2, ... , хn, на основе которых требуется сделать те или иные выводы. Часто этих наблюдений много, поэтому возникает задача их компактного описания. В идеале таким описанием могло бы быть утверждение, что х1, х2, ... , хn являются выборкой, т.е. независимыми реализациями случайной величины x с известным законом распределения F(x). Это позволило бы теоретически произвести расчеты всех необходимых исследователю характеристик наблюдаемого явления.

Однако далеко не всегда мы можем утверждать, что х1, х2, ... , хn являются независимыми и одинаково распределенными случайными величинами. Во-первых, это необходимо проверить, а во-вторых, часто заведомо известно, что это не так. Поэтому для компактного описания совокупности наблюдений используют другие методы – методы описательной статистики.

 


1. Методы описательной статистики

 

Методами описательной статистики называются методы описания выборок х1, х2, ... , хn с помощью различных показателей и графиков. Достоинство методов описательной статистики в том, что ее простые и довольно информативные статистические показатели избавляют от необходимости просмотра большого количества значений выборки.

1 Показатели описательной статистики

Показатели, описывающие выборку можно разбить на несколько групп:

1.   Показатели положения описывают положение данных (или середины совокупности) на числовой оси:

-               Минимальный и максимальный элементы выборки

-               Выборочные верхний и нижний квартили

-               Среднее

-               Выборочная медиана

-               Выборочная мода

2.   Показатели разброса описывают степень разброса данных относительно своего центра (насколько кучно основная масса данных группируется около середины совокупности)

-               Дисперсия выборки

-               Выборочное среднее квадратическое отклонение (стандартное отклонение)

-               Размах

-               Коэффициент эксцесса

3.   Показатели асимметрии описывают симметричность распределения данных около своего центра

-               Коэффициент асимметрии

-               Положение выборочной медианы относительно выборочного среднего и относительно выборочных квартилей

-               Гистограмма

4.   Показатели, описывающие закон распределения, дают представление о законе распределения данных

-               Гистограмма

-               Выборочная функция распределения

-               Таблица частот

Из перечисленных выше характеристик на практике по традиции чаще всего используют выборочные среднее, медиану и дисперсию (или стандартное отклонение). Однако для получения более точных и достоверных выводов необходимо использовать и другие показатели.

Особое внимание следует обратить на наличие в выборке выбросов – грубых, сильно отличающихся от основной массы, наблюдений. Большинство традиционных статистических методов весьма чувствительны к отклонениям от условий применимости метода. Поэтому выбросы могут не только исказить значение выборочных показателей, но и привести к ошибочным выводам. Подозрение о присутствии таких наблюдений должно возникнуть, если выборочная медиана сильно отличается от выборочного среднего, хотя в целом совокупность симметрична, или, если положение медианы сильно несимметрично относительно минимального и максимального элементов выборки. Проще всего обнаружить выбросы с помощью перехода от выборки к вариационному ряду или гистограмме с большим числом интервалов группировки.


2 Порядок выполнения работы   2.1 Исходные данные

Исходными данными является набор реализаций случайной величины (например, значения какой-либо величины, полученные при измерении). Размер выборки - n шт. Исходные данные оформить в виде таблицы (таблица 1).

Таблица 1 – Исходные данные

Номер реализации Значение Номер реализации Значение Номер реализации Значение Номер реализации Значение
1... ...n
2.2 Построение вариационного ряда

Для удобства работы с данными выборку преобразуют в вариационный ряд – ряд, в котором элементы выборки упорядочиваются по возрастанию.

Этапы выполнения:

1.   Найти наименьший элемент ряда Xmin

2.   Найти наибольший элемент ряда Xmax

3.   Записать ряд, начиная с наименьшего элемента Xmin и заканчивая наибольшим Xmax (таблица 2)

4.   Для упрощения процедуры обработки и с целью уменьшения ошибок при вычислениях необходимо вычесть из каждого элемента ряда постоянное число (например, округленное Xmin) и использовать в расчетах не сами размеры, а их отклонениями. Получившиеся отклонения записать в таблицу 2.


Таблица 2 – Вариационный ряд с отклонениями относительно x0 = <значение>[1]

Номер элемента Элемент Отклонение Номер элемента Элемент Отклонение
1... n
2.3 Группировка данных

Этапы выполнения:

1.  Разбить весь диапазон R = Xmax – Xmin на r интервалов. Число интервалов r устанавливают в зависимости от числа наблюдений n:

n r

40-100

100-500

5000-10000

7-9

8-12

10-16

При небольших выборках .

2.  Назначить длину интервалов. Длину интервалов Dx чаще всего выбирают одинаковой: Dx = R/r. Ее округляют до значения, удобного для графического отображения.

3.  Назначить нижнюю границу xн первого интервала (в отклонениях от x0). Она должна быть меньше xmin и удобной с позиции графического отображения. Результат занести в таблицу 3.

4.  Назначить нижние xн и верхние xв границы всех оставшихся интервалов (в отклонениях от x0). Результаты занести в таблицу 3.

5.  Определить число размеров, попадающих в интервал mi. Условие попадания размера xj в интервал xiн < xj £ xiв. Результаты занести в таблицу 3. Полученные результаты проверить по условию .

2.4 Определение частостей

Отношение частоты mi к общему числу наблюдений n называется частостью:

Частость представляет собой эмпирическую оценку вероятности попадания результатов наблюдений Хj в i интервал.

Определить частости и результаты занести в таблицу 3.

Полученные результаты проверить по условию .

2.5 Определение эмпирической плотности вероятностей

Эмпирическая плотность вероятностей равна:

Определить эмпирическую плотность вероятности, результаты занести в таблицу 3.

Таблица 3 – Расчетные данные

Номера интервалов Границы интервалов, <размерность> Частота, mi

Частость,

Эмпирическая плотность вероятности pi Середина интервала xi
1...


Для дальнейших геометрических построений необходимы значения середины интервалов xi. Определить их, результаты занести в таблицу 3.

2.6 Построение полигона

Этапы выполнения[2]:

1.   Определить масштабы по осям абсцисс и ординат, исходя их соотношения :R = 5 » 8.

2.   На оси абсцисс отложить интервалы значений измеряемой величины.

3.   В серединах интервалов отметить ординаты, пропорциональные частостям.

4.   Полученные точки соединить прямыми линиями.

Пример полигона приведен на рисунке 1.

Рисунок 1 – Пример полигона

Построение гистограммы распределения

Этапы выполнения:

1.   Повторить пункты 1-2 из 2.5.

2.   Над каждым интервалом по оси абсцисс построить прямоугольник, высота которого пропорциональна эмпирической плотности вероятностей.

Пример гистограммы распределения приведен на рисунке 2.

Рисунок 2 – Пример гистограммы распределения

2.7 Построение эмпирической функции распределения

В середине каждого интервала по оси абсцисс ордината возрастает скачком на значение, соответствующее .

Этапы выполнения:


Информация о работе «Описательная статистика»
Раздел: Экономика
Количество знаков с пробелами: 11171
Количество таблиц: 6
Количество изображений: 3

Похожие работы

Скачать
70243
3
0

... , а явилась результатом сложив­шейся ситуации и той большой подготовительной рабо­ты, которая проводилась еще в 30—40-х годах среди передовых русских исследователей социально-экономи­ческой жизни страны. Земская статистика в истории отечественной статис­тики занимает исключительное место. Земские статистики провели большую работу по де­тальному изучению многих сторон жизни русской дерев­ни, ...

Скачать
15591
0
0

... сбора и обработки данных, приёмы анализа информации. Появляется необходимость теоретического научного осмысления накопленной практики. 3 Английская научная школа политических арифметиков У истоков статистики как науки, а не только практической деятельности стояли две школы: английская научная школа политических арифметиков и немецкая описательная школа. Английская научная школа политических ...

Скачать
29348
0
0

... Для унимодальных симметричных распределений почти 70% значений лежит в интервале . Свойства дисперсии: 1. Влияние на дисперсию увеличения каждого значения на какую либо константу: , после выполнения математических операций убеждаемся, что дисперсия не изменяется. 2. Изменение дисперсии при умножении каждого исходного значения на константу: , то есть дисперсия увеличивается на квадрат константы. ...

Скачать
29536
5
3

... Для унимодальных симметричных распределений почти 70% значений лежит в интервале . Свойства дисперсии: 1. Влияние на дисперсию увеличения каждого значения на какую либо константу: , после выполнения математических операций убеждаемся, что дисперсия не изменяется. 2. Изменение дисперсии при умножении каждого исходного значения на константу: , то есть дисперсия увеличивается на квадрат ...

0 комментариев


Наверх