Определить показатели тесноты связи (коэффициент корреляции - r или корреляционное отношение - η)

25798
знаков
13
таблиц
13
изображений

2. Определить показатели тесноты связи (коэффициент корреляции - r или корреляционное отношение - η).

3. Нанести уравнение регрессии на график, полученный в задаче № 4. Проследить, как выявленная методом корреляционного анализа теоретическая линия регрессии (прямая или кривая) расположена относительно эмпирической.

Определение коэффициента корреляции.

Коэффициент корреляции (между двумя признаками) характеризует интенсивность связи между ними; он может изменяться в пределах от - 1,0 до +1,0. Знак коэффициента характеризует направление изменения результативного признака при увеличении факторного.

 (5)

Таблица 8 - Расчет коэффициента корреляции

Хi Уi ХiУi

Хi2

Уi2

1 1635,72 209,14 342090,70 2675590,62 43738,40
2 1439,29 196,06 282182,54 2071543,37 38438,48
3 1408,65 193,67 272817,55 1984286,37 37509,41
4 1253,17 191,45 239915,48 1570440,58 36651,78
5 1203,06 183,16 220353,98 1447356,31 33547,98
6 1163, 19 182,67 212481,80 1353005,99 33369,04
7 1080,65 180,78 195359,88 1167793,96 32681,69
8 1039,45 179,71 186800,36 1080453,71 32296,04
9 970,11 179,64 174270, 20 941111,81 32270,45
10 958,67 178,18 170814,71 919053,09 31747,53
11 944,78 178,09 168252,47 892616,08 31714,52
12 883, 19 176,95 156278,99 780017,23 31311,00
13 869,62 175,98 153036,70 756232,49 30969,62
14 866,90 175,73 152340,80 751520,81 30881,01
15 828,83 175,10 145127,82 686957,23 30659,96
16 819,40 175,04 143424,73 671411,74 30637,91
17 811,53 174,85 141891,52 658573,51 30570,93
18 792,50 174,47 138263,79 628052,18 30438,36
19 785,89 173,76 136556, 20 617616,00 30192,86
20 766,24 173,69 133088,42 587127,99 30168,08
21 766,24 173,26 132758,92 587123,74 30019,11
22 763,77 165,94 126742,12 583345,47 27536,97
23 762,01 160,80 122527,86 580653,07 25855,50
24 744,16 160,53 119460,11 553768,36 25770, 19
25 741,97 150,48 111651,77 550520,67 22644,23
26 705,47 145,48 102635,02 497692,86 21165,56
27 694,35 136,14 94532,44 482124,44 18535,43
28 549,94 134,75 74102,64 302429,04 18156,99
29 527,98 127,96 67558,48 278766,08 16372,68
30 514, 19 121,97 62714,28 264389,85 14876,07

27290,89

5105,41

4780032,26

26921574,62

880727,78

Проверим значимость коэффициента корреляции, т.е. возможность отвергнуть теорию о некоррелированности рассматриваемых величин.

Для этого определим коэффициент  (6)

Для нашего примера

В справочнике найдем табличное значение критерия значимости. При заданной вероятности Р=0,95 и N=30 . Условие, при котором отвергают гипотезу о некоррелированности исследуемых величин . Условие выполняется, следовательно гипотезу некоррелированности признаков можно отвергнуть с заданным уровнем надежности.

Построение линейной регрессионной модели.

Наибольшее распространение получил метод наименьших квадратов МНК, при использовании которого ставится требование, чтобы сумма квадратов разностей между эмпирическими и теоретическими значениями была минимальной.

Оценка линейности связи

Для решения поставленной задачи используем дисперсионный анализ. Если теоретическая линейная регрессия действительно выражает форму эмпирической связи, то отклонения эмпирической линии регрессии от теоретической будут случайными.

В случае если в действительности связь не прямолинейна, отклонения не будут случайными, а будут отражать кривизну эмпирической регрессии. Поэтому вопрос о линейной регрессии может быть решен путем сравнения неслучайных и случайных отклонений.

Неслучайные отклонения характеризуются дисперсией отклонения теоретической регрессии от среднего. Случайные отклонения характеризуются дисперсией остатка.

Определение общей дисперсии по результативному признаку

 

(7.1)

(7.2)

 

где К1 - число степеней свободы, приходящееся на регрессию; равно числу независимых переменных (для парной регрессии К1=1)

К2-число степеней свободы, приходящееся на остаток (К2=N - К1-1=28)

Y - теоретическое значение результативного признака, найденное по уравнению парной регрессии.

Таблица 9 - Расчет общей дисперсии

Х Y

Х Y

1635,72 222 2800,59 170,16 819,40 167 5,89 2222,63
1439,29 209 1568,33 682,48 811,53 166 8,76 2240,72
1408,65 207 1408,12 812,72 792,50 165 18,06 2276,79
1253,17 196 728,12 944,65 785,89 165 22,07 2344,56
1203,06 193 556,31 1522,60 766,24 163 36,36 2351,48
1163, 19 190 436,09 1561,01 766,24 163 36,36 2393,30
1080,65 185 233,67 1714,03 763,77 163 38,41 3162,82
1039,45 182 156,08 1803,76 762,01 163 39,91 3768,14
970,11 177 60,72 1809,81 744,16 162 56,66 3800,80
958,67 176 49,23 1936,29 741,97 162 58,92 5141,12
944,78 175 36,90 1944,45 705,47 159 103,03 5882,55
883, 19 171 3,60 2045,98 694,35 158 118,90 7402,33
869,62 170 0,96 2134,42 549,94 149 428,32 7644,66
866,90 170 0,63 2157,76 527,98 147 492,14 8878,51
828,83 167 3, 19 2216,69 514, 19 146 534,51 10042,88
10040,86 93010,09

Таким образом:

S1=10040,86/1=10040,86

S2=93010,09/28=3321,79

Для установления соответствия эмпирической регрессии линейной форме связи определяют дисперсионное отношение F=S1/S2 и сравнивают со значением из справочника при заданной надежности.

F=10040,86/3321,79=3,03, табличное значение F=4,2.

Фактическое значение меньше табличного, значит прямолинейная форма связи не соответствует эмпирическим данным.

Рисунок 2 - Графическая интерпретация теоретической и эмпирической регрессии

Корреляционный анализ статистических данных показал относительно высокую степень связи между факторным и результативным признаками.

Регрессионный анализ позволил подобрать регрессионную линейную модель методом наименьших квадратов. Насколько эта модель адекватна экспериментальным данным доказала проверка с помощью дисперсионного анализа. В частности, была проверена гипотеза о том, что регрессионная модель точнее описывает результаты эксперимента, чем среднее по всем опытам. С достоверностью 95 % эта гипотеза подтвердилась.

 

Задача № 6

Для изучения показателей производительности труда на предприятии, число рабочих на котором составляет 5000 человек, было проведено методом случайного бесповторного отбора обследование квалификации рабочих в процентном отношении (таблица 10).


Таблица 10

Число рабочих Квалификация рабочих (тарифные разряды) Заданная вероятность Р
1 2 3 4 5 6
180 5 9 47 50 42 27 0,996

 

С заданной вероятностью следует определить:

а) процентное соотношение выборки для проведения обследования;

б) величину средней ошибки выборки;

в) предельную ошибку выборочной сpeднeй;

г) пределы, в которых находится средний тарифный разряд рабочих предприятия.

Средняя ошибка выборки для средней показывает расхождение выборочной и генеральной средней. При случайном бесповторном отборе она рассчитывается по следующей формуле

, (8)

где µ-средняя ошибка выборочной вредней;

n - численность выборки;

N - численность генеральной совокупности;

σ2 - дисперсия выборочной совокупности.

Предельная ошибка выборки рассчитывается по следующей формуле

∆=µ*t, (9)

где ∆ - предельная ошибка выборки;

µ - средняя ошибка выборочной средней;

t =2,9 - коэффициент доверия, зависящий от значения вероятности (р).

Пределы, в которых находится данная выборочная средняя, определяются по следующей формуле

, (10)

 

где  числовые значения пределов;

 - среднее значение выборочной совокупности;

∆ - предельная ошибка выборки.

Определим процентное соотношение выборки

Для этого количество рабочих каждого разряда разделим на количество всех рабочих и умножим на 100%.

Для удобства составим таблицу по результатам расчета

Таблица 11 - Результаты обработки исходных данных

Тарифный разряд I II III IV V VI
Число рабочих 5 9 47 50 42 27
Процентное соотношение 2,78 5,0 26,11 27,78 23,33 15,0
Заданная вероятность разряда, р 0,028 0,05 0,26 0,277 0,231 0,15

Для нахождения величины средней ошибки выборки необходимо определить величину дисперсии.

Способ I - Для этого найдем математическое ожидание

, (11)

где х - число рабочих разряда;

р - заданная вероятность разряда

 

Далее, дисперсия равна

 

 (12)

Таким образом, средняя ошибка выборки

Предельная ошибка выборки

Средний тарифный разряд рабочих предприятия равен 3,5.

Предел нахождения выборочной средней

Способ II - Определим дисперсию:

 

Предельная ошибка выборки

Предел нахождения выборочной средней

Оба способами дали практически одинаковый результат, что говорит о верности расчетов.

 

Задача № 7

Сведения об объемах вывозки древесины по 10 леспромхозам представлены в таблице 11.

Таблица 11

Леспромхоз Годы
1976 1977 1978 1979 1980 1981 1982 1983 1984 1985
Объем вывозки древесины, тыс. м3
2 169 172 183 189 198 212 235 249 268 301

Проанализировать данные динамического ряда по второму леспромхозу:

1)  Исчислить базисным методом абсолютный прирост, коэффициент роста, темп роста, темп прироста и значение одного процента прироста в абсолютном выражении

2)  Представить данные динамики объема вывозки древесины за 1976-1985гг. графически

3)  Провести выравнивание динамического ряда по способу наименьших квадратов.

Абсолютный прирост - разность между сравниваемым уровнем и уровнем более раннего периода, принятым за базу сравнения. При расчете базисным методом за базу принимают значение одного и того же уровня, например, начального.

i=yi - y0, (13)

1=172-169=3 (тыс. м3/год)

2=183-169=14 (тыс. м3/2года)

3=189-169=20 (тыс. м3/3года)

4=198-169=29 (тыс. м3/4года)

5=212-169=43 (тыс. м3/5лет)

6=235-169=66 (тыс. м3/6лет)

7=249-169=80 (тыс. м3/7лет)

8=268-169=99 (тыс. м3/8лет)

9=301-169=132 (тыс. м3/9лет)

 

Коэффициент роста Ki определяется как отношение данного уровня к предыдущему или базисному, показывает относительную скорость изменения ряда. Если коэффициент роста выражается в процентах, то его называют темпом роста.

Темп роста - отношение сравниваемого уровня (боле позднего) к уровню, принятому за базу сравнения (более раннему). Данный показатель говорит о том, сколько процентов составил сравниваемый уровень по отношению к уровню, принятому за базу, или во сколько раз сравниваемый уровень больше уровня, принятого за базу.

Ki/0 = yi/y0, (14)

K1/0=172/169=1,018 (раз) рост 1,8%

K2/0=183/169=1,083 (раз) рост 8,3%

K3/0=189/169=1,118 (раз) рост 11,8%

K4/0=198/169=1,171 (раз) рост 17,1%

K5/0=212/169=1,254 (раз) рост 25,4%

K6/0=235/169=1,391 (раз) рост 39,1%

K7/0=249/169=1,473 (раз) рост 47,3%

K8/0=268/169=1,586 (раз) рост 58,6%

K9/0=301/169=1,781 (раз) рост 78,1%

 

Темп прироста (относительный прирост) - отношение абсолютного изменения к базисному уровню или

Тпi=Ki*100-100, (15), Тп1=1,018*100-100=1,8 %

Тп2=1,083*100-100=8,3 %

Тп3=1,118*100-100=11,8 %

Тп4=1,171*100-100=17,1 %

Тп5=1,254*100-100=25,4 %

Тп6=1,391*100-100=39,1 %

Тп7=1,473*100-100=47,3 %

Тп8=1,586*100-100=56,8 %

Тп9=1,78*100-100=78,1 %

 

Абсолютное значение 1% прироста равно сотой части базисного уровня 132/78=1,69 (тыс. м3) или 169/100=1,69 (тыс. м3)

Простейшей системой корреляционной связи является линейная связь между двумя признаками - парная линейная корреляция.

Практическое ее значение в том, что есть системы, в которых среди всех факторов, влияющих на результативный признак, выделяется один важнейший фактор, который в основном определяет вариацию результативного признака. Уравнение парной линейной корреляционной связи называется уравнением парной регрессии

= а + bt, (16)

где  - среднее значение результативного признака;

t - порядковый номер периодов или моментов времени;

a - свободный член уравнении;

b - коэффициент регрессии, измеряющий среднее отношение отклонения результативного признака от его средней величины к отклонению факторного признака от его средней величины на одну единицу его измерения.

Параметры уравнения (16) рассчитываются методом наименьших квадратов (МНК). Система нормальных уравнений в данном случае имеет вид:

Исходное условие МНК для прямой линии имеет вид:

Поиск параметров уравнения можно упростить, если отчет времени производить так, чтобы сумма показателей времени изучаемого ряда динамики была равна нулю (). При четном числе уровней динамического ряда (как в нашем случае) периоды верхнее половины ряда (до середины) нумеруются - 1, - 3, - 5 и т.д., а нижней - +1, +3, +5 и т.д. При этом условии  будет равна нулю, и система нормальных уравнений преобразуется следующим образом:

Откуда

 = 217,6 и  = 169,01

Расчет параметров уравнения прямой представлен в таблице 12.

Таблица 12

Годы

Объем выработки, тыс. м3 у

Условное обозначение периодов, t у*t

t2

Выровненные уровни ряда динамики, тыс. м3

2001 169 -9 -1521 81 153,7273
2002 172 -7 -1204 49 167,9212
2003 183 -5 -915 25 182,1152
2004 189 -3 -567 9 196,3091
2005 198 -1 -198 1 210,503
2006 212 +1 212 1 224,697
2007 235 +3 705 9 238,8909
2008 249 +5 1245 25 253,0848
2009 268 +7 1876 49 267,2788
2010 301 +9 2709 81 281,4727
Итого 2176  2342 330 2176

По рассчитанным параметрам записываем уравнение прямой ряда динамики:

 = 217,6 +169,01* t

Выравнивание динамического ряда представлено на рисунке 4.

 

Задача № 8

По двум предприятиям имеются данные о количестве выработанной продукции и себестоимости единицы продукции.

Таблица 13 - исходные данные

Вид продукции Предприятие № 1 Предприятие № 2
Кол-во выработанной продукции, тыс. шт. Себестоимость ед. продукции, руб. Кол-во выработанной продукции, тыс. шт. Себестоимость ед. продукции, руб.
План Отчет План Отчет План Отчет План Отчет
А 5200 5300 35 33 2300 2600 32 24
В 4800 4850 55 54 5200 5500 58 51
Г 7100 7100 60 57 9400 9500 64 59

1)  Определить индексы средней себестоимости по трем видам продукции:

а) Индивидуальные

б) Переменного состава;

в) Постоянного (фиксированного) состава;

г) Структурных сдвигов

2) Провести анализ полученных результатов

Индекс - это показатель сравнения двух состоянии одного и того же явления. Каждый индекс включает два вида данных: оцениваемые данные, которые принято называть отчетными и обозначать значком "1", и данные, которые используются в качестве базы сравнения, - базисные, обозначаемые значком "О".

Индекс, который строится как сравнение обобщенных величин, называется сводным, или общим. Если же сравниваются необобщенные величины, то индекс называется индивидуальным.

Общее изменение образуется под влиянием изменений себестоимости на отдельные товары. Таким образом, индивидуальные индексы:

, (17)

где р1112 - отчетная себестоимость продукции по 1-му и 2-му предприятиям;

р0102 - плановая себестоимость продукции по 1-му и 2-му предприятиям

Продукция А:

Продукция В:

Продукция Г:

Индивидуальные индексы характеризуют относительное изменение себестоимости единицы каждого вида продукции в отчетном периоде по сравнению с базисным. Данные значения показывают, что себестоимость продукции А снизилась в 0,94 раза (на 6%) и в 0,75 раз (на 25%) на первом предприятии и втором предприятии соответственно. Себестоимость продукции В - снизилась в 0,98 раз (на 2%) и в 0,88 раз (на 12%); продукции Г - снизилась в 0,95 раз (на 5%) и в 0,92 раза (на 8%).

Для определения общего изменения себестоимости продукции на обоих предприятиях, необходимо рассчитать агрегатный индекс.

Агрегатные индексы качественных показателей могут быть рассчитаны как индексы переменного состава и индексы фиксированного состава. В индексах переменного состава сопоставляются показатели, рассчитанные на базе изменяющихся структур явлений, а в индексах фиксированного состава - на базе неизменной структуры явлений.

Индексы позволяют проанализировать изменения средних величин.

Отношение двух взвешенных средних с меняющимися (переменными) весами, показывающее изменение индексируемой величины, носит название индекс переменного состава.

Изменение средней себестоимости

, (18)

где  - средняя отчетная себестоимость продукции по 1-му и 2-му предприятиям;

 - средняя плановая себестоимость продукции по 1-му и 2-му предприятиям

Формула средней себестоимости

 

, (19)

где  - себестоимость продукции на i-ом предприятии

 - структура выработки продукции на i-ом предприятии

ПродукцияА:

Продукция В:

Продукция Г:

Тогда индекс:

Продукция А:

Продукция В:

Продукция Г:

Рассчитанный выше признак отражает не только изменение осредняемого признака, но и структуру совокупности. На основе индекса средней величины могут быть рассчитаны индексы самого осредняемого признака при постоянстве структуры (индекс постоянного состава) и индекс структуры (структурных сдвигов).

Индекс постоянного состава

 

, (20)

Продукция А:

Продукция В:

Продукция Г:

Рассчитанный выше индекс показывает, какого было изменение средней себестоимости продукции по двум предприятиям, если бы удельный вес выработанной продукции на предприятиях в базисном периоде был таким же, как и в отчетном. То есть себестоимость продукции А снизилась бы на 12%, продукции В - на 7% и продукции Г - на 7%.

Величины индексов переменного и фиксированного состава получились практически одинаковыми, что свидетельствует об незначительных структурных сдвигах

Величина взвешенной средней зависит от двух факторов - изменения отдельной себестоимости и от изменения в структуре весов. Поэтому, если веса не остаются постоянными, индекс фиксированного состава будет отличаться от индекса переменного состава в меру отношения, получившего название индекс структурных сдвигов

 

, (21)

Продукция А:

Продукция В:

Продукция Г:

Формулы индексов (23) и (24) основаны на общепринятом правиле, по которому структура совокупности (выработки продукции) как первичная характеристика при индексации себестоимости закрепляется на уровне отчетного периода, а себестоимость как вторичная характеристика при индексации структуры закрепляется на уровне базисного периода.

То есть, среднее снижение себестоимости на предприятиях было примерно таким же, как и снижение средней себестоимости для разных видов продукции. За счет изменения структуры выработки продукции средняя себестоимость продукции А снизилась на 0,2% (или на 6 коп.), продукции В увеличилась на 0,1% (или на 3 коп.). Средняя себестоимость продукции Г осталась без изменений.

 

Задача № 9

Имеются данные о выпуске однородной продукции по трем предприятиям отрасли.


Таблица 14 - Исходные данные

Предприятие Объем выпуска продукции, тыс. шт. Ср. списочное число рабочих, тыс. чел.
Базисный период Отчетный период Базисный период Отчетный период
1 2357 2361 10 9,8
2 5462 5328 15 12,3
3 833 826 3,2 2,8

1)  Определить:

а) Индексы производительности труда на каждом предприятии и по трем предприятиям вместе (переменного состава)

б) Индекс фиксированного состава

в) Индекс структурных сдвигов

2) Провести анализ полученных результатов

Индекс производительности можно рассматривать как показатель влияния производительности труда на объем выпуска продукции. Такое предположение базируется на следующей связи признаков:

произв-сть труда * ср. списочное число рабочих = объем выпуска продукции

w *f = Q, (22)

Системе признаков соответствует система индексов (т.е. показателей их изменений). Индекс производительности труда

 

, (23)

, (24)

Предприятие №1:

Предприятие №2:

Предприятие №3:

По трем предприятиям:

Опираясь на формулы (20) и (21), используемые в задаче № 8, найдем индекс фиксированного состава и структурных сдвигов.

Индекс фиксированного состава

 

Предприятие №1:

Предприятие №2:

Предприятие №3:

По трем предприятиям:

Полученные цифры говорят об изменении производительности труда в большую сторону при условии, если бы удельный вес объема выпуска продукции в базисном периоде был таким же, как в отчетном.

Индекс структурных сдвигов

Предприятие №1:

Предприятие №2:

Предприятие №3:

По трем предприятиям:

Значения индексов структуры показывают, что изменение структуры производства не повлияло на производительность труда.


Информация о работе «Процесс обработки статистикой информации»
Раздел: Экономико-математическое моделирование
Количество знаков с пробелами: 25798
Количество таблиц: 13
Количество изображений: 13

Похожие работы

Скачать
49693
0
0

... статистической информации на ЭВМ. 3. Организация решения статистических задач с помощью комплекса средств новой технологии для обработки статистической информации. Одной из главных особенностей автоматизированной обработки статистической информации является новая технология, обеспечиваю- щая более эффективную обработку на основе достижения технической, программной, ...

Скачать
172056
0
5

... первичной или первичной вместе со вторичной или только вторичной И. Если это - итог обработки информации, решения задачи, то такая информация называется результативной, результирующей. В процессе решения задач возникает промежуточная информация, которая часто в автоматизированных системах играет самостоятельную роль, определения направления путей завершения решения задачи. Результатная информация ...

Скачать
27450
12
12

... значимости 0,05 или 0,01. В формулу вводят соответствующее принимаемому уровню значение t (t0,05 или t0,01). Расчёты объёма выборки при различных вероятностях заключения помещены в таблицу 9. 2 Анализ лесоводственной информации При проведённых исследованиях нами была взята выборка в количестве 50 деревьев, у которых замерены и определены следующие показатели: диаметр дерева на высоте 1,3 ...

Скачать
95260
0
0

... пер- вичных статистических материалов, и вторичные, характеризуемые в процессе обработки и анализа данных. ПОКАЗАТЕЛЬ - одно из основных понятий статистики, под которым имеется в виду обобщенная колличественная характеристика социально-экономических явлений и процессов в их качественной определенности в условиях конкрет- ного места и времени. Примерами конкретных социально-экономических показате ...

0 комментариев


Наверх