МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ ОРЛОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
ИНСТИТУТ БИЗНЕСА И ПРАВА
ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ФАКУЛЬТЕТ
Кафедра "Экономика и менеджмент"
А.В. Чернова
И.А. Краснобокая
СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗИ
СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ И ПРОЦЕССОВ
Методические указания по выполнению лабораторной работы
Дисциплина - "Статистика"
Специальность - 060400 "Финансы и кредит"
060500 "Бухгалтерский учет, анализ и аудит"
060800 "Экономика и управление на предприятиях
туризма и гостиничного хозяйства"
061000 "Государственное и муниципальное управление"
061100 "Менеджмент организации"
061500 "Маркетинг"
351000 "Антикризисное управление"
351200 "Налоги и налогообложение"
Печатается по решению редакционно-издательского совета Орел ГТУ
Орел 2003
Авторы: профессор кафедры экономики и менеджмента, доктор экономических наук А.В. Чернова, старший преподаватель кафедры экономики и менеджмента, кандидат экономических наук И.А. Краснобокая
Рецензент: заведующий кафедрой экономики и менеджмента, профессор, доктор экономических наук С.А. Никитин.
Методические указания по выполнению лабораторной работы содержат рекомендации и задания по установлению степени тесноты и характера направления зависимости между признаками. Предназначены для студентов специальностей 060400 "Финансы и кредит", 060500 "Бухгалтерский учет, анализ и аудит", 060800 "Экономика и управление на предприятиях туризма и гостиничного хозяйства", 061000 "Государственное и муниципальное управление", 061100 "Менеджмент организации", 061500 "Маркетинг", 351000 "Антикризисное управление", 351200 "Налоги и налогообложение" при изучении дисциплины "Статистика".
Редактор.
Технический редактор.
Орловский государственный технический университет
Лицензия ИД №00670 от 05.01.2000 г.
Подписано к печати. .03 г. Формат 60х84 1/16.
Печать офсетная. Уч. изд. л. Усл. печ. л.,. Тираж 300 экз.
Заказ №
Отпечатано с готового оригинал-макета на полиграфической базе ОрелГТУ, 302030, г. Орел, ул. Московская, 65.
Орел ГТУ, 2003
Чернова А.В., Краснобокая И.А., 2003
Содержание
1. Методические указания по выполнению лабораторной работы
2. Пример выполнения лабораторной работы
2.1 Задание на лабораторную работу
3. Порядок выполнения лабораторной работы
Рекомендуемая литература
Приложение
Наиболее разработанной в теории статистики является методология корреляционно-регрессионного анализа парной корреляции, которая исследует связь между одним признаком-фактором (х) и одним признаком-результатом (у).
В основу выявления и установления аналитической формы связи положено применение в анализе исходной информации математических функций, для чего применяют различного вида уравнения прямолинейной и криволинейной связи.
Это уравнение называется уравнением регрессии (или уравнение парной зависимости).
Например, уравнение парной линейной корреляционной зависимости имеет следующий вид:
, (1)
где ух - теоретические значения результативного признака, полученные по уравнению регрессии;
a0, a1 - коэффициенты (параметры) уравнения регрессии.
Коэффициент парной линейной регрессии а1 показывает изменение результативного признака у под влиянием изменения факторного признака х. Уравнение (1) показывает среднее значение изменения результативного признака у при изменении факторного признака х на одну единицу его измерения, т.е. вариацию у, приходящуюся на единицу вариации х. Знак а1 указывает направление этого изменения.
Параметры уравнения a0, a1 определяют путем решения системы нормальных уравнений, полученной на основе метода наименьших квадратов.
В основу этого метода положено требование минимальности сумм квадратов отклонений фактических данных (уi) от выровненных (yxi):
S (уi - yxi) 2 = S (уi - а0 - а1×хi) 2 ® min, (2)
Так, для уравнения парной линейной зависимости система уравнений имеет следующий вид:
(3)
(4)
Параметры уравнения прямой будут иметь следующий вид:
(5)
. (6)
Определив значения а0, а1 и подставив их в уравнение связи , находим значение ух, зависящее только от заданного значения х.
Для прямолинейных зависимостей измерителем тесноты связи между признаками является коэффициент парной корреляции, который рассчитывается по формуле:
, (7)
где - среднее произведение факторного и результативного признака:
; (8)
- среднее значение факторного признака:
; (9)
- среднее значение результативного признака:
; (10)
- среднее квадратическое отклонение результативного признака:
; (11)
- среднее квадратическое отклонение факторного признака:
. (12)
Квадрат линейного коэффициента корреляции называется линейным коэффициентом детерминации:
r2 = d. (13)
Коэффициент детерминации показывает, какая часть общей вариации результативного признака (y) объясняется влиянием изучаемого фактора (x).
Для получения выводов о практической значимости синтезированных в анализе моделей, показаниям тесноты связи дается качественная оценка. Это осуществляется на основе шкалы Чеддока.
Таблица 1 - Шкала Чеддока
Показания тесноты связи | 0,1 - 0,3 | 0,3 - 0,5 | 0,5 - 0,7 | 0,7 - 0,9 | 0,9 - 0,999 |
Характеристика силы связи | слабая | умеренная | заметная | высокая | весьма высокая |
При r = 1 связь является функциональной, при r= 0 связь отсутствует. Если коэффициент корреляции со знаком "+", то связь прямая, если со знаком "-", то связь обратная.
Для практического использования моделей регрессии важна оценка их адекватности, т.е. соответствия фактическим статистическим данным.
Поскольку корреляционно-регрессионный анализ связи между признаками проводится для ограниченной по объему совокупности, то параметры уравнения регрессии, коэффициенты корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить насколько эти показатели характерны для всей генеральной совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенной статистической модели.
При численности объектов анализа до 30 единиц возникает необходимость проверки значимости (существенности) коэффициента регрессии. При этом выясняют насколько вычисленные параметры характерны для отображения условий: не являются ли полученные значения параметров результатом действия случайных причин.
Значимость параметров простой линейной регрессии осуществляется с помощью t-критерия Стьюдента. При этом вычисляют фактические (расчетные) значения t-критерия:
для параметра а0:
, (14)
где - средне квадратическое отклонение результативного признака
у от выровненных значений уx, которые рассчитываются по уравнению регрессии:
. (15)
для параметра а1:
. (16)
Вычисленные по формулам (13) и (15) значения, сравниваются с критическими tк, которые принимаются согласно данным таблицы Стьюдента с учетом заданного уровня значимости (a) и числа степеней свободы (k = n - 2). В социально-экономических исследованиях уровень значимости a обычно принимают равным 5%, т.е. a = 0,05, что соответствует доверительной вероятности 95%. Параметр признается существенным при условии, если tф > tк. В таком случае практически невероятно, что найденные значения параметров обусловлены только случайными совпадениями.
Показатели тесноты связи, исчисленные по данным сравнительно небольшой статистической совокупности, также могут искажаться действием случайных причин. Это вызывает необходимость проверки их существенности, дающей возможность распространять выводы по результатам выборки на генеральную совокупность.
Для оценки значимости линейного коэффициента корреляции r применяется t-критерий Стьюдента. При этом определяется фактическое (расчетное) значение критерия (trф):
, (17)
где n-2 - число степеней свободы при заданном уровне значимости a и объеме выборки n.
Вычисленное значение trфсравнивается с критическим tk, которое берется из таблицы Стьюдента с учетом заданного уровня значимости a и числа степеней свободы k = n - 2.
Если trф > tk, то это свидетельствует о значимости линейного коэффициента корреляции r и существенности связи между признаком-фактором и признаком-результатом.
Поскольку не все фактические значения результативного признака лежат на линии регрессии, более справедливо для записи уравнения корреляционной зависимости воспользоваться следующей формулой:
, (18)
где e - отражает случайную составляющую вариации результативного признака.
В некоторых случаях рассеяние точек корреляционного поля настолько велико, что для принятия решений в управлении не целесообразно пользоваться уравнением регрессии, так как погрешность в оценке анализируемого показателя будет чрезвычайно велика. Для всей совокупности наблюдаемых значений рассчитывается средняя квадратическая ошибка уравнения регрессии, которая представляет собой среднее квадратическое отклонение фактических значений результативного признака у относительно значений, рассчитанных по уравнению регрессии ух:
. (19)
Среднюю квадратическую ошибку уравнения регрессии Se сравнивают со средним квадратическим отклонением результативного признака sу. Если Se < sу, то использование уравнения регрессии в статистическом анализе является целесообразным.
Таким образом, опираясь на оценку существенности параметров уравнения регрессии и значений линейного коэффициента корреляции, а также на основании оценки надежности уравнения регрессии, дают заключение об адекватности построенной регрессионной модели и возможности распространения выводов, полученных по результатам малой выборки на всю генеральную совокупность.
После проверки адекватности, установления точности и надежности регрессионной модели необходимо ее проанализировать, т.е. дать экономическую интерпретацию параметров регрессии.
Для уравнения парной линейной зависимости прежде всего необходимо проверить согласуется ли знак параметра а1 с теоретическими представлениями и соображениями о направлении влияния признака-фактора на результативный признак. Для удобства интерпретации параметра а1 следует использовать коэффициент эластичности:
. (20)
Коэффициент эластичности показывает среднее изменение результативного признака при изменении факторного признака на 1% и вычисляется в% -ах.
Уравнение регрессионной зависимости является базой для расчета прогнозных значений результативного признака, стоящих за пределами изучаемого ряда. Для осуществления прогноза значений результативного признака по уравнению регрессии используют не дискретные (точечные), а интервальные оценки.
Средняя квадратическая ошибка уравнения регрессии дает возможность в каждом отдельном случае с определенной вероятностью указать, что величина результативного признака расположена в определенном интервале относительно значения, вычисленного по уравнению регрессии.
Зная дисперсию результативного показателя у и задаваясь уровнем доверительной вероятности, определяют доверительные границы прогнозного значения результативного признака упрогноз при значении факторного признака хо по формуле:
, (21)
где ухо - дискретная (точечная) оценка прогнозного значения результативного признака у, рассчитанная по уравнению регрессии, при заданном значении факторного признака хо;
ta - критерий Стьюдента, который для линейной зависимости определяется в соответствии с уровнем значимости a по распределению Стьюдента с k = n - 2 степенями свободы;
При практическом использовании уравнения регрессии следует помнить, что экстраполяция, т.е. нахождение прогнозируемых уровней за пределами изучаемого ряда, допускается только тогда, когда существенно не изменяются условия формирования уровней признаков, которые лежат в основе определения параметров уравнения регрессии. В противном случае использование уравнений для составления прогнозов должно быть отвергнуто.
2.1 Задание на лабораторную работу
На основе ранжированных данных о производительности труда и стаже работы двадцати рабочих бригады (таблица) необходимо:
2.1 Установить результативный и факторный признаки.
2.2 Определить наличие и форму корреляционной связи между производительностью труда рабочих бригады и стажем работы.
2.3 Построить на графике поле корреляции и эмпирическую линию корреляционной связи.
2.4 Построить регрессионную модель парной корреляционной зависимости и определить её параметры.
2.5 Построить на графике теоретическую кривую корреляционной зависимости.
2.6 Рассчитать показатели тесноты связи между выработкой рабочего и стажем работы. Дать качественную оценку степени тесноты связи.
2.7 Оценить существенность параметров регрессивной модели и показателей тесноты связи. Дать оценку надёжности уравнения регрессии.
2.8 Дать экспериментальную интерпретацию параметров построенной регрессионной модели.
2.9 На основании регрессионной модели парной зависимости указать доверительные границы, в которых будет находиться прогнозное значение уровня производительности труда рабочего бригады, если стаж его работы составит 10,5 лет при уровне доверительной вероятности 95%.
Решение:
Установим результативный и факторный признаки: результативный признак (y) - выработка, факторный (x) - стаж работы, лет.
Определим наличие и форму корреляционной связи между производительностью труда рабочих бригады и стажем работы. Так как увеличение значений признака-фактора влечёт за собой увеличение величины результативного признака. То можно предположить наличие прямой корреляционной связи между выработкой и стажем работы. Проведём группировку работников бригады по признаку-фактору - стажу работы. Результаты оформим в таблицу 2. Сравнив средние значения результативного признака по группам, можно сделать вывод о наличии связи между выработкой и стажем работы. Причём она будет являться прямой, так как рост значений признака фактора влечёт рост средних значений признака результата.
Построим поле корреляции.
Построим регрессионную модель парной корреляционной зависимости и определим её параметры: - уравнение парной линейной корреляционной зависимости (регрессионная модель).
→, →
Таблица 2 - Расчётная таблица.
8 | 800 | 6400 | 640000 | 64 | 789,02 | -1,95 | 3,8025 | 152,5 | 23256,25 | 10,98 | 120,56 |
8 | 850 | 6800 | 722500 | 64 | 102,5 | 10506,25 | 60,98 | 3718,56 | |||
8 | 720 | 5760 | 518400 | 64 | 232,5 | 54056,25 | -69,02 | 4763,76 | |||
9 | 850 | 1650 | 722500 | 81 | 872,86 | -0,95 | 0,9025 | 102,5 | 10506,25 | -22,86 | 622,57 |
9 | 800 | 7200 | 640000 | 81 | -152,5 | 23256,3 | -72,86 | 5308,57 | |||
9 | 880 | 7920 | 774400 | 81 | -72,5 | 5256,25 | 7,14 | 50,98 | |||
9 | 950 | 8550 | 902500 | 81 | 2,5 | 6,25 | 77,14 | 5950,57 | |||
9 | 820 | 7380 | 672400 | 81 | -132,5 | 17556,25 | -52,86 | 2794,17 | |||
10 | 900 | 9000 | 810000 | 100 | 956,7 | 0,05 | 0,0025 | -52,5 | 2756,25 | -56,7 | 3114,89 |
10 | 1000 | 10000 | 1000000 | 100 | 47,5 | 2256,25 | 43,3 | 1874,89 | |||
10 | 920 | 9200 | 846400 | 100 | -32,5 | 1056,25 | -36,7 | 1346,89 | |||
10 | 1060 | 10600 | 1123600 | 100 | 107,5 | 11556,25 | 103,3 | 10670,89 | |||
10 | 950 | 9500 | 902500 | 100 | 2,5 | 6,25 | -6,7 | 44,89 | |||
11 | 900 | 9900 | 810000 | 121 | 1040,54 | 1,05 | 1,1025 | -52,5 | 2756,25 | -140,54 | 975,15 |
11 | 1200 | 13200 | 1440000 | 121 | 247,5 | 61256,25 | 159,46 | 25421, 19 | |||
11 | 1150 | 12650 | 1322500 | 121 | 197,5 | 39006,5 | 109,46 | 11981,49 | |||
11 | 1000 | 11000 | 1000000 | 121 | 47,5 | 2256,25 | -40,54 | 1643,49 | |||
12 | 1200 | 14400 | 1440000 | 144 | 1124,38 | 2,05 | 4, 2025 | 247,5 | 6156,25 | 75,62 | 5718,38 |
12 | 1100 | 13200 | 1210000 | 144 | 147,5 | 21756,25 | -24,38 | 594,38 | |||
12 | 1000 | 12000 | 1000000 | 144 | 47,5 | 2256,25 | -124,38 | 5470,38 | |||
199 | 19050 | 192310 | 2013 | 19050,16 | 32,95 | 358275 | 12969,33 |
Найдём среднее произведение факторного и результативного признака по формуле (8):
.
Рассчитаем средние значение факторного и результативного признака:
факторного по формуле (9):
.
результативного, по формуле (10):
; .
Подставим значения результативного и факторного признака в уравнение парной линейной корреляционной зависимости получим регрессионную модель парной корреляционной зависимости: - регрессионная модель зависимости выработки от стажа работы.
; .
... уравнения для оценки неизвестных значении зависимой переменной. Решение названных задач опирается на соответствующие приемы, алгоритмы, показатели, применение которых дает основание говорить о статистическом изучении взаимосвязей. Следует заметить, что традиционные методы корреляции и регрессии широко представлены в разного рода статистических пакетах программ для ЭВМ. Исследователю остается ...
... особого этапа статистического исследования – сводки. Сводка – это характеристика выделенных групп и совокупности в целом с помощью статистических показателей. Статистический показатель – это обобщающая характеристика социально-экономических явлений и процессов в конкретных условиях места и времени. Обобщающие показатели могут быть представлены абсолютными, относительными и средними величинами. ...
... исследуемых объектов, приводит к изменению установившихся причинно-следственных связей. Именно поэтому изучение структуры и структурных сдвигов занимает важное место в курсе теории статистики. В статистике под структурой понимают совокупность единиц, обладающих определенной устойчивостью внутригрупповых связей при сохранении основных признаков, характеризующих эту совокупность как целое. Основные ...
... потребления, но без учета «челночной» торговли, «оседающих» транзитных товаров и неэквивалентного бартера. Лекция 17 Статистика предпринимательства 1.Социально-экономическая сущность предпринимательства и задачи статистики. 2.Показатели статистики предпринимательства. Особенности статистического изучения малого предпринимательства 3.Тенденции развития малого предпринимательства в ...
0 комментариев