2. Основные статистические методы выявления корреляционной связи
К методам исследования взаимосвязей относятся: метод взаимосвязанных параллельных рядов, балансовый метод, индексный метод, метод аналитических группировок, корреляционные таблицы и графический метод.
Метод взаимосвязанных параллельных рядов состоит в установлении связей между экономическими явлениями посредством сопоставления показателей двух или нескольких рядов. Для этого признак-фактор ранжируется, т.е. располагается в порядке возрастания или убывания признака и соответственно ему записываются значения результативного признака. Путем сравнения взаимосвязанных рядов выявляется наличие связи и ее направление. Можно сравнивать временные и территориальные ряды.
Балансовый метод применяется для анализа связей и пропорций в экономике. Баланс представляет систему показателей, состоящей из равенства ресурсов и их распределения. Схема баланса может быть представлена равенством:
а + б= в + с
(Остаток начальный + Поступление = Расход + Остаток конечный).
Индексный метод - метод анализа компонентных связей. Это вид связей, когда изменение какого-то сложного явления целиком определяется изменением компонентов, входящих в это сложное явление как множители (а= бв, или ). Индексный метод анализа позволяет определить роль отдельных компонентов в совокупном изменении сложного явления.
Метод аналитических группировок - это установление связи между двумя и более признаками группировкой единиц по факторному признаку, а затем в группах вычисление средних и относительных величин результативного признака. Для оценки тесноты связи одновременно с методом группировок рассчитываются коэффициенты детерминации и эмпирическое корреляционное отношение.
Корреляционная таблица охватывает два ряда распределения: один ряд представляет факторный признак, а другой - результативный. Концентрация частот около диагонали, соединяющей левый верхний угол с правым нижним углом таблицы, выражает прямую связь, и наоборот, концентрация частот около диагонали, соединяющей левый . нижний угол с правым верхним углом таблицы, выражает обратную связь. Интенсивная концентрация частот около диагонали таблицы указывает на существование тесной корреляционной связи. Корреляционная таблица дает более правильную характеристику связи при условии, что число групп по двум признакам одинаково.
Графический метод состоит в построении графиков. На графике значения факторного признака наносятся на ось абсцисс, а результативного признака - на ось ординат. Если нанести на график средние значения результативного признака, то получим ломаную линию, которая называется эмпирической линией регрессии.
3. Корреляционно-регрессионный анализ. Уравнение парной регрессия: экономическая интерпретация и оценка значимости
Основная задача корреляционного анализа заключается в выявлении взаимосвязи между случайными переменными путем точечной и интервальной оценки парных (частных) коэффициентов корреляции, вычисления и проверки значимости множественных коэффициентов корреляции и детерминации. Кроме того, с помощью корреляционного анализа решаются следующие задачи: отбор факторов, оказывающих наиболее существенное влияние на результативный признак, на основании измерения степени связи между ними; обнаружение ранее неизвестных причинных связей. Корреляция непосредственно не выявляет причинных связей между параметрами, но устанавливает численное значение этих связей и достоверность суждений об их наличии.
Регрессионный анализ предназначен для исследования зависимости исследуемой переменной от различных факторов и отображения их взаимосвязи в форме регрессионной модели.
В регрессионных моделях зависимая (объясняемая) переменная Y может быть представлена в виде функции f (X1, X2, X3, … Xm), где X1, X2, X3, … Xm - независимые (объясняющие) переменные, или факторы. В качестве зависимой переменной может выступать практически любой показатель, характеризующий, например, деятельность предприятия или курс ценной бумаги. В зависимости от вида функции f (X1, X2, X3, … Xm) модели делятся на линейные и нелинейные. В зависимости от количества включенных в модель факторов Х модели делятся на однофакторные (парная модель регрессии) и многофакторные (модель множественной регрессии).
Связь между переменной Y и m независимыми факторами можно охарактеризовать функцией регрессии Y= f (X1, X2, X3, … Xm), которая показывает, каково будет в среднем значение переменной yi, если переменные xi примут конкретные значения.
Данное обстоятельство позволяет использовать модель регрессии не только для анализа, но и для прогнозирования экономических явлений.
Под линейностью здесь имеется в виду, что переменная y предположительно находиться под влиянием переменной x в следующей зависимости:
,
где - постоянная величина (или свободный член уравнения), - коэффициент регрессии, определяющий наклон линии, вдоль которой рассеяны данные наблюдений. Это показатель, характеризующий изменение переменной , при изменении значения на единицу. Если - переменные и положительно коррелированные, если < 0 – отрицательно коррелированны; - независимые одинаково распределенные случайные величины – остаток с нулевым математическим ожиданием () и постоянной дисперсией (). Она отражает тот факт, что изменение будет неточно описываться изменением Х – присутствуют другие факторы, неучтенные в данной модели.
Для оценки параметров регрессионного уравнения наиболее часто используют метод наименьших квадратов (МНК), который минимизирует сумму квадратов отклонения наблюдаемых значений от модельных значений .
Согласно принципу метода наименьших квадратов, оценки и находятся путем минимизации суммы квадратов
по всем возможным значениям и при заданных (наблюдаемых) значениях. Задача сводится к известной математической задаче поиска точки минимума функции двух переменных. Точка минимума находится путем приравнивания нулю частных производных функции по переменным и . Это приводит к системе нормальных уравнений
решением которой и является пара , . Согласно правилам вычисления производных имеем
так что искомые значения , удовлетворяют соотношениям
Эту систему двух уравнений можно записать также в виде
Эта система является системой двух линейных уравнений с двумя неизвестными и может быть легко решена, например, методом подстановки. В результате получаем
(3.2)
Такое решение может существовать только при выполнении условия
что равносильно отличию от нуля определителя системы нормальных уравнений. Действительно, этот определитель равен
Последнее условие называется условием идентифицируемости модели наблюдений , и означает, что не все значения совпадают между собой. При нарушении этого условия все точки , лежат на одной вертикальной прямой
Оценки и называют оценками наименьших квадратов. Обратим еще раз внимание на полученное выражение для . Нетрудно видеть, что в это выражение входят уже знакомые нам суммы квадратов, участвовавшие ранее в определении выборочной дисперсии
Для двух переменных теоретический коэффициент корреляции определяется следующим образом:
.
где - дисперсии случайных переменных , а их ковариация.
Парный коэффициент корреляции является показателем тесноты связи лишь в случае линейной зависимости между переменными и обладает следующими основными свойствами:
Коэффициент корреляции принимает значение в интервале (-1,+1), или
|rxy| < 1.
Коэффициент корреляции не зависит от выбора начала отсчета и единицы измерения, т.е.
r (α1X+β; α2Y+β)= rxy,
где α1, α2, b - постоянные величины, причем α1>0, α2>0.
Случайные величины Х, Y, можно уменьшать (увеличивать) в α раз, а также вычитать или прибавлять к значениям одно и тоже число β - это не приведет к изменению коэффициента корреляции r.
При r = ±1 случайные величинысвязаны линейной зависимостью, т.е.
.
При r = 0 линейная корреляционная связь отсутствует.
В практических расчетах коэффициент корреляции r генеральной совокупности обычно не известен. По результатам выборки может быть найдена его точечная оценка – выборочный коэффициент корреляции r, так как выборочная совокупность переменных случайна, то в отличие от параметра r , r – случайная величина. Оценкой коэффициента корреляции является выборочный парный коэффициент корреляции:
= , (3.3)
Для оценки значимости коэффициента корреляции применяется t - критерий Стьюдента. При этом фактическое значение этого критерия определяется по формуле:
(3.4)
Вычисленное по этой формуле значение tнабл сравнивается с критическим значением t-критерия, которое берется из таблицы значений t Стьюдента с учетом заданного уровня значимости и числа степеней свободы.
Если tнабл > tкр, то полученное значение коэффициента корреляции признается значимым (то есть нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается). И таким образом делается вывод о том, что между исследуемыми переменными есть тесная статистическая взаимосвязь.
Если значение близко к нулю, связь между переменными слабая. Если случайные величины связаны положительной корреляцией, это означает, что при возрастании одной случайной величины другая имеет тенденцию в среднем возрастать. Если случайные величины связаны отрицательной корреляцией, это означает, что при возрастании одной случайной величины, другая имеет тенденцию в среднем убывать.
... тот специфический для данной науки круг вопросов, которые подлежат исследованию при изучении наукой своего объекта познания. Принципы, методы и приемы изучения предмета науки образуют методологию этой науки. Объектом изучения социально-экономической статистики является общество во всем многообразии его форм и проявлений. Это связывает социально-экономическую статистику со всеми другими науками, ...
... усиливает актуальность этого вопроса. 5. Преодоление существующей несопоставимости показателей социальной статистики и показателей, представленных в других отраслевых статистиках. 6. Моделирование социально-экономических связей с целью обнаружения механизмов взаимодействия в общественной системе. На макроуровне представлен ряд объективно существующих ограничительных факторов, ...
... уравнения для оценки неизвестных значении зависимой переменной. Решение названных задач опирается на соответствующие приемы, алгоритмы, показатели, применение которых дает основание говорить о статистическом изучении взаимосвязей. Следует заметить, что традиционные методы корреляции и регрессии широко представлены в разного рода статистических пакетах программ для ЭВМ. Исследователю остается ...
... агрегатный индекс производительности труда – Уt= . Наиболее типичным общим индексом количественных показателей является индекс физического объема, который записывается в виде формулы: Уq= . В экономико-статистическом анализе приходится сравнивать в динамике такие обобщающие показатели качественных характеристик, как средняя цена, средняя себестоимость, средняя производительность труда и другие. ...
0 комментариев