1.2. Линейный множественный регрессионный анализ

Регрессионный анализ, по-видимому, наиболее широко используемый метод многомерного статистического анализа. Термин ''множественная регрессия'' объясняется тем, что анализу подвергается зависимость одного признака (результирующего) от набора независимых (факторных) признаков. Разделение признаков на результирующий и факторные осуществляется исследователем на основе содержательных представлений об изучаемом явлении (процессе). Все признаки должны быть количественными (хотя допускается и использование дихотомических признаков, принимающих лишь два значения, например 0 и 1).При поведении экспериментов в множественной ситуации исследователь записывает показания приборов о состоянии функции отклика (y) и всех факторов, от которых она зависит (xi).

При построении регрессионных моделей, прежде всего, возникает вопрос о виде функциональной зависимости, характеризующей взаимосвязи между результирующим признаком и несколькими признаками-факторами. Выбор формы связи должен основываться на качественном, теоретическом и логическом анализе сущности изучаемых явлений. Чаще всего ограничиваются линейной регрессией, т.е. зависимостью вида [2]:

Y=a0+a1x1+a2x2+…+anxn (12)

где Y - результирующий признак; x1, …, xn - факторные признаки; a1,…,an - коэффициенты регрессии; а0 - свободный член уравнения. aiнаходим методом наименьших квадратов, для этого рассматривается функции [2]:

(13)

Находим частные производные по неизвестным переменным, приравниваем к нулю и получаем систему уравнений. Решая систему, можем найти наименьшее значение функции.

Так как запись множественной регрессии (линейной) в матричной форме имеет вид [2]:

Y=X*A, (14)

где Y - это вектор-столбец опытных значений изучаемой характеристики; X –матрица всех значений всех рассматриваемых факторов, полученных при проведении измерений или наблюдений; А – вектор-столбец искомых коэффициентов аппроксимирующего полинома (12) [2]:

Y= ; (15)


X=; (16)

Y=; (17)

Тогда функционал F метода наименьших квадратов имеет вид [2]:

 (18)

Для оценки адекватности рассчитанной регрессионной модели вычисляется коэффициент детерминации, он показывает, какая часть дисперсии функции отклика объясняется вариацией линейной комбинации выбранных факторов x1, x2 ,…, xj, xn [2]:

 ,  (19)

где - прогнозные значения

и множественный коэффициент корреляции [2]:

. (20)

 Значение коэффициента множественной корреляции оценивается с помощью таблицы 2 [1]:

Таблица Чеддока  Таблица 2

диапазон измерения характер тесноты

слабая

умеренная

заметная

высокая

весьма высокая

1.3. Множественный корреляционный анализ

Расчеты обычно начинают с вычисления парных коэффициентов корреляции, характеризующих тесноту связи между двумя величинами. В множественной ситуации вычисляют два типа парных коэффициентов корреляции:

1.  - коэффициенты, определяющие тесноту связи между функцией отклика y и одним из факторов  [2]:

. (21)

2.  - коэффициенты, показывающие тесноту связи между одним из факторов xiи фактором xm (i, m=) [2]:

(22)

.

Значение парного коэффициента изменяется, как указывалось выше, изменяется от -1 до +1. Если, например, коэффициент  - величина отрицательная, то это значит, что xiуменьшается с увеличением y. Если  положителен, то xiувеличивается с увеличением y.

Значимость парных коэффициентов корреляции можно проверить двумя способами:

1) сравнение с табличным значениями  [2]:

, (23)

2) по t-критерию Стьюдента [2]:

,  (24)

Где  - среднеквадратическая погрешность выборочного парного коэффициента корреляции [2]:

.  (25)

Здесь  определяется по таблице с числом степеней свободы .

Доверительный интервал для парных коэффициентов корреляции [2]:

,  (26)

где  - парный коэффициент корреляции в генеральной совокупности.

Если один из коэффициентов  окажется равным 1, то это означает, что факторы xi и xmфункционально (не вероятностно) связаны между собой и тогда целесообразно один из них исключить из рассмотрения, причем оставляют тот фактор, у которого коэффициент  больше.

После вычисления всех парных коэффициентов корреляции и исключения из рассмотрения того или иного фактора можно построить матрицу коэффициентов корреляции вида [2]:

. (27)

Используя матрицу (23) можно вычислить частные коэффициенты, которые показывают степень влияния одного из факторов xi на функцию отклика y при условии, что все остальные факторы закреплены на постоянном уровне. Формула для вычисления частных коэффициентов корреляции такова [2]:

,  (28)

где  - определитель матрицы, образованной из матрицы (27) вычеркиванием 1-й строки, i-го столбца. Определители ,  вычисляются аналогично. Как и парные коэффициенты, частные коэффициенты корреляции изменяются от -1 до +1.



Информация о работе «Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса»
Раздел: Бухгалтерский учет и аудит
Количество знаков с пробелами: 25884
Количество таблиц: 9
Количество изображений: 3

0 комментариев


Наверх