Оценка тесноты корреляционной связи

Построение интервального ряда распределения Оценка тесноты корреляционной связи Изучение сезонных явлений Определение основной тенденции развития Изучение корреляционной зависимости между уровнями двух динамических рядов методом коррелирования разностей Изучение корреляционной зависимости между уровнями двух динамических рядов методом коррелирования с учётом фактора времени

20401

знак

таблиц

изображений

Построение интервального ряда распределения Читать далее: Изучение сезонных явлений

1. Оценка тесноты корреляционной связи

Из логических соображений выдвинем предположение, что признак (названный нами y) зависит от второго исследуемого признака x.

Используя проведенное в первом разделе разбиение значений x на интервалы, построим аналитическую таблицу:

Аналитическая таблица исследования зависимости признака y от признака x

Группы предприятий по признаку x	Число предприятий в j-ой группе mj	Признак y
Суммарное значение в группе	Среднее значение признака yi в j-ой группе на одно предприятие
31,4 – 34,02	8	250,8	31,3500
34,02 – 36,64	9	298,6	33,1778
36,64 – 39,26	6	207,8	34,6333
39,26 – 41,88	4	143,8	35,9500
41,88 – 44,5	3	113,3	37,7667

Далее рассчитываем общую дисперсию:

Модель распределения где - среднее значение признака для всей выборки, и межгрупповую дисперсию:

где - среднее значение признака в j-й группе; mj- численность j-й группы; k - число групп.

Модель распределения Для оценки тесноты связи между признаками y и x рассчитываем корреляционное отношение:

Оценку тесноты связи признаков y и x проводим по шкале Чеддока:

-если 0,3<h£0,5, то теснота связи заметная;

-если 0,5<h£0,7, то теснота связи умеренная;

-если 0,7<h£0,9, то теснота связи высокая;

-если 0,9<h£0,9(9), то теснота связи весьма высокая.

2. Определение формы связи двух признаков

Примерное представление о виде зависимости y от x даёт линия, проведённая через точки, соответствующие групповым средним и полученные на основе аналитической таблицы следующим образом: среднему значению признака в j-ой группе ставится в соответствие не середина интервала группирования по признаку x, а среднее значение , полученное из соответствующих интервалу значений признака x. Можно воспользоваться следующим приемом: построим все точки, соответствующие парам (хi;уi), в декартовой системе координат и провести линию через середины скоплений точек (График № 1).

Затем по справочнику плоских кривых и виду линии подбираем соответствующее уравнение регрессии. Однако не следует брать слишком сложное уравнение. В нашем случае берём линейную функцию:

Вычислив частные производные и приравняв их к нулю, получим систему линейных алгебраических уравнений относительно коэффициентов а и b. В нашем случае система уравнений имеет вид:

Модель распределения

Решая эту систему уравнений относительно b, получим:

Модель распределения

Решая первое уравнение относительно а, получим:

Т.о.:

Линейный коэффициент корреляции равен:

где sx и sy - средние квадратические отклонения признаков x и y.

Рассчитаем общую дисперсию:

Модель распределения и остаточную дисперсию:

где yx(хi) - значение величины y, рассчитанное по уравнению регрессии при подстановке в него значения xi; yi- значение величины y в исходной таблице, соответствующее значению xi.

Определим индекс корреляции:

Индекс корреляции принимает значения 0£ i £1.

Т.к. i близок к единице, то связь между признаками хорошо описана выбранным уравнением регрессии. Для линейной зависимости дополнительным условием для такого заключения является близость значений r и i.

Можно выбрать несколько видов уравнения регрессии. Наилучшим из них будет то уравнение, которому соответствует меньшая средняя квадратическая ошибка уравнения регрессии:

где m - число коэффициентов в уравнении регрессии.

Принимая во внимание то, что мы имеем дело с малой выборкой, необходимо оценить значимость коэффициентов уравнения регрессии, а также индекса корреляции i и линейного коэффициента корреляции r. Значимость линейного коэффициента корреляции r оцениваем с помощью критерия Стьюдента. Фактическое значение критерия Стьюдента равно:

Критическое (предельное) значение критерия Стьюдента tk, берем из табл.4 приложения, задаваясь уровнем значимости a=5,0 и имея число степеней свободы равное:

k=n-2

Если tr>tk, то величину линейного коэффициента корреляции считаем значимой и можем использовать в расчетах.

Значимость коэффициентов уравнения регрессии а и b также оцениваем с помощью критерия Стьюдента. Расчетные значения критерия Стьюдента равны:

Учитывая, что число степеней свободы также равно k=n-2, сравнение фактических значений критерия Стьюдента ведем с уже найденным критическим значением tk.

Если ta>tk, tb>tk, то соответствующий коэффициент уравнения регрессии значим, и мы можем им пользоваться. Значимость индекса корреляции определяем с помощью критерия Фишера. Фактическое значение критерия Фишера равно:

где m - число коэффициентов в уравнении регрессии.

Табличное значение критерия Фишера Fk; определяется по табл.5 приложения, задаваясь уравнением значимости a и числом степеней свободы k1=m-l; k2=n-m.

Если Fi>Fk, то величину индекса корреляции считаем значимой и можем ее использовать в расчетах.

Если коэффициенты а и b, а также линейный коэффициент корреляции r и индекс корреляции i значимы, то все наши расчеты и выводы, опирающиеся на эти величины, правомерны и мы можем использовать полученное уравнение регрессии для прогноза. Ошибка прогноза будет зависеть, в частности, от остаточной дисперсии s2e.

Раздел 3. Изучение динамических рядов

Построение интервального ряда распределения Читать далее: Изучение сезонных явлений

Раздел: Математика
Количество знаков с пробелами: 20401
Количество таблиц: 11
Количество изображений: 9

Скачать

... процесс с последействием. Чтобы исключить последействие, приходится вводить несколько параметров состоянии; задача на каждом шаге остается по-прежнему сложной из-за многомерности. 2.2 Двумерная модель распределения ресурсов Задача 2. Планируется деятельность двух предприятий (s=2) в течение n лет. Начальные средства составляют . Средства x, вложенные в предприятие I, приносят к концу года ...

Скачать

... 2.1. Предел статичности «черных дыр» в двоичной модели распределения плотности вещества 2.2. Горизонт «черных дыр» в двоичной модели распределения плотности вещества 3. Природа «темной материи» в двоичной модели распределения плотности вещества 4. Выводы 5. Подтверждения 6. Приложения 6.1. Фазовые переходы вещества в двоичной модели распределения плотности вещества 6.2. «Эффект темного ...

Скачать

... в пенсионный фонд (1% от зарплаты) 1345 Затраты на эксплуатацию оборудования (амортизацию) 976000 ИТОГО: 1207213 Заключение За время работы над дипломным проектом по теме «Организация удаленного доступа к распределенным базам данных» были изучены теоретические основы построения распределенных информационных систем с возможностью оперативного удаленного доступа к данным. ...

Скачать

... что при такой ориентации теста знания у сильных и слабых испытуемых измерялись с меньшей точностью. 3) Автоматизированный контроль знаний с применением компьютера и обработка результатов тестирования на ЭВМ для определения параметров качества тестирования. 2.1.9.4 Блок адаптивного обучения 1) Модели обучения. Информационные технологии оказывают решающее влияние на все этапы процесса обучения: ...

Главная Новости Рефераты Статьи Вузы

О проекте Соглашение

Наверх

Войти на сайт

Навигация

Похожие работы

0 комментариев

Разделы

Инфо

Следите за новостями