1. Оценка тесноты корреляционной связи

Из логических соображений выдвинем предположение, что признак (названный нами y) зависит от второго исследуемого признака x.

Используя проведенное в первом разделе разбиение значений x на интервалы, построим аналитическую таблицу:

Аналитическая таблица исследования зависимости признака y от признака x

Группы предприятий по признаку x Число предприятий в j-ой группе mj Признак y
Суммарное значение в группе Среднее значение признака yi в j-ой группе на одно предприятие
31,4 – 34,02 8 250,8 31,3500
34,02 – 36,64 9 298,6 33,1778
36,64 – 39,26 6 207,8 34,6333
39,26 – 41,88 4 143,8 35,9500
41,88 – 44,5 3 113,3 37,7667

Далее рассчитываем общую дисперсию:

Модель распределения

Модель распределениягде Модель распределения - среднее значение признака для всей выборки, и межгрупповую дисперсию:

где Модель распределения - среднее значение признака в j-й группе; mj- численность j-й группы; k - число групп.

Модель распределения Модель распределения

Модель распределенияДля оценки тесноты связи между признаками y и x рассчитываем корреляционное отношение:

Оценку тесноты связи признаков y и x проводим по шкале Чеддока:

-если 0,3<h£0,5, то теснота связи заметная;

-если 0,5<h£0,7, то теснота связи умеренная;

-если 0,7<h£0,9, то теснота связи высокая;

-если 0,9<h£0,9(9), то теснота связи весьма высокая.

Модель распределения

2. Определение формы связи двух признаков

Примерное представление о виде зависимости y от x даёт линия, проведённая через точки, соответствующие групповым средним и полученные на основе аналитической таблицы следующим образом: среднему значению признака Модель распределения в j-ой группе ставится в соответствие не середина интервала группирования по признаку x, а среднее значение Модель распределения, полученное из соответствующих интервалу значений признака x. Можно воспользоваться следующим приемом: построим все точки, соответствующие парам (хi;уi), в декартовой системе координат и провести линию через середины скоплений точек (График № 1).

Модель распределенияЗатем по справочнику плоских кривых и виду линии подбираем соответствующее уравнение регрессии. Однако не следует брать слишком сложное уравнение. В нашем случае берём линейную функцию:

Вычислив частные производные и приравняв их к нулю, получим систему линейных алгебраических уравнений относительно коэффициентов а и b. В нашем случае система уравнений имеет вид:

Модель распределения

Решая эту систему уравнений относительно b, получим:

Модель распределения

Решая первое уравнение относительно а, получим:

Модель распределения

Модель распределенияМодель распределения

Модель распределения Т.о.:

Модель распределения

Линейный коэффициент корреляции равен:

где sx и sy - средние квадратические отклонения признаков x и y.

Модель распределения
Модель распределения

Рассчитаем общую дисперсию:

Модель распределенияи остаточную дисперсию:

где yx(хi) - значение величины y, рассчитанное по уравнению регрессии при подстановке в него значения xi; yi- значение величины y в исходной таблице, соответствующее значению xi.

Модель распределения Модель распределения

Определим индекс корреляции:

Модель распределения

Индекс корреляции принимает значения 0£ i £1.

Модель распределения

Т.к. i близок к единице, то связь между признаками хорошо описана выбранным уравнением регрессии. Для линейной зависимости дополнительным условием для такого заключения является близость значений r и i.

Модель распределения

Можно выбрать несколько видов уравнения регрессии. Наилучшим из них будет то уравнение, которому соответствует меньшая средняя квадратическая ошибка уравнения регрессии:

где m - число коэффициентов в уравнении регрессии.

Модель распределения

Принимая во внимание то, что мы имеем дело с малой выборкой, необходимо оценить значимость коэффициентов уравнения регрессии, а также индекса корреляции i и линейного коэффициента корреляции r. Значимость линейного коэффициента корреляции r оцениваем с помощью критерия Стьюдента. Фактическое значение критерия Стьюдента равно:

Модель распределения

Модель распределения

Критическое (предельное) значение критерия Стьюдента tk, берем из табл.4 приложения, задаваясь уровнем значимости a=5,0 и имея число степеней свободы равное:

Модель распределения

k=n-2

Если tr>tk, то величину линейного коэффициента корреляции считаем значимой и можем использовать в расчетах.

Модель распределения

Значимость коэффициентов уравнения регрессии а и b также оцениваем с помощью критерия Стьюдента. Расчетные значения критерия Стьюдента равны:
Модель распределения

Учитывая, что число степеней свободы также равно k=n-2, сравнение фактических значений критерия Стьюдента ведем с уже найденным критическим значением tk.

Если ta>tk, tb>tk, то соответствующий коэффициент уравнения регрессии значим, и мы можем им пользоваться. Значимость индекса корреляции определяем с помощью критерия Фишера. Фактическое значение критерия Фишера равно:

Модель распределения

где m - число коэффициентов в уравнении регрессии.

Модель распределения

Табличное значение критерия Фишера Fk; определяется по табл.5 приложения, задаваясь уравнением значимости a и числом степеней свободы k1=m-l; k2=n-m.

Модель распределения

Если Fi>Fk, то величину индекса корреляции считаем значимой и можем ее использовать в расчетах.

Если коэффициенты а и b, а также линейный коэффициент корреляции r и индекс корреляции i значимы, то все наши расчеты и выводы, опирающиеся на эти величины, правомерны и мы можем использовать полученное уравнение регрессии для прогноза. Ошибка прогноза будет зависеть, в частности, от остаточной дисперсии s2e.

Раздел 3. Изучение динамических рядов


Информация о работе «Модель распределения»
Раздел: Математика
Количество знаков с пробелами: 20401
Количество таблиц: 11
Количество изображений: 9

Похожие работы

Скачать
49136
13
3

... процесс с последействием. Чтобы исключить последействие, приходится вводить несколько параметров состоянии; задача на каждом шаге остается по-прежнему сложной из-за многомерности.   2.2 Двумерная модель распределения ресурсов   Задача 2. Планируется деятельность двух предприятий (s=2) в течение n лет. Начальные средства составляют . Средства x, вложенные в предприятие I, приносят к концу года ...

Скачать
4788
0
0

... 2.1. Предел статичности «черных дыр» в двоичной модели распределения плотности вещества 2.2. Горизонт «черных дыр» в двоичной модели распределения плотности вещества 3. Природа «темной материи» в двоичной модели распределения плотности вещества 4. Выводы 5. Подтверждения 6. Приложения 6.1. Фазовые переходы вещества в двоичной модели распределения плотности вещества 6.2. «Эффект темного ...

Скачать
192976
8
10

... в пенсионный фонд (1% от зарплаты) 1345 Затраты на эксплуатацию оборудования (амортизацию) 976000 ИТОГО: 1207213 Заключение За время работы над дипломным проектом по теме «Организация удаленного доступа к распределенным базам данных» были изучены теоретические основы построения распределенных информационных систем с возможностью оперативного удаленного доступа к данным. ...

Скачать
100800
1
2

... что при такой ориентации теста знания у сильных и слабых испытуемых измерялись с меньшей точностью. 3) Автоматизированный контроль знаний с применением компьютера и обработка результатов тестирования на ЭВМ для определения параметров качества тестирования. 2.1.9.4 Блок адаптивного обучения 1) Модели обучения. Информационные технологии оказывают решающее влияние на все этапы процесса обучения: ...

0 комментариев


Наверх