3.   не коррелированна с к-1 предыдущими главными компонентами,

4.   среди всех возможных комбинаций исходных признаков, которые не

не коррелированны с к-1 предыдущими главными компонентами, эта комбинация имеет наибольшую дисперсию.

Введём ортогональную матрицу U и перейдём от переменных Х к переменным Z, при­чём

Вектор  выбирается т. о., чтобы дисперсия  была максимальной. После получения  выбирается  т. о., чтобы дисперсия  была максимальной при условии, что  не корре­лированно с  и т. д.

Так как признаки измерены в несопоставимых величинах, то удобнее будет перейти к центрированно-нормированным величинам. Матрицу исходных центрированно-нормированных значений признаков найдем из соотношения:

,

где - несмещенная, состоятельная и эффективная оценка математического ожидания,

-несмещенная, состоятельная и эффективная оценка дисперсии.

Матрица наблюденных значений исходных признаков приведена в Приложении.

 Центрирование и нормирование произведено с помощью программы"Stadia".

Так как признаки центрированы и нормированы, то оценку корреляционной матрицы можно произвести по формуле:

.

Перед тем как проводить компонентный анализ, проведем анализ незави­симости исходных признаков.

Проверка значимости матрицы парных корреляций с помощью кри­терия Уилкса.

Выдвигаем гипотезу:

Н0:  незначима

Н1:  значима

Строим статистику , распределена по закону  с  степенями свободы.

* =125,7; (0,05;3,3) = 7,8

т.к *> , то гипотеза Н0 отвергается и матрица является значимой, следовательно, имеет смысл проводить компонентный анализ.

Проверим гипотезу о диагональности ковариационной матрицы

 Выдвигаем гипотезу:

Н0: соv=0,

Н1: соv

Строим статистику , распределена по закону  с  степенями свободы.

*=123,21, (0,05;10) =18,307 т.к *> то гипотеза Н0 отвергается и имеет смысл проводить компонентный анализ.

Для построения матрицы факторных нагрузок необходимо найти собственные числа матрицы , решив уравнение.

Используем для этой операции функцию eigenvals системы MathCAD, которая возвращает собственные числа матрицы:

Т.к. исходные данные представляют собой выборку из генеральной сово­купности, то мы получили не собственные числа  и собственные век­тора матрицы, а их оценки. Нас будет интересовать на сколько “хорошо” со статистической точки зрения выборочные характеристики описывают соот­ветствующие параметры для генеральной совокупности.

 Доверительный интервал для i-го собственного числа ищется по формуле:

Доверительные интервалы для собственных чисел в итоге принимают вид:

Оценка значения нескольких собственных чисел попадает в доверительный интервал других собственных чисел. Необходимо проверить гипотезу о кратности собственных чисел.

Проверка кратности производится с помощью статистики

, где r-количество кратных корней.

Данная статистика в случае справедливости распределена по закону  с числом степеней свободы . Выдвинем гипотезы:

Так как , то гипотеза  отвергается, то есть собственные числа  и  не кратны.

Далее,

:

Так как , то гипотеза  отвергается, то есть собственные числа  и  не кратны.

:

Так как , то гипотеза  отвергается, то есть собственные числа  и  не кратны.

Необходимо выделить главные компоненты на уровне информативно­сти 0,85. Мера информативности показывает какую часть или какую долю дисперсии исходных признаков составляют k-первых главных компонент. Мерой информативности будем называть величину:

I1==0,458

I2==0,667

I3=

 На заданном уровне информативности выделено три главных компоненты.

Запишем матрицу =

Для получения нормализованного вектора перехода от исходных признаков к главным компонентам необходимо решить систему уравнений: , где - соответствующее собственное число. После получения решения системы необходимо затем нормировать полученный вектор.

Для решения данной задачи воспользуемся функцией eigenvec системы MathCAD, которая возвращает нормированный вектор для соответствующего собственного числа.

В нашем случае первых четырех главных компонент достаточно для достижения заданного уровня информативности, поэтому матрица U (матрица перехода от исходного базиса к базису из собственных векторов)

Строим матрицу U, столбцами которой являются собственные вектора:

U=.

Матрица весовых коэффициентов:

А=.

Коэффициенты матрицы А являются коэффициентами корреляции ме­жду центрировано – нормированными исходными признаками и ненормиро­ванными главными компонентами, и  показывают наличие, силу и направле­ние линейной связи между соответствующими исходными призна­ками и соответствующими главными компонентами.


Информация о работе «Компонентный и факторный анализ»
Раздел: Разное
Количество знаков с пробелами: 27904
Количество таблиц: 3
Количество изображений: 15

Похожие работы

Скачать
68698
4
2

... здесь можно довериться интуиции. В качестве предварительного варианта можно использовать имя переменной, которая вошла в фактор с наибольшей нагрузкой. 3.2. Разработка психодиагностического теста с применением факторного анализа на примере опросника “Шестнадцать личностных факторов (16PF)” Р.Кэттелла. Приложение факторного анализа к разработке личностных опросников в так называемой “лексической ...

Скачать
42676
2
0

... И ИНФОРМАТИКИ КАФЕДРА МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ И ЭКОНОМЕТРИКИ Контрольная работа по курсу: “Многомерные статистические методы” напо темуе: “КоррелЯционно-регрессионный, факторный и компонентный анализы деятельности предприятии”студента группы ЗС-301 шифр 96005 Башиной Екатерины Сергеевны Москва 1998 год СОДЕРЖАНИЕ Экономическая постановка задачи ...

Скачать
58729
3
0

... одного работника в % к заработной плате и меньше всего зависит от удельного веса потерь от брака и от удельного веса рабочих в составе промышленно-производственного персонала. Потом провели анализ с помощью линейной регрессии. Приведем протокол множественной линейной регрессии. *** Протокол множественной линейной регрессии *** Зависимая переменная Y - y2  Функция Y = -12.728+12.035*x4+28.237 ...

Скачать
37711
3
1

... сказалось несоответствие поставки (по ассортиментному составу или качеству) спросу населения Недопоставка также приводит к невыполнению плана розничного товарооборота.  Анализ динамики товарооборота розничной торговли.  Рассмотрим анализ розничного товарооборота в динамическом аспекте с помощью индексного метода. Для индексного метода характерным является сопоставление двух периодов—отчетного ...

0 комментариев


Наверх