2. Основные теоретические понятия факторного анализа
2.1. Факторная матрица.
Факторный анализ – это ветвь математической статистики. Его цели, как и цель других разделов математической статистики, заключается в разработке моделей, понятий и методов, позволяющих анализировать и интерпретировать массивы экспериментальных или наблюдаемых данных вне зависимости от их физической формы.
Одной из наиболее типичных форм представления экспериментальных данных является матрица, столбцы которой соответствуют различным параметрам, свойствам, тестам и т.п., а строки – отдельным объектам, явлениям, режимам, описываемым набором конкретных значений параметров. На практике размеры матрицы оказываются достаточно большими: так, число строк этой матрицы может колебаться от нескольких десятков до нескольких сотен тысяч (например, при социологических обследованиях), а число столбцов – от одного – двух до нескольких сотен. Непосредственный, “визуальный”, анализ матриц такого размера невозможен, поэтому в математической статистике возникло много подходов и методов, предназначенных для того, чтобы “сжать” исходную информацию, заключенную в матрице, до обозримых размеров, извлечь из исходной информации наиболее “существенное”, отбросив “второстепенное”, “случайное”.
При анализе данных, представленных в форме матрицы, возникают два типа задач. Задачи первого типа имеют целью получить “короткое описание” распределения объектов, а задачи второго – выявить взаимоотношения между параметрами.
Следует иметь в виду, что основной стимул для появления указанных задач заключается не только и не столько в желании коротко закодировать большой массив чисел, а в значительно более принципиальном обстоятельстве, имеющем методологический характер: коль скоро удалось коротко описать большой массив чисел, то можно верить, что вскрыта некая объективная закономерность, обусловившая возможность короткого описания; а ведь именно поиск объективных закономерностей и является основной целью, ради которой, как правило, и собираются данные.
Упомянутые подходы и методы обработки матрицы данных отличаются тем, какого типа задачи обработки данных они предназначены решать, и тем, к матрицам какого размера они применимы.
Что же касается проблемы короткого описания связей между параметрами при среднем числе этих параметров, то в данном случае соответствующая корреляционная матрица содержит несколько десятков или сотен чисел и сама по себе она еще не может служить “коротким описанием” существующих связей между параметрами, а должна с этой целью подвергнуться дальнейшей обработке.
Факторный анализ как раз и представляет собой набор моделей и методов, предназначенных для “сжатия” информации, содержащейся в корреляционной матрице. В основе различных моделей факторного анализа лежит следующая гипотеза: наблюдаемые или измеряемые параметры являются лишь косвенными характеристиками изучаемого объекта или явления, на самом же деле существуют внутренние (скрытые, не наблюдаемые непосредственно) параметры или свойства, число которых мало и которые определяют значения наблюдаемых параметров. Эти внутренние параметры принято называть факторами. Задача факторного анализа – представить наблюдаемые параметры в виде линейных комбинаций факторов и, может быть, некоторых дополнительных, “не существенных” величин – “помех”. Замечательным является тот факт, что, хотя сами факторы не известны, такое разложение может быть получено и, более того, такие факторы могут быть определены, т.е. для каждого объекта могут быть указаны значения каждого фактора.
Факторный анализ, независимо от используемых методов, начинается с обработки таблицы интеркорреляций, полученных на множестве тестов, известной как корреляционная матрица, а заканчивается получением факторной матрицы, т.е. таблицы, показывающей вес или нагрузку каждого из факторов по каждому тесту. Таблица 1 представляет собой гипотетическую факторную матрицу, включающую всего два фактора.
Факторы перечисляются в верхней строке таблицы от более значимого к менее значимому, а их веса в каждом из 10 тестов даны в соответствующих столбцах.
Таблица 1
Гипотетическая факторная матрица
Тест | Фактор I | Фактор II |
1.Словарный | 0,74 | 0,54 |
2.Аналогии | 0,64 | 0,39 |
3.Завершение предложений | 0,68 | 0,43 |
4.Восстановление порядка слов в предложении | 0,32 | 0,23 |
5.Понимание прочитанного | 0,70 | 0,50 |
6.Сложение | 0,22 | -0,51 |
7.Умножение | 0,40 | -0,50 |
8.Арифметические задачи | 0,52 | -0,48 |
9.Составление уравнений | 0,43 | -0,37 |
10.Завершение числовых рядов | 0,32 | -0,25 |
Оси координат. Принято представлять факторы геометрически в виде осей координат, относительно которых каждый тест может быть изображен в виде точки. Рис. 1 поясняет эту процедуру. На этом графике каждый из 10 тестов, приведенных в табл.1, отображен в виде точки относительно двух факторов, которые соответствуют осям I и II. Так, тест 1 представлен точкой с координатами 0,74 по оси I и 0,54 по оси II. Точки, представляющие остальные 9 тестов, построены аналогичным способом, с использованием значений весов из табл. 1.
Следует заметить, что положение осей координат не фиксировано данными. Исходная таблица корреляций определяет лишь положение тестов (т.е. точек на рис. 1) относительно друг друга. Те же точки можно нанести на плоскость с любым положением координатных осей. По этой причине при проведении факторного анализа обычно вращают оси до тех пор, пока не получают наиболее приемлемого и легко интерпретируемого отображения.
Рис. 1. Гипотетическое факторное отображение, показывающее веса двух групповых факторов по каждому из 10 тестов.
На рис. 1 полученные после вращения оси I’ и II’ показаны пунктирными линиями. Это вращение выполнено в соответствии с предложенными Терстоуном критериями положительного многообразия и простой структуры. Первый предполагает вращение осей до положения, при котором исключаются все значимые отрицательные веса. Большинство психологов считают отрицательные факторные нагрузки логически несоответствующими тестам способностей, так как такая нагрузка означает, что чем выше оценка индивидуума по специфическому фактору, тем ниже будет его результат по соответствующему тесту. Критерий простой структуры, в сущности, означает, что каждый тест должен иметь нагрузки по как можно меньшему числу факторов.
Выполнение обоих критериев дает факторы, которые можно наиболее легко и однозначно интерпретировать. Если тест имеет высокую нагрузку по одному фактору и не имеет значимых нагрузок по другим факторам, мы можем кое-что узнать о природе этого фактора, изучив содержание данного теста. Напротив, если тест имеет средние или низкие нагрузки по шести факторам, то он мало что скажет нам о природе любого из них.
На рис. 1 хорошо видно, что после вращения осей координат все вербальные тесты (1-5) располагаются вдоль или очень близко к оси I’, а числовые тесты (6-10) тесно группируются вокруг оси II’. Новые факторные нагрузки, измеренные относительно повернутых осей, приведены в табл. 2. Факторные нагрузки в табл. 2 не имеют отрицательных значений, за исключением пренебрежительно малых величин, явно относимых к ошибкам выборки. Все вербальные тесты имеют высокие нагрузки по фактору I’ и практически нулевые – по фактору II’. Числовые тесты, напротив, имеют высокие нагрузки по фактору II’ и пренебрежимо низкие – по фактору I’. Таким образом, вращение координатных осей существенно упростило идентификацию и называние обоих факторов, а также описание факторного состава каждого теста. На практике число факторов часто оказывается больше двух, что, разумеется, усложняет их геометрическое представление и статистический анализ, но не изменяет существа рассмотренной процедуры.
Таблица 2
Факторная матрица после вращения
Тест | Фактор I’ | Фактор II’ |
1.Словарный | 0,91 | -0,06 |
2.Аналогии | 0,75 | 0,02 |
3.Завершение предложений | 0,80 | 0,00 |
4.Восстановление порядка слов в предложении | 0,39 | -0,02 |
5.Понимание прочитанного | 0,86 | -0,04 |
6.Сложение | -0,09 | 0,55 |
7.Умножение | 0,07 | 0,64 |
8.Арифметические задачи | 0,18 | 0,68 |
9.Составление уравнений | 0,16 | 0,54 |
10.Завершение числовых рядов | 0,13 | 0,38 |
Некоторые исследователи руководствуются теоретической моделью как принципом вращения осей. Кроме того, принимается в расчет неизменность, или подтверждение одних и тех же факторов в независимо выполненных, но сравнимых исследованиях.
Интерпретация факторов. Получив после процедуры вращения факторное решение (или, проще говоря, факторную матрицу), мы можем переходить к интерпретации и наименованию факторов. Этот этап работы скорее требует психологической интуиции, нежели статистической подготовки. Чтобы понять природу конкретного фактора, нам ничего не остается, как изучить тесты, имеющие высокие нагрузки по этому фактору, и попытаться обнаружить общие для них психологические процессы. Чем больше оказывается тестов с высокими нагрузками по данному фактору, тем легче раскрыть его природу. Из табл. 2, к примеру, сразу видно, что фактор I’ вербальный, а фактор II’ числовой. Приведенные в табл. 2 факторные нагрузки отображают к тому же корреляцию каждого теста с фактором.
... задания были проверены по статистическим критериям и стали рассматриваться как средство определения интеллектуального уровня. Причиной, по которой А. Бине вместе с Т. Симоном приступил к разработке первого в истории психодиагностики интеллектуального теста, стал практический запрос — необходимость создать методику, с помощью которой можно было отделить детей, способных к учению, от страдающих ...
... и в экспериментальной психологии. Методы изучения мотивации успеха достаточно условны и не объективны, но работы в этом направлении ведутся и приносят свои плоды. 15. Теории личности как основа психодиагностики Рейнвальд Н.И. Личность и характер: учебное пособие. – М.: Изд-во РУДН, 1992, 88 с. Психологический статус личности в различных социальных условиях: диагностика и коррекция / ...
... которые приносят настоящее удовольствие. Вывод к разделу I: Более чем вековое развитие психодиагностики, выступавшей на Западе в обличье психологического тестирования, а позднее - психологической оценки, происходило, как правило, вне методологического осмысления этой области психологической науки. Долгое время господствование в психологическом тестировании эмпиризма и позитивизма не только ...
... у человека в глубокой древности. К психодиагностике уместно отнести известное высказывание Г. Эббингауза, характеризующее психологию в целом: "У нее долгое прошлое, но короткая история". Становление психодиагностики как науки обусловлено развитием экспериментальной психологии, измерением психических явлений. Начало психодиагностическим исследованиям было положено работами Ф. Гальтона, Дж. ...
0 комментариев