41. Психометрия, ее осн. параметры: тест. нормы и проверка их
Психометрия (от греч. metron- мера)- первоначально- измерение t-ых хар-к психич. пр-сов на рубеже Х1Х-ХХ веков как следствие общего для всех экспер-ых наук стремления к использованию мат. методов. Ныне под психометрией понимается весь круг ??-сов, связанных с измерением в Y-ии. Включает психофизику. Психометрия- это математизированная технология создания стандартизированных, измерительных ПД-их методик (наука о у-их измерениях). Она требует, чтобы любой тест, претендующий на то, чтобы счит-ся научным, обладал необход-ми психометрич. св-ми:
валидности, надежности, репрезентативности. В психометрии обоснованы правила и методы измерения указанных психометрич. св-в тестов. Следование этим правилам обеспечивает Q-ный контроль за степенью научности любого new теста, за степенью реальной ценности старого теста, а-ый вполне может устареть и перестать работать правильно. С1936г в США- спец. журнал «Психометрика». Позднее- журн. «Образовательные и у-ие измерения». Ведущ. психометристы:
Рюлон, Гилфорд, Кронбах, Анастази, Гуревич Константин Маркович. Оценки по психологич. тестам чаще всего интерпретируются ч/з сопоставление с нормами, отображающими выполнение теста в выборке стандартизации. Такие нормы устанавливаются эмпирически, путем определения того, как представители репрезентативной группы в действит-ти справляются с тестом. После чего «сырой балл» конкретного чела можно соотнести с распределением оценок, полученных на выборке стандартизации, чтобы узнать, какое место он занимает в этом распределении. Любые тест. заключения завис, от той выборки, на к-ой проводилась стандартизация теста. Стандартизация методики осущ. путем ее проведения на big репрезентативной выборке того типа, для а-го данная методика предназначена. Относит, этой группы вырабат. нормы, указывающие средний ур-нь выполнения и его относительную вариативность выше и ниже сред. ур-ня. Это позволяет определить положен, конкретного испыт. относит-но нормативной выборки. При подсчете баллов по тесту выбранные ответы получают однозначную количественную интерпретацию и суммируются. Суммарный балл сравнивается с количеств, тестовыми нормами, и после этого сравнения формулируются стандартные диагностич. заключения. Стандартизация теста- когда задана полная таблица соответствия сырой шкалы и стандартной шкалы и содержание этой таблицы обосновано статистической стр-рой распределения тестовых баллов на выборке стандарт-ции. Кроме статистич. тест. норм сущ. еще критериальные нормы- при построении теста по критерию шкала сырых тестовых баллов калибруется особыми точками, к-ые соответствуют уровням рассчитанной вероятности достижения какого-то критерия(заданной эффективности Д-ти). При построении диагностич. заключений по критериальным тестам мы интересуемся не степенью отклонения балла от центра шкалы, а достиж-ем или недостиж-ем какого-то критического ур-ня на шкале. Репрезентативность тест. норм- то, насколько выборка стандартизации позволяет применять тест на широк, популяции (категория испыт-ых опред. соц., проф. or половозрастной принадлежности). Репрезентат-ть тестовых норм помогает правильно учитывать ограничения в сфере применен, теста. Одним из способов обеспечения репрезентат-ти выборки явл. ограничение совокупности в соответствие с технич. хар-ми выборки. Желаемая совокупн-ть должна определ-ся заранее, исходя из целей теста. Тестовых норм, действительных для всего человеч. рода не сущ. Сомнительно, чтобы по к-л тесту имелись адекватные нормы для таких широко определ-ых совокупн-тей, как «взрослые американцы-мужчины», «русск. дети 10-летн. возраста». Проверка репрезент-ти тест. норм осущ. с help анализа распределения частот тестовых баллов: сравнение двух распределений, построенных для двух случайных половин выборки стандартизации. Если два этих распределения оказ-ся практич. тождественными, то можно говор, о репрезент-ти тестовых норм. Границы применения норм- ^} невозмож-ть межтестовых сравнений (некоторые тесты нельзя сравнивать м/у собой). Пр.: если в Л-ом деле школьника содержатся показатели IQ равные 118, 115 и 101, относящиеся к 4, 5 и 6 классу, то встает вопрос: какие тесты давали в этих трех случаях? Снижение рез-в может отражать всего-навсего различие м/у тестами. 3 осн. причины вариаций оценок, получаемых одни м и тем же челом по dif тестам: 1)тесты, даже если они одинаково называются, могут различаться по содержанию (тесты IQ); 2) несопоставимыми оказ. единицы измерения сравниваемых шкал; 3)состав выборок стандартизации, использованных при определении норм для dif тестов, может оказаться различным. 2) нормативная выборка- любая норма огранич-ся конкретной совокупностью людей, для к-ой она выводилась. Нормы психологич. тестов нельзя считать абсолютными, универсальными или постоянными. Они просто отражают ур-нь выполнения теста лицами, сост-щими выборку стандартизации. При форм-ии такой выборки стремятся получить репрезентативный срез популяции, на котор. ориентирован тест. Идеальная выборка, чтобы быть действительно репрезентативной для данной совокупности д.б. выверена по географич. распределению, социо-экономич. ур-ню, этническ. сост-ву и т.д. При разработке и применению тест. норм следует обращать особое внимание на выборку стандартизации: выборка д.б. достаточно big для обеспечения устойчивости норм. Надежность- помехоустойчивость теста, независимость его рез-в от действия dif случайн. факторов: разнообразие внеш. условий: t суток, освещенность, температура в помещен., наличие посторон. звуков, отвлек-щих внимание; динамичные внутренние факторы (t врабатываемости, скорость утомления); информационно-соц. обстоятельства: контакт с психологом, несколько чел. в помещении, предыдущ. опыт знакомства с тестом, наличие какого-то отношения к тестам вообще; нестабильность диагностируемого св-ва; несовершенство диагностич. методик (небрежно сост. интрукц., задания по своему хар-ру разнородны); элементы S-ти в способах оценки и интерпретации рез-ов. Эти факторы обуславл. появление отклонения измеренного тестового балла от истинного. Средняя относит, величина этого отклонения- «стандартная ошибка измерения» (Se). Она указ. на ур-нь ненадежности тест. шкалы. Гуревич К.М. вы- 3 показателя надежности: 1) надежность самого измерительного инструмента; 2) стабильность изучаемого признака (проверяется с help метода «тест-ретест»); 3) константность, т.е. относительная независ-ть рез-ов от Л-ти экс-ра. Подсчитать надеж-ть теста- с help корреляционных методов. Пр.: метод перетестирования: на одной и той же выборке провод. 1ое тестир., а затем, ч/з 2 недели (??-ы теста забываются), повторное тестир-ие. Затем- м/у 1-ми 2-м тестированием- подсчит. коэффициент корреляции. Низкая корреляция- знач. случайные факторы сильно искажают рез-тый тест не обладает необх-мой помехоустойчивостью и его нельзя use как измерительный инструмент. Показатель надеж-ти (R) д.б. °0,95. Средства повышен, надежности- единообразие процедуры обследования, его строгая регламентация + одинаковая оценка выполнен.: одинаковая для всех обстановка и условия работы, однотипн. хар-р инструкций, одинак-е t-ные ограничения, способы контакта с испыт-ми, порядок предъявлен, заданий, т.е. стандартиз-я процедуры исслед-я. Валидность- соответствие теста измеряемому психич. св-ву. Высок, коэффициент валидности-свыше 0,60, низк.- 0,20-0,30. Высок, валид. указ. на то, что тест измеряет именно то, что необходимо. На нее тоже «-» влияют случайные факты. Надеж-ть ° Валид-ть, т.е. валид-ть не может превышать надеж-ть теста. На валид-ть также влияют систематич. искажения рез-ов,т.е другие психич. св-ва, а-ые мешают проявиться тому св-ву, на а-ое тест направлен. Для проверки валидности- критерий валидности- независимый от теста, внешний по отношению к нему источник инф-ции об измеряемом психич. св-ве. Надо сравнить рез-ты теста с источником истинной инф. об измеряемом св-ве-критерием (данные лабораторн. экс-ов, в школе/типичный показатель- успеваемость; м.б. экспертная оценка, метод «известных групп»- приглашаются испытуемые, про а-ых известно, к какой группе по критерию они относ., учитывается повед-е, к-ое происходило в прошлом). Виды валид-ти: 1) вал. по содержанию- напр., в тестах достижений: в них включ. не весь пройденный материал, а не big его часть. Свидетельствуют ли правильные ответы на эти немногие ??-ы об усвоении всего материала? Проводится сопоставление успешности по тесту с экспертными оценками учителей (по данному материалу); 2) вал. по одновременности(текущая вал.)- определ. с help внеш. критерия: собираются данные, относящиеся к настоящему t-ни - успеваемость, производительность в пер-д испытания. С ними сопоставляют рез-ты, успешности то тесту; 3) предсказывающая вал.(прогностическая):
определ. по внеш. критерию, инф. собир-ся ч/з некотор. t после испытан. Предсказание будущ. успешности в выполнен, других методик. 4) ретроспективная вал.- определ-ся на основе критерия, отражающего события или состояния качества в прошлом. М.б. использована для быстрого получения сведений о предсказательной возможности методики. 5) валидность внешняя- соотв-вие конкретного исслед-я природной реальности или другим подобным исслед-ям. Определяет возм-ть переноса и обобщения рез-ов на другие Q-ты и условия исслед-я. Завис, от репрезент-ти выборки и соответствия контролируемых дополнительных пременных, их вариативности в других условиях. Ее частный случай- экологическая валид-ть- хар-зует соответствие процедуры и условий лаб. исслед-я «естественной» реальности. 6)валид-ть внутренняя- соответствие конкретного исслед-я идеальному;
оценивает изменение зависимой переменной, определяется влиянием независимой переменной. 7) вал. конструктная- хар-ет точность реализации теоретической гипотезы в экс-те. Явл. проявлением внутр. валид. Определяет область явлений, исследуемых в экс-те. 8) вал. критериальная- отражает соответствие диагноза и прогноза, получ. На основе данных тестирования. Включ. текущюю и пргностическую валидность. 9) вал. операциональная- соответствие операций экс-ра теоретич-му описанию переменных, контролируемых в исследовании. Проявление внутр. вал. Достоверность теста- особ. разновидность валидности; спос-ть теста защищать инф. от мотивационных искажений:
когда испыт. сознат-но or бессозн-но искажает рез-ты, руководствуясь особой мотивацией, отлич-щейся от присущей ему в реал. поведен. Прием обеспечен, достовер-ти - наличие в тесте шкалы лжи- они основываются на феномене соц-ой желательности- стремление давать соц-но одобряемую инф. Эти ??-ы входят в стр-ру теста и иногда не подлежат разглашению- проф. тайна. Достоверность теста связана со степенью доверительности общения. 2 ситуации : сит. клиента (добровольно, собст. инициатива) и экспертизы (инициатива педагога, родит.)
0 комментариев