8.         Третий этап стандартизации психологического теста состоит в определении норм выполнения теста [2].

Нормы разрабатываются для различных возрастов, профессий, полов и др.

Наличие нормативных данных (норм) в стандартизованных методах психодиагностики является их существенной характеристикой.

Нормы необходимы при интерпретации тестовых результатов (первичных показателей) в качестве эталона, с которым сравниваются результаты тестирования.

На этапе создания теста формируется некоторая группа испытуемых, на которой проводится данный тест. Средний результат выполнения этого теста в данной группе принято считать нормой. Средний результат – это не единственное число, а диапазон значений. Существуют определенные правила формирования такой группы испытуемых, или, как ее иначе называют, выборки стандартизации.

Правила формирования выборки стандартизации:

1.         выборка стандартизации должна состоять из респондентов, на которых в принципе ориентирован данный тест,

2.         выборка стандартизации должна быть репрезентативной, то есть представлять собой уменьшенную модель популяции по таким параметрам, как возраст, пол, профессия, географическое распределение и т.д.,

Распределение результатов, полученных при тестировании испытуемых выборки стандартизации, можно изобразить с помощью графика – кривой нормального распределения. Этот график показывает, какие значения первичных показателей входят в зону средних значений (в зону нормы), а какие выше и ниже нормы.

Производные показатели получаются путем математической обработки первичных показателей.

Первичные показатели по разным тестам нельзя сравнивать между собой по причине того, что тесты имеют различное внутреннее строение

Важно помнить, что, как писала А.Анастази, «Любая норма, в чем бы она ни выражалась, ограничивается конкретной совокупностью людей, для которых она вырабатывалась... Применительно к психологическим тестам они (нормы) никоим образом не абсолютны, не универсальны и не постоянны. Они просто выражают выполнение теста испытуемыми из выборки стандартизации»

2.3. Характеристики психодиагностической методики 2.3.1. Валидность

Все методы психологической диагностики, начиная со стандартизованных и заканчивая нестандартизованными, направлены на измерение свойств личности и особенностей интеллекта.

Каждый метод предназначен для измерения какого-либо свойства, что и определяет содержание этого метода. Сведения о степени, в которой тест действительно измеряет то, для чего он предназначен, входят в понятие валидности.

Помимо общего значения в понятие валидности входят многие другие сведения. Существуют разные типы и виды валидности, в которых отражены эти сведения. Ниже приведены некоторые типы.

1.         Практическая валидность характеризует тест не столько со стороны его психологического содержания, сколько с точки зрения его ценности в отношении достижения определенной практической цели (прогнозирования, диагностики). Выделяют подтипы практической валидности: прогностическая и совпадающая. Тест с высокой прогностической валидностью позволяет сделать прогноз, насколько успешно испытуемый будет выполнять определенную деятельность впоследствии. Тест с высокой совпадающей валидностью позволяет ответить на вопрос: «Какова вероятность того, что индивид Х обладает свойством У в настоящий момент времени?»

2.         Валидность по объему отражает степень, в какой объем теста выборочно репрезентирует тот класс ситуаций или учебного материала, относительно которого должны быть сделаны выводы. Валидность по объему показывает, в каком объеме, в какой мере психическое свойство отражено в методике.

3.         Оценочная валидность выражает степень корреляции (соответствия) между показателями, полученными испытуемыми по данному методу, и оценками измерительного свойства со стороны экспертов. Например, при валидации (проверке теста на валидность) тестов оценки умственных способностей школьников в качестве экспертов обычно выступают учителя.

4.         Внешняя валидность означает, что впечатление, которое создается у неспециалистов при знакомстве со стимульным материалом и сугубо внешней стороной тестирования, соответствует заявленному содержанию метода.

Эффективная методика может быть создана, если она прошла все этапы валидации, то есть когда приняты меры для придания ей как содержательной валидности (см. общее значение понятия валидности выше), так и практической.

2.3.2. Надежность

О высокой надежности метода говорят в том случае, когда метод точно измеряет то свойство, для измерения которого он предназначен. В качестве критериев точности можно отметить следующие:

1.         При повторном применении метода к тем же самым испытуемым в одних и тех же условиях через определенный интервал времени результаты обоих тестирований существенно не различаются между собой.

2.         Действия случайных посторонних факторов не оказывают существенного влияния на результаты тестирования. В качестве посторонних факторов можно назвать следующие: эмоциональное состояние и утомление, если они не входят в круг исследуемых характеристик, температура, освещенность помещения и др. Такие посторонние случайные факторы еще называют факторами нестабильности измерительной процедуры.

3.         При повторном применении метода к тем же самым испытуемым через определенный интервал времени в измененных условиях результаты обоих тестирований существенно не различаются между собой. Под измененными имеется в виду следующие условия: другой экспериментатор, состояние респондента и др.

Существуют различные методы оценки надежности:

Ретестовый метод – повторное тестирование выборки испытуемых одним и тем же тестом через определенный интервал времени при одних и тех же условиях. Временной интервал зависит от возраста (например, у маленьких детей изменения могут произойти в течение одного месяца), а также событий, происходящих с испытуемым в жизни.

ТЕСТ ИНТЕРВАЛ РЕТЕСТ

За индекс надежности принимается коэффициент корреляции между результатами двух тестирований. Полученная высокая корреляция может быть результатом тренированности испытуемого на заданиях подобного типа; низкая корреляция может быть результатом происшедших изменений с испытуемым, а также может свидетельствовать о ненадежности теста.

Надежность взаимозаменяемых форм – повторное тестирование выборки испытуемых параллельной формой теста через минимальный интервал времени при одних и тех же условиях.

ТЕСТ А ИНТЕРВАЛ ТЕСТ А'

За индекс надежности принимается коэффициент корреляции между результатами тестирования двумя параллельными формами теста. Высокий коэффициент корреляции и большой интервал между двумя испытаниями свидетельствуют о высокой надежности теста.

Возможный обман со стороны испытуемого, его искушенность, события, происшедшие в интервале между тестированиями, не оказывают особого влияния (как в ретестовом методе) на степень надежности теста. Если фактор тренировки снижен при тестировании параллельными формами, то эффект переноса принципа заданий часто имеет место. Эффект переноса следует учитывать при построении параллельных форм.

Требования к построению параллельных форм:

·  параллельные формы должны быть независимо построенными тестами, но отвечать одним и тем же требованиям;

·  должны содержать одинаковое количество заданий со сходной степенью трудности;

·  эквивалентность параллельных форм необходимо проверять ретестовым методом.

Метод расщепления состоит в том, что тест разбивают на две сопоставимые части. Респондент выполняет задания этих двух частей в течение одного сеанса с получением двух результатов (например, тест Равена содержит две части: четные и нечетные задания).

За индекс надежности принимается коэффициент корреляции между результатами тестирования двумя этими частями. Он называется коэффициентом внутренней согласованности теста.

Валидность и надежность. Тест может быть надежен, но не валиден. Это означает, что он измеряет какое-то свойство очень точно, но какое именно – остается под вопросом. В такой ситуации необходима более точная валидизация теста, как содержательная, так и практическая.

Со стороны взаимодействия испытуемого с тестом, причины недостоверности результатов могут быть следующие:

1.         у респондента может не быть четкого представления о том, о чем его спрашивают;

2.         на респондента влияет фактор социальной желательности, то есть респондент пытается представить себя в наивыгодном свете, отвечает, ориентируясь на общепринятые нормы. Во избежании влияния такого фактора в опросники вводятся шкалы лжи;

3.         респондент не способен оценить те черты, о которых его спрашивают;

4.         позиционный стиль ответов, то есть через некоторое время испытуемый начинает отвечать в одном ключе, поймав какую-то нить (например, «да, да, да...»). Чтобы этого не происходило, вводят прямые и обратные вопросы;

5.         респондент отвечает случайным образом. Чтобы избежать случайных ответов, вводят дублирующие друг друга вопросы (очень близкие синонимы).

2.4. Процесс разработки психодиагностических методик (опросников) 2.4.1. Определение гипотетического конструкта.

Прежде всего, необходимо точно определить, что будет измерять тест. Для этого анализируем соответствующую литературу, чтобы уточнить понятие. Сразу же стоит определить характеристики выборки, для которой тест предназначен – пол, возраст, другие особенности, если они важны. Результатом является т.н. теоретическое определение, раскрывающее сущность явления (измеряемого свойства) и его связи с другими психическими свойствами. Но для создания методики определение должно быть более подробным, и раскрывать также причины – другие, более глубокие явления, с которым связано измеряемое. При этом важно, чтобы определение было корректным с точки зрения логики, иначе тест, если и будет создан, будет измерять неизвестно что.

Далее, на основе теоретического, создаётся операциональное определение. Оно описывает соответствующее измеряемому свойству поведение и состояния.

Следующий шаг – выделение из операционального определения индикаторов.

2.4.2. Разработка первоначальной формы опросника

Принимается решение о форме ответов: дихотомия, трихотомия, количественная оценка и т.п.

Далее, к каждому индикатору придумывают ряд заданий (вопросов или утверждений). При этом должно быть примерно одинаковое число прямых и обратных заданий

Требования к формулировкам заданий:

-           неочевидность значений ответов;

-           понятность и недвусмысленность;

-           конкретность;

-           в каждом задании должен быть только один вопрос или утверждение;

-           следует избегать вопросов о частоте, если она не определена;

-           не должны навязываться определённые ответы;

-           формулировка должна побуждать к первому, пришедшему на ум ответу;

-           испытуемому над ответами не приходилось бы надолго задумываться;

-           задания должны охватывать всю область проявления.

Когда задания сформулированы, их следует «перемешать» так, чтобы

-           вопросы по одному индикатору не шли подряд;

-           прямые и обратные вопросы чередовались, лучше – случайным образом.

-          

2.4..3. Психометрическая проверка (анализ пунктов).

С помощью первоначальной формы тестируют выборку испытуемых (т.н. первоначальное тестирование). По поводу необходимого её размера спорят, но все сходятся, что минимальное число испытуемых – 200 человек. Более точный размер зависит от специфики конструкта. Разумеется, выборка должна соответствовать стандартным требованиям.

После тестирования данные обрабатываются.

Для теста в целом основной показатель – коэффициент однородности α, показывающий, насколько задания в целом измеряют что-то одно. Чаще всего это коэффициент Кьюдера-Ричардсона, значение которого д.б. не менее 0.75 – 0.85, лучшие по надежности тесты дают коэффициенты порядка 0,90 и более.

Используется также коэффициент корреляции при расщеплении пополам Спирмена-Брауна.

Для каждого задания существует ряд показателей, главные из которых

коэффициент корреляции с итоговым баллом и индекс дискриминативности

2.4.4. Отбор и корректировка заданий

На основании подсчитанных показателей отбираются пригодные. Отбрасываются, прежде всего, те, что имеют корреляцию с итоговым баллом, близкую к 1 . кстати. Потом выбрасываем недискриминативные задания. Обычно «вылетают» более половины заданий. Если оставшихся не хватает, то предпринимаем следующие меры:

-           в заданиях, имеющих отрицательную и значимую корреляцию с итоговым баллом ключ меняют на обратный;

В недискриминативных вопросах:

- смягчают или конкретизируют формулировку;

-           по-другому определяют объём;

-           анализируют содержание и определяют социокультурные факторы искажения, изменяют формулировку с учётом этого;

2.4.5. Проверка валидности и надёжности исправленной формы.

Из отобранных и изменённых заданий формируют исправленную форму с соблюдением тех же требований. Она проверяется на аналогичной, но другой выборке. Далее повторяется вся процедура проверки, но если отбор был произведён тщательно, отбрасывать больше нечего. В противном случае всё приходится начинать сначала.

Однако следует выяснить, что же измеряет получившийся, уже надёжный тест. Для этого существует два основных метода:

А) Метод контрастных групп

Б) Перекрёстная валидизация (проверка конкурентной валидности). Здесь мы снова обратимся к теоретическому определению и подберём уже проверенную надёжную методику, измеряющее то же, связанное или противоположное свойство. Эта методика предлагается тем же испытуемым, на которых проверялась исправленная форма. Между результатами этой и разрабатываемой методики подсчитывается коэффициент корреляции, он должен быть значимым .Если это действительно так, валидность можно считать подтверждённой.

Оптимально совместное использование обоих этих методов.

Следующий шаг – проверка ретестовой надёжности.

2.4.6. Стандартизация и комплектность готовой методики.

Тестовые показатели сами по себе не имеют смысла. Их необходимо сопоставить с усреднёнными нормами. Для современных методик существует требование переводить сырые баллы в стандартные единицы.

На этапе создания теста формируется некоторая группа испытуемых, на которой проводится данный тест. Средний результат выполнения этого теста в данной группе принято считать нормой. Средний результат - это не единственное число, а диапазон значений. Существуют определенные правила формирования такой группы испытуемых, или, как ее иначе называют, выборки стандартизации:

1) выборка стандартизации должна состоять из респондентов, на которых в принципе ориентирован данный тест.

2) выборка стандартизации должна быть репрезентативной, то есть представлять собой уменьшенную модель популяции (группы, для которой тест предназначен) по таким параметрам, как возраст, пол, профессия, географическое распределение и т.д.

Распределение результатов, полученных при тестировании испытуемых выборки стандартизации, можно изобразить с помощью графика - кривой нормального распределения (гистограммы). Он показывает, какие значения первичных показателей входят в зону средних значений (в зону нормы), а какие выше и ниже нормы.

Очень важный, наиболее сложный этап – создание интерпретации, то есть прогнозное описание поведения, свойственного испытуемым с таким-то стандартным баллом. Она создаётся на основе определения, с учётом обнаруженных при проверке валидности связей, анализе того, какие именно индикаторы остались после отбора заданий и т.п.

Итогом всей работы является руководство к тесту, в которое, если это приличный тест, входят:

1)         Стандартный стимульный материал (бланк, опросник и инструкция).

2)         Ключи и шаблоны для обработки.

3)         Краткий теоретический обзор проблемы тестирования данного свойства.

4)         Описание и обоснования «идеологии» измерения в данном тесте.

5)         Теоретическое и операциональное определения конструкта, индикаторы.

6)         Описание популяции, процедуры и условий тестирования.

7)         Описание процедуры разработки и следующие показатели:

-           общие коэффициенты однородности всей шкалы;

-           показатели дискриминативности и корреляции с итоговым баллом по каждому заданию;

-           показатели ретестовой надёжности;

-           данные проверки конкурентной валидности (коэф-ты корреляции с каждой из шкал «проверочных» методик);

-           описание выборки стандартизации.

8)         Нормы и таблицы перевода сырых баллов в стандартные для каждой категории испытуемых.

9)         Интерпретация.

10)      Имена авторов, рецензентов, адрес организации.

2.5.     Описание исходной методики

Рассмотрим предложенную В. Леви методику (см. приложение Таблица 1) с точки зрения требований к характеристикам тестов (см. глава 2).

Конструкция данной методики позволяет измерить только наличие определённого уровня страха, но, поскольку шкалы не стандартизированы, трудно судить о том, какой страх преобладает у тестируемого. Утверждения, относящиеся к панфобиям, эзофобиям, присутствуют вперемешку с социальными и зависимыми страхами. Этого можно было избежать, разделив тест на части, каждая из которых представляла бы утверждения, относящиеся к определённому виду страха – так удобнее испытуемым, они могут сосредоточиться на определенной области. Неудобна для испытуемого цифровая оценка. На этом фоне, более привлекательным видится система типа «никогда, редко, в половине случаев, в большинстве случаев, всегда»

Рассмотрим следующие утверждения опросника.

14. Мне случалось испытывать состояние бесконтрольной паники.

Если верить С. И. Ожегову – паника не может быть контролируемой [19]. Однако это утверждение может запутать тестируемого и он будет «вспоминать», в каких случаях паника была контролируемой, в каких нет.

15. Жизнь для меня также страшна, как и смерть.

Здесь подходят ответы типа «да - нет». Ранжирование ответа на это утверждения не только затруднительно, но и глупо.

3.При волнении у меня бывает учащенное сердцебиение, стесненное дыхание, дрожь, потливость, скованность, др. неприятные ощущения…(Если верно хоть одно ставьте баллы).

Допустим у тестируемого в 5 случаях из 10 при волнении бывает учащённое сердцебиение, скованность и потливость; в 5 случаях из 10 – только скованность и неприятные ощущения, а иногда, один раз в год, к выше описанному, добавляется дрожь. Какую цифру в ответе поставить испытуемому?

9. Волнуюсь перед экзаменами, перед публичными выступлениями, перед важными встречами…(Если верно хоть одно ставьте баллы).

22. При нахождении на улице у меня часто возникает боязнь попасть в драку, подвергнуться нападению, ограблению или нас

16. Боюсь летать в самолётах, ездить в метро, автобусе, автомобиле, находиться в лифте…(Если верно хоть одно ставьте баллы).

17. Боюсь темноты, избегаю неосвещённых пространств, предпочитаю не спускаться в подвалы и пещеры.

29. Боюсь уколов, зубоврачебных процедур, медицинских манипуляций в ухе, глазу, других органах…(Если верно хоть одно ставьте баллы).

31. Чтобы снять беспокойство, начинаю больше есть, больше пить, принимать лекарства…(Если верно хоть одно ставьте

35 Оставаясь в полном одиночестве, сплю тревожно, испытываю дискомфорт баллы).

36. Случается, по нескольку раз проверяю, закрыта ли дверь, выключен ли газ, свет, взято ли с собой нужное…(Если верно хоть одно ставьте баллы).

40. Стараюсь откладывать про запас, «на чёрный день» деньги, провизию, вещи, материалы. …(Если верно хоть одно ставьте баллы).

42. Испытываю сильную тревогу, когда заканчиваются запасы денег, еды, сигарет, вина…(Если верно хоть одно ставьте баллы).

В каждом задании содержится несколько утверждений, что делает его бесполезным. Следует сделать утверждения более точными.

5. Обычно стараюсь не рисковать.

7. Люди в основном не заслуживают доверия

11. Постоянно испытываю беспокойство за жизнь и здоровье своих близких (родителей, ребёнка…)

12. Иногда на меня накатывает беспричинная тревога.

32. Состояние моего здоровья часто внушает мне опасения

37. Чтобы всё было как надо, приходится иногда совершать действия, кажущиеся излишними.

39. Снятся кошмары, дурные сны (иногда…часто…).

48. Иногда я боюсь своих собственных мыслей.

50 . Иногда ощущаю беспричинное или малообоснованное чувство вины или стыда

По правилам мы должны избегать слов, определяющих частоту действий, так как мера этой частоты у каждого разная.

10 Боюсь своей смерти

43. Боюсь грозы, урагана, землетрясение, войны, воды, пожара…(Если верно хоть одно ставьте баллы).

44. Боюсь колдовства, порчи, сглаза, нечистой силы, гипноза…(Если верно хоть одно ставьте баллы).

24. Мне случалось оставаться в бездействии, когда при мне кого-то незаслуженно избивали или унижали

27. Если захожу в подъезд, а там сидит компания незнакомых мне парней, предпочитаю дождаться, пока в подъезд войдёт кто-нибудь, и идти вместе с ним.

25. Неприятно вспоминать то, что мне случалось оставлять без ответа явное хамство, грубость, агрессию

34. Опасаюсь остаться в условиях, когда невозможна экстренная медицинская помощь.

55. Я очень зависим (а) от мнения окружающих.

54. Общение с представителями (представительницами) противоположного пола, по возможности избегаю

6 .Мне трудно начинать новые дела из-за опасения неудач

58. Я боюсь любить или быть любимым (любимой).

8. Некоторые люди действуют на меня подавляюще

Многие испытуемые, особенно мужского пола, скорей всего будут стремиться занизить у себя эти показатели, так как во многих культурах они не поощряются. Здесь лучше будет, если утверждение будет более нейтральным, как бы со стороны.

20. В полном одиночестве чувствую себя не комфортно.

Здесь проблема будет со словом «комфортно». Сообразительные, высокообразованные, точно выражающие свои мысли испытуемые могут долго колебаться в выборе значения этого слова: «Да, им не нравится это, но, вероятно, «грустновато» будет чуточку точнее и т. д.

21. Если возвращаюсь домой после 11 вечера, всегда прошу меня проводить.

Валидность этого утверждения очень низка, так как непонятно что оно измеряет. Если это боязнь темноты то: почему после 11 вечера? Зимой, например, темнеет уже в 8 вечера. Если это боязнь попасть в неприятную ситуацию – почему именно 11 вечера?

23. Когда иду с девушкой, стараюсь обходить места, где на нас могут напасть

30. Мне случалось (случается) испытывать страх перед половыми контактами

Тестируемый может и не иметь опыта, описанного в этих утверждениях. Вполне понятно, что в таком случае ему придётся представить себе эту ситуацию и на ответ повлияет социальная желательность.

41. Тревожит перспектива остаться без средств, неохотно трачу свои деньги, даже если у меня их достаточно.

Наличие этой тревоги, ещё не говорит, автоматически, что испытуемый скупой. Ответ будет скорей всего неверным, так как непонятно, что измеряется: тревога или скупость.

45. Есть что-то (кто-то) в моей жизни, чего (кого) я, в отличие от других людей, боюсь, казалось бы, совершенно необоснованно, по непонятной причине (любой предмет, человек, событие, существо…).

Утверждение слишком запутано и неопределённо, что наверняка вызовет трудности у испытуемого.

52.Чувствую себя в полной безопасности только в одиночестве у себя дома

По правилам мы должны избегать терминов, выражающих чувства.

Итак, исходя всего вышеописанного, просинтезировав всё выше сказанное, мы приходим к выводу о неспособности опросника, разработанным Леви, давать достоверные результаты, и предлагаем свой вариант опросника (см. Приложение табл. 2).


Информация о работе «Разработка опросника диагностики фобий и страхов»
Раздел: Психология
Количество знаков с пробелами: 140094
Количество таблиц: 22
Количество изображений: 0

Похожие работы

Скачать
33223
2
1

... , истерический, депрессивный невроз, моносимптомные (моносимптоматические) неврозы. 2. Характеристика отдельных форм неврозов, направления психотерапевтической и коррекционной работы   2.1 Неврастения Неврастения наиболее распространенная форма неврозов у детей, взрослых и подростков. Как считает Личко (1985), она чаще развивается у представителей астеноневротического и лабильного типов ...

Скачать
557833
23
3

... запоры и упорные, монотонные абдоминалгии в проекции толстой кишки. Различия между СРК и другими изученными органными неврозами реализуются также и на уровне коморбидных соотношений функциональных расстройств ЖКТ как с личностными (непрерывная динамика в рамках психосоматического развития), так и психопатологическими (аффективными и тревожными) расстройствами. Переходя к обсуждению личностной ...

Скачать
449805
19
8

... , то во втором все это невозможно, попытки это делать приводили к антигуманным действиям воспитателей и психологической драме личности. Таким образом, педагогическая диагностика ставит своей целью изучение результатов семейного воспитания через сформированные характерологические свойства, выраженные в виде социально-психологического типа личности.   2.2 Понятие о структуре личности и его ...

Скачать
32043
1
0

... , так как за ним скрыто представление о характере как конституционально запрограммированной статичной структуре. Дискуссионным является и использования понятия «характер» в качестве психологической реальности, на диагностику которой направлен П.д.о. Стандартизация П.д.о. проводилась на материале обследования 2258 здоровых подростков и 650 подростков с психопатиями и акцентуациями характера разных ...

0 комментариев


Наверх