2. Оптимальный подбор заданий. В принципе РСТ, а вместе с ней и надежность
теста, возрастают с увеличением доли заданийсредней трудности в тесте. Однако в
тесте обязательно должна быть некотораячасть легких и трудных вопросов, точное
количество которых зависит от конкретныхобстоятельств.
3. Точность измерений. Если, например, время реакции измерять у испытуемых с
точностью до одной десятой, сотой, тысячной итак далее секунды, то получим
различную различающую способность теста.
Валидность теста связана, помимо прочего, с понятиями «гомогенный и
гетерогенный тест». Если тест создан с целью проверкизнаний по одной учебной
дисциплине и все вопросы теста связаны именно с ней, то такой тест считается
гомогенным, а значит и валидным для этой частной цели.Поэтому в более чистом
виде гомогенный тест представляет собой тест для изучения знаний какому-то
частному разделу программы.
Для комплексной оценки знаний студентов может быть составлен тест, состоящий
извопросов по нескольким дисциплинам. Это – пример гетерогенного теста, который
состоит из группы гомогенных тестов. Соответственно такой тест являетсявалидным
именно для комплексной оценки.
Валидность теста зависит и от так называемой длины теста. Под длиной теста
понимаетсяколичество заданий, входящих в тест. Существуют тесты очень короткие,
состоящие из 7 – 15 заданий, и очень длинные, состоящие из более чем пятисот
заданий.
Если тест очень длинный, то ухудшается мотивация и внимание у испытуемых, а
это снижает надежность и валидность. Практика показывает, что еслитестирование
занимает более полутора часов, то при этом возникают организационные проблемы,
испытуемые с неохотой соглашаются отвечать на вопросы теста. С другойстороны, с
точки зрения теории, чем длиннее тест, тем он надежнее. Возникающее противоречие
между теорией и практикой решается компромиссом в ту или инуюсторону, в
зависимости от конкретного случая.
Валидность теста зависит еще и от расположения заданий в тесте. Существует
различнаяпрактика расположения заданий:
1. По степени возрастания трудности. Такое расположение характерно в основном
для гомогенных тестов. Для гетерогенныхтестов сохранение этого принципа
выражается в так называемой «спиральной» форме расположения заданий.
2. В случайном порядке. Этот способ расположения заданий широко применяется в
психологических тестах и в процессекомпьютерного тестирования.
3. В специальном порядке, в соответствии с какой-либо теорией, соображениями
переноса навыков, концентрации внимания идругих.
4. В порядке, сочетающем специальный и случайный подбор. Обычно это делается
в гетерогенныхтестах.
Существуют несколько подходов к валидизации тестов, различающихся в
зависимости от используемых критериев. В педагогическойпрактике наибольшее
распространение в последние годы получили такие тесты, валидность которых не
требуется доказывать эмпирически: в таких тестах критериемих пригодности
является само содержание теста, одобренное опытными преподавателями-экспертами.
При этом у преподавателя должна быть уверенность втом, что:
задания теста находятся в соответствии с программой;
задания теста охватывают не один какой-либо раздел, а всю программу курса;
высока вероятность того, что студент, успешно ответивший на задания теста,
знаетпредмет в соответствии с полученной оценкой.
Перечисленные три пункта объединяются общей идеей – содержит ли тест задания,
пригодные дляоценки знаний по конкретной дисциплине? Если в результате
статистической проверки выявляется, что ответы на вопросы теста вполне позволяют
обоснованносудить о знаниях студентов, то считается, что тест содержит валидные
вопросы; он валиден по содержанию. Требование валидности по содержанию
предъявляется ккаждому вопросу теста, мерой валидности является коэффициент
корреляции ответов по заданию с критерием. При создании теста в качестве
критерия обычно берутсяоценки, выставляемые студентам группой
преподавателей-экспертов без тестов. Результаты студентов по вопросам теста и
по оценкам экспертов коррелируются. Высокаясогласованность оценок по тесту и у
экспертов указывает и на высокую валидность.
Надо подчеркнуть, что нет показателей раз и навсегда установленных надежности и
валидноститеста. В каждом отдельном исследовании рекомендуется проверять
качество теста и лишь на этой основе делать выводы о достоверности данных.
К показателям надежности, как и валидности, предъявляют определенные
требования.Надежность и валидность можно оценить с помощью таблицы 1.1.[1]
... с тестами В процессе преподавания важное значение имеют закрепление изученного материала и контроль результатов учебной деятельности, позволяющие определить уровень достижений каждого учащегося. Одним из современных вида контроля знаний и умений, а также развития умственных способностей учеников являются тесты с выбором правильного ответа. Удобно проводить проверку выполнения домашней работы ...
... фундаментальными, хотя все они в определенной степени способствовали развитию физики в прошлом и настоящем. Было бы полезно систематизировать многочисленные исторические наблюдения и опыты, входящие в курс физики средней школы (и те, которые, по нашему мнению, должны войти в будущем), по их функциональному признаку – реализации определенной задачи и значению в развитии физической науки. Класс ...
... : а) первый уровень (1–4 классы) – безопасность школьника; б) второй уровень (5–9 классы) – безопасность личности; в) третий уровень (10–11 классы) – безопасность жизнедеятельности личности, общества и государства. Преподавание основ безопасности жизнедеятельности на каждой ступени общеобразовательной школы имеет свои особенности. В начальной школе особенностью является то, что у младших ...
... , анализ, прогноз не носят завершающего цикла. В диссертации проанализированы причины, вызывающие затруднения у руководителей вуза и преподавателей по использованию технологий адаптивного компьютерного тестирования в профессиональной деятельности. Теория педагогических измерений в современных условиях внедрения государственных образовательных стандартов – это качественно новый этап в развитии ...
0 комментариев