2. Оптимальный подбор заданий. В принципе РСТ, а вместе с ней и на­дежность

теста, возрастают с увеличением доли заданийсредней трудности в тесте. Однако в

тесте обязательно должна быть некотораячасть легких и трудных вопросов, точное

количество которых зависит от конкретныхоб­стоятельств.

3. Точность измерений. Если, например, время реакции измерять у ис­пытуемых с

точностью до одной десятой, сотой, тысячной итак далее се­кунды, то получим

различную различающую способность теста.

Валидность теста связана, помимо прочего, с понятиями «гомогенный и

гетерогенный тест». Если тест создан с целью проверкизнаний по одной учебной

дисциплине и все вопросы теста связаны именно с ней, то такой тест считается

гомогенным, а значит и валидным для этой частной цели.Поэтому в более чистом

виде гомогенный тест представляет собой тест для изучения знаний какому-то

частному разделу программы.

Для комплексной оценки знаний студентов может быть составлен тест, состоящий

извопросов по нескольким дисциплинам. Это – пример гетеро­генного теста, который

состоит из группы гомогенных тестов. Соответст­венно такой тест являетсявалидным

именно для комплексной оценки.

Валидность теста зависит и от так называемой длины теста. Под длиной теста

понимаетсяколичество заданий, входящих в тест. Существуют тесты очень короткие,

состоящие из 7 – 15 заданий, и очень длинные, состоящие из более чем пятисот

заданий.

 Если тест очень длинный, то ухудшается мотивация и внимание у ис­пытуемых, а

это снижает надежность и валидность. Практика показывает, что еслитестирование

занимает более полутора часов, то при этом возникают ор­ганизационные проблемы,

испытуемые с неохотой соглашаются отвечать на вопросы теста. С другойстороны, с

точки зрения теории, чем длиннее тест, тем он надежнее. Возникающее противоречие

между теорией и практикой решается компромиссом в ту или инуюсторону, в

зависимости от конкрет­ного случая.

 Валидность теста зависит еще и от расположения заданий в тесте. Су­ществует

различнаяпрактика расположения заданий:

1. По степени возрастания трудности. Такое расположение характерно в основном

для гомогенных тестов. Для гетерогенныхтестов сохранение это­го принципа

выражается в так называемой «спиральной» форме расположения заданий.

2. В случайном порядке. Этот способ расположения заданий широко применяется в

психологических тестах и в процессекомпьютерного тестиро­вания.

3. В специальном порядке, в соответствии с какой-либо теорией, сооб­ражениями

переноса навыков, концентрации внимания идругих.

4. В порядке, сочетающем специальный и случайный подбор. Обычно это делается

в гетерогенныхтестах.

Существуют несколько подходов к валидизации тестов, различающихся в

зависимости от используемых критериев. В педагогическойпрактике наи­большее

распространение в последние годы получили такие тесты, валид­ность которых не

требуется доказывать эмпирически: в таких тестах крите­риемих пригодности

является само содержание теста, одобренное опытными преподавателями-экспертами.

При этом у преподавателя должна быть уве­ренность втом, что:

задания теста находятся в соответствии с программой;

задания теста охватывают не один какой-либо раздел, а всю про­грамму курса;

высока вероятность того, что студент, успешно ответивший на зада­ния теста,

знаетпредмет в соответствии с полученной оценкой.

Перечисленные три пункта объединяются общей идеей – содержит ли тест задания,

пригодные дляоценки знаний по конкретной дисциплине? Если в результате

статистической проверки выявляется, что ответы на вопросы теста вполне позволяют

обоснованносудить о знаниях студентов, то счита­ется, что тест содержит валидные

вопросы; он валиден по содержанию. Тре­бо­вание валидности по содержанию

предъявляется ккаждому вопросу теста, мерой валидности является коэффициент

корреляции ответов по заданию с критерием. При создании теста в качестве

критерия обычно берутсяоценки, выставляемые студентам группой

преподавателей-экспертов без тестов. Ре­зультаты студентов по вопросам теста и

по оценкам экспертов коррелиру­ются. Высокаясогласованность оценок по тесту и у

экспертов указывает и на высокую валидность.

Надо подчеркнуть, что нет показателей раз и навсегда установленных надеж­ности и

валидноститеста. В каждом отдельном исследовании рекомен­дуется проверять

качество теста и лишь на этой основе делать выводы о дос­товерно­сти данных.

К показателям надежности, как и валидности, предъявляют определен­ные

требования.Надежность и валидность можно оценить с помощью таб­лицы 1.1.[1]


Информация о работе «Методика составления тестовых заданий по курсу "Механика"»
Раздел: Информатика, программирование
Количество знаков с пробелами: 42992
Количество таблиц: 0
Количество изображений: 0

Похожие работы

Скачать
20020
4
0

... с тестами В процессе преподавания важное значение имеют закрепление изученного материала и контроль результатов учебной деятельности, позволяющие определить уровень достижений каждого учащегося. Одним из современных вида контроля знаний и умений, а также развития умственных способностей учеников являются тесты с выбором правильного ответа. Удобно проводить проверку выполнения домашней работы ...

Скачать
72487
0
0

... фундаментальными, хотя все они в определенной степени способствовали развитию физики в прошлом и настоящем. Было бы полезно систематизировать многочисленные исторические наблюдения и опыты, входящие в курс физики средней школы (и те, которые, по нашему мнению, должны войти в будущем), по их функциональному признаку – реализации определенной задачи и значению в развитии физической науки. Класс ...

Скачать
144436
9
0

... : а) первый уровень (1–4 классы) – безопасность школьника; б) второй уровень (5–9 классы) – безопасность личности; в) третий уровень (10–11 классы) – безопасность жизнедеятельности личности, общества и государства. Преподавание основ безопасности жизнедея­тельности на каждой ступени общеобразователь­ной школы имеет свои особенности. В начальной школе особенностью является то, что у младших ...

Скачать
52511
3
7

... , анализ, прогноз не носят завершающего цикла. В диссертации проанализированы причины, вызывающие затруднения у руководителей вуза и преподавателей по использованию технологий адаптивного компьютерного тестирования в профессиональной деятельности. Теория педагогических измерений в современных условиях внедрения государственных образовательных стандартов – это качественно новый этап в развитии ...

0 комментариев


Наверх