4. Принципы отбора содержания. Критерии оценки содержания теста
При создании теста внимание разработчика, прежде всего, привлекают вопросы отбора содержания, которое можно определить как оптимальное отображение содержания учебной дисциплины в системе тестовых заданий. Требование оптимальности предполагает использование определенной методики отбора, включающей вопросы целеполагания, планирования и оценки качества содержания теста.
Этап целеполагания является наиболее трудным и вместе с тем наиболее важным: от результатов его выполнения в первую очередь зависит качество содержания теста. В процессе целеполагания преподавателю необходимо решить вопрос о том, какие результаты учеников он хочет оценить с помощью теста.
Основания для ошибок в выводах педагога далеко не всегда связаны с технологическими недостатками традиционных средств контроля. Иногда они обусловлены недоработками педагога на этапе целеполагания, когда центр тяжести проверки смещается на второстепенные цели обучения, а иногда этап целеполагания отсутствует вовсе, поскольку часть педагогов уверена в непогрешимости своего опыта и интуиции, особенно при условии многолетней работы в школе. Однако никакие даже очень совершенные методы контроля и никакой опыт не дадут оснований для надежных выводов о достижении целей обучения до тех пор, пока нет уверенности в правильной постановке целей контроля и в их правильном, несмещенном отображении в содержании теста.
При создании теста ставится задача отобразить в его содержании то главное, что должны знать ученики в результате обучения, поэтому ограничиться простым перечислением целей обучения нельзя. В тест хотелось бы включить все, но, к сожалению, это невозможно, поэтому часть целей приходится просто отбросить и не проверять степень их достижения учащимися. Для того чтобы не утратить самое главное, необходимо структурировать цели и ввести определенную иерархию в их взаимное расположение. Без сомнения, здесь нет и не может быть готовых общих рецептов, поскольку в каждой дисциплине свои приоритеты. К тому же отдельные цели заметно связаны между собой, и потому простого представления о системе целей как об упорядоченной совокупности без рассмотрения связей между элементами явно недостаточно.
После определения целей тестирования и их конкретизации необходимо разработать план и спецификацию теста.
При разработке плана делается примерная раскладка процентного соотношения содержания разделов и определяется необходимое число заданий, по каждому разделу дисциплины исходя из важности раздела и числа часов, отведенных на его изучение в программе.
Раскладку начинают с подсчета планируемого исходного числа заданий в тесте, которое затем в процессе работы над тестом будет неоднократно меняться в сторону увеличения или уменьшения. Обычно предельное число не превышает 60 - 80 заданий, поскольку время тестирования выбирают в пределах 1,5 - 2 ч., а на выполнение одного задания отводится в среднем не более 2 мин.
После выполнения первого шага по планированию содержания разрабатывается спецификация теста, в которой фиксируется структура, содержание проверки и процентное соотношение заданий в тесте. Иногда спецификацию делают в развернутой форме, содержащей указания на тип заданий, который будет использоваться для оценки достижений учащихся в соответствии с намеченными целями создания теста, время выполнения теста, число заданий, особенности проведения тестирования, которые могут повлиять на характеристики теста и т.д.
Спецификация в развернутой форме включает:
1) цель создания теста, обоснование выбора подхода к его созданию, описание возможных сфер применения теста;
2) перечень нормативных документов, используемых при планировании содержания теста;
3) описание общей структуры теста, включающее перечень субтестов (если они есть) с указанием подходов к их разработке;
4) количество заданий различной формы с указанием числа ответов к закрытым заданиям, общее число заданий в тесте;
5) число параллельных вариантов теста либо ссылку на кластер, содержащую число и номера заданий кластера;
6) вес каждого задания, рекомендуемый автором теста;
7) рекомендуемое время выполнения теста, в том числе на каждый субтест, среднее время выполнения одного задания с учетом специфики формы;
8) соотношение заданий по различным разделам и видам учебной деятельности школьников;
9) рекомендации по контингенту учащихся для апробации теста;
10) охват требований стандартов (для аттестационных тестов);
11) перечень требований, не вошедших в тест (для аттестационных тестов);
12) рекомендуемую автором стратегию расположения заданий в тесте.
Знания и умения делятся таким образом:
А – знания понятий, определений, терминов;
В – знание законов и формул;
С – умение применять законы и формулы для решения задач;
D – умение интерпретировать результаты на графиках и схемах;
Е – умение проводить оценочные суждения.
Нередко устанавливаются следующие пропорции:
А – 10%, В – 20%, С – 30%, D – 30%, Е – 10%.
Помимо критериев, есть общие принципы, способствующие в определенной степени правильному отбору содержания тестов.
Принцип репрезентативности регламентирует не только полноту отображения, но и значимость содержательных элементов теста. Содержание заданий должно быть таким, чтобы по ответам на них можно было сделать вывод о знании или незнании всей программы проверяемого раздела или курса.
Принцип системности предполагает подбор содержательных элементов, отвечающих требованиям системности и связанных между собой обшей структурой знаний. При соблюдении принципа системности тест можно использовать для выявления не только объема знаний, но и для оценки качества структуры знаний учеников.
После отбора содержания теста начинается наиболее ответственный этап создания предтестовых заданий. Эта работа поручается обычно самым опытным преподавателям с большим стажем работы в школе. Однако для создания заданий одного опыта недостаточно. Необходимы также специальные знания по теории и методике разработки педагогических тестов, обеспечивающие профессиональный подход к созданию предтестовых заданий.
В.С. Аванесов выделил 3 критерия отбора содержания тестовых заданий:
1) определенность содержания теста;
2) непротиворечивость содержания заданий;
3) обоснованность содержания тестовых заданий.
1. Определенность содержания теста образует предмет педагогического измерения. В случае гомогенного теста возникает вопрос об уверенности в том, что все задания теста проверяют знания именно по определенной учебной дисциплине, а не по какой-то другой. Довольно часто случается так, что правильные ответы на некоторые задания требуют знаний не только интересующей дисциплины, но и ряда других, обычно смежных и предшествовавших учебных дисциплин. Близость и связанность которых затрудняет точное определение предметной принадлежности измеряемых знаний.
Например, в физических расчетах используется немало математических знаний и потому в систему физического знания обычно включается та математика, которая используется при решении физических задач. Неудача в математических расчетах порождает неудачу при ответах на задания физического теста. Отрицательный балл ставится, соответственно, за незнание физики, хотя испытуемый допустил ошибки математического толка. Если в такой тест включено много таких заданий, которые для правильного решения требуют не столько физических знаний, сколько умений выполнять усложненные расчеты, то это может быть примером неточно определенного содержания теста по физике. Чем меньше пересечение знаний одной учебной дисциплины со знаниями другой, тем определеннее выражается в тесте содержание учебной дисциплины. Определенность содержания требуется и во всех других тестах. В гетерогенном тесте это достигается посредством явного выделения заданий одной учебной дисциплины в отдельную шкалу. При этом нередко встречаются задания, хорошо работающие не только на одну, но и на две, три и даже большее число шкал.
Во всяком тестовом задании заранее определяется, что однозначно считается ответом на задание, с какой степенью полноты должен быть правильный ответ. Не допускается определение понятия через перечисление элементов, не входящих в него.
2. Непротиворечивость содержания заданий требует, чтобы относительно одной и той же мысли не возникали суждения, одновременно утверждающие и отрицающие ее. Недопустимо существование двух исключающих ответов на одно и то же задание теста. Если испытуемым дается инструкция: "Обведите кружком номер правильного ответа", а затем в одном из ответов утверждается, что правильного ответа нет, то это порождается пример непоследовательности мышления разработчика теста. В некоторых тестах встречаются ответы, вообще не связанные с содержанием задания. Таки ответы довольно легко распознаются испытуемыми как ошибочные, и потому тест оказывается неэффективным. Для повышения эффективности тест предварительно проходит апробацию на типичной выборке испытуемых. И если обнаружатся такие ответы к заданиям, которые испытуемые вообще не выбирают, то такие ответы из теста удаляются. Потому что они не выполняют функцию так называемых дистракторов, призванных отвлечь внимание незнающих испытуемых от правильного ответа. Кроме того, такие дистракторы вредны для теста, ибо снижают точность измерений (но об этом в статьях, где будут рассматриваться вопросы надежности тестов).
3. Обоснованность содержания тестовых заданий означает наличие у них оснований истинности. Обоснованность связана с аргументами, которые могут быть приведены в пользу той или другой формулировки заданий теста. При отсутствии доказательных аргументов в пользу правильности сформулированного задания оно в тест не включается, ни под каким предлогом. То же происходит, если в процессе экспертного обсуждения возникает хотя бы один контраргумент, или допускается условие, при котором данное утверждение может оказаться двусмысленным или ложным. Идея обоснованности содержания теста тесно переплетается с принципом содержательной правильности тестовых заданий, о чем уже говорилось в предыдущей статье. Напомним, что в тест включается только то содержание учебной дисциплины, которое является объективно истинным и что поддается некоторой рациональной аргументации. Соответственно, спорные точки зрения, вполне приемлемые в науке, не рекомендуется включать в содержание тестовых заданий.
Неистинность содержания тестовых заданий отличается от некорректности их формулировки. Неистинность, как отмечалось выше, определяется соответствующим ответом, в то время как некорректно сформулированное задание может продуцировать ответы как правильные, так и неправильные, а то и вызывать недоумение. Сюда же можно отнести неточно или двусмысленно сформулированные задания, порождающие несколько правильных или условно правильных ответов. Отсюда возникает необходимость вводить дополнительные условия истинности, что удлиняет само задание и усложняет его семантику. Некорректность формулировки обычно выясняется в процессе обсуждения содержания заданий с опытными педагогами-экспертами. Успех такого обсуждения возможен при создании соответствующей культурной среды, где допустимы только конструктивные и тактичные суждения. Увы, опыт убеждает, что такое встречается не часто. Между тем, только совместное и доброжелательное обсуждение материалов разработчиками и экспертами способно породить атмосферу поиска наилучших вариантов содержания теста. Этот поиск практически бесконечен, и здесь нет истины в последней инстанции.
... б) 4–5 в) 6–7 г) 8–9 2. Число мочеиспусканий у детей первого года жизни составляет в сутки а) 1–10 б) 10–20 в) 20–30 г) 30–40ЭТАЛОНЫ ОТВЕТОВ 1в 2б СБОРНИК ТЕСТОВЫХ ЗАДАНИЙ ДЛЯ ИТОГОВОЙ ГОСУДАРСТВЕННОЙ АТТЕСТАЦИИ по специальности 0401 «Лечебное дело» ТЕРАПИЯВВЕДЕНИЕУважаемые коллеги! Обучение студентов в медицинском колледже (училище) завершается подведением итоговой аттестации, которая ...
... критериев, включающая совокупность ориентировочных связей у всех испытуемых, прошедших проверку, возросла. 3. Доказаны валидность и надежность тестовых заданий. Таким образом, разработанные в рамках системного подхода в ходе формирующего эксперимента тестовые задания, методы составления экспертной оценки контроля знаний способствуют реализации мониторинга исследования тестовых заданий
... надежности, как и валидности, предъявляют определенные требования. Надежность и валидность можно оценить с помощью таблицы 1.1.[1] 2. РАЗРАБОТКА ПАКЕТА ТЕСТОВЫХ ЗАДАНИЙ ДЛЯ ОПЕРАТИВНОГО КОНТРОЛЯ УРОВНЯ ЗНАНИЙ СТУДЕНТОВ ПО КУРСУ «МЕХАНИКА» Одним из эффективных инструментов при проведении педагогического эксперимента является компьютерная технология оценки качества знаний, умений и навыков. ...
... в ходе рассуждения учащегося цепочка прервалась (несоответствие понятия или пояснения), то количество существенных операций определяется до разрыва логической цепочки. Особенность составления тестовых заданий этого уровня усвоения заключается в том, что практически невозможно создать однозначный эталон. Эталон может быть создан в виде схемы решения проблемы. Пример: логическая цепочка. ...
0 комментариев