2. Методология и технология построения тестовой системы контроля
2.1 Понятие и методика тестового контроля
Метод тестирования имеет многолетние корни. В современном образовании он является одним из самых эффективных методов измерения учебных достижений учащихся. Ему посвящены многие работы исследователей. Данный метод активно используется и в практике педагогов, руководителей образовательных учреждений и системы образования. Однако его применение возможно лишь при условии освоения основных подходов к созданию измерительных материалов, их особенностей.
Проблемно-хронологический анализ становления тестовой технологии и исследования современных тестологов позволяют увидеть пути решения проблемы создания инструментария, способного точно и объективно оценить качество подготовки учащихся образовательных учреждений при массовых измерениях, например, в ходе аттестации образовательных учреждений, когда целесообразно использовать в качестве измерительного инструмента именно тесты.
Диапазон подходов к определению педагогических тестов широк как в научной, так и в методической литературе. Сложность рассмотрения понятия «тест» усугубляется неоднозначностью подходов в теории и практике. В современной педагогике наметилось два широких подхода к его определению. Под тестом понимается либо весь метод исследования целиком, включая процедуру проверки, либо только средство измерения.
Часть авторов уже названием тестов определяет цель тестирования:
- тест обученности – это совокупность заданий, сориентированных на определение (измерение) уровня (степени) усвоения определенных аспектов (частей) содержания обучения (В.П. Симонов) [53, с.70];
- тест достижений – набор стандартизированных заданий по определенному материалу, устанавливающий степень усвоения его учащимися (А.Н. Майоров) [38, с.81];
- тест успеваемости – это совокупность заданий, ориентированных на измерение степени уровня определенных аспектов содержания образования (Н.М. Розенберг) [60, с.17].
Очевидно, что многообразие подходов к определению теста порождается многообразием существенных признаков педагогического теста, которые, прежде всего, зависят от цели создания теста и круга вопросов, решаемых с его помощью.
Сложность рассмотрения понятия «педагогический тест» также усугубляется неоднозначностью подходов теоретиков и практиков. Так, А.Н. Майоров рассматривает его как достаточно широкое понятие: «инструмент, состоящий из квалиметрически выверенной системы тестовых заданий, стандартизированной процедуры проведения и заранее спроектированной технологии обработки и анализа результатов, предназначенный для измерения качеств и свойств личности, измерение которых возможно в процессе систематического обучения» [38, с. 33].
В.С. Аванесов понятие «педагогический тест» сужает и трактует его в двух существенных смыслах: как метод педагогического измерения и как результат применения теста как метода измерения, состоящего из ограниченного множества заданий. При этом замечает, что в большинстве работ западных авторов, в отличие от отечественных, понятие «тест» чаще рассматривается во втором смысле. [2, с.12]
М.Б. Челышковой ближе толкование понятия «теста» как совокупности заданий, которые позволяют дать объективную, сопоставимую и даже количественную оценку качества подготовки обучаемого в заданной образовательной области. [75, с.25-26]
Процесс совершенствования понятийного аппарата идет по пути «систематизации множества определений и приведения их в соответствие с решением вопроса классификации педагогических тестов» [7, с. 39].
Разработчики тестов опираются на два подхода, которые уже сложились в тестировании: тесты, ориентированные на критерий (критериально-ориентированные), и тесты, ориентированные на норму (нормативно-ориентированные).
Для критериально-ориентированной интерпретации вывод выстраивается вдоль логической цепочки: задания → ответы → выводы о соответствии испытуемого заданному критерию.
При критериально-ориентированном подходе создаются тесты для сопоставления учебных достижений каждого ученика с планируемым к усвоению объемом знаний, умений или навыков, а в качестве интерпретационной системы отсчета используется конкретная область содержания (например, содержание за год обучения или за ступень обучения). Трудность заключается в том, что в тесте стараются отразить больший объем содержания контролируемого курса. Но так как проверить все просто невозможно, необходимо ранжировать содержание и требования по степени важности. Тест включает все то, что можно условно принять за 100%.
Преимущество критериально-ориентированных тестов в том, что они помогают собрать полную и объективную информацию о достижениях каждого учащегося; сравнить обученность ученика с требованиями, заложенными в государственных образовательных стандартах. В результате критериально-ориентированного тестирования ученик получает информацию о том, что он знает по сравнению с требованиями к уровню подготовки по предмету.
В рамках нормативно-ориентированного подхода тесты разрабатываются для сравнения учеников по уровню учебных достижений. Это достигается путем сопоставления результата каждого учащегося с результатами других учеников, которые выполняли тот же тест. Для нормативно-ориентированной интерпретации вывод выстраивается вдоль цепочки: задания → ответы → выводы о знаниях испытуемого → рейтинг, понимаемый как вывод о месте или ранге испытуемого.
При нормативно-ориентированном подходе возникает вопрос об истинной оценке результата каждого ученика, поэтому эмпирически устанавливаются нормы (система показателей, отражающих результаты выполнения теста большой группой испытуемых).
Нормативно- и критериально-ориентированные тесты отличаются по целям создания, методике отбора содержания, характеру распределения эмпирических результатов тестирования и методам их обработки, критериям качества тестов и тестовых заданий, а, главное, по интерпретации результатов испытуемых.
Критериально-ориентированные тесты необходимы, прежде всего, для определения учебных достижений при сравнении с требованиями, которые заложены в стандартах по различным предметам.
Требования к тестам как измерительному инструменту содержат требования к расчету показателей качества тестов и требования к их оснащению. Такими показателями качества являются надежность и валидность тестового инструментария.
А.А. Анастази определяет надежность теста как «согласованность показателей, полученных у тех же самых испытуемых при повторном тестировании, тем самым тестом, или эквивалентной ее формой» [2, с. 35].
Надежность теста является одним из критериев качества теста и показывает, насколько точно измеряет данный тест изучаемое явление. Следовательно, термин «надежность» имеет два значения: во-первых, если тест надежный, он при повторном выполнении дает близкие результаты; во-вторых, он обеспечивает высокую точность измерений.
Стандартный набор данных о тесте, предназначенных для широкого употребления, обязательно должен включать сведения о мере ее надежности.
Исследования В.С. Аванесова, Дж. Гласcа, А.Н. Майорова, Е.А. Михайлычева, М.Б. Челышковой, Н.М. Розенберга и ряда других авторов приводят к выводу о том, что надежность теста является характеристикой того, в какой степени полученные в результате тестирования различия между испытуемыми является отражением различий в свойствах испытуемых и в какой мере являются отображением случайных ошибок. Н. Гронлуд отмечает: «Если балл, полученный учеником в результате теста по оценке результатов, будет соответствовать той оценке, которую они получили бы при повторном прохождении того же теста или идентичного с ним по форме, то данная оценка считается высоко надежной… Чем длиннее тест, тем более надежными и адекватными будут результаты» [3, с. 205].
Вторым важным показателем качества теста является валидность (от англ. valid – пригодный). «Проблема валидности возникает в процессе разработок и практического применения теста, когда ставится задача установить соответствие между степенью выраженности интересующего свойства личности и методам его измерения. Чем валиднее тест, тем лучше отображается в нем то качество (свойство), ради измерения которого он создавался» [2, с. 47].
Для определения подходов к процессу валидизации теста и валидности в трудах ученых используется большое количество терминов. Одним из наиболее распространенных терминов является «содержательная валидность», необходимость которой не отрицают вышеназванные тестологи и определяют ее как характеристику репрезентативного содержания теста по отношению к запланированным для проверки знаний и умений. По мнению И.А. Анастази, сфера распространения валидности по содержанию – это тесты учебных достижений, особенно критериально-ориентированные тесты по усвоению материала и навыков. Если тест позволяет проверить все то, что авторами было задумано в спецификации, он считается валидным относительно контролируемого содержания курса. Полнота выходит на первый план именно при создании критериально-ориентированных тестов. Помимо этого, повышению содержательной валидности способствует независимая экспертиза.
Анализ трудов теоретиков-тестологов позволяет сделать следующие выводы:
- тесты отличаются от других средств контроля (контрольных работ, диктантов и др.) тем, что проходят процесс научного обоснования качества, который предполагает оценку соответствия характеристик тестов двум важнейшим критериям: надежности и валидности;
- при оценке надежности и валидности не следует полагаться на единственную формулу, а надо пользоваться совокупностью методов, ориентированных на особенности разрабатываемого теста;
- любые оценки надежности и валидности выступают не как истина в последней инстанции, а лишь как правдоподобные утверждения, имеющие ту или иную степень достоверности;
- повышению точности и созданию качественных тестов способствует стандартизация процедуры предъявления теста;
- современная теория тестов позволяет повысить точность измерений и качество педагогических тестов.
При создании тестов важен выбор модели педагогического тестирования – схемы предъявления тестовых заданий и оценивания результатов тестирования.
... учебного процесса; 4) Абсолютно неудовлетворительная объективность оценки знаний обучающихся, невозможность сопоставления оценок, полученных или разных обучающих или, тем более, в разных учебных заведениях [10]. 1.8 Тестовый контроль знаний на уроках химии В последние годы в связи с проведением в стране эксперимента по внедрению единого государственного экзамена (ЕГЭ) тестовые задания все ...
... , становления и трансформации тестирования в отечественной истории образования и педагогической мысли. На основе анализа проблемы сформулирована тема исследования: «Генезис тестирования в истории отечественного образования». Актуальность, несоответствия, противоположности, противоречия, проблема и тема позволили сформулировать цель исследования: выявить, определить, обосновать предпосылки ...
... и взаимопонимания, достигать поставленных целей. В труде идет активный процесс становление тех практических умений и навыков, которые в будущем могут понадобиться для совершенствования профессиональных способностей. Глава 2. Разработка и апробация уроков по технологии с применением национально-регионального компонента в разделе «Ручная вышивка», 8 класс 2.1. Роль и место раздела «Ручная ...
... , позволяет педагогам более активно использовать их в обучении и воспитании. Практическая часть «Методика проведения контроля знаний, умений и навыков на уроках Мировой художественной культуры». 2.1 «Специфика контроля на уроках Мировой художественной культуры» При рассмотрении данного вопроса, я постараюсь дать оценку целесообразности использования определённых форм контрольных ...
0 комментариев