3.2 Форма представления электронного учебника
В пакете ToolBook II Assistant создать упакованную форму электронного учебника позволяет диалоговое окно “Автоупаковщик” (“AutoPackager”), представленное на рис. 16.
Рис.16. Вид диалогового окна “Автоупаковщик” пакета ToolBook II Assistant
Опции инсталляции позволяют выбрать один из пяти видов инсталляции.
Электронный учебник
Учебник организован как обычная книга, т.е. имеет такую же структуру. В начале учебника (рис.17) идёт описание навигационных средств учебника, таких, как кнопки перехода на страницы, кнопок вызова помощи, содержания и оглавления. Затем, на странице “содержание” (рис. 18) содержатся пункты основных разделов материала представленного в учебнике, в виде “горячих” слов. При нажатие мышкой на которые происходит перемещение на страницу указанную в содержание.
Рисунок 17 Страница "инструкция по навигации".
Рисунок 18 Страница "Содержание".
5. Требования к построению теста
В данной работе для тестирования применим так называемую закрытую форму тестов. Пользователю представлен вопрос или утверждение, а также варианты ответов. Причем количество самих ответов и правильных из них может быть неограниченно.
Тест по информатике может быть, охарактеризован как эффективный при условии, что он удовлетворяет определенным требованиям. Основные требования следующие:
надёжность более 0,7;
валидность;
дискриминативность стремится к 1;
Обсудим и определим все те термины, в которых следует досконально разобраться, чтобы тесты были не только правильно сконструированы, но и соответствующим образом использовались.
5.1 Надежность
Надёжность теста – это характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов. При этом надёжность бывает нескольких видов:
ре-тестовая надёжность – когда рассматриваются показатели при повторном исследовании испытуемых с помощью одного и того же теста по прошествии времени;
надежность частей теста – получается путём анализа устойчивости результатов отдельных совокупностей тестовых задач или отдельных частей теста.
5.1.1 Ре-тестовая надежность
Когда тест не может дать тот же самый результат для некоторого испытуемого (при условии, что этот испытуемый не изменился) в различных условиях, - значит, не все в порядке. Способ измерения ре-тестовой надёжности очень прост. Вычисляется корреляция показателей для выборки испытуемых, протестированных в двух случаях. Удовлетворительным наименьшим значением для ре-тестовой надежности является 0,7. Указанный предельный коэффициент надежности в известной мере условен. Для проективных и некоторых других тестов личности показатель ре-тестовой надежности может быть ниже, при этом диагностическая ценность методики не снижается.
При более низком значении использование теста становится вряд ли целесообразным, поскольку стандартная погрешность получаемых по нему показателей будет настолько велика, что интерпретация показателей станет сомнительной.
5.2 Коэффициент надежности
Средняя величина корреляции одного теста или задания со всем тестами или заданиями из генеральной совокупности называется коэффициентом надежности. Квадратный корень из коэффициента надёжности является корреляцией данного теста или задания с истинным показателем. Однако на практике невозможно точно вычислить это теоретическое значение надежности , потому что количество разработанных нами заданий и тестов не является бесконечным. Это означает, что надежность некоторого теста можно оценить лишь приблизительно.
Таким образом, на практике коэффициенты надежности основаны на корреляции одного теста с другими, и эта оценка может быть не очень точной. Это, означает, что имеющая более существенное значение корреляция теста или задания с истинным показателем тоже может быть оценена неточно.
5.3 Надежность и величина теста
Таким образом, надежность возрастает с величиной теста. С точки зрения разработчика тестов важной является быстрота возрастания надежности с возрастанием количества заданий. Всегда трудно разработать большое количество валидных заданий (например, таких, которые принадлежат именно нужной генеральной совокупности); следовательно, если мы хотим продемонстрировать, что скажем, надежность двадцати пяти заданий (с заданной средней корреляцией) является высокой, то достижение этой цели будет иметь смысл.
5.4 Коэффициент ассоциации для оценки надёжности теста
Тесноту связи между качественными признаками X и Y измеряют с помощью коэффициента ассоциации. Где Х – вид теста, а Y – результаты тестирования. В простейшем виде формула, по которой рассчитывается этот показатель, выглядит следующим образом:
, (1.1)
где
a, b, c, d – численности коррелируемых групп.
Коэффициент ассоциации, как и пирсоновский коэффициент корреляции, изменяется от -1 до +1. Значимость можно проверить с помощью t-критерия Стьюдента. Нулевую гипотезу, которая сводится к предложения, что в генеральной совокупности этот показатель равен нулю, отвергают, если
, (1.2)
где
– количество тестируемых,
– коэффициент ассоциации,
– t-критерий Стьюдента,
для принятого уровня значимости () и числа степеней свободы .
Так как коэффициент ассоциации имеет прямое отношение к пирсоновскому критерию , на котором он основан, то распределение вероятных значений критерия является непрерывным. Качественные же признаки дискретны, их числовое значение не распределяются непрерывно. Учитывая эту особенность, в формулу (1.1) принято вносить поправку Йейтса на непрерывность вариации, равную половине объёма выборки. И формула (1.1) принимает следующий вид:
. (1.3)
5.5 Валидность
Кратко рассмотрим природу валидности, второй из основных характеристик эффективных тестов. Тест называется валидным, если он измеряет то, для измерения чего он предназначен. Однако такое определение не разъясняет удовлетворительно значения валидности. В этом случае возникает новый вопрос: как мы узнаем, что тест измеряет то, для чего он предназначен? В действительности, существует много различных способов доказательства валидности тестов, и каждый из них соответствует разным аспектам этого значения.
Говорят, что тест является, очевидно валидным, если о нем складывается впечатление, что он измеряет именно то, что подразумевается, особенно с точки зрения испытуемых
Конкурентная валидность – эта валидность оценивается по корреляции результатов данного теста с результатами других тестов. Так, если мы пытаемся установить конкурентную валидность некоторого теста интеллекта, мы будем изучать его корреляцию с другими тестами, валидность которых установлена.
Содержательная валидность. Этот термин применяется, в основном, по отношению к тестам достижений и может быть просто объяснён следующим образом. Если можно показать, что задания теста отражают все аспекты исследуемой области поведения, то тест является, по существу, валидным, при условии, что инструкции изложены ясно. Содержательная валидность не сводится к простой очевидной валидности, которая связан с внешним видом заданий теста. Если в тесте математических навыков мы хотим протестировать умение перемножать выражения скобках и имеем задания вида , то трудно оспаривать валидность этого задания. Очевидно, содержательная валидность полезна только для тех тестов, для которых, как в данном случае, смысл, измеряемого параметра полностью ясен.
Были описаны разнообразные способы установления валидности тестов, некоторые из них коренным образом отличаются друг от друга. Из обсуждения должно быть также понятно, что не может быть какого-либо единственного показателя, демонстрирующего валидность теста. Для полной ее проверки следует учитывать множеств получаемых показателей. Более того, как это станет ясно из дальнейшего изложения, валидность теста может фактически гарантироваться логически обоснованными методами конструирования тестов.
5.6 Дискриминативность
Дискриминативность – это способность отдельных заданий теста и теста в целом дифференцировать обследуемых относительно “максимального” и “минимального” результата теста.
Еще одной особенностью эффективных тестов является дискриминативность. Действительно, достижение удовлетворительного распределения показателей является одной из целей разработчика теста. При помощи тщательного конструирования теста можно обеспечить соответствующий уровень дискриминативности, а это именно то, в чем тесты значительно выигрывают по сравнению с другими формами испытаний. В общем, было обнаружено, что в оценке может быть использовано около девяти градаций [1], а в опросах, вероятно, наиболее эффективно использовать три градации: ниже среднего, средний уровень и выше среднего. Дискриминативность измеряется показателем дельта Фергюсона и принимает максимальное значение при равномерном (прямоугольном) распределении показателей ().
5.7 Метод Фергюсона для вычисления дискриминативности теста
Коэффициент Фергюсона – это отношение между показателем дискриминативности, полученным для некоторого теста и максимальным значением дискриминативности, которое может обеспечить такой тест.
,
где
– количество испытуемых,
– количество заданий теста,
– частота встречаемости каждого показателя.
= 0, когда все испытуемые получили одинаковые показатели, то есть когда нет дискриминативности. = 1 при равномерном распределении заданий, в которых наиболее полно были реализованы все возможные проявления измеряемого свойства.
... больше меня заинтересовало другое предложение, выловленное мною совершенно случайно во время одного из сеансов работы в Internet. Многие вузы, особенно зарубежные, оказывается, готовы предложить... дистанционное образование. Вплоть до получения соответствующего диплома. Идея зацепила. Действительно, почему бы не попробовать поучиться прямо у себя дома, за компьютером (единственное условие: он ...
... прогрессивными в этом направлении считаются американские и западноевропейские учебные заведения, с готовностью разрабатывающие такие курсы. Основные виды и технологии интеллектуальных информационных систем Знание – основа интеллектуальной системы Многие виды умственной деятельности человека, такие, как написание программ для вычислительной машины, занятие математикой, ведение рассуждений на ...
0 комментариев