Что такое гетерогенный тест
Тест обладает составом, целостностью и структурой. Он состоит из:
Целостность теста означает взаимосвязь заданий, их принадлежность общему измеряемому фактору. Каждое задание теста выполняет отведенную ему роль и потому ни одно из них не может быть изъято из теста без потери качества измерения.
Структуру теста образует способ связи заданий между собой. В основном, это так называемая факторная структура, в которой каждое задание связано с другими через общее содержание и общую вариацию тестовых результатов.
Традиционный тест представляет собой единство, по меньшей мере, трех систем:
Традиционный педагогический тест нужно рассматривать в двух существенных смыслах: как метод педагогического измерения и как результат применения теста.
Удивительно, что работы на русском языке тяготеют к смыслу метода, в то время как в большинстве работ западных авторов понятие тест чаще рассматривается в смысле результатов. Между тем оба эти смысла характеризуют тест с разных сторон, потому что тест надо понимать одновременно и как метод, и как результат педагогического измерения. Одно дополняет другое. Тест как метод не мыслится без результатов, подтверждающих качество его самого и качество оценок измерения испытуемых различного уровня подготовленности.
В приведенном выше определении традиционного теста получили развитие несколько идей.
По существу этим отражается идея эффективности педагогической деятельности в области контроля знаний. Хотелось бы думать, что против самой этой идеи возражать уже некому и незачем.
Гомогенные тесты
К традиционным тестам относятся тесты гомогенные и гетерогенные.
Легко видеть, что в своей основе определение гомогенного теста совпадает с определением традиционного теста.
Гомогенные тесты распространены больше других. В педагогике они создаются для контроля знаний по одной учебной дисциплине или по одному разделу такой, например, объемной учебной дисциплины, как физика. В гомогенном педагогическом тесте не допускается использование заданий, выявляющих другие свойства. Наличие последних нарушает требование дисциплинарной чистоты педагогического теста. Ведь каждый тест измеряет что-то заранее определенное.
Например, тест по физике измеряет знания, умения, навыки и представления испытуемых в данной науке. Одна из трудностей такого измерения заключается в том, что физическое знание изрядно сопряжено с математическим. Поэтому в тесте по физике экспертно устанавливается уровень математических знаний, используемых при решении физических заданий. Превышение принятого уровня приводит к смещению результатов; по мере превышения последние все больше начинают зависеть не столько от знания физики, сколько от знания другой науки- математики.
Другой важный аспект- стремление некоторых авторов включать в тесты не столько проверку знаний, сколько умение решать физические задачи, вовлекая, тем самым, интеллектуальный компонент в измерение физической подготовленности.
Гетерогенные тесты
Нередко в такие тесты включаются и психологические задания для оценки уровня интеллектуального развития.
Обычно гетерогенные тесты используются для комплексной оценки выпускника школ, оценки личности при приеме на работу и для отбора наиболее подготовленных абитуриентов при приеме в вузы. Поскольку каждый гетерогенный тест состоит из гомогенных тестов, интерпретация результатов тестирования ведется по ответам на задания каждого теста (здесь они называются шкалами) и кроме того, посредством различных методов агрегирования баллов делаются попытки дать общую оценку подготовленности испытуемого.
Напомним, что традиционный тест представляет собой метод диагностики испытуемых, в котором они отвечают на одни задания, в одинаковое время, в одинаковых условиях и с одинаковой оценкой.
При такой ориентации задачи определения точного объема и структуры освоенного учебного материала отступают, по необходимости, на задний план. В тест отбирается такое минимально достаточное количество заданий, которое позволяет сравнительно точно определить, образно говоря, не «кто что знает», а «кто знает больше».
Интегративные тесты
Интегративным можно назвать тест, состоящий из системы заданий, отвечающих требованиям интегративного содержания, тестовой формы, возрастающей трудности заданий, нацеленных на обобщенную итоговую диагностику подготовленности выпускника образовательного учреждения.
Диагностика проводится посредством предъявления таких заданий, правильные ответы на которые требуют интегрированных (обобщенных, явно взаимосвязанных) знаний в области двух и большего числа учебных дисциплин. Создание таких тестов дается только тем преподавателям, которые владеют знаниями ряда учебных дисциплин, понимают важную роль межпредметных связей в обучении, способны создавать задания, правильные ответы на которые требуют от учащихся знаний различных дисциплин и умений применять такие знания.
Интегративному тестированию предшествует организация интегративного обучения. К сожалению, существующая сейчас классно-урочная форма проведения занятия, в сочетании с чрезмерным дроблением учебных дисциплин, вместе с традицией преподавания отдельных дисциплин (а не обобщенных курсов), еще долго будут тормозить внедрение интегративного подхода в процессы обучения и контроля подготовленности.
Преимущество интегративных тестов перед гетерогенными заключается в большей содержательной информативности каждого задания и в меньшем числе самих заданий.
Методика создания интегративных тестов сходна с методикой создания традиционных тестов, за исключением работы по определению содержания заданий. Для отбора содержания интегративных тестов использование экспертных методов является обязательным. Это связано с тем, что только эксперты могут определить адекватность содержания заданий целям теста. Но, прежде всего, самим экспертам важно будет определиться с целями образования и изучения тех или иных образовательных программ, а затем и договориться между собой по принципиальным вопросам, оставив для экспертизы лишь вариации в понимании степени значимости отдельных элементов в общей структуре подготовленности.
Адаптивные тесты
Целесообразность адаптивного контроля вытекает из необходимости рационализации традиционного тестирования.
Каждый учитель понимает, что хорошо подготовленному ученику нет необходимости давать легкие и очень легкие задания, потому что слишком высока вероятность правильного решения. К тому же легкие материалы не обладают заметным развивающим потенциалом. Симметрично, из-за высокой вероятности неправильного решения нет смысла давать трудные задания слабому ученику. Известно, что трудные и очень трудные задания снижают учебную мотивацию многих учащихся.
Нужно было найти сопоставимую, в одной шкале, меру трудности заданий и меру уровня знаний. Эта мера была найдена в теории педагогических измерений. Датский математик Г. Раск назвал эту меру словом «логит».
После появления компьютеров эта мера легла в основу методики адаптивного контроля знаний, где используются способы регулирования трудности и числа предъявляемых заданий, в зависимости от ответа учеников.
Использование заданий, соответствующих уровню подготовленности, существенно повышает точность измерений и минимизирует время индивидуального тестирования до 5-10 минут. Адаптивное тестирование позволяет обеспечить компьютерную выдачу заданий на оптимальном, примерно 50%-ном уровне вероятности правильного ответа для каждого ученика.
В западной литературе выделяется три варианта адаптивного тестирования.
Первый называется пирамидальным тестированием. При отсутствии предварительных оценок всем испытуемым дается задание средней трудности и уже затем, в зависимости от ответа, каждому испытуемому дается задание легче или труднее; на каждом шаге полезно использовать правило деления шкалы трудности пополам.
Второй вариант- flexilevel— контроль начинается с любого, желаемого испытуемым, уровня трудности, с постепенным приближением к реальному уровню знаний.
Таким образом, адаптивный тест представляет собой вариант автоматизированной системы тестирования с заранее известными параметрами трудности и дифференцирующей способностью каждого задания. Эта система создана в виде компьютерного банка заданий, упорядоченных в соответствии с интересующими характеристиками заданий.
Распространенная у нас образовательная модель адаптивной школы Е.А. Ямбурга исходит, по существу, из общих идей адаптивного обучения и адаптивного контроля знаний. Истоки такого подхода можно проследить с момента возникновения педагогических трудов Коменского, Песталоцци и Дистервега, которых объединяют идеи природосообразности и гуманности обучения. В центре их педагогических систем был Ученик.
Например, в малоизвестной у нас работе А. Дистервега «Дидактические правила» (Киев, 1870 г.) можно прочитать такие слова: «Преподавай сообразно природе. Учи без пробелов. Начинай преподавание с того, на чем остановился ученик. Прежде чем приступить к преподаванию, нужно исследовать точку исхода. Без знания того, на чем остановился ученик, невозможно порядочно обучить его«.
Недостаточная информированность о реальном уровне знаний учеников и естественные различия в их способностях усвоить предлагаемые знания стали главной причиной появления адаптивных систем, основанных на принципе индивидуализации обучения.
Критериально-ориентированные тесты
Это весьма условное и в принципе неправильное название группы тестов, получивших у нас некоторое распространение и признание. К сожалению, была сделана даже попытка ввести это название в текст наших законов об аттестации и о стандартах, против чего выступил В.С. Аванесов. По существу же мы имеем дело не столько с тестами названного рода, сколько с интерпретацией тестовых результатов
Если главной задачей является стремление выяснить,какие элементы содержания учебной дисциплины усвоены тем или иным испытуемым, то это случай предметно-педагогического подхода к интерпретации результатов тестирования. При этом определяется: что из генеральной совокупности заданий (по англ. Domain) испытуемый знает и чего не знает. Интерпретация результатов ведется педагогами, на языке учебной дисциплины.
Споры ведутся вокруг двух главных вопросов:
1. Правильности содержания теста, что означает безошибочность формулировок его заданий, предметно-научную обоснованность, допустимость теста для проверки интересующих знаний в данной группе испытуемых.
При аргументации в пользу того или иного теста педагоги-предметники опираются на понятийный аппарат, язык, принципы и вообще на знания преподаваемой ими учебной дисциплины. В таких случаях говорят о тестах с содержательно-ориентированной интерпретацией результатов. Это так называемый случай Domain Referenced Testing, что можно перевести как соотнесение знаний по результатам теста со знаниями, полный перечень которых представлен в генеральной совокупности (domain);
2. Обоснованности оценки знаний по всему учебному предмету, на основе результатов тестирования испытуемых по небольшой выборке заданий теста; выборке из потенциально или реально существующей генеральной совокупности всех заданий, которые можно было бы дать испытуемым для уверенной и обоснованной оценки. Фактически это вопрос обоснования точности индуктивного вывода о знании большого числа вопросов на основе ответов по малому числу заданий теста.
Второй вид тестов связан с ориентацией на такие конкретные цели и задачи, как, например, проверка уровня усвоения сравнительно короткого перечня требуемых знаний, умений и навыков, выступающих в качестве заданного стандарта или критерия усвоения.
Например, для аттестации выпускников образовательных учреждений важно иметь такие задания, которые позволяют делать вывод о минимально допустимой компетентности выпускников. За рубежом их так и называют: Minimum Competency Tests. При проверке минимально допустимого уровня знаний содержание заданий носит принципиально облегченный характер. Поскольку такие задания должны выполнять все выпускники, допущенные учебным заведением к аттестации, здесь трудно говорить о тестах как методе объективного и эффективного измерения разного уровня подготовленности испытуемых, в строгом смысле понятия «тест».
Этот подход выработан для органов управления образованием, стоящих перед необходимостью в короткое время проверить состояние образования в большом количестве учебных заведений и не позволять последним опускаться ниже предельно допустимого уровня требований.
По мнению В.С. Аванесова, используемые при этом «тесты» не соответствуют подлинно тестовым требованиям, предъявляемым к традиционным и адаптивным тестам. При критериально-ориентированной интерпретации для диагностики заранее заданного уровня подготовленности используются, по существу, не тесты, в традиционном понимании этого метода, а совокупности заданий в тестовой и в иной другой форме, не более того. Слово одно, но смысл другой.
Педагогические компьютерные тесты
Зелинская Нина Гордеевна
преподаватель латинского языка и ТИЛФ
учреждение: Министерство Здравоохранения РФ Федеральное Государственное Бюджетное Профессиональное Образовательное Учреждение Ульяновский Фармацевтический Колледж Минздрава России
Интернет-ресурсы активизируют познавательную деятельность, формируют информационную культуру, навыки исследовательской и аналитической деятельности, а также формируют умения самостоятельно принимать решения.
Размещенную в сети Интернет информацию можно разделить на три основные группы :
Наиболее значимыми являются электронные библиотеки, при работе с которыми студенты, чаще всего, получают бесплатный доступ к размещенным каталогам и материалам.
Под тестом (англ. test — проба, испытание, проверка) понимается ансамбль стандартизированных, стимулирующих определенную форму активности, часто ограниченных по времени выполнения заданий, результаты которых поддаются количественной (и качественной) оценке и позволяют установить индивидуально-психологические особенности личности.
В настоящее время принято выделять два вида тестов :
Существуют два основных вида педагогических тестов :
Педагогический тест (традиционный) — это система заданий возрастающей трудности, позволяющая эффективно измерить уровень и качественно оценить структуру подготовленности учащихся.
Традиционный педагогический тест нужно рассматривать в двух существенных смыслах :
Ведущая идея традиционного теста – минимальным числом заданий, за короткое время, быстро, качественно и с наименьшими затратами сравнить знания как можно большего числа учащихся.
Первая идея: тест рассматривается не как обычная совокупность или набор вопросов, задач и т.п., а в виде понятия «система заданий». Такую систему образует не всякая совокупность, а только та, которая обусловливает возникновение нового интегративного качества, отличающего тест от элементарного набора заданий и от других средств педагогического контроля.
Цель тестирования: минимальным числом заданий, за короткое время, быстро, качественно и с наименьшими затратами сравнить знания как можно большего числа учащихся.
Существует ряд требований к педагогическим тестам.
Педагогический тест должен обладать :
Он должен состоять из:
заданий, правил их применения, оценок за выполнение каждого задания рекомендаций по интерпретации тестовых результатов.
Основные типы педагогических тестов:
Каждому заданию ставятся в соответствие ответы правильные и неправильные (дистракторы). Тестовые задания бывают открытого и закрытого типа.
В современной тестологии (Аванесов В.С., Челышкова М.Б., Майоров А.Н. и др.) различают 4 типа заданий в тестовой форме :
Задания на выбор одного или нескольких правильных ответов для компьютерного контроля знаний подходят больше всего. Такие задания удобно разделить на следующие виды : задания с двумя, тремя, четырьмя пятью и большим числом ответов. Инструкцией для этой формы заданий служит предложение: «Обведите (отметьте, укажите) номер правильного ответа».
Пример 1. Отметьте номер правильного ответа.
Место, которое занимает цифра в записи числа, называют:
В заданиях открытой формы готовые ответы не даются: их должен придумать или получить сам тестирующийся. Для открытой формы принято использовать инструкцию, состоящую из одного слова: «Дополните».
Пример 2. Дополните.
В двоичной системе счисления 10-1=_________.
Задания на дополнение бывают двух заметно отличающихся видов :
В заданиях на установление соответствия преподаватель проверяет знание связей между элементами двух множеств. Элементы для сопоставления записываются в два столбца: слева обычно приводятся элементы задающего множества, содержащие постановку проблемы, а справа – элементы, подлежащие выбору. К заданиям дается стандартная инструкция: «Установите соответствие». Следует отметить, что желательно, чтобы в правом столбце элементов было больше, чем в левом.
Тестовые задания на установление правильной последовательности предназначены для оценки уровня владения последовательностью действий, процессов и т.п. Цель введения таких заданий в учебный процесс – формирование алгоритмического мышления, алгоритмических знаний, умений и навыков. Стандартная инструкция к этим заданиям имеет вид: «Установите правильную последовательность действий».
Пример 3. Установите правильную последовательность
Команда полного ветвления на УАЯ имеет формат:
Наличие достаточного числа тестовых заданий позволяет перейти к разработке теста как системы, обладающей целостностью, составом и структурой. Целостность теста образует взаимосвязь ответов испытуемых на задания теста, наличие общего измеряемого фактора, влияющего на качество знаний. Состав теста образует правильный подбор заданий, позволяющий минимально необходимым числом отобразить существенные элементы языковой компетентности испытуемых. Чем больше правильных ответов, тем выше индивидуальный тестовый балл испытуемых.
Теорию тестов можно определить, как совокупность непротиворечивых понятий, форм, методов, аксиом, формул и утверждений, способствующих повышению эффективности и качества тестового процесса. Кроме того, может потребоваться и некоторый опыт применения методов многомерного статистического анализа, и опыт правильной интерпретации тестовых результатов.
Для определения уровня структурированности подготовленности можно использовать коэффициент Л. Гутмана, ранее неточно называвшийся мерой «надежности теста».
По мнению Беспалько В.П. и Татур Ю.Г., тестирование должно быть измерением качества усвоения знаний, умений и навыков. Сравнение правил выполнения задания (задачи), предложенного в тексте, с эталоном ответа позволяет определить коэффициент усвоения знаний (К us ).
,
где А – число правильных ответов,
Р – число заданий в предлагаемых тестах.
При создании теста внимание разработчика, прежде всего, привлекают вопросы отбора содержания, которое можно определить, как оптимальное отображение содержания учебной дисциплины в системе тестовых заданий. Требование оптимальности предполагает использование определенной методики отбора, включающей вопросы целеполагания, планирования и оценки качества содержания теста.
Знания и умения делятся таким образом :
А – знания понятий, определений, терминов;
В – знание законов и формул;
С – умение применять законы и формулы для решения задач;
D – умение интерпретировать результаты на графиках и схемах;
Е – умение проводить оценочные суждения.
Нередко устанавливаются следующие пропорции: А – 10%, В – 20%, С – 30%, D – 30%, Е – 10%.
Определенность содержания теста образует предмет педагогического измерения. В случае гомогенного теста возникает вопрос об уверенности в том, что все задания теста проверяют знания именно по определенной учебной дисциплине, а не по какой-то другой.
Непротиворечивость содержания заданий требует, чтобы относительно одной и той же мысли не возникали суждения, одновременно утверждающие и отрицающие ее. Недопустимо существование двух исключающих ответов на одно и то же задание теста. Если испытуемым дается инструкция: «Обведите кружком номер правильного ответа», а затем в одном из ответов утверждается, что правильного ответа нет, то это порождается пример непоследовательности мышления разработчика теста. Для повышения эффективности тест предварительно проходит апробацию на типичной выборке испытуемых.
Обоснованность содержания тестовых заданий означает наличие у них оснований истинности. Обоснованность связана с аргументами, которые могут быть приведены в пользу той или другой формулировки заданий теста. При отсутствии доказательных аргументов в пользу правильности сформулированного задания оно в тест не включается, ни под каким предлогом.
Методологические знания. Это знания о методах преобразования действительности, научные знания о построении эффективной деятельности. Это знания самого высокого, пятого уровня.
Компьютерные тесты – тесты подготовленные и реализуемые с помощью современных информационных технологий.
Положительные стороны компьютерных тестов:
Отрицательные стороны компьютерных тестов:
Технологические особенности подготовки компьютерных тестов:
Для подготовки педагогического компьютерного теста необходимо обладать специальной «тестовой» квалификациейХорошее знание современных информационных технологий Знание статистических методов обработки результатов тестированияПравильно интерпретировать результаты теста.
Существует огромное множество программ для тестирования. Некоторые из них приведены ниже.
1. TeachMaster – программа для осуществления диагностики знаний в рамках образовательных и иных учреждений (вузы, колледжи, школы, отделы кадров предприятий и т.п.)
2. Hyper test – Программа предназначена для проверки знаний (тестирования).
В отличии от других программ, она обладает следующими характерными свойствами:
Первые версии программы, как тестовые будут условно бесплатными, в будущем намечается переход на коммерческую основу. Автор программы – Рыбалкин К.Г. (Караганда, Казахстан). Все права на программу HyperTest принадлежат только автору.
Определённым недостатком является невозможность применять её для контрольного тестирования. Программа широко используется во всем мире для создания заданий для изучения любых дисциплин.
4. AVELife TestGold Studio – это cовременный, надежный, легкий в освоении и удобный в использовании инструмент для принятия решений, связанных с оценкой уровня знаний, умений, навыков и психологических характеристик сотрудников или обучаемых, — от разработки тестов до проведения тестирования и анализа его результатов. Программа позволит контролировать результат обучения, периодически получать информацию по квалификации всех сотрудников и т.п.
Разработчик: AVELife, Inc. Сайт программы : http://www.avelife.ru / Способ распространения: shareware
TestGold отличает удобный интерфейс, многоуровневая система обеспечения безопасности данных, гибкий механизм формирования отчетов. Наличие более 300 готовых тестов (маркетинг, интеллект, психологические методики и др.) позволит сразу приступить к применению программы.
AVELife TestGold Agent 2.2 — это бесплатный агент тестирования по технологии TestGold.
5. УСАТИК – это аббревиатура, расшифровывающаяся как универсальная система автоматизированного тестирования и контроля.
В состав УСАТИК входят четыре программы :
С помощью УСАТИК 2.003 можно организовать как классическое тестирование в компьютерном классе школы, вуза, техникума, так и телетестирование с применением Интернета.
Таким образом, компьютерное тестирование активно используется в преподавании. Оно значительно сокращает процесс проверки знаний учащихся и помогает работникам образования в их непосредственной деятельности. С помощью компьютерного тестирования студенты учатся быстро принимать решения и выбирать из большого объёма материала нужное, в последствии эти данные можно использовать в написании ВКР.
Одномерное шкалирование гетерогенных тестов
Опубликовано в ж. «Педагогические Измерения» №2, 2005 г.
Известное определение гомогенного теста предполагает использование заданий, выявляющих одно какое-либо качество (свойство) [1, с. 190, 193]. Гомогенный тест, измеряющий уровень подготовленности учащихся по одной учебной дисциплине или одному разделу объемной учебной дисциплины, одномерен, т.е. одномерна шкала, на которой фиксируются результаты.
Интегративные тесты диагностируют общую подготовленность учащихся. Конструирование или выбор правильного ответа на задание интегративного теста требует знаний по двум и более учебным дисциплинам. Из общих соображений следует, что если для выполнения какого-либо задания интегративного теста требуется наличие свойства A с уровнем не ниже определенного и свойства B с уровнем не ниже определенного, то система заданий (интегративный тест) будет фактически измерять наименее выраженное свойство испытуемого, практически игнорируя свойство с максимальной выраженностью.
Пример: тестовые задания предполагают перевод предложений с родного языка на иностранный, без словаря. Если тест будет составлен из заданий с последовательно возрастающей от задания к заданию лексической и грамматической трудностью, испытуемый в ходе тестирования дойдет до задания (или группы заданий, учитывая вероятностный характер ответа), где откажет либо его лексический запас, либо знание грамматики. Тестовый балл (т.е. количество верно выполненных заданий) отразит наименее развитое качество (свойство). Установить по тестовому баллу, является это свойство знанием лексики либо грамматики, невозможно. Из сказанного вытекает основное назначение интегративных тестов – диагностика подготовленности выпускника образовательного учреждения [1, с. 191], поскольку текущий контроль тестами с подобными характеристиками нецелесообразен.
Проблемой при создании заданий интегративного теста является установление баланса между необходимыми для выполнения каждого задания свойствами. Любое задание гомогенного теста можно рассматривать так же, как интегративное, с сознательно нарушенным балансом между необходимыми для его выполнения свойствами. Необходимый уровень всех остальных свойств (кроме основного, измеряемого тестом в соответствии с его назначением) устанавливается в гомогенном тесте ниже некоторого определенного, устанавливаемого экспертным путем, уровня. Так, при составлении заданий гомогенных тестов по грамматике тексты заданий должны содержать только хорошо усвоенную лексику, обеспечивающую достаточную ситуативность и однозначность стимула (основы задания) [2, с. 83]. Нарушение этого требования неизбежно переводит задание в разряд интегративных. Аналогично лексические задания, вне зависимости от уровня их сложности, должны требовать для своего выполнения минимума грамматических знаний.
Проблемы другого рода возникают при использовании гетерогенных тестов. Гетерогенный тест – система, создаваемая с целью измерения уровня подготовленности учащихся по нескольким учебным дисциплинам [1, с. 191]. Используются они там, где необходима комплексная оценка (проверка знаний выпускников школ, абитуриентов на вступительных экзаменах). Классический гетерогенный тест, по сути, состоит из отдельных гомогенных тестов (далее называемых субтестами), по одному субтесту на каждую дисциплину или раздел дисциплины. Отсюда вытекают две методики шкалирования: раздельное оценивание заданий каждого субтеста либо агрегирование баллов по каждому субтесту. Идее комплексной оценки более отвечает агрегирование баллов, чем раздельное оценивание. Самый простой агрегирующий метод – подсчет суммарного тестового балла без учета вклада каждого субтеста в конечный результат. Здесь результат существенно зависит от соотношения между размерами отдельных субтестов. Убедительной аргументации в пользу агрегирования посредством суммирования не существует. Положение не исправляется и при взвешенном суммировании (т.е. приписывании заданиям отдельных субтестов различных весов в зависимости от их предполагаемой важности).
Возможна следующая геометрическая интерпретация процесса измерения. Гомогенный тест одномерен, т.е. измеряемое свойство характеризуется одним параметром – расстоянием между точкой, отражающей уровень проявления измеряемого свойства у данного испытуемого, и точкой абсолютного нуля (полного незнания). Гетерогенный тест многомерен, и его размерность определяется количеством измеряемых свойств. Отсюда вытекает геометрическая интерпретация комплексного знания как некоторого многомерного тела в многомерном пространстве знаний. Для случая двух измеряемых свойств речь идет о плоской фигуре.
При упрощении картины и предположении всего трех уровней у каждого из двух свойств получается хорошо известный в философии даосизма пятичастный крест [3, с. 15], в центре которого располагаются «типичные середняки» со средним значением обоих свойств, а на периферии – четыре группы, у которых одно из свойств в норме, а другое отклоняется в ту или иную сторону (рис. 1).
Учет групп испытуемых с отклонениями по двум свойствам дает еще четыре группы, и на смену пятичастному кресту выступает девятипольная колодезная система (рис. 2).
Дальнейшее обобщение модели с выходом еще в одно измерение дает «кубическую генетическую модель мироздания» [3, с. 16], которая может быть интерпретирована как модель измерения трех свойств, в предположении трех уровней у каждого свойства.
Для рассматривавшегося случая двух измеряемых свойств и геометрической интерпретации области тестирования как плоской фигуры агрегирование посредством суммирования баллов характеризует периметр фигуры, а здравый смысл заставляет искать метод оценивания ее площади. Один из методов оценивания площади фигуры заключается в том, что фигура покрывается сетью параллельных линий, расположенных на единичном расстоянии друг от друга, и суммарная длина всех отрезков, образованных пересечением линий с границей фигуры, дает искомую площадь. Отсюда и проистекает идея гетерогенных тестов нового типа.
В качестве примера рассматривается по-прежнему тест для комплексной оценки двух свойств (свойства A и свойства B). Тест составлен из нескольких гомогенных субтестов. В каждом субтесте требуемый для выполнения уровень свойства B фиксирован, а уровень свойства A меняется от задания к заданию в пределах заданного уровня трудности в соответствии с общими правилами изменения уровня трудности тестовых заданий. В других субтестах уровень A меняется в тех же пределах при ином уровне B. Все уровни B также изменяются закономерно в заданных пределах от субтеста к субтесту. Построенный таким образом тест можно обратить, т.е. считать его состоящим из субтестов с фиксированным A при меняющемся B. Для нас интерес здесь представляет то, что все пространство знаний окажется заполненным равномерно размещенными точками (во всяком случае, к этому необходимо стремиться), и подсчет количества точек в пределах области знаний (т.е. количества верно выполненных заданий) позволяет оценить площадь этой области. Аналогом описываемого метода оценивания является известный метод определения площади фигуры палеткой с точками. При необходимости произвести комплексную оценку знания по трем дисциплинам (или трем разделам дисциплины) речь идет уже об объеме трехмерного тела знаний и т.д.
На рис. 3 изображено двумерное пространство знаний.
Для количественной оценки знаний испытуемых по двум свойствам предназначен тест из 36 заданий (каждое задание представлено точкой). Задания, на которые испытуемый дал верные ответы, изображены жирными точками. Согласно рис. 3 знания испытуемого оцениваются в 12 баллов. Комплексная оценка знаний тестом подобного вида более объективна, чем двумя гомогенными тестами (горизонтальная и вертикальная линии) при агрегировании баллов или интегративным тестом (диагональная линия) ввиду тестирования испытуемого набором заданий с варьирующейся трудностью и изменением соотношения между измеряемыми свойствами в широких пределах.
Таким образом, рассматриваемый гетерогенный тест нового типа схож с классическим гетерогенным тестом в том, что состоит из отдельных гомогенных тестов, но ввиду отказа от принципа непревышения заданного (невысокого) уровня требований к сопряженному свойству (свойствам), правильнее говорить о вхождении в состав гетерогенного теста ряда интегративных тестов (субтестов) с фиксированным для каждого субтеста уровнем сопряженного свойства.
Тест подобного рода на примере лексико-грамматического теста будет состоять из ряда грамматических субтестов с постоянным в пределах каждого субтеста, но закономерно меняющимся от субтеста к субтесту уровнем лексических требований. Есть все основания полагать, что подобные тесты объективно оценивают комплексное свойство на одномерной шкале.
Список литературы
1. Аванесов В.С. Композиция тестовых заданий. – М: Центр тестирования, 2002.
2. Коккота В.А. Лингводидактическое тестирование. – М: Высшая школа, 1989.
3. Лукьянов А.Е. Лаоцзы (философия раннего даосизма): Монография. – М.: Изд-во УДН, 1991.