Требования к построению и проверке тестовых методик

Известны два пути создания психодиагностических методик: адаптация известных методик (зарубежных, устаревших, с иными целями) и разработка новых, оригинальных методик.

Адаптация теста – это комплекс мероприятий, обеспечивающих адекватность теста в новых условиях его применения. Этапы адаптации:

  1. Анализ исходных теоретических положений автора теста.
  2. Для иностранных методик перевод теста и инструкций к нему на язык пользователя (с обязательной экспертной оценкой соответствия оригиналу).
  3. Проверка надежности и валидности в соответствии с психометрическими требованиями.
  4. Стандартизация на соответствующих выборках.

Наиболее серьезные проблемы возникают при адаптации вербальных тестов (опросников, вербальных субтестов в составе тестов интеллекта). Эти проблемы связаны с языковыми и социокультурными различиями между народами разных стран. Многовариантность перевода какого-либо термина, невозможность точной передачи идиоматических оборотов – обычное явление при переводах с языка на язык. Иногда бывает настолько сложно подобрать языковые и смысловые аналоги заданий теста, что полная адаптация теста становится сопоставима с разработкой оригинальной методики.

Понятие адаптации приложимо не только к зарубежным методикам, которые мы хотим использовать в наших условиях, но и к устаревшим отечественным методикам. А устаревают методики достаточно быстро: в связи с изменчивостью языка и социокультурных стереотипов методики должны корректироваться каждые 5–7 лет, что подразумевает уточнение формулировок вопросов, коррекцию нормативов, обновление стимульного материала, пересмотр интерпретационных критериев.

Самостоятельная разработка тестовой методики обычно имеет следующие этапы.Выбор предмета (явления) и объекта исследования (контингента).

  1. Выбор вида теста (объективный, субъективный, проективный), типа заданий (с предписанными ответами, со свободными ответами) и шкал (числовые, вербальные, графические).
  2. Подбор первичного банка заданий. Может осуществляться двумя путями: вопросы формулируются, исходя из теоретических представлений об измеряемом явлении (факторно-аналитический принцип), или вопросы подбираются в ?соответствии с их дискриминативностью, т. е. способностью отделять испытуемых по наличию требуемого признака (критериально-ключевой принцип). Второй принцип является эффективным в тестах отбора (например, профессионального или клинического).
  3. Оценка заданий первичного банка (оценка содержательной валидности теста, т. е. соответствия каждого из заданий измеряемому явлению и полноты охвата изучаемого явления тестом в целом). Проводится с помощью метода экспертной оценки.
  4. Предварительное тестирование, формирование банка эмпирических данных.
  5. Эмпирическая валидизация теста. Проводится с помощью корреляционного анализа оценок теста и показателей по внешнему параметру изучаемого свойства (например,школьной успеваемости при валидизации теста интеллекта; врачебного диагноза при валидизации клинических тестов; данных других тестов, валидность которых известна,и др.).
  6. Оценка надежности теста (устойчивости результатов к действию случайных факторов, внешних и внутренних). Наиболее часто оценивается надежность ретестовая (соответствие результатам повторного тестирования, обычно через несколько месяцев), надежность частей теста (устойчивость результатов отдельных задач или групп задач, например, по методу «четное – нечетное») и надежность параллельных форм, если таковые существуют.
  7. Методика признается надежной, если коэффициент корреляции результатов (первичного и повторного тестирования; одной и другой частей теста; одной и другой параллельных форм) составляет не менее 0,75. При более низком показателе надежности производится корректировка заданий теста, переформулировка вопросов, снижающих надежность.
  8. Проводится стандартизация теста, т. е. приведение процедуры и оценок к общепринятым нормативам. Стандартизация оценок подразумевает преобразование нормальной или искусственно нормализованной шкалы первичных оценок (эмпирических значений изучаемого показателя) в оценки шкальные (отражающие место в распределении результатов выборки испытуемых). Виды шкальных оценок:стены (1–10), станайны (1–9), Т-оценки (10–100) и др.
  9. По возможности определяется прогностическая валид-ность, т. е. информация о том, с какой степенью точности методика позволяет судить о диагностируемом психологическом качестве спустя определенное время после измерения. Также определяется по внешнему критерию, но данные по нему собираются спустя некоторое время после тестирования.

Таким образом, надежность и валидность – это собирательные понятия, включающие в себя несколько видов показателей, отражающих направленность методики на предмет исследования (валидность) и объект исследования (надежность). Степень надежности и валидности отражают соответствующие коэффициенты, указываемые в сертификате методики.

Создание методики – трудоемкая работа, требующая развитой системы заказа на методики с соответствующей оплатой труда разработчиков. В настоящее время ввиду низкой платежеспособности основной массы психологов сфера профессиональной разработки отечественных тестов развита весьма слабо, что ведет к массовому использованию методик устаревших, не прошедших оценку валидности и надежности, либо переведенных с иностранного языка без проведения процедуры полноценной адаптации.

Процедуру разработки тестовых методик часто именуют конструированием тестов, а теорию (науку) конструирования – тестологией. Источники более подробной информации о тестологии приводились в начале этой главы.

Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)