Валидность психологических тестов

человек заполняет кружки ответов на экзаменационном листе с вариантами ответов

spxChrome / Getty Images

Валидность — это степень, в которой тест измеряет то, что он якобы измеряет. Тест должен быть валидным, чтобы его результаты можно было точно применять и интерпретировать.

Психологическая оценка является важной частью как экспериментального исследования, так и клинического лечения. Одна из самых больших проблем при создании психологического теста заключается в том, измеряет ли он на самом деле то, что, как мы думаем, он измеряет.

Например, тест может быть разработан для измерения стабильной черты личности , но вместо этого он измеряет преходящие эмоции, вызванные ситуативными или экологическими условиями. Действенный тест гарантирует, что результаты являются точным отражением оцениваемого измерения.

Валидность определяется не одной статистикой, а совокупностью исследований, демонстрирующих связь между тестом и поведением, которое он призван измерять. Существует четыре типа валидности: валидность содержания, валидность, связанная с критериями, конструктная валидность и очевидная валидность.

В этой статье обсуждается, что такое каждый из этих четырех типов валидности и как они используются в психологических тестах. В ней также рассматривается, как валидность соотносится с надежностью, которая является еще одной важной мерой точности и полезности теста.

Содержание валидности

Если тест имеет содержательную валидность, то элементы теста представляют весь спектр возможных элементов, которые должен охватывать тест. Отдельные вопросы теста могут быть взяты из большого набора элементов, которые охватывают широкий спектр тем.

В некоторых случаях, когда тест измеряет черту, которую трудно определить, экспертный судья может оценить релевантность каждого элемента. Поскольку каждый судья основывает свою оценку на мнении, два независимых судьи оценивают тест отдельно. Элементы, которые оба судьи оценивают как сильно релевантные, будут включены в финальный тест.

Внутренняя и внешняя валидность

Внутренняя и внешняя валидность используются для определения того, являются ли результаты эксперимента значимыми. Внутренняя валидность относится к способу проведения теста, в то время как внешняя валидность проверяет, насколько хорошо результаты могут применяться в других условиях.

Критериально-связанная валидность

Говорят, что тест имеет критериальную валидность, когда он продемонстрировал свою эффективность в прогнозировании критериев или показателей конструкции.

Например, когда работодатель нанимает новых сотрудников, он будет изучать различные критерии, которые могут предсказать, будет ли потенциальный кандидат подходящим для работы. Люди, которые хорошо справляются с тестом, с большей вероятностью будут хорошо справляться с работой, в то время как люди с низким баллом за тест будут плохо справляться с этой работой.

Существует два различных типа критериальной валидности: текущая и прогностическая.

Одновременная действительность

Конкурентная валидность имеет место, когда критерии оценки получаются одновременно с результатами теста, что указывает на способность результатов теста оценивать текущее состояние человека. Например, в тесте, измеряющем уровень депрессии, можно сказать, что тест имеет конкурентную валидность, если он измеряет текущий уровень депрессии, испытываемый испытуемым.

Прогностическая валидность

Прогностическая валидность имеет место, когда критерии оценки получаются в определенный момент времени после теста. Примерами тестов с прогностической валидностью являются тесты на карьеру или способности , которые помогают определить, кто, скорее всего, добьется успеха или потерпит неудачу в определенных предметах или профессиях.

Конструктивная валидность

Тест имеет конструктную валидность, если он демонстрирует связь между результатами теста и предсказанием теоретической черты. Тесты на интеллект являются одним из примеров измерительных инструментов, которые должны иметь конструктную валидность. Валидный тест на интеллект должен быть способен точно измерять конструкт интеллекта , а не другие характеристики, такие как память или уровень образования.

По сути, конструктная валидность проверяет, охватывает ли тест весь спектр поведений, которые составляют измеряемый конструкт. Процедура здесь заключается в определении необходимых задач для выполнения работы, такой как набор текста, дизайн или физические способности.

Чтобы продемонстрировать конструктную валидность процедуры отбора, поведение, продемонстрированное при отборе, должно быть репрезентативной выборкой поведения на работе.

Лицо действительно

Внешняя валидность — одна из самых основных мер валидности. По сути, исследователи просто принимают валидность теста за чистую монету, глядя на то, измеряет ли он целевую переменную. Например, в случае с измерением счастья можно было бы сказать, что тест имеет внешнюю валидность, если бы он действительно измерял уровни счастья.

Очевидно, что кажущаяся валидность означает лишь то, что тест выглядит так, будто он работает. Это не означает, что доказано, что тест работает. Однако, если на данный момент мера кажется валидной, исследователи могут провести дальнейшее исследование, чтобы определить, валиден ли тест и следует ли его использовать в будущем.

Опрос, в котором людей спрашивают, за какого политического кандидата они планируют проголосовать, можно считать имеющим высокую внешнюю валидность, в то время как сложный тест, используемый в рамках психологического эксперимента , который рассматривает различные ценности, характеристики и модели поведения, можно считать имеющим низкую внешнюю валидность, поскольку точная цель теста не ясна сразу, особенно для участников.

Надежность против валидности

В то время как валидность проверяет, насколько хорошо тест измеряет то, что он призван измерять, надежность относится к тому, насколько последовательны результаты. Существует четыре способа оценки надежности:

  • Внутренняя согласованность : Внутренняя согласованность проверяет согласованность различных элементов в рамках одного теста. 
  • Межоценочный : в этом методе несколько независимых судей оценивают надежность теста. 
  • Параллельные или альтернативные формы : этот подход использует разные формы одного и того же теста и сравнивает результаты.
  • Повторный тест : надежность результатов измеряется путем проведения одного и того же теста в разные моменты времени.

Важно помнить, что тест может быть надежным, не будучи действительным. Последовательные результаты не всегда указывают на то, что тест измеряет то, для чего его разработали исследователи.

9 Источников
MindWell Guide использует только высококачественные источники, включая рецензируемые исследования, для подтверждения фактов в наших статьях. Ознакомьтесь с нашим редакционным процессом, чтобы узнать больше о том, как мы проверяем факты и сохраняем точность, надежность и достоверность нашего контента.
  1. Ньютон П.Е., Шоу С.Д. Стандарты разговоров и размышлений о валидности . Психологические методы . 2013;18(3):301-19. doi:10.1037/a0032969

  2. Cizek GJ. Определение и различение валидности: интерпретации значения баллов и обоснования использования теста . Психол. методы . 2012;17(1):31-43. doi:10.1037/a0026975

  3. Комитет по психологическому тестированию, включая проверку достоверности, для определения инвалидности Администрацией социального обеспечения; Совет по здоровью отдельных групп населения; Институт медицины. Психологическое тестирование в службе определения инвалидности . Вашингтон, округ Колумбия; 2015.

  4. Lin WL., Yao G. Критериальная валидность . В: Michalos AC, ed. Энциклопедия исследований качества жизни и благополучия . Springer, Дордрехт; 2014. doi:10.1007/978-94-007-0753-5_618

  5. Lin WL., Yao G. Конкурирующая валидность . В: Michalos AC, ed. Энциклопедия исследований качества жизни и благополучия . Springer, Дордрехт; 2014. doi:10.1007/978-94-007-0753-5_516

  6. Lin WL., Yao G. Прогностическая валидность . В: Michalos AC, ред. Энциклопедия исследований качества жизни и благополучия . Springer, Дордрехт; 2014. doi:10.1007/978-94-007-0753-5_2241

  7. Ginty AT. Конструктивная валидность . В: Gellman MD, Turner JR, ред. Энциклопедия поведенческой медицины . Springer, New York, NY; 2013. doi:10.1007/978-1-4419-1005-9_861

  8. Джонсон Э. Лицевая валидность . В: Volkmar FR, ред. Энциклопедия расстройств аутистического спектра . Springer, Нью-Йорк, штат Нью-Йорк; 2013. doi:10.1007/978-1-4419-1698-3_308

  9. Альманасрех Э., Молес Р., Чен Т.Ф. Оценка методов, используемых для оценки валидности контентаRes Social Adm Pharm . 2019;15(2):214-221. doi:10.1016/j.sapharm.2018.03.066

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top