Trafność w testach psychologicznych – Mind Well Guide Poland

osoba wypełniająca bąbelki odpowiedzi w arkuszu egzaminu wielokrotnego wyboru — spxChrome / Getty Images

Popularne filmy

Zamknij ten odtwarzacz wideo

Trafność to stopień, w jakim test mierzy to, co obiecuje zmierzyć. Trafność testu jest niezbędna do prawidłowego zastosowania i interpretacji wyników.

Ocena psychologiczna jest ważną częścią zarówno badań eksperymentalnych, jak i leczenia klinicznego. Jednym z największych zmartwień przy tworzeniu testu psychologicznego jest to, czy faktycznie mierzy on to, co naszym zdaniem mierzy.

Na przykład test może być zaprojektowany do pomiaru stabilnej cechy osobowości , ale zamiast tego mierzy przejściowe emocje generowane przez warunki sytuacyjne lub środowiskowe. Prawidłowy test zapewnia, że wyniki są dokładnym odzwierciedleniem wymiaru poddawanego ocenie.

Trafność nie jest określana przez pojedynczą statystykę, ale przez zbiór badań, które wykazują związek między testem a zachowaniem, które ma mierzyć. Istnieją cztery rodzaje trafności: trafność treści, trafność kryterialna, trafność konstruktu i trafność pozorna.

W tym artykule omówiono, czym jest każdy z tych czterech typów ważności i jak są one wykorzystywane w testach psychologicznych. Analizuje się również porównanie ważności z niezawodnością, co jest kolejnym ważnym miernikiem dokładności i przydatności testu.

Spis treści

Ważność treści

Jeśli test ma trafność merytoryczną, pytania w teście reprezentują cały zakres możliwych pytań, jakie test powinien obejmować. Poszczególne pytania testowe można wybrać z dużej puli pytań obejmujących szeroki zakres tematów.

W niektórych przypadkach, gdy test mierzy cechę trudną do zdefiniowania, sędzia ekspert może ocenić trafność każdego elementu. Ponieważ każdy sędzia opiera swoją ocenę na opinii, dwóch niezależnych sędziów ocenia test oddzielnie. Elementy, które zostaną ocenione jako silnie istotne przez obu sędziów, zostaną uwzględnione w ostatecznym teście.

Ważność wewnętrzna i zewnętrzna

Trafność wewnętrzna i zewnętrzna służą do określenia, czy wyniki eksperymentu są znaczące. Trafność wewnętrzna odnosi się do sposobu wykonania testu, podczas gdy trafność zewnętrzna bada, jak dobrze wyniki mogą mieć zastosowanie w innych warunkach.

Ważność związana z kryteriami

Test uznaje się za mający trafność kryterialną, jeżeli wykazał swoją skuteczność w przewidywaniu kryteriów lub wskaźników konstruktu.

Na przykład, gdy pracodawca zatrudnia nowych pracowników, bada różne kryteria, które mogą przewidzieć, czy potencjalny pracownik będzie odpowiedni do pracy. Osoby, które dobrze wypadną w teście, mogą mieć większe szanse na dobre wyniki w pracy, podczas gdy osoby z niskim wynikiem w teście poradzą sobie słabo w tej pracy.

Istnieją dwa rodzaje trafności kryterialnej: jednoczesna i predykcyjna.

Ważność równoczesna

Trafność współbieżna występuje wtedy, gdy miary kryterialne uzyskuje się w tym samym czasie, co wyniki testów, co wskazuje na zdolność wyników testów do oszacowania bieżącego stanu danej osoby. Na przykład w teście mierzącym poziom depresji test będzie uważany za mający trafność współbieżną, jeśli zmierzy bieżący poziom depresji doświadczany przez osobę badaną.

Trafność predykcyjna

Trafność predykcyjna ma miejsce, gdy kryteria pomiaru uzyskuje się w określonym czasie po wykonaniu testu. Przykładami testów o trafności predykcyjnej są testy zawodowe lub testy predykcyjne , które pomagają określić, kto ma większe szanse na powodzenie lub niepowodzenie w określonych przedmiotach lub zawodach.

Ważność konstrukcji

Test ma trafność konstruktu, jeśli wykazuje związek między wynikami testu a przewidywaniem cechy teoretycznej. Testy inteligencji są jednym z przykładów instrumentów pomiarowych, które powinny mieć trafność konstruktu. Trafny test inteligencji powinien być w stanie dokładnie zmierzyć konstrukt inteligencji, a nie inne cechy, takie jak pamięć lub poziom wykształcenia.

Zasadniczo trafność konstruktu sprawdza, czy test obejmuje pełen zakres zachowań, które składają się na mierzony konstrukt. Procedura tutaj polega na zidentyfikowaniu niezbędnych zadań do wykonania pracy, takiej jak pisanie na maszynie, projektowanie lub sprawność fizyczna.

Aby wykazać trafność teoretyczną procedury selekcji, zachowania zademonstrowane podczas selekcji powinny stanowić reprezentatywną próbkę zachowań charakterystycznych dla danego stanowiska.

Ważność twarzy

Trafność pozorna jest jedną z najbardziej podstawowych miar trafności. Zasadniczo badacze po prostu przyjmują trafność testu za dobrą monetę, sprawdzając, czy wydaje się mierzyć zmienną docelową. Na przykład w przypadku miary szczęścia test byłby uważany za trafny pozornie, gdyby wydawał się faktycznie mierzyć poziomy szczęścia.

Oczywiście, trafność pozorna oznacza tylko, że test wygląda na działający. Nie oznacza to, że udowodniono, że test działa. Jednakże, jeśli pomiar wydaje się być ważny w tym momencie, naukowcy mogą zbadać go dalej, aby ustalić, czy test jest ważny i czy powinien być używany w przyszłości.

Ankietę pytającą ludzi, na którego kandydata politycznego zamierzają głosować, można by uznać za mającą wysoką trafność pozorną, podczas gdy złożony test wykorzystywany w ramach eksperymentu psychologicznego , który bada szereg wartości, cech i zachowań, można by uznać za mający niską trafność pozorną, ponieważ dokładny cel testu nie jest od razu jasny, zwłaszcza dla uczestników.

Niezawodność kontra ważność

Podczas gdy ważność bada, jak dobrze test mierzy to, co ma mierzyć, niezawodność odnosi się do tego, jak spójne są wyniki. Istnieją cztery sposoby oceny niezawodności:

Spójność wewnętrzna : Spójność wewnętrzna bada spójność różnych elementów w ramach tego samego testu.
Ocena międzyoceniająca : W tej metodzie wielu niezależnych sędziów ocenia test pod kątem jego rzetelności.
Formy równoległe lub alternatywne : W tym podejściu stosuje się różne formy tego samego testu i porównuje się ich wyniki.
Test-retest : metoda ta polega na pomiarze wiarygodności wyników poprzez powtarzanie tego samego testu w różnych momentach czasu.

Ważne jest, aby pamiętać, że test może być wiarygodny, nie będąc ważnym. Spójne wyniki nie zawsze wskazują, że test mierzy to, do czego zaprojektowali go badacze.

CZYTAJ DALEJ: Zrozumienie metod badań w psychologii

9 Źródeł

MindWell Guide korzysta wyłącznie ze źródeł wysokiej jakości, w tym recenzowanych badań, aby poprzeć fakty w naszych artykułach. Przeczytaj nasz proces redakcyjny , aby dowiedzieć się więcej o tym, jak sprawdzamy fakty i dbamy o to, aby nasze treści były dokładne, wiarygodne i godne zaufania.

Newton PE, Shaw SD. Standardy mówienia i myślenia o ważności . Psychol Methods . 2013;18(3):301-19. doi:10.1037/a0032969
Cizek GJ. Definiowanie i rozróżnianie ważności: interpretacje znaczenia wyników i uzasadnienia stosowania testów . Psychol Methods . 2012;17(1):31-43. doi:10.1037/a0026975
Komitet ds. Testów Psychologicznych, w tym Testów Ważności, dla Ustaleń Niepełnosprawności Administracji Ubezpieczeń Społecznych; Rada ds. Zdrowia Wybranych Populacji; Instytut Medycyny. Testy Psychologiczne w Służbie Ustalania Niepełnosprawności . Waszyngton, DC; 2015.
Lin WL., Yao G. Trafność kryterium . W: Michalos AC, red. Encyclopedia of Quality of Life and Well-Being Research . Springer, Dordrecht; 2014. doi:10.1007/978-94-007-0753-5_618
Lin WL., Yao G. Ważność równoczesna . W: Michalos AC, red. Encyclopedia of Quality of Life and Well-Being Research . Springer, Dordrecht; 2014. doi:10.1007/978-94-007-0753-5_516
Lin WL., Yao G. Trafność predykcyjna . W: Michalos AC, red. Encyclopedia of Quality of Life and Well-Being Research . Springer, Dordrecht; 2014. doi:10.1007/978-94-007-0753-5_2241
Ginty AT. Trafność konstrukcji . W: Gellman MD, Turner JR, red. Encyclopedia of Behavioral Medicine . Springer, Nowy Jork, NY; 2013. doi:10.1007/978-1-4419-1005-9_861
Johnson E. Ważność twarzy . W: Volkmar FR, red. Encyclopedia of Autism Spectrum Disorders . Springer, Nowy Jork, NY; 2013. doi:10.1007/978-1-4419-1698-3_308
Almanasreh E, Moles R, Chen TF. Ocena metod stosowanych do szacowania ważności treści . Res Social Adm Pharm . 2019;15(2):214-221. doi:10.1016/j.sapharm.2018.03.066