Zamknij ten odtwarzacz wideo
Trafność to stopień, w jakim test mierzy to, co obiecuje zmierzyć. Trafność testu jest niezbędna do prawidłowego zastosowania i interpretacji wyników.
Ocena psychologiczna jest ważną częścią zarówno badań eksperymentalnych, jak i leczenia klinicznego. Jednym z największych zmartwień przy tworzeniu testu psychologicznego jest to, czy faktycznie mierzy on to, co naszym zdaniem mierzy.
Na przykład test może być zaprojektowany do pomiaru stabilnej cechy osobowości , ale zamiast tego mierzy przejściowe emocje generowane przez warunki sytuacyjne lub środowiskowe. Prawidłowy test zapewnia, że wyniki są dokładnym odzwierciedleniem wymiaru poddawanego ocenie.
Trafność nie jest określana przez pojedynczą statystykę, ale przez zbiór badań, które wykazują związek między testem a zachowaniem, które ma mierzyć. Istnieją cztery rodzaje trafności: trafność treści, trafność kryterialna, trafność konstruktu i trafność pozorna.
W tym artykule omówiono, czym jest każdy z tych czterech typów ważności i jak są one wykorzystywane w testach psychologicznych. Analizuje się również porównanie ważności z niezawodnością, co jest kolejnym ważnym miernikiem dokładności i przydatności testu.
Spis treści
Ważność treści
Jeśli test ma trafność merytoryczną, pytania w teście reprezentują cały zakres możliwych pytań, jakie test powinien obejmować. Poszczególne pytania testowe można wybrać z dużej puli pytań obejmujących szeroki zakres tematów.
W niektórych przypadkach, gdy test mierzy cechę trudną do zdefiniowania, sędzia ekspert może ocenić trafność każdego elementu. Ponieważ każdy sędzia opiera swoją ocenę na opinii, dwóch niezależnych sędziów ocenia test oddzielnie. Elementy, które zostaną ocenione jako silnie istotne przez obu sędziów, zostaną uwzględnione w ostatecznym teście.
Ważność wewnętrzna i zewnętrzna
Trafność wewnętrzna i zewnętrzna służą do określenia, czy wyniki eksperymentu są znaczące. Trafność wewnętrzna odnosi się do sposobu wykonania testu, podczas gdy trafność zewnętrzna bada, jak dobrze wyniki mogą mieć zastosowanie w innych warunkach.
Ważność związana z kryteriami
Test uznaje się za mający trafność kryterialną, jeżeli wykazał swoją skuteczność w przewidywaniu kryteriów lub wskaźników konstruktu.
Na przykład, gdy pracodawca zatrudnia nowych pracowników, bada różne kryteria, które mogą przewidzieć, czy potencjalny pracownik będzie odpowiedni do pracy. Osoby, które dobrze wypadną w teście, mogą mieć większe szanse na dobre wyniki w pracy, podczas gdy osoby z niskim wynikiem w teście poradzą sobie słabo w tej pracy.
Istnieją dwa rodzaje trafności kryterialnej: jednoczesna i predykcyjna.
Ważność równoczesna
Trafność współbieżna występuje wtedy, gdy miary kryterialne uzyskuje się w tym samym czasie, co wyniki testów, co wskazuje na zdolność wyników testów do oszacowania bieżącego stanu danej osoby. Na przykład w teście mierzącym poziom depresji test będzie uważany za mający trafność współbieżną, jeśli zmierzy bieżący poziom depresji doświadczany przez osobę badaną.
Trafność predykcyjna
Trafność predykcyjna ma miejsce, gdy kryteria pomiaru uzyskuje się w określonym czasie po wykonaniu testu. Przykładami testów o trafności predykcyjnej są testy zawodowe lub testy predykcyjne , które pomagają określić, kto ma większe szanse na powodzenie lub niepowodzenie w określonych przedmiotach lub zawodach.
Ważność konstrukcji
Test ma trafność konstruktu, jeśli wykazuje związek między wynikami testu a przewidywaniem cechy teoretycznej. Testy inteligencji są jednym z przykładów instrumentów pomiarowych, które powinny mieć trafność konstruktu. Trafny test inteligencji powinien być w stanie dokładnie zmierzyć konstrukt inteligencji, a nie inne cechy, takie jak pamięć lub poziom wykształcenia.
Zasadniczo trafność konstruktu sprawdza, czy test obejmuje pełen zakres zachowań, które składają się na mierzony konstrukt. Procedura tutaj polega na zidentyfikowaniu niezbędnych zadań do wykonania pracy, takiej jak pisanie na maszynie, projektowanie lub sprawność fizyczna.
Aby wykazać trafność teoretyczną procedury selekcji, zachowania zademonstrowane podczas selekcji powinny stanowić reprezentatywną próbkę zachowań charakterystycznych dla danego stanowiska.
Ważność twarzy
Trafność pozorna jest jedną z najbardziej podstawowych miar trafności. Zasadniczo badacze po prostu przyjmują trafność testu za dobrą monetę, sprawdzając, czy wydaje się mierzyć zmienną docelową. Na przykład w przypadku miary szczęścia test byłby uważany za trafny pozornie, gdyby wydawał się faktycznie mierzyć poziomy szczęścia.
Oczywiście, trafność pozorna oznacza tylko, że test wygląda na działający. Nie oznacza to, że udowodniono, że test działa. Jednakże, jeśli pomiar wydaje się być ważny w tym momencie, naukowcy mogą zbadać go dalej, aby ustalić, czy test jest ważny i czy powinien być używany w przyszłości.
Ankietę pytającą ludzi, na którego kandydata politycznego zamierzają głosować, można by uznać za mającą wysoką trafność pozorną, podczas gdy złożony test wykorzystywany w ramach eksperymentu psychologicznego , który bada szereg wartości, cech i zachowań, można by uznać za mający niską trafność pozorną, ponieważ dokładny cel testu nie jest od razu jasny, zwłaszcza dla uczestników.
Niezawodność kontra ważność
Podczas gdy ważność bada, jak dobrze test mierzy to, co ma mierzyć, niezawodność odnosi się do tego, jak spójne są wyniki. Istnieją cztery sposoby oceny niezawodności:
- Spójność wewnętrzna : Spójność wewnętrzna bada spójność różnych elementów w ramach tego samego testu.
- Ocena międzyoceniająca : W tej metodzie wielu niezależnych sędziów ocenia test pod kątem jego rzetelności.
- Formy równoległe lub alternatywne : W tym podejściu stosuje się różne formy tego samego testu i porównuje się ich wyniki.
- Test-retest : metoda ta polega na pomiarze wiarygodności wyników poprzez powtarzanie tego samego testu w różnych momentach czasu.
Ważne jest, aby pamiętać, że test może być wiarygodny, nie będąc ważnym. Spójne wyniki nie zawsze wskazują, że test mierzy to, do czego zaprojektowali go badacze.