Wykresy pudełkowe w badaniach psychologicznych: definicja, interpretacja, sposoby ich wykorzystania

Kobieta rasy mieszanej studiująca na laptopie

Studio Hill Street / Getty Images


Wykres pudełkowy, znany również jako wykres wąsów, to wizualna reprezentacja, która pokazuje rozkład zestawu danych wraz z kilkoma kluczowymi miarami statystycznymi . Zapewnia graficzne podsumowanie ważnych informacji o zestawie danych, w tym minimalny wynik, pierwszy kwartyl, medianę, trzeci kwartyl i wartości maksymalne. 

Wykres pudełkowy wygląda jak prostokąt, często nazywany pudełkiem, który wskazuje zakres interkwartylowy. Środek pudełka reprezentuje medianę, a zewnętrzne boki pudełka reprezentują odpowiednio pierwszy kwartyl (25. percentyl) i trzeci kwartyl (75. percentyl). „Wąsy” rozciągające się od pudełka pokazują zakres danych, z wyłączeniem wartości odstających.

Wykres pudełkowy po raz pierwszy wprowadził matematyk John Tukey w 1970 roku.

W tym artykule omówiono, co wykres pudełkowy może powiedzieć o zestawie danych i różnych częściach wykresu pudełkowego. Opisano w nim również, w jaki sposób wykresy pudełkowe mogą pomóc w analizie danych i jak je interpretować.

Jakie informacje przekazują wykresy pudełkowe?

Wykres pudełkowy przedstawia szereg kluczowych danych, które mogą pomóc w ujawnieniu ważnych szczegółów i informacji na temat opisywanych danych.

Niektóre z tych kluczowych punktów obejmują medianę, rozstęp interkwartylowy oraz wartości minimalne i maksymalne z wyłączeniem wartości odstających.

7 elementów wykresu pudełkowego

Siedem kluczowych elementów wykresu pudełkowego to:

  1. Wynik minimalny : Wynik minimalny to najniższy punkt danych wykluczający wszelkie wartości odstające.
  2. Mediana : Linia wewnątrz pola wskazuje medianę zestawu danych. Mediana jest środkową wartością zestawu danych, gdy wartości są ustawione w kolejności. Ta liczba jest ważna, ponieważ wskazuje centralną tendencję zestawu danych.
  3. Dolny percentyl : Znany również jako pierwszy kwartyl lub 25 percentyl, jest to mediana dolnej połowy zestawu danych.
  4. Górny percentyl : Znany również jako trzeci kwartyl lub 75 percentyl, jest to mediana górnej połowy zestawu danych.
  5. Maksymalny wynik : Jest to najwyższy punkt danych w zestawie danych po wykluczeniu wartości odstających.
  6. Whiskers : „Wąsy” wykresu pudełkowego to linie rozciągające się z obu stron pudełka. Linie te reprezentują zakres danych bez wartości odstających. Może to być przydatne do uzyskania wglądu w wartości minimalne i maksymalne w określonym zakresie.
  7. Zakres interkwartylowy (IQR) : Pole na wykresie pudełkowym przedstawia zakres interkwartylowy zestawu danych. IQR to zakres między pierwszym a trzecim kwartylem. Zawiera on środkowe 50% danych i jest pomocny w wizualizacji rozproszenia zestawu danych.

Wykresy pudełkowe są nieparametryczne, co oznacza, że ​​nie zakładają one podstawowego rozkładu danych. Zamiast tego służą do przedstawienia wizualnego na podstawie mediany i kwartyli.

Dzięki temu są przydatne do porównywania danych w różnych grupach lub warunkach. Zapewniają zwięzłe podsumowanie głównych cech danych, szybko przekazując centralną tendencję i rozprzestrzenianie.

Orientacja wykresu pudełkowego

Wykresy pudełkowe można przedstawiać poziomo i pionowo. Często są przedstawiane pionowo w profesjonalnych pracach naukowych .

Dlaczego wykresy pudełkowe są pomocne w analizie danych?

Wykresy pudełkowe mają wiele ważnych zastosowań i zalet w przekazywaniu i analizowaniu danych w badaniach psychologicznych

Te graficzne reprezentacje mogą szybko przekazać ważne informacje o rozproszeniu i symetrii dystrybucji. Za pomocą tych narzędzi można tworzyć wizualne porównania różnych grup danych. 

Naukowcy sugerują również, że wykresy pudełkowe mogą pomóc ludziom poprawić ich zdolność interpretowania i rozumienia złożonych informacji. Pozwala to ludziom na skuteczniejsze rozumowanie na temat informacji ilościowych .

Wykresy pudełkowe mogą być również dobrą alternatywą dla histogramów. Podczas gdy w przypadku histogramu zaleca się zazwyczaj minimalną wielkość próby 50 punktów danych, wykres pudełkowy może być skuteczny przy wielkości próby wynoszącej tylko pięć. Wykresy pudełkowe można również dostosować na różne sposoby, aby pomóc w ulepszeniu porównania i interpretacji. Na przykład, można dodać wcięcie do pola, aby pokazać 95% przedział ufności dla mediany.

Jak interpretować wykres pudełkowy

Podczas interpretacji danych na wykresie pudełkowym badacze zazwyczaj stosują zestaw kroków lub metod, aby uzyskać wgląd i wyciągnąć wnioski. Oto typowe kroki stosowane do interpretacji danych na wykresie pudełkowym:

Przyjrzyj się kluczowym cechom danych

Pierwszym krokiem przy interpretacji wykresu pudełkowego jest przyjrzenie się najważniejszym cechom danych:

  • Zidentyfikuj medianę : Mediana jest reprezentowana przez linię w polu na wykresie pudełkowym. Dzieli dane na dwie równe połowy, przy czym 50% danych znajduje się poniżej i 50% powyżej mediany. Zapewnia miarę tendencji centralnej.
  • Określ kwartyle : Pole na wykresie pudełkowym przedstawia zakres interkwartylowy (IQR). Dolny kwartyl (Q1) jest medianą dolnej połowy danych, a górny kwartyl (Q3) jest medianą górnej połowy. IQR to zakres między Q1 i Q3 i zawiera środkowe 50% danych.
  • Rozważ zakres: Zakres danych, wskazany przez długość wąsów, pozwala zrozumieć rozproszenie danych. Szeroki zakres byłby wskazany przez dłuższe wąsy. Z drugiej strony, krótkie wąsy wskazywałyby na wąski zakres. Szeroki zakres sugeruje większą zmienność danych.

Szukaj oznak nietypowych danych

Pomocne może okazać się również sprawdzenie, czy dane nie są w jakiś sposób przekłamane lub nietypowe.

  • Zidentyfikuj wartości odstające : Wartości odstające to punkty danych, które znajdują się znacznie powyżej lub poniżej wąsów wykresu pudełkowego. Są one oznaczone przez pojedyncze punkty lub kropki poza wąsami. Wartości odstające mogą reprezentować wartości ekstremalne lub punkty danych, które znacznie odbiegają od większości.
  • Szukaj przekrzywionych danych : Dane, które są mocno przekrzywione, mogą być oznaką, że dane nie są normalne. Możesz ocenić przekrzywienie, patrząc na położenie pola na linii środkowej i położenie mediany w stosunku do pola. Jeśli mediana jest bliżej Q1, rozkład może być lewoskośny, a jeśli jest bliżej Q3, rozkład może być prawoskośny. Jeśli Twoje dane wydają się niezwykle przekrzywione, ważne jest, aby zbadać, co może być tego przyczyną.
  • Przeanalizuj symetrię : Symetria wykresu pudełkowego może wskazywać na symetrię rozkładu danych. Jeśli wykres pudełkowy jest mniej więcej symetryczny, sugeruje to symetryczny rozkład. Asymetryczne pola mogą sugerować skośność lub inne cechy rozkładu.

Dokonaj porównań

Wykresy pudełkowe można wykorzystać do porównywania rozkładów między różnymi grupami lub kategoriami. Badacze mogą identyfikować różnice lub podobieństwa w danych, wizualnie porównując położenie, kształt i rozmieszczenie pudełek i wąsów.

  • Spójrz na wcięcia : Jeśli oceniasz wykres pudełkowy, wcięcia na bokach pudełka mogą zapewnić wizualne porównanie niepewności między grupami. Jeśli wcięcia nie zachodzą na siebie, mediany mogą się znacząco różnić.
  • Spójrz na mediany : Jeżeli linia mediany jednego pola leży poza polem drugiej grupy, jest to dobry znak różnic między dwiema grupami.
  • Weź pod uwagę wielkość próby : Porównując wykresy pudełkowe, ważne jest, aby wziąć pod uwagę wielkość próby. Mała wielkość próby może nie być reprezentatywna dla całej populacji, dlatego wnioski należy wyciągać ostrożnie.
  • Porównaj długości pudełek i wąsów : Porównanie długości pudełek (zakres interkwartylowy) i wąsów (całkowity rozrzut danych) może również dostarczyć cennych informacji podczas porównywania grup. Istotne różnice w długościach pudełek i wąsów sugerują różnice między grupami.

Wykonanie poniższych kroków pomoże Ci zinterpretować dane przedstawione na wykresach pudełkowych i wyciągnąć wnioski z wizualnych reprezentacji danych.

Nie oznacza to, że wykresy pudełkowe są zawsze najlepszym wyborem do prezentacji danych. Mogą być pomocne przy porównywaniu grup, ale bardziej szczegółowa reprezentacja wizualna, taka jak histogram , może być bardziej informacyjna, jeśli patrzysz na pojedynczy zestaw danych.

5 Źródeł
MindWell Guide korzysta wyłącznie ze źródeł wysokiej jakości, w tym recenzowanych badań, aby poprzeć fakty w naszych artykułach. Przeczytaj nasz proces redakcyjny , aby dowiedzieć się więcej o tym, jak sprawdzamy fakty i dbamy o to, aby nasze treści były dokładne, wiarygodne i godne zaufania.
  1. Tukey JW. Eksploracyjna analiza danych . Addison-Wesley Pub. Co; 1977.

  2. Park JH, Lee DK, Kang H i in. Zasady prezentacji wyników statystycznych za pomocą rysunków . Korean J Anesthesiol . 2022;75(2):139-150. doi:10.4097/kja.21508)

  3. Williamson DF. Wykres pudełkowy: prosta metoda wizualna interpretacji danych . Ann Intern Med . 1989;110(11):916. doi:10.7326/0003-4819-110-11-916

  4. Krzywinski M, Altman N. Wizualizacja próbek za pomocą wykresów pudełkowych . Nat Methods . 2014;11(2):119-120. doi:10.1038/nmeth.2813

  5. Hu K. Zdobądź kompetencje w ciągu jednego dnia w zakresie generowania wykresów pudełkowych i wykresów skrzypcowych dla nowicjusza bez wcześniejszego doświadczenia w R. Methods Protoc . 2020;3(4):64. doi:10.3390/mps3040064

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top