Schließen Sie diesen Videoplayer
Ein Boxplot, auch Whiskerplot genannt, ist eine visuelle Darstellung, die die Verteilung eines Datensatzes zusammen mit mehreren wichtigen statistischen Maßen anzeigt . Es bietet eine grafische Zusammenfassung wichtiger Informationen zu einem Datensatz, einschließlich des Mindestwerts, des ersten Quartils, des Medians, des dritten Quartils und der Maximalwerte.
Das Boxplot sieht aus wie ein Rechteck, oft Box genannt, das den Interquartilsabstand angibt. Die Mitte der Box stellt den Median dar, und die Außenseiten der Box repräsentieren das erste Quartil (25. Perzentil) bzw. das dritte Quartil (75. Perzentil). Die „Whisker“, die von der Box ausgehen, zeigen den Datenbereich ohne die Ausreißer.
Der Boxplot wurde erstmals 1970 vom Mathematiker John Tukey
In diesem Artikel wird erläutert, was ein Boxplot Ihnen über einen Datensatz und die verschiedenen Teile eines Boxplots sagen kann. Außerdem wird erläutert, wie Boxplots Ihnen bei der Datenanalyse helfen können und wie man sie interpretiert.
Inhaltsverzeichnis
Welche Informationen liefern Boxplots?
Ein Boxplot stellt eine Reihe von Schlüsseldatenpunkten dar, die dabei helfen können, wichtige Details und Informationen über die beschriebenen Daten ans Licht zu bringen.
Zu diesen Schlüsselpunkten gehören unter anderem der Median, der Interquartilsabstand sowie die Minimal- und Maximalwerte ohne Berücksichtigung der Ausreißer.
Die 7 Elemente eines Boxplots
Die sieben Schlüsselelemente eines Boxplots sind:
- Mindestpunktzahl : Die Mindestpunktzahl ist der niedrigste Datenpunkt, der alle Ausreißer ausschließt.
- Median : Die Linie innerhalb des Felds gibt den Median eines Datensatzes an. Der Median ist der mittlere Wert des Datensatzes, wenn die Werte in der richtigen Reihenfolge angeordnet sind. Diese Zahl ist wichtig, da sie die zentrale Tendenz des Datensatzes angibt.
- Unteres Perzentil : Auch als erstes Quartil oder 25. Perzentil bezeichnet. Dies ist der Median der unteren Hälfte des Datensatzes.
- Oberes Perzentil : Auch als drittes Quartil oder 75. Perzentil bekannt. Dies ist der Median der oberen Hälfte des Datensatzes.
- Maximale Punktzahl : Dies ist der höchste Datenpunkt im Datensatz, nachdem Ausreißer ausgeschlossen wurden.
- Whiskers : Die „Whiskers“ des Boxplots sind die Linien, die von beiden Seiten der Box ausgehen. Diese Linien stellen den Bereich der Daten ohne Ausreißer dar. Dies kann nützlich sein, um Einblick in die Minimal- und Maximalwerte innerhalb eines bestimmten Bereichs zu erhalten.
- Der Interquartilsabstand (IQR) : Die Box in einem Boxplot stellt den Interquartilsabstand des Datensatzes dar. Der IQR ist der Bereich zwischen dem ersten und dem dritten Quartil. Er enthält die mittleren 50 % der Daten und ist hilfreich, um die Streuung des Datensatzes zu visualisieren.
Boxplots sind nichtparametrisch, d. h. sie machen keine Annahmen über die zugrunde liegende Verteilung der Daten. Stattdessen dienen sie dazu, eine visuelle Darstellung basierend auf dem Median und den Quartilen zu liefern.
Dadurch sind sie nützlich, um Daten zwischen verschiedenen Gruppen oder Bedingungen zu vergleichen. Sie bieten eine präzise Zusammenfassung der Hauptmerkmale der Daten, indem sie schnell die zentrale Tendenz und Streuung vermitteln.
Boxplot-Ausrichtung
Boxplots können horizontal und vertikal dargestellt werden. In professionellen wissenschaftlichen Arbeiten werden sie häufig vertikal dargestellt .
Warum sind Boxplots bei der Datenanalyse hilfreich?
Boxplots haben eine Reihe wichtiger Anwendungen und Vorteile bei der Übermittlung und Analyse von Daten in der psychologischen Forschung .
Diese grafischen Darstellungen können schnell wichtige Informationen über die Streuung und Symmetrie einer Verteilung vermitteln. Mit diesen Tools ist es möglich, visuelle Vergleiche verschiedener Datengruppen zu erstellen.
Forscher weisen auch darauf hin, dass Boxplots Menschen dabei helfen können, ihre Fähigkeit zu verbessern, komplexe Informationen zu interpretieren und zu verstehen. Dadurch können Menschen quantitative effektiver beurteilen.3
Boxplots können auch eine gute Alternative zu Histogrammen sein. Während für ein Histogramm im Allgemeinen eine Mindeststichprobengröße von 50 Datenpunkten empfohlen wird, kann ein Boxplot bereits mit einer Stichprobengröße von nur fünf effektiv sein. Boxplots können auch auf verschiedene Weise angepasst werden, um den Vergleich und die Interpretation zu verbessern. Beispielsweise kann der Box eine Kerbe hinzugefügt werden, um das 95%-Konfidenzintervall für den Median anzuzeigen.
So interpretieren Sie ein Boxplot
Bei der Interpretation von Daten in einem Boxplot folgen Forscher normalerweise einer Reihe von Schritten oder Methoden, um Erkenntnisse zu gewinnen und Schlussfolgerungen zu ziehen. Hier sind die üblichen Schritte zur Interpretation von Daten in einem Boxplot:
Schauen Sie sich die wichtigsten Merkmale der Daten an
Der erste Schritt bei der Interpretation eines Boxplots besteht darin, einige der wichtigsten Merkmale der Daten zu betrachten:
- Ermitteln Sie den Median : Der Median wird durch die Linie innerhalb der Box im Boxplot dargestellt. Er teilt die Daten in zwei gleiche Hälften, wobei 50 % der Daten unter und 50 % über dem Median liegen. Er liefert ein Maß für die zentrale Tendenz.
- Bestimmen Sie die Quartile : Die Box im Boxplot stellt den Interquartilsabstand (IQR) dar. Das untere Quartil (Q1) ist der Median der unteren Hälfte der Daten und das obere Quartil (Q3) ist der Median der oberen Hälfte. Der IQR ist der Bereich zwischen Q1 und Q3 und enthält die mittleren 50 % der Daten.
- Betrachten Sie den Bereich: Der Bereich der Daten, der durch die Länge der Whiskers angegeben wird, bietet einen Einblick in die Streuung der Daten. Ein breiter Bereich würde durch längere Whiskers angezeigt. Kurze Whiskers hingegen würden einen schmalen Bereich anzeigen. Ein breiter Bereich deutet auf eine größere Variabilität der Daten hin.
Achten Sie auf ungewöhnliche Daten
Es kann auch hilfreich sein, nach Anzeichen dafür zu suchen, dass Ihre Daten verzerrt oder in irgendeiner Weise ungewöhnlich sein könnten.
- Ausreißer identifizieren : Ausreißer sind Datenpunkte, die deutlich über oder unter den Whiskern des Boxplots liegen. Sie werden durch einzelne Punkte oder Punkte außerhalb der Whiskers gekennzeichnet. Ausreißer können Extremwerte oder Datenpunkte darstellen, die deutlich von der Mehrheit abweichen.
- Suchen Sie nach verzerrten Daten : Stark verzerrte Daten können ein Zeichen dafür sein, dass die Daten nicht normal sind. Sie können die Schiefe beurteilen, indem Sie sich die Position der Box auf der Mittellinie und die Position des Medians im Verhältnis zur Box ansehen. Liegt der Median näher an Q1, ist die Verteilung möglicherweise linksschief, während sie rechtsschief sein kann, wenn er näher an Q3 liegt. Wenn Ihre Daten ungewöhnlich verzerrt erscheinen, ist es wichtig zu untersuchen, was die Ursache dafür sein könnte.
- Symmetrie analysieren : Die Symmetrie des Boxplots kann Aufschluss über die Symmetrie der Datenverteilung geben. Wenn die Box ungefähr symmetrisch ist, deutet dies auf eine symmetrische Verteilung hin. Asymmetrische Boxen können auf Schiefe oder andere Merkmale der Verteilung hinweisen.
Vergleiche anstellen
Boxplots können verwendet werden, um Verteilungen zwischen verschiedenen Gruppen oder Kategorien zu vergleichen. Forscher können Unterschiede oder Ähnlichkeiten in den Daten erkennen, indem sie die Position, Form und Streuung der Boxen und Whisker visuell vergleichen.
- Achten Sie auf die Kerben : Wenn Sie ein Boxplot auswerten, können die Kerben an den Seiten des Boxplots einen visuellen Vergleich der Unsicherheit zwischen den Gruppen ermöglichen. Wenn sich die Kerben nicht überlappen, können die Mediane erheblich voneinander abweichen.
- Betrachten Sie die Mediane : Wenn die Medianlinie einer Box außerhalb der Box der anderen Gruppe liegt, ist das ein gutes Zeichen für Unterschiede zwischen den beiden Gruppen.
- Stichprobengröße berücksichtigen : Beim Vergleich von Boxplots ist es wichtig, die Stichprobengröße zu berücksichtigen. Eine kleine Stichprobengröße ist möglicherweise nicht repräsentativ für die gesamte Population, daher sollten Schlussfolgerungen mit Vorsicht gezogen werden.
- Vergleichen Sie die Längen von Boxen und Whiskern : Der Vergleich der Längen von Boxen (Interquartilsabstand) und Whiskern (Gesamtstreuung der Daten) kann beim Vergleich von Gruppen ebenfalls wertvolle Informationen liefern. Signifikante Unterschiede in den Längen von Boxen und Whiskern deuten auf Unterschiede zwischen den Gruppen hin.
Das Befolgen dieser Schritte kann Ihnen dabei helfen, die durch Boxplots dargestellten Daten zu interpretieren und Erkenntnisse aus der visuellen Darstellung der Daten zu gewinnen.
Das bedeutet jedoch nicht, dass Boxplots immer die beste Wahl für die Darstellung von Daten sind. Sie können hilfreich sein, um Gruppen zu vergleichen, aber eine detailliertere visuelle Darstellung, beispielsweise ein Histogramm , kann informativer sein, wenn Sie einen einzelnen Datensatz betrachten.