Wie berechnet man Diskrepanzen?

Autor: Mike Robinson
Erstelldatum: 8 September 2021
Aktualisierungsdatum: 17 November 2024
Anonim
Woche 02b   Kausalität   statistische Grundlagen
Video: Woche 02b Kausalität statistische Grundlagen

Inhalt

Eine Diskrepanz ist ein Wert in einem Datensatz, der weit von anderen Werten entfernt ist. Abweichungen können durch experimentelle oder Messfehler verursacht werden. In den ersten Fällen kann es wünschenswert sein, Ausreißer zu identifizieren und aus anderen Daten zu entfernen, bevor eine statistische Analyse durchgeführt wird, um eine Beeinflussung der Ergebnisse zu vermeiden, da sie die Stichprobenpopulation nicht genau wiedergeben. Der einfachste Weg, um Diskrepanzen zu identifizieren, ist die Quartilmethode.

Schritt 1

Listen Sie die Daten in aufsteigender Reihenfolge auf. Betrachten Sie den Datensatz {4, 5, 2, 3, 15, 3, 3, 5}. Das geordnete Datensatzbeispiel lautet: {2, 3, 3, 3, 4, 5, 5, 15}.

Schritt 2

Finden Sie den Median. Dies ist die zentrale Zahl, die die Haupthälfte von der Nebenhälfte trennt. Wenn es eine gerade Anzahl von Daten gibt, sollte der Durchschnitt der beiden berechnet werden. Beispiel: In dem angegebenen Datensatz sind die Mittelpunkte 3 und 4, sodass der Median (3 + 4) / 2 = 3,5 ist.

Schritt 3

Suchen Sie den Datenpunkt des oberen Quartils Q2, der die Gruppe zwischen dem 75% kleinsten und dem 25% größten teilt. Wenn der Datensatz gerade ist, durchschnittlich zwei Punkte um das Quartil. Im vorherigen Beispiel: (5 + 5) / 2 = 5.


Schritt 4

Finden Sie das niedrigste Quartil, Q1, den Datenpunkt, der die kleinsten 25% von den größten 75% trennt. Wenn der Datensatz gerade ist, durchschnittlich zwei Punkte um das Quartil. Im Beispiel: (3 + 3) / 2 = 3.

Schritt 5

Subtrahieren Sie das untere Quartil vom oberen Quartil, um den Interquartilbereich IQ zu erhalten. Im Beispiel: Q2 - Q1 = 5 - 3 = 2.

Schritt 6

Multiplizieren Sie den Interquartilbereich mit 1,5. Addiere das obere Quartil zum Ergebnis und subtrahiere das untere Quartil. Jeder Datenpunkt außerhalb dieser Werte ist eine leichte Diskrepanz. Für das gegebene Beispiel: 1,5 x 2 = 3. 3 - 3 = 0 und 5 + 3 = 8. Somit wäre jeder Wert kleiner als 0 oder größer als 8 eine leichte Diskrepanz. Dies bedeutet, dass 15 als leichte Diskrepanz qualifiziert ist.

Schritt 7

Multiplizieren Sie den Interquartilbereich mit 3. Addieren Sie zum oberen Quartil und subtrahieren Sie das untere Quartil. Jeder Datenpunkt außerhalb dieser Werte ist eine extreme Diskrepanz. Für das gegebene Beispiel ist 3 × 2 = 6. 3-6 = -3 und 5 + 6 = 11. Somit ist jeder Wert kleiner als -3 oder größer als 11 eine extreme Diskrepanz. Dies bedeutet, dass 15 als extreme Diskrepanz qualifiziert ist.