Die Bedeutung der Chi-Quadrat-Verteilung und die Berechnung des richtigen p-Werts
Was bedeutet die y-Achse in der Grafik der Chi-Quadrat-Verteilung und wie findet man den richtigen p-Wert?
Die Chi-Quadrat-Verteilung ist eine Wahrscheinlichkeitsverteilung die bei der statistischen Auswertung von Häufigkeiten in mehreren Kategorien verwendet wird. Sie wird vor allem im Zusammenhang mit dem Chi-Quadrat-Test verwendet um festzustellen, ob die beobachteten Häufigkeiten signifikant von den erwarteten Häufigkeiten abweichen.
In dem gegebenen Beispiel werden 120 Münzwürfe betrachtet bei denen statistisch gesehen 60 mal Kopf und 60 mal Zahl auftreten sollten. Tatsächlich wurden jedoch 65 mal Kopf und 55 mal Zahl gezählt. Die Frage ist nun, ob dieses Ergebnis unserer Erwartung gemäß ist oder nicht.
Um diese Frage zu beantworten, wird die Chi-Quadrat-Verteilung verwendet. Der Chi-Quadrat-Wert wird berechnet, indem die quadrierte Differenz zwischen den beobachteten und erwarteten Häufigkeiten für jede Kategorie berechnet und anschließend summiert wird. In diesem Fall ergibt sich ein Chi-Quadrat-Wert von 0⸴84.
Die y-Achse der Grafik der Chi-Quadrat-Verteilung gibt die Wahrscheinlichkeit an. Je höher der Wert auf der y-Achse, desto unwahrscheinlicher ist das Ereignis. Der Bereich unter der Kurve gibt die Wahrscheinlichkeit an: Dass das beobachtete Ergebnis auf Zufall beruht.
Der kritische Wert ist ein Wert der festgelegt wird um zu entscheiden, ob die Nullhypothese, in diesem Fall dass die beobachteten Häufigkeiten unseren Erwartungen entsprechen, verworfen werden kann. Der kritische Wert wird festgelegt indem ein Signifikanzniveau gewählt wird das angibt, ebenso wie sicher man sein möchte, dass die beobachteten Abweichungen nicht auf Zufall beruhen. In diesem Beispiel wurde ein Signifikanzniveau von 5% verwendet was einem p-Wert von 0⸴05 entspricht. Der kritische Chi-Quadrat-Wert für ein Signifikanzniveau von 0⸴05 und einem Freiheitsgrad von 1 beträgt 3⸴841.
Um den richtigen p-Wert zu finden, muss man die Fläche unter der Verteilungskurve berechnen die rechts vom empirischen Chi-Quadrat-Wert liegt. In diesem Fall liegt der empirische Wert von 0⸴84 unter dem kritischen Wert von 3⸴841, deshalb kann die Nullhypothese nicht verworfen werden.
Es ist wichtig zu beachten » dass die Nullhypothese niemals angenommen wird « allerdings nur nicht verworfen werden kann. Dies ist vor allem bei kleinen Stichproben wichtig da eine Annahme der Nullhypothese bei kleinen Stichproben zu falschen Schlussfolgerungen führen kann.
Zusammenfassend kann man sagen, dass die Chi-Quadrat-Verteilung und der Chi-Quadrat-Test verwendet werden um festzustellen, ob beobachtete Häufigkeiten signifikant von erwarteten Häufigkeiten abweichen. Der p-Wert gibt die Wahrscheinlichkeit an: Das beobachtete Ergebnis auf Zufall beruht und der kritische Wert wird verwendet um zu entscheiden, ob die Nullhypothese verworfen werden kann.
In dem gegebenen Beispiel werden 120 Münzwürfe betrachtet bei denen statistisch gesehen 60 mal Kopf und 60 mal Zahl auftreten sollten. Tatsächlich wurden jedoch 65 mal Kopf und 55 mal Zahl gezählt. Die Frage ist nun, ob dieses Ergebnis unserer Erwartung gemäß ist oder nicht.
Um diese Frage zu beantworten, wird die Chi-Quadrat-Verteilung verwendet. Der Chi-Quadrat-Wert wird berechnet, indem die quadrierte Differenz zwischen den beobachteten und erwarteten Häufigkeiten für jede Kategorie berechnet und anschließend summiert wird. In diesem Fall ergibt sich ein Chi-Quadrat-Wert von 0⸴84.
Die y-Achse der Grafik der Chi-Quadrat-Verteilung gibt die Wahrscheinlichkeit an. Je höher der Wert auf der y-Achse, desto unwahrscheinlicher ist das Ereignis. Der Bereich unter der Kurve gibt die Wahrscheinlichkeit an: Dass das beobachtete Ergebnis auf Zufall beruht.
Der kritische Wert ist ein Wert der festgelegt wird um zu entscheiden, ob die Nullhypothese, in diesem Fall dass die beobachteten Häufigkeiten unseren Erwartungen entsprechen, verworfen werden kann. Der kritische Wert wird festgelegt indem ein Signifikanzniveau gewählt wird das angibt, ebenso wie sicher man sein möchte, dass die beobachteten Abweichungen nicht auf Zufall beruhen. In diesem Beispiel wurde ein Signifikanzniveau von 5% verwendet was einem p-Wert von 0⸴05 entspricht. Der kritische Chi-Quadrat-Wert für ein Signifikanzniveau von 0⸴05 und einem Freiheitsgrad von 1 beträgt 3⸴841.
Um den richtigen p-Wert zu finden, muss man die Fläche unter der Verteilungskurve berechnen die rechts vom empirischen Chi-Quadrat-Wert liegt. In diesem Fall liegt der empirische Wert von 0⸴84 unter dem kritischen Wert von 3⸴841, deshalb kann die Nullhypothese nicht verworfen werden.
Es ist wichtig zu beachten » dass die Nullhypothese niemals angenommen wird « allerdings nur nicht verworfen werden kann. Dies ist vor allem bei kleinen Stichproben wichtig da eine Annahme der Nullhypothese bei kleinen Stichproben zu falschen Schlussfolgerungen führen kann.
Zusammenfassend kann man sagen, dass die Chi-Quadrat-Verteilung und der Chi-Quadrat-Test verwendet werden um festzustellen, ob beobachtete Häufigkeiten signifikant von erwarteten Häufigkeiten abweichen. Der p-Wert gibt die Wahrscheinlichkeit an: Das beobachtete Ergebnis auf Zufall beruht und der kritische Wert wird verwendet um zu entscheiden, ob die Nullhypothese verworfen werden kann.