top of page

Chi-Quadrat-Statistik

Chi-Quadrat (χ2) Statistik: Was es ist, Beispiele, wie und wann man den Test anwendet<|SEP|>



Wichtige Erkenntnisse


  • Chi-Quadrat ist nützlich zur Analyse solcher Unterschiede bei kategorialen Variablen, insbesondere bei solchen nominaler Natur.
  • χ2 hängt von der Größe der Differenz zwischen tatsächlichen und beobachteten Werten, den Freiheitsgraden und der Stichprobengröße ab.
  • χ2 kann verwendet werden, um zu testen, ob zwei Variablen miteinander verbunden oder unabhängig voneinander sind.
  • Es kann auch verwendet werden, um die Anpassungsgüte zwischen einer beobachteten Verteilung und einer theoretischen Häufigkeitsverteilung zu testen.


Was ist eine Chi-Quadrat (χ2) Statistik?


Eine Chi-Quadrat (χ2) Statistik ist ein Test, der beobachtete Daten mit dem Modell vergleicht und dessen Anpassung misst. Die Daten, die zur Berechnung einer Chi-Quadrat-Statistik verwendet werden, müssen zufällig, roh, sich gegenseitig ausschließend, aus unabhängigen Variablen gezogen und aus einer ausreichend großen Stichprobe stammen. Beispielsweise erfüllen die Ergebnisse des Werfens einer fairen Münze diese Kriterien.

Chi-Quadrat-Tests werden häufig verwendet, um Hypothesen zu testen. Die Chi-Quadrat-Statistik vergleicht die Größe etwaiger Abweichungen zwischen den erwarteten Ergebnissen und den tatsächlichen Ergebnissen, unter Berücksichtigung der Stichprobengröße und der Anzahl der Variablen in der Beziehung.

Bei diesen Tests werden Freiheitsgrade verwendet, um zu bestimmen, ob eine bestimmte Nullhypothese basierend auf der Gesamtzahl der Variablen und Stichproben im Experiment abgelehnt werden kann. Wie bei jeder Statistik gilt: Je größer die Stichprobe, desto zuverlässiger die Ergebnisse.



Formel für eine Chi-Quadrat (χ2) Statistik


χc2=∑(Oi−Ei)2Eiwobei:c=FreiheitsgradeO=Beobachtete(r) Wert(e)E=Erwartete(r) Wert(e)\begin{aligned}&\chi^2_c = \sum \frac{(O_i - E_i)^2}{E_i} \\&\textbf{wobei:}\\&c=\text{Freiheitsgrade}\\&O=\text{Beobachtete(r) Wert(e)}\\&E=\text{Erwartete(r) Wert(e)}\end{aligned}​χc2​=∑Ei​(Oi​−Ei​)2​wobei:c=FreiheitsgradeO=Beobachtete(r) Wert(e)E=Erwartete(r) Wert(e)​



Was eine Chi-Quadrat (χ2) Statistik Ihnen sagen kann


Es gibt zwei Hauptarten von Chi-Quadrat-Tests, die unterschiedliche Informationen liefern:

Der Unabhängigkeitstest, der eine Frage nach dem Zusammenhang stellt, wie zum Beispiel: „Gibt es einen Zusammenhang zwischen dem Geschlecht der Studenten und der Kursauswahl?“

Der Anpassungsgüte-Test, der eine theoretische Frage stellt wie: „Wie gut entspricht die Münze in meiner Hand einer theoretisch fairen Münze?“



Kurzer Fakt


Chi-Quadrat-Analyse wird auf kategoriale Variablen angewendet und ist besonders nützlich, wenn diese Variablen nominal sind (wo die Reihenfolge keine Rolle spielt, wie z.B. Familienstand oder Geschlecht).



Unabhängigkeitstest


Bei der Betrachtung von Studentengeschlecht und Kursauswahl könnte ein χ2-Test auf Unabhängigkeit verwendet werden. Um diesen Test durchzuführen, würde der Forscher Daten zu den beiden ausgewählten Variablen (Geschlecht und gewählte Kurse) sammeln und dann die Häufigkeiten, mit denen männliche und weibliche Studenten die angebotenen Kurse auswählen, mit der oben angegebenen Formel und einer χ2-Statistik-Tabelle vergleichen.

Wenn kein Zusammenhang zwischen Geschlecht und Kursauswahl besteht (d.h. sie sind unabhängig), dann sollten die tatsächlichen Häufigkeiten, mit denen männliche und weibliche Studenten jeden angebotenen Kurs auswählen, annähernd gleich sein, oder umgekehrt sollte der Anteil männlicher und weiblicher Studenten in jedem ausgewählten Kurs annähernd dem Anteil männlicher und weiblicher Studenten in der Stichprobe entsprechen.

Ein χ2-Unabhängigkeitstest kann uns sagen, wie wahrscheinlich es ist, dass Zufall einen beobachteten Unterschied zwischen den tatsächlichen Häufigkeiten in den Daten und diesen theoretischen Erwartungen erklären kann.

Bei einem Unabhängigkeitstest möchte ein Unternehmen möglicherweise bewerten, ob sein neues Produkt, ein pflanzliches Nahrungsergänzungsmittel, das Menschen einen Energieschub verspricht, die Personen erreicht, die am wahrscheinlichsten interessiert sind.

Es wird auf Websites zu Sport und Fitness beworben, unter der Annahme, dass aktive und gesundheitsbewusste Menschen es am ehesten kaufen. Es wird eine umfangreiche Umfrage durchgeführt, die das Interesse an dem Produkt nach demografischer Gruppe bewerten soll. Die Umfrage deutet auf keine Korrelation zwischen dem Interesse an diesem Produkt und den gesundheitsbewusstesten Menschen hin.



Anpassungsgüte-Test


χ2 bietet eine Möglichkeit zu testen, wie gut eine Stichprobe von Daten mit den (bekannten oder angenommenen) Eigenschaften der größeren Grundgesamtheit übereinstimmt, die die Stichprobe repräsentieren soll. Dies wird als Anpassungsgüte bezeichnet.

Wenn die Stichprobendaten nicht zu den erwarteten Eigenschaften der interessierenden Grundgesamtheit passen, sollte man diese Stichprobe nicht verwenden, um Schlussfolgerungen über die größere Grundgesamtheit zu ziehen.

Als Beispiel für einen Anpassungsgüte-Test erwägt ein Marketingfachmann die Einführung eines neuen Produkts, von dem das Unternehmen glaubt, dass es für Frauen über 45 unwiderstehlich sein wird. Das Unternehmen hat Produkttestpanels mit 500 potenziellen Produktkäufern durchgeführt.

Der Marketingfachmann hat Informationen über das Alter und Geschlecht der Testpanels. Dies ermöglicht die Erstellung eines Chi-Quadrat-Tests, der die Verteilung nach Alter und Geschlecht der Personen zeigt, die angaben, das Produkt kaufen zu wollen.

Das Ergebnis zeigt, ob der wahrscheinlichste Käufer eine Frau über 45 ist oder nicht. Wenn der Test zeigt, dass Männer über 45 oder Frauen zwischen 18 und 44 das Produkt genauso wahrscheinlich kaufen, wird der Marketingfachmann die Werbung, Verkaufsförderung und Platzierung des Produkts überarbeiten, um diese breitere Kundengruppe anzusprechen.



Beispiel für die Verwendung einer Chi-Quadrat (χ2) Statistik


Stellen Sie sich zum Beispiel eine imaginäre Münze mit genau einer 50/50-Chance auf Kopf oder Zahl vor und eine echte Münze, die Sie 100 Mal werfen. Wenn diese Münze fair ist, hat sie auch eine gleiche Wahrscheinlichkeit, auf beiden Seiten zu landen, und das erwartete Ergebnis des 100-maligen Werfens der Münze ist, dass Kopf 50 Mal und Zahl 50 Mal erscheint.

In diesem Fall kann χ2 uns sagen, wie gut die tatsächlichen Ergebnisse von 100 Münzwürfen mit dem theoretischen Modell übereinstimmen, dass eine faire Münze 50/50-Ergebnisse liefert. Der tatsächliche Wurf könnte 50/50, 60/40 oder sogar 90/10 ergeben.

Je weiter die tatsächlichen Ergebnisse der 100 Würfe von 50/50 entfernt sind, desto schlechter ist die Anpassung dieser Wurfserie an die theoretische Erwartung von 50/50, und desto wahrscheinlicher ist es, dass man zu dem Schluss kommt, dass diese Münze tatsächlich nicht fair ist.



Wann man einen Chi-Quadrat (χ2) Test verwendet


Ein Chi-Quadrat-Test wird verwendet, um festzustellen, ob beobachtete Ergebnisse mit den erwarteten Ergebnissen übereinstimmen und um auszuschließen, dass die Beobachtungen auf Zufall beruhen.

Ein Chi-Quadrat-Test ist hierfür geeignet, wenn die analysierten Daten aus einer Zufallsstichprobe stammen und wenn die betreffende Variable eine kategoriale Variable ist. Eine kategoriale Variable besteht aus Auswahlmöglichkeiten wie Autotyp, Rasse, Bildungsabschluss, männlich oder weiblich oder wie sehr jemand einen politischen Kandidaten mag (von sehr stark bis sehr wenig).

Diese Arten von Daten werden häufig über Umfrageantworten oder Fragebögen gesammelt. Daher ist die Chi-Quadrat-Analyse bei der Analyse dieser Art von Daten oft am nützlichsten.



Kurzer Fakt


Der Chi-Quadrat-Test ist am effektivsten bei einer ausreichend großen Stichprobengröße. Die erwartete Häufigkeit für jede Zelle sollte mindestens 1 betragen und für die Mehrheit (80%+) der Zellen größer als 5 sein.1



Wie man einen Chi-Quadrat (χ2) Test durchführt


Dies sind die grundlegenden Schritte, unabhängig davon, ob Sie einen Anpassungsgüte-Test oder einen Unabhängigkeitstest durchführen:

Erstellen Sie eine Tabelle der beobachteten und erwarteten Häufigkeiten.

Verwenden Sie die Formel, um den Chi-Quadrat-Wert zu berechnen.

Finden Sie den kritischen Chi-Quadrat-Wert mithilfe einer Chi-Quadrat-Wertetabelle oder statistischer Software.

Bestimmen Sie, ob der Chi-Quadrat-Wert oder der kritische Wert der größere von beiden ist.

Lehnen Sie die Nullhypothese ab oder akzeptieren Sie sie.



Einschränkungen einer Chi-Quadrat (χ2) Statistik


Der Chi-Quadrat-Test reagiert empfindlich auf die Stichprobengröße. Beziehungen können signifikant erscheinen, obwohl sie es nicht sind, nur weil eine sehr große Stichprobe verwendet wird.

Darüber hinaus kann der Chi-Quadrat-Test nicht feststellen, ob eine Variable eine kausale Beziehung zu einer anderen hat. Er kann nur feststellen, ob zwei Variablen miteinander verbunden sind.



Wofür wird ein Chi-Quadrat-Test verwendet?


Chi-Quadrat ist ein statistischer Test, der verwendet wird, um die Unterschiede zwischen kategorialen Variablen aus einer Zufallsstichprobe zu untersuchen, um die Anpassungsgüte zwischen erwarteten und beobachteten Ergebnissen zu beurteilen.



Wer verwendet die Chi-Quadrat-Analyse?


Da Chi-Quadrat auf kategoriale Variablen anwendbar ist, wird es am häufigsten von Forschern verwendet, die Umfragedaten untersuchen. Diese Art von Forschung kann von Demografie über Konsum- und Marketingforschung bis hin zu Politikwissenschaft und Wirtschaftswissenschaften reichen.



Wird die Chi-Quadrat-Analyse verwendet, wenn die unabhängige Variable nominal oder ordinal ist?


Eine nominale Variable ist eine kategoriale Variable, die sich qualitativ unterscheidet, deren numerische Reihenfolge jedoch irrelevant sein könnte. Zum Beispiel würde die Frage nach der Lieblingsfarbe einer Person eine nominale Variable ergeben. Die Frage nach dem Alter einer Person würde dagegen einen ordinalen Datensatz ergeben. Chi-Quadrat kann am besten auf nominale Daten angewendet werden.

bottom of page