Anpassungsgüte

Was ist Anpassungsgüte?

Der Begriff Anpassungsgüte bezieht sich auf einen statistischen Test, der bewertet, wie gut Stichprobendaten zu einer Verteilung aus einer Grundgesamtheit mit einer Normalverteilung passen. Vereinfacht gesagt, testet er, ob eine Stichprobe verzerrt ist oder die Daten repräsentiert, die man in der tatsächlichen Grundgesamtheit erwarten würde.

Die Anpassungsgüte ermittelt die Diskrepanz zwischen den beobachteten Werten und den im Modell erwarteten Werten bei einer Normalverteilung. Es gibt mehrere Methoden zur Bestimmung der Anpassungsgüte, darunter der Chi-Quadrat-Test.

Wichtige Erkenntnisse

Die Anpassungsgüte kann zeigen, ob Ihre Stichprobendaten zu einem erwarteten Datensatz aus einer Grundgesamtheit mit Normalverteilung passen.
Es gibt verschiedene Arten von Anpassungsgüte-Tests, aber der häufigste ist der Chi-Quadrat-Test.
Der Chi-Quadrat-Test bestimmt, ob ein Zusammenhang zwischen kategorialen Daten besteht.
Der Kolmogorov-Smirnov-Test bestimmt, ob eine Stichprobe aus einer bestimmten Verteilung einer Grundgesamtheit stammt.
Erhalten Sie personalisierte, KI-gestützte Antworten, die auf über 27 Jahren vertrauenswürdiger Expertise basieren.

Anpassungsgüte verstehen

Anpassungsgüte-Tests sind statistische Methoden, die Rückschlüsse auf beobachtete Werte ziehen. Beispielsweise können Sie feststellen, ob eine Stichprobengruppe wirklich repräsentativ für die gesamte Grundgesamtheit ist.

Sie bestimmen, wie tatsächliche Werte mit den vorhergesagten Werten in einem Modell zusammenhängen. Bei Entscheidungsfindungen erleichtern Anpassungsgüte-Tests die Vorhersage zukünftiger Trends und Muster.

Wie bereits erwähnt, gibt es mehrere Arten von Anpassungsgüte-Tests. Dazu gehören der Chi-Quadrat-Test, der am häufigsten vorkommt, sowie der Kolmogorov-Smirnov-Test und der Shapiro-Wilk-Test. Die Tests werden normalerweise mit Computersoftware durchgeführt. Statistiker können diese Tests jedoch auch mit Formeln durchführen, die auf die jeweilige Testart zugeschnitten sind.

Um den Test durchzuführen, benötigen Sie eine bestimmte Variable sowie eine Annahme darüber, wie sie verteilt ist. Sie benötigen außerdem einen Datensatz mit klaren und expliziten Werten, wie zum Beispiel:

Die beobachteten Werte, die aus dem tatsächlichen Datensatz stammen

Die erwarteten Werte, die aus den getroffenen Annahmen abgeleitet werden

Die Gesamtanzahl der Kategorien im Datensatz

Wichtig

Anpassungsgüte-Tests werden häufig verwendet, um die Normalität von Residuen zu testen oder zu bestimmen, ob zwei Stichproben aus identischen Verteilungen stammen.

Ein Alpha-Niveau festlegen

Um einen Anpassungsgüte-Test zu interpretieren, ist es für Statistiker wichtig, ein Alpha-Niveau festzulegen, wie z. B. den p-Wert für den Chi-Quadrat-Test.

Der p-Wert bezieht sich auf die Wahrscheinlichkeit, Ergebnisse nahe an den extremen Enden der beobachteten Ergebnisse zu erhalten. Dabei wird angenommen, dass die Nullhypothese korrekt ist.

Eine Nullhypothese behauptet, dass kein Zusammenhang zwischen Variablen besteht, während die Alternativhypothese annimmt, dass ein Zusammenhang besteht.

Stattdessen wird die Häufigkeit der beobachteten Werte gemessen und anschließend mit den erwarteten Werten und den Freiheitsgraden zur Berechnung des Chi-Quadrat-Werts verwendet. Ist das Ergebnis kleiner als Alpha, ist die Nullhypothese ungültig, was auf einen Zusammenhang zwischen den Variablen hinweist.

Arten von Anpassungsgüte-Tests

Chi-Quadrat-Test

χ2=∑i=1k(Oi−Ei)2/Ei\chi^2=\sum\limits^k_{i=1}(O_i-E_i)^2/E_iχ2=i=1∑k(Oi−Ei)2/Ei

Der Chi-Quadrat-Test, auch als Chi-Quadrat-Unabhängigkeitstest bekannt, ist eine Methode der Inferenzstatistik, die die Gültigkeit einer Behauptung über eine Grundgesamtheit auf Basis einer Zufallsstichprobe testet.

Ausschließlich für Daten verwendet, die in Klassen (Bins) eingeteilt sind, erfordert er eine ausreichende Stichprobengröße für genaue Ergebnisse. Er gibt jedoch nicht die Art oder Stärke des Zusammenhangs an. Beispielsweise sagt er nicht, ob der Zusammenhang positiv oder negativ ist.

Um eine Chi-Quadrat-Anpassungsgüte zu berechnen, legen Sie das gewünschte Alpha-Signifikanzniveau fest. Wenn Ihr Konfidenzniveau also 95 % (oder 0,95) beträgt, ist das Alpha 0,05. Identifizieren Sie als nächstes die zu testenden kategorialen Variablen und definieren Sie Hypothesenaussagen über die Beziehungen zwischen ihnen.¹

Kurzer Fakt

Variablen müssen sich gegenseitig ausschließen, um für den Chi-Quadrat-Unabhängigkeitstest geeignet zu sein. Und der Chi-Quadrat-Anpassungsgüte-Test sollte nicht für kontinuierliche Daten verwendet werden.

Kolmogorov-Smirnov (K-S) Test

Benannt nach den russischen Mathematikern Andrey Kolmogorov und Nikolai Smirnov, ist der Kolmogorov-Smirnov (K-S) Test eine statistische Methode, die bestimmt, ob eine Stichprobe aus einer bestimmten Verteilung innerhalb einer Grundgesamtheit stammt.

Dieser Test, der für große Stichproben (z. B. über 2000) empfohlen wird, ist nicht-parametrisch. Das bedeutet, dass er nicht auf einer Verteilung basieren muss, um gültig zu sein. Das Ziel ist es, die Nullhypothese zu beweisen, die die Stichprobe der Normalverteilung darstellt.

Wie der Chi-Quadrat-Test verwendet er eine Null- und Alternativhypothese sowie ein Alpha-Signifikanzniveau. Die Nullhypothese besagt, dass die Daten einer bestimmten Verteilung in der Grundgesamtheit folgen, und die Alternativhypothese besagt, dass die Daten keiner bestimmten Verteilung in der Grundgesamtheit folgen.

Das Alpha wird verwendet, um den kritischen Wert für den Test zu bestimmen. Im Gegensatz zum Chi-Quadrat-Test ist der K-S-Test jedoch für kontinuierliche Verteilungen anwendbar.

Die berechnete Teststatistik wird oft als D bezeichnet. Sie bestimmt, ob die Nullhypothese angenommen oder abgelehnt wird. Ist D größer als der kritische Wert bei Alpha, wird die Nullhypothese abgelehnt. Ist D kleiner als der kritische Wert, wird die Nullhypothese angenommen.²

Der Anderson-Darling (A-D) Test

S=∑i=1N(2i−1)N[ln⁡F(Yi)+ln⁡(1−F(YN+1−i))]S = \sum_{i = 1}^{N} \frac {( 2i - 1 )}{ N } [\ln F ( Y_i ) + \ln ( 1 - F ( Y_{N + 1 - i} ) ) ]S=∑i=1NN(2i−1)[lnF(Yi)+ln(1−F(YN+1−i))]

Der Anderson-Darling (A-D) Test ist eine Variante des K-S-Tests, gibt aber den Enden der Verteilung mehr Gewicht.

Der K-S-Test ist empfindlicher für Unterschiede, die näher am Zentrum der Verteilung auftreten können, während der A-D-Test empfindlicher für Variationen in den Enden ist.³ Da das Risiko von Extremwerten (Tail Risk) und die Idee von "fetten Enden" (Fat Tails) in den Finanzmärkten vorherrscht, kann der A-D-Test bei Finanzanalysen mehr Aussagekraft bieten.

Wie der K-S-Test erzeugt der A-D-Test eine Statistik, bezeichnet als A², die mit der Nullhypothese verglichen werden kann.

Shapiro-Wilk (S-W) Test

Der Shapiro-Wilk (S-W) Test bestimmt, ob eine Stichprobe einer Normalverteilung folgt. Der Test prüft nur auf Normalität, wenn eine Stichprobe mit einer Variablen kontinuierlicher Daten verwendet wird, und wird für kleine Stichproben bis zu 2000 empfohlen.

Der Shapiro-Wilk-Test verwendet einen Wahrscheinlichkeitsplot namens QQ-Plot, der zwei Sätze von Quantilen auf der y-Achse anzeigt, die vom kleinsten zum größten angeordnet sind. Wenn jedes Quantil aus derselben Verteilung stammt, sind die Punktreihen linear.

Der QQ-Plot wird verwendet, um die Varianz zu schätzen. Mit der QQ-Plot-Varianz zusammen mit der geschätzten Varianz der Grundgesamtheit kann bestimmt werden, ob die Stichprobe zu einer Normalverteilung gehört. Wenn der Quotient beider Varianzen gleich oder nahe 1 ist, kann die Nullhypothese angenommen werden. Ist er erheblich kleiner als 1, kann sie abgelehnt werden.

Genau wie die oben genannten Tests verwendet auch dieser ein Alpha und bildet zwei Hypothesen: Nullhypothese und Alternativhypothese. Die Nullhypothese besagt, dass die Stichprobe aus der Normalverteilung stammt, während die Alternativhypothese besagt, dass die Stichprobe nicht aus der Normalverteilung stammt.⁴

Weitere Anpassungsgüte-Tests

Neben den oben genannten häufigeren Testarten gibt es zahlreiche weitere Anpassungsgüte-Tests, die ein Analyst verwenden kann:

Das Bayes'sche Informationskriterium (BIC) ist ein statistisches Maß, das für die Modellauswahl aus einer endlichen Menge von Modellen verwendet wird. Der BIC ist ein Anpassungsgüte-Test, der die Komplexität eines Modells mit seiner Anpassungsgüte an die Daten in Einklang bringt.

Das Cramer-von-Mises-Kriterium (CVM) ist ein Anpassungsgüte-Test, der bewertet, wie gut ein Satz beobachteter Daten zu einer hypothetischen Wahrscheinlichkeitsverteilung passt. Es wird häufig in der Wirtschafts-, Ingenieur- oder Finanzwissenschaft verwendet und basiert auf der kumulativen Verteilungsfunktion der beobachteten Daten und der hypothetischen Verteilung.

Das Akaike-Informationskriterium (AIC) ist ein Maß für die relative Qualität eines statistischen Modells für einen gegebenen Datensatz und bietet einen Kompromiss zwischen der Anpassungsgüte des Modells und seiner Komplexität. Es basiert auf der Informationstheorie und misst die Informationsmenge, die durch ein Modell verloren geht, wenn es verwendet wird, um die wahre zugrundeliegende Verteilung der Daten zu approximieren.

Der Hosmer-Lemeshow-Test vergleicht die erwarteten Häufigkeiten eines binären Ergebnisses mit den beobachteten Häufigkeiten dieses Ergebnisses in verschiedenen Gruppen oder Intervallen. Die Gruppen werden typischerweise gebildet, indem die vorhergesagten Wahrscheinlichkeiten des Ergebnisses in zehn Gruppen oder Bins unterteilt werden.

Kuiper's Test ist ähnlich dem Kolmogorov-Smirnov-Test, aber empfindlicher für Unterschiede in den Enden der Verteilung.

Moran's I-Test oder Moran's Index ist ein statistischer Test, der verwendet wird, um räumliche Autokorrelation in Daten zu bewerten. Räumliche Autokorrelation ist ein Maß für den Grad, in dem Beobachtungen einer Variablen im Raum ähnlich oder unähnlich sind.

Tipp

Eine sehr allgemeine Faustregel ist, dass jede Gruppe innerhalb eines Anpassungsgüte-Tests mindestens fünf Datenpunkte haben sollte. Dies stellt sicher, dass dem Test ausreichend Informationen zugeführt werden, um die Verteilung zu bestimmen.

Bedeutung von Anpassungsgüte-Tests

Anpassungsgüte-Tests sind in der Statistik aus vielen Gründen wichtig.

1. Erstens bieten sie eine Möglichkeit zu bewerten, wie gut ein statistisches Modell zu einem Satz beobachteter Daten passt. Die Hauptbedeutung der Durchführung eines Anpassungsgüte-Tests besteht darin, festzustellen, ob die beobachteten Daten mit dem angenommenen statistischen Modell konsistent sind. In der Folge kann ein Anpassungsgüte-Test nützlich sein, um zwischen verschiedenen Modellen zu wählen, die möglicherweise besser zu den Daten passen.

2. Anpassungsgüte-Tests können auch dabei helfen, Ausreißer oder Marktanomalien zu identifizieren, die die Anpassung des Modells beeinflussen könnten. Ausreißer können einen großen Einfluss auf die Modellanpassung haben und müssen möglicherweise entfernt oder separat behandelt werden. Manchmal sind Ausreißer nicht leicht identifizierbar, bis sie in ein Analysemodell integriert wurden.

3. Anpassungsgüte-Tests können Informationen über die Variabilität der Daten und die geschätzten Parameter des Modells liefern. Diese Informationen können nützlich sein, um Vorhersagen zu treffen und das Verhalten des modellierten Systems zu verstehen.

Basierend auf den in das Modell eingespeisten Daten kann es notwendig sein, das Modell spezifisch für den getesteten Datensatz, die berechneten Residuen und den p-Wert für potenziell extreme Daten zu verfeinern.

Anpassungsgüte-Test vs. Unabhängigkeitstest

Der Anpassungsgüte-Test und der Unabhängigkeitstest sind beide statistische Tests, die verwendet werden, um die Beziehung zwischen Variablen zu bewerten; daher kann es leicht sein, die beiden zu verwechseln. Allerdings ist jeder darauf ausgelegt, unterschiedliche Fragen zu beantworten.

Ein Anpassungsgüte-Test wird verwendet, um zu bewerten, wie gut ein Satz beobachteter Daten zu einer bestimmten Wahrscheinlichkeitsverteilung passt.

Andererseits wird ein Unabhängigkeitstest verwendet, um die Beziehung zwischen zwei Variablen zu bewerten; das heißt, ob ein Zusammenhang zwischen den beiden Variablen besteht. Der Hauptzweck eines Unabhängigkeitstests besteht darin zu sehen, ob eine Änderung einer Variablen mit einer Änderung einer anderen Variablen zusammenhängt.

Ein Unabhängigkeitstest wird typischerweise verwendet, wenn die Forschungsfrage darauf abzielt, die Beziehung zwischen zwei spezifischen Variablen zu verstehen und ob sie zusammenhängen oder unabhängig sind (z. B. verursacht Rauchen Lungenkrebs?).

Andererseits wird ein Anpassungsgüte-Test für einen gesamten Satz beobachteter Daten verwendet, um die Angemessenheit eines bestimmten Modells zu bewerten.

Beispiel für Anpassungsgüte

Hier ist ein hypothetisches Beispiel, das zeigt, wie der Anpassungsgüte-Test funktioniert.

Angenommen, ein kleines Gemeinschaftsfitnessstudio arbeitet unter der Annahme, dass die höchste Besucherzahl an Montagen, Dienstagen und Samstagen ist, durchschnittliche Besucherzahl an Mittwochen und Donnerstagen auftritt und die niedrigste Besucherzahl an Freitagen und Sonntagen.

Basierend auf diesen Annahmen beschäftigt das Fitnessstudio jeden Tag eine bestimmte Anzahl von Mitarbeitern, um Mitglieder einzuchecken, Einrichtungen zu reinigen, Trainingsdienste anzubieten und Kurse zu leiten.

Aber das Fitnessstudio läuft finanziell nicht gut und der Besitzer möchte wissen, ob diese Besucherannahmen und Personalbesetzungsstufen korrekt sind. Der Besitzer beschließt, die Anzahl der Fitnessstudio-Besucher an jedem Tag sechs Wochen lang zu zählen.

Sie können dann die angenommene Besucherzahl des Fitnessstudios mit der beobachteten Besucherzahl vergleichen, zum Beispiel unter Verwendung eines Chi-Quadrat-Anpassungsgüte-Tests.

Nachdem sie die neuen Daten haben, können sie bestimmen, wie das Fitnessstudio am besten zu verwalten ist und die Rentabilität verbessert wird.

Was bedeutet Anpassungsgüte?

Anpassungsgüte ist ein statistischer Hypothesentest, der verwendet wird, um zu sehen, wie genau beobachtete Daten mit erwarteten Daten übereinstimmen. Anpassungsgüte-Tests können helfen festzustellen, ob eine Stichprobe einer Normalverteilung folgt, ob kategoriale Variablen zusammenhängen oder ob Zufallsstichproben aus derselben Verteilung stammen.

Warum ist Anpassungsgüte wichtig?

Anpassungsgüte-Tests sind wichtig, weil sie helfen können festzustellen, ob beobachtete Daten mit dem übereinstimmen, was angenommen/erwartet wird. Entscheidungen können basierend auf dem Ergebnis des durchgeführten Hypothesentests getroffen werden. Beispielsweise möchte ein Einzelhändler wissen, welches Produktangebot junge Menschen anspricht. Der Einzelhändler befragt eine Zufallsstichprobe von alten und jungen Menschen, um zu identifizieren, welches Produkt bevorzugt wird. Mit Chi-Quadrat stellen sie fest, dass mit 95%iger Konfidenz ein Zusammenhang zwischen Produkt A und jungen Menschen besteht. Basierend auf diesen Ergebnissen könnte bestimmt werden, dass diese Stichprobe die Bevölkerung junger Erwachsener repräsentiert. Marketingfachleute des Einzelhandels können dies nutzen, um ihre Marketingkampagnen zu überarbeiten.

Was ist Anpassungsgüte beim Chi-Quadrat-Test?

Der Chi-Quadrat-Test bewertet, ob Zusammenhänge zwischen kategorialen Variablen bestehen und ob die Stichprobe die Gesamtheit repräsentiert. Er schätzt, wie genau die beobachteten Daten mit den erwarteten Daten übereinstimmen, oder wie gut sie passen.

Wie führt man den Anpassungsgüte-Test durch?

Es gibt mehr als einen Test. Das Ziel des Tests hilft bei der Entscheidung, welche Methode verwendet werden soll. Wenn das Ziel beispielsweise darin besteht, die Normalität bei einer relativ kleinen Stichprobe zu testen, könnte der Shapiro-Wilk-Test geeignet sein. Wenn Forscher feststellen möchten, ob eine Stichprobe aus einer bestimmten Verteilung innerhalb einer Grundgesamtheit stammt, wird der Kolmogorov-Smirnov-Test verwendet. Jeder Test verwendet seine eigene einzigartige Formel. Sie haben jedoch Gemeinsamkeiten, wie eine Nullhypothese und ein Signifikanzniveau.