top of page

Freiheitsgrade

Freiheitsgrade in der Statistik verstehen: Schlüsselkonzepte erklärt



Wichtige Erkenntnisse


  • Freiheitsgrade werden als Anzahl der Elemente minus eins berechnet.
  • Sie werden beim Hypothesentest in der Statistik verwendet, wie zum Beispiel bei Chi-Quadrat-Tests.
  • Das Konzept wurde erstmals von dem Mathematiker Carl Friedrich Gauss eingeführt.
  • Freiheitsgrade erlauben es, Datenpunkte in einer Stichprobe zufällig auszuwählen, mit Ausnahme des letzten Werts. Freiheitsgrade entsprechen der Anzahl der Einheiten in einer gegebenen Menge minus 1, z. B. n-1, wobei n die Stichprobengröße ist. Die Stichprobengröße spielt keine Rolle, solange der letzte Datenpunkt in der Stichprobe konstant bleibt.
  • Der Mathematiker und Astronom Carl Friedrich Gauss entwickelte das früheste Konzept der Freiheitsgrade. Freiheitsgrade werden häufig im Zusammenhang mit Hypothesentests in der Statistik diskutiert, wie zum Beispiel beim Chi-Quadrat-Test.


Verständnis der Freiheitsgrade


Freiheitsgrade sind die Anzahl unabhängiger Variablen, die in einer statistischen Analyse geschätzt werden können, und geben an, wie viele Elemente zufällig ausgewählt werden können, bevor Einschränkungen vorgenommen werden müssen.

Innerhalb eines Datensatzes können einige Anfangszahlen zufällig gewählt werden. Wenn jedoch der Datensatz eine bestimmte Summe oder einen bestimmten Mittelwert ergeben muss, wird die Zahl im Datensatz eingeschränkt, um die Werte aller anderen Werte im Datensatz zu bewerten und dann die festgelegte Anforderung zu erfüllen.



Praktische Beispiele für Freiheitsgrade


Beispiel 1: Betrachten Sie eine Datenstichprobe, die aus fünf positiven ganzen Zahlen besteht. Die Werte der fünf ganzen Zahlen müssen einen Durchschnitt von sechs haben. Wenn vier Elemente des Datensatzes {3, 8, 5 und 4} sind, muss die fünfte Zahl 10 sein. Da die ersten vier Zahlen zufällig gewählt werden können, betragen die Freiheitsgrade vier.

Beispiel 2: Betrachten Sie eine Datenstichprobe, die aus fünf positiven ganzen Zahlen besteht. Die Werte können beliebige Zahlen ohne bekannte Beziehung zueinander sein. Mit anderen Worten, es gibt keine Einschränkungen oder Begrenzungen für die ausgewählten Zahlen. Da alle fünf Zahlen zufällig und ohne Einschränkungen ausgewählt werden können, beträgt der Freiheitsgrad fünf.

Beispiel 3: Betrachten Sie eine Datenstichprobe, die aus einer ganzen Zahl besteht. Diese ganze Zahl muss ungerade sein. Da es Einschränkungen für das einzelne Element im Datensatz gibt, sind die Freiheitsgrade null.



Formel zur Berechnung der Freiheitsgrade


Die Formel zur Bestimmung der Freiheitsgrade lautet:

Df=N−1wo:Df=FreiheitsgradeN=Stichprobengröße\begin{aligned} &\text{D}_\text{f} = N - 1 \\ &\textbf{wo:} \\ &\text{D}_\text{f} = \text{Freiheitsgrade} \\ &N = \text{Stichprobengröße} \\ \end{aligned}

Stellen Sie sich zum Beispiel eine Aufgabe vor, bei der 10 Baseballspieler ausgewählt werden, deren Schlagdurchschnitt .250 betragen muss. Die Gesamtzahl der Spieler, die unseren Datensatz bilden, ist die Stichprobengröße, also N = 10. In diesem Beispiel können 9 (10 - 1) Baseballspieler zufällig ausgewählt werden, wobei der 10. Baseballspieler einen bestimmten Schlagdurchschnitt haben muss, um die Beschränkung des .250er Schlagdurchschnitts einzuhalten.



Wichtig


Einige Berechnungen der Freiheitsgrade mit mehreren Parametern oder Beziehungen verwenden die Formel Df = N - P, wobei P die Anzahl der verschiedenen Parameter oder Beziehungen ist. Zum Beispiel wird bei einem Zweistichproben-t-Test N - 2 verwendet, da zwei Parameter zu schätzen sind.



Anwendung der Freiheitsgrade in der Statistik


In der Statistik definieren Freiheitsgrade die Form der t-Verteilung, die bei t-Tests zur Berechnung des p-Werts verwendet wird. Abhängig von der Stichprobengröße zeigen unterschiedliche Freiheitsgrade unterschiedliche t-Verteilungen. Die Berechnung der Freiheitsgrade ist entscheidend für das Verständnis der Bedeutung einer Chi-Quadrat-Statistik und der Gültigkeit der Nullhypothese.

Freiheitsgrade haben auch konzeptionelle Anwendungen außerhalb der Statistik. Stellen Sie sich ein Unternehmen vor, das den Einkauf von Rohmaterialien für seinen Herstellungsprozess entscheidet. Das Unternehmen hat zwei Elemente in diesem Datensatz: die Menge der zu beschaffenden Rohmaterialien und die Gesamtkosten der Rohmaterialien.

Das Unternehmen entscheidet frei über eines der beiden Elemente, aber seine Wahl bestimmt das Ergebnis des anderen. Da es nur eines der beiden frei wählen kann, hat es in dieser Situation einen Freiheitsgrad. Wenn das Unternehmen die Menge der Rohmaterialien festlegt, kann es nicht über den Gesamtbetrag entscheiden, der ausgegeben wird. Durch die Festlegung des Gesamtbetrags kann das Unternehmen in der Menge der Rohmaterialien, die es beschaffen kann, eingeschränkt sein.



Chi-Quadrat-Tests und Freiheitsgrade


Es gibt zwei verschiedene Arten von Chi-Quadrat-Tests: den Unabhängigkeitstest, der eine Frage nach einem Zusammenhang stellt, wie zum Beispiel "Gibt es einen Zusammenhang zwischen Geschlecht und SAT-Ergebnissen?"; und den Anpassungstest (Goodness-of-Fit), der etwas fragt wie "Wenn eine Münze 100 Mal geworfen wird, wird sie dann 50 Mal Kopf und 50 Mal Zahl zeigen?"

Bei diesen Tests werden Freiheitsgrade verwendet, um zu bestimmen, ob eine Nullhypothese basierend auf der Gesamtzahl der Variablen und Stichproben im Experiment abgelehnt werden kann. Wenn man zum Beispiel Schüler und Kurswahl betrachtet, ist eine Stichprobengröße von 30 oder 40 Schülern wahrscheinlich nicht groß genug, um signifikante Daten zu erzeugen. Die gleichen oder ähnlichen Ergebnisse aus einer Studie mit einer Stichprobengröße von 400 oder 500 Schülern zu erhalten, ist aussagekräftiger.



t-Test und seine Freiheitsgrade


Um einen t-Test durchzuführen, müssen Sie den t-Wert für die Stichprobe berechnen und mit einem kritischen Wert vergleichen. Der kritische Wert variiert, und Sie können den richtigen kritischen Wert bestimmen, indem Sie die t-Verteilung eines Datensatzes mit den Freiheitsgraden verwenden.

Mengen mit niedrigeren Freiheitsgraden haben eine höhere Wahrscheinlichkeit für Extremwerte, und höhere Freiheitsgrade, wie z. B. eine Stichprobengröße von mindestens 30, werden einer Normalverteilungskurve viel näher kommen. Kleinere Stichprobengrößen entsprechen kleineren Freiheitsgraden und führen zu dickeren Enden der t-Verteilung.

In den obigen Beispielen können viele der Situationen als Einstichproben-t-Test verwendet werden. Zum Beispiel kann "Beispiel 1", bei dem fünf Werte ausgewählt werden, aber eine bestimmte Summe oder ein bestimmter Durchschnitt erreicht werden muss, als Einstichproben-t-Test definiert werden. Dies liegt daran, dass der Variablen nur eine Einschränkung auferlegt wird.



Geschichte der Freiheitsgrade


Das früheste und grundlegendste Konzept der Freiheitsgrade wurde im frühen 19. Jahrhundert festgestellt, eingewoben in die Arbeiten des Mathematikers und Astronomen Carl Friedrich Gauss. Die moderne Verwendung und das Verständnis des Begriffs wurden erstmals von William Sealy Gosset, einem englischen Statistiker, in seinem Artikel "The Probable Error of a Mean" erläutert, der 1908 unter einem Pseudonym in Biometrika veröffentlicht wurde, um seine Anonymität zu wahren.1

In seinen Schriften verwendete Gosset den Begriff "Freiheitsgrade" nicht ausdrücklich. Er erklärte das Konzept jedoch durchgehend und entwickelte das, was schließlich als "Student's t-Verteilung" bekannt wurde. Der Begriff wurde erst 1922 populär. Der englische Biologe und Statistiker Ronald Fisher begann den Begriff "Freiheitsgrade" zu verwenden, als er Berichte und Daten zu seiner Arbeit an der Entwicklung von Chi-Quadrat-Tests veröffentlichte.1



Wie bestimmt man Freiheitsgrade?


Bei der Bestimmung des Mittelwerts eines Datensatzes werden Freiheitsgrade als Anzahl der Elemente in einer Menge minus eins berechnet. Dies liegt daran, dass alle Elemente in dieser Menge zufällig ausgewählt werden können, bis eines übrig bleibt; dieses eine Element muss einem gegebenen Mittelwert entsprechen.



Was sagen Ihnen Freiheitsgrade?


Freiheitsgrade geben an, wie viele Einheiten innerhalb einer Menge ohne Einschränkungen ausgewählt werden können, um dennoch eine gegebene Regel für die Menge einzuhalten. Betrachten Sie zum Beispiel eine Menge von fünf Elementen, die einen Durchschnittswert von 20 ergeben. Freiheitsgrade sagen Ihnen, wie viele der Elemente zufällig ausgewählt werden können, bevor Einschränkungen vorgenommen werden müssen. In diesem Beispiel haben Sie, sobald die ersten vier Elemente ausgewählt sind, nicht mehr die Freiheit, einen Datenpunkt zufällig auszuwählen, da Sie den gegebenen Durchschnitt "erzwingen" müssen.



Ist der Freiheitsgrad immer 1?


Freiheitsgrade sind immer die Anzahl der Einheiten in einer gegebenen Menge minus 1. Es ist immer minus eins, weil, wenn Parameter für den Datensatz festgelegt werden, das letzte Datenelement spezifisch sein muss, damit alle anderen Punkte diesem Ergebnis entsprechen.

bottom of page