t-Test

T-Test: Was es ist mit mehreren Formeln und wann man sie verwendet

Wichtige Erkenntnisse

Ein t-Test kann einen statistisch signifikanten Unterschied zwischen den Mittelwerten zweier Datensätze aufdecken.
Er wird in der Statistik für Hypothesentests verwendet.
Zur Berechnung eines t-Tests werden die Differenz zwischen den Mittelwerten der einzelnen Datensätze, die Standardabweichung jeder Gruppe und die Anzahl der Datenwerte benötigt.
t-Tests können abhängig oder unabhängig sein.

Was ist ein t-Test?

Ein t-Test ist ein inferenzstatistischer Test, der verwendet wird, um festzustellen, ob ein signifikanter Unterschied zwischen den Mittelwerten zweier Gruppen besteht und wie diese zusammenhängen. t-Tests werden verwendet, wenn die Datensätze einer Normalverteilung folgen und unbekannte Varianzen aufweisen, wie z. B. der Datensatz, der durch 100-maliges Werfen einer Münze aufgezeichnet wurde. Der t-Test unterstützt Hypothesentests in der Statistik und verwendet die t-Statistik, die t-Verteilungswerte und die Freiheitsgrade, um die statistische Signifikanz zu bestimmen.

Investopedia / Sabrina Jiang

Den t-Test verstehen

Ein t-Test vergleicht die Mittelwerte zweier Stichproben, um einen statistisch signifikanten Unterschied festzustellen. Beispielsweise hätten die Noten von Schülern einer Physikklasse und die einer anderen Gruppe von Schülern einer Schreibklasse wahrscheinlich nicht denselben Mittelwert und dieselbe Standardabweichung.

Ebenso sollten Stichproben, die der Placebo-Kontrollgruppe eines Medikamententests entnommen wurden, und Stichproben, die der medikamentös behandelten Gruppe entnommen wurden, leicht unterschiedliche Mittelwerte und Standardabweichungen aufweisen.

Bei der Verwendung eines t-Tests werden vier Annahmen getroffen:1

Die gesammelten Daten müssen einer kontinuierlichen oder ordinalen Skala folgen, wie z. B. die Ergebnisse eines IQ-Tests.

Die Daten werden aus einem zufällig ausgewählten Teil der Gesamtpopulation erhoben.

Die Daten führen zu einer Normalverteilung in Form einer Glockenkurve.

Gleiche oder homogene Varianz liegt vor, wenn die Standardabweichungen gleich sind.

Mathematisch gesehen entnimmt der t-Test eine Stichprobe aus jeder der beiden Gruppen und stellt die Problemstellung auf. Er geht von einer Nullhypothese aus, d. h. er nimmt an, dass die beiden Mittelwerte gleich sind.2

Mit den t-Test-Formeln werden Werte berechnet und mit den Standardwerten verglichen. Dieser Vergleich hilft, den Einfluss des Zufalls auf die Differenz zu bestimmen und festzustellen, ob die Differenz außerhalb dieses Zufallsbereichs liegt.

Der t-Test hinterfragt, ob es einen wahren oder zufälligen Unterschied zwischen den Gruppen in der Studie gibt. Basierend auf den Ergebnissen wird die angenommene Nullhypothese akzeptiert oder abgelehnt. Wenn die Nullhypothese abgelehnt wird, zeigt dies an, dass die Datenmesswerte stark sind und wahrscheinlich nicht auf Zufall beruhen.3

Nullhypothese abgelehnt: Unterschiede sind statistisch signifikant

Nullhypothese akzeptiert: Unterschiede sind nicht statistisch signifikant

Der t-Test ist nur einer von vielen Tests, die auf diese Weise verwendet werden. Andere können je nach Anzahl der Variablen oder der Stichprobengröße geeigneter sein. Beispielsweise verwenden Statistiker einen z-Test für Datensätze mit einer großen Stichprobengröße. Weitere Testmöglichkeiten sind der Chi-Quadrat-Test und der F-Test.

Beispiel für einen sinnvollen Einsatz eines t-Tests

Stellen Sie sich vor, ein Pharmahersteller testet ein neues Medikament. Nach dem Standardverfahren wird das Medikament einer Gruppe von Patienten verabreicht und ein Placebo einer anderen Gruppe, der sogenannten Kontrollgruppe.

Das Placebo ist eine Substanz ohne therapeutischen Wert und dient als Maßstab, um zu messen, wie die andere Gruppe, die das eigentliche Medikament erhält, reagiert.

Nach der Medikamentenstudie berichteten die Mitglieder der Kontrollgruppe über eine durchschnittliche Verlängerung der Lebenserwartung um drei Jahre. Mitglieder der Gruppe, denen das neue Medikament verschrieben wurde, berichteten über eine durchschnittliche Verlängerung der Lebenserwartung um vier Jahre.

Die erste Beobachtung deutet darauf hin, dass das Medikament wirkt. Es ist jedoch auch möglich, dass die Beobachtung auf Zufall beruht. Ein t-Test könnte verwendet werden, um festzustellen, ob die Ergebnisse signifikant und auf die gesamte Population anwendbar sind oder ob sie zufällig sind und nicht auf die Medikamentenintervention zurückzuführen sind.

Verwendung des t-Tests

Die Berechnung eines t-Tests erfordert drei grundlegende Datenwerte:

Die Differenz zwischen den Mittelwerten der einzelnen Datensätze, auch bekannt als die mittlere Differenz

Die Standardabweichung jeder Gruppe

Die Anzahl der Datenwerte jeder Gruppe

Der t-Test liefert zwei Werte als Ergebnis: den t-Wert und die Freiheitsgrade. Der t-Wert oder t-Score ist ein Verhältnis der Differenz zwischen den Mittelwerten der beiden Stichprobensätze und der Variation, die innerhalb der Stichprobensätze vorhanden ist.

Der Zähler ist die Differenz zwischen den Mittelwerten der beiden Stichprobensätze. Der Nenner ist die Variation, die innerhalb der Stichprobensätze besteht und die Streuung oder Variabilität misst.

Dieser berechnete t-Wert wird dann mit einem Wert verglichen, der aus einer Tabelle kritischer Werte, der sogenannten t-Verteilungstabelle, ermittelt wird. Höhere Werte weisen auf einen signifikanten Unterschied zwischen den beiden Stichprobensätzen hin. Ein kleinerer Wert bedeutet, dass eine Ähnlichkeit zwischen den beiden Stichprobensätzen besteht.

Freiheitsgrade beziehen sich auf die Werte in einer Studie, die die Freiheit haben, zu variieren. Sie sind wesentlich für die Beurteilung der Bedeutung und der Gültigkeit der Nullhypothese.

Die Berechnung dieser Werte hängt normalerweise davon ab, wie viele Datenpunkte in der Stichprobe vorhanden sind.1

Wichtig

Ein großer t-Score oder t-Wert zeigt an, dass die Gruppen unterschiedlich sind, während ein kleiner t-Score anzeigt, dass die Gruppen ähnlich sind.

Arten von t-Tests

Formel für den gepaarten t-Test

Der gepaarte oder korrelierte t-Test ist eine abhängige Testart, die durchgeführt wird, wenn die Stichproben aus zusammengehörigen Paaren ähnlicher Einheiten bestehen oder wenn wiederholte Messungen vorliegen.4

Beispielsweise kann es bestimmte Fälle geben, in denen dieselben Patienten wiederholt vor und nach Erhalt einer bestimmten Behandlung getestet werden. Jeder Patient dient als Kontrollstichprobe für sich selbst.

Diese Methode gilt auch für Fälle, in denen die Stichproben verwandt sind oder übereinstimmende Merkmale aufweisen, wie z. B. eine vergleichende Analyse mit Kindern, Eltern oder Geschwistern.

Die Formel zur Berechnung des t-Werts und der Freiheitsgrade für einen gepaarten t-Test lautet:

T=mean1−mean2s(diff)(n)wobei:mean1 und mean2=Die Durchschnittswerte jedes der Stichprobensätzes(diff)=Die Standardabweichung der Differenzen der gepaarten Datenwerte n=Die Stichprobengröße (die Anzahl der gepaarten Differenzen)n−1=Die Freiheitsgrade\begin{aligned}&T=\frac{\textit{mean}1 - \textit{mean}2}{\frac{s(\text{diff})}{\sqrt{(n)}}}\\&\textbf{wobei:}\\&\textit{mean}1\text{ und }\textit{mean}2=\text{Die Durchschnittswerte jedes der Stichprobensätze}\\&s(\text{diff})=\text{Die Standardabweichung der Differenzen der gepaarten Datenwerte}\\&n=\text{Die Stichprobengröße (die Anzahl der gepaarten Differenzen)}\\&n-1=\text{Die Freiheitsgrade}\end{aligned}T=(n)s(diff)mean1−mean2wobei:mean1 und mean2=Die Durchschnittswerte jedes der Stichprobensätzes(diff)=Die Standardabweichung der Differenzen der gepaarten Datenwerte n=Die Stichprobengröße (die Anzahl der gepaarten Differenzen)n−1=Die Freiheitsgrade

Formel für den t-Test bei gleicher Varianz (gepoolt)

Der t-Test bei gleicher Varianz ist unabhängig. Er wird verwendet, wenn die Anzahl der Stichproben in jeder Gruppe gleich ist oder die Varianz der beiden Datensätze ähnlich ist.3

Die Formel zur Berechnung des t-Werts und der Freiheitsgrade für einen t-Test bei gleicher Varianz lautet:

T-Wert=mean1−mean2(n1−1)×var12+(n2−1)×var22n1+n2−2×1n1+1n2wobei:mean1 und mean2=Durchschnittswerte jedesder Stichprobensätzevar1 und var2=Varianz jedes der Stichprobensätzen1 und n2=Anzahl der Datensätze in jedem Stichprobensatz\begin{aligned}&\text{T-Wert}=\frac{\textit{mean}1-\textit{mean}2}{\sqrt{\frac{(n1-1)\times\textit{var}1^2+(n2-1)\times\textit{var}2^2}{n1+n2-2}\times\frac{1}{n1}+\frac{1}{n2}}}\\&\textbf{wobei:}\\&\textit{mean}1 \text{ und } \textit{mean}2=\text{Durchschnittswerte jedes}\\&\text{der Stichprobensätze}\\&\textit{var}1\text{ und }\textit{var}2=\text{Varianz jedes der Stichprobensätze}\\&n1\text{ und }n2=\text{Anzahl der Datensätze in jedem Stichprobensatz}\end{aligned}T-Wert=n1+n2−2(n1−1)×var12+(n2−1)×var22×n11+n21mean1−mean2wobei:mean1 und mean2=Durchschnittswerte jedesder Stichprobensätzevar1 und var2=Varianz jedes der Stichprobensätzen1 und n2=Anzahl der Datensätze in jedem Stichprobensatz

und,

Freiheitsgrade=n1+n2−2wobei:n1 und n2=Anzahl der Datensätze in jedem Stichprobensatz\begin{aligned} &\text{Freiheitsgrade} = n1 + n2 - 2 \\ &\textbf{wobei:}\\ &n1 \text{ und } n2 = \text{Anzahl der Datensätze in jedem Stichprobensatz} \\ \end{aligned}Freiheitsgrade=n1+n2−2wobei:n1 und n2=Anzahl der Datensätze in jedem Stichprobensatz

Formel für den t-Test bei ungleicher Varianz

Der t-Test bei ungleicher Varianz wird unabhängig durchgeführt, wenn die Anzahl der Stichproben in jeder Gruppe unterschiedlich ist und die Varianzen der beiden Datensätze ebenfalls unterschiedlich sind. Dieser Test wird auch als Welch-t-Test bezeichnet.13

Die Formel zur Berechnung des t-Werts und der Freiheitsgrade für einen t-Test bei ungleicher Varianz lautet:

T-Wert=mean1−mean2(var1n1+var2n2)wobei:mean1 und mean2=Durchschnittswerte jedesder Stichprobensätzevar1 und var2=Varianz jedes der Stichprobensätzen1 und n2=Anzahl der Datensätze in jedem Stichprobensatz\begin{aligned}&\text{T-Wert}=\frac{mean1-mean2}{\sqrt{\bigg(\frac{var1}{n1}{+\frac{var2}{n2}\bigg)}}}\\&\textbf{wobei:}\\&mean1 \text{ und } mean2 = \text{Durchschnittswerte jedes} \\&\text{der Stichprobensätze} \\&var1 \text{ und } var2 = \text{Varianz jedes der Stichprobensätze} \\&n1 \text{ und } n2 = \text{Anzahl der Datensätze in jedem Stichprobensatz} \end{aligned}T-Wert=(n1var1+n2var2)mean1−mean2wobei:mean1 und mean2=Durchschnittswerte jedesder Stichprobensätzevar1 und var2=Varianz jedes der Stichprobensätzen1 und n2=Anzahl der Datensätze in jedem Stichprobensatz

und,

Freiheitsgrade=(var12n1+var22n2)2(var12n1)2n1−1+(var22n2)2n2−1wobei:var1 und var2=Varianz jedes der Stichprobensätzen1 und n2=Anzahl der Datensätze in jedem Stichprobensatz\begin{aligned} &\text{Freiheitsgrade} = \frac{ \left ( \frac{ var1^2 }{ n1 } + \frac{ var2^2 }{ n2 } \right )^2 }{ \frac{ \left ( \frac{ var1^2 }{ n1 } \right )^2 }{ n1 - 1 } + \frac{ \left ( \frac{ var2^2 }{ n2 } \right )^2 }{ n2 - 1}} \\ &\textbf{wobei:}\\ &var1 \text{ und } var2 = \text{Varianz jedes der Stichprobensätze} \\ &n1 \text{ und } n2 = \text{Anzahl der Datensätze in jedem Stichprobensatz} \\ \end{aligned}Freiheitsgrade=n1−1(n1var12)2+n2−1(n2var22)2(n1var12+n2var22)2wobei:var1 und var2=Varianz jedes der Stichprobensätzen1 und n2=Anzahl der Datensätze in jedem Stichprobensatz

Welchen t-Test verwenden

Das folgende Flussdiagramm kann bestimmen, welcher t-Test basierend auf den Eigenschaften der Stichprobensätze verwendet werden soll.

Die wichtigsten zu berücksichtigenden Punkte sind:

Die Ähnlichkeit der Stichprobenaufzeichnungen

Die Anzahl der Datenaufzeichnungen in jedem Stichprobensatz

Die Varianz jedes Stichprobensatzes

Beispiel für einen t-Test bei ungleicher Varianz

Angenommen, die diagonale Messung von Gemälden, die in einer Kunstgalerie eingehen, wird durchgeführt. Eine Gruppe von Stichproben umfasst 10 Gemälde, während die andere 20 Gemälde umfasst.

Die Datensätze mit den entsprechenden Mittelwert- und Varianzwerten sind wie folgt:

Liegt der Unterschied von 19,4 zu 21,6 allein am Zufall, oder gibt es Unterschiede in den Gesamtpopulationen aller in der Kunstgalerie eingegangenen Gemälde?

Wir stellen das Problem auf, indem wir die Nullhypothese annehmen, dass der Mittelwert zwischen den beiden Stichprobensätzen gleich ist, und führen einen t-Test durch, um zu prüfen, ob die Hypothese plausibel ist.

Da die Anzahl der Datenaufzeichnungen unterschiedlich ist (n1 = 10 und n2 = 20) und die Varianz ebenfalls unterschiedlich ist, werden der t-Wert und die Freiheitsgrade für den obigen Datensatz unter Verwendung der Formel für den t-Test bei ungleicher Varianz berechnet.

Der t-Wert beträgt -2,24787. Da das Minuszeichen beim Vergleich der beiden t-Werte ignoriert werden kann, beträgt der berechnete Wert 2,24787.

Der Freiheitsgradwert beträgt 24,38 und wird auf 24 reduziert (die Formeldefinition erfordert das Abrunden des Wertes auf die kleinstmögliche ganze Zahl).

Man kann ein Wahrscheinlichkeitsniveau (Alpha-Niveau, Signifikanzniveau, p) als Akzeptanzkriterium festlegen. In den meisten Fällen kann ein Wert von 5 % angenommen werden.

Unter Verwendung eines Freiheitsgradwerts von 24 und einem Signifikanzniveau von 5 % ergibt die t-Wert-Verteilungstabelle einen Wert von 2,064.

Der Vergleich dieses Werts mit dem berechneten Wert von 2,247 zeigt, dass der berechnete t-Wert auf einem Signifikanzniveau von 5 % größer ist als der Tabellenwert.

Daher ist es sicher, die Nullhypothese, dass es keinen Unterschied zwischen den Mittelwerten gibt, abzulehnen.

Die Ablehnung der Nullhypothese bedeutet, dass die Populationsmenge inhärente Unterschiede aufweist und diese nicht auf Zufall beruhen.

Wie wird die t-Verteilungstabelle verwendet?

Die t-Verteilungstabelle ist in einseitigen und zweiseitigen Formaten erhältlich. Das einseitige Format wird zur Bewertung von Fällen verwendet, die einen festen Wert oder Bereich mit einer klaren Richtung haben, entweder positiv oder negativ. Zum Beispiel: Wie hoch ist die Wahrscheinlichkeit, dass der Ausgabewert unter -3 bleibt oder mehr als sieben ergibt, wenn man mit einem Paar Würfel würfelt? Das zweiseitige Format wird für bereichsgebundene Analysen verwendet, z. B. wenn gefragt wird, ob die Koordinaten zwischen -2 und +2 fallen.

Was ist ein unabhängiger t-Test?

Die Stichproben von unabhängigen t-Tests werden unabhängig voneinander ausgewählt, wobei sich die Datensätze in den beiden Gruppen nicht auf dieselben Werte beziehen. Sie können eine Gruppe von 100 zufällig nicht verwandten Patienten umfassen, die in zwei Gruppen von jeweils 50 Patienten aufgeteilt werden. Eine der Gruppen wird zur Kontrollgruppe und erhält ein Placebo, während die andere Gruppe eine verschriebene Behandlung erhält. Dies stellt zwei unabhängige Stichprobengruppen dar, die nicht gepaart und nicht miteinander verwandt sind.

Was erklärt ein t-Test und wie wird er verwendet?

Ein t-Test ist ein statistischer Test, der verwendet wird, um die Mittelwerte zweier Gruppen zu vergleichen. Er wird häufig in Hypothesentests verwendet, um festzustellen, ob ein Prozess oder eine Behandlung einen Effekt auf die interessierende Population hat oder ob sich zwei Gruppen voneinander unterscheiden.