p-Wert

P-Wert: Was er ist, wie man ihn berechnet, und Beispiele

Was ist der P-Wert?

Ein P-Wert (Wahrscheinlichkeitswert) ist eine Zahl, die die Wahrscheinlichkeit beschreibt, die beobachteten Daten unter der Nullhypothese eines statistischen Tests zu erhalten.

Der P-Wert dient als Alternative zu Ablehnungspunkten, um das kleinste Signifikanzniveau anzugeben, bei dem die Nullhypothese abgelehnt würde. Ein kleinerer P-Wert bedeutet stärkere Evidenz für die Alternativhypothese.

Wichtige Erkenntnisse

Ein P-Wert ist eine statistische Messgröße, die verwendet wird, um eine Hypothese anhand beobachteter Daten zu validieren.
Ein P-Wert misst die Wahrscheinlichkeit, die beobachteten Ergebnisse zu erhalten, unter der Annahme, dass die Nullhypothese wahr ist.
Je niedriger der P-Wert, desto größer die statistische Signifikanz der beobachteten Differenz.
Ein P-Wert von 0,05 oder niedriger wird allgemein als statistisch signifikant angesehen.
Der P-Wert kann als Alternative zu – oder zusätzlich zu – vorgewählten Konfidenzniveaus für Hypothesentests dienen.
Jessica Olah / Investopedia

Wofür wird der P-Wert verwendet?

Der P-Wert wird häufig verwendet, um die Glaubwürdigkeit von Studien durch Wissenschaftler und Medizinforscher sowie von Berichten staatlicher Behörden zu untermauern. Beispielsweise legt das U.S. Census Bureau fest, dass jede Analyse mit einem P-Wert größer als 0,10 von einer Aussage begleitet werden muss, dass der Unterschied nicht statistisch von Null verschieden ist. Das Census Bureau hat auch Standards, die festlegen, welche P-Werte für verschiedene Veröffentlichungen akzeptabel sind.1

Wie wird der P-Wert berechnet?

P-Werte werden in der Regel mit statistischer Software oder P-Wert-Tabellen berechnet, basierend auf der angenommenen oder bekannten Wahrscheinlichkeitsverteilung der spezifisch getesteten Statistik. Während der Stichprobenumfang die Zuverlässigkeit der beobachteten Daten beeinflusst, beinhaltet der P-Wert-Ansatz beim Hypothesentest speziell die Berechnung des P-Werts auf Grundlage der Abweichung zwischen dem beobachteten Wert und einem gewählten Referenzwert, gegeben die Wahrscheinlichkeitsverteilung der Statistik. Ein größerer Unterschied zwischen den beiden Werten entspricht einem niedrigeren P-Wert.

Mathematisch wird der P-Wert mittels Integralrechnung aus der Fläche unter der Wahrscheinlichkeitsverteilungskurve für alle Werte der Statistik berechnet, die mindestens so weit vom Referenzwert entfernt sind wie der beobachtete Wert, relativ zur Gesamtfläche unter der Wahrscheinlichkeitsverteilungskurve. Standardabweichungen, die die Streuung der Datenpunkte um den Mittelwert quantifizieren, sind bei dieser Berechnung von zentraler Bedeutung.

Die Berechnung eines P-Werts variiert je nach Art des durchgeführten Tests. Die drei Testtypen beschreiben die Position auf der Wahrscheinlichkeitsverteilungskurve: linksseitiger Test, rechtsseitiger Test oder zweiseitiger Test. In jedem Fall spielen die Freiheitsgrade eine entscheidende Rolle bei der Bestimmung der Form der Verteilung und somit bei der Berechnung des P-Werts.

Kurz gesagt: Je größer der Unterschied zwischen zwei beobachteten Werten, desto unwahrscheinlicher ist es, dass der Unterschied auf einfachen Zufall zurückzuführen ist, und dies spiegelt sich in einem niedrigeren P-Wert wider.

Welche Bedeutung hat ein P-Wert?

Der P-Wert-Ansatz beim Hypothesentest verwendet die berechnete Wahrscheinlichkeit, um zu bestimmen, ob es Evidenz gibt, die Nullhypothese abzulehnen. Diese Bestimmung hängt stark von der Teststatistik ab, die die für die getestete Hypothese relevanten Informationen aus der Stichprobe zusammenfasst. Die Nullhypothese, auch als Vermutung bekannt, ist die anfängliche Behauptung über eine Grundgesamtheit (oder einen datengenerierenden Prozess). Die Alternativhypothese gibt an, ob sich der Populationsparameter vom Wert des in der Vermutung angegebenen Populationsparameters unterscheidet.

In der Praxis wird das Signifikanzniveau im Voraus festgelegt, um zu bestimmen, wie klein der P-Wert sein muss, um die Nullhypothese abzulehnen. Da verschiedene Forscher bei der Untersuchung einer Frage unterschiedliche Signifikanzniveaus verwenden, kann es für einen Leser manchmal schwierig sein, Ergebnisse aus zwei verschiedenen Tests zu vergleichen. P-Werte bieten eine Lösung für dieses Problem.

Wichtig

So interpretiert man den P-Wert: Selbst ein niedriger P-Wert ist nicht unbedingt ein Beweis für statistische Signifikanz, da immer noch die Möglichkeit besteht, dass die beobachteten Daten auf Zufall beruhen. Nur wiederholte Experimente oder Studien können bestätigen, ob ein Zusammenhang statistisch signifikant ist.

Angenommen, eine Studie, die die Renditen zweier bestimmter Vermögenswerte vergleicht, wurde von verschiedenen Forschern durchgeführt, die dieselben Daten, aber unterschiedliche Signifikanzniveaus verwendeten. Die Forscher könnten zu gegensätzlichen Schlussfolgerungen gelangen, ob sich die Vermögenswerte unterscheiden.

Wenn ein Forscher ein Konfidenzniveau von 90 % und der andere ein Konfidenzniveau von 95 % verwendet hätte, um die Nullhypothese abzulehnen, und wenn der P-Wert des beobachteten Unterschieds zwischen den beiden Renditen 0,08 betragen hätte (entsprechend einem Konfidenzniveau von 92 %), dann hätte der erste Forscher festgestellt, dass die beiden Vermögenswerte einen statistisch signifikanten Unterschied aufweisen, während der zweite keinen statistisch signifikanten Unterschied zwischen den Renditen festgestellt hätte.

Um dieses Problem zu vermeiden, könnten die Forscher den P-Wert des Hypothesentests angeben und es den Lesern überlassen, die statistische Signifikanz selbst zu interpretieren. Dies wird als P-Wert-Ansatz beim Hypothesentest bezeichnet. Unabhängige Beobachter könnten den P-Wert notieren und selbst entscheiden, ob dies einen statistisch signifikanten Unterschied darstellt oder nicht.

Beispiel für einen P-Wert

Ein Anleger behauptet, dass die Performance seines Anlageportfolios der des Standard & Poor’s (S&P) 500 Index entspricht. Um dies zu überprüfen, führt der Anleger einen zweiseitigen Test durch.

Die Nullhypothese besagt, dass die Renditen des Portfolios den Renditen des S&P 500 über einen bestimmten Zeitraum entsprechen, während die Alternativhypothese besagt, dass die Renditen des Portfolios und die Renditen des S&P 500 nicht gleich sind – wenn der Anleger einen einseitigen Test durchgeführt hätte, würde die Alternativhypothese besagen, dass die Renditen des Portfolios entweder niedriger oder höher sind als die Renditen des S&P 500.

Der P-Wert-Hypothesentest verwendet nicht unbedingt ein vorgewähltes Konfidenzniveau, bei dem der Anleger die Nullhypothese, dass die Renditen gleich sind, zurückweisen sollte. Stattdessen liefert er ein Maß dafür, wie viel Evidenz es gibt, die Nullhypothese abzulehnen. Je kleiner der P-Wert, desto größer die Evidenz gegen die Nullhypothese.

Wenn der Anleger also feststellt, dass der P-Wert 0,001 beträgt, gibt es starke Evidenz gegen die Nullhypothese, und der Anleger kann zuversichtlich schlussfolgern, dass die Renditen des Portfolios und die Renditen des S&P 500 nicht äquivalent sind.

Obwohl dies keine genaue Schwelle liefert, wann der Anleger die Nullhypothese akzeptieren oder ablehnen sollte, hat es doch einen weiteren sehr praktischen Vorteil. Die P-Wert-Hypothesentestung bietet eine direkte Möglichkeit, das relative Vertrauen zu vergleichen, das der Anleger bei der Auswahl zwischen verschiedenen Arten von Anlagen oder Portfolios im Vergleich zu einer Benchmark wie dem S&P 500 haben kann.

Beispielsweise kann der Anleger bei zwei Portfolios, A und B, deren Performance mit P-Werten von 0,10 bzw. 0,01 vom S&P 500 abweicht, viel sicherer sein, dass Portfolio B mit einem niedrigeren P-Wert tatsächlich konsistent abweichende Ergebnisse zeigen wird.

Ist ein P-Wert von 0,05 signifikant?

Ein P-Wert von weniger als 0,05 gilt typischerweise als statistisch signifikant, in diesem Fall sollte die Nullhypothese abgelehnt werden. Ein P-Wert größer als 0,05 bedeutet, dass die Abweichung von der Nullhypothese nicht statistisch signifikant ist, und die Nullhypothese wird nicht abgelehnt.

Was bedeutet ein P-Wert von 0,001?

Ein P-Wert von 0,001 zeigt an, dass, wenn die getestete Nullhypothese tatsächlich wahr wäre, eine Wahrscheinlichkeit von 1 zu 1.000 bestünde, Ergebnisse zu beobachten, die mindestens so extrem sind. Dies führt den Beobachter dazu, die Nullhypothese abzulehnen, da entweder ein äußerst seltenes Datenergebnis beobachtet wurde oder die Nullhypothese falsch ist.

Wie kann man den P-Wert verwenden, um zwei verschiedene Ergebnisse eines Hypothesentests zu vergleichen?

Wenn Sie zwei verschiedene Ergebnisse haben, eines mit einem P-Wert von 0,04 und eines mit einem P-Wert von 0,06, wird das Ergebnis mit einem P-Wert von 0,04 als statistisch signifikanter angesehen als das mit einem P-Wert von 0,06. Über dieses vereinfachte Beispiel hinaus könnten Sie einen P-Wert von 0,04 mit einem P-Wert von 0,001 vergleichen. Beide sind statistisch signifikant, aber das Beispiel mit 0,001 liefert einen noch stärkeren Fall gegen die Nullhypothese als das mit 0,04.