AI-United » Mathematik » Was ist der p-Wert?

Was ist der p-Wert?

Was ist der p-Wert?

Jeder Datenwissenschaftler muss auf diese Frage gestoßen sein: Was ist der p-Wert und wie nutzen wir ihn in unserer statistischen Analyse?

Mindestens eine Frage jedes Datenwissenschafts-Interviews ist nach dem p-Wert und dessen Zweck. In diesem Artikel werden wir also über den p-Wert reden: Kontext, Prozess und Zweck. Fehlinterpretationen und Missbrauch statistischer Tests, Konfidenzintervalle und statistischer Macht werden seit Jahrzehnten angeprangert, bleiben aber weit verbreitet. Da dieses Konzept eine hohe Aufmerksamkeit und Zeit erfordert, hat diese hohe kognitive Nachfrage zu einer Epidemie von Kurzschlussdefinitionen und Interpretationen geführt, die einfach falsch sind, manchmal katastrophal und doch dominieren diese Fehlinterpretationen einen Großteil der wissenschaftlichen Literatur.

Statistische Prüfung

In den meisten Anwendungen der statistischen Prüfung, ist eine Annahme im Modell eine Hypothese, dass ein bestimmter Effekt eine bestimmte Größe hat, und wurde für die statistische Analyse gezielt. Diese gezielte Annahme wird als Studien- oder Testhypothese bezeichnet  und die statistischen Methoden, mit denen sie bewertet wird, werden als statistische Hypothese-Tests bezeichnet. Meistens handelt es sich bei der angestrebten Effektgröße um einen „null“-Wert, der einen Null-Effekt darstellt (z.B. dass die Studienbehandlung im durchschnittlichen Ergebnis keinen Unterschied macht). In diesem Fall wird die Testhypothese als Nullhypothese bezeichnet. Dennoch ist es auch möglich, andere Effektgrößen zu testen. Wir können auch Hypothesen testen, dass der Effekt in einen bestimmten Bereich fällt oder nicht; zum Beispiel können wir die Hypothese testen, dass der Effekt nicht größer ist als eine bestimmte Menge. In diesem Fall wird die Hypothese als einseitige Hypothese bezeichnet.

Viele statistische Lehren und Praxis haben einen starken (und ungesunden) Fokus auf die Idee gerichtet, dass das Hauptziel einer Studie darin bestehen sollte, Nullhypothesen zu testen. In der Tat konzentrieren sich die meisten Beschreibungen statistischer Prüfung  nur auf die Prüfung von Nullhypothesen und das gesamte Thema wurde als „Null Hypothesis Significance Testing“ bezeichnet. Diese ausschließliche Fokussierung auf Nullhypothesen trägt zu einem Missverständnis von Tests bei. Zu dem Missverständnis kommt hinzu, dass viele Autoren die „Nullhypothese“ verwenden, um sich auf eine Testhypothese zu beziehen, obwohl diese Verwendung im Widerspruch zu anderen Autoren und zu gewöhnlichen englischen Definitionen von „null“ steht – wie statistische Verwendungen von „Bedeutung“ und „Vertrauen“.

Ein definiertes Ziel der statistischen Analyse ist eine Bewertung der Gewissheit oder Ungewissheit hinsichtlich der Größe eines Effekts. Wir bringen diese Gewissheit in Bezug auf „Wahrscheinlichkeiten“ von Hypothesen zum Ausdruck. Bei herkömmlichen statistischen Methoden bezieht sich „Wahrscheinlichkeit“ aber nicht auf Hypothesen, sondern auf Mengen, die hypothetische Frequenzen von Datenmustern unter einem vermuteten statistischen Modell sind. Diese Methoden werden also als frequentistische Methoden bezeichnet und die hypothetischen Frequenzen, die sie vorhersagen, werden als „Frequentistischer Wahrscheinlichkeitsbegriff“ bezeichnet, nicht als die Hypothese-Wahrscheinlichkeiten (Missverständnis).

P-Wert

Hypothetische Frequenz, p-Wert genannt, auch bekannt als die „beobachtete Bedeutungsebene“ für die Testhypothese. Die traditionelle Definition von p-Wert und statistischer Signifikanz drehte sich um Nullhypothesen und wir behandeln alle anderen Annahmen, die verwendet werden, um den p-Wert zu berechnen, als ob sie alle richtig wären. Da wir uns über diese Annahmen nicht sicher sind, betrachten wir eine allgemeinere Sicht des p-Wertes als statistische Zusammenfassung der Kompatibilität zwischen den beobachteten Daten und dem, was wir vorhersagen oder erwarten, zu sehen, als ob wir wüssten, dass das gesamte statistische Modell korrekt war.

Der Abstand zwischen den Daten und der Modellvorhersage wird anhand einer Teststatistik (z. B. einer t-Statistik oder einer Chi² Statistik) gemessen. Der p-Wert ist dann die Wahrscheinlichkeit, dass die gewählte Teststatistik mindestens so groß gewesen wäre wie ihr beobachteter Wert, wenn jede Modellannahme richtig wäre, einschließlich der Testhypothese. Diese Definition verkörpert einen entscheidenden Punkt, der in den traditionellen Definitionen verloren geht: Logischerweise testet der p-Wert alle Annahmen darüber, wie die Daten erzeugt wurden (das gesamte Modell), nicht nur die gezielte Hypothese, die getestet werden soll (wie eine Nullhypothese).

Wenn wir einen kleinen p-Wert erhalten, können wir sagen, dass die Daten ungewöhnlicher sind, wenn alle Annahmen stimmen; Aber ein sehr kleiner P-Wert sagt nichts über die Gültigkeit der Annahmen aus. Nehmen wir ein Beispiel, wenn ein p-Wert wegen des falschen Hypothese-Ziels sehr klein ist; Aber es kann wegen der Verletzung des Studienprotokolls klein sein, oder vielleicht wurde es mit falschen Daten analysiert. Und umgekehrt deutet ein großer p-Wert darauf hin, dass die Daten unter dem statistischen Modell nicht ungewöhnlich sind aber sie sagen uns nichts über die Gültigkeit und Annahmen des Modells. Es kann wegen der Verletzung des Studienprotokolls groß sein  oder vielleicht wurde es mit falschen Daten oder nur für Präsentationszwecke analysiert, um einen gültigen Punkt zu machen.

Ein guter Weg, um ein gutes statistisches Modell zu erstellen, ist die Berechnung von Konfidenzintervalle und heutzutage erfordern viele Zeitschriften Konfidenzintervalle.

Diese ausschließliche Fokussierung auf Nullhypothesen bei der Prüfung  trägt nicht nur zu einem Missverständnis von Tests und einer gegenseitigen Wertschätzung bei, sondern verschleiert auch die enge Beziehung zwischen p-Werten und Konfidenzintervallen sowie deren Schwächen.

Referenzen

Wann und wie kann der Signifikanztest sinnvoll genutzt werden?

Was bedeutet der p-Wert für die Aussagekraft?

Gern beantwortet Ihnen das Team von AI United alle möglichen Fragen per Email oder im Q&A Bereich.

AI-United-Redaktion

Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.