Publicly Available
August 5, 2016
Abstract
Zusammenfassung Der p -Wert wird vielfach als Goldstandard für Inferenzschlüsse angesehen. Zur Validierung statistischer Zusammenhänge hat sich die Konvention herausgebildet, möglichst geringe p -Werte einzufordern und bei Werten unterhalb gewisser Schwellen (z. B. 0,05) von statistisch signifikanten Ergebnissen zu sprechen. Häufig wird der p -Wert auch als Irrtumswahrscheinlichkeit bezeichnet. Beide Begriffe sind problematisch, da sie Missverständnissen Vorschub leisten. Hinzu kommt, dass das sog. p-hacking , d. h. die gezielte Suche nach Auswertungen, die zu statistisch signifikanten Ergebnissen führen, Verzerrungen hervorrufen und die Rate falscher Entdeckungen ( false discovery rate ) erhöhen kann. Fehlinterpretationen des p -Wertes und auswertungsbedingte Verzerrungen wurden über die Jahrzehnte hinweg immer wieder kritisch diskutiert. In der empirischen Forschung scheinen sie aber persistent zu sein und in den letzten Jahren wurde die p -Wert-Debatte wegen der Nicht-Reproduzierbarkeit vieler Studien zunehmend intensiv geführt. Angesichts der über die Disziplinen verstreuten und oft auf Einzelaspekte abzielenden Literatur zur p -Wert-Problematik beschreibt dieser Methodenkommentar systematisch die wichtigsten Probleme und diskutiert die entsprechenden Lösungsvorschläge.