El valor P se utiliza en todas las estadísticas, desde pruebas t hasta análisis de regresión. Todos saben que usted usa los valores de P para determinar la significancia estadística en una prueba de hipótesis. De hecho, los valores de P a menudo determinan qué estudios se publican y qué proyectos obtienen financiación.
A pesar de ser tan importante, el valor P es un concepto resbaladizo que las personas a menudo interpretan incorrectamente. ¿Cómo interpretas los valores de P?
En esta publicación, le ayudaré a comprender los valores de P de una manera más intuitiva y a evitar una interpretación errónea muy común que puede costarle dinero y credibilidad.
¿Cuál es la hipótesis nula en las pruebas de hipótesis?
Científico que realiza un experimento para comprender los valores de P, primero debe comprender la hipótesis nula.
En cada experimento, hay un efecto o diferencia entre los grupos que los investigadores están probando. Podría ser la efectividad de un nuevo medicamento, material de construcción u otra intervención que tenga beneficios. Desafortunadamente para los investigadores, siempre existe la posibilidad de que no haya ningún efecto, es decir, que no haya diferencia entre los grupos. Esta falta de diferencia se llama hipótesis nula, que es esencialmente la posición que tomaría un abogado del diablo al evaluar los resultados de un experimento.
Para ver por qué, imaginemos un experimento para un medicamento que sabemos que es totalmente ineficaz. La hipótesis nula es cierta: no hay diferencia entre los grupos experimentales a nivel de población.
A pesar de que la nula es cierta, es completamente posible que haya un efecto en los datos de la muestra debido a un error de muestreo aleatorio. De hecho, es extremadamente improbable que los grupos de muestra sean exactamente iguales al valor de la hipótesis nula. En consecuencia, la posición del abogado del diablo es que la diferencia observada en la muestra no refleja una verdadera diferencia entre las poblaciones.
¿Qué son los valores P?
Los valores P evalúan qué tan bien los datos de la muestra respaldan el argumento del abogadodel diablo de que la hipótesis nula es cierta. Mide qué tan compatibles son sus datos con la hipótesis nula. ¿Qué tan probable es el efecto observado en los datos de su muestra si la hipótesis nula es verdadera?
Valores altos de P: es probable que sus datos tengan un valor nulo verdadero.
Valores bajos de P: sus datos son poco probables con un valor nulo verdadero.
Un valor P bajo sugiere que su muestra proporciona evidencia suficiente de que puede rechazar la hipótesis nula para toda la población.
¿Cómo interpretas los valores P?
En términos técnicos, un valor P es la probabilidad de obtener un efecto al menos tan extremo como el de los datos de la muestra, suponiendo la verdad de la hipótesis nula.
Por ejemplo, suponga que un estudio de vacuna produjo un valor de P de 0.04. Este valor de P indica que si la vacuna no tuvo efecto, obtendría la diferencia observada o más en el 4% de los estudios debido a un error de muestreo aleatorio.
Los valores P abordan solo una pregunta: ¿qué tan probable es su información, suponiendo una hipótesis nula verdadera? No mide el apoyo a la hipótesis alternativa. Esta limitación nos lleva a la siguiente sección para cubrir una interpretación errónea muy común de los valores de P.
Los valores P NO son la probabilidad de cometer un error
Las interpretaciones incorrectas de los valores de P son muy comunes. El error más común es interpretar un valor P como la probabilidad de cometer un error al rechazar una hipótesis nula verdadera (un error de Tipo I).
Hay varias razones por las cuales los valores de P no pueden ser la tasa de error.
Primero, los valores de P se calculan con base en los supuestos de que el valor nulo es verdadero para la población y que la diferencia en la muestra es causada por casualidad. En consecuencia, los valores de P no pueden decirle la probabilidad de que el valor nulo sea verdadero o falso porque es 100% verdadero desde la perspectiva de los cálculos.
En segundo lugar, si bien un valor P bajo indica que es poco probable que sus datos supongan un valor nulo verdadero, no puede evaluar cuál de los dos casos en competencia es más probable:
- El nulo es cierto pero su muestra fue inusual.
- El nulo es falso.
Determinar qué caso es más probable requiere conocimiento del área temática y estudios replicados.
Volvamos al estudio de la vacuna y comparemos la forma correcta e incorrecta de interpretar el valor P de 0.04:
Correcto: suponiendo que la vacuna no tuvo efecto, obtendría la diferencia observada o más en el 4% de los estudios debido a un error de muestreo aleatorio.
Incorrecto: si rechaza la hipótesis nula, existe un 4% de posibilidades de que esté cometiendo un error.
Para ver una representación gráfica de cómo funcionan las pruebas de hipótesis, vea mi publicación: Comprender las pruebas de hipótesis: niveles de significancia y valores de P.
¿Cuál es la verdadera tasa de error?
¿Piensa que esta diferencia de interpretación es simplemente una cuestión de semántica, y solo importante para los estadísticos exigentes? Piensa otra vez. Es importante para usted-
Si un valor de P no es la tasa de error, ¿cuál es la tasa de error? (¿Puedes adivinar hacia dónde se dirige esto ahora?)
Sellke et al. * Han estimado las tasas de error asociadas con diferentes valores de P. Si bien la tasa de error precisa depende de varios supuestos (que discuto aquí), la tabla los resume para supuestos intermedios.
Valor P
Caso 1: Valor P de 0,05
Probabilidad de rechazar incorrectamente una hipótesis nula verdadera: 0,05
Entonces la probabilidad de incorrectamente rechazar la hipótesis nula es al menos el 23% (y típicamente cerca del 50%)
Caso 2: Valor P de 0,01
Entonces la probabilidad de incorrectamente rechazar la hipótesis nula al menos 7% (y típicamente cerca del 15%)
¿Le sorprenden las tasas de error más altas en esta tabla? Desafortunadamente, la interpretación errónea común de los valores de P como la tasa de error crea la ilusión de una evidencia sustancialmente mayor contra la hipótesis nula que la justificada. Como puede ver, si basa una decisión en un solo estudio con un valor de P cercano a 0.05, la diferencia observada en la muestra puede no existir a nivel de la población. ¡Eso puede ser costoso!
Ahora que sabe cómo interpretar los valores de P, lea mis cinco pautas sobre cómo usar los valores de P y evitar errores.
¡También puede leer mi refutación a una revista académica que realmente prohibió los valores de P!
En agosto de 2015 se publicó un emocionante estudio sobre la reproducibilidad de los resultados experimentales. Este estudio destaca la importancia de comprender la verdadera tasa de error. Para obtener más información, lea la publicación de mi blog: Valores P y la replicación de experimentos.
¡La Asociación Americana de Estadística habla sobre cómo usar los valores p!
* Thomas SELLKE, M. J. BAYARRI y James O. BERGER, Calibración de valores p para probar hipótesis nulas precisas, The American Statistician, febrero de 2001, vol. 55, N ° 1
Este artículos es original de Minitab Inc. Blackberry&Cross es aliado de Minitab.
Fuente: https://blog.minitab.com/blog/adventures-in-statistics-2/how-to-correctly-interpret-p-values
Adaptación al español: Blackberry&Cross
Original: Miércoles 31 de Diciembre, 1969.
Leave a Reply