Entendiendo las Pruebas de Hipótesis: Intervalos de Confianza y Niveles de Confianza

Entendiendo las Pruebas de Hipótesis: Intervalos de Confianza y Niveles de Confianza

Autor: Jim Frost

En esta serie de artículos, muestro cómo las pruebas de hipótesis e intervalos de confianza trabajan centrándose en conceptos y gráficos en lugar de ecuaciones y números.

Anteriormente, he usado gráficos para mostrar lo que realmente significa el “nivel de significancia estadística”. En este artículo, voy a explicar ambos, los intervalos de confianza y los niveles de confianza, y la forma en que están estrechamente relacionados con los valores  P (valores de probabilidad) y niveles de significancia.

Un intervalo de confianza del 95% indica que 19 de 20 muestras (95%) de la misma población producirán intervalos de confianza que contienen el paramétro poblacional

Un intervalo de confianza del 95% indica que 19 de 20 muestras (95%) de la misma población producirán intervalos de confianza que contienen el paramétro poblacional

Cómo interpretar correctamente los intervalos de confianza y los niveles de confianza

Un intervalo de confianza es un rango de valores que es probable que contenga un parámetro de población desconocido. Si dibuja una muestra aleatoria muchas veces, un cierto porcentaje de los intervalos de confianza contendrá la media poblacional. Este porcentaje es el nivel de confianza.

Lo más frecuente es que usemos los intervalos de confianza para acotar la media o la desviación estándar, pero también se pueden obtener intervalos de confianza para los coeficientes de regresión, las proporciones, las tasas de ocurrencia (Poisson), y para las diferencias entre las poblaciones.

Así como es común mal interpretar  los valores de P, hay un error común acerca de cómo interpretar los intervalos de confianza. En este caso, el nivel de confianza no es la probabilidad de que un intervalo de confianza específico contenga el parámetro de la población.

El nivel de confianza representa la capacidad teórica del análisis para producir intervalos precisos si usted es capaz de evaluar muchos intervalos y conoce el valor del parámetro de la población. Para un nivel de confianza específico de un estudio, el intervalo o bien contiene el valor de la población o no lo contiene- no hay cabida para probabilidades distintas de 0 ó 1. Y usted no puede elegir entre estas dos posibilidades, porque usted no sabe el valor del parámetro de la población.

“El parámetro es una constante desconocida y ningún enunciado de probabilidad en relación con su valor se puede hacer.” -Jerzy Neyman, desarrollador original de intervalos de confianza.

Esto será más fácil de entender si después discutimos el siguiente gráfico. . .

Con esto en mente, ¿cómo interpretas los intervalos de confianza?

Los intervalos de confianza sirven como buenas estimaciones del parámetro de la población debido a que el procedimiento tiende a producir intervalos que contienen el parámetro. Los intervalos de confianza se componen de la estimación puntual (el valor más probable) y un margen de error alrededor de esa estimación puntual. El margen de error indica la cantidad de incertidumbre que rodea a la estimación de la muestra del parámetro de población.

En este orden de ideas, puede utilizar los intervalos de confianza para evaluar la precisión de la estimación de la muestra. Para una variable específica, un intervalo de confianza más estrecho [90 110] sugiere una estimación más precisa del parámetro de la población de un intervalo de confianza más amplio [50 150].

Intervalos de confianza y el margen de error

Pasemos a ver cómo representan los intervalos de confianza el margen de error. Para ello, vamos a utilizar las mismas herramientas que hemos estado usando para entender las pruebas de hipótesis. Voy a crear una distribución de muestreo utilizando parcelas (gráficas) de distribución de probabilidad, la distribución t, y la variabilidad en nuestros datos. Basaremos nuestro intervalo de confianza en el conjunto de datos de coste energético que hemos estado usando.

Cuando nos fijamos en los niveles de significancia, los gráficos exhiben una distribución muestral centrada en el valor de la hipótesis nula, y el  5% externo de la distribución en el área sombreada. Para los intervalos de confianza, tenemos que cambiar la distribución de muestreo de forma que se centre en la media de la muestra y la zona sombreada es el 95% del medio.

El área sombreada muestra el rango de los promedios muestrales que obtendría 95% de las veces usando nuestra media muestral como estimación puntual de la media poblacional. Este rango [267 394] es nuestro intervalo de confianza del 95%.

Usando el gráfico, es más fácil entender cómo un intervalo de confianza específico representa el margen de error, o la cantidad de incertidumbre, alrededor de la estimación puntual. La media de la muestra es el valor más probable de la media de la población dada la información que tenemos. Sin embargo, el gráfico muestra que no sería inusual en absoluto para otras muestras al azar procedentes de la misma población de la muestra obtener diferentes medias dentro del área sombreada. Estos otros “ promedios muestrales probables” todos sugieren diferentes valores para la media de la población. Por lo tanto, el intervalo representa la incertidumbre inherente que viene con el uso de datos de la muestra.

Puede utilizar estos gráficos para calcular probabilidades para valores específicos. Sin embargo, observe que no se puede colocar la media poblacional en el gráfico porque ese valor es desconocido. En consecuencia, no se puede calcular las probabilidades para la media de la población, ¡tal como dijo Neyman!

¿Por qué los valores P e intervalos de confianza están de acuerdo siempre sobre la significancia estadística?

Puede utilizar sea los valores de P o intervalos de confianza para determinar si sus resultados son estadísticamente significativos. Si una prueba de hipótesis entrega ambos, estos resultados estarán de acuerdo.

El nivel de confianza es equivalente a 1 – el nivel alfa. Por lo tanto, si su nivel de significancia es de 0,05, el nivel de confianza correspondiente es del 95%.

·       Si el valor  P es menor que su nivel de significancia (alfa), la prueba de hipótesis es estadísticamente significativa.

·       Si el intervalo de confianza no contiene el valor de la hipótesis nula, los resultados son estadísticamente significativos.

·       Si el valor P es menor que el de alfa, el intervalo de confianza no contendrá el valor de la hipótesis nula.

Para nuestro ejemplo, el valor P (0.031) es menor que el nivel de significancia (0,05), lo que indica que nuestros resultados son estadísticamente significativos. Del mismo modo, nuestro intervalo de confianza del 95% [267 394] no incluye la media hipótesis nula de 260 y dibujamos la misma conclusión.

Para entender por qué los resultados siempre están de acuerdo, recordemos cómo tanto el trabajan el nivel de significancia y nivel de confianza.

El nivel de significancia define a que distancia debe estar la media de la muestra de la hipótesis nula para que sea considerada estadísticamente significativa.

El nivel de confianza define la distancia y cuan cerca los límites de confianza están de la media de la muestra.

Tanto el nivel de significancia y el nivel de confianza definen una distancia de un límite a una media. ¿Adivinen qué? Las distancias en ambos casos ¡son exactamente la misma!

La distancia es igual al valor t crítico * error estándar de la media. Para nuestro ejemplo los datos de costos de la energía, la distancia resulta ser $ 63.57.

Imagínese esta discusión entre la hipótesis nula del promedio y el promedio de la muestra:

Hipótesis nula significa, prueba de hipótesis representativa: ¡Hola amigo! He descubierto que eres estadísticamente significativa porque ¡estás más de $ 63.57 lejos de mí!

Media de la muestra, intervalo de confianza representativo: En realidad, soy importante porque ¡usted está a más $ 63.57 lejos de mí!

¿Muy de acuerdo no están? Y, siempre van a estar de acuerdo, siempre y cuando se comparen los pares correctos de los valores P y los intervalos de confianza. Si se compara el par incorrecto, puede obtener resultados contradictorios, como se muestra por error común # 1 en este artículo.

Pensamientos finales

En los análisis estadísticos, tiende a haber un mayor enfoque en los valores de P y simplemente la detección de un efecto o una diferencia significativa. Sin embargo, un efecto estadísticamente significativo no es necesariamente significativo en el mundo real. Por ejemplo, el efecto podría ser demasiado pequeño para ser de alguna utilidad práctica.

Es importante prestar atención  tanto a la magnitud y a la precisión del efecto estimado. Es por eso que soy bastante aficionado a los intervalos de confianza. Ellos le permiten evaluar estas características importantes junto con la significancia estadística. Usted gustaría ver a un intervalo de confianza estrecho, donde el rango representa un efecto que es significativo en el mundo real.

Para más información sobre los intervalos de confianza, leer mi artículo donde los comparo a intervalos de tolerancia y los intervalos de predicción.

Si desea ver cómo hice la trama de distribución de probabilidad, por favor lea: Cómo crear una versión de la gráfica  t-Test para 1 muestra.

Originalmente publicado 2 de abril 2015, en el Blog de Minitab.

Las imágenes utilizadas son réplicas de las empleadas en el artículo original.


Original: Lunes 6 de Abril, 2015.

Leave a Reply

Your email address will not be published.