3 Pasos para un Mejor Análisis Estadístico

3 Pasos para un Mejor Análisis Estadístico

Usted trabaja en LEAN Six Sigma, ingeniería de calidad o similar. Le entregan un puñado de datos que son recolectados tras observar un problema.

Alguien le dice: “Haga una ANOVA y me platica qué pasa”.

Un momento.

Las herramientas no se seleccionan “por seleccionarlas”.

Antes es necesario, conveniente, que recuerde estas tres buenas prácticas de un analista sofisticado (un analista refinado):

1. Revise el sistema de medición: si los datos recolectados no son confiables, entonces el análisis tampoco.

2. ¿Cuál es la variable y qué tipo?  quizás la variable sea “peso”, pero esto no asegura que se mida como variable continua. Quizás quien diseño el sistema de medición decidió considerar la variable “peso” como un atributo, tipo pasa/no-pasa.

Aun cuando simple, esto ayudará a seleccionar adecuadamente herramientas estadísticas que en general se agrupan en función del tipo de variables:

  • Continuas
  • Atributos (proporciones-binarias, conteo)

3. Mantenga intimidad con los datos: tome unos minutos para revisar los datos de esta forma:

  • observe los valores
  • examine aspectos básicos como cantidad de observaciones
  • revise si hay datos faltantes
  • verifique que cuando se tabularon los datos el tipo de datos coincide
  • haga gráficas, varias para poder visualizar posibles: datos extremos, errores de digitación, patrones inusuales.

¿Cuáles gráficas utilizar para mantener intimidad con los datos?

 Una práctica común es comenzar de “lo general a lo específico”. Y en este enfoque hay tres gráficas que ayudan mucho:

– Histograma: permite ver sesgos, modalismos, curtósis

Pruebe usar historgramas generales (todos los datos); luego histogramas por grupos con variables categóricas

– Caja y Bigotes: refuerza la observación de sesgo, además de permitir ver posibles valores “atípicos”, y permite tener una primera impresión de dispersión al calcular el rango total

Igualmente, haga una gráfico de caja y bigote general, y luego otro por grupos.

– Gráfica de puntos individuales: al pasar de lo general a lo específico, la gráfica de puntos individuales permite entender si ciertos puntos se presentan condicionados a determinadas situaciones; para esto usar herramientas como “Identificación de variables” en Minitab Statistical Software es muy útil y práctico.

Ejemplo:

Este es un ejemplo elaborado con datos del archivo originales del archivo EJA_cal.mtw, disponible en la versión Minitab 17, como parte del conjunto de datos de muestra de Minitab Statistical Software. Las versiones de Minitab cambian regularmente por lo que estos archivos podrían no estar disponibles.

Variable: faltas (faltante medido en milímetro a partir de un punto de referencia cero, 0).

Tipo: Continua

Variable Categórica: Turno

Nótese como un histograma por grupos ayuda a visualizar que los datos del turno 1, se acumulan principalmente entre 0 y 1,5; igualmente, la gráfica de cajas y bigotes en grupos, muestra que un valor extraño está presente en turno 1. La gráfica de puntos individuales refuerza la visualización.

Análisis gráfico en Minitab 17

Saltar de forma precipitada a “hacer cálculos” puede no ser lo más sabio. Mantenga intimidad con los datos desde el principio.

Para más información sobre capacitación especializada en análisis de datos usando Minitab, consulte a Blackberry&Cross. http://contactenos.blackberrycross.com

Artículo actualizado en Marzo, 2022.


Original: Domingo 12 de Abril, 2015.

Leave a Reply

Your email address will not be published.