Visualización y Control Estadístico

Visualización y Control Estadístico

El Desafío

Grandes cantidades de datos (estas épocas del “Big Data”). Tantos datos que algunas veces, quizás más de la que nos gustaria admitir, no tenemos buena información.

Es un desafío: administrar escenarios complejos de datos e información.

No es un asunto de “tal vez algún día sea necesario”. Ese día llegó hace mucho, y si su empresa no está sacando provecho de los datos, para convertirlos en información, está, como decirlo: al menos atrasada.

Curiosamente, ya no se puede alegar aquello de “eso es para las empresas grandes”. Hoy en día un emprededor solitario, una pequeña empresa (miPYME), y claro, las grandes corporaciones, tienen a la mano herramientas para hacer frente a este desafío.

DMP

El DMP no es una colección de herramientas y software para hacer “algo” con los datos: el propósito principal es entender cómo el flujo de gestión de procesos genera datos y cómo esos datos pueden potenciar el negocio.

Tras diseñar una estrategia de administración de datos (DMP, Data Management Plan por sus siglas en inglés), la empresa puede tomar datos para entender mejor el negocio, la experiencia del cliente (CX, Customer Experience), hacer minería de datos (Data Mining).

Es posible que los datos ayuden tareas como:

– descubrimiento de oportunidades y riesgos

– monitoreo y control de procesos y variables críticas

– visualización ilustrativa de datos

– entre otras.

Visualización de datos Vs. Control Estadístico de Proceso

“Una imagen vale más que mil palabras”. Bien eso depende de la imagen, y de la capacidad de interpretación de quién ve, o estudia, esa imagen.

En general, tratar de explicar datos con verbo, mejora cuando se utilizan ilustraciones.

Esas ilustraciones del comportamiento específico de los datos, es a lo que llamamos “Visualización de Datos” (Data Visualization, en inglés).

SAS menciona sobre Visualización de Datos: *

“La visualización de datos es la presentación de los datos en un formato pictórico o gráfico. Permite a los tomadores de decisiones ver la analítica presentada  visualmente, para que puedan comprender conceptos difíciles o identificar nuevos patrones.”

Los datos pueden provenir de múltiples fuentes, y resulta interesante entender mejor el fenómeno por medio de los datos.

La visualización puede ser utilizada para entender el comportamiento en términos de:

– Series de tiempo: muy útil para entender datos de eventos que suceden en momentos específicos, como la demanda de un producto o servicio, sismos, precipitaciones,accidentes, etc.

– Concentración: algunas veces llamados diagramas de “sarampion”, que con la ayuda de sistemas de coordenadas (sea personalizadas o geográficas), permiten ver la concentración de eventos en zonas especificas de una ciudad, un producto, un cuerpo.

– Frecuencia y distribución: gráficas ilustrativas más tradicionales como gráficas de pastel para porcentajes, de barras, de líneas, que ayudan a entender la frecuencia con la que sucede un evento y su distribución.

-Infográficos:es la convergencia de diseño y visualización de datos de forma tal que facilite aun más la comprensión de patrones, comunicación y relaciones.

 Y las opciones en gráficas de visualización son mútliples. En general, mucho de lo que la estadística descriptiva nos ha enseñado por años y ahora toma más fuerza con el potenciamiento que nuevas tecnologías ponen a nuestra disposición.

SPC: Control Estadístico de Procesos

El Control Estadístico de Procesos es parte de las técnicas de ingeniería de calidad.

 .

ASQ menciona: *

“Podría decirse que la herramienta de SPC más exitosa es el gráfico de control, desarrollado originalmente por Walter Shewhart a principios de 1920. Un gráfico de control que ayuda a registrar los datos y le permite ver cuándo, por ejemplo, una observación es muy alta o baja en comparación con el rendimiento del proceso “típico”, y se produce un evento inusual.

Desde principios del siglo XX, la ingeniería de calidad descubrió el poder de entender la variabilidad de los procesos, y mostrarla en un formato gráfico. Esos gráficos han sido llamados “gráficos de control”.

Un gráfico de control logra una ilustración del comportamiento de la variabilidad y aplica conocimiento estadístico para identificar patrones, agrupaciones y distribuciones que podrían estar asociadas con causas de variación asignable.

Los gráficos de control si bien ilustran, están diseñados para entender, monitorear y controlar la variación de un fenómeno (una variable).

Hay gran variedad de gráficas de control. PQ Systems define un gráfico de control como: *

“Un gráfico de control es una representación gráfica de una característica de un proceso, que muestra valores trazados de algunos estadísticos, con una línea central, y uno o dos límites de control. Se utiliza para determinar si un proceso ha estado operando en el control estadístico y es una ayuda para mantener el control estadístico.”

Y PQ Systems continua:

Los gráficos de control son la mejor manera de aprender cómo un proceso se está ejecutando.

Se utilizan para reducir la posibilidad de hacer uno de los dos tipos de errores:

Sobre-Control: A lo largo de control también llamado un error de tipo I, esto se refiere a ajustar el proceso cuando no se ha producido nada fuera de lo común.

Sub-Control: También se llama un error de tipo II, esto se refiere a la falta de ajuste del proceso cuando se ha producido algo fuera de lo común

Como notará los gráficos de control son parte también de la visualización de datos, pero con “esteroides”: Potenciados por análisis estadístico para entendimiento de la variabilidad.

Visualización de Datos Vs. Gráficos de Control 

Un ejemplo podría ayudar a entender mejor cómo la visualización de datos y el SPC (Control Estadístico de Procesos) pueden ayudar a su empresa-

Para efectos de este ejemplo utilizaremos dos herramientas:

Power BI: una herramienta de Microsoft, incluida en Office 365**, y diseñada para visualización de datos

Minitab Statistical Software: software especializado en análisis estadístico, desarrollado por Minitab Inc.

La variable bajo estudio

La variable bajo estudio será llamada: Magnitud Promedio

En este caso, “Magnitud” es una variable continua. tomada de forma aleatoria desde un proceso repetitivo que produce el mismo producto.

La variable Magnitud se estudio durante un mes de 31 días, y era posible que en algunos de los días se hiciesen más de una medición.

Por esa razón se selección como variable a graficar: Magnitud Promedio.

Magnitud en Power BI

Utilizando Power BI se pueden hacer mútliples gráficas.

La siguiente gráfica es una gráfica de promedio de Magnitud por día.

Nótese cómo es posible distinguir puntos en los que la magnitud es mayor o menor, y en general una muy buena ilustración del comportamiento.

Además, PowerBI permite que la gráfica sea interactiva, es decir, no es una imagen estática.

Power BI es muy adecuado para publicar las gráficas a nivel web, ya que permite generar un código HTML incrustable.

La gráfica a continuación ilustra el comportamiento de la variable “magnitud promedio”, creado en Power BI e incrustado como HTML en este artículo.

Magnitud en Minitab Statistical Software

Minitab Statistical Software, en el menú de Gráficos de Control, facilita la construcción de gráficos X-Barra (gráficos para el promedio de observaciones) entre muchas más.

La gráfica de control X-barra de Magnitud, ha graficado los promedios de magnitud por día. Además, se han calculado límites de control superior, central e inferior que permiten entender si un comportamiento de mangnitud en un día específico, podría estar asociado a causas asignables de variabilidad.

Nótese como los limites de control cambian para días, dada que la cantidad de observaciones es diferente para cada día.

Los puntos fuera de control no necesariamente son aquellos que parecen “más altos o bajos” a simple vista.

Un gráfico de control es visualización potenciada por estadística. 

Minitab 17, versión utilizada para este ejemplo, no genera un código HTML incrustable; pero, es posible guardar las gráficas en formatos como JPG, PNG y otros, que en luego puede usarse en diseño web.

Más provecho a sus datos 

Diseñe su plan de manejo de datos. Explore herramientas como Power BI, Minitab y SQCpack.

Sáquele más provecho a sus datos al entender cómo no solo es un asunto de ilustrar: es entender.

 * Traducción realizada por Blackberry&Cross.

** No todas las versiones de Office 365 tienen acceso a Power BI. Para más información contáctenos.


Original: Miércoles 23 de Marzo, 2016.

Leave a Reply

Your email address will not be published.