Recortar los Árboles de Decisión para Crear Papel: Un Ejercicio Práctico de Machine Learning y el Análisis de la Causa Raíz

Recortar los Árboles de Decisión para Crear Papel: Un Ejercicio Práctico de Machine Learning y el Análisis de la Causa Raíz

A medida que recopilamos más y más datos de observación de nuestros procesos, es posible que necesitemos nuevas herramientas para proporcionar información significativa sobre esta información. Puede agregar técnicas modernas de aprendizaje automático junto con herramientas estadísticas tradicionales para analizar, mejorar y controlar sus procesos.

No se preocupe si no está familiarizado con el aprendizaje automático y los árboles de clasificación y regresión (CART). Te guiaré por un ejemplo a continuación y luego te daré instrucciones paso a paso.

Encontrar la causa raíz de la variación excesiva en un proceso de blanqueo de pulpa

Puede detectar rápidamente la causa raíz de una condición de proceso fuera de control o fuera de especificación utilizando los métodos de aprendizaje automático basados en árbol en Salford Predictive Modeler (SPM) de Minitab junto con gráficos de control tradicionales.

Considere la posibilidad de un fabricante de papel que necesita utilizar los datos del proceso actual para determinar qué factores están contribuyendo a la variación excesiva en el proceso de blanqueo de la pulpa. El gráfico de un individuo creado en Minitab indica que el proceso es muy inestable, lo que a su vez genera una tasa de defectos inaceptable.

Para comenzar a ver la causa raíz de la excesiva variabilidad en este proceso, puede comenzar con una Regresión logística binaria en Minitab, donde la variable de respuesta es uno si el punto cae fuera del límite de control inferior y cero de lo contrario. Desafortunadamente, para estos datos, los patrones locos en los gráficos residuales a continuación indican que el modelo de regresión logística binaria puede no ser adecuado.

El enfoque CART

CART es un algoritmo de árbol de decisiones que funciona al crear un conjunto de reglas de sí / no que dividen la variable de respuesta (Y) en particiones en función de la configuración del predictor (X). Al utilizar la función CART en SPM, veo que una de mis variables de predicción, Producción, es un gran contribuyente a un punto que cae fuera del límite de control inferior.

Si la tasa de producción es <= 91.76, entonces la probabilidad estimada de que el proceso esté fuera de control es relativamente alta (33%). Si la tasa de producción es> 91.76, entonces es probable que el proceso esté en control estadístico.

El gráfico de Minitab a continuación explica por qué funciona esta regla. El modelo CART encuentra la línea vertical correspondiente a la tasa de producción que mejor separa la Respuesta = 0 (en control) del grupo Respuesta = 1 (fuera de control).

Puedo seguir creciendo el árbol CART para eventualmente encontrar más causas de la excesiva variabilidad en este proceso. Una vez que reduje el problema a las pocas X vitales, puedo implementar controles para reducir la posibilidad de que el proceso pierda el control, lo que da como resultado la mejora del proceso que se muestra en la Tabla de Individuos de Minitab con etapas que se muestra a continuación.

El enfoque en el análisis y las decisiones basadas en datos dentro de la mayoría de las organizaciones no debería representar una amenaza. Es una gran oportunidad para todos nosotros. La experiencia en el análisis de datos no solo es valiosa para su trabajo. Se está volviendo crucial. Considere aumentar su kit actual de herramientas de análisis con algunas herramientas adicionales de aprendizaje automático desarrolladas específicamente para los problemas que ocurren al usar grandes conjuntos de datos de observación.

Este artículo apareció originalmente en el blog de Minitab y traducido a usted por Blackberry&Cross.


Original: Martes 7 de Agosto, 2018.

Leave a Reply

Your email address will not be published.