El diseño de experimentos (DOE) es una rama de la estadística aplicada que utiliza la planificación, la realización, el análisis y la interpretación de pruebas controladas para explicar la variación de la información en condiciones hipotéticas que reflejan la variación. Se trata de una potente herramienta de recopilación y análisis de datos que investiga cómo afectan los distintos factores o variables a un resultado o respuesta de interés.
El Diseño de Experimentos (DOE) también se conoce como Experimentos Diseñados o Diseño Experimental; todos los términos tienen el mismo significado.
El término experimento se define como el procedimiento sistemático llevado a cabo en condiciones controladas para descubrir un efecto desconocido, probar o establecer una hipótesis o ilustrar un efecto conocido. Al analizar un proceso, los experimentos suelen utilizarse para evaluar qué entradas del proceso tienen un impacto significativo en la salida del proceso y cuál debe ser el nivel objetivo de esas entradas para lograr un resultado deseado (salida). Los experimentos pueden diseñarse de muchas maneras diferentes para recopilar esta información, y es útil disponer de un software que le guíe en la dirección más precisa para responder a sus preguntas de investigación. La herramienta DOE de EngineRoom tiene funciones integradas que le ayudarán a diseñar experimentos estadísticamente sólidos. Le guía a través de la selección de un diseño racionalizado en favor de los recursos necesarios, pero también es lo suficientemente potente como para detectar un efecto si existe.
El diseño experimental puede utilizarse en el punto de mayor apalancamiento para reducir los costes de diseño acelerando el proceso de diseño, reduciendo los cambios tardíos en el diseño de ingeniería y reduciendo la complejidad del material y la mano de obra del producto. Los experimentos diseñados también son herramientas poderosas para conseguir ahorros en los costes de fabricación minimizando la variación del proceso y reduciendo las repeticiones, los desechos y la necesidad de inspección.
Este módulo de la Caja de Herramientas incluye una visión general del Diseño Experimental y enlaces y otros recursos que le ayudarán a realizar experimentos diseñados. Un glosario de términos también está disponible en cualquier momento a través de la función de Ayuda, y le recomendamos que lo lea para familiarizarse con cualquier término que no le resulte familiar. Para un recurso adicional, consulte la grabación web de nuestro webinar en dos partes, “Getting Started with DOE”.
Preparación
Si no tiene conocimientos generales de estadística, revise los módulos Histograma, Control estadístico de procesos y Análisis de regresión y correlación de la Caja de herramientas antes de trabajar con este módulo.
Puede utilizar el software de análisis de datos EngineRoom® de MoreSteam para crear y analizar muchos diseños experimentales de uso común pero potentes.
Componentes del Diseño Experimental
Considere el siguiente diagrama del proceso de cocción de un pastel (Figura 1). Hay tres aspectos del proceso que se analizan mediante un experimento diseñado:
- Factores o entradas del proceso. Los factores pueden clasificarse como variables controlables o incontrolables. En este caso, los factores controlables son los ingredientes de la tarta y el horno en el que se hornea. A lo largo de este documento nos referiremos a las variables controlables como factores. Tenga en cuenta que la lista de ingredientes se ha acortado para este ejemplo: podría haber muchos otros ingredientes que influyeran significativamente en el resultado final (aceite, agua, aromatizantes, etc.). Del mismo modo, podría haber otros tipos de factores, como el método de mezcla o las herramientas, la secuencia de mezcla o incluso las personas implicadas. Las personas suelen considerarse un factor de ruido (véase el glosario): un factor incontrolable que causa variabilidad en condiciones normales de funcionamiento, pero que podemos controlar durante el experimento mediante el bloqueo y la aleatorización. Los factores potenciales pueden categorizarse utilizando el Diagrama de Espina de Pescado (Diagrama de Causa y Efecto) disponible en la Caja de Herramientas.
- Niveles o ajustes de cada factor del estudio. Por ejemplo, el ajuste de la temperatura del horno y las cantidades concretas de azúcar, harina y huevos elegidas para la evaluación.
- Respuesta o resultado del experimento. En el caso del horneado de pasteles, el sabor, la consistencia y el aspecto del pastel son resultados mensurables potencialmente influidos por los factores y sus respectivos niveles. Los experimentadores a menudo desean evitar la optimización del proceso para una respuesta a expensas de otra. Por esta razón, los resultados importantes se miden y analizan para determinar los factores y sus ajustes que proporcionarán el mejor resultado global para las características críticas para la calidad, tanto variables mensurables como atributos evaluables.
las imágenes que se utilizan son las originales desde la fuente
Objetivo de la Experimentación
Los experimentos diseñados tienen muchos usos potenciales en la mejora de procesos y productos, entre ellos:
- Comparar alternativas. En el caso de nuestro ejemplo de elaboración de pasteles, podríamos comparar los resultados de dos tipos diferentes de harina. Si resultara que la harina de distintos proveedores no fuera significativa, podríamos seleccionar el proveedor de menor coste. Si la harina fuera significativa, entonces seleccionaríamos la mejor harina. El experimento o los experimentos deberían permitirnos tomar una decisión informada que evalúe tanto la calidad como el coste.
- Identificar las entradas (factores) significativas que afectan a una salida (respuesta): separar las pocas vitales de las muchas triviales. Podríamos preguntarnos «¿Cuáles son los factores significativos más allá de la harina, los huevos, el azúcar y el horneado?».
- Conseguir un resultado óptimo del proceso (respuesta). «¿Cuáles son los factores necesarios, y cuáles son los niveles de esos factores, para conseguir el sabor y la consistencia exactos del pastel de chocolate de mamá?
- Reducir la variabilidad. «¿Se puede cambiar la receta para que sea más probable que salga siempre igual?».
- Minimizar, maximizar u orientar un resultado (respuesta). «¿Cómo se puede conseguir que el pastel esté lo más húmedo posible sin que se desintegre?».
- Mejora de la «robustez» del proceso o producto: aptitud para su uso en condiciones variables. «¿Pueden modificarse los factores y sus niveles (receta) para que el pastel salga casi igual independientemente del tipo de horno que se utilice?».
- Equilibrio de compensaciones cuando hay múltiples características críticas para la calidad (CTQC) que requieren optimización. «¿Cómo producir el pastel de mejor sabor con la receta más sencilla (menor número de ingredientes) y el menor tiempo de horneado?».
Directrices para el Diseño de Experimentos
El diseño de un experimento aborda las cuestiones planteadas anteriormente estipulando lo siguiente:
- Los factores que se van a probar.
- Los niveles de esos factores.
- La estructura y disposición de las series experimentales, o condiciones.
Un experimento bien diseñado es lo más sencillo posible: obtener la información necesaria de forma rentable y reproducible.
Recordatorio MoreSteam: Al igual que el Control Estadístico de Procesos, la fiabilidad de los resultados de los experimentos se basa en dos condiciones: un sistema de medición capaz y un proceso estable. Si el sistema de medición contribuye con un error excesivo, los resultados del experimento se verán enturbiados. Puede utilizar el módulo Análisis de sistemas de medición de la Caja de herramientas para evaluar el sistema de medición antes de realizar el experimento.
Del mismo modo, puede utilizar el módulo Control estadístico del proceso para ayudarle a evaluar la estabilidad estadística del proceso que se está evaluando. La variación que afecta a la respuesta debe limitarse al error aleatorio de causa común, no a la variación de causa especial de eventos específicos.
Al diseñar un experimento, preste especial atención a cuatro posibles trampas que pueden crear dificultades experimentales:
- Además del error de medición (explicado anteriormente), otras fuentes de error, o variación inexplicable, pueden oscurecer los resultados. Tenga en cuenta que el término «error» no es sinónimo de «equivocaciones». El error se refiere a toda la variación inexplicable que se produce dentro de una serie de experimentos o entre series de experimentos y que está asociada al cambio de los ajustes de nivel. Los experimentos correctamente diseñados pueden identificar y cuantificar las fuentes de error.
- Los factores incontrolables que inducen variaciones en condiciones normales de funcionamiento se denominan «factores de ruido». Estos factores, como las máquinas múltiples, los turnos múltiples, las materias primas, la humedad, etc., pueden incorporarse al experimento para que su variación no se incluya en el error no explicado o error del experimento. Un punto fuerte clave de los experimentos diseñados es la capacidad de determinar factores y ajustes que minimicen los efectos de los factores incontrolables.
- La correlación puede confundirse a menudo con la causalidad. Dos factores que varían juntos pueden estar muy correlacionados sin que uno sea la causa del otro, sino que ambos pueden estar causados por un tercer factor. Consideremos el ejemplo de una empresa de esmaltado de porcelana que fabrica bañeras. El director observa que hay problemas intermitentes de «piel de naranja», una rugosidad inaceptable en la superficie del esmalte. También observa que la piel de naranja es peor los días de baja producción. Un gráfico de la piel de naranja frente al volumen de producción (Figura 2) ilustra la correlación:
las imágenes que se utilizan son las originales desde la fuente
Si se analizan los datos sin conocer la operación, se podría llegar a la falsa conclusión de que los bajos índices de producción causan la piel de naranja. De hecho, tanto los bajos índices de producción como la piel de naranja están causados por el excesivo absentismo, que se produce cuando los operarios habituales de la cabina de pintura son sustituidos por empleados menos cualificados. Este ejemplo pone de manifiesto la importancia de tener en cuenta los conocimientos operativos a la hora de diseñar un experimento. Los ejercicios de lluvia de ideas y los diagramas de causa y efecto en espina de pescado son dos técnicas excelentes disponibles en la caja de herramientas para captar este conocimiento operativo durante la fase de diseño del experimento. La clave está en implicar a las personas que conviven a diario con el proceso.
4. Los efectos combinados o las interacciones entre factores exigen una reflexión cuidadosa antes de realizar el experimento. Por ejemplo, consideremos un experimento para cultivar plantas con dos insumos: agua y fertilizante. Aumentar la cantidad de agua incrementa el crecimiento, pero hay un punto en el que el agua adicional provoca la pudrición de las raíces y tiene un efecto perjudicial. Del mismo modo, el fertilizante adicional tiene un impacto beneficioso hasta el punto en que demasiado fertilizante quema las raíces. Además de la complejidad de los efectos principales, también hay efectos interactivos: demasiada agua puede anular los beneficios del fertilizante al arrastrarlo. Los factores pueden generar efectos no lineales que no sean aditivos, pero éstos sólo pueden estudiarse con experimentos más complejos que incluyan más de dos niveles. Dos niveles se define como lineal (dos puntos definen una línea), tres niveles se define como cuadrático (tres puntos definen una curva), cuatro niveles se define como cúbico, y así sucesivamente.
Proceso de Diseño de Experimentos
El diagrama de flujo que figura a continuación (Figura 3) ilustra el proceso de diseño del experimento:
las imágenes que se utilizan son las originales desde la fuente
Prueba de Medias – Experimento de Un Factor
Uno de los tipos de experimentos más habituales es la comparación de dos métodos de proceso o dos métodos de tratamiento. Existen varias formas de analizar un experimento de este tipo en función de la información disponible tanto de la población como de la muestra. Uno de los métodos más directos para evaluar un nuevo método de proceso es trazar los resultados en un gráfico SPC que también incluya datos históricos del proceso de referencia, con límites de control establecidos.
A continuación, aplique las reglas estándar para evaluar las condiciones fuera de control y ver si el proceso se ha desviado. Es posible que tenga que recopilar datos de varios subgrupos para tomar una determinación, aunque un solo subgrupo podría quedar fuera de los límites de control existentes. Puede consultar el módulo de gráficos de control estadístico de procesos de la caja de herramientas para obtener ayuda.
Una alternativa al enfoque del gráfico de control es utilizar la prueba F (relación F) para comparar las medias de tratamientos alternativos. Esto lo hace automáticamente la función ANOVA (análisis de varianza) del software estadístico, pero ilustraremos el cálculo con el siguiente ejemplo: Un viajero quería encontrar una ruta más rápida para volver a casa desde el trabajo. Había dos alternativas para evitar los atascos de tráfico. El viajero cronometra el trayecto de vuelta a casa durante un mes y medio, registrando diez puntos de datos para cada alternativa.
Recordatorio MoreSteam: Asegúrese de que los experimentos se realicen de forma aleatoria, es decir, en orden aleatorio. La aleatorización es necesaria para evitar el impacto de variables ocultas. Considere el ejemplo de la medición del tiempo de viaje a casa: si al final del período de muestreo se inicia un importante proyecto de autopista que aumenta el tiempo de viaje a casa, el proyecto de autopista podría sesgar los resultados si se muestrea un determinado tratamiento (ruta) durante ese período de tiempo.
Es necesario programar los recorridos experimentales para garantizar la independencia de las observaciones. Puede aleatorizar los recorridos utilizando monedas de un céntimo: escriba el número de referencia de cada recorrido en una moneda de un céntimo con un lápiz y, a continuación, saque las monedas de un recipiente y registre el orden.
A continuación se muestran los datos junto con la media de cada ruta (tratamiento) y la varianza de cada ruta:
las imágenes que se utilizan son las originales desde la fuente
Como se muestra en la tabla anterior, las dos nuevas rutas a casa (B&C) parecen ser más rápidas que la ruta existente A. Para determinar si la diferencia en las medias de los tratamientos se debe al azar o a un proceso diferente estadísticamente significativo, se realiza una prueba F ANOVA.
El análisis de la prueba F es la base para la evaluación de modelos tanto de experimentos de un solo factor como de múltiples factores. El software de análisis estadístico suele presentar este análisis en forma de tabla ANOVA, como se ilustra en la tabla siguiente:

El resultado más importante de la tabla es el cociente F (3,61). El cociente F equivale al cuadrado medio (variación) entre los grupos (tratamientos, o rutas a casa en nuestro ejemplo) de 19,9 dividido por el error cuadrático medio dentro de los grupos (variación dentro de las muestras de rutas dadas) de 5,51. El cociente F del modelo de 3,61 implica que el modelo es significativo.
El valor p («Probabilidad de superar el cociente F observado suponiendo que no hay diferencias significativas entre las medias») de 0,0408 indica que sólo hay un 4,08% de probabilidad de que un cociente F del modelo tan grande pueda deberse al ruido (azar). En otras palabras, las tres rutas difieren significativamente en cuanto al tiempo que se tarda en llegar a casa desde el trabajo.
El siguiente gráfico (Figura 4) muestra los intervalos de confianza de la «diferencia simultánea por pares» para cada par de diferencias entre las medias de los tratamientos. Si un intervalo incluye el valor cero (lo que significa «diferencia cero»), el par de medias correspondiente NO difiere significativamente. Puede utilizar estos intervalos para identificar cuál de las tres rutas es diferente y en qué medida. Los intervalos contienen los valores probables de las diferencias de las medias de los tratamientos (1-2), (1-3) y (2-3) respectivamente, cada uno de los cuales es probable que contenga la verdadera diferencia de medias (poblacional) en 95 de cada 100 muestras. Observe que el segundo intervalo (1-3) no incluye el valor cero; las medias de las rutas 1 (A) y 3 (C) difieren significativamente. De hecho, todos los valores incluidos en el intervalo (1, 3) son positivos, por lo que podemos afirmar que la ruta 1 (A) tiene asociado un mayor tiempo de desplazamiento en comparación con la ruta 3 (C).

las imágenes que se utilizan son las originales desde la fuente
Otros enfoques estadísticos para la comparación de dos o más tratamientos están disponibles a través del manual de estadística en línea – Capítulo 7: Manual de estadística.
Experimentos Diseñados con Múltiples Factores
Los experimentos multifactoriales están diseñados para evaluar múltiples factores establecidos en múltiples niveles. Un enfoque se denomina experimento factorial completo, en el que cada factor se prueba en cada nivel en todas las combinaciones posibles con los demás factores y sus niveles. Los experimentos factoriales completos que estudian todas las interacciones emparejadas pueden resultar económicos y prácticos si hay pocos factores y sólo 2 ó 3 niveles por factor. La ventaja es que se pueden estudiar todas las interacciones emparejadas. Sin embargo, el número de ejecuciones aumenta exponencialmente a medida que se añaden factores adicionales. Los experimentos con muchos factores pueden volverse rápidamente inmanejables y costosos de ejecutar, como muestra el gráfico siguiente:
Vea un experimento factorial completo en EngineRoom:
Para estudiar un mayor número de factores e interacciones, pueden utilizarse diseños factoriales fraccionados que reducen el número de ejecuciones evaluando sólo un subconjunto de todas las combinaciones posibles de los factores. Estos diseños son muy rentables, pero el estudio de las interacciones entre factores es limitado, por lo que la disposición experimental debe decidirse antes de ejecutar el experimento (durante la fase de diseño del experimento).
Recordatorio MoreSteam: Al seleccionar los niveles de factor para un experimento, es fundamental capturar la variación natural del proceso. Los niveles cercanos a la media del proceso pueden ocultar la importancia del factor en su rango probable de valores. Para los factores que se miden en una escala variable, intente seleccionar niveles a más/menos tres desviaciones estándar del valor medio.
También puede utilizar EngineRoom, la herramienta estadística en línea de MoreSteam, para diseñar y analizar varios experimentos de diseño populares. La aplicación incluye tutoriales sobre planificación y ejecución de diseños factoriales completos, fraccionales y generales.
Vea un experimento factorial fraccionario en EngineRoom:
Tema avanzado – Métodos Taguchi
El Dr. Genichi Taguchi es un estadístico japonés, ganador del premio Deming, pionero en técnicas de mejora de la calidad mediante el diseño robusto de productos y procesos de producción. El Dr. Taguchi desarrolló diseños experimentales factoriales fraccionados que utilizan un número muy limitado de series experimentales. Los detalles específicos del diseño experimental de Taguchi están fuera del alcance de este tutorial, sin embargo, es útil entender la Función de Pérdida de Taguchi, que es la base de su filosofía de mejora de la calidad.
El pensamiento tradicional es que cualquier pieza o producto dentro de especificación es igualmente apto para su uso. En ese caso, la pérdida (coste) por mala calidad sólo se produce fuera de la especificación (Figura 5). Sin embargo, Taguchi argumenta que una pieza que está marginalmente dentro de la especificación es en realidad poco mejor que una pieza que está marginalmente fuera de la especificación.
Así, Taguchi describe una función de pérdida continua que aumenta a medida que una pieza se desvía del valor objetivo o nominal (figura 6). La función de pérdida estipula que la pérdida de la sociedad debida a productos de bajo rendimiento es proporcional al cuadrado de la desviación de la característica de rendimiento con respecto a su valor objetivo.
las imágenes que se utilizan son las originales desde la fuente
Taguchi suma este coste de mala calidad para la sociedad (consumidores) al coste de producción del producto para obtener la pérdida total (coste). Taguchi utiliza experimentos diseñados para producir diseños de productos y procesos más robustos, menos sensibles a la variación de piezas/procesos.
Elegir el software DOE adecuado
Al planificar un DOE, es esencial utilizar un software estadístico que le ayude a diseñar y analizar el experimento más adecuado para responder a sus preguntas de investigación. La herramienta DOE de EngineRoom tiene funciones incorporadas específicamente diseñadas para guiarle en la selección de un diseño racionalizado en favor de los recursos necesarios, pero también lo suficientemente potente como para detectar un efecto si existe.
Proporciona una lista completa de diseños factoriales completos, fraccionados y generales para cubrir una amplia variedad de escenarios de DOE. También permite ejecutar algoritmos automatizados para seleccionar el mejor modelo para los datos, lo que facilita la extracción de conclusiones y la adopción de medidas fundamentadas. El uso de EngineRoom para sus experimentos diseñados puede ahorrar tiempo, reducir errores costosos y ayudar a tomar decisiones basadas en datos.
Vea un Experimento Factorial General en EngineRoom:
Resumen
Los experimentos diseñados son una herramienta de análisis avanzada y potente durante los proyectos. Un experimentador eficaz puede filtrar el ruido y descubrir factores significativos del proceso. Los factores pueden utilizarse entonces para controlar las propiedades de respuesta de un proceso y los equipos pueden diseñar un proceso con las especificaciones exactas que requiere su producto o servicio.
Un experimento bien construido puede ahorrar no sólo tiempo de proyecto, sino también resolver problemas críticos que han pasado desapercibidos en los procesos. En concreto, se pueden observar y evaluar las interacciones de los factores. En última instancia, los equipos aprenderán qué factores importan y cuáles no.
Más información sobre EngineRoom
Referencias
- Webster’s Ninth New Collegiate Dictionary
Recursos en línea adicionales
- An excellent online Statistics Handbook is available that covers Design of Experiments and many other topics. See Section 5 – “Improve” for a complete tutorial on Design of Experiments.
- Check the White Paper Section for related online articles.
Libros
- Mark J. Anderson and Patrick J. Whitcomb, DOE Simplified (Productivity, Inc. 2000). ISBN 1-56327-225-3. Recommended – This book is easy to understand and comes with copy of excellent D.O.E. software good for 180 days.
- George E. P. Box, William G. Hunter and J. Stuart Hunter, Statistics for Experimenters – An Introduction to Design, Data Analysis, and Model Building (John Wiley and Sons, Inc. 1978). ISBN 0-471-09315-7
- Douglas C. Montgomery, Design and Analysis of Experiments (John Wiley & Sons, Inc., 1984) ISBN 0-471-86812-4.
- Genichi Taguchi, Introduction to Quality Engineering – Designing Quality Into Products and Processes (Asian Productivity Organization, 1986). ISBN 92-833-1084-5
Fuentes y notas:
Este texto fue desarrollado por nuestro aliado MoreSteam.
Blackberry&Cross es aliado de MoreSteam.
(*) Blackberry & Cross realiza ajustes al texto original para mejorar la interpretación en español
Si usted está interesado(a) en temas LEAN Six Sigma, recuede consultar: https://blackberrycross.com/cursos/
Imagen utilizada con permisos y en alineamiento con los términos de uso de canva.com
Leave a Reply