Inteligencia Artificial en Sistemas de Manufactura Complejos: Una Revisión Sistemática del Rigor de Validación y la Preparación para el Despliegue en el Mantenimiento Predictivo
Autores: Henao Villa, Cesar Felipe; Garcia Arango, David Alberto; Garcés Giraldo, Luis Fernando; Meleán Romero, Rosana Alejandra; Valencia-Arias, Alejandro; Velásquez Ochoa, José Alexander
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Inteligencia Artificial en Sistemas de Manufactura Complejos: Una Revisión Sistemática del Rigor de Validación y la Preparación para el Despliegue en el Mantenimiento Predictivo
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Revisión sistemática
Investigación en IA
Mantenimiento predictivo
Aprendizaje profundo
Preparación para el despliegue
IA explicable
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Esta revisión sistemática (PRISMA 2020) examina 89 estudios: 64 artículos revisados por pares y 25 preprints de arXiv (2007-2026) que abordan la brecha entre la investigación en IA y el despliegue operativo de mantenimiento predictivo (PdM) en sistemas de fabricación complejos. Al analizar cinco clústeres temáticos en entornos no estacionarios y estocásticos, evaluamos el rendimiento predictivo y la preparación para el despliegue. El aprendizaje profundo domina la previsión de la vida útil restante (RUL); sin embargo, el 65.6% de los estudios emplea protocolos de validación débiles o poco claros (Nivel 0-1), careciendo de pruebas de robustez en el mundo real. El diagnóstico de fallos integra cada vez más Edge-AI, sin embargo, la adopción de IA Explicable (XAI) sigue siendo escasa (15.6%), socavando la confianza industrial. Ningún estudio alcanzó la validación en campo operativo más allá de la división temporal o entre dominios, reflejando una desconexión sistemática de los sistemas de fabricación desplegados. Introducimos un nuevo marco de puntuación de preparación para el despliegue (DRS) e identificamos barreras críticas: escasez de datos, no estacionariedad ambiental, limitaciones computacionales y desconfianza en modelos de caja negra. Las recomendaciones incluyen protocolos de validación temporal estandarizados, estudios de campo en múltiples sitios y explicabilidad integrada en la arquitectura. Los 25 preprints de arXiv (2024-2026) exhiben una puntuación media de DRS casi tres veces mayor que la del corpus revisado por pares, señalando una convergencia incipiente hacia una investigación madura para el despliegue. Esta revisión no fue pre-registrada.
Descripción
Esta revisión sistemática (PRISMA 2020) examina 89 estudios: 64 artículos revisados por pares y 25 preprints de arXiv (2007-2026) que abordan la brecha entre la investigación en IA y el despliegue operativo de mantenimiento predictivo (PdM) en sistemas de fabricación complejos. Al analizar cinco clústeres temáticos en entornos no estacionarios y estocásticos, evaluamos el rendimiento predictivo y la preparación para el despliegue. El aprendizaje profundo domina la previsión de la vida útil restante (RUL); sin embargo, el 65.6% de los estudios emplea protocolos de validación débiles o poco claros (Nivel 0-1), careciendo de pruebas de robustez en el mundo real. El diagnóstico de fallos integra cada vez más Edge-AI, sin embargo, la adopción de IA Explicable (XAI) sigue siendo escasa (15.6%), socavando la confianza industrial. Ningún estudio alcanzó la validación en campo operativo más allá de la división temporal o entre dominios, reflejando una desconexión sistemática de los sistemas de fabricación desplegados. Introducimos un nuevo marco de puntuación de preparación para el despliegue (DRS) e identificamos barreras críticas: escasez de datos, no estacionariedad ambiental, limitaciones computacionales y desconfianza en modelos de caja negra. Las recomendaciones incluyen protocolos de validación temporal estandarizados, estudios de campo en múltiples sitios y explicabilidad integrada en la arquitectura. Los 25 preprints de arXiv (2024-2026) exhiben una puntuación media de DRS casi tres veces mayor que la del corpus revisado por pares, señalando una convergencia incipiente hacia una investigación madura para el despliegue. Esta revisión no fue pre-registrada.