Investigación desarrolla modelo de inteligencia artificial interpretable para detectar anomalías en sistemas distribuidos
El profesor Rodrigo Carrasco publicó recientemente el artículo “Interpretable Transformer-based model with sentiment analysis for anomaly detection in individual logs in distributed systems using word-level explanations” en la revista científica Scientific Reports del grupo Nature. La investigación fue desarrollada junto al exalumno Andrés Catalán y Gonzalo Ruz Heredia. El estudio aborda uno de los principales desafíos de las infraestructuras digitales modernas: la detección de anomalías en sistemas distribuidos y servicios en la nube a partir de los millones de registros o logs que estos generan diariamente. Actualmente, los administradores de sistemas deben analizar enormes volúmenes de información semiestructurada para identificar posibles fallos o comportamientos anómalos. Sin embargo, los métodos tradicionales suelen depender de analizadores rígidos y predefinidos, lo que dificulta su adaptación a sistemas dinámicos y vocabularios cambiantes. Frente a este escenario, la investigación propone un marco de inteligencia artificial basado en arquitectura Transformer capaz de procesar registros completos como texto, sin necesidad de utilizar analizadores sintácticos tradicionales. El modelo utiliza representaciones contextuales basadas en BERT para identificar patrones lingüísticos asociados a estados degradados o anómalos del sistema. Uno de los principales aportes del trabajo es la incorporación de herramientas de interpretabilidad en modelos de aprendizaje profundo. A través de un procedimiento de reconstrucción semántica utilizando valores SHAP, la investigación logra transformar decisiones complejas del modelo en explicaciones comprensibles para operadores humanos a nivel de palabra. De esta manera, el sistema no solo detecta anomalías, sino que también identifica los términos específicos que originan una alerta, entregando evidencia cuantificable y útil para apoyar la toma de decisiones en entornos complejos. “En lugar de simplemente proporcionar a los operadores del sistema una alerta binaria de ‘Error’ o ‘Sin error’, nuestro modelo ofrece evidencia cuantificada a nivel de palabra”, señaló Rodrigo Carrasco tras la publicación del artículo. Los resultados obtenidos en múltiples conjuntos de datos públicos demostraron que el enfoque propuesto permite una mejor generalización frente a vocabularios nuevos y escenarios fuera del dominio, entregando además herramientas útiles para sistemas de monitoreo y soporte operacional. La publicación se suma a las recientes investigaciones del profesor Rodrigo Carrasco en áreas de optimización, analítica e inteligencia artificial aplicada a problemas complejos y de alto impacto.

