La inteligencia artificial bajo ataque: análisis impulsado por métricas de amenazas cibernéticas en modelos de aprendizaje profundo para aplicaciones de salud
Autores: Brohi, Sarfraz; Mastoi, Qurat-ul-ain
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
La inteligencia artificial bajo ataque: análisis impulsado por métricas de amenazas cibernéticas en modelos de aprendizaje profundo para aplicaciones de salud
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Inteligencia artificial
Atención médica
Vulnerabilidades de ciberseguridad
Modelos de aprendizaje profundo
Escenarios de ataque
Detección de cáncer de mama
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 56
Citaciones: Sin citaciones
Incorporar la Inteligencia Artificial (IA) en el sector de la salud ha transformado el diagnóstico y tratamiento de enfermedades al ofrecer beneficios sin precedentes. Sin embargo, también ha revelado vulnerabilidades críticas de ciberseguridad en los modelos de Aprendizaje Profundo (DL), lo que plantea riesgos significativos para la seguridad de los pacientes y su confianza en las aplicaciones impulsadas por IA. Los estudios existentes se centran principalmente en vulnerabilidades teóricas o tipos de ataques específicos, dejando un vacío en la comprensión de las implicaciones prácticas de múltiples escenarios de ataque en la IA sanitaria. En este documento, proporcionamos un análisis exhaustivo de los principales vectores de ataque, incluidos los ataques adversariales, como el método de la Rápida Señal de Gradiente (FGSM) basado en gradientes, ataques de evasión (basados en perturbaciones) y envenenamiento de datos, que amenazan la fiabilidad de los modelos de DL, con un enfoque específico en la detección de cáncer de mama. Proponemos el Algoritmo de Evaluación de Vulnerabilidad de IA en Salud (HAVA) que simula sistemáticamente estos ataques, calcula el Índice de Vulnerabilidad Post-Ataque (PAVI) y evalúa cuantitativamente sus impactos. Nuestros hallazgos revelaron que los ataques adversariales FGSM y de evasión redujeron significativamente la precisión del modelo del 97.36% al 61.40% (PAVI: 0.385965) y 62.28% (PAVI: 0.377193), respectivamente, demostrando su grave impacto en el rendimiento, pero el envenenamiento de datos tuvo un efecto más suave, manteniendo una precisión del 89.47% (PAVI: 0.105263). Las matrices de confusión también revelaron una mayor tasa de falsos positivos en los ataques adversariales FGSM y de evasión que patrones de clasificación errónea más equilibrados observados en el envenenamiento de datos. Al proponer un marco unificado para cuantificar y analizar estas vulnerabilidades post-ataque, esta investigación contribuye a formular modelos de IA resilientes para dominios críticos donde la precisión y la fiabilidad son importantes.
Descripción
Incorporar la Inteligencia Artificial (IA) en el sector de la salud ha transformado el diagnóstico y tratamiento de enfermedades al ofrecer beneficios sin precedentes. Sin embargo, también ha revelado vulnerabilidades críticas de ciberseguridad en los modelos de Aprendizaje Profundo (DL), lo que plantea riesgos significativos para la seguridad de los pacientes y su confianza en las aplicaciones impulsadas por IA. Los estudios existentes se centran principalmente en vulnerabilidades teóricas o tipos de ataques específicos, dejando un vacío en la comprensión de las implicaciones prácticas de múltiples escenarios de ataque en la IA sanitaria. En este documento, proporcionamos un análisis exhaustivo de los principales vectores de ataque, incluidos los ataques adversariales, como el método de la Rápida Señal de Gradiente (FGSM) basado en gradientes, ataques de evasión (basados en perturbaciones) y envenenamiento de datos, que amenazan la fiabilidad de los modelos de DL, con un enfoque específico en la detección de cáncer de mama. Proponemos el Algoritmo de Evaluación de Vulnerabilidad de IA en Salud (HAVA) que simula sistemáticamente estos ataques, calcula el Índice de Vulnerabilidad Post-Ataque (PAVI) y evalúa cuantitativamente sus impactos. Nuestros hallazgos revelaron que los ataques adversariales FGSM y de evasión redujeron significativamente la precisión del modelo del 97.36% al 61.40% (PAVI: 0.385965) y 62.28% (PAVI: 0.377193), respectivamente, demostrando su grave impacto en el rendimiento, pero el envenenamiento de datos tuvo un efecto más suave, manteniendo una precisión del 89.47% (PAVI: 0.105263). Las matrices de confusión también revelaron una mayor tasa de falsos positivos en los ataques adversariales FGSM y de evasión que patrones de clasificación errónea más equilibrados observados en el envenenamiento de datos. Al proponer un marco unificado para cuantificar y analizar estas vulnerabilidades post-ataque, esta investigación contribuye a formular modelos de IA resilientes para dominios críticos donde la precisión y la fiabilidad son importantes.