Utilizando algoritmos de optimización para una imputación efectiva de datos faltantes: un estudio de caso de datos tabulares derivados de videovigilancia
Autores: Eid, Mahmoud M.; ElDahshan, Kamal; Abouali, Abdelatif H.; Tharwat, Alaa
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Utilizando algoritmos de optimización para una imputación efectiva de datos faltantes: un estudio de caso de datos tabulares derivados de videovigilancia
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Datos
Aprendizaje automático
Aprendizaje profundo
Datos faltantes
Vigilancia de video
Enfoque de imputación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
Los datos son componentes cruciales del aprendizaje automático y del aprendizaje profundo en aplicaciones del mundo real. Sin embargo, al recopilar datos de sistemas reales, a menudo nos encontramos con problemas de información faltante, lo cual puede afectar la precisión y llevar a resultados sesgados. En el contexto de la videovigilancia, los datos faltantes pueden surgir debido a obstrucciones, ángulos de cámara variables o problemas técnicos, lo que resulta en información incompleta sobre la escena observada. Este artículo presenta un método para manejar datos faltantes en formatos tabulares, centrándose específicamente en la videovigilancia. La idea principal es completar los valores faltantes para una característica específica utilizando valores de otras características relacionadas en lugar de depender de todas las características disponibles, a lo que nos referimos como el enfoque de imputación basado en características informativas. El artículo presenta tres conjuntos de experimentos. El primer conjunto utiliza conjuntos de datos sintéticos para comparar cuatro algoritmos de optimización: Optimización de Enjambre de Partículas (PSO), Optimización del Lobo Gris (GWO), Algoritmo de Optimización de Ballenas (WOA) y el Algoritmo Seno-Coseno (SCA), para determinar cuál identifica mejor las características relacionadas con la característica objetivo. El segundo conjunto trabaja con conjuntos de datos del mundo real, mientras que el tercero se centra en conjuntos de datos de videovigilancia. Cada experimento compara el método propuesto, utilizando el mejor optimizador del primer conjunto, con los principales métodos de imputación. Los experimentos evalúan diferentes tipos de datos y diversas tasas de datos faltantes, asegurando que la aleatoriedad no introduzca sesgos. En el primer experimento, utilizando solo datos sintéticos, los resultados indican que el enfoque basado en WOA supera a los algoritmos de optimización PSO, GWO y SCA. El segundo experimento utilizó conjuntos de datos reales, mientras que el tercero utilizó datos tabulares extraídos de un sistema de videovigilancia. Ambos experimentos muestran que nuestro método de imputación basado en WOA produce resultados prometedores, superando a otros métodos de imputación de vanguardia.
Descripción
Los datos son componentes cruciales del aprendizaje automático y del aprendizaje profundo en aplicaciones del mundo real. Sin embargo, al recopilar datos de sistemas reales, a menudo nos encontramos con problemas de información faltante, lo cual puede afectar la precisión y llevar a resultados sesgados. En el contexto de la videovigilancia, los datos faltantes pueden surgir debido a obstrucciones, ángulos de cámara variables o problemas técnicos, lo que resulta en información incompleta sobre la escena observada. Este artículo presenta un método para manejar datos faltantes en formatos tabulares, centrándose específicamente en la videovigilancia. La idea principal es completar los valores faltantes para una característica específica utilizando valores de otras características relacionadas en lugar de depender de todas las características disponibles, a lo que nos referimos como el enfoque de imputación basado en características informativas. El artículo presenta tres conjuntos de experimentos. El primer conjunto utiliza conjuntos de datos sintéticos para comparar cuatro algoritmos de optimización: Optimización de Enjambre de Partículas (PSO), Optimización del Lobo Gris (GWO), Algoritmo de Optimización de Ballenas (WOA) y el Algoritmo Seno-Coseno (SCA), para determinar cuál identifica mejor las características relacionadas con la característica objetivo. El segundo conjunto trabaja con conjuntos de datos del mundo real, mientras que el tercero se centra en conjuntos de datos de videovigilancia. Cada experimento compara el método propuesto, utilizando el mejor optimizador del primer conjunto, con los principales métodos de imputación. Los experimentos evalúan diferentes tipos de datos y diversas tasas de datos faltantes, asegurando que la aleatoriedad no introduzca sesgos. En el primer experimento, utilizando solo datos sintéticos, los resultados indican que el enfoque basado en WOA supera a los algoritmos de optimización PSO, GWO y SCA. El segundo experimento utilizó conjuntos de datos reales, mientras que el tercero utilizó datos tabulares extraídos de un sistema de videovigilancia. Ambos experimentos muestran que nuestro método de imputación basado en WOA produce resultados prometedores, superando a otros métodos de imputación de vanguardia.