Un modelo para la selección de características con optimización de enjambre de partículas binarias y características sintéticas
Autores: Ojo, Samuel Olusegun; Adisa, Juliana Adeola; Owolawi, Pius Adewale; Tu, Chunling
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un modelo para la selección de características con optimización de enjambre de partículas binarias y características sintéticas
Categoría
Ingeniería y Tecnología
Subcategoría
Inteligencia Artificial
Palabras clave
Patrones
No linealidades
Aprendizaje automático
Selección de características
Características sintéticas
Correlación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
Reconocer patrones e inferir no linealidades entre datos que parecen aleatorios y estocásticos es una de las fortalezas de los modelos de aprendizaje automático. Dado un conjunto de características, la capacidad de distinguir entre características útiles y aparentemente inútiles, y posteriormente extraer un subconjunto de características que dará como resultado la mejor predicción en datos altamente estocásticos, sigue siendo un problema abierto. Este estudio presenta un modelo de selección de características mediante la generación de características sintéticas y la aplicación de Optimización de Enjambre de Partículas Binarias con un modelo basado en Memoria a Corto y Largo Plazo. El estudio analiza la correlación entre los datos y hace uso de los datos del mercado de valores de Apple como caso de uso. Se crean características sintéticas a partir de características que tienen una correlación débil/baja con la etiqueta y se analiza cómo las características sintéticas que son descriptivas de las características pueden mejorar la capacidad predictiva del modelo. Los resultados obtenidos muestran que al expandir el conjunto de datos para contener características sintéticas antes de aplicar la selección de características, la función objetivo se optimizó mejor en comparación con cuando no se agregaron características sintéticas.
Descripción
Reconocer patrones e inferir no linealidades entre datos que parecen aleatorios y estocásticos es una de las fortalezas de los modelos de aprendizaje automático. Dado un conjunto de características, la capacidad de distinguir entre características útiles y aparentemente inútiles, y posteriormente extraer un subconjunto de características que dará como resultado la mejor predicción en datos altamente estocásticos, sigue siendo un problema abierto. Este estudio presenta un modelo de selección de características mediante la generación de características sintéticas y la aplicación de Optimización de Enjambre de Partículas Binarias con un modelo basado en Memoria a Corto y Largo Plazo. El estudio analiza la correlación entre los datos y hace uso de los datos del mercado de valores de Apple como caso de uso. Se crean características sintéticas a partir de características que tienen una correlación débil/baja con la etiqueta y se analiza cómo las características sintéticas que son descriptivas de las características pueden mejorar la capacidad predictiva del modelo. Los resultados obtenidos muestran que al expandir el conjunto de datos para contener características sintéticas antes de aplicar la selección de características, la función objetivo se optimizó mejor en comparación con cuando no se agregaron características sintéticas.