Un nuevo medida de precisión resistente a valores atípicos para la regresión de aprendizaje automático utilizando una métrica de distancia no convexa
Autores: Hassanat, Ahmad B.; Alqaralleh, Mohammad Khaled; Tarawneh, Ahmad S.; Almohammadi, Khalid; Alamri, Maha; Alzahrani, Abdulkareem; Altarawneh, Ghada A.; Alhalaseh, Rania
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un nuevo medida de precisión resistente a valores atípicos para la regresión de aprendizaje automático utilizando una métrica de distancia no convexa
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Regresión
Enfoque de aprendizaje automático
Métricas de error
Error cuadrático medio
Error cuadrático medio raíz
Medida de precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La regresión, un enfoque de aprendizaje automático supervisado, establece relaciones entre variables independientes y una variable dependiente continua. Se aplica ampliamente en áreas como la predicción de precios y la predicción de series temporales. El rendimiento de los modelos de regresión se evalúa típicamente utilizando métricas de error como el Error Cuadrático Medio (MSE), el Error Absoluto Medio (MAE) y el Error Cuadrático Medio de la Raíz (RMSE). Sin embargo, estas métricas presentan desafíos, incluida la sensibilidad a los valores atípicos (notablemente MSE y RMSE) y la dependencia de la escala, lo que complica las comparaciones entre diferentes modelos. Además, las métricas tradicionales a veces arrojan valores que son difíciles de interpretar en diversos problemas. En consecuencia, hay una necesidad de una métrica que refleje consistentemente el rendimiento del modelo de regresión, independientemente del dominio del problema, la escala de datos y la presencia de valores atípicos. Para superar estas deficiencias, este documento introduce una nueva medida de precisión de regresión basada en la distancia de Hassanat, una métrica de distancia no convexa. Esta medida no solo es invariante a los valores atípicos, sino que también es fácil de interpretar, ya que proporciona un valor similar a la precisión que varía de 0 a 1 (o del 0 al 100%). Validamos la métrica propuesta frente a medidas tradicionales en múltiples benchmarks, demostrando su robustez en diversos escenarios de modelos y tipos de datos. Por lo tanto, lo sugerimos como un nuevo estándar para evaluar la precisión de los modelos de regresión.
Descripción
La regresión, un enfoque de aprendizaje automático supervisado, establece relaciones entre variables independientes y una variable dependiente continua. Se aplica ampliamente en áreas como la predicción de precios y la predicción de series temporales. El rendimiento de los modelos de regresión se evalúa típicamente utilizando métricas de error como el Error Cuadrático Medio (MSE), el Error Absoluto Medio (MAE) y el Error Cuadrático Medio de la Raíz (RMSE). Sin embargo, estas métricas presentan desafíos, incluida la sensibilidad a los valores atípicos (notablemente MSE y RMSE) y la dependencia de la escala, lo que complica las comparaciones entre diferentes modelos. Además, las métricas tradicionales a veces arrojan valores que son difíciles de interpretar en diversos problemas. En consecuencia, hay una necesidad de una métrica que refleje consistentemente el rendimiento del modelo de regresión, independientemente del dominio del problema, la escala de datos y la presencia de valores atípicos. Para superar estas deficiencias, este documento introduce una nueva medida de precisión de regresión basada en la distancia de Hassanat, una métrica de distancia no convexa. Esta medida no solo es invariante a los valores atípicos, sino que también es fácil de interpretar, ya que proporciona un valor similar a la precisión que varía de 0 a 1 (o del 0 al 100%). Validamos la métrica propuesta frente a medidas tradicionales en múltiples benchmarks, demostrando su robustez en diversos escenarios de modelos y tipos de datos. Por lo tanto, lo sugerimos como un nuevo estándar para evaluar la precisión de los modelos de regresión.