Regresión logística laplaciana sensible al costo para la predicción de detención de barcos
Autores: Tian, Xuecheng; Wang, Shuaian
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Regresión logística laplaciana sensible al costo para la predicción de detención de barcos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Control de estado del puerto
Retención de buques
Deficiencias críticas
Datos desequilibrados
Datos no etiquetados
Paradigmas de aprendizaje automático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
El control del estado del puerto (PSC) es la última línea de defensa para los barcos de calidad inferior. Durante una inspección de PSC, la detención del barco es el resultado más severo si se identifican deficiencias críticas en el barco inspeccionado. Con respecto al desarrollo de modelos de predicción de detención de barcos, este documento identifica dos desafíos: aprender de datos desequilibrados y aprender de datos no etiquetados. El primer desafío, datos desequilibrados, surge del hecho de que una minoría de barcos inspeccionados fueron detenidos. El segundo desafío, datos no etiquetados, surge del hecho de que en la práctica no todos los barcos extranjeros que visitan reciben una inspección formal de PSC, lo que conduce a un problema de datos faltantes. Para abordar estos dos desafíos, este documento adopta dos paradigmas de aprendizaje automático: aprendizaje sensible al costo y aprendizaje semisupervisado. En consecuencia, ampliamos el modelo tradicional de regresión logística (LR) introduciendo un parámetro de costo para considerar los diferentes costos de clasificación errónea de clases desequilibradas e incorporando un término de regularización de gráficos para considerar datos no etiquetados. Finalmente, realizamos experimentos computacionales extensos para verificar la superioridad del marco de aprendizaje semisupervisado sensible al costo desarrollado en este documento. Los resultados computacionales muestran que la introducción de un parámetro de costo en LR puede mejorar la tasa de clasificación de barcos de calidad inferior en casi un 10%. Además, los resultados muestran que considerar datos no etiquetados en modelos de clasificación puede aumentar la tasa de clasificación de clases minoritarias y mayoritarias en un 1,33% y un 5,93%, respectivamente.
Descripción
El control del estado del puerto (PSC) es la última línea de defensa para los barcos de calidad inferior. Durante una inspección de PSC, la detención del barco es el resultado más severo si se identifican deficiencias críticas en el barco inspeccionado. Con respecto al desarrollo de modelos de predicción de detención de barcos, este documento identifica dos desafíos: aprender de datos desequilibrados y aprender de datos no etiquetados. El primer desafío, datos desequilibrados, surge del hecho de que una minoría de barcos inspeccionados fueron detenidos. El segundo desafío, datos no etiquetados, surge del hecho de que en la práctica no todos los barcos extranjeros que visitan reciben una inspección formal de PSC, lo que conduce a un problema de datos faltantes. Para abordar estos dos desafíos, este documento adopta dos paradigmas de aprendizaje automático: aprendizaje sensible al costo y aprendizaje semisupervisado. En consecuencia, ampliamos el modelo tradicional de regresión logística (LR) introduciendo un parámetro de costo para considerar los diferentes costos de clasificación errónea de clases desequilibradas e incorporando un término de regularización de gráficos para considerar datos no etiquetados. Finalmente, realizamos experimentos computacionales extensos para verificar la superioridad del marco de aprendizaje semisupervisado sensible al costo desarrollado en este documento. Los resultados computacionales muestran que la introducción de un parámetro de costo en LR puede mejorar la tasa de clasificación de barcos de calidad inferior en casi un 10%. Además, los resultados muestran que considerar datos no etiquetados en modelos de clasificación puede aumentar la tasa de clasificación de clases minoritarias y mayoritarias en un 1,33% y un 5,93%, respectivamente.