Un Marco de Conjunto para la Clasificación de Texto
Autores: Kamateri, Eleni; Salampasis, Michail
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un Marco de Conjunto para la Clasificación de Texto
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Aprendizaje en conjunto
Rendimiento predictivo
Marco de conjunto
Clasificación de patentes
Clasificación de texto
Modelos base
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El aprendizaje en conjunto puede mejorar el rendimiento predictivo en comparación con el rendimiento de cualquiera de sus componentes por separado, manteniendo al mismo tiempo las demandas computacionales manejables. Sin embargo, no existe una metodología de referencia disponible para desarrollar sistemas de conjunto. En este artículo, adaptamos un marco de conjunto para la clasificación de patentes para ayudar a los científicos de datos a crear arquitecturas de conjunto flexibles para la clasificación de texto al seleccionar un conjunto finito de modelos base constituyentes de las muchas alternativas disponibles. Analizamos los ejes a lo largo de los cuales se puede seleccionar modelos base de un sistema de conjunto y proponemos una metodología para combinarlos. Además, realizamos experimentos para comparar la efectividad de los sistemas de conjunto frente a modelos base y métodos de vanguardia en múltiples conjuntos de datos (tres conjuntos de datos de clasificación de patentes y dos conjuntos de datos de clasificación de texto), incluyendo textos largos y cortos y textos etiquetados de forma única y/o múltiple. Los resultados verifican la generalidad de nuestro marco y la efectividad de los sistemas de conjunto, especialmente los conjuntos de clasificadores entrenados en diferentes secciones de datos/metadatos.
Descripción
El aprendizaje en conjunto puede mejorar el rendimiento predictivo en comparación con el rendimiento de cualquiera de sus componentes por separado, manteniendo al mismo tiempo las demandas computacionales manejables. Sin embargo, no existe una metodología de referencia disponible para desarrollar sistemas de conjunto. En este artículo, adaptamos un marco de conjunto para la clasificación de patentes para ayudar a los científicos de datos a crear arquitecturas de conjunto flexibles para la clasificación de texto al seleccionar un conjunto finito de modelos base constituyentes de las muchas alternativas disponibles. Analizamos los ejes a lo largo de los cuales se puede seleccionar modelos base de un sistema de conjunto y proponemos una metodología para combinarlos. Además, realizamos experimentos para comparar la efectividad de los sistemas de conjunto frente a modelos base y métodos de vanguardia en múltiples conjuntos de datos (tres conjuntos de datos de clasificación de patentes y dos conjuntos de datos de clasificación de texto), incluyendo textos largos y cortos y textos etiquetados de forma única y/o múltiple. Los resultados verifican la generalidad de nuestro marco y la efectividad de los sistemas de conjunto, especialmente los conjuntos de clasificadores entrenados en diferentes secciones de datos/metadatos.