Algoritmos de aprendizaje automático para fomentar una educación innovadora para estudiantes universitarios
Autores: Wang, Yinghua; You, Fucheng; Li, Qing
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Algoritmos de aprendizaje automático para fomentar una educación innovadora para estudiantes universitarios
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aumento de datos
Mixup
Mbmix
Aumento de lotes de memoria
Distribución espacial
Clasificación de texto
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
La técnica de aumento de datos con mixup ha demostrado ser efectiva en diversas tareas de aprendizaje automático. Sin embargo, los métodos anteriores se centran principalmente en generar ejemplos virtuales previamente no vistos utilizando muestras mixtas seleccionadas al azar, lo que puede pasar por alto la importancia de distribuciones espaciales similares. En este trabajo, ampliamos mixup y proponemos MbMix, un enfoque de entrenamiento novedoso pero simple diseñado para implementar mixup con aumento de lotes de memoria. MbMix selecciona específicamente las muestras a mezclar a través de lotes de memoria para garantizar que las muestras generadas tengan la misma distribución espacial que las muestras del conjunto de datos. Mediante experimentos extensos, validamos empíricamente que nuestro método supera a varios métodos de mixup en una amplia gama de pruebas de clasificación de texto, incluyendo clasificación de sentimientos, clasificación de tipos de preguntas y deducción textual. Cabe destacar que nuestro método propuesto logra una mejora del 5,61% en comparación con enfoques existentes en la prueba TREC-fine. Nuestro enfoque es versátil, con aplicaciones en análisis de sentimientos, respuestas a preguntas y detección de noticias falsas, ofreciendo a equipos emprendedores y estudiantes vías para innovar. Permite la simulación y modelado para empresas estudiantiles, fomentando una cultura y mentalidad emprendedora en el campus.
Descripción
La técnica de aumento de datos con mixup ha demostrado ser efectiva en diversas tareas de aprendizaje automático. Sin embargo, los métodos anteriores se centran principalmente en generar ejemplos virtuales previamente no vistos utilizando muestras mixtas seleccionadas al azar, lo que puede pasar por alto la importancia de distribuciones espaciales similares. En este trabajo, ampliamos mixup y proponemos MbMix, un enfoque de entrenamiento novedoso pero simple diseñado para implementar mixup con aumento de lotes de memoria. MbMix selecciona específicamente las muestras a mezclar a través de lotes de memoria para garantizar que las muestras generadas tengan la misma distribución espacial que las muestras del conjunto de datos. Mediante experimentos extensos, validamos empíricamente que nuestro método supera a varios métodos de mixup en una amplia gama de pruebas de clasificación de texto, incluyendo clasificación de sentimientos, clasificación de tipos de preguntas y deducción textual. Cabe destacar que nuestro método propuesto logra una mejora del 5,61% en comparación con enfoques existentes en la prueba TREC-fine. Nuestro enfoque es versátil, con aplicaciones en análisis de sentimientos, respuestas a preguntas y detección de noticias falsas, ofreciendo a equipos emprendedores y estudiantes vías para innovar. Permite la simulación y modelado para empresas estudiantiles, fomentando una cultura y mentalidad emprendedora en el campus.