Un análisis empírico de los modelos BERT en portugués y multilingües para la auto-clasificación de códigos NCM en el comercio internacional
Autores: de Lima, Roberta Rodrigues; Fernandes, Anita M. R.; Bombasar, James Roberto; da Silva, Bruno Alves; Crocker, Paul; Leithardt, Valderi Reis Quietinho
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un análisis empírico de los modelos BERT en portugués y multilingües para la auto-clasificación de códigos NCM en el comercio internacional
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Clasificación
Algoritmos de aprendizaje supervisado
Clasificación de bienes
Penalidades fiscales
Implicaciones legales
Modelo BERT
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Los problemas de clasificación son actividades comunes en muchos dominios diferentes y los algoritmos de aprendizaje supervisado han demostrado gran promesa en estas áreas. La clasificación de bienes en el comercio internacional en Brasil representa un desafío real debido a la complejidad involucrada en asignar los códigos de categoría correctos a un bien, especialmente considerando las penalizaciones fiscales e implicaciones legales de una clasificación incorrecta. Este trabajo se centra en el proceso de entrenamiento de un clasificador basado en representaciones de codificadores bidireccionales de transformers (BERT) para la clasificación fiscal de bienes con códigos MCN que son el sistema oficial de clasificación de productos de importación y exportación en Brasil. En particular, este artículo presenta resultados del uso de un modelo BERT específico preentrenado en idioma portugués, así como resultados del uso de un modelo BERT preentrenado multilingüe. Los resultados experimentales muestran que el modelo en portugués tuvo un rendimiento ligeramente mejor que el modelo multilingüe, logrando un MCC de 0.8491, y confirma que los clasificadores podrían usarse para mejorar el rendimiento de los especialistas en la clasificación de bienes.
Descripción
Los problemas de clasificación son actividades comunes en muchos dominios diferentes y los algoritmos de aprendizaje supervisado han demostrado gran promesa en estas áreas. La clasificación de bienes en el comercio internacional en Brasil representa un desafío real debido a la complejidad involucrada en asignar los códigos de categoría correctos a un bien, especialmente considerando las penalizaciones fiscales e implicaciones legales de una clasificación incorrecta. Este trabajo se centra en el proceso de entrenamiento de un clasificador basado en representaciones de codificadores bidireccionales de transformers (BERT) para la clasificación fiscal de bienes con códigos MCN que son el sistema oficial de clasificación de productos de importación y exportación en Brasil. En particular, este artículo presenta resultados del uso de un modelo BERT específico preentrenado en idioma portugués, así como resultados del uso de un modelo BERT preentrenado multilingüe. Los resultados experimentales muestran que el modelo en portugués tuvo un rendimiento ligeramente mejor que el modelo multilingüe, logrando un MCC de 0.8491, y confirma que los clasificadores podrían usarse para mejorar el rendimiento de los especialistas en la clasificación de bienes.