SMPT: Una técnica de predicción multi-modelo semi-supervisada para la construcción del conjunto de datos de reconocimiento de entidades nombradas de ingredientes alimentarios (FINER)
Autores: Komariah, Kokoy Siti; Purnomo, Ariana Tulus; Satriawan, Ardianto; Hasanuddin, Muhammad Ogin; Setianingsih, Casi; Sin, Bong-Kee
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
SMPT: Una técnica de predicción multi-modelo semi-supervisada para la construcción del conjunto de datos de reconocimiento de entidades nombradas de ingredientes alimentarios (FINER)
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Ingredientes de comida
Receta en línea
Preferencia de dieta saludable
Reconocimiento de entidades nombradas
Sistema NER
Técnica de predicción multimodal semisupervisada
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Para llevar un estilo de vida saludable, las personas están cada vez más preocupadas por los ingredientes de sus alimentos. Recientemente, se ha convertido en una práctica común utilizar una receta en línea para seleccionar los ingredientes que coinciden con el plan de comidas y las preferencias dietéticas saludables de un individuo. La información de las recetas en línea se puede extraer y utilizar para desarrollar diversas aplicaciones relacionadas con la alimentación. El reconocimiento de entidades nombradas (NER) se utiliza a menudo para extraer dicha información. Sin embargo, el problema al construir un sistema NER radica en la gran cantidad de datos necesarios para entrenar al clasificador, especialmente en un dominio específico, como la alimentación. Existen conjuntos de datos de NER de alimentos disponibles, pero todavía son bastante limitados. Por lo tanto, proponemos un enfoque de autoentrenamiento iterativo llamado técnica de predicción multimodal semisupervisada (SMPT) para construir un conjunto de datos de NER de ingredientes alimentarios. SMPT es un modelo de aprendizaje profundo en conjunto que emplea el concepto de autoentrenamiento y utiliza múltiples modelos de lenguaje preentrenados en el proceso de etiquetado de datos iterativo, con un mecanismo de votación utilizado como la decisión final para determinar la etiqueta de la entidad. Utilizando el SMPT, hemos creado un nuevo conjunto de datos anotados de entidades de ingredientes obtenidos del sitio web Allrecipes llamado FINER. Finalmente, este estudio tiene como objetivo utilizar el conjunto de datos FINER como un recurso alternativo para apoyar la investigación y el desarrollo en computación alimentaria.
Descripción
Para llevar un estilo de vida saludable, las personas están cada vez más preocupadas por los ingredientes de sus alimentos. Recientemente, se ha convertido en una práctica común utilizar una receta en línea para seleccionar los ingredientes que coinciden con el plan de comidas y las preferencias dietéticas saludables de un individuo. La información de las recetas en línea se puede extraer y utilizar para desarrollar diversas aplicaciones relacionadas con la alimentación. El reconocimiento de entidades nombradas (NER) se utiliza a menudo para extraer dicha información. Sin embargo, el problema al construir un sistema NER radica en la gran cantidad de datos necesarios para entrenar al clasificador, especialmente en un dominio específico, como la alimentación. Existen conjuntos de datos de NER de alimentos disponibles, pero todavía son bastante limitados. Por lo tanto, proponemos un enfoque de autoentrenamiento iterativo llamado técnica de predicción multimodal semisupervisada (SMPT) para construir un conjunto de datos de NER de ingredientes alimentarios. SMPT es un modelo de aprendizaje profundo en conjunto que emplea el concepto de autoentrenamiento y utiliza múltiples modelos de lenguaje preentrenados en el proceso de etiquetado de datos iterativo, con un mecanismo de votación utilizado como la decisión final para determinar la etiqueta de la entidad. Utilizando el SMPT, hemos creado un nuevo conjunto de datos anotados de entidades de ingredientes obtenidos del sitio web Allrecipes llamado FINER. Finalmente, este estudio tiene como objetivo utilizar el conjunto de datos FINER como un recurso alternativo para apoyar la investigación y el desarrollo en computación alimentaria.