Anímate o Inanimado, Esa Es la Pregunta para los Modelos de Lenguaje Grandes
Autores: Pucci, Giulia; Zanzotto, Fabio Massimo; Ranaldi, Leonardo
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Anímate o Inanimado, Esa Es la Pregunta para los Modelos de Lenguaje Grandes
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Núcleo cognitivo
Animación
LLMs
Datos textuales
Comportamiento humano
Modelos GPT
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El núcleo cognitivo de los seres humanos está estrechamente relacionado con el concepto de animacidad, que influye significativamente en su memoria, visión y comprensión del lenguaje complejo. Mientras que la animacidad se refleja en el lenguaje a través de sutiles restricciones en verbos y adjetivos, también se adquiere y perfecciona a través de experiencias no lingüísticas. En la misma línea, sugerimos que la capacidad limitada de los LLM para comprender el lenguaje natural, particularmente en relación con la animacidad, proviene del hecho de que estos modelos se entrenan únicamente con datos textuales. Por lo tanto, surge la pregunta que este artículo pretende responder: ¿Pueden los LLM, en su sabiduría digital, procesar la animacidad de manera similar a como lo harían los humanos? Luego proponemos un análisis sistemático a través de enfoques de prompting. En particular, examinamos diferentes LLM utilizando contrastes léxicos controlados (sustantivos animados vs. inanimados) y contextos narrativos en los que entidades típicamente inanimadas se comportan como animadas. Los resultados revelan que, aunque los LLM han sido entrenados predominantemente con datos textuales, exhiben un comportamiento similar al humano cuando se enfrentan a entidades animadas e inanimadas típicas, en línea con estudios anteriores, específicamente en siete LLM seleccionados de tres familias principales: OpenAI (GPT-3.5, GPT-4), Meta (Llama2 7B, 13B, 70B) y Mistral (Mistral-7B, Mixtral). Los modelos GPT generalmente logran el rendimiento más consistente y similar al humano, y en algunas tareas, como juicios de plausibilidad y aceptabilidad de oraciones, incluso superan las líneas base humanas. Además, aunque en menor medida, los otros modelos también asumen resultados comparables. Por lo tanto, los LLM pueden adaptarse para comprender situaciones no convencionales al reconocer rarezas como animadas sin necesidad de interactuar con desencadenantes cognitivos no expresados en los que los humanos confían para descomponer animaciones.
Descripción
El núcleo cognitivo de los seres humanos está estrechamente relacionado con el concepto de animacidad, que influye significativamente en su memoria, visión y comprensión del lenguaje complejo. Mientras que la animacidad se refleja en el lenguaje a través de sutiles restricciones en verbos y adjetivos, también se adquiere y perfecciona a través de experiencias no lingüísticas. En la misma línea, sugerimos que la capacidad limitada de los LLM para comprender el lenguaje natural, particularmente en relación con la animacidad, proviene del hecho de que estos modelos se entrenan únicamente con datos textuales. Por lo tanto, surge la pregunta que este artículo pretende responder: ¿Pueden los LLM, en su sabiduría digital, procesar la animacidad de manera similar a como lo harían los humanos? Luego proponemos un análisis sistemático a través de enfoques de prompting. En particular, examinamos diferentes LLM utilizando contrastes léxicos controlados (sustantivos animados vs. inanimados) y contextos narrativos en los que entidades típicamente inanimadas se comportan como animadas. Los resultados revelan que, aunque los LLM han sido entrenados predominantemente con datos textuales, exhiben un comportamiento similar al humano cuando se enfrentan a entidades animadas e inanimadas típicas, en línea con estudios anteriores, específicamente en siete LLM seleccionados de tres familias principales: OpenAI (GPT-3.5, GPT-4), Meta (Llama2 7B, 13B, 70B) y Mistral (Mistral-7B, Mixtral). Los modelos GPT generalmente logran el rendimiento más consistente y similar al humano, y en algunas tareas, como juicios de plausibilidad y aceptabilidad de oraciones, incluso superan las líneas base humanas. Además, aunque en menor medida, los otros modelos también asumen resultados comparables. Por lo tanto, los LLM pueden adaptarse para comprender situaciones no convencionales al reconocer rarezas como animadas sin necesidad de interactuar con desencadenantes cognitivos no expresados en los que los humanos confían para descomponer animaciones.