Los Diez Minutos Que Shockearon al Mundo-Enseñando a la IA Generativa a Analizar el Debate Multimodal Trump-Zelensky
Autores: Poggi, Isabella; Scaramella, Tommaso; Violini, Sissy; Careri, Simona; Epure, Maria Désirée; Dragoni, Daniele
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Los Diez Minutos Que Shockearon al Mundo-Enseñando a la IA Generativa a Analizar el Debate Multimodal Trump-Zelensky
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Modelos de base
IA generativa
Análisis del discurso
Modelo Gemini 2.5
Discurso político
Análisis LEP
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Hoy en día, los modelos de fundación simulan las habilidades humanas en traducción, revisión de literatura, verificación de hechos, detección de noticias falsas, producción de novelas y poesía. Sin embargo, la IA generativa también se puede aplicar al análisis del discurso. Este estudio instruyó al modelo Gemini 2.5 para analizar el discurso político multimodal. Seleccionamos algunos fragmentos del debate Trump-Zelensky celebrado en la Casa Blanca el 28 de febrero de 2025 y anotamos cada oración, gesto, entonación, mirada y expresión facial en términos de análisis LEP (Logos, Ethos, Pathos) para evaluar cuándo los oradores, en palabras o comunicación corporal, se basan en la argumentación racional, enfatizan sus propios méritos o los deméritos de los oponentes, o expresan e intentan inducir emociones en la audiencia. A través de indicaciones detalladas, pedimos al modelo Gemini 2.5 que realizara el análisis LEP sobre los mismos fragmentos. Luego, considerando las anotaciones del humano y del modelo en paralelo, propusimos una métrica para comparar sus respectivos análisis y medir discrepancias, afinando finalmente un aviso optimizado para el mejor rendimiento del modelo, que en algunos casos superó el análisis del humano: una aplicación interesante, ya que el análisis LEP destaca aspectos profundos del discurso multimodal pero es muy laborioso, mientras que su versión automática nos permite interpretar grandes fragmentos de discurso de manera rápida pero confiable.
Descripción
Hoy en día, los modelos de fundación simulan las habilidades humanas en traducción, revisión de literatura, verificación de hechos, detección de noticias falsas, producción de novelas y poesía. Sin embargo, la IA generativa también se puede aplicar al análisis del discurso. Este estudio instruyó al modelo Gemini 2.5 para analizar el discurso político multimodal. Seleccionamos algunos fragmentos del debate Trump-Zelensky celebrado en la Casa Blanca el 28 de febrero de 2025 y anotamos cada oración, gesto, entonación, mirada y expresión facial en términos de análisis LEP (Logos, Ethos, Pathos) para evaluar cuándo los oradores, en palabras o comunicación corporal, se basan en la argumentación racional, enfatizan sus propios méritos o los deméritos de los oponentes, o expresan e intentan inducir emociones en la audiencia. A través de indicaciones detalladas, pedimos al modelo Gemini 2.5 que realizara el análisis LEP sobre los mismos fragmentos. Luego, considerando las anotaciones del humano y del modelo en paralelo, propusimos una métrica para comparar sus respectivos análisis y medir discrepancias, afinando finalmente un aviso optimizado para el mejor rendimiento del modelo, que en algunos casos superó el análisis del humano: una aplicación interesante, ya que el análisis LEP destaca aspectos profundos del discurso multimodal pero es muy laborioso, mientras que su versión automática nos permite interpretar grandes fragmentos de discurso de manera rápida pero confiable.