CLARE: Construcción de Grafos de Conocimiento Interactivos y Conscientes del Contexto a partir de Transcripciones
Autores: Henry, Ryan; Gong, Jiaqi
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
CLARE: Construcción de Grafos de Conocimiento Interactivos y Conscientes del Contexto a partir de Transcripciones
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Gráficas de conocimiento
Extractor de relaciones automatizado
Corrección de transcripciones
KG editable y buscable
Modelos de lenguaje grandes
Refinamiento interactivo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los gráficos de conocimiento (KGs) representan un enfoque prometedor para detectar y corregir errores en transcripciones automáticas de audio y video. Sin embargo, la falta de herramientas accesibles deja a los revisores humanos con un apoyo limitado, ya que la construcción de KGs a partir de datos multimedia a menudo depende de conocimientos avanzados en programación o procesamiento de lenguaje natural. Presentamos el Extractor de Relaciones Automatizado LLM Personalizado (CLARE), un sistema que reduce esta barrera al combinar la extracción de relaciones consciente del contexto con una interfaz para la corrección de transcripciones y el refinamiento de KGs. Los usuarios importan medios sincronizados en el tiempo, corrigen transcripciones a través de la reproducción vinculada y generan un KG editable y buscable a partir del texto revisado. CLARE admite más de 150 modelos de lenguaje grande (LLMs) y modelos de incrustación, incluidas opciones locales adecuadas para datos sensibles a la privacidad. Evaluamos CLARE en el benchmark Medida de Información en Nodos y Bordes (MINE), que empareja artículos con hechos verídicos. Con una mínima afinación de parámetros, CLARE logró una precisión media de hechos del 82.1%, superando a la Generación de Gráficos de Conocimiento (KGGen, 64.8%) y a la Generación Aumentada por Recuperación de Gráficos (GraphRAG, 48.3%). Además, evaluamos el refinamiento interactivo revisitando los veinticinco gráficos con menor puntuación durante quince minutos cada uno y encontramos que la precisión de los hechos aumentó en un promedio del 22.7%. Estos hallazgos muestran que CLARE no solo supera métodos anteriores, sino que también permite mejoras eficientes impulsadas por el usuario. Al simplificar la ingestión, corrección y filtrado, CLARE hace que la construcción de KGs sea más accesible para los investigadores que trabajan con datos no estructurados.
Descripción
Los gráficos de conocimiento (KGs) representan un enfoque prometedor para detectar y corregir errores en transcripciones automáticas de audio y video. Sin embargo, la falta de herramientas accesibles deja a los revisores humanos con un apoyo limitado, ya que la construcción de KGs a partir de datos multimedia a menudo depende de conocimientos avanzados en programación o procesamiento de lenguaje natural. Presentamos el Extractor de Relaciones Automatizado LLM Personalizado (CLARE), un sistema que reduce esta barrera al combinar la extracción de relaciones consciente del contexto con una interfaz para la corrección de transcripciones y el refinamiento de KGs. Los usuarios importan medios sincronizados en el tiempo, corrigen transcripciones a través de la reproducción vinculada y generan un KG editable y buscable a partir del texto revisado. CLARE admite más de 150 modelos de lenguaje grande (LLMs) y modelos de incrustación, incluidas opciones locales adecuadas para datos sensibles a la privacidad. Evaluamos CLARE en el benchmark Medida de Información en Nodos y Bordes (MINE), que empareja artículos con hechos verídicos. Con una mínima afinación de parámetros, CLARE logró una precisión media de hechos del 82.1%, superando a la Generación de Gráficos de Conocimiento (KGGen, 64.8%) y a la Generación Aumentada por Recuperación de Gráficos (GraphRAG, 48.3%). Además, evaluamos el refinamiento interactivo revisitando los veinticinco gráficos con menor puntuación durante quince minutos cada uno y encontramos que la precisión de los hechos aumentó en un promedio del 22.7%. Estos hallazgos muestran que CLARE no solo supera métodos anteriores, sino que también permite mejoras eficientes impulsadas por el usuario. Al simplificar la ingestión, corrección y filtrado, CLARE hace que la construcción de KGs sea más accesible para los investigadores que trabajan con datos no estructurados.