Comparación de las características gramaticales de los corpus escritos por humanos y los textos generados por máquinas utilizando un nuevo analizador basado en reglas
Autores: Strübbe, Simon; Sidorenko, Irina; Lampe, Renée
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Comparación de las características gramaticales de los corpus escritos por humanos y los textos generados por máquinas utilizando un nuevo analizador basado en reglas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Prevalencia
Textos escritos por máquinas
Métodos de detección de IA
Humanización
Características gramaticales
Analizador basado en reglas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
A medida que la prevalencia de los textos escritos por máquinas crece, se ha vuelto cada vez más importante distinguir entre el contenido generado por humanos y el generado por máquinas, especialmente cuando dichos textos no están etiquetados explícitamente. Los métodos actuales de detección de inteligencia artificial (IA) se centran principalmente en características similares a las humanas, como la emocionalidad y la subjetividad. Sin embargo, estas características pueden ser fácilmente modificadas a través de la humanización de la IA, que implica alterar la elección de palabras. En contraste, alterar la gramática subyacente sin afectar la información transmitida es considerablemente más desafiante. Así, las características gramaticales de un texto pueden ser utilizadas como indicadores adicionales de su origen. Para abordar esto, empleamos un analizador basado en reglas recién desarrollado para analizar las estructuras gramaticales en textos escritos por humanos y por máquinas. Nuestros hallazgos revelan diferencias gramaticales sistemáticas entre los textos escritos por humanos y por máquinas, proporcionando un criterio fiable para la determinación del origen del texto. Además, examinamos la estabilidad de este criterio en el contexto de la humanización de la IA y la traducción a otros idiomas.
Descripción
A medida que la prevalencia de los textos escritos por máquinas crece, se ha vuelto cada vez más importante distinguir entre el contenido generado por humanos y el generado por máquinas, especialmente cuando dichos textos no están etiquetados explícitamente. Los métodos actuales de detección de inteligencia artificial (IA) se centran principalmente en características similares a las humanas, como la emocionalidad y la subjetividad. Sin embargo, estas características pueden ser fácilmente modificadas a través de la humanización de la IA, que implica alterar la elección de palabras. En contraste, alterar la gramática subyacente sin afectar la información transmitida es considerablemente más desafiante. Así, las características gramaticales de un texto pueden ser utilizadas como indicadores adicionales de su origen. Para abordar esto, empleamos un analizador basado en reglas recién desarrollado para analizar las estructuras gramaticales en textos escritos por humanos y por máquinas. Nuestros hallazgos revelan diferencias gramaticales sistemáticas entre los textos escritos por humanos y por máquinas, proporcionando un criterio fiable para la determinación del origen del texto. Además, examinamos la estabilidad de este criterio en el contexto de la humanización de la IA y la traducción a otros idiomas.