Análisis de credibilidad de contenido diseñado por el usuario utilizando técnicas de aprendizaje automático
Autores: Gayakwad, Milind; Patil, Suhas; Kadam, Amol; Joshi, Shashank; Kotecha, Ketan; Joshi, Rahul; Pandya, Sharnil; Gonge, Sudhanshu; Rathod, Suresh; Kadam, Kalyani; Shelke, Maya
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Análisis de credibilidad de contenido diseñado por el usuario utilizando técnicas de aprendizaje automático
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Información
Análisis de contenido
Credibilidad
Características
Algoritmos de regresión
Conjunto
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
El contenido es una forma de información diseñada por el usuario, por ejemplo, observación, percepción o revisión. Este tipo de información es más relevante para los usuarios, ya que pueden relacionarla con su experiencia. El problema de investigación es identificar la credibilidad y el porcentaje de credibilidad también. La evaluación de dicho contenido es importante para transmitir el correcto entendimiento de la información. Se utilizan diferentes técnicas para el análisis de contenido, como votar el contenido, técnicas de aprendizaje automático y evaluación manual para evaluar el contenido y la calidad de la información. En este artículo de investigación, se realiza un análisis de contenido recopilando el conjunto de datos de críticas de películas de Kaggle. Se extraen características y se seleccionan las características más relevantes para la experimentación. El efecto de estas características se analiza utilizando algoritmos de regresión base, como Regresión Lineal, Regresión Lasso, Regresión Ridge y Árbol de Decisión. La contribución de la investigación es diseñar un algoritmo de regresión de conjunto heterogéneo para la evaluación de la puntuación de credibilidad del contenido, que combina los métodos base mencionados anteriormente. Además, estos factores también se ajustan para obtener valores más cercanos al mínimo de Descenso de Gradiente. Se utilizan diferentes formas de Pérdida de Error, como Error Absoluto Medio, Error Cuadrático Medio, LogCosh, Huber y Jacobiano, y el rendimiento se optimiza introduciendo el sesgo de equilibrio. La precisión del algoritmo se compara con los algoritmos de regresión individuales y la regresión de conjunto por separado; esta precisión es del 96.29%.
Descripción
El contenido es una forma de información diseñada por el usuario, por ejemplo, observación, percepción o revisión. Este tipo de información es más relevante para los usuarios, ya que pueden relacionarla con su experiencia. El problema de investigación es identificar la credibilidad y el porcentaje de credibilidad también. La evaluación de dicho contenido es importante para transmitir el correcto entendimiento de la información. Se utilizan diferentes técnicas para el análisis de contenido, como votar el contenido, técnicas de aprendizaje automático y evaluación manual para evaluar el contenido y la calidad de la información. En este artículo de investigación, se realiza un análisis de contenido recopilando el conjunto de datos de críticas de películas de Kaggle. Se extraen características y se seleccionan las características más relevantes para la experimentación. El efecto de estas características se analiza utilizando algoritmos de regresión base, como Regresión Lineal, Regresión Lasso, Regresión Ridge y Árbol de Decisión. La contribución de la investigación es diseñar un algoritmo de regresión de conjunto heterogéneo para la evaluación de la puntuación de credibilidad del contenido, que combina los métodos base mencionados anteriormente. Además, estos factores también se ajustan para obtener valores más cercanos al mínimo de Descenso de Gradiente. Se utilizan diferentes formas de Pérdida de Error, como Error Absoluto Medio, Error Cuadrático Medio, LogCosh, Huber y Jacobiano, y el rendimiento se optimiza introduciendo el sesgo de equilibrio. La precisión del algoritmo se compara con los algoritmos de regresión individuales y la regresión de conjunto por separado; esta precisión es del 96.29%.