Clasificación de tomas cinematográficas con aprendizaje profundo en conjunto
Autores: Vacchetti, Bartolomeo; Cerquitelli, Tania
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Clasificación de tomas cinematográficas con aprendizaje profundo en conjunto
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Toma cinematográfica
Tamaño de campo
Movimiento de cámara
Automatización
Campo creativo visual
Modelos VGG-16
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
La clasificación de planos cinematográficos asigna una categoría a cada plano ya sea en función del tamaño del campo o del movimiento realizado por la cámara. En este trabajo, nos enfocamos en el campo de visión de la cámara, el cual es determinado por la porción del sujeto y del entorno mostrado en el campo de visión de la cámara. La automatización de esta tarea puede ayudar a freelancers y estudios pertenecientes al campo creativo visual en sus actividades diarias. En nuestro estudio, tomamos en cuenta ocho clases de planos de película: , , , , , , y . La clasificación de planos cinematográficos es una tarea compleja, por lo que combinamos técnicas de vanguardia para abordarla. Específicamente, ajustamos tres modelos VGG-16 separados y combinamos sus predicciones para obtener mejores rendimientos explotando la técnica de aprendizaje por apilamiento. Los resultados experimentales demuestran la efectividad del enfoque propuesto en realizar la tarea de clasificación con buena precisión. Nuestro método logró alcanzar un 77% de precisión sin depender de técnicas de aumento de datos. También evaluamos nuestro enfoque en términos de puntuación f1, precisión y recuperación, y mostramos matrices de confusión para demostrar que la mayoría de nuestras muestras mal clasificadas pertenecían a una clase vecina.
Descripción
La clasificación de planos cinematográficos asigna una categoría a cada plano ya sea en función del tamaño del campo o del movimiento realizado por la cámara. En este trabajo, nos enfocamos en el campo de visión de la cámara, el cual es determinado por la porción del sujeto y del entorno mostrado en el campo de visión de la cámara. La automatización de esta tarea puede ayudar a freelancers y estudios pertenecientes al campo creativo visual en sus actividades diarias. En nuestro estudio, tomamos en cuenta ocho clases de planos de película: , , , , , , y . La clasificación de planos cinematográficos es una tarea compleja, por lo que combinamos técnicas de vanguardia para abordarla. Específicamente, ajustamos tres modelos VGG-16 separados y combinamos sus predicciones para obtener mejores rendimientos explotando la técnica de aprendizaje por apilamiento. Los resultados experimentales demuestran la efectividad del enfoque propuesto en realizar la tarea de clasificación con buena precisión. Nuestro método logró alcanzar un 77% de precisión sin depender de técnicas de aumento de datos. También evaluamos nuestro enfoque en términos de puntuación f1, precisión y recuperación, y mostramos matrices de confusión para demostrar que la mayoría de nuestras muestras mal clasificadas pertenecían a una clase vecina.