Hacia un análisis unificado y cuantitativo de los atributos de tomas cinematográficas
Autores: Li, Yuzhi; Tian, Feng; Xu, Haojun; Lu, Tianfeng
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Hacia un análisis unificado y cuantitativo de los atributos de tomas cinematográficas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Analizar
Atributos de disparo
Arquitectura
Movimiento-estático
Entrenamiento de extremo a extremo
Conjunto de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
El Análisis de Atributos de Toma Cinematográfica tiene como objetivo analizar los atributos intrínsecos de las tomas de películas. En métodos anteriores, se diseñaron arquitecturas especializadas para cada tarea específica y se basaron en el uso de mapas de flujo óptico. En este documento, consideramos el análisis de atributos de toma como una tarea unificada de asignación de peso estático de movimiento y proponemos una arquitectura de doble camino de movimiento-estático para reconocer varios atributos de toma. En esta arquitectura, diseñamos un nuevo módulo de generación de señales de acción para adaptar el proceso de entrenamiento de extremo a extremo en lugar de una red de flujo óptico preentrenada; y, para abordar el problema de muestras limitadas en conjuntos de datos de tomas de películas, diseñamos una estrategia de ajuste de tamaño fijo para permitir que la red utilice directamente modelos de transformadores de visión preentrenados mientras se adapta a las entradas de datos de toma a tasas de muestra arbitrarias. Además, analizamos cuantitativamente la sensibilidad de diferentes atributos de toma a las características de movimiento y estáticas por primera vez. Los resultados experimentales posteriores en dos conjuntos de datos, MovieShots y AVE, demuestran que nuestro método propuesto supera a todos los enfoques anteriores sin aumentar el costo computacional.
Descripción
El Análisis de Atributos de Toma Cinematográfica tiene como objetivo analizar los atributos intrínsecos de las tomas de películas. En métodos anteriores, se diseñaron arquitecturas especializadas para cada tarea específica y se basaron en el uso de mapas de flujo óptico. En este documento, consideramos el análisis de atributos de toma como una tarea unificada de asignación de peso estático de movimiento y proponemos una arquitectura de doble camino de movimiento-estático para reconocer varios atributos de toma. En esta arquitectura, diseñamos un nuevo módulo de generación de señales de acción para adaptar el proceso de entrenamiento de extremo a extremo en lugar de una red de flujo óptico preentrenada; y, para abordar el problema de muestras limitadas en conjuntos de datos de tomas de películas, diseñamos una estrategia de ajuste de tamaño fijo para permitir que la red utilice directamente modelos de transformadores de visión preentrenados mientras se adapta a las entradas de datos de toma a tasas de muestra arbitrarias. Además, analizamos cuantitativamente la sensibilidad de diferentes atributos de toma a las características de movimiento y estáticas por primera vez. Los resultados experimentales posteriores en dos conjuntos de datos, MovieShots y AVE, demuestran que nuestro método propuesto supera a todos los enfoques anteriores sin aumentar el costo computacional.