paint-brush
VEATIC: Seguimiento de emociones y afectos basado en videos en un conjunto de datos contextual: más sobre estímulospor@kinetograph
208 lecturas

VEATIC: Seguimiento de emociones y afectos basado en videos en un conjunto de datos contextual: más sobre estímulos

Demasiado Largo; Para Leer

En este artículo, los investigadores presentan el conjunto de datos VEATIC para el reconocimiento de los afectos humanos, abordando las limitaciones de los conjuntos de datos existentes y permitiendo la inferencia basada en el contexto.
featured image - VEATIC: Seguimiento de emociones y afectos basado en videos en un conjunto de datos contextual: más sobre estímulos
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item

Este documento está disponible en arxiv bajo licencia CC 4.0.

Autores:

(1) Zhihang Ren, Universidad de California, Berkeley y estos autores contribuyeron igualmente a este trabajo (correo electrónico: [email protected]);

(2) Jefferson Ortega, Universidad de California, Berkeley y estos autores contribuyeron igualmente a este trabajo (correo electrónico: [email protected]);

(3) Yifan Wang, Universidad de California, Berkeley y estos autores contribuyeron igualmente a este trabajo (correo electrónico: [email protected]);

(4) Zhimin Chen, Universidad de California, Berkeley (correo electrónico: [email protected]);

(5) Yunhui Guo, Universidad de Texas en Dallas (correo electrónico: [email protected]);

(6) Stella X. Yu, Universidad de California, Berkeley y Universidad de Michigan, Ann Arbor (correo electrónico: [email protected]);

(7) David Whitney, Universidad de California, Berkeley (correo electrónico: [email protected]).

Tabla de enlaces

7. Más sobre estímulos

Todos los vídeos utilizados en el conjunto de datos VEATIC se seleccionaron de un sitio web para compartir vídeos en línea (YouTube). El conjunto de datos VEATIC contiene 124 clips de vídeo, 104 clips de películas de Hollywood, 15 clips de vídeos caseros y 5 clips de documentales o reality shows de televisión. Específicamente, clasificamos los videos documentales como cualquier video que muestra interacciones sociales sinceras pero que tienen algún tipo de edición de video, mientras que los videos caseros se refieren a videos que muestran interacciones sociales sinceras sin ninguna edición de video. Todos los vídeos del conjunto de datos tenían una velocidad de fotogramas de 25 fotogramas por segundo y su resolución variaba, siendo la más baja 202 x 360 y la más alta 1920 x 1080.


Excepto por la descripción general de los cuadros de video en la Figura 2, mostramos más muestras en la Figura 9. Además, a diferencia de los conjuntos de datos publicados anteriormente donde la mayoría de los cuadros contienen el personaje principal [31, 29, 32], VEATIC no solo tiene cuadros que contienen el personaje seleccionado sino También hay muchos fotogramas que contienen personajes no seleccionados y fondos puros (Figura 10). Por lo tanto, VEATIC es más similar a nuestros escenarios de la vida diaria y los algoritmos entrenados en él serán más prometedores para las aplicaciones diarias.


Este documento está disponible en arxiv bajo licencia CC 4.0.