Este documento está disponible en arxiv bajo licencia CC 4.0.
Autores:
(1) Zhihang Ren, Universidad de California, Berkeley y estos autores contribuyeron igualmente a este trabajo (correo electrónico: [email protected]);
(2) Jefferson Ortega, Universidad de California, Berkeley y estos autores contribuyeron igualmente a este trabajo (correo electrónico: [email protected]);
(3) Yifan Wang, Universidad de California, Berkeley y estos autores contribuyeron igualmente a este trabajo (correo electrónico: [email protected]);
(4) Zhimin Chen, Universidad de California, Berkeley (correo electrónico: [email protected]);
(5) Yunhui Guo, Universidad de Texas en Dallas (correo electrónico: [email protected]);
(6) Stella X. Yu, Universidad de California, Berkeley y Universidad de Michigan, Ann Arbor (correo electrónico: [email protected]);
(7) David Whitney, Universidad de California, Berkeley (correo electrónico: [email protected]).
Todos los vídeos utilizados en el conjunto de datos VEATIC se seleccionaron de un sitio web para compartir vídeos en línea (YouTube). El conjunto de datos VEATIC contiene 124 clips de vídeo, 104 clips de películas de Hollywood, 15 clips de vídeos caseros y 5 clips de documentales o reality shows de televisión. Específicamente, clasificamos los videos documentales como cualquier video que muestra interacciones sociales sinceras pero que tienen algún tipo de edición de video, mientras que los videos caseros se refieren a videos que muestran interacciones sociales sinceras sin ninguna edición de video. Todos los vídeos del conjunto de datos tenían una velocidad de fotogramas de 25 fotogramas por segundo y su resolución variaba, siendo la más baja 202 x 360 y la más alta 1920 x 1080.
Excepto por la descripción general de los cuadros de video en la Figura 2, mostramos más muestras en la Figura 9. Además, a diferencia de los conjuntos de datos publicados anteriormente donde la mayoría de los cuadros contienen el personaje principal [31, 29, 32], VEATIC no solo tiene cuadros que contienen el personaje seleccionado sino También hay muchos fotogramas que contienen personajes no seleccionados y fondos puros (Figura 10). Por lo tanto, VEATIC es más similar a nuestros escenarios de la vida diaria y los algoritmos entrenados en él serán más prometedores para las aplicaciones diarias.
Este documento está disponible en arxiv bajo licencia CC 4.0.