Bu makale arxiv'de CC 4.0 lisansı altında mevcuttur.
Yazarlar:
(1) Zhihang Ren, Kaliforniya Üniversitesi, Berkeley ve bu yazarlar bu çalışmaya eşit katkıda bulunmuşlardır (E-posta: [email protected]);
(2) Jefferson Ortega, California Üniversitesi, Berkeley ve bu yazarlar bu çalışmaya eşit katkıda bulunmuşlardır (E-posta: [email protected]);
(3) Yifan Wang, California Üniversitesi, Berkeley ve bu yazarlar bu çalışmaya eşit katkıda bulunmuşlardır (E-posta: [email protected]);
(4) Zhimin Chen, Kaliforniya Üniversitesi, Berkeley (E-posta: [email protected]);
(5) Yunhui Guo, Dallas'taki Texas Üniversitesi (E-posta: [email protected]);
(6) Stella X. Yu, Kaliforniya Üniversitesi, Berkeley ve Michigan Üniversitesi, Ann Arbor (E-posta: [email protected]);
(7) David Whitney, Kaliforniya Üniversitesi, Berkeley (E-posta: [email protected]).
VEATIC veri setinde kullanılan tüm videolar çevrimiçi bir video paylaşım web sitesinden (YouTube) seçilmiştir. VEATIC veri seti 124 video klip, Hollywood filmlerinden 104 klip, ev videolarından 15 klip ve belgesellerden veya reality TV şovlarından 5 klip içeriyor. Özellikle, Belgesel videoları, samimi sosyal etkileşimler gösteren ancak bir tür video düzenlemesi içeren videolar olarak sınıflandırırız; ev videoları ise herhangi bir video düzenlemesi olmadan samimi sosyal etkileşimler gösteren videolar anlamına gelir. Veri kümesindeki tüm Videolar saniyede 25 kare kare hızına sahipti ve çözünürlükleri en düşük 202 x 360 ve en yüksek 1920 x 1080 olacak şekilde değişiyordu.
Şekil 2'deki video karelerinin genel görünümü dışında, Şekil 9'da daha fazla örnek gösteriyoruz. Ayrıca, çoğu karenin ana karakteri içerdiği daha önce yayınlanmış veri setlerinin aksine [31, 29, 32], VEATIC yalnızca seçilen karakteri içeren karelere sahip olmakla kalmıyor, aynı zamanda ayrıca seçilmemiş karakterler ve saf arka planlar içeren çok sayıda çerçeve vardır (Şekil 10). Dolayısıyla VEATIC günlük hayat senaryolarımıza daha çok benzemekte ve üzerinde eğitilen algoritmalar günlük uygulamalar için daha umut verici olacaktır.
Bu makale arxiv'de CC 4.0 lisansı altında mevcuttur .