Bài viết này có sẵn trên arxiv theo giấy phép CC 4.0.
tác giả:
(1) Zhihang Ren, Đại học California, Berkeley và các tác giả này đã đóng góp như nhau cho công trình này (Email: [email protected]);
(2) Jefferson Ortega, Đại học California, Berkeley và các tác giả này đã đóng góp như nhau cho công trình này (Email: [email protected]);
(3) Yifan Wang, Đại học California, Berkeley và các tác giả này đã đóng góp như nhau cho công trình này (Email: [email protected]);
(4) Zhimin Chen, Đại học California, Berkeley (Email: [email protected]);
(5) Yunhui Guo, Đại học Texas tại Dallas (Email: [email protected]);
(6) Stella X. Yu, Đại học California, Berkeley và Đại học Michigan, Ann Arbor (Email: [email protected]);
(7) David Whitney, Đại học California, Berkeley (Email: [email protected]).
Tất cả các video được sử dụng trong bộ dữ liệu VEATIC đều được chọn từ trang web chia sẻ video trực tuyến (YouTube). Bộ dữ liệu VEATIC chứa 124 video clip, 104 clip từ phim Hollywood, 15 clip từ video gia đình và 5 clip từ phim tài liệu hoặc chương trình truyền hình thực tế. Cụ thể, chúng tôi phân loại Video tài liệu là bất kỳ video nào thể hiện tương tác xã hội thẳng thắn nhưng có một số hình thức chỉnh sửa video, trong khi video gia đình đề cập đến những video thể hiện tương tác xã hội thẳng thắn mà không cần chỉnh sửa video. Tất cả các Video trong tập dữ liệu đều có tốc độ khung hình là 25 khung hình/giây và có độ phân giải ở mức thấp nhất là 202 x 360 và cao nhất là 1920 x 1080.
Ngoại trừ tổng quan về các khung hình video trong Hình 2, chúng tôi hiển thị nhiều mẫu hơn trong Hình 9. Hơn nữa, không giống như các bộ dữ liệu được xuất bản trước đó trong đó hầu hết các khung hình đều chứa ký tự chính [31, 29, 32], VEATIC không chỉ có các khung chứa ký tự được chọn mà còn cũng có rất nhiều khung chứa các ký tự không được chọn và nền thuần túy (Hình 10). Do đó, VEATIC giống với các tình huống cuộc sống hàng ngày của chúng ta hơn và các thuật toán được đào tạo về nó sẽ hứa hẹn hơn cho các ứng dụng hàng ngày.
Bài viết này có sẵn trên arxiv theo giấy phép CC 4.0.