paint-brush
Elaboración de perfiles multinivel de redes profundas basadas en situaciones y diálogos: conjunto de datos EMTDpor@kinetograph

Elaboración de perfiles multinivel de redes profundas basadas en situaciones y diálogos: conjunto de datos EMTD

Demasiado Largo; Para Leer

En este artículo, los investigadores proponen un marco multimodal para la clasificación de géneros cinematográficos, utilizando características de situación, diálogo y metadatos.
featured image - Elaboración de perfiles multinivel de redes profundas basadas en situaciones y diálogos: conjunto de datos EMTD
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item

Autores:

(1) Dinesh Kumar Vishwakarma, Laboratorio de Investigación Biométrica, Departamento de Tecnología de la Información, Universidad Tecnológica de Delhi, Delhi, India;

(2) Mayank Jindal, Laboratorio de Investigación Biométrica, Departamento de Tecnología de la Información, Universidad Tecnológica de Delhi, Delhi, India

(3) Ayush Mittal, Laboratorio de Investigación Biométrica, Departamento de Tecnología de la Información, Universidad Tecnológica de Delhi, Delhi, India

(4) Aditya Sharma, Laboratorio de Investigación Biométrica, Departamento de Tecnología de la Información, Universidad Tecnológica de Delhi, Delhi, India.

Tabla de enlaces

3. Conjunto de datos EMTD

Los conjuntos de datos de la literatura anterior carecen de la composición uniforme de los géneros cinematográficos. Por lo tanto, proponemos un EMTD (conjunto de datos de avances de películas en inglés) que consta de alrededor de 2000 avances de películas de Hollywood únicos descargados desde IMDB1. EMTD contiene 2000 avances únicos de 5 géneros, a saber: acción, comedia, terror, romance y ciencia ficción. El conjunto de datos se extrae de IMDB mediante el procedimiento de desguace web de la siguiente manera: (1) buscar la lista de títulos de películas disponibles en IMDB (con al menos 1 género común a uno mencionado anteriormente), (2) extraer metadatos correspondientes a cada título de película, incluido el avance enlace para descargar y (3) descargar los avances (.mp4) correspondientes al enlace en una carpeta, y enumerar toda la información/metadatos sobre la película, incluido el nombre del avance, las descripciones, la trama, las palabras clave y los géneros en forma de un archivo CSV. En este trabajo, el conjunto de datos se divide en conjunto de trenes (1700 remolques) y conjunto de validación (300 remolques), como se muestra en la Tabla 1.


El estudio se lleva a cabo con los géneros anteriores sólo porque la mayoría de estos géneros se observan en las películas. También queremos explorar el rendimiento de nuestra arquitectura primero en un pequeño conjunto de géneros, por lo que elegimos solo 5 géneros en lugar de ir hacia un conjunto amplio de géneros.


Tabla 1: Composición del conjunto de datos


Este documento está disponible en arxiv bajo licencia CC BY-NC-SA 4.0 DEED.