paint-brush
"Kurosawa" : l'assistant d'un scénariste : annexepar@teleplay
149 lectures

"Kurosawa" : l'assistant d'un scénariste : annexe

par Teleplay Technology 5m2024/05/23
Read on Terminal Reader

Trop long; Pour lire

Dans cet article, les chercheurs présentent KUROSAWA, un atelier d’écriture de scripts d’IA pour la génération d’intrigues et de scripts, traitant de l’automatisation dans les médias de divertissement.
featured image - "Kurosawa" : l'assistant d'un scénariste : annexe
Teleplay Technology  HackerNoon profile picture
0-item

Auteurs:

(1) Prerak Gandhi, Département d'informatique et d'ingénierie, Institut indien de technologie de Bombay, Mumbai, [email protected], et ces auteurs ont contribué à parts égales à ce travail ;

(2) Vishal Pramanik, Département d'informatique et d'ingénierie, Institut indien de technologie de Bombay, Mumbai, vishalpramanik, [email protected], et ces auteurs ont contribué à parts égales à ce travail ;

(3) Pushpak Bhattacharyya, Département d'informatique et d'ingénierie, Institut indien de technologie de Bombay, Mumbai.

Tableau des liens

A. Annexe

A.1. Considération éthique

Nous avons récupéré tous les scripts des bases de données IMDB et IMSDb. Le site Web contient une clause de non-responsabilité concernant l'utilisation de ses scripts à des fins de recherche, qui peut être consultée sur ce lien https://imsdb.com/disclaimer.html. Nous avons utilisé les scripts de manière équitable et sans violation du droit d'auteur.

A.2. Profils d'annotateur

Nous avons eu besoin de l'aide d'annotateurs externes dans deux cas : (i) Annoter manuellement les scripts et (ii) Créer des scènes et leurs descriptions à partir des scripts. Pour la première tâche, nous avons fait appel à 10 annotateurs. Leurs âges variaient entre 21 et 28 ans et tous étaient asiatiques. Ils ont reçu des directives détaillées avec des exemples à annoter. Il y avait aussi des séances périodiques pour confirmer leur compréhension et résoudre leurs doutes et leurs erreurs. Pour la deuxième tâche, nous avons fait appel à deux annotateurs. Ce sont toutes deux des femmes asiatiques âgées de 21 à 23 ans. Tous deux ont reçu des directives détaillées pour la tâche d’écriture de la scène. Quelques points de données ont été sélectionnés au hasard et vérifiés pour découvrir et corriger les erreurs conceptuelles. Les annotateurs étaient titulaires d'un baccalauréat et d'une maîtrise en STEM et en arts.

A.3. Paramètres d'évaluation

Les mesures d’évaluation sont décrites ci-dessous :


• Perplexité (PPL) : la perplexité est l'une des mesures les plus courantes pour évaluer les modèles de langage. Ils sont calculés comme exponentielle de l'entropie. Plus la valeur du PPL est petite, plus la fluidité du texte généré est grande.


• BLEU : évaluation bilingue La compréhension est une mesure courante dans de nombreuses tâches de PNL, en particulier dans le domaine de la traduction automatique. Il mesure le chevauchement entre la sortie générée et les données de référence. Bien que cette métrique ne prenne pas en compte la créativité du modèle, nous pouvons en déduire la différence entre le texte candidat et le texte de référence en utilisant BLEU. Plus la mesure BLEU est élevée, mieux c'est.


• ROUGE : Étude orientée sur le rappel pour l'évaluation G isting L' évaluation est généralement utilisée pour évaluer la synthèse automatique. Dans notre cas, il mesure la plus longue séquence superposée entre les tracés générés et originaux. Plus la mesure ROUGE est élevée, mieux c'est.


• N-grammes : Nous mesurons la redondance et la diversité des intrigues du film en calculant les scores de répétition et de distinction n-grammes.

A.4. Structure du scénario

Un scénario de film ou un scénario a un format différent de celui d'une histoire. Un script est un groupe de scènes. Chacune de ces scènes se compose de quelques éléments principaux, qui sont discutés ci-dessous :


En-têtes de scène/Sluglines - Ce composant décrit le moment et le lieu de la scène. Cela peut être considéré comme la première photo prise par une caméra d’une nouvelle scène. Par exemple, INT. - RESTAURANT - NUIT indique que la scène commence à l'intérieur d'un restaurant la nuit. Les sluglines sont normalement écrites en majuscules et alignées à gauche.


Noms des personnages - ils sont mentionnés chaque fois qu'un personnage va prononcer un dialogue. Le nom de chaque personnage est mentionné en majuscule et aligné au centre.


Dialogues - les dialogues sont les lignes que disent les personnages. Ils apparaissent juste après le nom du personnage dans un script et sont alignés au centre.


Lignes d'action : les lignes d'action décrivent presque tout ce qui concerne une scène. Ils peuvent être décrits comme la narration de chaque scénario. Les lignes d'action peuvent être présentes après les dialogues ou les sluglines et sont alignées à gauche.


Transitions - une transition marque le passage d'une scène à la suivante. Ils décrivent également la fin d'une scène. Par exemple, DISSOLVE, FADE et CUT sont des mots-clés différents utilisés pour indiquer une transition. Ils sont généralement en majuscules et alignés à droite.


La figure 8 montre un exemple des éléments du scénario.

A.5. Modèles d'histoire

Au fil du temps, divers modèles ont été développés pour aider à créer des histoires. L'un des modèles les plus connus est la structure en 3 actes (Field, 1979). Cette structure divise une histoire en une configuration, une confrontation et une résolution. Dans ce travail, nous avons utilisé la structure en 4 actes que nous décrivons maintenant en détail.


Acte 1 - C'est l'acte d'ouverture/introduction. Il décrit le personnage du protagoniste et présente brièvement le thème du film. L'acte se termine avec le début d'un nouveau voyage pour le protagoniste.


Acte 2A - En raison de la vaste étendue de l'acte 2, il peut être divisé en deux actes. Cet acte contient généralement le début d'une histoire d'amour. Cela divertit également le public alors que le protagoniste tente de s'adapter à son nouveau voyage. L'acte se termine au milieu du film, l'un des moments critiques du film, avec une scène soit très positive, soit négative.


Acte 2B – Cet acte contient généralement la chute du protagoniste. Le méchant ou l'antagoniste commence à prendre un avantage et le protagoniste perd quelque chose ou quelqu'un d'important. L'acte se termine avec le protagoniste réalisant sa nouvelle mission après avoir touché le fond.


Acte 3 — Le protagoniste a réalisé le changement requis en lui et entreprend de vaincre l'antagoniste dans une finale passionnante. Le film se termine ensuite en affichant un changement bienvenu chez le protagoniste qui manquait au début.


Figure 6 : Exemple d'annotation manuelle de l'intrigue du film Music of the Heart en utilisant la structure en 4 actes

A.6. Réglage fin de GPT-3

GPT-3 a été jugé accessible au public l'année dernière par OpenAI (Brown et al., 2020). Son meilleur modèle a 175B de paramètres, ce qui est bien plus que les 2,9B de GPT2. Nous avons affiné plusieurs modèles de génération d'intrigues avec GPT-3 ainsi qu'un modèle de génération de scènes. Les multiples combinaisons de modèles de génération d'intrigues sont des invites courtes ou longues et avec ou sans genres. Le modèle GPT-3 et les hyperparamètres restent les mêmes pour toutes les combinaisons ci-dessus. Nous avons affiné le modèle GPT-3 Curie pour quatre époques. Pour générer du texte, GPT-3 propose divers hyperparamètres pour ajuster et se rapprocher des résultats souhaités. Pour les tests, nous définissons d'autres hyperparamètres comme suit : la température sur 0,7, le top-p sur 1, la pénalité de fréquence sur 0,1, la pénalité de présence sur 0,1 et le nombre maximal de jetons sur 900.


Figure 7 : Un exemple de scène complète générée avec une courte entrée.


Figure 8 : Les éléments d'un scénario


Cet article est disponible sur arxiv sous licence CC 4.0 DEED.