paint-brush
„Kurosawa“: Der Assistent eines Drehbuchautors: Einschränkungen und Referenzenvon@teleplay

„Kurosawa“: Der Assistent eines Drehbuchautors: Einschränkungen und Referenzen

von Teleplay Technology 4m2024/05/23
Read on Terminal Reader

Zu lang; Lesen

In diesem Artikel stellen Forscher KUROSAWA vor, eine KI-Drehbuch-Workbench zur Plot- und Skripterstellung, die sich mit der Automatisierung in Unterhaltungsmedien befasst.
featured image - „Kurosawa“: Der Assistent eines Drehbuchautors: Einschränkungen und Referenzen
Teleplay Technology  HackerNoon profile picture
0-item

Autoren:

(1) Prerak Gandhi, Department of Computer Science and Engineering, Indian Institute of Technology Bombay, Mumbai, [email protected], und diese Autoren haben zu gleichen Teilen zu dieser Arbeit beigetragen;

(2) Vishal Pramanik, Department of Computer Science and Engineering, Indian Institute of Technology Bombay, Mumbai, vishalpramanik,[email protected], und diese Autoren haben zu gleichen Teilen zu dieser Arbeit beigetragen;

(3) Pushpak Bhattacharyya, Abteilung für Informatik und Ingenieurwesen, Indian Institute of Technology Bombay, Mumbai.

Linktabelle

8. Einschränkungen

• Im Plotgenerierungsdatensatz werden die Wikipedia-Plots manchmal nicht von professionellen Inhaltsautoren aus der Filmbranche geschrieben. Daher können diese Plots die Hauptereignisse des Films nicht enthalten.


• In einigen Fällen gelingt es dem Modell nicht, zusammenhängende Ereignisse zu erzeugen, und es kommt auch zu einer abrupten Einführung von Charakteren in die Handlung und die Szenen.


• Obwohl es nur wenige Male bemerkt wurde, enthält die generierte Handlung oder Szene wiederholte Klauseln oder Phrasen.


• Das Modell halluziniert und generiert sachlich falsche Dinge, sodass es nicht in der Lage ist, Biografien oder Dokumentationen zu erstellen.


• Die Handlung oder Szene entspricht möglicherweise nicht dem Thema der Eingabe oder dem Genre, das zusammen mit der Eingabeaufforderung erwähnt wurde.

Verweise

Selmer Bringsjord und David Ferrucci. 1999. Künstliche Intelligenz und literarische Kreativität: Im Kopf von Brutus, einer Erzählmaschine. Psychology Press.


Tom Brown, Benjamin Mann, Nick Ryder, Melanie Subbiah, Jared D Kaplan, Prafulla Dhariwal, Arvind Neelakantan, Pranav Shyam, Girish Sastry, Amanda Askell, et al. 2020. Sprachmodelle sind Lerner mit wenigen Versuchen. Fortschritte in neuronalen Informationsverarbeitungssystemen, 33:1877–1901.


Angela Fan, Mike Lewis und Yann Dauphin. 2018. Hierarchische neuronale Story-Generierung. arXiv-Preprint arXiv:1805.04833.


Angela Fan, Mike Lewis und Yann Dauphin. 2019. Strategien zur Strukturierung der Story-Generierung. arXiv-Preprint arXiv:1902.01109.


S. Field. 1979. Drehbuch: Die Grundlagen des Drehbuchschreibens. Ein Delta-Buch. Dell Publishing Company.


Chenyang Huang, Osmar R Zaiane, Amine Trabelsi und Nouha Dziri. 2018. Automatische Dialoggenerierung mit ausgedrückten Emotionen. In Proceedings der Konferenz 2018 des nordamerikanischen Kapitels der Association for Computational Linguistics: Human Language Technologies, Band 2 (Kurzbeiträge), Seiten 49–54.


Ting-Hao Huang, Francis Ferraro, Nasrin Mostafazadeh, Ishan Misra, Aishwarya Agrawal, Jacob Devlin, Ross Girshick, Xiaodong He, Pushmeet Kohli, Dhruv Batra, et al. 2016. Visuelles Geschichtenerzählen. In Proceedings der Konferenz 2016 des nordamerikanischen Kapitels der Vereinigung für Computerlinguistik: Human Language Technologies, Seiten 1233–1239.


Parag Jain, Priyanka Agrawal, Abhijit Mishra, Mohak Sukhwani, Anirban Laha und Karthik Sankaranarayanan. 2017. Story-Generierung aus einer Sequenz unabhängiger Kurzbeschreibungen. arXiv-Preprint arXiv:1707.05501.


Frederick Jelinek, Robert L. Mercer, Lalit R. Bahl und J. Baker. 1977. Perplexität – ein Maß für die Schwierigkeit von Spracherkennungsaufgaben. Journal of the Acoustical Society of America, 62.


Mihir Kale und Abhinav Rastogi. 2020. Vorlagengesteuerte Textgenerierung für aufgabenorientierten Dialog. arXiv-Vorabdruck arXiv:2004.15006.


Jiwei Li, Will Monroe, Alan Ritter, Michel Galley, Jianfeng Gao und Dan Jurafsky. 2016. Deep Reinforcement Learning zur Dialoggenerierung. arXiv-Preprint arXiv:1606.01541.


Rensis Likert. 1932. Eine Technik zur Messung von Einstellungen / von Rensis Likert. Archiv für Psychologie; NEIN. 140. [sn], New York.


Chin-Yew Lin. 2004. ROUGE: Ein Paket zur automatischen Auswertung von Zusammenfassungen. In Text Summarization Branches Out, Seiten 74–81, Barcelona, Spanien. Association for Computational Linguistics.


Kishore Papineni, Salim Roukos, Todd Ward und WeiJing Zhu. 2002. Bleu: eine Methode zur automatischen Auswertung maschineller Übersetzungen. In Proceedings der 40. Jahrestagung der Association for Computational Linguistics, Seiten 311–318.


Rafael Pérez Ý Pérez und Mike Sharples. 2001. Mexica: Ein Computermodell einer kognitiven Darstellung des kreativen Schreibens. Journal of Experimental & Theoretical Artificial Intelligence, 13(2):119–139.


Krishna Pillutla, Swabha Swayamdipta, Rowan Zellers, John Thickstun, Sean Welleck, Yejin Choi und Zaid Harchaoui. 2021. Mauve: Messung der Lücke zwischen neuronalem und menschlichem Text mithilfe von Divergenzgrenzen. Advances in Neural Information Processing Systems, 34:4816–4828.


Hannah Rashkin, Asli Celikyilmaz, Yejin Choi und Jianfeng Gao. 2020. Plotmachines: Outline-bedingte Generierung mit dynamischer Plot-Statusverfolgung. arXiv-Vorabdruck arXiv:2004.14967.


Mark O Riedl und Robert Michael Young. 2010. Narrative Planung: Handlung und Charakter ins Gleichgewicht bringen. Journal of Artificial Intelligence Research, 39:217–268.


Jianheng Tang, Tiancheng Zhao, Chenyan Xiong, Xiaodan Liang, Eric Xing und Zhiting Hu. 2019. Zielgerichtete Open-Domain-Konversation. In Proceedings der 57. Jahrestagung der Association for Computational Linguistics, Seiten 5624–5634, Florenz, Italien. Association for Computational Linguistics.


Zhe Wang, Wei He, Hua Wu, Haiyang Wu, Wei Li, Haifeng Wang und Enhong Chen. 2016. Chinesische Gedichtegenerierung mit einem planungsbasierten neuronalen Netzwerk. arXiv-Vorabdruck arXiv:1610.09889.


Wenquan Wu, Zhen Guo, Xiangyang Zhou, Hua Wu, Xiyuan Zhang, Rongzhong Lian und Haifeng Wang. 2019. Proaktive Mensch-Maschine-Konversation mit explizitem Gesprächsziel. In Proceedings der 57. Jahrestagung der Association for Computational Linguistics, Seiten 3794–3804, Florenz, Italien. Association for Computational Linguistics.


Rui Yan. 2016. i, poet: Automatisches Verfassen von Gedichten durch rekurrierende neuronale Netze mit iterativem Polierschema. In IJCAI, Band 2238, Seite 2244.


Zheng Zhao, Shay B Cohen und Bonnie Webber. 2020. Reduzierung von Quantitätshalluzinationen bei abstrakter Zusammenfassung. arXiv-Vorabdruck arXiv:2009.13312.


Yutao Zhu, Ruihua Song, Zhicheng Dou, Jian-Yun Nie und Jin Zhou. 2020. ScriptWriter: Narrativ orientierte Drehbucherstellung. In Proceedings der 58. Jahrestagung der Association for Computational Linguistics, Seiten 8647–8657, Online. Association for Computational Linguistics.