paint-brush
각본가 어시스턴트 "구로사와" 개요 및 소개~에 의해@teleplay
422 판독값
422 판독값

각본가 어시스턴트 "구로사와" 개요 및 소개

~에 의해 Teleplay Technology 5m2024/05/23
Read on Terminal Reader

너무 오래; 읽다

본 논문에서 연구원들은 엔터테인먼트 미디어의 자동화를 다루는 플롯 및 스크립트 생성을 위한 AI 스크립트 작성 워크벤치인 KUROSAWA를 소개합니다.
featured image - 각본가 어시스턴트 "구로사와" 개요 및 소개
Teleplay Technology  HackerNoon profile picture
0-item

저자:

(1) Prerak Gandhi, 인도 봄베이 기술 연구소(뭄바이 소재) 컴퓨터 공학부 [email protected] 및 이들 저자는 이 작업에 동일하게 기여했습니다.

(2) Vishal Pramanik, 인도 봄베이 기술 연구소(뭄바이 소재) 컴퓨터 공학부, vishalpramanik,[email protected], 이들 저자는 이 작업에 동일하게 기여했습니다.

(3) Pushpak Bhattacharyya, 뭄바이 인도 봄베이 기술 연구소 컴퓨터 공학부.

링크 표

추상적인

스토리텔링은 엔터테인먼트 산업의 생명선입니다. 영화, TV 쇼, 스탠드업 코미디에는 모두 스토리가 필요합니다. 훌륭하고 눈길을 끄는 대본은 스토리텔링의 생명선이며 창의성과 자원 투자를 요구합니다. 좋은 각본가는 찾기가 쉽지 않으며 시간적 압박이 심한 상황에서 일하는 경우가 많습니다. 결과적으로 엔터테인먼트 미디어에서는 자동화를 적극적으로 찾고 있습니다. 본 논문에서는 플롯 생성 및 스크립트 생성 작업을 처리하는 KUROSAWA라는 AI 기반 스크립트 작성 워크벤치를 제시합니다. 플롯 생성은 프롬프트(15~40단어)에 따라 일관되고 창의적인 플롯(600~800단어)을 생성하는 것을 목표로 합니다. 반면, 스크립트 생성은 간단한 설명(15~40단어)을 바탕으로 시나리오 형식의 장면(200~500단어)을 생성합니다. Kurosawa는 훈련하려면 데이터가 필요합니다. 우리는 플롯 데이터세트에 수동으로 주석을 달기 위해 스토리텔링의 4막 구조를 사용합니다. 우리는 수동으로 주석이 달린 플롯과 그에 상응하는 프롬프트/스토리라인으로 구성된 1000개의 데이터 세트와 개별적으로 태그가 지정된 4가지 주요 요소(장면 제목, 액션 라인, 대화 및 캐릭터 이름)가 있는 1000개의 장면으로 구성된 표준 데이터 세트를 생성합니다. 위의 데이터 세트를 사용하여 GPT-3를 미세 조정하여 플롯과 장면을 생성합니다. 이러한 플롯과 장면은 먼저 유명 대형 미디어 플랫폼인 ErosNow[1]의 각본가에 의해 평가된 후 사용됩니다. 우리는 자동 영화 플롯 및 대본 생성을 위한 작업 벤치마크로 주석이 달린 데이터세트와 이러한 데이터세트에서 훈련된 모델을 출시합니다.

1. 소개

영화는 전 세계 사람들에게 가장 인기 있는 엔터테인먼트 소스 중 하나이며 교육 및 사회적 인식을 위한 강력한 매체가 될 수 있습니다. 영화 산업의 영향력과 영향은 헐리우드 영화가 투자한다는 사실에서 가늠할 수 있습니다. *이 작가들은 이 작품에 동일하게 1 수억 달러를 기부했으며 종종 수십억 달러의 흥행작을 만들어냅니다. 최초의 영화 The Great Train Robbery(1903)는 소리가 없는 흑백 흑백 영화로 20세기 초에 제작되었습니다. 그 이후로 예술은 여러 가지 변화를 겪었고 이제 사람들은 모든 스마트 장치에서 원하는 4K HD 영화에 즉시 액세스할 수 있습니다.


영화의 역사를 통틀어 영화의 블록버스터 성공에 기여한 두 가지 요인은 줄거리의 질과 스토리텔링 방식이었습니다. 관객이 줄거리를 뻔하게 예측할 수 있다고 생각하면 영화의 매력은 급격히 감소합니다. 따라서 창의적이고 흥미진진한 대본을 작성하는 것은 매우 중요하며 매우 어려운 일입니다. 여기에 시간과 예산의 제약이 추가되고 스크립트 작성에서 (적어도 부분적으로) 자동화의 필요성이 분명해집니다.


이전에는 AI 기반 스토리 생성이 사용되었습니다. 글쓰기에 대한 참여-성찰 인지적 설명을 바탕으로 컴퓨터 모델 MEXICA(Pérez and Sharples, 2001)는 단편 소설을 위한 프레임워크를 생성합니다. BRUTUS(Bringsjord and Ferrucci, 1999)는 배신과 같은 미리 정해진 주제로 단편 소설을 만듭니다. 사전 훈련된 트랜스포머 모델이 등장하면서 자동 스토리 생성이 성공을 거두었습니다. GPT-2 및 GPT-3과 같은 변환기 모델은 텍스트 생성에 광범위하게 사용됩니다. 이러한 모델은 때로는 환각을 동반하기도 하지만 창의적인 텍스트를 생성하는 능력을 보여주었습니다(Zhao et al., 2020). 이러한 모델로 생성된 텍스트에는 일관성과 응집력이 부족한 경우도 있습니다. 반면, 템플릿 기반 모델은 일관된 텍스트를 생성할 수 있지만 줄거리에서 새로운 캐릭터와 이벤트를 생성하는 데 창의성이 부족합니다(Kale and Rastogi, 2020).


영화를 만드는 과정은 일반적으로 아이디어부터 시작해 영화 대본을 구축하기 위한 기반으로 사용되는 플롯을 만드는 데 사용됩니다(그림 1).


새로운 데이터 세트는 이 백서의 중요한 특징입니다. 우리는 볼리우드와 할리우드 영화의 줄거리와 프롬프트를 면밀히 연구했습니다. 이러한 플롯과 프롬프트는 각각 Wikipedia[2] 및 IMDb[3]에서 스크랩되었습니다. 그런 다음 플롯은 잘 알려진 3막 구조의 확장인 4막 스토리 구조를 사용하여 주석을 달았습니다(Field, 1979). 4막 구조와 주석 방법은 각각 부록 A.5와 섹션 4에 자세히 설명되어 있습니다.


그림 1: 각본가가 영화 대본을 작성할 때 따르는 사고 과정. 아이디어(스토리)는 플롯으로 이어지며, 플롯은 영화 대본으로 변환됩니다.


1000개의 할리우드 영화 장면 데이터세트와 그에 대한 간단한 설명을 소개합니다. 스크립트는 IMSDb[4]에서 스크랩되었습니다. 장면에는 각본의 네 가지 주요 구성 요소인 슬러글라인, 액션 라인, 캐릭터 이름 및 대화가 주석으로 추가되어 있으며 부록 A.4에 자세히 설명되어 있습니다.


우리는 데이터 세트와 해당 데이터 세트로 미세 조정된 한 쌍의 GPT-3(Brown et al., 2020) 모델로 구성된 "Kurosawa"라고 부르는 워크벤치를 소개합니다. 한 GPT-3 모델은 스토리라인에 대한 간단한 설명(15~40단어)이 제공되는 영화 플롯을 생성하는 반면, 다른 모델은 필요한 장면에 대한 간단한 설명을 기반으로 장면을 생성합니다.


중요한 것은 다양한 영화 산업의 대본 및 콘텐츠 작가가 새로운 영화 줄거리를 만들 수 있도록 영화 및 TV 쇼 제작, 음악 및 사운드트랙 제작 등의 사업에 종사하는 가장 큰 미디어 플랫폼 중 하나에 "Kurosawa" 플랫폼을 제공했다는 것입니다.


이 작업에 대한 우리의 기여는 다음과 같습니다.


• 우리가 아는 한, 이것은 장면 설명에서 영화 장면을 생성하는 첫 번째 작업입니다.


• 우리는 두 개의 데이터 세트를 생성하고 공개적으로 출시합니다. (a) 1,000개의 영화 스토리라인과 해당 줄거리로 구성된 병렬 데이터 세트, (b) 1,000개의 영화 장면과 해당 설명으로 구성된 병렬 데이터 세트. (a)에서는 IMDb에서 사용 가능한 영화 스토리라인을 Wikipedia에서 사용 가능한 해당 영화 줄거리와 연결합니다. (b)에서는 IMSDb에서 사용 가능한 영화 장면을 IMDb의 해당 설명과 연결합니다.


• 우리는 잘 알려진 3막 구조(Field, 1979)의 확장인 4막 구조에 따라 영화 줄거리에 수동으로 주석을 달았습니다. 미디어 및 엔터테인먼트 업계의 전문 각본가들이 우리를 매우 긴밀하게 안내했습니다.


• 우리는 장면에 대한 간단한 설명과 함께 슬러글라인, 액션 라인, 캐릭터 이름, 대화 등 장면의 네 가지 주요 구성 요소를 사용하여 영화 장면에 수동으로 주석을 추가합니다.


• 영화 산업의 대본 및 장면 작가를 지원할 수 있는 여러 데이터세트와 모델로 구성된 워크벤치인 "Kurosawa"를 소개합니다.


이 문서는 CC 4.0 DEED 라이선스에 따라 arxiv에서 볼 수 있습니다.


[1] https://erosnow.com/


[2] https://www.wikipedia.org/


[3] https://www.imdb.com/


[4] https://www.imsdb.com/