AI来抢编剧饭碗了?这个AI用GPT-2写的剧本,预计2021年1月首播

发布于: 雪球转发:0回复:0喜欢:0

大数据文摘出品

来源:techxplore

编译:Min

查尔斯大学、Švanda剧院和布拉格表演艺术学院的研究人员目前正在进行一个有趣的研究项目,将人工智能和机器人技术与戏剧相融合。他们项目的主要目标是利用人工智能创造一个创新的戏剧表演,预计将于2021年1月首演。

“我们研究背后的主要想法来自Tomáš Studeník,他是一位创新者,他注意到戏剧剧本R.U.R.的100周年纪念日即将到来,”进行这项研究的研究人员之一Rudolf Rosa告诉TechXplore。

“这对机器人技术来说是一个关键的时刻,因为机器人的概念,包括‘机器人’这个词本身,是由Karel Čapek和他的兄弟Josef发明的,他写了这个剧本。托马什认为应该好好庆祝一下,于是就产生了把故事翻转过来的想法:100年前,一个人写了一部关于机器人的戏剧,如果今天,机器人写了一部关于人类的戏剧呢?

在开始研究他们的项目之前,研究人员回顾了以前的文献,探索人工智能技术在诗歌、音乐、绘画或其他艺术形式的创作中的潜力。虽然现在有大量的论文关注机器生成的艺术,在一些论文中,计算技术被用于制作戏剧剧本的对话或故事创意,但是自动生成整个戏剧表演是一项非常复杂的任务,以前很少有人尝试。

Rosa和他的同事们决定将他们的剧本分成几个小部分。他们的计划是使用一种被称为“分层生成”的方法,即把大量文本的生成分割成可控的小部分。虽然其他研究团队在过去使用这种方法来生成对话、剧本或其他文本,但很少有人尝试使用这种方法来制作整个剧本。

“由于周年纪念日的临近,我们的主要目标很明确,也很坚定:在2021年1月之前,我们需要有一部已准备好首演的戏剧。”Rosa解释道。“由于将由专业剧团演出,我们需要在9月份准备好剧本,这样就有足够的时间戏剧化、彩排等。因此,尽管我们正在开发一个通用的戏剧剧本生成工具,但目前我们真正需要生成的只是一个剧本。”

到目前为止,研究人员用的是GPT-2的语言模型进行训练。这是一个由OpenAI联盟开发的开源模型,并在大量的在线英语文本上进行了训练。他们测试的第一批结果被简述在arXiv上预先发表的一篇论文中。

论文地址:

网页链接

Rudolf Rosa

GPT-2是一个生成式语言模型,这意味着当经过充分训练后,它可以使用相似的语言完成未完成的文本,并涵盖相关主题。例如,如果给它输入一篇新闻文章的第一段,该模型就会尝试生成关于同一主题的另外几段,将现有文本作为灵感来源,但也会生成关于新概念的句子。

“当我们向GPT-2输入一个场景设置和几句戏剧剧本时,它就会以同样的风格生成进一步的台词,并专注于输入剧本块的主题,”Rosa解释道。“这样一来,我们不需要训练任何东西(目前),因为我们对生成器做了一点限制,让它专注在自己的任务上,不偏离到其他地方。因此,我们可以利用在海量文本上训练了很长时间的巨大的GPT-2模型,我们自己没有能力在我们的硬件上进行训练,因为现在只有最大的技术公司才能训练这样的模型。”

虽然研究人员使用预先训练的GPT-2模型进行的实验取得了可喜的结果。但是事实上,他们没有对该模型进行改编,也没有对戏剧剧本进行专门训练,这使得控制其操作和性能变得更加困难。

该项目工作团队

“我们也明确地与‘人机回圈’(Human-in-the-loop)概念合作,”Rosa说。“基本上,所有计算机生成的'艺术'都会以某种方式被人类触碰和修饰,但这往往不是很透明。在我们的工作中,我们试图非常明确机器做什么,人类做什么,让他们的合作成为系统设计的一个组成部分,而不是一种事后的修补。

目前,Rosa和他的同事们通过回顾以前的作品,试图找出制作戏剧剧本最有效的方法来启动他们的项目。虽然他们已经决定了要使用什么方法,但他们才刚刚开始将其运用到戏剧剧本的创作中。

Rosa说:“我们的项目仍处于起步阶段,但我们对采用预训练的GPT-2模型的基本方法的效果感到惊讶。”

"我们只给它输入剧本中的几句台词,它就能接收到它的体裁、结构、主题和人物名称,利用这些信息生成就能或多或少的生成一些合理的台词。这是在没有任何改编或微调的情况下实现的:我们只是使用了网上可以下载的模型,这说明GPT-2模型确实相当强大。"

生成的脚本样本。前6行是来自原始的R.U.R.脚本,并作为生成器的输入,其余的由预先训练的GPT-2模型生成。

目前,Rosa和他的同事们还在尝试所谓的"平面文本生成",即由机器学习模型为剧本单独生成台词,一次一行。不过,他们很快就想开始使用分层生成方法来创建剧本的简要摘要,并将其扩展为详细的大纲,最后将这个大纲翻译成对话。理想情况下,他们计划使用的模型将生成一个既连贯又有效的剧本,既遵循一条共同的线索,又能创造出背后有明确含义的文本。

“我们还需要确保生成的剧本是连贯的,不会重复或自相矛盾,不会过于频繁地引入新的随机角色,以及一些小而有趣的事情,比如防止角色离开现场但继续说话的情况。”Rosa说。“我们的第一部戏应该会在2021年1月首演。我们会看看它的进展情况以及接受度如何,然后希望我们的观察能推动我们进一步的研究和发展。”

在现阶段的研究中,Rosa和他的同事仍然认为,机器人参加他们的戏剧需要大量的人类监管。但在未来,他们希望制作出一个完全可以由机器人来表演的剧本,而不需要任何人类表演者或人类指导。

相关报道:

网页链接

实习/全职编辑记者招聘ing

加入我们,亲身体验一家专业科技媒体采写的每个细节,在最有前景的行业,和一群遍布全球最优秀的人一起成长。坐标北京·清华东门,在大数据文摘主页对话页回复“招聘”了解详情。简历请直接发送至zz@bigdatadigest.cn

志愿者介绍

后台回复“志愿者”加入我们

点「在看」的人都变好看了哦!