【导读】Deep-speare 编写的诗歌节奏、韵律和基本语法都很自然,还惟妙惟肖地模仿了莎士比亚的诗歌风格。大多数读者都无法区分 AI 生成的诗歌与诗人创作的作品。
这是威廉·莎士比亚(William Shakespeare)十四行诗中的一个诗节:
这是由人工智能程序 Deep-speare 编写的诗节:
近日,三位机器学习研究人员与一位文学学者共同组成的 Deep-speare 团队,使用在线图书馆谷登堡计划(Project Gutenberg)中大约 2700 首十四行诗(约 36.7 万个单词)来训练 AI 诗人。通过在培训数据库中搜寻诗歌,并一次又一次地尝试创建与示例匹配的诗歌,AI 诗人最终在深度学习中学会了“创作”。
研究人员没有在程序中写入押韵词典、发音词典或其他资源,而是让 Deep-speare 独立学习与十四行诗写作有关的三个主要规则:节奏、韵律和自然的语言(单词流畅自然地组合在一起)。
Deep-speare 研究人员表示,他们的目的是了解深度学习可以将自然语言生成推进到何种程度,同时利用诗歌的有趣特质(因为十四行诗等诗歌在节奏和韵律方面都有相当严格的模式),研究人员想知道是否可以设计系统的创作体系,让 Deep-speare 自主学习这些模式。
在 16 世纪,英国诗人开始使用 Iambic(五步抑扬格)作为诗歌格律,并发展出一种独特的十四行诗风格,其中十行诗具有规则的无重音节奏模式。
一首十四行诗通常由三个呈现“问题”的四行诗节组成,然后是两行双韵,通常带有 ABAB CDCD EFEF GG 的押韵。这一类型的十四行诗主要有两个特点:长度为十四行诗,且有两部分的“论证”结构。由于莎士比亚频繁使用这种诗意形式,如今已称为莎士比亚十四行诗。
Deep-speare 采用了三种自然语言处理模型:第一种通过评估单词的使用概率来选择每个单词,第二种检查每一行诗的节奏,第三种确保每一行诗都遵循韵律方案。
例如在示例中,AI 诗人选择了“ ABBA ”韵律,这意味着第一行诗节将与最后一行诗节押韵,而两个中间行的诗节互相押韵。
1.Deep-speare 首先需要选择最后一行诗节的最后一个单词(“ wait”)。该程序通过考虑英语中的所有单词并评估每个单词出现在该位置的可能性来做出选择。在这里可以看到排名前五位的单词及其概率排名。但该模型不会选择概率最高的单词,而是从候选单词中进行随机采样。(注:符号“”表示低频词或从未被选择的单词。)
2.之后,Deep-speare 对最后一行诗节中的每个单词不断重复该选择过程。候选单词的概率得分可以反映出一些单词彼此相邻或在同一句子中出现的频率。
3.Deep-speare 以这种方式生成许多候选单词。随后,其节奏模型会查看并为这些单词分配相应分数,再从中选择符合五步抑扬格的单词。
4.从十四行诗的开头到结尾,AI 诗人不断地重复这些步骤。
5.最后,当选择的单词在第二行诗节和第一行诗节末尾(“pray”和“state”)时,韵律模型会为候选单词打出“押韵度”分数,并寻找带有“ way”和“ wait”的押韵单词。
语言模型是生成十四行诗的最重要组成部分,主要通过吸收训练语料库中的所有单词和句子来进行学习;研究人员使用了 Wikipedia 条目、Reddit 的讨论话题,以及专门用于训练自然语言处理的数据库。
一旦拥有训练有素的语言模型,Deep-speare 就可以从头开始生成诗句。通过随机选择一个具有高概率得分的单词,将其添加到正在生成的诗句中,再重新计算接之后可能出现的所有单词的概率。通过不断重复此过程,Deep-speare 就“创作”出了一首十四行诗。
Deep-speare 生成的诗歌与训练数据并无太多重叠。换而言之,它并未直接复制训练数据,而是生成了原创诗歌,但这并不能说明其诗歌在文学上的价值。为了评估 Deep-speare “创作”的诗歌质量,研究人员找来了两组评委,让他们区分诗人与 AI 创作的十四行诗。
第一组评委是亚马逊 Mechanical Turk 雇佣的众包工人,他们只会基本的英语,没有诗歌方面的专业知识。最终结果是,工人们以 50% 的准确率分辨出人类创作的诗歌和 AI 生成的诗歌。但这一数据可能虚高,因为工人们可能在网上对诗节进行搜索,诗人创作的诗歌会出现在搜索结果之中,AI 生成的诗歌则不会出现。
第二组评委是多伦多大学的文学助理教授亚当·哈蒙德(Adam Hammond)。此次评审不涉及区分人类与机器的创作,而是对人机合写的十四行诗的韵律、节奏、可读性和情感影响等四大属性进行评分。
哈蒙德对 Deep-speare 生成的诗句节奏和韵律给予了高度评价,甚至认为比人类的创作更胜一筹。哈蒙德得知 Deep-speare 是 AI 时并不感到惊讶,他解释称诗人常常为了取得某些效果而打破节奏与韵律的规则。但在可读性与引起情感共鸣方面,哈蒙德认为AI生成的十四行诗明显逊色很多。文学专家可以轻易地分辨出 Deep-speare “创作”的是哪些诗句。
几年前,微软小冰就通过深度学习,可以生成具有自我风格的诗歌。华为诺亚方舟实验室也推出过AI诗人“乐府”,唐诗宋词信手拈来。
微软小冰深度学习几万首的诗歌作品仅需 0.6 分钟。在它学习到第 10 次时,生成的诗歌毫无意义,但当它学习到第 500 次时,生成的诗歌已变得通顺,再到 1 万次时,就能生成有其自我风格的诗歌。而这种自我风格来源于微软小冰的自我认知,也就是它的记忆与知识。
华为的 AI 诗人“乐府”则通过把训练使用的诗词序列化为格式化的文本序列,再通过对语言模型 token 的抽样,生成满足形式和内容要求的诗词,比如绝句、律诗、词,以及对联等。
但这些 AI 诗人都在诗歌的可读性与引起情感共鸣方面表现欠佳。此外,十四行诗 AI 诗人 Deep-speare 在主题创作方面也存在一些局限。
人类诗人主要通过在脑海里构思出诗歌主题再展开叙事,不断揣摩恰当的词汇来抒发情感。虽然 Deep-speare 能够根据特定的主题(例如爱情或失去)来创作一首诗,但其语言模型的单词选择将受到限制。
针对这方面的不足,AI 诗人需要长期训练一个创作主题来增加诗句连贯性。研究人员也计划使用更多层次的语言模型进行深度学习,该模型能为诗歌首先生成高级叙事,再使用框架生成单个的单词。
总体而言,虽然人工智能可以通过自然语言模型生成具有一定可读性的诗歌,但正如文学专家所言,AI 更擅长遵循韵律等固定规则,无法像人类诗人一样突破规则创作出有创造力的作品。
此外,AI 生成的诗歌并不具有文学价值,其情感影响力无法像人类创作的作品一样激发读者的共鸣。AI “创作“诗歌是人工智能的又一伟大尝试,但人类书写的文学作品中,浓烈的思想情感无可取代。
参考资料:
https://spectrum.ieee.org/artificial-intelligence/machine-learning/this-ai-poet-mastered-rhythm-rhyme-and-natural-language-to-write-like-shakespeare
https://www.aclweb.org/anthology/P18-1181/
https://baijiahao.baidu.com/s?id=1608854967685272708&wfr=spider&for=pc
https://new.qq.com/omn/20190908/20190908A07GWE00.html