当诗歌邂逅算法
2022-09-28

1665133505947.png

你是否也有过这样的时刻:

满腔情志汹涌不知如何书写,感于古诗艰深只好望而却步……

倘在过去,名师教诲或许难得,大家只能独自苦学;而在当下,人工智能却可以“飞入寻常百姓家”,成为诗词爱好者的良师益友。

诞生于清华大学自然语言处理与社会人文计算实验室(THUNLP)的九歌,便是这样一位“饱读诗书善点墨”的“诗词大师”。自诞生以来,九歌以其流畅自然的诗篇、丰富开放的机制收获了一众关注,也吸引着更多人走近诗歌、走近传统文化。

·广纳苦读成好诗·

1665133640586.png

提及人工智能写诗,多数了解甚微的人都会持怀疑态度:人工智能可以写诗?

人工智能的语言智能研究起步不过数年,而诗歌是人类语言高度凝练、高度艺术化的体现,古诗更是中华传统文化的璀璨明珠。人工智能虽然具有杰出的储存与计算能力,但在如何写出一首好诗上,还是得参考人的经验。

清代孙洙在《唐诗三百首》序言中曾言:“熟读唐诗三百首,不会作诗也会吟。”九歌系统录入了从魏晋南北朝到近现代所能找到的90万首诗歌,通过对这些诗歌的反复学习,与标注有诗歌情感、韵律、质量数据库的支撑,九歌团队设计算法,建立出诗歌自动生成模型。

诗歌创作不仅需要满足格律的要求,篇章连贯、新颖个性才能成为佳品。这也是九歌团队不懈探索的目标。以往团队大都从数学视角出发,将诗歌生成理解为序列预测问题,九歌并没有止步于此。正如研发者矣晓沅所言,“诗歌是一种高度文学化、艺术化的文本”,这一洞见引领九歌从学科交叉中获取启发——针对诗歌创作的特点和难题,设计出专门的模型结构优化写作。

《文心雕龙》有载:“夫裁文匠笔,篇有小大;离章合句,调有缓急;随变适会,莫见定准……故能外文绮交,内义脉注,跗萼相衔,首尾一体。”矣晓沅解释道,“在写作中,要动态地、灵活地构建出整首诗的骨架主线,以此对上下文的内容和主题进行约束,做到上下紧密相关,意脉连贯。同时又要断续离合、荡开笔墨,允许一定的自由与发挥的空间,不能约束得太死板。”

基于此,研发团队对《文心雕龙》中的“意脉”进行数学建模,设计出了显著性线索机制模型,主题突出的同时使诗歌全篇更为连贯;参考认知心理学中的工作记忆原理,团队提出了基于工作记忆模型的诗歌生成方法,增强与用户输入的关键词的扣题性,实现语句间的连贯表达、合理过渡。

许多人认为,AI写诗最致命的弱点就是缺乏情感。为了使AI更富“人”情,九歌将每一句的情感和内容分别构成序列,不仅能够控制全诗的情感,还可以比较细致地预测每一句的情感,使诗歌内具有起承转合的情感流动。用户可以在“藏头诗”模块选择“喜悦”“较喜悦”至“悲伤”的五种情感基调。此外,背靠模型,九歌可以自动划分风格并实现对诗歌的风格控制,如“萧瑟凄凉”“忆旧感喟”等,模仿人类类型化的风格表达。

微信图片_20221007173150.png

·亦师亦友伴诗途·

1665133640586.png

你说“不想开学”,它答“何必读书”;你说“谁在用琵琶弹奏一曲东风破”,它答“我来把玉笛吹开满园春意浓”……一来一回,趣意盎然,传统文化的魅力悄然彰显,让人不自觉沉浸其中。

·更多详情请点击“阅读原文”·