报道称,莫奈的园林画能让观众感到满足,达利画的软塌塌的时钟则会引起恐惧或困惑。如今,人工智能艺术评论家已经能够预测名画将在观众心里唤起的情感,并往往像人类一样令人信服地对这些情感作出解释。
美国斯坦福大学的帕诺斯·阿赫利奥普塔斯说,人工智能图像分析通常着重于描述图片中发生的情况,但艺术作品唤起的主观感受对人类行为有着同样巨大的影响。他说:“我们理解和解读世界的方式涉及很多情绪反应。”
阿赫利奥普塔斯说,能够预测、甚至模拟这些反应可能有助于机器更顺利地与我们互动。因此,他的团队利用网络调查建立了一套人类对艺术的反应的大型数据集。
他们要求6000多名参与者对“阿耳忒弥斯”数据集中8.1万幅画作引发的主导情绪作出选择,并写一段说明文字,以就相关的艺术作品描述是什么引导了他们的判断。每幅画至少有5人进行分析。这些图片、情感标签和说明文字被用来训练一个人工智能程序。然后,这个人工智能程序被要求预测它以前未看过的画作将唤起什么情感,并提供简短的解释。
阿赫利奥普塔斯说,预测有关结果本身就很困难,因为不存在正确答案。只有45%的绘画的主导情感得到了大多数注释家的赞同。因此,研究人员进行了一种图灵测试,方法是,向人类评估员展示一幅画、人工智能撰写的说明文字,以及注释家的说明文字,让评估员猜哪条说明文字是人类写的。人工智能的说明文字在50%的时间里都被当成了人写的文字。
阿赫利奥普塔斯承认,人工智能的说明文字不像人类的那么多样化和有创意,但他说,初步结果显示很有前景,有关数据已经成为公开资源,这样其他人就可以在相关模型上进行改进。
英国伦敦大学玛丽皇后学院的西蒙·科尔顿说:“在拥有足够多的适当数据和某些深度学习技巧的情况下,一个模型可能经过培训,以生成带有情感内容的像样的说明文字,这应该不令人意外。”科尔顿没有参与这项研究。
他又说,新数据集是对该领域的一项重要贡献。他说,一个令人兴奋的前景可能是,利用这些数据来训练会生成视觉艺术的有创造力的人工智能,这样它就能更好地表达特定情感。(编译/朱捷)