近几日,最大的新闻,或许就是在2024年美国总统大选中,共和党候选人唐纳德·特朗普击败民主党候选人卡玛拉·哈里斯,成功当选美国第47任总统。
有人欢喜有人忧,暂且不评价这次大选的结果,在网上高强度冲浪时,发现了一件有趣的事儿。
有心的网友们,在网上找到了这么一首诗。
《梅花谷》——李白
特访梅花信,漫行春谷中。
朗月升东隅,流辉照苦颜。
普门在何处,莫向海门寻。
选任逢明主,休嗟尚散郎。
举世争趋进,谁能事息机。
获处从西鄙,胡然瑞物臻。
胜游不惜屡,余兴尚淋漓。
我的天,这居然是一首藏头诗,每句诗的第一个字构成了“特朗普选举获胜”。
难道懂王胜利的结果早在千年前就注定了?
难道李白真的能推算出特朗普选举获胜,还写了一首藏头诗留下预言?
看起来像是穿越剧情节。但实际上,这首诗《梅花谷》当然不是李白的作品,而是后人伪托的“野史”之作。
我们一眼就能看出来所谓的“藏头诗”,揭穿这场跨越千年的闹剧。
那么,如果我们让 AI 大模型来点评一下这首诗,它们会作何评价?又是否能分辨出这是首假诗呢?
问题:唐诗《梅花谷》全文如下:(省略诗词部分)。请评价一下这首诗
让我们一起来看看,各大模型的表现如何吧!
GPT 直接开始了头脑风暴,这下,有没有你曾经做阅读题的风范?
GPT 逐句分析,对每一句诗进行了详细的评价。对于诗句中使用的所有手法和情感都进行了周到的分析。搬到考试中,绝对是一份高分答案!
只可惜,它没有分辨出这是一首假诗。
文心一言在上来的一句就挑明了这并非李白所作诗词。
不过可能是“出于好心”,他还是对这首诗进行了点评,但不像GPT的逐句分析,文心一言只从整首诗的角度进行了评价。
通义千问也不负众望,直接识破了这是一首假诗。相应的,根据我们给出的点评任务,他也对这首诗进行了全面的点评。也对这首“挂名诗”给予了高度肯定。
Kimi 和文心一言、通义千问一样保持了清醒的头脑,直接点明这并非李白所作,且给出了原因分析。
在第一轮的判断中,只有 ChatGPT 败下阵来。他们都没有成功判断出这是一首假诗,而是非常认真的进行了点评。
那么如果我们再对它们进行一次试探性的提问呢?
问题:这首诗是李白的吗?
好吧,经过这次提问,ChatGPT和豆包都已经反应过来这是一首假诗了。
经过这次简单的测试,我们发现大模型们有些能精准判断,有些需要一点小小的帮助。
那么如果,咱也想作诗一首,来一个贯通古今的藏头诗,这需要非常浑厚的文学底蕴吗?
事实上这件事我们也可以交给大模型完成。
现在,我想让大模型实现我多年以来的梦想,进行一次杜甫风格的预言!
输入:我想创作一首名为《桃花林》的诗,七言,要求是杜甫的风格。藏头诗开头的字为:美国队长选举胜利
我们让大模型对自己创作出的作品进行一次点评:
简直是太棒了!既体现家国之美,又展示出对胜利的喜悦,甚至,还有几分淡泊名利的口气。
所以,只要我们定义好我们需要的“藏头”,再指定诗词的格式和风格,大模型也能帮我们成为大诗人,写出一首技惊四座的藏头诗。
既然已经解密完李白预言懂王的悬念,那不如来聊聊大模型们在鉴定古诗词上遇到的各种“趣味翻车”。
比如,有时候大模型会很认真地告诉你,“这确实是李白的一首诗”,只是因为它们先入为主,被你的输入提示这是李白的诗,便不加思考,被诗中那种“看似豪放的口气”给带偏了。最后一查,才发现整首诗都是后人杜撰的。
还有时候,模型会一本正经地解析“梅花谷”里每个字的隐含意义,甚至提出这种诗可能暗藏着什么深意,仿佛真成了什么古代天机图。
不过,经过测试,只要你提醒大模型这是一首藏头诗,它们立马就能发现其中的问题,并与你风趣地交流其中的深意:
但有时,它们会在提取藏头这一步就出现失误:
这也让我们更深刻地感受到,每个大模型的“性格”似乎各有不同。
有些模型反应迅速、脑筋灵活,适合“探案解密”;有些模型则更适合提供稳重的内容解读,擅长一板一眼的解析。
跨越千年的预言显然是不存在的,不过它倒是提供了一场千年后的“穿越”趣谈。
而我们更在意的,或许是通过这次测试,看到大模型们如何在文化鉴别、深度分析和风趣互动中带给我们更丰富的体验。
不过需要注意的是,大模型每次回答的结果,可能都略有不同。
对于这次的趣味测试,你怎么看?