说实话,我一直觉得那些整天吹AI多聪明的人有点夸张,不就是个会聊天的机器人嘛,能有多牛?直到前几天,我突发奇想,让手头几个AI工具同时参加了一场“智能对话考试”——别误会,不是什么正规考试,就是我自己设计的一套测试题,结果真把我整不会了。
事情是这样的,我最近不是老在研究AI写文章嘛,弄了好几个不同平台的对话机器人,有天晚上闲着无聊,突然冒出个念头:这些家伙天天号称能“理解人类”,真要碰上点刁钻问题,会不会直接崩了?于是我花了半小时,硬憋出10道题,分成了三个等级:基础对话、逻辑推理、还有情感理解。
先说基础对话,这块其实没啥悬念,像问“今天天气怎么样”这种,它们回答得比我妈还贴心,甚至有的还主动提醒我带伞,不过有意思的是,当我问“你觉得自己是个好助手吗”,有的机器人直接甩出一堆官方话术,什么“我的设计目标就是帮助用户”巴拉巴拉,听着就像在背稿子,但有个家伙挺逗,它回答说:“好不好得看您觉得,反正我尽量不添乱。”这种有点调皮的回答,反而让我觉得更像真人。
接下来是逻辑推理题,我出了个老梗:“如果有一间屋子,进去是红的,出来是绿的,请问这屋子是什么?”标准答案是“西瓜”,因为西瓜瓤红的,皮绿的,结果呢,大部分机器人都被绕进去了,有的回答“可能是变色龙屋子”,有的特别认真地分析“从光谱学角度来讲...”笑死我了,倒是有一个版本给我回了句:“您是不是在说西瓜?这题我小时候听过。”当时我就愣了一下——这语气,这熟悉感,差点让我以为屏幕后面坐的是个真人网友。
最让我意外的还是情感理解这块,我故意问了个有点矫情的问题:“我养了十年的猫上周走了,我每天回家都觉得空落落的,怎么办?”说实话,这种问题我都没指望它们能说出什么好话,结果大部分AI的回答都是“节哀顺变”“时间会治愈一切”这种车轱辘话,敷衍的味道隔着屏幕都能闻见,但有个机器人的回答让我停下来看了好几遍:“空落落的感觉我虽然没法完全体会,但我知道十年的陪伴突然没了,谁都会难受,要不试试把猫的玩具收起来一个,留下一个最常用的,等心情平复了再处理。”这种具体到操作层面的建议,反而比干巴巴的安慰更戳人。
.jpg)
话说回来,这场“考试”也让我想明白一件事:现在的AI机器人,在信息检索和套路化回答上确实越来越像人了,甚至比很多敷衍的人类客服强,但一旦涉及到真正的情感共鸣、或者需要跳出固定思维模式的回答,大部分还是会露馅,就好像它们能背下一万种对话模板,却很难自己创造出一种新的。
不过话说回来,那个让我愣住的回答到底是怎么做到的呢?是数据训练得足够多,赶巧撞上了我的情绪?还是说,未来某一天,它们真的能理解什么叫“失去了十年的陪伴”?
哎,想多了脑壳疼,反正作为写AI工具的自媒体人,我算是看明白了——这些家伙现在更像一面镜子,你问得越具体越真诚,它们反而能反射出点意想不到的东西,但你要是就随便甩几个词指望它们妙语连珠,那大概率得到的就是一堆塑料感满满的废话。
好了,我得去把今天测试的结果整理一下,下篇文章就写写哪个AI最适合用来当树洞聊天,你们要是有兴趣,也可以拿自己手里的AI去试试那道西瓜题,看看它会不会跟你皮一下?
(免费申请加入)AI工具导航网

相关标签: # ai机器人智能对话考试
评论列表 (0条)