那天凌晨两点,我盯着屏幕上跑了一半的代码,突然冒出一个特别“小白”的疑问:我这一行行代码喂数据,等上十几个小时出来的东西,就能叫“人工智能”了?巧的是,最近在知乎上,看到一模一样的问题被顶上了热榜:“训练模型就是AI吗?”底下几百条回答,吵得不可开交,作为一个折腾过不少模型,也写过不少科普的人,我想聊聊这个事儿,可能和那些标准答案不太一样。
直接说结论吧:训练模型绝对是AI的核心部分,但它不等于AI的全部,更不等于我们普通人想象中那个“智能”。 这就好比,你练书法,反复临摹字帖是“训练”,但最后能写出自己风格的作品,甚至创作一首诗,那才是“艺术”,训练模型就是那个“临摹”的过程,至关重要,但离真正的“创作”还有距离。
我刚开始接触的时候,也犯过迷糊,觉得把数据丢进去,调调参数,出来一个能识图或者聊天的东西,哇,太神奇了,这就是智能吧!但后来自己踩的坑多了就明白了,我试着训练一个识别猫狗的小模型,我精心准备了一万张高清猫狗图片,跑了一晚上,准确率高达95%,我兴奋地拿朋友手机里一张有点模糊的、猫躲在阴影里的照片去试,结果模型一口咬定那是只“狗”,为啥?因为我给的训练数据太“干净”了,都是标准照,它根本没学会处理现实世界里那些乱七八糟的情况,你看,它只是在数据里找到了统计规律,但完全谈不上“理解”什么是猫,什么是狗。
知乎上很多专业答主说的对,现在的模型训练,很大程度上是“曲线拟合”,通过海量数据,找到一个超级复杂的数学函数,让它的输出尽可能符合我们的预期,它很强大,能解决特定问题,但它的“智能”非常狭窄,甚至脆弱,你换个问法,或者给它一个训练数据里从没出现过的场景,它可能就“懵”了,给出离谱的答案,这离我们科幻电影里那种能推理、有常识、能举一反三的通用人工智能(AGI),还差着十万八千里。
那为什么大家还是习惯把训练出来的模型叫做AI呢?我觉得,一方面是技术传播中的简化,跟普通人解释“深度神经网络中的梯度下降优化”,不如一句“它在学习”来得直观,这些模型实现的效果,确实替代或增强了过去需要人类智能才能完成的任务,比如翻译、下棋、生成文本,从功能结果上看,叫它“弱人工智能”或者“专用人工智能”,没毛病。
.jpg)
但我们必须心里有数,现在满天飞的“AI工具”,本质上都是被精心训练出来的“模型”,你用它写文章,它是在模仿它“吃”进去的所有文本模式;你用它画画,它是在拼接学习到的视觉元素,它的“思考”过程,和我们人类完全不同,明白了这一点,你再看那些宣传“全智能”、“颠覆性”的文案,就能冷静很多,它是个厉害的工具,但工具的背后,还是人的设计、人的数据、人的目标。
回到开头那个深夜的困惑,我现在觉得,训练模型更像是在给一个拥有巨大潜力的“大脑”灌输经验和知识,这个大脑的结构(算法)是我们设计的,经验(数据)是我们筛选的,学习目标(损失函数)也是我们设定的,最终它能表现出多高的“智能”,取决于我们这些“老师”教得怎么样,以及它自身结构的潜力,它自己,暂时还不会主动好奇,不会提出那个“我是谁”的知乎问题。
下次你再听到“AI”这个词,可以多问一句:它指的是那个训练过程?还是训练好的那个模型?或者是最终表现出来的智能行为?这么一分,很多玄乎的概念就清晰了,技术很酷,但祛魅之后,我们才能更好地用它,而不是被它牵着鼻子走,毕竟,工具嘛,用得明白,才是真的好。
(免费申请加入)AI工具导航网

相关标签: # 训练模型就是ai吗知乎
评论列表 (0条)