最近跟几个做技术的朋友聊天,话题不知怎么又绕到了AI上,有个朋友突然抛出一个问题:“你说,咱们喂给AI那么多数据,它训练完了,到底是真的‘理解’了,还是单纯把东西给‘了?” 这话一出,饭桌上顿时安静了几秒,是啊,我们整天说模型“学习”,说它“智能”,可这种学习的本质,是不是更像一种超级复杂的记忆呢?这个问题,细想起来还真有点让人后背发凉。
咱们先从一个最直接的层面来看,你肯定听说过,大规模语言模型在训练时“看”过了几乎整个互联网的文本,这意味着什么?意味着如果你在某篇冷门博客里写过自己的电话号码,或者在某次公开的代码提交里不小心留下了数据库密钥的片段,这些信息都有可能被模型“吞”进去,这可不是危言耸听,已经有研究证实,通过一些特定的提示技巧,确实有可能从某些模型中“诱导”出它训练数据中包含的个人隐私信息、版权材料甚至是一些有毒内容,这就好比一个拥有摄影式记忆天赋的学生,它把图书馆里所有书,包括那些涂鸦和夹在书里的小纸条,都一字不落地印在了脑子里,你能说它“学会”了知识吗?某种程度上是,但它记住的,是未经筛选、未经消化的原始副本。
这种记忆,技术圈里有个专门的词,叫“精确记忆”,它很机械,很原始,但危害可能不小,想想看,如果未来某个AI客服,不小心把训练数据里某个用户的投诉信息和姓名一起复述出来了,那场面得多尴尬,现在的模型训练者想了很多办法来给模型“健忘”,比如在数据清洗时下更大力气,或者用一些技术手段去降低模型对特定数据片段的记忆强度,但这就像让人忘记一件事,挺难的,尤其是当这件事反复出现的时候。
但“记忆”如果仅仅是这样,那AI也就没那么让人着迷了,更值得我们琢磨的,是另一种“记忆”——模式记忆,或者说规律记忆,这大概是AI真正有点“智能”味道的地方,模型通过海量数据,记住的不是具体的“张三在某年某月某日说了某句话”,而是“像张三这样的人,在类似的情境下,大概会用什么样的句式来表达什么样的情绪”,它记住的是概率分布,是词语与词语之间、概念与概念之间千丝万缕的关联网络。
举个例子,它没见过你写的文章,但它“了成千上万篇科技文章的行文风格、术语搭配和逻辑结构,所以当你让它写一篇介绍新手机的文章时,它能模仿得八九不离十,这不是因为它背下了某一篇范文,而是因为它“了科技文章这个“模式”,这种记忆是抽象的、泛化的,也是它能够“举一反三”,处理未见过的任务的基础,但这种记忆也带来了问题:它可能会固化甚至放大数据中存在的偏见,如果训练数据中“护士”常常与“她”关联,“程序员”常常与“他”关联,那么模型就会“这种有偏差的社会模式,并在生成内容时体现出来,它记住的,是我们世界不完美的缩影。
.jpg)
聊到这儿,你可能觉得,模式记忆听起来更高级,我们应该努力让模型只进行这种记忆,但事情没这么简单,在现实中,这两种记忆的边界是模糊的,甚至是相互纠缠的,模型那惊人的“创造力”或“类比能力”,恰恰可能源于它对某些非常具体、非常偏僻的例子的记忆,只是在输出时进行了巧妙的改编和重组,这就像一个作家,他读过的每一本书的细节可能都模糊了,但那些精彩的桥段、独特的比喻,却潜移默化地融入了他的风格里,在某个灵感迸发的时刻,以一种全新的面貌浮现出来,你很难说清,这到底是“记忆”还是“创造”。
更有趣的是,我们人类对AI“记忆”的担忧和期待,本身也投射了我们对自己的理解,我们害怕它记住不该记的(隐私、偏见),又期待它能牢牢记住该记的(知识、技能),我们希望它像人一样,能遗忘琐碎,提炼精华,但又希望它比人更可靠,不会遗忘重要信息,这种矛盾的心态,恰恰说明我们正在把一个原本属于生物心智的概念,强加给一个数学和工程学的造物。
作为使用者的我们,该怎么看待这件事呢?得有点“数据素养”,要知道你面对的AI,它的“知识”和“观点”是有来源的,这个来源就是它的训练数据,它的输出,不是真理,而是对它所“的那个数据世界的某种概率性反射,保持审慎的乐观,模型“记忆”问题既是挑战,也是前沿研究的富矿,科学家们在探索如何让模型更“懂事”,比如学会有选择地记忆,或者给记忆加上“权限锁”,这些技术或许能让未来的AI更安全、更可控。
不妨把这个问题当作一面镜子,当我们纠结于AI是“真理解”还是“假记忆”时,或许也该反问自己:我们人类引以为傲的学习、创造和直觉,其底层是否也依赖于某种我们尚未完全理解的、复杂而精妙的“记忆”系统呢?AI的训练,就像在为我们自己的心智奥秘,搭建一个粗糙但可供观测的模型。
下次当你与AI对话,惊叹于它的对答如流时,或许可以会心一笑,你知道,它那看似深邃的回答背后,可能既有对整个互联网文风的精妙模仿,也说不定偷偷藏着某篇古老论坛帖子里的一句玩笑话,这种混杂着庞杂记忆与抽象模式的存在,不完美,但或许,这正是它目前最像“智能”的地方,我们塑造着它的记忆,而它的表现,也在不断重塑我们对记忆、学习和智能的认知,这条路,还长着呢。
(免费申请加入)AI工具导航网

相关标签: # ai训练模型会记住
评论列表 (0条)