不知道你有没有过这样的经历:为了通关某个游戏,没日没夜地刷级、背板、练操作,鼠标键盘搓到冒烟,最后看着通关画面,心里除了空虚就是腱鞘炎的隐隐作痛,又或者,在看一些大神行云流水的游戏操作视频时,一边惊叹“这是人类能打出来的?”,一边默默怀疑自己的手和脑子是不是没配合好。
有个挺“邪门”的路子开始冒头了:咱们不亲自上了,让AI自己去学,去练,直到它成为游戏里的“那个神”,听起来像科幻小说?但其实,这玩意儿已经在我们眼皮底下悄悄进化了好一阵子了。
最早让我震惊的,是几年前DeepMind的AlphaStar在《星际争霸2》里暴虐人类顶级职业选手,那可不是象棋围棋那种信息完全透明的游戏,《星际争霸》有战争迷雾,要运营、要侦查、要微操,需要直觉、欺骗和临场应变,传统上被认为是AI的禁区,结果呢?AI通过一种叫“强化学习”的方法,自己跟自己打了成千上万局,摸索出了一套人类完全没想到的战术和操作节奏,你看它的第一视角,甚至会觉得有点“蠢”,因为它的一些操作选择根本不符合人类常识,但偏偏就是能赢,那种感觉,就像是一个用完全不同的物理法则运转的外星生物在跟你打游戏,憋屈又无力。
“AI自动训练游戏模型”,到底是怎么一回事?你可以把它想象成教一个天生学霸,但脑回路清奇的孩子,你不教他具体的数学公式,而是把他扔进一个叫“游戏”的考场里,只告诉他最终目标:考高分(赢),他就不停地考,考完自己看分数,琢磨“刚才哪一步做对了加了分,哪一步做错了扣了分”,就这么一遍又一遍,几十万、几百万次地考下来,他硬生生自己总结出了一套匪夷所思但极其高效的解题(游戏)方法,这个过程,强化学习”的核心。
这技术听起来很酷,但离我们普通人远吗?其实不然,现在一些模拟器游戏,比如经典的《GTA V》、《我的世界》,甚至一些老式的红白机游戏,都成了AI训练的绝佳沙盒,有开发者和研究爱好者,利用一些开源的强化学习框架(比如OpenAI的Gym、Unity的ML-Agents),自己就能搭个环境,让AI在里面学开车、学盖房子、学打小怪,油管上就能搜到不少这样的视频,看着AI从最开始像个无头苍蝇一样乱撞,到后来能流畅跑完整个赛道,那种养成感,还挺奇妙的。
.jpg)
它可能先学会猛打方向盘,发现撞墙会扣分,于是慢慢调整角度;它可能先乱跳,发现掉下悬崖游戏结束,于是学会在边缘试探,你看它的学习过程,有时候会气得发笑,有时候又会为它一点微小的进步感到欣慰——虽然它只是一串代码。
但这事儿,细想下去,味道就有点复杂了。
好的一方面,这无疑是巨大的生产力解放,游戏测试员可能不用再枯燥地重复跑图找Bug了,让AI去跑,它能不眠不休地测试出各种极端情况下的程序漏洞,游戏设计也能得到反馈,AI玩家可能会用你完全没想到的方式通关,或者卡在一个你设计时根本没留意到的死角,这能帮助开发者把游戏打磨得更好,甚至,未来我们可能会玩到专门为AI训练而设计、拥有无限可能动态内容的游戏,那体验就完全不同了。
可另一面,潘多拉魔盒的盖子也在松动,首先是公平性问题,如果AI训练得足够好,悄无声息地潜入多人竞技游戏(比如MOBA、FPS)里,那对于普通玩家简直就是降维打击,游戏环境瞬间崩坏,虽然现在各大游戏厂商都在严打外挂,但这种基于模型决策的“AI外挂”,检测起来难度更大,它可能没有离谱的锁头、透视,只是走位、瞄准、决策优化到了人类极限,这算作弊吗?界限很模糊。
更深层的,是一种“意义”的消解,我们玩游戏,乐趣往往在于挑战、学习、克服困难的过程,如果最终极的“通关”或“巅峰技术”可以被一个无意识、无情绪的AI通过暴力穷举的方式达成,那我们所追求的技巧、意识、甚至“游戏艺术”,价值何在?当某个游戏的世界纪录被AI刷新到一个人类永远无法企及的高度时,这个纪录还有多少让人热血沸腾的力量?
更不用说,训练强大的游戏AI需要惊人的算力资源,这会不会进一步加剧技术领域的资源垄断?小团队和个人创作者,还能平等地参与这场游戏吗?
看着AI在游戏世界里从笨拙到精通,心情挺矛盾的,我像个看热闹的观众,为技术的进步感到兴奋;作为一个普通玩家,又隐隐感到自己的一片自留地正在被一种陌生的力量侵入和重新定义。
它或许终将改变我们“玩”的方式,甚至改变“游戏”本身,而我们能做的,可能就是一边保持好奇,一边握紧自己的手柄,在AI还没彻底“统治”所有服务器之前,再多享受一会儿属于人类的、笨拙但充满惊喜的游玩时光,毕竟,菜有菜的快乐,对吧?至少,腱鞘炎是实实在在属于我们自己的。
(免费申请加入)AI工具导航网

相关标签: # ai自动训练游戏模型
评论列表 (0条)