这事儿得从上周五说起,当时我正在刷短视频,刷到一个老外操着流利的东北话在那儿直播卖貂儿,底下评论区全在嚎:“大哥你翻译翻译,他说的‘波棱盖儿卡马路牙子上秃噜皮了’到底是啥意思?”我当场笑喷,但转念一想,这事儿其实挺戳中一个刚需的——市面上的翻译器,正经英语翻得贼溜,遇到这种混搭着方言、梗、还有各种离谱语法的“人间英语”,基本全废,你说谷歌翻译能把“skr skr”翻成啥?它大概会给你一串乱码。
于是我决定自己动手,不对,是动AI,我用的工具叫AI2,这玩意儿大家可能听过,就是个能根据你描述的功能直接生成应用的平台,不用写代码,说实话,一开始我是有点心虚的,因为我对编程的理解仅限于“ctrl+C和ctrl+V哪个更快”,但AI2的好处就是,你只要跟它唠嗑就行。
我跟它说:“我要做个翻译器,但是要能识别那种……怎么说呢,就是你把中文网络梗直接塞进英文句子里那种翻译。”AI2沉默了三秒钟,然后弹出来一个对话框:“请提供样本。”我当场给它扔了句我胡编的:“Yesterday I went to the mall, 结果发现我的钱包被steal了,我整个人都emo了。”你猜怎么着?它给了个翻译:“昨天我去了商场,结果发现我的钱包被偷了,我整个人都抑郁了。”一字不差,但感觉缺了灵魂,我又补了句:“你能不能翻得更像人类说话?我整个人都emo了’这种,翻成‘我直接裂开’?”它居然回了个“收到”,然后重新生成了一个版本,翻译成了:“昨天去了趟商场,钱包被人摸走了,我直接裂开。”
那一刻我差点把咖啡喷屏幕上。
接下来两天我基本就在干一件事:疯狂给这个翻译器喂数据,我把我能想到的所有离谱中英混杂句都塞进去——“You真是个小机灵鬼”、“This project已经凉透了,老板还在画饼”、“别跟我讲道理,I don't care”,AI2的底层逻辑其实是基于大语言模型,但它有个好处是可以针对特定场景做微调,你给它喂的样本越多,它就越懂你想让它干嘛,这活儿特别像训狗,你教它“坐下”,它坐下了,你就给块肉干;它坐歪了,你就拍一下地板重新来。
.jpg)
但我很快发现一个问题:过度训练会让它变得死板,比如我一开始只给它喂那种“中英混杂+网络梗”的样本,结果它后来遇到正经的商务英语,Please find the attached file for your review”,它直接给翻成“请瞅一眼附件呗”,这就有点尴尬了,所以我调整了策略——在训练数据里混入了一大堆不同场景的句子,从“How are you doing”到“你咋又鸽了”,从合同条款到外卖吐槽,AI2有个“混合模式”开关,打开之后它会自动根据输入句子的语境选择翻译风格,这事儿后来成了我这个破应用的救命稻草。
昨天终于搞出了个能跑的版本,我给它起了个名儿叫“Chinglish Bot”,还录了个使用视频发到我的账号上,第一个试用的粉丝给我回了个评论:“博主,我拿它翻译了一句‘I’m fine, thank you, and you?’,它给我翻成了‘我挺好的,谢谢,您吃了没?’”我盯着屏幕愣了三秒,然后笑得在椅子上打滚,这显然是个bug,因为“and you”在它的数据库里和“你吃了没”有过强关联,我忘了把那些过于口语化的样本权重调低,但说实话,我反而觉得这个bug挺可爱的,因为它特别真实,你看,真正人类写的翻译器绝对不会出这种岔子,因为人类太完美了,太正确了,反而没意思。
现在这个翻译器已经挂在我个人站点上当玩具了,每天大概有几百个人用,正经的商务翻译我是不会推荐它去的,我怕用户把“Dear Sir”翻成“老铁在吗”,但如果你是个在海外留学的中国学生,想跟同学炫耀你们村儿的方言,或者想用最野的翻译方式把中文脱口秀段子讲给外国朋友听,那这个破玩意儿绝对能让你笑到肚子疼。
最后说句掏心窝子的——做这个应用的技术门槛其实极低,真正花时间的反而是收集样本和调整那个“度”,AI工具现在满地都是,但怎么让它不像是机器生成的“正确答案”,而是有血有肉有人味儿的工具,这事儿,估计得靠咱们这帮爱折腾的普通人慢慢怼出来,反正我还会继续往里塞各种离谱的语料,下一个目标是让它能翻译“四川话版莎士比亚”,要不你也试试?
(免费申请加入)AI工具导航网

相关标签: # 用AI2制作英文翻译器
评论列表 (0条)