说实话,我对AI同声翻译这事儿,一开始是有点不屑的。
因为几年前我试过几次,那体验简直灾难,你这边说“今天天气不错”,那边翻成“今日气候宜人”,然后延迟个两三秒,整个对话节奏全乱了,更别提那些专业术语,翻出来的东西让人想撞墙。
但最近因为要采访一个日本的技术专家,我又硬着头皮把这玩意儿捡起来了,结果这一试,还真给我惊着了,变化挺大。
先说个最直观的体验,我现在用的某款工具,打开之后直接戴耳机听,对方说日语,我耳朵里同步出来的是中文,不是那种“先录完再转写”的伪同传,是真的一边说着一边就翻出来了,延迟大概在一秒以内,虽然不能说零延迟,但至少不会让人觉得“这对话卡在半空中了”。
我试过几个场景。
.jpg)
一个是技术交流,聊的是AI芯片架构,这里头涉及一堆英文术语,什么transformer、attention mechanism、quantization,照理说这种内容对翻译是地狱难度,结果让我意外的是,它居然把“quantization”翻成了“量化”,而不是什么“量子化”或者直接丢个英文过来,说明后台已经能识别上下文做精准匹配了,这种体验,两年前我还真没见过。
另一个场景就是日常聊天,我跟一个德国朋友视频,聊他最近养猫的事,他那边语速飞快,还夹着各种口语化表达,actually”、“you know what”、“sort of”,以前的翻译工具碰到这种东西基本就宕机,要么直接跳过,要么翻成那种特别死板的“实际上你知道什么”,但现在这个,直接把“you know what”处理成了“你猜怎么着”,还有点语气感在里面,说实话我当时愣了一下。
但你说这东西已经完美了吗?那也没有。
有几个问题还是很明显的,一个是多人对话场景,如果一群人在一起说话,声音混在一起,它就傻了,谁在说、说什么、优先级怎么处理,直接乱套,我有次试过一个会议场景,三四个人的声音交叠在一起,它直接开始胡言乱语,翻出来的东西跟原话完全搭不上边,这种场景下,它还不如一个普通的人类速记员。
还有个问题,就是带口音的英语,我试过一个印度朋友的英语,它的表现就没那么好了,经常出现“嗯?嗯?”那种等待模式,有些句子直接断了,说明底层训练数据还是以标准美式、英式英语为主,其他口音的覆盖率还不够。
情绪这个东西,它还是没办法处理,同声翻译现在的水平大概能做到“准确传达意思”,但语气、情绪、反讽这些东西,基本是失真的,你朋友用开玩笑的口吻说“你可真是个天才”,它翻出来就是一句正经的“你真是个天才”,听起来像在夸你,这就很尴尬,误会就是这么来的。
那这东西到底有没有实用价值呢?
我觉得得分场景,如果是那种信息密度高但情感成分少的交流,比如商务会议、技术讨论、或者听一场国外的发布会直播,现在AI同传的体验已经相当可以了,我已经开始用它来听一些国外技术播客,边听边翻,基本能跟上节奏。
但如果是朋友之间的深度聊天、或者需要传递情绪和细腻语感的交流,它还有点距离,你和一个外国朋友吐槽生活,它可能翻得像个翻译机,而不是一个真人在陪你聊天。
最后说一个让我印象深刻的细节。
前几天我测试一个工具,对方突然咳嗽了一声,然后说了句“sorry, I’m a bit under the weather”,那个翻译工具愣是没翻译出“咳嗽”这件事本身,而是直接翻了“抱歉,我有点不舒服”,这说明它已经学会了跳过非语言信息,直接聚焦在语义上,这个小细节反而让我觉得,这玩意儿变得更“像一个人”了。
但你要问我会不会完全信任它?不会,至少现在还不会。
我会拿它当工具用,但关键沟通、尤其是情绪层面的交流,我还是会自己来,翻译这个东西,说到底不只是词对词的转换,更是文化、语气、上下文、潜台词的综合博弈,这段路,AI才刚走了开头。
不过话说回来,这个开头走得还挺快的,比我预想的快很多。
(免费申请加入)AI工具导航网

相关标签: # ai同声翻译发展到什么水平了
评论列表 (0条)