说实话,做自媒体这行,很多时候都在琢磨怎么省力又吸粉,前阵子我捣鼓了一个小项目——用AI主播做自动翻译直播,效果居然还不错,今天就把这套路掰开了讲讲,过程真没你想得那么玄乎。
先聊聊为啥要搞这个,我那会儿刷到不少老外讲AI的频道,英语的、日语的、甚至印度口音的都有,心里痒痒,想着要是能把这些内容翻成中文,或者反过来把中文内容翻成英文播出去,是不是能蹭个双倍流量?但问题是,我自己英语也就四级水平,还带点中式发音(讲真,谁不是呢),雇人翻译?那成本可不是小数目,于是我就把主意打到了AI身上。
第一步,你得有个能直播的虚拟形象,现在市面上不少平台都支持数字人,比如国外的D-ID,或者国内的一些工具,像腾讯智影、商汤什么的,选个顺眼的模特(我选了个看起来比较正经的小哥哥,毕竟讲技术嘛),录个几秒钟的点头眨眼素材,后台就能自动生成口型同步,别小看这一步,口型能对上,观众才愿意多看两眼。
第二步,才是核心:自动翻译,我试过不少路子,最后还是觉得这样最稳——用语音识别把原声转成文字,再扔给翻译API,最后把翻译结果合成语音,听起来绕?其实就三步:听写、转译、再说话,具体点,如果你用的是OBS(免费直播软件,建议人手一个),可以装个插件接Google Cloud的语音识别服务,原声从麦克风进去,实时输出字幕,同时塞进翻译接口,翻译我用的是DeepL,因为它翻译得更自然,尤其是技术文档,比谷歌翻译那种死板味儿少很多,如果你做的是中文翻外文,可以试试百度翻译,某些语种挺全的。
最后一步有点烦人,但必须搞定——语音合成,翻译完的文字得让虚拟主播读出来,我试过微软Azure的文本转语音,声音选择多,而且支持情感参数,比如加点兴奋或者严肃的语调,如果你嫌麻烦,剪映也有语音合成功能,免费,但可选声音少点,反正我最后就是先把谷歌识别的结果丢给DeepL翻译,再微软合成,然后OBS里循环播放,全程自动,人都不用守着。
.jpg)
但有个坑得提醒你,AI直播最怕延迟,尤其是语音识别那一步,英文快话说快了,识别容易漏词,我第一次测试时,老外嘴皮子一溜,字幕直接崩成“I… very… think”,后来我调整了一下麦克风音量和识别语言标签(强制指定为英语“en-US”),这才好点,翻译延迟控制在2秒以内最好,不然观众会以为是卡碟了。
至于效果嘛,我连播了三天,就讲AI工具怎么用,中间穿插几段翻译过的海外博主干货,粉丝从个位数涨到三百多(虽然不多,但对我这种小号已经很意外了),评论区有人问“是不是真人”,也有人直接讨论内容,说白了,观众才不管你背后是人是AI,他们只关心能不能学到东西。
对了,有个朋友还问我,这算不算作弊,我说,工具摆在那儿,就看你怎么用,写文章我用AI辅助,直播我用AI翻译,但我输出的知识是自己的,这不就跟当年我们用计算器算账一个道理么?省下来的人力,还不如想想怎么让内容更有趣。
如果你也想搞个自动翻译直播,别怕技术门槛,只要会基本的OBS操作,外加几十块的翻译接口费用,一天内就能跑起来,现在平台政策也没说禁止这种形式的直播内容(前提是你别挂羊头卖狗肉),先试个小语种,比如法语或日语,竞争少,反而容易出头。
反正我是尝到甜头了,接下来打算搞个日播,每天讲一个AI工具的实际用法,翻译成三种语言在不同时段推,一个人,一台电脑,听上去像科幻片?其实真就几行配置的事,你也别等着了,趁现在规则宽松,赶紧试试,毕竟,流量这玩意儿,手快有,手慢无。
(免费申请加入)AI工具导航网

相关标签: # ai主播自动化翻译怎么做
评论列表 (0条)