我们办了场差点翻车的人机大战,但效果还不错

春暖讲事 2024-12-25 16:49:52

相信不少差友都知道,今年年初我们去逛 CES ( 国际消费电子展 )的时候,跟一家做 AI 翻译产品的中国企业时空壶打了交道。当时也跟大伙聊了聊他们的 X1 同声传译器,是怎么在展会上惊艳一大批老外的。

并且评论区有不少差友在讨论:AI 翻译发展这么快,接下来各种语言专业、同声传译专业是不是要被淘汰了?

于是,一个小小的种子在差评君的心里埋下—— “AI 翻译最终是不是会取代人类? ”

直到两个月前,我刷到了罗永浩的直播间。他在带货时空壶 W4 Pro 同传翻译耳机的时候,很认真地劝退想学同声传译专业的朋友:“ 实际上,人类最终什么语言都不用学,也就是未来 10 年 8 年的事。 ” 老罗在行业里的含金量,大家应该都是懂的。。。

看到老罗这么说之后,差评君之前埋在心里的那个疑问又蹦了出来,虽然我也觉得 AI 翻译现在很强,但取代人类这件事还真不好说。 “ 诶 ~ 既然如此,不如把 AI 翻译拉来跟人类同传比一比呗 ” ——这个想法一出就止不住了,作为《 我爱发明 》的忠实观众,这种人类队大战机械队 / 智能队的场面,真的让我觉得太有看头了

于是,差评君就在中国传媒大学摆下擂台,邀请了北京各个院校同传专业的优秀学生和时空壶,来一场别开生面的 AI 翻译大战人类同传。

但。。。没想到,比赛过程状况百出。

“ 我觉得这轮对人类队不公平! ”一位自称法律专业的学生在日语翻译环节的投票中表示弃权,因为比赛中的专业词和生僻词对人类队有些不公平,而 AI 可以实时联网搜索。

“ 本质上来说,一个成熟的产品跟一个尚未成熟的人类译员相比,我觉得这不是一个公平的竞争。 ”英语评委沈洲榕老师在电话翻译环节说道,他觉得 AI 翻译比起台上比赛的高校生,还是要更有优势些。

“ 我回一下刚才沈老师的问题,他觉得这个产品是个成熟的产品,很不好意思,就是现在的大模型它还是个小学生,它也在学习。 ”AI 领域专家王晓茹老师对前面沈老师的观点进行反驳。

学生观众质疑公平性,导师之间火药味十足差友们是不是以为我们这个活动主办方要汗流浃背了。。。恰恰相反,这个节目效果出乎意料的好!

原本我最怕出来的效果是一边倒地为 AI 翻译叫好,但结果现场的观众也好,评委老师也好,在 “ 站 AI 还是站人类 ” 的观点交锋非常激烈,这才是办活动的魅力 “ 哥们玩的就是真实! ”

下面我先给大家稍微介绍这次活动的情况。

这次比赛双方分别是:以时空壶 W4 Pro 为代表的 AI 翻译队;由北京各高校翻译专业的优秀学生组成的人类翻译队。

其中 W4 Pro 不能提前地对考题内容进行预训练,但人类队可以在比赛前获得考题的相关资料进行预习,包括考题的方向、考核的生词、难词等。由此可见,其实并不存在我们偏袒 AI 的情况。相反,因为我们知道 AI 的长处在哪,所以是给了它一层限制的,而评委打分环节呢,我们也是尽量保证公平公正,每个环节将会由外语评委、翻译学专家以及 AI 领域专家三人来完成打分,他们将会从翻译的准确度、完整度以及流畅度等方面来综合评判。

首先是第一个环节:基础翻译,这个环节主要比四轮,分别是英语、日语、法语和西班牙语四个语种,主要考验的是参赛选手对专业名词、专业术语、数据和古诗词等的翻译表现。

在第一轮比拼中, AI 翻译队不出意外地出了意外——一开始就暴露出了目前 AI 翻译的一大难题:网络。。。

在英语演讲员念完一段话之后, W4 Pro 因为现场的网络丢包问题,直接把前两句给漏掉了,并且后面为了赶进度,语速也加快了。

在专业评委看来,翻译工作面向的是人,要考虑人的听感,再加上前面两句漏译了,所以时空壶这里丢分比较多。

而人类队的英语翻译小姐姐凭借稳定的发挥,成功拿下了这一轮的胜利。这里我必须给 AI 翻译队稍微挽尊一下,现场因为场地布置和预算等原因,并没有拉来运营商的专线,所以 W4 Pro 靠的是手机的 5G 网络,它在当时人很多的会场里出现延迟,其实很正常。当然,这也是我们日常使用 AI 翻译会遇到的问题,毕竟运营商不可能一直让基站跟在你的周围到了第二轮的日语翻译环节, AI 翻译队也是出了状况,因为 W4 Pro 耳机操作员的一个失误,他们提前交了答案,所以申请重赛。

重赛的结果就是, AI 翻译队扳回一城。在这轮中, W4 Pro 胜在了对特定领域的专有名词更加了解,而人类队选手则是没有把很多专有名词翻译出来,导致丢分严重。但我觉得人类队的同学也算是情有可原,一个是这篇内容确实难,像是内窥镜、肿瘤性结肠息肉、小型腺瘤这些词,别说日语了,就是中文语境内,大家平时应该也很少听到;另外一个就是这位同学也是真的紧张了。

还有日语评委丁曼老师提到了,不仅选手紧张,上台念稿的高桥同学也紧张得不行,因为这样导致 AI 翻译这边出现了个错误,把「 小型腺肿 」译成「 小运动员 」。日语里面,「 腺肿 」和「 选手 」的读音是差不多的,所以 AI 就给听成了运动员选手。。。

估计后边时空壶得根据这种日语里的同音词去对大模型做点微调。

到了第三和第四轮呢, AI 翻译队终于是有点进入状态的感觉了。

W4 Pro 凭借着更准确和更全面的翻译表现,接连拿下法语翻译和西班牙语翻译这两轮的胜利。

而人类队这边,主要丢分的地方是法语的翻译漏了重要数据,以及西班牙语的翻译丢失了关键信息。

因此,第一个基础翻译环节就以 AI 翻译队 267 分比人类翻译队 226 分作为结束。

接着就是第二个比拼环节电话翻译了。

这个环节中,参赛双方需要接入一个语音会议,里面会有一个操着地方口音英语的外国人在进行交流,相当于模拟打电话的场景。总共有三轮,分别是新加坡口音、印度口音和新西兰口音。

那结果呢,同样是 AI 翻译队取得胜利,不过两边选手的分数差距其实并没有拉得很大。

W4 Pro 主要胜在面对各种口音的语言,都可以把各种信息说对说全。

而英语翻译小姐姐丢分的点,主要都是在于信息的准确度和完整度这两个方面,有部分错译和漏译的情况。

总之,这场活动办下来,虽然状况百出,但也真实地暴露出了 AI 队和人类队的问题,这些经验我觉得是非常宝贵的。

对于人类队来说,这些同学未来在开展工作的时候,肯定是会遇到形形色色的人,他们有的口音不标准、有的说话容易紧张;也肯定会遇到一些让人紧张到汗流浃背的翻译场合。。。

今天这场比赛的预演,我希望能对他们的未来发展有所帮助。

对于 AI 队来说,时空壶 W4 Pro 的表现,我觉得算是代表了 AI 翻译领域的一个重要节点,它所体现出来的优势和问题,可以作为整个行业的参照,推动 AI 翻译往下一个重要的能力节点去发展。在差评君看来,整场比赛下来, W4 Pro 其实在速度上并没有占优,基本都是落后人类队一句话的时间,它最大的优势还是在于准确度和完整度,这种近乎「 全知全能 」的知识储备量,是人类同传很难实现的。

当然,就跟专业评委们说的那样,翻译是一门面向人的工作,它需要情感和灵活性,这点是目前 AI 所欠缺的,比如 AI 翻译的朗读声基本没啥起伏,听着就不够生动;还有对于一些发言人的口误, AI 翻译现在还没办法很好地及时纠正回来。

对于这些问题,时空壶他们也跟我说,这场比赛之后又有了点新灵感,接下来会着手解决,并且还约我来日再战。

好好好,那下回我可要加大难度。要是咱们邀请同传界的老鸟,来跟时空壶来个人机大战 2.0 巅峰对决,不知道差友们感不感兴趣呢?最后我们回到开头的那个问题—— “AI 翻译最终是不是会取代人类? ”关于这个问题啊,我觉得法语评委宋碧珺老师讲得非常好,她说道:

“ 其实人类翻译和AI翻译更像是「 山和水 」的关系,而并非是零和博弈。 ”

“AI 翻译更像是水流一样,它可以源源不断地流动,可以不知疲倦地持续输出,也不会出现人类的伤痛和衔接问题。 ”  “ 而人呢,则可以像山一样,它可以指引水流的方向,也可以在某种极限的环境下起到稳定的作用。比如当 AI 翻译出现网络连接问题的时候,人类可以及时介入;再比如很多时候发言人犯错误的时候,人类也可以进行纠正。 ”  “ 并且人类翻译在一些商务洽谈场合下,还起到调和气氛的作用。 ”

“ 所以未来,我们可能会看到的是,人类翻译和AI翻译是一种和谐共生、耦合的关系。 ”

对于同传翻译行业来说是如此,而对于我们这些普通人来说呢, AI 翻译的发展同样也是一件好事,它让我们的跨语言交流是变得越来越便利了。回顾一下人类为了突破语言隔阂所做的努力,从 20 世纪三四十年代开始,法国科学家和苏联发明家就在探索可以将一种语言翻译成另一种语言的机器,虽然这个构想受限于当时的技术并未最终实现,但也鼓励了无数的后来者。直到 1946 年,第一台现代电子计算机的诞生,给机器翻译提供了发展的土壤,让人类进入到机器翻译的时代。

而到了近两年,基于大模型的能力,翻译技术又迎来了第二波爆发,像时空壶 W4 Pro 这种AI翻译产品就突破了实时同声传译的技术瓶颈,让我们进入到 AI 同传的时代。

就像在场的教授们说的那样,在一些不太重要的场合下,比如业务合作洽谈、线上会议等场景, W4 Pro 已经可以取代人类干一些同传翻译工作了。但像是商务谈判、政府接待等严肃场合,采用人机搭配的形式,可能会在效率和解决方案商得到更多保障。

0 阅读:1