在AI调用量最高的场景之一——机器翻译,阿里国际的AI团队有了新进展。 10月16日,阿里国际副总裁、AI负责人张凯夫在接受彭博社专访时表示,阿里国际最新研发的Marco翻译大模型,支持中、英、日、韩、西、法等15种全球主流语种。目前已在阿里国际AI官网Aidge上发布,面向全球用户开放使用。基于目前广泛使用的开源评测数据集Flores,Marco翻译大模型在BLEU自动评测指标上,领先于市面上的标杆翻译产品,如Google翻译、DeepL、GPT-4等。这意味着,Marco的AI翻译能力总体已经超越全球竞争对手,成为行业第一。 图:根据公开榜单数据的测评结果 Marco的主要优势就是由大语言模型驱动,能够基于语境进行精准翻译,而不是根据字面意思,造成哭笑不得的歧义。“你的宝贝正在路上”,不会再被翻译成“Your baby is on the way”。以“尊嘟喜欢”这一网络用语为例,一些AI翻译产品会将这句话翻译为“Zundu likes it”,而在Marco大模型中,这句话非常地道地翻译为“I really like it”。如何实现这一效果呢?据介绍,Marco翻译大模型通过面向多语言的数据筛选技术,如多语种混合语料甄别、多维度数据质量评估,获得高质量、大规模的多语言数据,再结合多语言的混合专家、参数扩张方法,从而保证主导语言(如中、英)性能不下降的情况下,提升其他语种的质
...
继续阅读
(16)