博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
前Facebook AI翻译主管加盟阿里达摩院,致力图片、视频、声音“秒翻”
阅读量:6566 次
发布时间:2019-06-24

本文共 1093 字,大约阅读时间需要 3 分钟。

日前,前Facebook(脸书)应用机器学习部AI翻译团队主管黄非博士入职阿里巴巴达摩院。

入职后,他将在达摩院机器智能技术实验室,和同事推动AI翻译在新零售、跨境电商、视频等领域的实时翻译应用。

“语言”是跨境交易头号拦路虎。在阿里巴巴国际站,7成买家以英语沟通,还有30%为小语种。而卖家端的调研数据显示,大约96%的卖家对小语种无能为力。 阿里目前需要翻译的商品总量超过4亿。

5月18日,阿里巴巴在跨境电商中正式上线对话实时翻译功能,破解买卖家语言不通难题。据悉,这是全球首个电商领域的实时翻译AI(人工智能)产品。

目前,阿里AI实时翻译日均翻译次数达7.5亿,每年翻译次数超3000亿。公开资料显示,这是全球电商领域AI翻译之最。伴随电商全球化的步伐,阿里AI翻译发展壮大,其AI实时翻译工具目前提供21种热门语言,包括43个语言方向翻译服务,满足全球用户浏览不同国家商品的翻译需求。

8c9c2d889148f71cd23ae4fe564ca7c1e4abbc7c

实时翻译

因此,阿里AI实时翻译俨然成了阿里全球化战略的“技术生命线”。

黄非说,“选择从Facebook来到阿里,主要是因为这里有着丰富的应用场景,能给AI翻译学科带来更广阔的研发和想象空间。”

他介绍,主流商业AI翻译引擎都基于文本,进行海量比较、学习。这种单一维度的数据分析方法,面临模型的学习效率低下等瓶颈。而基于阿里丰富的应用场景,他和同事可以尝试建立包括图片、图像、声音等多模态数据维度的翻译架构,使得AI翻译的学习过程,更接近人的学习语言过程。

1dd9e1c259305185b64a29352e0429e431ae78f9

“人学习语言,不是简单背字典,而是掌握图像、声音等字词延伸内容后,理解字词使用的环境以及背后含义。而目前的AI翻译引擎,可以说是海量学习、比对网上的‘双语文本数据字典’,这样的学习效率其实并不高。而基于多模态的翻译架构,将综合学习字词语义以及相关的图像、语境等含义, 力求更接近人类学习语言,理解世界的方式。”黄非表示。

在黄非博士加入达摩院之前,陈博兴、刘晓钟两位博士也加入了达摩院机器智能实验室NLP团队。陈博兴博士曾在加拿大国家研究委员会从事机器翻译研究,刘晓钟博士曾在美国雅虎从事信息检索工作。

aabf9773b509efedbf13adbb5a02cc81ce32d8ab

阿里达摩院机器智能技术NLP团队负责人司罗介绍,NLP团队现有近百人分布在中国、美国、新加坡等实验室,30%以上人员有博士学历,团队还在招贤纳士。

日前,有消息称,阿里巴巴将于下半年正式推出语音实时翻译和直播视频自动生成双语字幕功能,届时,跨境商家可直接通过视频交流。各位科学家的陆续加入,无疑将加速这一进程。

原文发布时间为:2018-05-21

本文作者:孙茜茜

本文来自云栖社区合作伙伴“”,了解相关信息可以关注“”。

转载地址:http://wmcjo.baihongyu.com/

你可能感兴趣的文章
hdu-----(4514)湫湫系列故事——设计风景线(树形DP+并查集)
查看>>
第40周二
查看>>
用户注册
查看>>
使用虚拟机运行Ubuntu时,主机与宿主机共享文件的方法。
查看>>
做一个略调皮的个人主页--相册与随笔篇
查看>>
EJB究竟是什么,真的那么神奇吗??
查看>>
Python 转义符
查看>>
海茶3 らぶデス3 入门经典教程
查看>>
pstree命令
查看>>
css选择器顺序的小技巧
查看>>
C#之自己定义的implicit和explicit转换
查看>>
dojo 学习笔记之dojo.query - query(id) 与query(class)的差别
查看>>
Java基础加强总结(三)——代理(Proxy)
查看>>
一步一步写算法(之hash表)
查看>>
C99规范
查看>>
常用Git代码托管服务分享
查看>>
[转] 电子技术·笔记1(9月份)
查看>>
常用的服务
查看>>
BZOJ3799 : 字符串重组
查看>>
用纯JS做俄罗斯方块 - 简要思路介绍(1)
查看>>