En
全站>新闻中心> 详情

于洋:跨语言大数据驱动未来 翻译行业巨头讲述心得

媒体聚焦 来源:中华网日期:2017-12-09浏览次数:126

背景信息:TAUS(翻译自动化用户协会)对话中译语通科技股份有限公司(“中译语通”)CEO于洋。中译语通是行业领先的语言、大数据和人工智能服务供应商。以下为对话实录:

image.png

对话首先围绕一个核心问题展开——

TAUS:“您对翻译行业最重要的心得体会是什么?”

于洋:我认为最主要的是:翻译行业是一个综合性“行业”的一部分,这个“行业”就是我们所说的“跨语言大数据”。

我本身跟翻译行业渊源颇深。我学的是会议口译专业,毕业后加入中国对外翻译有限公司(“中译”),先后担任首席同传、会议口译部主任、市场总监、总经理助理和副总经理等职务。中译是中国最大的语言服务供应商,2013年,中译成立子公司中译语通,我被任命为CEO。这些年中,我认识到许多相关的语言现象都可以作为语言数据归结到人工智能这个行业中。

众所周知,机器翻译是自然语言处理(NLP)和人工智能(AI)最复杂的部分,我们称之为“皇冠上的宝石”。2014年,我们开始投入大量资金进行机器翻译研发,因此对NLP、语音识别、大数据和人工智能有了更深刻的认识。

2015年10月,我们提出了“跨语言大数据”这一概念。如果我们用英语、俄语或中文进行搜索,得到的只能是相应语种的内容,那么如果消除所有语言标签,只是简单地让大家输入他们自己的语言,结果会怎么样呢?这样我们可以获取中文、英语、俄语、德语及其他任意一种语言的所有相关结果。如果我们能够定量、定性地分析所有这些数据,又会怎么样呢?这就是我们跨语言大数据概念的实质所在。

从本质上来说,这涉及到实时机器翻译的应用,但这仅仅是一种“语言转换”。我们开始思考,假如能够从一个术语搜索到所有相关文本,或者能够根据用户收到的一条新闻来分析相关人员、时间、位置、实体以及包含的其他知识或信息,会有怎样的结果?如果我们能够扩大数据搜索范围,获取近10年或20年的所有数据,并以同样的方式对其进行定量定性分析,又会有怎样的结果?目前这个领域是空白,所以我们试图来实现这一概念。

TAUS:您是如何将口译的专业背景和兴趣与这一理念联系到一起的呢?

于洋:早在2008年,我在全球顾问委员会担任语言服务业务委员的时候,就提出我们应该试试通过电话进行同声传译。那时候这个想法很超前,事实上现在也是。

因此,2012年,我们开始筹备成立多语言呼叫中心。2013年初,中译语通作为独立公司成立,我们设立了全球多语言呼叫中心。近几年,它已经发展为中国最大的呼叫中心,提供12种语言服务,平均每月收到全球各地客户50万分钟的呼叫。比如,我们有400余位口译员专门为中国银联提供服务。此外,我们还为客户提供大数据分析。每个月我们都对所有呼叫大数据进行分析并生成报告,从这点上讲,呼叫中心已经不是传统意义上的呼叫中心,而是正在发展为一个大数据中心。

TAUS:从规模上讲,您如何将中译语通与你们最强劲的对手进行对比?

于洋:如我所说,中译语通现在是一家大数据公司,规模及业务范围远远超过中国任何一家翻译公司,也许还超过许多其他国家和地区的翻译公司。

例如,我们从2014年开始致力于机器翻译,2015年开始开展大数据业务,平均每年投入3000万美元用于研发。公司已经申请了十几项机器翻译技术的专利。目前,我们的机器翻译支持33种语言,包括中文、英语、德语、法语、日语、阿拉伯语、葡萄牙语、俄语、韩语等;其中,25种语言采用了我们自主研发的神经网络机器翻译技术。

除了翻译业务和呼叫中心,我们还提供视频本地化服务,其中约85%的内容是通过我们的一站式智能字幕翻译工具——字幕通(YeeCaption)完成的。

我来举个视频翻译的例子。2017年3月,我们的客户从海外引进海量短视频,计划在类似YouTube的平台上推出短视频业务。这些视频种类多样、内容丰富,并且涉及多个语种。我们启用了将近700位翻译,仅用10天时间就完成了时长约830个小时的视频本地化翻译。此外,我们已经成为IP供应商,与海外37家最大的IP供应商签署了版权合作协议,成为他们在中国的独家经营商。因此,我们已经超越了本地化的技术服务,进一步向发行与制作方面进军。

TAUS:中译语通追求的已经不仅仅是提供翻译服务了。您认为你们已经做好准备与Google这样的技术公司进行竞争了吗?

于洋:我们与Google和其他机器翻译技术供应商不同,我们提供垂直领域的机器翻译引擎。比如在金融、军事等领域可以进行定制,我们的机器翻译能提供更高质量的服务。除了机器翻译,我们的数据挖掘能力已经覆盖全球200多个国家和地区的65种语言,并且每天进行更新。全球范围内,我们的新闻日更新和处理能力达3000多万篇,社交数据日更新和处理能力达5亿条。

对我们而言,跨语言大数据是非结构化开源数据,包括开源新闻数据以及Twitter、Facebook、微信、微博等社交媒体数据。我们可以分析每一条非结构化数据。比如我们的大数据产品JoveBird,通过一系列金融分析模型和强大的跨语言大数据处理能力,可以帮助投资人分析股价趋势并制定投资战略。

TAUS:中译语通是否有计划将业务扩展至其他大洲或国家,还是仅限于在中国发展?

于洋:事实上,我们很希望与全球伙伴合作,包括广告公司、咨询公司和大数据公司等等,帮助他们在中国市场发展。中国是一个很大的市场,我们能够很好地对客户千变万化的市场需求做出回应。我们现在拥有10余个大数据产品,面向政府、企业、新闻媒体等行业的大数据分析平台,还拥有工业大数据、数据采集平台及其他大数据平台。我们希望能与我们合作伙伴一起,运用我们最先进的数据技术,来帮助他们打开中国市场并扩展全球市场。

TAUS:你们的大数据和人工智能业务发展越来越大,翻译业务占据的比例是否会逐渐缩小?

于洋:目前,语言服务在中译语通整体收入中的确只占据很小一部分,但未来,这个市场会有极大的发展。与发展迅速的大数据和人工智能相比,语言服务市场同前沿技术的融合相对缓慢。我想强调的是语言行业应该借助人工智能,而不是继续遵循传统方式。就像我在澳大利亚的世界翻译大会(FIT)主题演讲中提到的一样,我们必须迎接人工智能,与其共同成长,为语言服务创建更好的未来。我们之所以可以与海尔、通用电气、阿里巴巴等这样的行业巨头进行合作,是因为我们拥有整个大数据平台背后的语言技术,也正因为如此,我们的平台才能处理跨语言大数据,这就是我们的核心价值。

我们可以预见未来,以我们的大数据行业平台为例,所有这些语言技术已经自动嵌入大数据平台。通过这种方式,我们已经将语言和数据连接起来,为语言服务行业打造全新的未来。


扫描二维码分享到微信

联系我们