En
校园招聘信息
请以中国出版集团的校招通知为准
全站>新闻中心> 详情

中译语通2017新征程:打造大数据技术生态主引擎

媒体聚焦 来源:中国经营网日期:2017-08-15浏览次数:28

当大数据对企业决策的重要性日益突显,当经济一体化、技术全球化越来越深入,如何打通跨语言体系,在全球的框架下进行决策就显得格外重要。

换句话说,百度、Google提供了搜索平台,但如何克服语言障碍,将散落一地的信息以更加清晰的结构化形式呈现出来,这其中蕴含着巨大的市场机会。

作为中国对外翻译有限公司控股子公司, 中译语通科技(北京)有限公司(以下简称中译语通)抓住了这一机会。在7月29日举办的“幻化·中译语通2017战略发布会”上,展示了中译语通独特的大数据驱动下的AI美学,并发布了基于译见大数据技术生态的多款新应用和最新技术成果。“未来,中译语通将依托庞大的技术体系,构建大数据生态,在神经网络机器翻译、多语言自然语言理解、语义搜索等最新技术成果的基础上,为各领域提供专业、精准、定制化的大数据服务。” 中译语通CEO于洋表示。

构建跨语言大数据生态

在于洋看来,过去的五年,是中译语通 “不循规蹈矩”成长的五年。从最初不着边际的“黑脑洞”到其变为现实,中译语通将“数据地图”到“数据心电图”再到“技术生命曲线”做成了一幅幅清晰直观的数据图谱,实现了大数据驱动下的智能化直观应用工具。

目前,在跨语言大数据领域,中译语通已经拥有了大数据采集、治理、分析、呈现等多方面的成果,形成了成熟的大数据技术生态。以面向海外发布的金融大数据平台JOVEBIRD为例,该平台通过内置百种数据模型及算法和独特的跨语言文本分析算法,对金融数据进行智能化分析,并以“数据心电图”的形式清晰的呈现分析结果。目前,JOVEBIRD预测的数据曲线与上市公司股价变化的拟合度准确率超过了65%,这对于金融领域而言,无疑将带来巨大的研判价值。

于洋介绍说:“这一切,是基于庞大的、高质量的语言数据,也基于我们在语言科技、语言生态当中的积累。”中译语通拥有每天超过5亿条的全球社交媒体的结构化与非结构化数据解析,加上传统语言服务的积淀,使得中译语通在语言大数据的积累方面有着得天独厚的优势,体量之大让人难以想象。

打造大数据技术生态主引擎

中译语通大数据生态的构建,离不开庞大的技术体系。近几年,中译语通加大了对机器翻译和大数据方面的研发投入,并且取得了许多重大的技术研究成果。

从2014年起,中译语通投入机器翻译研发,并陆续打造出系列场景应用工具,继而形成了今天完善的机器翻译生态。如今中译语通机器翻译日访问量已超过1.5亿次,相当于每天的翻译超过30亿字。公开信息显示,由最新第三方机构对谷歌、微软、百度和中译语通四家目前市场上规模化商用的机器翻译的中文-英文双方向(应用规模最大的语言方向)进行的机器评测与人工评测的最终结果显示:中译语通在两个语言方向上的综合得分名列第一,超过谷歌、微软和百度,并在垂直领域的机器翻译引擎拥有优势。

中译语通CTO程国艮告诉记者,中译语通的译见大数据平台解构后包括采集平台、治理平台、分析平台、数据平台、管理平台、数据地图等6大子系统,覆盖大数据分析的全生命周期,为各个行业提供“一站式”大数据解决方案,通过对海量数据进行深度挖掘,实现对数据价值的唤醒。

目前,基于译见大数据技术生态,中译语通发布了Insider DI 、Insider BUZZ 、Insider LITE三款面向不同用户需求的大数据应用,为各行业提供全面且个性化的大数据应用服务。

大数据平台作为译见大数据技术生态的核心,将为各行业打造更加智能的大数据平台,突破无监督学习、综合深度推理等数据算法、分析难点问题,建立数据驱动、以自然语言理解为核心的认知计算模型,形成从大数据到知识、从知识到决策的能力升级。大数据发展的未来,必定是开放与共融的,这也同样是中译语通将其庞大复杂的技术体系高度集成,以技术成果的形式开放给全行业的初衷。

扫描二维码分享到微信

联系我们