趣文网 > 作文大全

AI能看懂英文 阿里巴巴夺实体发现测评全球第一

2020-12-19 00:55:01
相关推荐

全球顶级的知识库构建测评KBP2017日期公布了最新排名。阿里巴巴人工智能研究机构iDST斩获英文实体发现测评全球冠军,在准确率和召回率上均表现出色,核心指标F1达到0.811。这次测评吸引了全球20多支顶尖团队参与,包括IBM Research, BBN, Stanford Univ, CMU Univ, UIUC Univ, Columbia Univ, 腾讯等。

KBP是由NIST(National Institute of Standards and Technology,美国国家标准与技术研究院)指导、美国国防部协办的赛事,主要任务为从自然书写的非结构化文本中抽取实体,以及实体之间的关系。

这项测评要求AI算法在“读完”一篇英文文章后,构建一个物理世界的命名实体和实体之间关系的知识库,如“克林顿和希拉里之间是夫妻关系”、“克林顿毕业于耶鲁法学院”这样一个个实体的关系。

阿里巴巴iDST自然语言处理首席科学家司罗介绍,他们的算法可以做到对文章上下文的理解。比如,文章出现了Apple,再出现Jobs,就可以辨别出这个Jobs指的是乔布斯,而不是工作。再比如,文章出现了Microsoft,那么Apple就更有可能是苹果公司,而不是一种水果。

“另外,我们构建了一个算法去学习不同领域之间共同的部分,通过迁移学习提升我们学习的准确度。对于不同领域数据,我们取其精华,去其糟粕,进行智能学习”,司罗说。

在这次测评中,iDST团队采用经过改良的深度神经网络架构对文本进行理解。改良的架构有三个主要特点:首先该模型可以自动阅读海量文章(如维基百科)并从中汲取经验;其次,该架构可以智能选择训练数据集以保证训练数据的准确性;最后,我们采用post regularization的办法保证模型结果的一致性。

对于KBP2017的成绩,司罗表示:“很荣幸能够同全球的同行分享阿里巴巴的研究成果,人工智能在机器阅读理解和知识库构建上还处在起步阶段,我们正在积极和同行业顶尖机构学习交流,推动行业发展。比如我们内部建设的信息抽取平台AliIE项目就在同斯坦福大学展开积极合作”。

阿里巴巴正在将这样的信息抽取技术广泛的应用到实际业务当中,并致力于让更多的中小开发者从中收益。他们搭建的信息抽取平台AliIE拥有最顶尖的AI技术,并从一开始的架构设计就考虑到平台的开放性和可扩展性。可以让更多的开发者、研究员共同开发,并将成果回馈给这个社区。

阿里巴巴iDST自然语言处理首席科学家司罗

司罗是全球权威机器智能学者,曾担任美国普渡大学计算机系终身教授,主持的20余个项目得到美国政府、工业界资助,先后获得美国国家科学基金会成就奖、雅虎、谷歌研究奖等。

由他领导的自然语言处理团队目前支持了阿里巴巴大生态每天多达600亿次的自然语言处理需求,团队横跨杭州、北京、硅谷、西雅图(新加坡)多地,成员大多拥有10年以上的研发经验。检索招聘网站可以看到,他们依旧在不断扩充团队。

阅读剩余内容
网友评论
相关内容
延伸阅读
小编推荐

大家都在看

我最尊敬的人800字作文 我终于战胜了什么作文600字 童年趣事450字满分作文 作文我最好的朋友 家人团圆的作文 高中常考作文 有关窗外的作文 过独木桥作文 写人的作文六百字 世界真奇妙作文 自我介绍500字作文男 学校操场作文 高考作文常用素材 作文我最喜爱的一本书 我和手机作文 看图写话体育活动作文 学校趣事作文 第一次剪纸作文 我的观察作文300字 家规英语作文带翻译 小学作文旁批 同桌摸下的作文1000字 考研英语作文一般能拿多少分 我的爱好作文结尾 优秀作文400字可抄免费 奉献的作文素材 童年趣事作文1000字 扬帆起航作文500字 食品作文 往事的作文