趣文网 > 作文大全

哈佛 X DeepMind最新成果:用AI破译古希腊文字 超越人类水平

2020-12-21 19:50:01
相关推荐

大数据文摘出品

来源:newscientist

编译:赵吉克、武帅、钱天培

AI又学会了一项新技能——破译残缺的古希腊金石文字,在这项任务上,AI甚至超越了人类水准。

近日,来自哈佛和DeepMind的Yannis Assael以及他的同事发表了他们的最新研究成果。他们训练了出了一种名为Pythia的神经网络,可以阅读年代久远的金石,并由此推测缺失部分的文字。

该研究的代码也已经被公开。Github链接如下:

https://github.com/sommerschield/ancient-text-restoration

金石,也就是雕刻在耐用器具,如石器、陶瓷或金属的表面上的文字,是古代历史的主要来源之一。

这些文字通常是由古代的个人、团体或者机构所书写的,它为人们对古代文明的思想、社会和历史的研究提供了第一手资料。

目前人类已知的古代金石数以千计,而且每年还会新发现几十种。不幸的是,长年的侵蚀和破坏造成了不少文字的缺损。依据剩余部分和其余相似文字推理出残缺部分的铭文至今仍是个难题。

复原文本是一项复杂而耗时的任务。铭文学家依靠访问大量的信息来找到缺损文本和上下文的“相似点”(类似于寻找文档中的重复表达),而这些信息资料主要存在于研究人员的个人记忆库以及执行“字符串匹配”搜索的数字语料库中。然而,搜索查询中的细微差异就可能会排除或混淆相关结果,使得构建一个“待复原字符”的真实概率分布十分困难。

Deeepmind发表的Pythia模型是第一个打破了当前铭文复原方法局限的AI系统。

这个被称为Pythia的AI从包含至少300万个文字的35,000块碎片中学习识别模式。这种识别模式包括了不同词语出现的语境、语法以及铭文的形状和布局。

针对一个特定的信息缺失字符,Pythia提供20个用于填充缺失的建议,有了这些建议人们可以就根据自己的判断和学科知识选择最佳匹配项。“这个AI就是用来帮助人类专家的”,Assael如是说。

为了测试这一系统,开发团队对Pythia隐藏了一个九个字符组成的希腊人名。Pythia成功猜出了名字。

在另一项测试中,AI试图填补2949份受损铭文的空缺,而与之相对的是,人类专家所犯的错误比AI多出了30%。并且就效率而言,人类专家花了2个小时才看完50个铭文,而Pythia只用了几秒钟就猜出了全部。

来自牛津大学的团队成员之一Thea Sommerschield说,这显示了AI辅助复原的巨大潜力,而且这一方法可以告诉我们古代世界宗教、社会和经济生活的几乎每一个方面,简直不要太有用。

剑桥大学的Philippa Steele也认同Pythia的辅助作用,尽管当下人类仍然需要用肉眼拼凑碎片,并在使用AI之前先人工解码一部分。

她随后补充道:“在我看来,当一段长文本中只缺失了一小块或者某个新发现的碎片有很多相似副本时,AI识别的正确率最高”。

阅读剩余内容
网友评论
相关内容
小编推荐

大家都在看

赞美菊花的作文 做重阳糕的作文 小学作文快乐的一天 儿童节作文250字 什么在远方作文 牡丹的作文300字 ps动作文件夹 灯下作文600字 新农村的变化作文 我的好妹妹作文 英语通知作文的格式 写景作文夏天 美丽的景色作文 写一篇关于快乐的作文 国庆趣味作文 心灯作文 最开心的一件事作文 三年级作文可爱的小猫 给的一封信作文600字 消防作文300字 幸福的滋味作文600字 以心要在焉为题的作文 关于网红的作文 我好想自由作文600字 关于病毒的作文 划龙舟的作文 父母之爱作文400字 义工英语作文 漫画作文250 事物变化作文