ACL 2020 | 用BERT解决表格问答任务,谷歌提出弱监督表格解析器TaPas
BERT 在自然语言上已经取得了非凡的成就。近日,谷歌一篇 ACL 2020 论文又将 BERT 模型应用到了基于表格的问答场景中,为弱监督式的表格解析性能带来了显著提升。此外,谷歌开源了相关代码和预训练模型。 选自Google AI Blog,作者:Thomas Müller,机器之心编译,参与:Panda。 论文地址: https:// arxiv.org/pdf/2004.0234 9.pdf 代码和模型: https:// github.com/google-resea rch/tapas 世上许多信息都是以表格形式存储的,这些表格见诸于网络、数据库或文件中。它们包括消费产品的技术规格、金融和国家发展统计数据、体育赛事结果等等。目前,要想找到问题的答案,人们仍需以人工方式查找这些表格,或使用能提供特定问题(比如关于体育赛事结果的问题)的答案的服务。如果可通过自然语言来查询这些信息,那么取用这些信息会容易很多。 举个例子,下图展示了一个表格,并给出了一些人们想问的问题。这些问题的答案可在该表格的一个或多个单元格中找到(哪位摔跤运动员夺冠次数最多?),或需要聚合多个单元格的信息才能得到(仅夺冠一次的世界冠军有多少人?)。 表格,以及问题和预期答案。有的答案通过选择即可得到(如问题 1 和问题 4),有的答案则需要计算(问题 2 和问题 3)。 针对这一问题