NAACL 2022论文奖项公布:谷歌成最大赢家

qunmoluanwu2022-07-01 20:27:49腾讯科技

机器之心报道

编辑:陈萍、小舟

共有 5 篇论文获得 NAACL 2022 论文奖项,包括最佳新任务和新资源论文、最高效 NLP 论文、最佳新任务论文、最佳新方法论文和以人为中心的 NLP 专题最佳论文。

NAACL 会议是 ACL 的的北美分会,每年举办一次,也是 NLP 领域备受关注的顶会之一。NAACL 主要涉及对话、信息抽取、信息检索、语言生成、机器翻译、多模态、统计机器学习等多个方面。

今年共有 5 篇论文获得 NAACL 论文奖项,包括最佳新任务和新资源论文、最高效 NLP 论文、最佳新任务论文、最佳新方法论文和以人为中心的 NLP 专题最佳论文,另外还有 3 篇论文获得荣誉提名。

最佳新任务和新资源论文

论文:Automatic Correction of Human Translations

作者:Jessy Lin、Geza Kovacs、Aditya Shastry、Joern Wuebker, John DeNero

机构:UC 伯克利、 Lilt 公司

论文地址:https://arxiv.org/abs/2206.08593

获奖理由:这篇论文引入了一个新的语料库,提出一种新任务――人工翻译自动更正及其解决方法。该研究表明这项任务与经过深入研究的书面错误更正和 MT 输出更正任务不同。为这项任务开发系统需要一个新的语料库,该语料库是与一家大型人工翻译服务公司密切合作精心收集的,对新开发系统的评估包括了一项深入的可用性研究。

最高效 NLP 论文

论文:FNet: Mixing Tokens with Fourier Transforms

作者:James Lee-Thorp、Joshua Ainslie、Ilya Eckstein、Santiago Ontanon

机构:Google Research

论文地址:https://arxiv.org/abs/2105.03824

获奖理由:自推出以来,Transformer 一直是语言建模多项进展的基础,部分原因在于其学习的注意力权重。然而,随着参数量的增加,Transformer 模型需要更多的算力来训练。本文用混合输入 token 的未参数化傅里叶变换替换了 transformer 架构中的自注意力层。与类似的 Transformer 模型相比,替换之后的模型在 GPU 上的训练速度提高了 80%,在 TPU 上的训练速度提高了 70%,同时在许多任务中的准确性都能和原模型媲美。这项创新还让模型能够处理更长的输入序列,让未来研究远程上下文成为可能。NAACL 委员会称赞了该团队对大型语言模型效率的贡献。

最佳新任务论文

论文:FRUIT: Faithfully Reflecting Updated Information in Text

作者:Robert L. Logan IV、Alexandre Tachard Passos、Sameer Singh、Ming-Wei Chang

机构:加州大学欧文校区、 Google Research

论文地址:https://arxiv.org/abs/2112.08634

获奖理由:该研究为 NLP 社区提供了一个有趣且相关的新挑战:在给定新证据的情况下更新知识库信息。随着时间的推移,许多静态存储的信息已经过时,需要更新。一种自动更新过时信息的方法在现实世界的应用程序中将受到极大欢迎。该研究提出了这项任务,并讨论了新任务带来的挑战,其中涉及对比文本证据以确定哪些片段已过时,以及生成新文本的语言生成。论文中发布了新创建的数据集,并公开了源代码,以允许其他人使用与该研究相同的设置重新创建新的数据集。

最佳新方法论文

论文:NeuroLogic A*esque Decoding: Constrained Text Generation with Lookahead Heuristics

作者:Ximing Lu、Sean Welleck、Peter West、Liwei Jiang、Jungo Kasai、Daniel Khashabi、Ronan Le Bras、Lianhui Qin、Youngjae Yu, Rowan Zellers, Noah Smith, Yejin Choi

机构:艾伦人工智能研究院、华盛顿大学

论文地址:https://arxiv.org/abs/2112.08726

获奖理由:语言生成最简单的形式是在高维空间中搜索问题。该论文通过将经典的 A* 搜索算法纳入语言生成过程,明确了这种联系。A* 算法允许启发式搜索,将未来性能的「前瞻」信号合并到 token 选择中。作者在许多任务中对所提模型进行了非常彻底的评估,包括问题生成、机器翻译和故事生成。与典型的波束搜索(beam search)方法以及原始的 NeuroLogic 算法相比,新模型显示出巨大的性能改进。

以人为中心 NLP 专题最佳论文

论文:User-Driven Research of Medical Note Generation Software

作者:Tom Knoll, Francesco Moramarco, Alex Papadopoulos Korfiatis, Rachel Young, Claudia Ruffini, Mark Perera, Christian Perstl, Ehud Reiter, Anya Belz, Aleksandar Savkov

机构:Babylon 、阿伯丁大学、都柏林城市大学

论文地址:https://arxiv.org/pdf/2205.02549.pdf

获奖理由:本文是 NLP 系统以用户为中心的设计的一个很好的例子。作者进行了涵盖整个软件生命周期的不同用户研究,这有助于研究团队对系统需求以及利益相关者形成更可靠的理解。而且,作者并没有停留在部署这一步,而是在系统部署了一段时间后跟踪了用户。通过每个用户研究收集的见解证明对于 NLP 系统的设计、开发和部署至关重要。这篇论文对打算部署 NLP 系统的 NLP 研究人员和从业者很有帮助。

荣誉提名奖

对以人为中心的 NLP 专题贡献荣誉提名

论文:Automatic Correction of Human Translations

作者:Jessy Lin, Geza Kovacs, Aditya Shastry, Joern Wuebker, John DeNero

本篇论文还获得了最佳新任务和新资源论文,如前文所介绍的。

对方法贡献荣誉提名

论文:A Balanced Data Approach for Evaluating Cross-Lingual Transfer: Mapping the Linguistic Blood Bank

作者:Dan Malkin, Tomasz Limisiewicz, Gabriel Stanovsky

机构:希伯来大学、查理大学

论文地址:https://arxiv.org/pdf/2205.04086.pdf

获奖理由:本文讨论了零样本跨语言迁移学习的一个重要但未充分探索的方面,即预训练模型的语言特征对下游微调性能的影响程度。作者提出了一个新的框架来探索这个主题,以及几个有趣的指标来描述主体(donor)和接受者(recipient)语言之间的关系。本文最具启发性的发现之一是,最常用于预训练模型的语言英语通常不是最佳选择。这一结果有可能极大地改变 NLP 研究人员处理涉及跨语言迁移学习的任务的方式。

对资源贡献荣誉提名

论文:NewsEdits: A Dataset of News Article Revision Histories and a Novel Document-Level Reasoning Challenge

作者:Alexander Spangher, Xiang Ren, Jonathan May, Nanyun Peng

论文地址:https://openreview.net/pdf?id=EpXKbPSsYqL

获奖理由:该论文提出了一个由英语和法语报纸组成的数据集,其修订历史跨越 15 年。他们研究了文章更新在多大程度上是可预测的,并表明该任务在实践中具有相关性。先前研究主要集中在维基百科上的文章更新,其中的更改通常是小的语法更正,而该研究表明新闻文章更新主要包含语义上的新信息。除了这个新基准之外,该研究还提供了对结果的详细分析和额外的人工评估。这一新资源可以促进对自动修改文章的研究。

参考链接:

https://2022.naacl.org/blog/best-papers/

THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

金色趋势丨新一轮爆发还有多久?

BTC依旧未能突破上周提示的中轨线压制,同时也是日线三角上边线压制区,目前已下移至23700-24000区间,前期已经提示在未突破前短线可以逢高减仓,突破站稳则将有望挑战26000上方压力,目前行情再次下探,加上本周美...

分析 USDT 爆雷的可能性

USDT会爆雷吗?最近传出有避险基金在大量做空USDT,规模达到数亿美金。这篇来分析下USDT爆雷的可能性。我们先来看一下$USDT的资产储备成分,其实所有的稳定币发行商资产储备都跟货币市场基金成分类似,都是以现金、...

金色观察|NFT熊市大考:并购整合进行时

NFT市场正在降温。据TheBlockResearch 数据显示,在5月至6月期间,NFT的月交易量从40亿美元下降到了10.4亿美元,降幅达74%。74%的降幅是迄今为止NFT市场交易量的最大环比降幅。第二大环比降幅发生在今年2月至3月期...

DID与灵魂绑定:元宇宙的信用基石

摘要DID去中心化数字身份,元宇宙最重要的基础设施之一。身份是个体的属性集合,社会经济运行的基石。数字身份包含标识符、属性、凭证等数据要素,传统互联网的身份模型中,用户没有统一的标识符,数据身份无法互通...

我爱加密世界 但「她」现在真的令我失望

希望在未来,区块链上的应用会变得足够有用、方便和有趣。撰文:amirbolous.eth编译:Amber在最近一段时间里,我一直在与自己加密世界中经历的某些挫折以及心中对加密货币未来持续累计的「疑虑」斗争着,头脑中的两...

CZ谈Luna灾难:Do Kwon曾想联系我 被我拒绝了

目前,DoKwon及其公司TerraformLabs已经重新推出了Terra网络,并搭建了新的区块链及LunaToken,以此让Terra生态系统重新焕发生机。Binance首席执行官ChangpengZhao(CZ)是UST事件中仅有的几位对TerraformLabs表示失...

各国 Web3 现状与趋势

2022年,元宇宙、NFT、GameFi、DAO、DeFi等Web3时代的新生事物,正在彻底改写传统商业模式,重塑全球数字商业的版图,一个全新的数字时代正在开启。美国、欧洲官方开始在Web3领域发力,希望自己国家在Web3.0中更具竞...

纽约时报:朝鲜如何利用加密黑客提供经费?

这个与世隔绝的国家继续想方设法逃避制裁并在全球金融体系的边缘创造收入。原文标题:《HowNorthKoreaUsedCryptotoHackItsWayThroughthePandemic》作者:ChoeSang-Hun&DavidYaffe-Bellany,纽约时报朝鲜的经济受到联...

解析Tezos DeFi生态:为何能从DeFi项目中脱颖而出

去中心化金融(DeFi)是加密货币底层区块链技术的革命性应用,拓展了全球金融的视野。作为传统金融生态系统的替代方案,DeFi应用是由以太坊——有史以来第一个具有智能合约功能的可编程区块链协议——实现的。DeFi领...

全球独角兽|五个月长成独角兽,一双虚拟鞋卖5000元,最火web3游戏如何让人跑步入场

文|子佩编辑|乔芊一双只要你在动就能赚钱的虚拟跑鞋,你会动心吗?如果这双鞋的价格最高上百万元,最低也要5000元,你还会吗?StepN就是这样一双鞋:玩家在购入NFT运动鞋后,只要在运动,无论是逛街通勤还是跑步健...

上一篇:分析师指出导致DeFi崩溃的3个关键缺陷
下一篇:Arthur Hayes 博文:我所认识的三箭资本