2018年自然语言处理最值得关注的研究、论文和代码

weiweipig

2019-01-09

摘要： NLP 与情感分析、增强学习、深度学习的交叉领域，全年干货大合集。

2018年对于自然语言处理（NPL）是很有意义的一年，见证了许多新的研究方向和尖端成果。Elvis Saravia 是计算语言学专家，也是2019 计算语言学会年度大会北美分部的项目委员之一。他总结了2018年 NLP 的重要进展，包括增强学习、情感分析和深度学习等领域。

点击文章中的链接，可获得每一项研究的详细信息、论文或者代码。

综合领域

Facebook 研究员们发明了一种机器翻译的新方法，只需要使用单一语言语料库，这对于缺乏资料的语言非常有用。
Young 和同事更新了他们近期发表的论文《基于深度学习的自然语言处理的最新趋势》，增加了 NLP 文献中最新的 SQuAD 结果。
Bloomberg 研究员 Yi Yang 发表了 RNN 卷积筛选建模的最新论文及代码，称体现了语言中的长期依存性和组合性。
百度发布了 Deep Voice 3，是一项基于注意、完全卷积的文字语音转换神经系统，比目前的循环系统在神经语音合成方面快几个量级。
Pair2vec 是一种学习文字嵌入对的新方法，能体现隐含关系的背景知识。
百度发布了名为同声翻译与预测及可控延迟（STACL）的机器翻译算法，能够同时进行多个翻译。在同声传译时，这项技术不需要等发言者暂停发言，而可以预测发言者的下一个词语。
Deep INFOMAX 是一种学习无监督表征的方法，将输入和高层特征矢量之间的共同信息最大化。

2018年自然语言处理最值得关注的研究、论文和代码

蒙特利尔大学的 AI 研究团队 MILA 发表了多个超赞的研究成果，记录了自然语言生成（NLG）任务中 GAN 的限制。
聊天机器人是 NLP 的一个重要研究领域，创业公司 lang.ai 如何使用无监督 AI 来解决打造聊天机器人的重要挑战之一：理解用户到底想要什么。
这个模型提供了一种新方法进行文字生成，可以实现更强的解读性和控制性。
谷歌 AI 发表了论文，探索语言建模的极限。
亚马逊研究员提出了一种语言建模方法，这种新的训练策略的重要性在于，在现实中，要获得大量的训练数据来建立一种新能力经常是不现实的。

**增强学习**

许多研究员认为增强学习是机器学习的最前端。我们来看看这个领域内，2018年都有哪些重大进展。

David Ha 的“世界模型”，目标是研究个体能否在其自身的梦境中学习，需要利用增强学习来学习一项规则，依靠世界模型中抽取的特征来解决制定的任务。
OpenAI 开发了一个类似人类的机器人手，通过增强学习算法获得操纵物体的灵活性。
DeepMind 在《自然》杂志发布了一篇论文，讨论虚拟环境中，人工个体的网格表征怎样通过矢量导航找到解决。
TextWorld 是以文字游戏为灵感的学习环境，用于训练增强学习代理。

2018年自然语言处理最值得关注的研究、论文和代码

Google研究员开发了一项名为 MnasNet 的技术，是一种自动化神经网络架构搜索方法，用于通过增强学习设计移动化机器学习模型。
OpenAI Five 利用增强学习，能在复杂游戏 Dota 2 中打败业余水准的人类选手。
DeepMind 开发了名为 PopArt 的技术，利用增强学习在多任务环境中具有高精确度。
三星的 CozNet 是一种增强学习算法，在两项知名的NPL比赛中展现了顶尖表现。
Arel 使用对抗奖励学习来讲故事，解决故事评估维度的局限。
Metacar 是为无人驾驶汽车而设计的增强学习环境，在以 Tensorflow.js 打造的浏览器上使用。
OpenAI 发布的 Gym Retro 平台提供 1000多个游戏，进行增强学习研究。

情感分析

机器学习系统需要更深的理解能力，才能与人类在情感层面互动。

这篇新论文提出了“层级化CVAE用于精准的仇恨言论分类”，能够理解40多个群体和13中不同类别的仇恨言论。
这篇论文讨论如何使用简单的支持向量机变量获得最佳结果，并指出模型方面需要注意的几点。目前大部分情感分析都是基于神经方法，研究时需要注意模型和特征的选择。
这篇论文定量分析了推特表情肤色修改器的使用效果。

2018年自然语言处理最值得关注的研究、论文和代码

这篇论文讨论如何使用深度卷积神经网络检测讽刺。另外，这项新研究使用眼动追踪、NLP和深度学习算法检测讽刺。
研究员开发了一项成为“情感聊天机器”的方法，这个聊天机器人不仅能给出符合事实与逻辑的答案，还能在聊天中加入悲伤、厌烦等情绪。
Lei Zhang 等研究员发表了一篇论文，综合概括了深度学习方法如何用于情感分析。
这个双向异步框架可以在聊天中生成有意义的情感回复。
这项研究使用计算机视觉方法，研究语境中的情感识别。
这篇在2018 NAACL 大会上发表的论文，提出了一种方法可以使用简单的递归神经网络模拟情感流。

2018年自然语言处理最值得关注的研究、论文和代码

深度学习

DeepMind 与哈佛大学教师 Wouter Kool 合作发表了论文，研究人类如何使用大脑来做决定，以及这些研究结果能如何启发人工智能的研究。
这篇论文引入了“群组归一化”的概念，可以有效替代批归一化，被认为是深度学习的一项重要技术。
Sperichal CNN 是一种打造卷积神经网络的新方法。
BAIR 发布了一篇文章，讨论目前循环神经网络和前馈神经网络在解决各种问题时的优缺点。
Facebook 的 AI 研究小组开发了一项新技术，能将 AI 模型运行效率提升16%。这能提高 AI 模型的训练速度，并简化模型的量化和运行。
这篇《自然》杂志论文，介绍了一种可以预测地震后余震位置的深度学习方法。
DeepMind 研究员开发了一种新方法，利用神经算数逻辑单元（NALU）改善神经网络，追踪时间、用数字图片运行算数、数图片中的物体个数等等。
DARTS 是一种架构搜索算法，可以设计高性能的图像分类卷积架构。
这篇论文《实证验证序列建模中的通用卷积网络和神经网络》，讨论了序列建模中 CNN 和 RNN 的区别。
图形神经网络如何帮助推断潜在关系结构、模拟多代理和物理动态。
谷歌 AI 研究团队发布了一篇论文，提出了一种改进版的 RNN，能够提高自动数据解读的精确度。
Distill 发布了新研究，可以在一个数据源的语境下分析另一个数据。
-

2018年自然语言处理最值得关注的研究、论文和代码

如果没有任何数据、也没有任何人类知识工程，有可能习得精准的认知模型吗？这项研究会告诉你答案。
这篇论文详细描述了针对深度神经网络的批归一化研究。
这篇论文回顾了神经网络中，如何更好地进行批训练。
这篇论文讨论如何正确评估深度半监督学习算法。

本文由阿里云云栖社区组织翻译。

文章原标题《NLP Highlights of 2018》，译者：炫，审校：袁虎。

作者：【方向】

自然语言处理机器学习

weiweipig

0 关注 0 粉丝 0 动态

相关推荐

为什么企业应该了解聊天机器人中的自然语言处理？

自然语言处理使聊天机器人能够理解我们的会话信息并相应地作出响应。企业应该对聊天机器人中的自然语言处理有所了解，因为它可以确定用户意图，评估其情绪并了解其行为。聊天机器人已经成为企业在当今竞争激烈的市场中获得认可的当务之急。利用聊天机器人提供的前所未有的客户

saluzirobot 2020-11-05

MIT 推出机器翻译新算法，破译已消失的古语言

麻省理工学院计算机科学与人工智能实验室的研究人员最近开发出了一种新的计算机算法，可以帮助语言学家自动破译历史上消失已久失的古语言。官方指出，该系统能够自动破译已消失的语言，且无需对这一语言与其他语言的关系有深入的了解。他们还表明，该系统自身就可以确定语言之

baijingjing 2020-10-27

NLP：不要重新造轮子

自然语言处理是一个令人生畏的领域名称。从非结构化文本中生成有用的结论是很困难的，而且有无数的技术和算法，每一种都有自己的用例和复杂性。作为一个接触NLP最少的开发人员，很难知道要使用哪些方法以及如何实现它们。本文的目标读者是希望将自然语言处理快速集成到他们

熊Ok 2020-10-26

十大针对机器学习的文本注释工具与服务，你会选用哪个？

下面，我将和您一起探讨目前十大针对机器学习的文本注释工具与服务。您可以根据自己项目的实际情况，从中做出选择并试用。Tagtog是一款由波兰软件公司开发的工具，可用于自动化或手动注释文本。Tagtog既支持原生的PDF注释，又包含了可用于自动化文本注释的预训

lgblove 10评论 2020-10-23

机器翻译：谷歌翻译是如何对几乎所有语言进行翻译的？

谷歌翻译大家想必都不陌生，但你有没有想过，它究竟是如何将几乎所有的已知语言翻译成我们所选择的语言？本文将解开这个谜团，并且向各位展示如何用长短期记忆网络构建语言翻译程序。第一部分简单介绍神经网络机器翻译和编码器-解码器结构。什么是机器翻译？在机器翻译领域，

WhiteHacker 2评论 2020-10-11

AI创业哪家强？6大选择给你方向

人工智能被认为是当代“最热门”的工作。根据《财富》杂志统计，雇佣AI专家的人数在过去4年里增长了74%，社会对人工智能专家的需求正以前所未有的速度增长。人工智能的子领域，如机器学习、深度学习、计算机视觉、统计学和自然语言处理，对这些领域专家的需求和空缺职位

guojin0 2020-10-08

自然语言处理实战：机器学习常见工具与技术

许多自然语言处理都涉及机器学习，所以理解机器学习的一些基本工具和技术是有益处的。有些工具已经在前几章中讨论过，有些还没有，但这里我们会讨论所有这些工具。数据选择和特征工程会带来偏见的风险。类似的种族、宗教甚至地理区域偏见在原始的Word2vec模型中普遍存

lirika 2020-09-27

人工智能的企业家来说，这四个新的方向可能值得重视

在过去、现在和未来，人们用人工智能改变了许多行业，取得了很大的进步，也对人工智能有着长期和系统的发展远景和规划。对于人工智能的企业家来说，这四个新的方向可能值得重视：一是人类的自然语言处理、密集学习、记忆网络和其他技术领域与其他物种不同。人类的重要能力之一

saluzirobot 2020-09-25

人工智能的研究热点:自然语言处理

人工智能作为新一轮科技革命和产业变革的重要驱动力量，正在深刻地影响世界、改变世界。而自然语言处理已成为AI领域的研究热点，它推动着语言智能的持续发展和突破，并越来越多地应用于各个行业。正如国际知名学者周海中先生曾经所言：“自然语言处理是极有吸引力的研究领域

hxq 2020-09-23

性能媲美BERT，参数量仅为1/300，谷歌最新的NLP模型

在最新的博客文章中，谷歌公布了一个新的 NLP 模型，在文本分类任务上可以达到 BERT 级别的性能，但参数量仅为 BERT 的 1/300。在过去的十年中，深度神经网络从根本上变革了自然语言处理领域的发展，但移动端有限的内存和处理能力对模型提出了更高的要

熊Ok 2020-09-22

AI写的文章，真的可以骗过老师了

在过去的几年里，机器学习和人工智能的专家们一直致力于研究一些算法，这些算法可以用以前认为人类完全可以写的方式撰写文章和其他类型的内容。前段时间，一位学生用编程语言让电脑写了一篇文章在外网火了，网友都看不出来那篇文章出自AI之手。随着这些技术越来越先进，我们

randy0 2020-09-17

自然语言处理必读：5本平衡理论与实践的书籍

当谈到学习方法时，我们常常会提到教程、博客文章、在线课程等等，书本总是会被忽略掉。即使是在找一本关于某个主题的书，也会很快发现这样的书太多了，无法快速判断哪一本最适合自己。它也称为NLTK书籍，应用Python进行自然语言处理在整个过程中都很大程度上依赖于

MakeRoomFor 2020-08-30

无需「域外」文本，微软：NLP就应该针对性预训练

在生物医学这样的专业领域训练NLP模型，除了特定数据集，「域外」文本也被认为是有用的。但最近，微软的研究人员「大呼」：我不这么觉得！这是一个拷问人工智能「门外汉」的灵魂问题。但研究人员将这部分归因于数据中的噪声。

mxs 2020-08-10

pytorch+huggingface实现基于bert模型的文本分类（附代码）

一年前的这个时候，我逃课了一个星期，从澳洲飞去上海观看电竞比赛，也顺便在上海的一个公司联系了面试。当时，面试官问我对RNN的了解程度，我回答“没有了解”。但我把这个问题带回了学校，从此接触了RNN，以及它的加强版-LSTM。时隔一年，LSTM好像已经可以退

qilixuening 2020-07-18

NLP中的标识化

从零开始掌握一门新的语言令人望而生畏。如果你曾经学过一种不是你母语的语言，你就会理解！有太多的层次需要考虑，例如语法需要考虑。这是一个相当大的挑战。这就是自然语言处理中标识化的概念。简单地说，标识化对于处理文本数据十分重要。标识化是一种将文本分割成称为标识

NgCafai 2020-06-28

基于OpenSeq2Seq的NLP与语音识别混合精度训练

Mixed Precision Training for NLP and Speech Recognition with OpenSeq2Seq. 迄今为止，神经网络的成功建立在更大的数据集、更好的理论模型和缩短的训练时间上。为此，我们创建了OpenSeq

bensonrachel 2020-06-21

人工智能的8个有用的日常例子

如果你在谷歌上搜索“人工智能”这个词，然后不知怎的就打开了这篇文章，或者用优步打车上班，那么你就利用了人工智能。虽然有人将其称为“机器人以邪恶的天才统治世界”的现象，但我们无法否认人工智能通过节省时间、金钱和精力使生活变得轻松。人工智能是指机器通过专门设计

womystery 2020-06-17

人工智能的三大领域及其工业应用

人工智能是一门新兴的技术学科，研究和开发用于模拟人类智能的扩展和扩展的理论，方法，技术和应用系统。人工智能研究的目标是让机器执行一些复杂的任务，这些任务需要聪明的人来完成。也就是说，我们希望机器可以代替我们来解决一些复杂的任务，不仅仅是重复的机械活动，而是

purgle 2020-06-01

腾讯AI又创新纪录：ACL 2020入选27篇论文

近日，国际计算语言学协会年会在官网公布了ACL 2020的论文收录名单，共计收录779篇论文。据不完全统计，此次腾讯共有27篇论文入选，投中论文总数刷新国内记录，领跑国内业界AI研究第一梯队。此次ACL 2020的审稿周期相比以往几乎增加了一倍的时间，据最

dynalidan 2020-05-22

什么是机器阅读理解？跟自然语言处理有什么关系？

学者C. Snow于2002年发表的一篇论文中将阅读理解定义为“通过交互从书面文字中提取与构造文章语义的过程”。而机器阅读理解的目标是利用人工智能技术，使计算机具有和人类一样理解文章的能力。深度学习的特点是，模型能根据训练集上预测的准确度直接优化参数，不断

xceman 2020-04-30

weiweipig

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号