“我为什么反对AI论文强制开源代码”

woniuxyy

2020-04-13

关注关注

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。

AI论文，到底该不该强制开源代码？

NeurIPS 2020官方近日发布了一份开源指南。从2019开始，NeurIPS就“强烈建议”提交论文代码，不过仍非强制。

但无论如何，官方传达出了一种信号：AI学术顶会开源代码已是行业趋势。

NeurIPS此举也引发了一场“年经”式的讨论：如果将来学术会议要求必须开源，投稿人应该拒绝吗？

而让人始料未及的是，不少网友认为：不开源，我有理。

反对一：代码并没有那么重要

首先，开源代码的目的是什么？是为了让其他研究者可以复现结果。

如果一篇论文包含足够多的细节，那么别人就可以根据其中的公式自己写出代码，对于这类论文，可以不公开代码。不过前提必须是提供足够多的细节。

比如谷歌的AlphaGo就没有开源代码，但是没有人怀疑它的正确性，事实上也有很多人根据谷歌论文复现了AlphaGo。

而且作者本人的代码可能会出现错误，不开源的一个好处就是让其他研究者独立复现。

万一作者在代码里挖了个不明显的“坑”，其他人也可以规避，防止被带到沟里。

另外，也不要高估代码的价值，经典论文可以几十年长盛不衰，但是代码很可能十年后就难以运行了。

当然，还有一种观点就是，对于AI来说，数据集更重要。没有数据的代码是没有价值的，而很多数据集没法开放，这意味着你即使拿到代码，也无法复现SOTA结果。

反对二：要为作者考虑

不开源同时也是为了照顾作者的种种特殊情况。

比如一些研究者是从事纯理论的研究。有一个网友就说，他甚至都不知道怎么构建Docker容器，虽然发表了多篇论文都在GitHub上开源了代码，但它从来不维护。

所以，论文是否开源应该根据代码对于文章的重要性而定，不该一刀切。

还有一些商业公司的研究者，他们在写论文的时候用到了公司内部专有软件库，如果强制开源，他们必须从头再写一遍代码，费时费力，对这些人也是不公平的。

还有一些作者，本身并不是不想开源，而是希望能够将成果保护一段时间，在论文发布几个月后再开源代码，这对于从事医疗、法律领域的学者很重要。

综上所述，反方网友认为，强制开源过于极端，应该对论文开源持鼓励态度，而不是强制。

支持开源：不开源怎能让人信服

首先是一名从事石油行业的网友说，他们行业的数据都是商业机密，所以不会发布任何数据和代码，甚至会在文章中丢掉一些公式来隐藏成果，还声称98%的正确率。结果怎能让人信服。

他认为不公开数据和代码，就像把一篇论文中所有的关键要素都删了，这样的研究即使发表出来也毫无价值。

还有一些人认为，强制开源会改变其他行业对机器学习的偏见。

很多其他学科的人都把机器学习看成伪科学，这是为什么？因为AI领域的论文发布过程非常不成熟。

科学方法的关键是一致性和可重复性。追逐单一的指标，每个人都对SOTA着迷，这是一个巨大的问题。

而开源是解决此问题的一种方法。

去年，AI知名女学者Anima Anandkumar曾在个人博客里公开喊话，强烈反对发论文却不给代码的行为，呼吁学术会议强制要求投稿同时必须公开代码。

开放源代码人工智能

woniuxyy

0 关注 0 粉丝 0 动态

关注关注

Python调用ffmpeg开源视频处理库，批量处理视频

strcmd = r'ffprobe -print_format json -show_streams -i "{}"'.format. strcmd = 'ffmpeg -i "{}" -vcodec copy -

dingwun 2020-11-16

LinkedIn开源Dagli，发布Java机器学习函数库

近年来，越来越多的优秀的机器学习工具不断涌现，如 TensorFlow、 PyTorch、 Caffee 和 CNTK、用于大规模数据的 Spark 和 Kubeflow，以及用于各种通用模型的 scikit-learn、 ML.NET 和最近的 Trip

lgblove 2020-11-16

使用开源可视化工具来理解你的Python代码

VizTracer 工具可以可视化并跟踪 Python 代码，让你可以更深入地了解其工作原理。随着 Python 项目变得越来越大、越复杂，理解起它来就变得充满挑战性。即使是你自己独自编写了整个项目，也不可能完全知道项目是如何工作的。为了能更好的理解你的代

千锋 2020-11-15

国内开源的里程碑！Linux基金会项目正式进入中国

近日,Linux 基金会和国内著名代码托管平台 Gitee 达成合作关系,将逐步在 Gitee 建立基金会旗下项目的官方镜像仓库,让国内开发者更近距离地认识和了解 Linux 基金会旗下项目,并参与其开源社区交流。在未来,会有更多 Linux 基金会项目

zhaomengsen 2020-11-12

开源端到端流水线实践-需求与代码管理

业务的简称为demo，微服务架构。特性分支开发，版本分支发布。每个需求对应一个特性分支。Jira作为需求和缺陷管理，采用Scrum开发方法，jira中的项目名称与业务简称一致。此时可以通过Jira中创建一个发布版本，然后问题关联发布版本。Jira负责创建需

jingzhaopan 2020-10-25

Linux 黑话解释：什么是 FOSS（自由和开源软件）？什么是开源？

在过去，我曾多次被问到这个问题，现在是时候解释一下什么是 Linux 和软件世界中的 FOSS 了。这个区别很重要，因为 FOSS 是一个通用的词汇，它可以根据上下文的不同而有不同的含义。在这里，我讨论的是软件中的 FOSS 原则。FOSS 是指自由和开

futurezone 2020-10-24

搜狗开源srpc，C++通用RPC框架

今年 7 月底，搜狗公司开源了内部的工业级 C++ 服务器引擎 Workflow。现如今，搜狗又宣布开源 Workflow 的生态项目——srpc，一个基于 Workflow 打造的轻量级 RPC 框架。srpc 与 thrift/brpc 是协议与 ID

Runtimeclass 2020-10-20

高性能、低开发门槛，搜狗开源轻量级RPC框架srpc

不久之前，搜狗开源了一个轻量级的 RPC 框架——srpc。这是一个基于 Sogou C ++ Workflow 的 RPC 项目，通过解析部分 IDL 和进行代码生成，实现了与 workflow 底层通信框架的对接和非常简洁的用户接口。srpc 整个项目

Martian 2020-10-13

这10个机器学习开源工具，你用过吗？

作为机器学习开发人员，你可能已经接触到很多机器学习资源，今天给大家介绍10个机器学习开源工具，有很多都是可以在项目中使用的工具，如果有帮到你的话，欢迎转发收藏。AutoML是一款可以自动选择并训练机器学习模型的软件，能够选择正确的算法，帮助调整超参数。Au

playoffs 2020-10-13

现在知道还不算晚，输入示例自动生成代码，谷歌开源这项神器要火

操作张量并非易事，因为它需要很多先决条件，例如跟踪多个维度，Dtype兼容性，数学正确性和张量形状等。当然最大的挑战还是从数百种可用选项中确定正确的TensorFlow操作。如果会的话，谷歌的TensorFlow Coder可以帮你实现这一点。然后，它会运

lybbb 2020-09-29

原来Java是这样打败PHP的，这张开源图太狠了

guangcheng 2020-09-24

所有的编程语言知识，都包含在这100张思维导图里了丨开源

编程里能用到的所有知识，都在这里了。这个号称东半球最全最酷的编程学习项目，不仅容纳了30万字的算法图解题典、100张各种编程语言的思维导图、1000本编程电子书，还有100篇大厂的面经。无论你是想收获大厂offer，还是不图名利、遍历编程的各种算法语言精髓

guangcheng 2020-08-31

7个优秀的学习Python编程的开源库

很多伙伴们在学习Python的过程中，更倾向于在Github上寻找Python学习资料，今天就和大家分享Github上7个绝佳的Python编程学习的开源库：。这个存储库还可以作为Python的介绍，帮助你从初级水平上升至中级，这里的中级指的是熟练地使用这

FalseNotFalse 2020-08-31

输入示例，自动生成代码：TensorFlow官方工具TF-Coder已开源

如何使编程更加便捷？最近，谷歌 TensorFlow 开源了一个帮助开发者写 TensorFlow 代码的程序合成工具 TF-Coder。用过 TensorFlow 框架的应该都知道，在操纵张量时，需要跟踪多个维度、张量形状和数据类型兼容性，当然还需要考虑

lybbb 2020-08-28

谷歌开源NLP模型可视化工具LIT，模型训练不再「黑箱」

深度学习模型的训练就像是「黑箱操作」，知道输入是什么、输出是什么，但中间过程就像个黑匣子，这使得研究人员可能花费大量时间找出模型运行不正常的原因。假如有一款可视化的工具，能够帮助研究人员更好地理解模型行为，这应该是件非常棒的事。近日，Google 研究人员

yyhhlancelot 2020-08-26

谷歌新工具重磅开源！有它就能在Chrome OS上快速构建应用程序了

如今，人们待在家里的时间比外出的时间要多得多，同时，人们也越来越依赖于电脑，无论他们是在和朋友和家人视频聊天，还是在玩娱乐应用和游戏，抑或是处理例行工作事项，还是在创建自己喜欢的一个项目......从2020年3月到6月，在美国Chromebook的销量同

化风 2020-08-14

程序员喜爱的8个Java开源IDE工具

谈开发，Java肯定是个绕不过去的话题，那大家到底都用哪些IDE呢?下面给大家讲讲8个程序员喜爱的Java开源IDE工具，当然了这只是整理出来的一部分，如果你有更好用的，也欢迎在评论区和大家一起探讨。Eclipse是一款主要用Java编写的免费IDE，允许

xiaoyaodaia 2020-08-12

几行代码即可高效创建数据集，谷歌开源 TFRecorder

在训练计算机视觉机器学习模型时，数据加载常常会成为性能瓶颈，导致在等待将数据加载到模型中时 GPU 或 TPU 资源的利用率不足。以TFRecord格式存储数据集是一个行之有效的方法，然而，创建 TFRecord通常需要大量的复杂代码。于是，谷歌近期开源了

多智时代 2020-08-11

一个开源免费的基于现代Javascript的动画引擎库——kute.js

KUTE.js是用于现代浏览器的JavaScript动画引擎，基于ES6 / ES7标准的现代JavaScript动画引擎，为Web开发人员，设计人员和动画师提供了最基本的功能，提供了易于使用的方法来设置高性能的跨浏览器动画。重点是代码质量高，灵活性强

小飞侠V 2020-07-28

一款vue编写的功能强大的swagger-ui，有点秀（附开源地址）

wagger-ui有非常多的版本，觉得不太好用，用postman，每个接口都要自己进行录入。所以在基于think-vuele进行了swagger格式json的解析，自己实现了一套swaggerui界面。swagger分为后端数据提供方方和前端页面展示请求方

XuDanT 2020-07-24

安科网

“我为什么反对AI论文强制开源代码”

woniuxyy

反对一：代码并没有那么重要

反对二：要为作者考虑

支持开源：不开源怎能让人信服

woniuxyy

相关推荐

Python调用ffmpeg开源视频处理库，批量处理视频

LinkedIn开源Dagli，发布Java机器学习函数库

使用开源可视化工具来理解你的Python代码

国内开源的里程碑！Linux基金会项目正式进入中国

开源端到端流水线实践-需求与代码管理

Linux 黑话解释：什么是 FOSS（自由和开源软件）？什么是开源？

搜狗开源srpc，C++通用RPC框架

高性能、低开发门槛，搜狗开源轻量级RPC框架srpc

这10个机器学习开源工具，你用过吗？

现在知道还不算晚，输入示例自动生成代码，谷歌开源这项神器要火

原来Java是这样打败PHP的，这张开源图太狠了

所有的编程语言知识，都包含在这100张思维导图里了丨开源

7个优秀的学习Python编程的开源库

输入示例，自动生成代码：TensorFlow官方工具TF-Coder已开源

谷歌开源NLP模型可视化工具LIT，模型训练不再「黑箱」

谷歌新工具重磅开源！有它就能在Chrome OS上快速构建应用程序了

程序员喜爱的8个Java开源IDE工具

几行代码即可高效创建数据集，谷歌开源 TFRecorder

一个开源免费的基于现代Javascript的动画引擎库——kute.js

一款vue编写的功能强大的swagger-ui，有点秀（附开源地址）

woniuxyy