天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

本文经AI新媒体量子位(公众号ID:qbitai )授权转载,转载请联系出处

本文约1500字,建议阅读6分钟。

人工智能技术应用化日益推进,这次是AI对联。

A:天对地,雨对风。B:大陆对长空。这我也会。A:那你出一个我给你对。B:辣条对什么?A:额,没学过,我先问问AI。B:问出来了么?

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

对联秀,开场

AI说,辣条对香茗。

这是一位名叫王斌的有志青年,开发的对联AI

出炉之后,网友一股脑儿的都去调戏AI,网站甚至一度要挂。

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

我也出个认真的上联,考一考它:

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

突发现场:不会数数

不不不,认真的是这个:

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

有道理,梅花开的时节确实不一样。另外,平仄也讲究。

增加难度,上联出个有断句的:

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

山可透光,水不染尘,好一个清明的世界。

如果再配上山花烂漫:

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

来啊,快活啊。老司机啊,动车驾照拿好了吗?(误)

相信我,开车是个意外。

要成为一名德智体全面发展的AI,除了对诗文,也要常练武。

先来一招,猛虎硬爬山

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

名对名,动对动,形对形。矮又与高相映成趣,周全了。

不过,这意思是不想起床?

那可不行,再来一招乌鸦坐飞机

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

这次是坐起来了。但好像也坐得太稳了,菩萨啊。

唉,不爱动就躺着吧,十年一觉扬州梦

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

阿嘞?这样居然跑起来了,还不是短跑。

体能优异,又有爱国之心,成为栋梁之才指日可待。

不过,他日担当国之大任,还需对人工智能领域拥有清晰的认识,并且掌握专业知识:

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

额,还是谦虚一点比较好吧。

下面来考学术概念:无监督学习、线性回归、自然语言处理、向量,以及词嵌入。

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

有法可依;

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

民心归之;

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

人生平淡;

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

不想加班;

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

我在问词嵌入,你怎么喝上了?

那就趁着微醺,考察一下对学界和产业界的了解吧:

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

对学术前辈怀有敬畏之情,孺子可教。

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

伯克利......收回刚才的表扬。

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

这是说万古流芳的意思么?

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

你到底信佛还是信道?

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

好的,你醉了,明天再考。

打哪儿来的AI

这个AI的训练,基于深度学习seq2seq模型,用到了TensorFlow和Python 3.6,代码已经开源,你可以自行到文末传送门找到GitHub页面下载开源代码尝试训练。

目前的对联水平,是在Nivida GTX-1080 GPU上训练了大约4天左右的模型。

不过,这个AI对对联的表现还是要看它的“课本”。训练它所用的数据集来自一位名为冯重朴_梨味斋散叶的博主的新浪博客,总共包含超过70万副对联。

然而,由于我们不知道的原因,这位博主的博客已经无法访问了……

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

好在,我们还有万能的度娘,度娘在博客弥留之际留下了一些快照,我们发现,这是这位博主编辑的一部名为《联语杂酱面》的书。

看一看这些珍贵的史料,或许你就明白了上面对联AI的文风是怎样习得的了。

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

另外,博主本人还po出了该系列的目录:

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

全文不含标点15,153,840字,如果每天看100条的话,22年都看不完。

然而英伟达的GPU四天就看完了……

看完了……

完了……

还有微软的对联AI

我们今天的对联AI作者是一位名叫王斌的小哥哥,本科毕业于黑龙江大学计算机专业,几年后又到英国莱斯特大学读计算机硕士,现在是一名软件工程师。

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

除了王斌的对联AI之外,AI对联界还有一个著名的作品,来自大名鼎鼎的微软亚洲研究院,是十余年前沈向洋主导的一个研究项目。

微软的对联AI要谨慎且复杂一点,即使你填“辣条”作为上联,它也会给你许多个下联。

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

还能生成横批。

天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了

微软的研究其实是个古董,2004年沈向洋就提出要做自动对联,第二年的春节就已经申请下了专利。

对联AI的第一版早在2006年就已经上线公开了,我们看到的这一版是2008年的第二版,当时在PC互联网时代,未经主动传播的情况下就取得了5W的单日访问量。

来看看微软AI的代表作:

上联:此木为柴山山出下联:白水做泉日日昌横批:景色怡人

上此下木,是为柴;上白下水,是为泉。

能对出拆字联,这位AI老先生的文学造诣可见一斑。

究其原理,我们找到了微软亚洲研究院副院长周明博士的博文《微软对联背后的故事》,文中是这样介绍的:

我设计了一个简单的模型,把对联的生成过程看作是一个翻译的过程。给定一个上联,根据字的对应和词的对应,生成很多选字和候选词,得到一个从左到右相互关联的词图,然后根据一个动态规划算法,求一个最好的下联出来。

传送门

  • 王斌版AI对联
  • https://ai.binwang.me/couplet/
  • 开源代码
  • https://github.com/wb14123/seq2seq-couplet
  • 训练数据集
  • https://github.com/wb14123/couplet-dataset
  • 微软对联
  • https://duilian.msra.cn/default.htm

— 完 —

关注清华-青岛数据科学研究院官方微信公众平台“THU数据派”及姊妹号“数据派THU”获取更多讲座福利及优质内容。

相关推荐