使用图神经网络做基于会话的推荐

kevinzhaozl

2019-05-20

关注关注

1、背景介绍

现有基于会话的推荐，方法主要集中于循环神经网络和马尔可夫链，论文提出了现有方法的两个缺陷：

1）当一个会话中用户的行为数量十分有限时，这些方法难以获取准确的用户行为表示。如当使用RNN模型时，用户行为的表示即最后一个单元的输出，作者认为只有这样并非十分准确。

2）根据先前的工作发现，物品之间的转移模式在会话推荐中是十分重要的特征，但RNN和马尔可夫过程只对相邻的两个物品的单向转移关系进行建模，而忽略了会话中其他的物品。

针对上面的问题，作者提出使用图网络来做基于会话的推荐，其整个模型的框架如下图所示：

使用图神经网络做基于会话的推荐

接下来，我们就来介绍一下这个流程吧。

2、模型介绍

2.1 符号定义

V={v1,v2,...,vm} 代表所有的物品。s=[vs,1,vs,2,...,vs,n]代表一个session中按照时间先后排序的用户点击序列，我们的目标是预测用户下一个要点击的物品vs,n+1

2.2 子图构建

我们为每一个Session构建一个子图，并获得它对应的出度和入度矩阵。

假设一个点击序列是v1->v2->v4->v3，那么它得到的子图如下图中红色部分所示：

使用图神经网络做基于会话的推荐

再假设一个点击序列是v1->v2->v3->v2->v4，那么它得到的子图如下：

使用图神经网络做基于会话的推荐

同时，我们会为每一个子图构建一个出度和入度矩阵，并对出度和入度矩阵的每一行进行归一化，如我们序列v1->v2->v3->v2->v4对应的矩阵如下：

使用图神经网络做基于会话的推荐

上图中，左边的矩阵是出度矩阵，右边的矩阵是入度矩阵，如果同时考虑出度和入度，模型学习的就不是简单的单向转移关系了，而是更加丰富的双向关系。

2.3 基于Graph学习物品嵌入向量

基于Graph学习物品的嵌入向量，作者借鉴的下面这篇文章《GATED GRAPH SEQUENCE NEURAL NETWORKS》（地址：https://arxiv.org/pdf/1511.05493v3.pdf）的做法，其实就是一个GRU单元，不过在输入时，模型做了一定的改进。

模型的输入计算公式如下：

使用图神经网络做基于会话的推荐

我们还是使用刚才的序列v1->v2->v3->v2->v4来一点点分析输入的过程。

1）ats,i是t时刻，会话s中第i个点击对应的输入

2）As,i:代表的是一个分块矩阵，它是1*2n的，n代表序列中不同物品的数量，而非序列的长度，此处是4，而非5。举例来说，假设我们当前的i=2，那么其对应的As,2:=[0,0,1/2,1/2 | 1/2,0,1/2,0]。我们可以把As,i:拆解为[As,i:,in,As,i:,out]

3）vt-1i可以理解为序列中第i个物品，在训练过程中对应的嵌入向量，这个向量随着模型的训练不断变化，可以理解为隐藏层的状态，是一个d维向量。

4）H是d*2d的权重向量，也可以看作是一个分块的矩阵，可以理解为H=[Hin|Hout]，每一块都是d*d的向量。

那么我们来看看计算过程：

1）[vt-11,...,vt-1n] ，结果是d * n的矩阵，转置之后是n*d的矩阵，计作vt-1

2）As,i:vt-1H相当于[As,i:,invt-1Hin , As,i:,outvt-1Hout]，即拆开之后相乘再拼接，因此结果是一个1 * 2d的向量。

上面的过程，相当于分别对一个节点的出度和入度进行处理，再进行合并。该过程是我通过代码慢慢理解的，代码如下：

fin_state = tf.reshape(fin_state, [self.batch_size, -1, self.out_size])
fin_state_in = tf.reshape(tf.matmul(tf.reshape(fin_state, [-1, self.out_size]),
 self.W_in) + self.b_in, [self.batch_size, -1, self.out_size])
fin_state_out = tf.reshape(tf.matmul(tf.reshape(fin_state, [-1, self.out_size]),
 self.W_out) + self.b_out, [self.batch_size, -1, self.out_size])
av = tf.concat([tf.matmul(self.adj_in, fin_state_in),
 tf.matmul(self.adj_out, fin_state_out)], axis=-1)

上面的代码中，fin_state相当于保存的是我们的vt-1，self.W_in相当于我们的Hin， self.W_out相当于我们的Hout，self.adj_in相当于As,i:,in，self.adj_out相当于As,i:,out。

有一丢丢的复杂，上面是我个人的理解的计算过程，大家可以作为参考。

上面的输入，我们充分考虑了图的信息，接下来，就是GRU单元了，这里的GRU单元没有太多变化，公式如下：

使用图神经网络做基于会话的推荐

由上面的公式，整个学习的过程就是每个物品的向量独自进行循环，但是在每次输入的时候，会充分考虑图中的信息，简单化一下示意图如下：

使用图神经网络做基于会话的推荐

图中我省略了一些不必要的线，不过我想你能够理解。

2.4 生成Session对应的嵌入向量

好了，经过T轮的图网络，我们得到了一个session中每个点击物品的向量，分别为[v1,v2,...,vn]，即下图中红色的部分我们已经获得了：

使用图神经网络做基于会话的推荐

接下来，我们要讲解的是下图中红色的部分：

使用图神经网络做基于会话的推荐

我们认为，当前序列中最后一个物品是十分关键的，所以把这个信息单独拎出来，令s1 = vn。但是，我们已不能舍弃其他的信息，所以，模型中使用了一个attention的策略，分别计算前面的物品和最后一个点击物品的相关性，并进行加权，得到sg：

使用图神经网络做基于会话的推荐

最后，将两部分进行横向拼接，并进行线性变换，得到sh:

使用图神经网络做基于会话的推荐

2.5 给出推荐结果及模型训练

在最后的输出层，使用sh和每个物品的embedding进行内积计算：

使用图神经网络做基于会话的推荐

并通过一个softmax得到最终每个物品的点击概率：

使用图神经网络做基于会话的推荐

损失函数是交叉熵损失函数：

使用图神经网络做基于会话的推荐

3、一点小疑问

在上面进行内积计算的过程中，所使用的vi，应该不是经过GNN中间输出的vi，而是每个物品的初始embedding，这个初始的embedding，即我们GNN的初始的输入v0，如下图：

使用图神经网络做基于会话的推荐

这个embedding在训练过程中不断的被更新。

个人感觉论文这里符号有点混乱。

4、总结

本文使用图网络进行基于会话的推荐，效果还是不错的，而且图网络逐渐成为现在人工智能领域的一大研究热点。感兴趣的小伙伴们，咱们又有好多知识要学习啦，你行动起来了么？

原文发布于微信公众号 - 小小挖掘机（wAIsjwj）

神经网络模型矩阵

安科网

使用图神经网络做基于会话的推荐

kevinzhaozl

1、背景介绍

2、模型介绍

3、一点小疑问

4、总结

kevinzhaozl

相关推荐

机器学习的未来就在这里：高斯过程和神经网络是等价的

面向深度学习的五大神经网络模型及其应用

【干货】图神经网络的十大学习资源分享

神经网络：高深莫测又妙趣横生的完整历史！

建神经网络模型，哪种优化算法更好？35000次测试告诉你

图神经网络快速爆发，最新进展都在这里了

神经网络“炼丹炉”内部构造长啥样？牛津大学博士小姐姐论文解读

2019年Philip S. Yu团队的图神经网络综述

9大主题卷积神经网络（CNN）的PyTorch实现

什么时候以及为什么基于树的模型可以超过神经网络模型？

当支持向量机遇上神经网络：SVM、GAN距离之间的关系

浅谈CNN和RNN

图神经网络的究竟有多强大？道翰天琼认知智能机器人平台API接口大脑为您揭秘。

谷歌用算力爆了一篇论文，解答有关无限宽度网络的一切

Pytorch_第十篇_卷积神经网络（CNN）概述

一文了解卷积神经网络基础，建议收藏

用神经网络给照片补光，谷歌这项研究却实现了「鬼片」效果

图神经网络越深，表现就一定越好吗？

73岁Hinton老爷子构思下一代神经网络：属于无监督对比学习

人工智能迁移学习如何工作在AI模型和培训过程起到那些作用

kevinzhaozl