DeepWalk算法的本质（DeepWalk的应用）

DeepWalk模型可以理解为一种矩阵分解 $M=WH^T$ ，其中矩阵的每一个元素 $M_{ij}$ 其实是节点 $i$ 以固定步长随机游走到 $j$ 上的概率。下边将从数学角度解释。其中 $W$ 和 $H$ 为训练中的邻居节点和中心节点对应的节点向量矩阵。

准备

通过了解Word2Vec我们可以知道，词对（ $w_1, w_2$ ）之间关系的远近可以通过其对应向量的点乘来表示，将其转换为词对共现的概率可以表示为：

$P(w1,w2))=σ(w1⃗,w2⃗)=11+ew1⃗⋅w2⃗P\left(w_1, w_2)\right)=\sigma\left(\vec{w_1},\vec{w_2}\right)=\frac{1}{1+e^{\vec{w_1}\cdot\vec{w_2}}}$

$, w^{2}$ $) = 1 + e ^{w 1}$ $^{\cdot w 2}$

$1$

由于DeepWalk借鉴了这个思路，所以DeepWalk中点对（ $v, c$ ）的关系也可以这么表示：

$P(v,c))=σ(v⃗,c⃗)=11+ev⃗⋅c⃗P\left(v, c)\right)=\sigma\left(\vec{v},\vec{c}\right)=\frac{1}{1+e^{\vec{v}\cdot\vec{c}}}$

$, c$ $) = 1 + e ^{v}$ $^{\cdot c}$

$1$

优化的目标是：

$\prod_{v_i,c_i} P\left(v_i,c_i\right)$

我们假设随机游走路径已经被进行了处理，提取出了其中所有相邻的节点对，我们将所有的节点对构成一个集合 $D$ 。进而，我们同样可以得到节点 $v$ 和节点 $c$ 的集合 $V$ 和 $V_c$ （在实际操作中，我们往往令 $V=V_c$ ）。对于特定的节点对（ $v, c$ ）而言，我们记 $♯(v,c)\sharp\left(v,c\right)$ 为节点对（ $v, c$ ）的在 $D$ 中出现的次数，记 $♯(v),♯(c)\sharp\left(v\right),\sharp\left(c\right)$ 为节点 $v$ 和 $c$ 在 $D$ 中出现的次数。

负采样

根据负采样的原理，我们可以写出基于负采样的目标函数，它除了要保证正例上的概率最大，也要保证负例上的概率最小：

$l=∑v∑c♯(v,c)logσ(v⃗⋅c⃗)+k⋅♯(v)⋅♯(c)∣D∣logσ(−v⃗⋅c⃗)l=\sum_v\sum_c\sharp\left(v,c\right)log\sigma\left(\vec{v}\cdot\vec{c}\right)+k\cdot\sharp\left(v\right)\cdot\frac{\sharp{\left(c\right)}}{|D|}log\sigma\left(-\vec{v}\cdot\vec{c}\right)$

$\cdot c$ $) + k \cdot ♯ (v) \cdot ∣ D ∣ ♯ ( c ) l o g σ (- v$ $\cdot c$

$)$

设 $x=v⃗⋅c⃗x=\vec{v}\cdot\vec{c}$

$\cdot c$

，要想使概率最大，只需对将l对x求导，得到导数为0时x的值即可。

$v⃗⋅c⃗=x=log♯(v,c)⋅∣D∣♯(v)⋅♯(v)−logk\vec{v}\cdot\vec{c}=x=log\frac{\sharp\left(v,c\right)\cdot|D|}{\sharp{\left(v\right)}\cdot\sharp{\left(v\right)}}-logk$

$\cdot c$

$= x = l o g ♯ ( v ) \cdot ♯ ( v ) ♯ ( v , c ) \cdot ∣ D ∣ - l o g k$

其中k为负采样数量。

softmax

softmax也有类似的结论，推导会复杂点，直接给出结果：

$v⃗⋅c⃗=x=log♯(v,c)♯(v)+bv\vec{v}\cdot\vec{c}=x=log\frac{\sharp\left(v,c\right)}{\sharp{\left(v\right)}}+b_v$

$\cdot c$

$= x = l o g ♯ ( v ) ♯ ( v , c ) + b_{v}$

其中 $b_v$ 为任意常数。

观察 $v⃗⋅c⃗=x\vec{v}\cdot\vec{c}=x$

$\cdot c$ $= x$ ，我们发现，如果将 $V$ 和 $V_c$ 对应的所有节点的向量分别写成一个列矩阵 $W$ 和 $H$ ，则 $vi⃗⋅cj⃗=(WHT)ij\vec{v_i}\cdot\vec{c_j}=\left(WH^T\right)_ {ij}$ $\cdot c^{j}$ $= (W H^{T})_{i j}$ 。我们设矩阵 $M=WH^T$ ，则有 $Mij=vi⃗⋅cj⃗M_{ij}=\vec{v_i}\cdot\vec{c_j}$ $\cdot c^{j}$

。而现在我们只需要知道 $♯(v),♯(c),♯(v,c),∣D∣\sharp\left(v\right), \sharp\left(c\right),\sharp\left(v,c\right),|D|$ ，直接假设 $W = H$ ,我们便可以根据 $M=W^2$ 来得到 $W$ ，也即所求的节点向量。接下来，我们只需要讨论上述几个值该怎么求即可。

对DeepWalk的讨论

假设DeepWalk作用的图为无向的连通图，窗口为 $t$ 。我们上述的 $D$ 可以通过以下步骤得到：

对于有向图来说，则把上式的最内层for循环中 $add (RW_i, RW_j) into D$ 去除即可。

在无向图中，每一次节点 $i$ 的出现都会在 $D$ 中被纪录 $2 t$ 次，而在有向图中，则被纪录 $t$ 次。根据以上的定义，我们很容易得到 $♯(vi)∣D∣\frac{\sharp\left(v_i\right)}{|D|}$ 就是 $v_i$ 在 $D$ 中的频率，这其实也是 $v_i$ 的PageRank值（确切的说，是初始值）。 $v_j$ 与 $v_i$ 作为节点对出现在 $D$ 中的概率是 $♯(vi,vj)♯(vi)\frac{\sharp\left(v_i,v_j\right)}{\sharp\left(v_i\right)}$ ，则 $v_j$ 出现在 $v_i$ 的左右 $t$ 个邻居内的期望频次是 $♯(vi,vj)♯(vi)/2t\frac{\sharp\left(v_i,v_j\right)}{\sharp\left(v_i\right)/2t}$ 。引入该图PageRank的转移矩阵 $Aij=1diA_{ij}=\frac{1}{d_i}$ (当i,j相连,否则等于0），其中 $d_i$ 是i的度。设 $e_i$ 是一个行向量，只在i维是1，其他维是0。则 $e_iA$ 同样表示一个行向量，其中第j维表示从节点i到节点j的概率； $eiAite_iA^t_i$ 则表示节点i经过t步随机游走到达节点j的概率。对于DeepWalk来说，在窗口 $t$ 范围内，i节点到达j节点的情况有t种可能：经过1步到达，经过2步到达，…，经过t步到达。那么 $[ei(A+A2+…+At)]j\left[e_i\left(A+A^2+…+A^t\right)\right]_ j$ 即表示 $v_j$ 出现在 $v_i$ 的左或右 $t$ 个邻居内的期望频次。再乘以2，,便等于 $♯(vi,vj)♯(vi)/2t\frac{\sharp\left(v_i,v_j\right)}{\sharp\left(v_i\right)/2t}$ ：

$♯(vi,vj)♯(vi)/2t=2[ei(A+A2+…+At)]j\frac{\sharp\left(v_i,v_j\right)}{\sharp\left(v_i\right)/2t}=2\left[e_i\left(A+A^2+…+A^t\right)\right]_ j$ $⟶\longrightarrow$ $♯(vi,vj)♯(vi)=[ei(A+A2+…+At)]jt\frac{\sharp\left(v_i,v_j\right)}{\sharp\left(v_i\right)}=\frac{\left[e_i\left(A+A^2+…+A^t\right)\right]_ j}{t}$ 。

对于有向图，同样可以得到上述式子。

至此，利用之前softmax所得结果，便可以求出M。

DeepWalk算法的本质（DeepWalk的应用）

准备

负采样

softmax

对DeepWalk的讨论

相关推荐

TOP虚拟主机推荐

最新文章

随机文章

热门标签

网站声明内容

回顶部

QQ咨询投稿

微信咨询：cnjoel001
复制微信号

准备

负采样

softmax

对DeepWalk的讨论

相关推荐

TOP虚拟主机推荐

最新文章

随机文章

热门标签

网站声明内容

回顶部

QQ咨询投稿

微信咨询：cnjoel001复制微信号

微信咨询：cnjoel001
复制微信号