Recurrent Recommender Networks

Chao-Yuan Wu, UT-Austin

Amr Ahmed, Google Research

Alex Beutel, Google Research

Alexander J. Smola, CMU

Hong Jing, LinkedIn

Intro

传统的推荐系统假设用户或者电影的状态是静态（也就是忽略了时间性特征）。而这里提出的Recurrent Recommender Networks(RRN)能够预测将来的行为。

简单地说，就是现在的数据都是randomly split成training和test。但是实际中，training和test会有前后顺序。比如我在训练数据都是2.14之前的，测试集则都是2.14之后的，这样才能在实际运用中有意义。

这个解决方案就可以用latent variable模型来推断没有观测到的状态。

使用LSTM来获取用户和电影的时间依赖关系。为用户$$i$$和电影$$j$$的latent特征，用$$u_i$$和$$m_j$$来表示。那么更新函数（即LSTM的几个门）则为

$$ \hat r{ij|t} = f(u{it}, m{jt})\ u{i,t+1} = g(u{it}, { r{ij|t} })\ m{j,t+1} = h(m{jt}, { r_{ij|t} })

其中$$\hat r{ij|t}$$是在时间$$t$$时，预测用户$$i$$对电影$$j$$的评分，而$$r{ij|t}$$是实际评分。

$$yt = W{embed}[xt, 1{newbie}, \taot, \tao{t-1}]$$

其中$$xt$$是时间$$t$$时的评分，$$1{newbie}$$表示这个用户是否是新用户。最终embed生成的$$y_t$$，就是LSTM的输入。也就是

$$ut = LSTM(u{t-1}, y_t)$$

对于推荐系统一直是没有深入了解，这篇paper也只是看懂了问题，但是对于细节不甚了解。将来补上。