论文阅读之跨领域推荐

标题

Semantic-based Recommendation across Heterogeneous Domains

作者

Deqing Yang, Yanghua Xiao

主要内容

这是2015年发表在ICDM上的文章,文章实现了跨领域的推荐。首先,本文提出了一种较以往跨领域完全不同的问题定义,即多个领域之间没有任何交集,没有跨领域用户-物品交互,多领域间也没有重合的特征,如下图(e)所示。

不同的跨领域问题设置

本文两个主要贡献:1. 缓解用户画像稀疏性问题;2. 对不同领域间的特征构建语义联系

1. 使用标签传播算法构建用户画像

作者首先考虑直接关联用户的影响,对于目标用户u,他的标签评分向量计算如下:。其中代表用户u与其他用户的关系向量,T表示所有用户和标签的关系矩阵。为了使标签具有代表性,文章用一个IDF对角矩阵D来表示标签的代表性,从而修正用户标签矩阵。从而。接着,作者又考虑到间接用户的影响,因此在之前的基础上的迭代计算由此诞生。考虑到大规模矩阵运算的时空花费过大,文章又介绍了提出了两个剪枝算法对算法进行优化。

2. 语义匹配

对于中文中不同领域间标签的匹配,作者使用百度百科的信息。当两个概念在一个页面中同时出现,且这样的页面越多时,我们认为这两个概念是更加语义相关的。作者首先将所有的标签映射到百科中的概念中,然后根据每一个概念百科页面计算概念的词向量。在此基础上使用一个Weighted Normal Google Distance(简称WNGD)来衡量标签的相似度。

实验数据集

  1. 微博和豆瓣电影数据集
  2. 两个糖尿病数据集