标题
Semantic-based Recommendation across Heterogeneous Domains
作者
Deqing Yang, Yanghua Xiao
主要内容
这是2015年发表在ICDM上的文章,文章实现了跨领域的推荐。首先,本文提出了一种较以往跨领域完全不同的问题定义,即多个领域之间没有任何交集,没有跨领域用户-物品交互,多领域间也没有重合的特征,如下图(e)所示。
本文两个主要贡献:1. 缓解用户画像稀疏性问题;2. 对不同领域间的特征构建语义联系
1. 使用标签传播算法构建用户画像
作者首先考虑直接关联用户的影响,对于目标用户u,他的标签评分向量计算如下:。其中代表用户u与其他用户的关系向量,T表示所有用户和标签的关系矩阵。为了使标签具有代表性,文章用一个IDF对角矩阵D来表示标签的代表性,从而修正用户标签矩阵。从而。接着,作者又考虑到间接用户的影响,因此在之前的基础上的迭代计算由此诞生。考虑到大规模矩阵运算的时空花费过大,文章又介绍了提出了两个剪枝算法对算法进行优化。
2. 语义匹配
对于中文中不同领域间标签的匹配,作者使用百度百科的信息。当两个概念在一个页面中同时出现,且这样的页面越多时,我们认为这两个概念是更加语义相关的。作者首先将所有的标签映射到百科中的概念中,然后根据每一个概念百科页面计算概念的词向量。在此基础上使用一个Weighted Normal Google Distance(简称WNGD)来衡量标签的相似度。
实验数据集
- 微博和豆瓣电影数据集
- 两个糖尿病数据集