基于UGC(user Generate Content)的推荐
- 用户用标签来描述对物品的看法,所以用户生成标签(UGC)是联系用户和物品的纽带,也是反应用户兴趣的重要数据源。
- 一个用户标签行为的数据集一般由一个三元组(用户,物品,标签)的集合表示,其中一条记录 (u, i, b)表示用户u给物品i打上了标签b.
- 一个最简单的算法
- 统计每个用户最常用的标签
- 对于每个标签,统计被打过这个标签次数最多的物品
- 对于一个用户,首先找到他常用的标签,然后找到具有这些标签的最热门的物品,推荐给他
- 所以用户u对物品i的兴趣公式为 p ( u , i ) = ∑ n u , b × n b , i p(u,i)=\sum n_{u,b}\times n_{b,i} p(u,i)=∑nu,b×nb,i其中, n u , b n_{u,b} nu,b是用户u打过标签b的次数, n b , i n_{b,i} nb,i是物品i被打过标签b的次数。