推荐系统里的那些算法—— TF-IDF(附python代码)

发布时间:2023-07-28 14:30

基于UGC(user Generate Content)的推荐

  • 用户用标签来描述对物品的看法,所以用户生成标签(UGC)是联系用户和物品的纽带,也是反应用户兴趣的重要数据源。
  • 一个用户标签行为的数据集一般由一个三元组(用户,物品,标签)的集合表示,其中一条记录 (u, i, b)表示用户u给物品i打上了标签b.
  • 一个最简单的算法
    • 统计每个用户最常用的标签
    • 对于每个标签,统计被打过这个标签次数最多的物品
    • 对于一个用户,首先找到他常用的标签,然后找到具有这些标签的最热门的物品,推荐给他
    • 所以用户u对物品i的兴趣公式为 p ( u , i ) = ∑ n u , b × n b , i p(u,i)=\sum n_{u,b}\times n_{b,i} p(u,i)=nu,b×nb,i其中, n u , b n_{u,b} nu,b是用户u打过标签b的次数, n b , i n_{b,i} nb,i是物品i被打过标签b的次数。

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网,如有侵权请联系:561261067@qq.com

桂ICP备16001015号