发布时间:2022-12-20 21:30
作者 | Amine Zaamoun
编译 | VK
来源 | Towards Data Science
最初是一个数据集,现在是一个由Amine Zaamoun开发的电影推荐系统:
你们可能曾经花上几分钟甚至几个小时去选择一部电影单独看或者和家人一起看,不幸的是没有成功?你希望有人在这种时候替你做决定,这正是推荐系统的作用。
推荐系统是网易和亚马逊巨头目前取得成功的主要原因之一。我设计这篇文章是为了向你展示,任何在数据科学和编程方面有一点创造力和经验的人,都可以通过遵循我将要描述的几个步骤来实现他们自己的推荐系统。
我在德国电信公司(DEUTSCHE TELEKOM AG)数据科学创新中心(IHUB)8个月的实习期间实现了这个项目。我们的想法也是把重点放在实践方面,而不是放在理论和数学方面,你可以在互联网上找到科学文献。
本文介绍的推荐系统分四个主要步骤实现:
第1步:计算每部电影的加权平均分,以便向最终用户推荐最受欢迎的100部电影的目录
第2步:使用机器学习算法建立5部“流行”电影的推荐:使用Scikit learn的k近邻(kNN)
第3步:建立5部由深度学习算法推荐的“鲜为人知”电影的推荐:使用Tensorflow和Keras的深度神经矩阵分解(DNMF)实现
第4步:使用来自Flask(python web开发框架)部署最终系统