协同过滤推荐算法相关步骤和细节

推荐算法分类

1.基于内容的推荐算法
2.协同过滤推荐算法

基于内容推荐

1.需要知道每个项目的特征,以及详细的特征值,比如一个电影的爱情元素占比,动作成分占比等
2.需要用户事先评价几部电影,得到用户的评分特征向量,比如,对动作电影的偏好程度等
3.把特征和用户偏好相乘,得到预估得分,得到推荐结果集

基于内容算法弊端

需要详细知道每个元素的具体特征和值,这是基本不可能实现的

协同过滤推荐算法

1.随机初始化用户偏好θ和项目特征x
2.直接使用代价函数同时求上述两个随机变量的最优解,梯度下降或者高级算法均可
3.预测过程与内容推荐相同

协同过滤的优点

1.不需要知道x的具体内容和值,会自动通过现有数据进行求解求值
2.随着数据增多而越来越准确

协同过滤缺点

1.随机初始化过很费时间
2.学习的x特征无法被人类理解

近似项目推荐

通过求||x1-x2||的大小,可以得出与当前项目最接近的项目,从而获得关联项目。

均值标准化

当一个用户没有对任何电影评分的时候,如何推荐?
使用均值标准化,把每个评分都减去平均值,再在计算结束之后加上,这样就可以避免未评分用户每个预测都是0的情况,从而给用户推荐了。

u3coding
A software developer

Leave a Comment

Your email address will not be published. Required fields are marked *

*