2009年4月3日星期五

聚类在CF中的应用,我的一点看法

最近在研究,如何把一些评分之外的特征加入到CF中,比如context信息。我觉得利用聚类是一个比较好的手段。

假设我们有很多用户的信息,我们可以用这些信息对用户进行聚类,c_u是u所属的聚类。另外如果我们也有很多物品的信息,我们也可以对物品聚类,c_i是i所属的聚类。那么我们可以用如下模型:

r(u,i) = b(u,i) + dot(p(c_u), q(c_i))

其中b(u,i)是一个base预测器,比如可以是一个RSVD预测器。

其实我觉得global effect也是一种聚类。比如根据用户评分数对用户聚类userSupp,等等。

比如我们有电影的导演,演员,我们也可以用这些信息对电影聚类。个人感觉,这种方法是一种不错的利用其它信息的方法。

没有评论:

发表评论