推荐系统

包括两种方式—基于内容的过滤和协同过滤
隐含语义分析
Tf-idf
TF—出现频率
IDF—在其他文档中出现的频率,(在其他文档也经常出现,则IDF值会比较低)
向量空间模型
相似度—余弦距离
存在的问题
LSA—隐含语义分析
PageRank

L(pj)是指向其他人个数,d是参数,通常设为0.85

协同过滤

《数据挖掘:理论与算法》学习笔记(十)—推荐算法
阅读 73
2022-05-27

包括两种方式—基于内容的过滤和协同过滤
Tf-idf
TF—出现频率
IDF—在其他文档中出现的频率,(在其他文档也经常出现,则IDF值会比较低)
向量空间模型
相似度—余弦距离
存在的问题
LSA—隐含语义分析

L(pj)是指向其他人个数,d是参数,通常设为0.85


相关推荐
精彩评论(0)