推荐系统
包括两种方式—基于内容的过滤和协同过滤
隐含语义分析
Tf-idf
TF—出现频率
IDF—在其他文档中出现的频率,(在其他文档也经常出现,则IDF值会比较低)
向量空间模型
相似度—余弦距离
存在的问题
LSA—隐含语义分析
PageRank
L(pj)是指向其他人个数,d是参数,通常设为0.85
协同过滤
微信扫一扫
包括两种方式—基于内容的过滤和协同过滤
Tf-idf
TF—出现频率
IDF—在其他文档中出现的频率,(在其他文档也经常出现,则IDF值会比较低)
向量空间模型
相似度—余弦距离
存在的问题
LSA—隐含语义分析
L(pj)是指向其他人个数,d是参数,通常设为0.85
相关推荐