稀疏矩阵处理方法:
(1) 数据平滑技术,如设定缺省值,将为评分项设为平均分或众数,回归填补法,随机填补法;聚类平滑技术,将未评分项使用聚类中心的数据经行填充。
(2) 降维技术,主成分分析( PCA)和奇异值分解(SVD)
(3)对已有相似度计算模型进行局部加权处理。如基于时间的加权,基于共现次数的线性加权,类似于Jaccard系数的加权方法。
稀疏矩阵处理方法:
(1) 数据平滑技术,如设定缺省值,将为评分项设为平均分或众数,回归填补法,随机填补法;聚类平滑技术,将未评分项使用聚类中心的数据经行填充。
(2) 降维技术,主成分分析( PCA)和奇异值分解(SVD)
(3)对已有相似度计算模型进行局部加权处理。如基于时间的加权,基于共现次数的线性加权,类似于Jaccard系数的加权方法。