%A 周燕茹 %T 基于模糊数学的高维稀疏数据聚类统计方法设计 %0 Journal Article %D 2021 %J 吉林化工学院学报 %R 10.16039/j.cnki.cn22-1249.2021.09.020 %P 107-111 %V 38 %N 9 %U {https://xuebao.jlict.edu.cn/CN/abstract/article_1167.shtml} %8 2021-09-25 %X
传统的数据聚类统计方法仅适用于低维数据聚类问题,为此,本研究设计了基于模糊数据的高维稀疏数据聚类统计方法,以期提升高维稀疏数据的聚类统计效果。以模糊C均值聚类算法为基础,通过优化初始聚类中心解决局部最优问题,缩短聚类统计时间;然后引入权重机制,令该方法适用于高维稀疏数据聚类统计。基于此,以余弦距离替换原有的欧几里德距离,提高高维稀疏数据聚类统计效果。实验证明:在数据维度不同时,该方法均有较优的聚类统计效果。当数据维度较低时,分块比例为10%时聚类统计效果最优;当数据维度较高时,分块比例为40%时聚类统计效果最优。在不同稀疏度等级时,该方法的命中率和聚类统计效率均较高。