Mahout 算法库
聚类算法
聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。
聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式时一个度量(Measurement)的向量,或者是多维空间中的一个点。
聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。
算法类 | 算法名 | 中文名 |
---|---|---|
聚类算法 | Canopy Clustering | Canopy聚类 |
K-Means Clustering | K均值算法 | |
Fuzzy K-Means | 模糊K均值 | |
Expectation Maxmization | EM聚类(期望最大化聚类) | |
Mean Shift Clustering | 均值漂移聚类 | |
Hierarchical Clustering | 层次聚类 | |
Dirichlet Process clustering | 狄利克雷过程聚类 | |
Latent Dirichlet Allocation | LDA聚类 | |
Spectral clustering | 谱聚类 |