4、重心距离法:均值间的距离。
5、类平均距离法:两类中各个元素两两之间的距离平方相加后取平均值
算例
K-均值算法
基本思想算法步骤
基于使聚类性能指标最小化,所用的聚类准则函数是聚类集中每一个样本点到该类中心的距离平方之和,并使其最小化。
IOSDATA算法
VSK均值 K-均值算法通常适合于分类数目已知的聚类,而ISODATA算法则更加灵活;
从算法角度看,ISODATA算法与K-均值算法相似,聚类中心都是通过样本均值的迭代运算来决定的; ISODATA算法加入了一些试探步骤,并且可以结合成人机交互的结构,使其能利用中间结果所取得的经验更好地进行分类。
基本思路(1)选择某些初始值。可选不同的指标,也可在迭代过程中人为修改,以将N个模式样本按指标分配到
各个聚类中心中去。
(2)计算各类中诸样本的距离指标函数。
(3)~(5)按给定的要求,将前一次获得的聚类集进行分裂和合并处理
((4)为分裂处理,(5)为合并处理),从而获得新的聚类中心。(6)重新进行迭代运算,计算各项指标,判断聚类结果是否符合要求。 经过多次迭代后,若结果收敛,则运算结束。算法步骤该算法需要确定并在计算中可以调整的参数有:
K : 所要求的聚类中心数。
: 一个类别至少应具有的样本数目。
见流程图 : 一个类别样本标准差阈值。
: 聚类中心之间距离的阈值,即归并系数。