首页 > 编程 > Python > 正文

Python聚类算法之基本K均值实例详解

2020-01-04 17:56:14
字体:
来源:转载
供稿:网友

这篇文章主要介绍了Python聚类算法之基本K均值运算技巧,结合实例形式较为详细的分析了基本K均值的原理与相关实现技巧,具有一定参考借鉴价值,需要的朋友可以参考下

本文实例讲述了Python聚类算法之基本K均值运算技巧。分享给大家供大家参考,具体如下:

基本K均值

:选择 K 个初始质心,其中 K 是用户指定的参数,即所期望的簇的个数。每次循环中,每个点被指派到最近的质心,指派到同一个质心的点集构成一个。然后,根据指派到簇的点,更新每个簇的质心。重复指派和更新操作,直到质心不发生明显的变化。

 

 
  1. # scoding=utf-8 
  2. import pylab as pl 
  3. points = [[int(eachpoint.split("#")[0]), int(eachpoint.split("#")[1])] for eachpoint in open("points","r")] 
  4. # 指定三个初始质心 
  5. currentCenter1 = [20,190]; currentCenter2 = [120,90]; currentCenter3 = [170,140] 
  6. pl.plot([currentCenter1[0]], [currentCenter1[1]],'ok'
  7. pl.plot([currentCenter2[0]], [currentCenter2[1]],'ok'
  8. pl.plot([currentCenter3[0]], [currentCenter3[1]],'ok'
  9. # 记录每次迭代后每个簇的质心的更新轨迹 
  10. center1 = [currentCenter1]; center2 = [currentCenter2]; center3 = [currentCenter3] 
  11. # 三个簇 
  12. group1 = []; group2 = []; group3 = [] 
  13. for runtime in range(50): 
  14. group1 = []; group2 = []; group3 = [] 
  15. for eachpoint in points: 
  16. # 计算每个点到三个质心的距离 
  17. distance1 = pow(abs(eachpoint[0]-currentCenter1[0]),2) + pow(abs(eachpoint[1]-currentCenter1[1]),2) 
  18. distance2 = pow(abs(eachpoint[0]-currentCenter2[0]),2) + pow(abs(eachpoint[1]-currentCenter2[1]),2) 
  19. distance3 = pow(abs(eachpoint[0]-currentCenter3[0]),2) + pow(abs(eachpoint[1]-currentCenter3[1]),2) 
  20. # 将该点指派到离它最近的质心所在的簇 
  21. mindis = min(distance1,distance2,distance3) 
  22. if(mindis == distance1): 
  23. group1.append(eachpoint) 
  24. elif(mindis == distance2): 
  25. group2.append(eachpoint) 
  26. else
  27. group3.append(eachpoint) 
  28. # 指派完所有的点后,更新每个簇的质心 
  29. currentCenter1 = [sum([eachpoint[0] for eachpoint in group1])/len(group1),sum([eachpoint[1] for eachpoint in group1])/len(group1)] 
  30. currentCenter2 = [sum([eachpoint[0] for eachpoint in group2])/len(group2),sum([eachpoint[1] for eachpoint in group2])/len(group2)] 
  31. currentCenter3 = [sum([eachpoint[0] for eachpoint in group3])/len(group3),sum([eachpoint[1] for eachpoint in group3])/len(group3)] 
  32. # 记录该次对质心的更新 
  33. center1.append(currentCenter1) 
  34. center2.append(currentCenter2) 
  35. center3.append(currentCenter3) 
  36. # 打印所有的点,用颜色标识该点所属的簇 
  37. pl.plot([eachpoint[0] for eachpoint in group1], [eachpoint[1] for eachpoint in group1], 'or'
  38. pl.plot([eachpoint[0] for eachpoint in group2], [eachpoint[1] for eachpoint in group2], 'oy'
  39. pl.plot([eachpoint[0] for eachpoint in group3], [eachpoint[1] for eachpoint in group3], 'og'
  40. # 打印每个簇的质心的更新轨迹 
  41. for center in [center1,center2,center3]: 
  42. pl.plot([eachcenter[0] for eachcenter in center], [eachcenter[1] for eachcenter in center],'k'
  43. pl.show() 

运行效果截图如下:

Python聚类算法之基本K均值实例详解

希望本文所述对大家Python程序设计有所帮助。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表