智德知识库

如何利用Python 进行K-means聚类分析？

时间：2026-04-27 08:33:58

1、利用pandas导入数据集。这里有两个变量，假设学生的数学与英语两个成绩如下：

import pandas as pd

df=pd.DataFrame({'math':[98,78,54,89,24,60,98,44,96,90],'english':[92,56,90,57,46,75,76,87,91,88]})

如何利用Python 进行K-means聚类分析？

2、导入机器学习报的K-means分析工具。

from sklearn.cluster import KMeans

如何利用Python 进行K-means聚类分析？

3、处理训练集。假设数据中有分类结果，可以将分类结果作为目标变量。与逻辑回归不同，在没有y的情况下，直接用X变量集也可以进行K-means训练。

X=df.ix[:,['math','english']]

如何利用Python 进行K-means聚类分析？

4、建立模型。n_clusters参数用来设置分类个数，即K值，这里表示将样本分为两类。

clf_KMeans=KMeans(n_clusters=2)

其他参数为默认值，可以根据实际情况进行调整。

如何利用Python 进行K-means聚类分析？

5、模型训练。得到预测值。

cluster=clf_KMeans.fit_predict(X)

print(cluster)

从结果中可以看到，样本被分为了两类。

如何利用Python 进行K-means聚类分析？

6、根据聚类结果绘制散点图形。

plt.figure()

plt.scatter(X['math'], X['english'],c=cluster)

plt.title("K-means test")

plt.show()

由于本例样本较少，分类个数较少，聚类效果不是很明显。

如何利用Python 进行K-means聚类分析？

7、增加聚类个数。并绘制图形。

cluster2=KMeans(n_clusters=4).fit_predict(X)

plt.figure(1)

plt.scatter(X['math'], X['english'],c=cluster2)

plt.title("K-means test")

plt.show()

从图形上看，比2类时效果好很多。当然，在样本量足够的情况下，进行聚类分析，要根据实际情况或聚类效果选择K值。

如何利用Python 进行K-means聚类分析？

肥牛洋葱土豆的做法

小动物的尾巴有什么特点和作用#校园分享#

10月4号上班工资怎么算

简笔画--卡通蜻蜓的画法

热门搜索

长歌行古诗意思解释 3166什么意思穷困潦倒的意思私人影院有什么沉默代表什么规矩的意思呵呵呵是什么意思什么药补肾好不屑的意思晦暗的意思

Copyright © 2026 智德知识库 All Rights Reserved 信息来自网络，所有数据仅供参考，有任何疑问请联系站长联系邮箱

联系邮箱