k均值聚类的python代码
K均值(K-means)聚类是一种常见的无监督学习算法,用于将数据集分成 K 个不同的簇。以下是使用 Python 中的 scikit-learn 库进行 K 均值聚类的简单示例代码:
```python
import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs
# 生成一些随机数据
data, labels = make_blobs(n_samples=300, centers=4, random_state=42)
# 创建 KMeans 模型,指定簇的数量
kmeans = KMeans(n_clusters=4)
# 用数据训练模型
kmeans.fit(data)
# 获取簇中心和预测的标签
centers = kmeans.cluster_centers_
predicted_labels = kmeans.labels_
# 绘制原始数据和簇中心
plt.scatter(data[:, 0], data[:, 1], c=predicted_labels, cmap='viridis', edgecolor='k', s=50)
plt.scatter(centers[:, 0], centers[:, 1], c='red', marker='X', s=200, label='Cluster Centers')
plt.title('K-Means Clustering')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.legend()
plt.show()
```
上述代码的步骤如下:
1. 生成一些随机数据(在实际应用中,你会使用你自己的数据)。
2. 创建 KMeans 模型,指定簇的数量。
python新手代码示例3. 使用 `fit` 方法训练模型。
4. 获取簇中心和预测的标签。
5. 使用 matplotlib 绘制原始数据和簇中心。
请注意,这只是一个简单的示例。在实际应用中,你需要根据你的数据和问题进行调整。选择适当的簇数通常需要一些试验,例如使用肘部法则(Elbow Method)来确定最佳的簇数。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论