这段代码实现了使用K-means聚类算法对标准化后的数据进行聚类分析。
首先,通过np.load()
函数读取已经标准化后的数据集airline_scale
。然后,确定了聚类中心数目为k=5
。
接下来,使用KMeans()
函数创建了一个K-means模型,并指定了聚类中心数目、并行计算的任务数量以及随机种子。然后,调用fit()
方法训练模型。
在输出结果部分,首先通过kmeans_model.cluster_centers_
获得各个聚类中心的坐标。然后,通过kmeans_model.labels_
获取每个样本点的所属聚类类别标签。
接着,通过统计不同类别样本数目,使用pd.Series(kmeans_model.labels_).value_counts()
进行计算,并将结果存储在变量 r1
中。最后打印出每个聚类中心和其包含的样本数目。
最后一步是将聚类中心和对应样本数目放入一个DataFrame对象 cluster_center
中,并根据样本类别作为索引显示结果。
总之,这段代码实现了K-means聚类算法,并展示了各个聚类中心以及每个簇内的样本数量。
内容由零声教学AI助手提供,问题来源于学员提问