K-means聚类MNIST数据集

以下是一个使用K-means聚类算法对MNIST数据集进行聚类的示例代码：

import numpy as np
from sklearn.cluster import KMeans
from sklearn.datasets import fetch_openml
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt

# 加载MNIST数据集
mnist = fetch_openml('mnist_784')
X = mnist.data
y = mnist.target

# 使用PCA降维
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X)

# 使用K-means进行聚类
kmeans = KMeans(n_clusters=10, random_state=42)
kmeans.fit(X_pca)

# 可视化聚类结果
colors = ['#FF0000', '#00FF00', '#0000FF', '#FFFF00', '#00FFFF', '#FF00FF', '#800000', '#008000', '#000080', '#808080']
plt.figure(figsize=(12, 8))
for i in range(10):
    cluster_points = X_pca[kmeans.labels_ == i]
    plt.scatter(cluster_points[:, 0], cluster_points[:, 1], c=colors[i], label=str(i))
plt.legend()
plt.title('K-means Clustering of MNIST Dataset')
plt.show()

这段代码首先使用fetch_openml函数加载MNIST数据集，然后使用PCA进行降维，将原始的784维特征降低到2维，以便于可视化。接下来，创建一个KMeans对象，设置聚类数为10，并使用fit方法对降维后的数据进行聚类。最后，通过循环遍历每个聚类，将其对应的数据点在散点图上用不同颜色表示，并添加图例和标题，最终显示出聚类结果。

请注意，这只是一个示例代码，实际使用K-means聚类MNIST数据集时，可能需要根据具体需求进行调整和优化。

本文内容通过AI工具匹配关键字智能整合而成，仅供参考，火山引擎不对内容的真实、准确或完整作任何形式的承诺。如有任何问题或意见，您可以通过联系service@volcengine.com进行反馈，火山引擎收到您的反馈后将及时答复和处理。

展开更多

开发者特惠

面向开发者的云福利中心，ECS 60元/年，域名1元起，助力开发者快速在云上构建可靠应用

ECS首年60元

社区干货

> > > 本文通过调研学术、商业、开源三个领域词云相关的产品,对词云相关算法、产品进行从上至下的总结,帮助读者快速了解词云相关的算法发展,并希望总结出当前字节跳动数据平台词云发展的路线。全文将分两次推送... **使用 k-means 对有相同标签的点进行聚类。** 可能有相隔很远的两个点有相同的标签,此时会被聚集成两簇,如上图中的 Tomme。聚类后的每个簇各代表一个单词。2. **聚类后,为每个簇设置合适的角度来更好的覆盖该簇...

「火山引擎」数智平台VeDI增长营销季刊VOL.05

在企业进行数据采集时使用过其他厂商的埋点系统,不希望重复建设埋点体系,希望DataTester能够提供数据集成的方案,对历史数据资产直接复用。为了支持数据集成的需求, DataTester采用可视化数据集成的方式支持Kaf... 「聚类模型」**- 支持聚类模型功能,用户通过聚类模型( K-means算法)可以根据特征快速拆分已有人群,搭配后续针对性的营销策略。- 聚类模型( K-means算法)可以根据特征快速拆分已有人群,场景举例: - ...

时效准确率提升之承运商路由网络挖掘

而每个节点的数据类型如下:```1. waybill_no 表示运单号,同一个运单号会有多条节点记录2. station_index 表示当前这个节点的下标3. station_enum 表示这个节点的类型,是分拣中心还是揽派网点4. station_name... =&rk3s=8031ce6d&x-expires=1716135645&x-signature=AadKFBxHinXeVKj0fxPBnCMr3%2FY%3D)绘制上述图时使用的是kmeans聚类算法,kmeans聚类算法需要指定聚类的个数。故需要使用 **Knee/Elbow** 这类的算法进行聚类...

Katalyst:字节跳动云原生成本优化实践

此外还有**机器学习和大数据**以及**各类存储服务**。云原生后需要解决的核心问题是如何提高集群的资源利用效率;以典型的在线服务的资源使用情况为例,深蓝色部分是业务实际使用的资源量,浅蓝色部分为业务提供的安... k-means 聚类算法 | 0.35 | 0.48 | 0.6 || 系统指标 PID 算法 | 0.39 | 0.54 | 0.66 || 系统指标模型预估 + PID 算法 | 0.42 |...

特惠活动

域名注册服务

cn/top/com等热门域名，首年低至1元，邮箱建站必选

￥1.00/首年起32.00/首年起

立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗，加速分发更实惠

￥2.00/年20.00/年

立即购买

K-means聚类MNIST数据集-优选内容

聚类模型

1. 功能概述 CDP支持通过内置的聚类模型,按照所需特征,将人群包输出拆分为不同类别的子人群包,以满足某些业务场景下,按特征拆分不同属性用户人群的需求 2. 功能场景聚类模型( K-means算法)可以根据特征快速拆分已有人群,场景举例: 目标需求:希望在近3个月注册的用户中,拆分5类出年龄和地域特征接近的用户群,以进行后续针对性的营销策略。使用方法:首先在用户分群中圈出近3个月的注册用户,作为原始人群包,再通过聚类模型,选择年...

观点|词云指北(上):谈谈词云算法的发展

「火山引擎」数智平台VeDI增长营销季刊VOL.05

机器学习

数据,并且从全部特征中随机抽取出一个子集,从这个子集中选择最优特征进行分裂,而不是总选全局最优点进行分裂,这有助于防止单个决策树过拟合。梯度提升树梯度提升树是一个集成学习(ensemblemodel)模型,内部的模型使用决策树。与随机森林不同的是,它一次只训练一棵树,后面每一棵新的决策树逐步矫正前面决策树产生的误差。随着树的添加,模型的表达力也愈强。 2.4 聚类支持以下模型,详情参见功能页面。模型名称模型简介 K-means聚...