样本聚类

当你有一批受访者、用户、城市或商品的多列数值指标，想按相似程度自动分成几类时，把 Excel 或 CSV 表格上传给本工具，它会给出每一样本所属类别和各类的平均画像。

内部采用K-Means 聚类：支持自动 K 选择（轮廓系数）或手动指定聚类数，可选标准化消除量纲差异，自动用 PCA 投影生成二维散点图。

报告给出轮廓系数、簇规模均衡比、各类平均画像对比、组间差异摘要和可下载的聚类标签文件。

适合问卷数据的受访者分群、运营指标的用户分层，输出常用于交叉表分析和描述性统计的后续处理。

当你有一批受访者、用户、城市或商品的多列数值指标，想把它们按相似程度自动分成几类时，把 Excel / CSV 表格上传给本工具，它会输出每一样本所属类别、各类的平均画像、类间差异线索，并给出二维投影图便于汇报展示。

内部采用K-Means（K 均值）聚类：在可选的标准化之后，按欧氏距离将行样本划到 K 个簇；若选择自动聚类数，则在给定范围内用轮廓系数挑选较清晰的分群方案。

支持 .csv（UTF-8 推荐）与 .xlsx，单文件建议不超过 10MB；默认最多读取前 10 万行与 120 列。需至少两个及以上可转为数值的列（或你在下方显式指定列名），且有效行足够多，结果才稳定。本工具输出常用于下一步的交叉表、描述统计、量表分析，可在交叉表与自动卡方、问卷描述性统计中继续处理。

加载文件上传组件中...

智能推荐聚类列

将根据表头与样例行自动识别适合聚类分析的数值指标列。

样本标签列（可选）

聚类数

搜索 K 下限

搜索 K 上限

聚类前按列标准化（量纲不同时建议开启）

推荐下一步：交叉表与自动卡方推荐下一步：问卷描述性统计

每 10,000 字 2 点

完成后发送邮件通知