样本聚类
当你有一批受访者、用户、城市或商品的多列数值指标,想按相似程度自动分成几类时,把 Excel 或 CSV 表格上传给本工具,它会给出每一样本所属类别和各类的平均画像。
内部采用K-Means 聚类:支持自动 K 选择(轮廓系数)或手动指定聚类数,可选标准化消除量纲差异,自动用 PCA 投影生成二维散点图。
报告给出轮廓系数、簇规模均衡比、各类平均画像对比、组间差异摘要和可下载的聚类标签文件。
适合问卷数据的受访者分群、运营指标的用户分层,输出常用于交叉表分析和描述性统计的后续处理。
当你有一批受访者、用户、城市或商品的多列数值指标,想把它们按相似程度自动分成几类时,把 Excel / CSV 表格上传给本工具,它会输出每一样本所属类别、各类的平均画像、类间差异线索,并给出二维投影图便于汇报展示。
内部采用K-Means(K 均值)聚类:在可选的标准化之后,按欧氏距离将行样本划到 K 个簇;若选择自动聚类数,则在给定范围内用轮廓系数挑选较清晰的分群方案。
支持 .csv(UTF-8 推荐)与 .xlsx,单文件建议不超过 10MB;默认最多读取前 10 万行与 120 列。需至少两个及以上可转为数值的列(或你在下方显式指定列名),且有效行足够多,结果才稳定。本工具输出常用于下一步的交叉表、描述统计、量表分析,可在交叉表与自动卡方、问卷描述性统计中继续处理。
加载文件上传组件中...
将根据表头与样例行自动识别适合聚类分析的数值指标列。
每 10,000 字 2 点
