PCA 主成分分析
用于在大量词语特征中提炼少数几个主成分,判断文本差异主要由哪些变量方向拉开,以及样本之间是聚集、分离还是存在离群点。碎石图、解释方差、载荷图和得分散点图可用于判断保留多少主成分更合适、识别哪些词贡献最大、比较样本结构并发现异常样本;参数建议与图表解读可用于支持后续聚类、分组和结果说明。适用于问卷开放题与访谈语料的结构摸底,也适用于政策文本和评论数据的降维分析。
加载文件上传组件中...
领域术语被切碎、虚词过多或常见词占据载荷图时,可上传自定义词典/停用词后重新分析。
2
1000
5
0.95
100
每 10,000 字 2 点
