文档-词频矩阵
针对多篇文本自动构建文档-词频矩阵,横向对比每篇文档中核心词汇的出现次数,实时生成热力矩阵可视化,并可下载原始矩阵数据,适合政策文本、访谈稿、文献材料等批量分析。
加载文件上传组件中...
系统会自动构建“文档 × 词汇”矩阵,X 轴为文档,Y 轴为词汇。可视化矩阵与下载文件均会基于该数量进行展示。
与「高频词」和「文本矩阵」的区别
高频词: 仅统计语料整体的词频排行榜,无法区分不同文档的差异。
文本矩阵: 以 TF-IDF 等权重构建词语的重要性矩阵,更关注词语权重而非绝对频次。
文档-词频矩阵: 针对每篇文档逐一统计词频,生成可下载的 Doc-Term Matrix,便于横向对比。