文本矩阵分析

系统会把文本切成文档段、统计词频并做 TF-IDF 加权，挑出在本批材料中区分度最高的前 N 个核心词（10～50 个可调），再基于文档段级共现构建这些词之间的邻接强度矩阵和关系网络图。

报告按你选择的使用场景（通用材料梳理、论文综述、问卷开放题、用户反馈、政策与通知、访谈初筛、作文作业）组织阅读顺序和核对问题。可以指定重点关注词，即使词频不高也会被优先保留在重要词表中。

报告同时呈现重要词条排序条形图（按 TF-IDF 重要度 / 词频 / 文档覆盖率可切换）、词条共现邻接热力图、词汇关系网络图（可调节点数 10-30），以及文档长度分布、矩阵稀疏度、文档余弦相似度等统计指标。每条共现词对都配有原文证据定位，可以直接回原文核对关联是否真实成立。

适合问卷开放题和用户反馈的快速编码准备、文献综述中确认候选主题词和章节结构、政策文件中识别核心概念与稳定表述，以及访谈材料中为定性编码准备候选概念和核对清单。

加载文件上传组件中...

使用自定义字典

字典帮助：可使用搜狗细胞词库下载你需要的字典 SCEL 文件，并使用辅助工具中的「搜狗输入法词库 SCEL 转 TXT 字典工具」转为 txt 上传到这里

使用自定义停用词

开启智能词汇识别

分词模式

使用词性过滤

你准备用它做什么

这个选择只影响报告里的阅读顺序和下一步建议，不改变分词、矩阵或共现计算。

选择展示词频最高的前 20 个词

指定重点关注词（可选）

填入的词会在分析中优先保留，即使词频不高也不会被自动筛选掉。最多 20 个。

每 40,000 字 3 点

完成后发送邮件通知