文本矩阵分析

用于在多份文档中找出最具代表性的核心词,并看清这些核心词之间是结伴出现还是彼此排斥,从而梳理材料的主题结构与概念关联。

系统会先按重要性给词汇打分,再构建一个由前 N 个核心词组成的两两相关性矩阵同一组词的关联既可以用热力矩阵查看,也可以用关系网络查看,方便从不同视角判断概念之间的远近。

报告同时呈现核心词重要性条形图、词汇相关性矩阵词汇关系网络,以及文档长度、词频分位数、稀疏度和相似性等统计指标,便于归纳主题、对比文档结构,或为后续聚类与主题模型挑选种子词。

适合政策与研报中梳理议题的核心概念与关联结构,也适合访谈与评论语料中识别反复出现的关键词族。

加载文件上传组件中...

字典帮助:可使用 搜狗细胞词库 下载你需要的字典 SCEL 文件,并使用辅助工具中的 「搜狗输入法词库 SCEL 转 TXT 字典工具」 转为 txt 上传到这里

每 40,000 字 3 点