文本矩阵分析
用于在多份文档中找出最具代表性的核心词,并看清这些核心词之间是结伴出现还是彼此排斥,从而梳理材料的主题结构与概念关联。
系统会先按重要性给词汇打分,再构建一个由前 N 个核心词组成的两两相关性矩阵;同一组词的关联既可以用热力矩阵查看,也可以用关系网络查看,方便从不同视角判断概念之间的远近。
报告同时呈现核心词重要性条形图、词汇相关性矩阵、词汇关系网络,以及文档长度、词频分位数、稀疏度和相似性等统计指标,便于归纳主题、对比文档结构,或为后续聚类与主题模型挑选种子词。
适合政策与研报中梳理议题的核心概念与关联结构,也适合访谈与评论语料中识别反复出现的关键词族。
每 40,000 字 3 点