高频词提取
统计每个词的出现次数,找出最常被提到的高频词。除了单个词,还可以同时统计由 2 到 4 个词组成的固定词组(如「乡村振兴战略」「数字化转型」),这些词组靠单看一个词很容易漏掉。
可以设定词组至少出现几次才算「高频」,还可以按词性结构过滤——比如只保留「名词+名词」「形容词+名词」的组合,去掉「在路上」这类无意义搭配。
报告会自动给出一段关键发现,指出哪些词占主导、是否形成稳定搭配、表达是否套路化,并配以词云、面积图和 Top 20 清单。
上传多篇文档时,会额外展示跨文档共有词和单篇独有词的分布,看出哪些提法贯穿所有材料、哪些只在某一篇里出现。
适合通稿和政策文本里检视提法集中度,问卷开放题里归纳受访者反复提到的主题,或者财报和研报里盘点高频术语。
加载文件上传组件中...
2 次
只对"两个词及以上的词组"生效。单个词会全部统计,不受此限制。
每 40,000 字 2 点
