词语共现分析

用于识别文本里反复成对出现的词,判断它们是固定搭配、习惯说法还是只是偶然同现,从而梳理材料的核心议题与话语口径。

工具会同时给出三种判断指标:互信息(MI)看共现是否远超随机水平,T 值看搭配是否具备统计显著性,对数似然比看搭配在文本里有多稳定;还会标记两个词谁在前、谁在后,避免把方向相反的搭配混为一谈。

报告呈现完整的词对搭配表(次数 + 三项指标 + 位置关系),并按关联强度自动分组聚类,把极强、紧密、一般等不同层级的搭配分别列出;同时支持 3 词、4 词的共现组合。

适合舆情与新闻报道中梳理话语口径,也适合学术文献与访谈中提取概念间的语义关联,为知识图谱与主题网络做准备。

加载文件上传组件中...

字典帮助:可使用 搜狗细胞词库 下载你需要的字典 SCEL 文件,并使用辅助工具中的 「搜狗输入法词库 SCEL 转 TXT 字典工具」 转为 txt 上传到这里

每 20,000 字 2 点