词汇等级评估

用于核对读物与课文是否落在既定考纲档、列出高于目标的难点词,并在专名与术语较多的稿件里仍看清普通词汇的难度结构。

先切词,再按HSKCEFROxford 学习者词表分级,可弱化命名实体干扰;整篇档位取逐级累加词次首次达九成已分级词时的那一档。

与估算阅读年级、给难句易读样本的文本可读性分析不同,本工具逐词对齐官方档位并筛超纲,不输出多项易读度综合分。

报告含等级分布、覆盖率、超纲词与示例表外片段,多文件可雷达与汇总对比占比。表外清单天然可作新词发现候选,整成领域词表可收窄后续分词、关键词与主题建模噪声。

除选材命题外,亦适合先辨批量语料的表外词,再沉淀为下游关键词与主题挖掘用词表。

这个工具能帮你做什么

按官方学习标准给文本中每个词打难度等级(中文 HSK / 英文 CEFR / Oxford),告诉你这篇文本的整体难度、哪些词超出目标等级、以及哪些词不在词表里。常见用途:

  • 选教材 / 选读物:判断这篇文章能不能给某等级(HSK4 / CEFR B1 等)的学生看。
  • 做生词预习单:导出超纲词清单,直接当作课前词汇表 / 测验题。
  • 找领域专业词:未分级词多为术语 / 网络新词,可作为自定义词典扩充候选。
  • 横向比较:上传多份课文 / 章节 / 不同作者文本,雷达图对比难度梯度。
  • 给文本分析加可解释性:把难度等级当成额外维度叠加到其他工具的结果上 —— 高频词里挑出"高频但 C1 / HSK6+"的词作为真正的领域关键词; 未分级词清单天然就是新词发现的候选; 不同语料的等级分布差异可以解释聚类 / 主题为何区分开。
加载文件上传组件中...

中文跳过 jieba 标记的人名 / 地名 / 机构名 / 专名(nr / ns / nt / nz);英文跳过句中首字母大写词。 关闭后,「张伟」「Microsoft」等词若不在 HSK / CEFR 表里也会被算作超纲。

报告里展示「不在词表内」的高频词数量上限(按出现次数倒序)。术语 / 网络新词常见于此。

每 20,000 字 2 点

TAT logoText analysis tools
© 2026 tatools.cn 京ICP备2020042889号-2 渝公网安备50010302505500号