文本可读性分析
用于回答一段文字的阅读门槛大致在哪个水平、目标读者能不能读懂、哪些句子最难需要改写,是发布前判断稿件是否需要简化、或挑选不同读者群对应版本的常用工具。
中文按《通用规范汉字表》一 / 二 / 三级覆盖率,结合平均句长、生僻字比例、虚词密度与平均词长综合打分;英文同时跑 Flesch Reading Ease、Flesch-Kincaid Grade、Gunning Fog、SMOG、Coleman-Liau、ARI、Dale-Chall 七项学界通行公式,可自动检测语言或手动指定,中英混排时按主导语言走对应管线。
报告给出 0-100 综合可读性分与近似阅读年级,配以通用规范汉字表覆盖堆叠图、多文件难度雷达对比、多文件汇总表,以及每份文件最难 5 句 / 最易 5 句样本;同时附「凭什么得出阅读年级」的方法说明与年级带映射表(小学 / 初中 / 高中 / 通用 / 学术)。
适合教辅与少儿读物分级、字幕与配音稿的难度匹配,也适合公文、学术与品牌稿件在面向大众发布前的改写决策与多版稿件难度横向对比。
中文管线基于《通用规范汉字表》(一/二/三级共 8105 字)覆盖率 + 平均句长 + 生僻字比例 + 虚词密度 + 平均词长,给出 0-100 综合分与近似阅读年级。
英文管线跑学界标准的 Flesch Reading Ease / Flesch-Kincaid Grade / Gunning Fog / SMOG / Coleman-Liau / ARI / Dale-Chall 七件套(基于 textstat)。
⚠️ 评分依赖统计阈值,对古文 / 口语 / 对话 / 代码 / 表格 / 极短文本可能偏差较大;建议结合「文本质量评估」「文体风格指纹」综合判断。
仅影响展示偏好;引擎仍按检测到的实际语言走对应管线(中文文本不会按英文公式硬算)。
按句长 + 生僻字(中文)/ 长词比例(英文)打分,挑出最难和最易的各 5 条句子,便于直观感受文本难度。
每 20,000 字 2 点