信息价值评估
用于比较句子之间的信息价值,判断哪些句子信息更密、更新颖、更值得保留,哪些句子内容空泛或重复。逐句指标表、综合得分和筛选结果可用于摘出高价值原句、压缩冗余材料、整理引文和下一轮分析语料;多项信息指标还能帮助解释一句话为什么值得保留。适用于访谈逐字稿筛句,也适用于新闻、评论和笔记材料的重点提炼。
该方式按行计算,单行建议控制在 200 字内,不适合直接分析整段长文,推荐使用强力清洗后的文本文件。
使用前请读:能量化什么 + 输出什么 + 文件要求
信息价值评估器可帮您量化以下文本特性:
- 信息熵与信息密度: 评估文本的不确定性和每单位长度包含的信息量,识别高价值内容
- 词汇密度与新颖性: 分析文本中实质性内容词的比例和内容的独特程度,发现有深度的表述
- 语义信息量与简洁性: 衡量文本传递知识的效率,找出表达精炼且内容丰富的段落
- 综合评分系统: 通过多维度指标得出段落的整体价值评分,自动筛选高质量内容
分析结果包含:
- 详细指标报告: 提供 10 项核心信息指标的具体数值,包括信息熵、困惑度、词汇密度等
- 无效内容筛选: 自动标记并可选择剔除低价值段落,提升文本整体质量
- 信息价值排序: 根据综合评分对段落进行排序,突出最有价值的内容
- 质量分布统计: 生成文本质量分布报告,了解内容的整体信息价值水平
⚠️ 仅支持中文;本工具按 段落 进行分析(每行 = 一段,不再按标点切句)。每段长度不限,但推荐每段约 100 字,段落数越多对比指标越有意义;空白行会被自动跳过。
加载文件上传组件中...
每 1,000 行 2 点