信息价值评估

用于比较句子之间的信息价值,判断哪些句子信息更密、更新颖、更值得保留,哪些句子内容空泛或重复。逐句指标表、综合得分和筛选结果可用于摘出高价值原句、压缩冗余材料、整理引文和下一轮分析语料;多项信息指标还能帮助解释一句话为什么值得保留。适用于访谈逐字稿筛句,也适用于新闻、评论和笔记材料的重点提炼。

该方式按行计算,单行建议控制在 200 字内,不适合直接分析整段长文,推荐使用强力清洗后的文本文件。

使用前请读:能量化什么 + 输出什么 + 文件要求

信息价值评估器可帮您量化以下文本特性:

  • 信息熵与信息密度: 评估文本的不确定性和每单位长度包含的信息量,识别高价值内容
  • 词汇密度与新颖性: 分析文本中实质性内容词的比例和内容的独特程度,发现有深度的表述
  • 语义信息量与简洁性: 衡量文本传递知识的效率,找出表达精炼且内容丰富的段落
  • 综合评分系统: 通过多维度指标得出段落的整体价值评分,自动筛选高质量内容

分析结果包含:

  • 详细指标报告: 提供 10 项核心信息指标的具体数值,包括信息熵、困惑度、词汇密度等
  • 无效内容筛选: 自动标记并可选择剔除低价值段落,提升文本整体质量
  • 信息价值排序: 根据综合评分对段落进行排序,突出最有价值的内容
  • 质量分布统计: 生成文本质量分布报告,了解内容的整体信息价值水平

⚠️ 仅支持中文;本工具按 段落 进行分析(每行 = 一段,不再按标点切句)。每段长度不限,但推荐每段约 100 字,段落数越多对比指标越有意义;空白行会被自动跳过。

加载文件上传组件中...

每 1,000 行 2 点