抽取式摘要(TextRank / LexRank 双引擎)

用于快速从长文里挑出最具代表性的几句话拼成摘要。与生成式摘要不同——本工具不改写、不脑补,每一句都直接来自原文并标注原文行号,可一键回到出处,从根源上避免事实漂移与措辞篡改的风险。

系统先把每个句子用 TF-IDF 表示并构建句子相似度图,再同时跑 TextRank(基于 PageRank 的图迭代)与 LexRank(阈值化邻接 + 幂迭代)两套经典算法计算「句重要性分」,按权重挑头部并保持原文顺序拼接;摘要长度可按压缩比目标句数控制,支持中文、英文与自动检测。

报告给出每篇文档的摘要句列表(含权重条形与原文行号)、原文 + 摘要高亮对照(Tab 切换看两套算法的选句差异)、句权重 Top 30 分布、两算法重合度指标,以及多文件压缩比与重合度汇总表。

适合政策文件、论文、研究报告的快速通读与批量「先看摘要再决定要不要细读」,也适合长篇评论、访谈、博客的重点抽取与导读卡片生成。

使用前请读:抽取式摘要 ≠ 生成式摘要

从原文里挑出最有代表性的几句话,按原文顺序拼接而成,不会生成新句子,也不会改写,因此可读性取决于原文本身的句段质量。

每篇文档都会**同时**用两种经典算法计算并展示:TextRank(句子相似度图 + PageRank)与 LexRank(阈值化邻接 + 幂迭代)。两套结果在报告页用 Tab 切换查看,并给出两者重合度。

⚠️ 对话 / 字幕 / 短文本(句数 < 5)效果有限;如需"理解 + 改写"型摘要,请改用「智能分析」类工具。

加载文件上传组件中...
20%

0.05 = 仅保留 5% 的句子;0.2 = 摘要约为原文 1/5。新闻 / 评论建议 0.2 ~ 0.3,论文 / 长报告建议 0.1 ~ 0.15。

中文走 jieba 分词 + 中文标点切句;英文按 . ! ? 切句 + lowercase。

每 20,000 字 2 点

TAT logoText analysis tools
© 2026 tatools.cn 京ICP备2020042889号-2 渝公网安备50010302505500号