抽取式摘要（TextRank / LexRank 双引擎）

用于快速从长文里挑出最具代表性的几句话拼成摘要。与生成式摘要不同——本工具不改写、不脑补，每一句都直接来自原文并标注原文行号，可一键回到出处，从根源上避免事实漂移与措辞篡改的风险。

系统先把每个句子用 TF-IDF 表示并构建句子相似度图，再同时跑 TextRank（基于 PageRank 的图迭代）与 LexRank（阈值化邻接 + 幂迭代）两套经典算法计算「句重要性分」，按权重挑头部并保持原文顺序拼接；摘要长度可按压缩比或目标句数控制，支持中文、英文与自动检测。

报告给出每篇文档的摘要句列表（含权重条形与原文行号）、原文 + 摘要高亮对照（Tab 切换看两套算法的选句差异）、句权重 Top 30 分布、两算法重合度指标，以及多文件压缩比与重合度汇总表。

适合政策文件、论文、研究报告的快速通读与批量「先看摘要再决定要不要细读」，也适合长篇评论、访谈、博客的重点抽取与导读卡片生成。

使用前请读：抽取式摘要 ≠ 生成式摘要

从原文里挑出最有代表性的几句话，按原文顺序拼接而成，不会生成新句子，也不会改写，因此可读性取决于原文本身的句段质量。

每篇文档都会**同时**用两种经典算法计算并展示：TextRank（句子相似度图 + PageRank）与 LexRank（阈值化邻接 + 幂迭代）。两套结果在报告页用 Tab 切换查看，并给出两者重合度。

⚠️ 对话 / 字幕 / 短文本（句数 < 5）效果有限；如需"理解 + 改写"型摘要，请改用「智能分析」类工具。

加载文件上传组件中...

目标长度

压缩比20%

0.05 = 仅保留 5% 的句子；0.2 = 摘要约为原文 1/5。新闻 / 评论建议 0.2 ~ 0.3，论文 / 长报告建议 0.1 ~ 0.15。

文本语言

中文走 jieba 分词 + 中文标点切句；英文按 . ! ? 切句 + lowercase。

每 20,000 字 2 点

完成后发送邮件通知