News
百度开源端到端长文档 OCR 模型 Unlimited-OCR
百度开源全新OCR模型 Unlimited OCR,主打一次性解析数十页长文档,在 OmniDocBench 上刷新 SOTA,综合得分 93.23%,超越 DeepSeek OCR。模型核心创新为参考滑动窗口注意力(R-SWA)机制,通过”软遗忘”策略使 KV Cache 保持恒定,推理速度不随文档长度增长,6000 Token 时 TPS 提升约 35%。
百度开源全新OCR模型 Unlimited OCR,主打一次性解析数十页长文档,在 OmniDocBench 上刷新 SOTA,综合得分 93.23%,超越 DeepSeek OCR。模型核心创新为参考滑动窗口注意力(R-SWA)机制,通过”软遗忘”策略使 KV Cache 保持恒定,推理速度不随文档长度增长,6000 Token 时 TPS 提升约 35%。