NewsMarch 3, 2026

小红书发布并开源端到端文档识别模型：FireRed-OCR

小红书团队发布并开源端到端文档识别模型FireRed-OCR，基于Qwen3-VL架构，首创”三阶段渐进优化”策略与”几何+语义”数据工厂，解决通用VLM处理复杂文档时的”结构性幻觉”问题。模型在权威评测OmniDocBench v1.5中取得端到端方案SOTA，综合评分92.9%领先Gemini-3.0 Pro等模型。

Back

All Categories