News
小红书发布并开源端到端文档识别模型:FireRed-OCR
小红书团队发布并开源端到端文档识别模型FireRed-OCR,基于Qwen3-VL架构,首创”三阶段渐进优化”策略与”几何+语义”数据工厂,解决通用VLM处理复杂文档时的”结构性幻觉”问题。模型在权威评测OmniDocBench v1.5中取得端到端方案SOTA,综合评分92.9%领先Gemini-3.0 Pro等模型。
小红书团队发布并开源端到端文档识别模型FireRed-OCR,基于Qwen3-VL架构,首创”三阶段渐进优化”策略与”几何+语义”数据工厂,解决通用VLM处理复杂文档时的”结构性幻觉”问题。模型在权威评测OmniDocBench v1.5中取得端到端方案SOTA,综合评分92.9%领先Gemini-3.0 Pro等模型。