6月26日,Mistral重磅推出新一代文档理解模型——Mistral OCR 4。此次发布的定位非常精准:专为企业级文档解析与智能检索场景量身定制。几个核心亮点:模型覆盖多达170种语言,能够高精度识别文本、表格、数学公式、手写签名等多种文档元素,不仅如此,还会同步返回高精度的边界框坐标、语义区块类型分类以及置信度分数。这意味着什么?它能为RAG系统和搜索平台提供真正高质量的结构化输入,而非一堆杂乱的原始文本。
在多语言支持方面,OCR 4的表现极为出色,尤其在处理资源稀缺的语言时优势明显。根据Mistral官方公布的基准测试结果,在OlmOCRBench评测集上的综合得分高达85.20,这一成绩已经超过当前市面上绝大多数主流OCR工具及文档AI方案。值得关注的是,该模型支持单容器化部署,企业可在本地环境直接运行,确保数据不出本地,从而切实保障数据主权与合规性需求。
目前,Mistral OCR 4已全面开放API调用服务,标准定价为每千页4美元。若批量提交,还可享受5折优惠。此外,模型已深度集成到Mistral Search Toolkit,并可通过Mistral Studio、Amazon SageMaker、Microsoft Foundry等主流平台快速接入。落实到企业级应用,这套组合拳从成本控制到部署灵活性,均提供了极具竞争力的解决方案。

