Mistral 发布 Pixtral Large 多模态 AI 模型：登顶复杂数学推理，图表 / 文档推理超过 GPT-4

AI写作
AI图像

1天前

Mistral AI 公司发布了名为 Pixtral Large 的多模态 AI 模型，该模型在处理文本和图片方面表现出色，拥有 1240 亿参数，基于 Mistral Large 2。Pixtral Large 在 MathVista、DocVQA 和 VQAv2 等标准多模态基准测试中取得了优异成绩，特别是在 MathVista 中达到了 69.4% 的准确率，超越了包括 GPT-4 在内的所有竞争对手。该模型在 ChartQA 和 DocVQA 测试中的表现同样超越了 GPT-4 和 Gemini-1.5 Pro。Pixtral Large 配备了 123B 的多模态解码器和 1B 的视觉编码器，支持 128K 的上下文窗口，能够处理至少 30 张高分辨率图像。该模型不仅在视觉数据处理上表现出色，还在复杂推理和图表理解方面具备强大能力。Pixtral Large 现已在 Mistral 研究许可证和商业许可证下提供，适用于研究、教育以及商业用途。

Mistral 发布 Pixtral Large 多模态 AI 模型：登顶复杂数学推理，图表 / 文档推理超过 GPT-4

最新内容