面壁智能开源MiniCPM-V 4.5:8B参数实现高刷视频理解,反超Gemini 2.5

大模型之家讯 8 月 28 日,面壁智能开源首款 “高刷视频理解” 端侧多模态模型 MiniCPM-V 4.5,仅 8B 参数却在多领域突破:单图理解、OCR、复杂文档解析、长视频分析均获 SOTA,反超 Gemini 2.5 Pro、GPT-4o 及 72B 参数的 Qwen2.5-VL。该模型首创 3D-Resampler 技术,实现 96 倍视觉压缩率,可处理 6 倍视频帧,轻松识别高刷视频细节;端侧部署友好,推理效率为同级 1/10,支持车机、机器人等场景。目前已在 Github、Hugging Face、魔搭社区开放下载,刷新端侧 AI 天花板。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注