大模型之家讯 8 月 28 日,面壁智能开源首款 “高刷视频理解” 端侧多模态模型 MiniCPM-V 4.5,仅 8B 参数却在多领域突破:单图理解、OCR、复杂文档解析、长视频分析均获 SOTA,反超 Gemini 2.5 Pro、GPT-4o 及 72B 参数的 Qwen2.5-VL。该模型首创 3D-Resampler 技术,实现 96 倍视觉压缩率,可处理 6 倍视频帧,轻松识别高刷视频细节;端侧部署友好,推理效率为同级 1/10,支持车机、机器人等场景。目前已在 Github、Hugging Face、魔搭社区开放下载,刷新端侧 AI 天花板。