面壁智能开源MiniCPM-V 4.5：8B参数实现高刷视频理解，反超Gemini 2.5

大模型之家讯 8 月 28 日，面壁智能开源首款 “高刷视频理解” 端侧多模态模型 MiniCPM-V 4.5，仅 8B 参数却在多领域突破：单图理解、OCR、复杂文档解析、长视频分析均获 SOTA，反超 Gemini 2.5 Pro、GPT-4o 及 72B 参数的 Qwen2.5-VL。该模型首创 3D-Resampler 技术，实现 96 倍视觉压缩率，可处理 6 倍视频帧，轻松识别高刷视频细节；端侧部署友好，推理效率为同级 1/10，支持车机、机器人等场景。目前已在 Github、Hugging Face、魔搭社区开放下载，刷新端侧 AI 天花板。

面壁智能开源MiniCPM-V 4.5：8B参数实现高刷视频理解，反超Gemini 2.5

发表回复