仅3B激活参数，更强的多模态理解与推理能力，ERNIE-4.5-VL-28B-A3B-Thinking正式开源

志斌 • 2天前 • 人工智能

大模型之家讯 11月11日，百度宣布正式开源文心多模态思考模型ERNIE-4.5-VL-28B-A3B-Thinking。根据官方信息，这一模型采用约3B激活参数（activation parameters），定位为轻量级架构，但在多项能力测试中对标主流大型模型。其开源协议为Apache License 2.0，允许商业化使用。

仅3B激活参数，更强的多模态理解与推理能力，ERNIE-4.5-VL-28B-A3B-Thinking正式开源

多模态理解能力的进一步扩展

ERNIE-4.5-VL-28B-A3B-Thinking源自ERNIE-4.5-VL-28B-A3B模型体系。通过额外训练与数据优化，新版本在视觉与语言结合场景中表现提升。官方介绍称模型在文档解析、图表阅读、学科综合推理以及通用视觉理解任务上取得更优结果，并增强了跨模态推理与问题解决能力。

这一代模型强调空间定位能力与外部工具协同，包括支持“图像思考”（Image-Thinking）功能，可在用户指令下触发图像区域定位、放大及图片搜索等交互，使其具备更完整的环境感知与操作能力。

开源布局与生态支持

该模型的预训练权重、推理代码与示例项目已在Hugging Face、GitHub以及飞桨星河社区发布。百度表示，FastDeploy、vLLM、Transformers等主流部署工具链已完成适配，为开发者直接加载与使用提供便利。作为文心4.5系列的一部分，其开源动作被视为该系列模型体系进一步开放的延续。

从训练策略来看，ERNIE-4.5-VL-28B-A3B-Thinking在中期训练阶段加入更大规模的高质量视觉-语言语料，以改善特征表征及语义对齐能力。在强化学习部分则采用GSPO、IcePop等策略，目标是提升基于MoE（Mixture-of-Experts）架构的训练稳定性与效率。官方同时强调了对指令遵循性与定位能力的针对性优化，这是模型面向开发者需求的一个具体方向。

百度方面声称，该模型在业界多项评测中与旗舰级大模型的差距进一步缩小。鉴于轻量化规模与推理成本的优势，这一开源举措也被解读为多模态模型竞争格局中的另一种路线选择。性能数据的独立验证与行业采用情况仍有待后续观察。

原创文章，作者：志斌，如若转载，请注明出处：http://www.damoai.com.cn/archives/13490

赞 (0)

0 0

2025大模型之家「达摩奖」案例征集开启：致敬AI行业实践，与时代共书答案

上一篇 3天前

前DeepSeek研究员罗福莉加入小米公司，任职Xiaomi MiMo团队

下一篇 1天前

人工智能

努比亚MyOS14发布：业界首个垂直影像AI大模型来袭

大模型之家讯今日，努比亚宣布MyOS14发布，该版本引入了业界首个垂直影像AI大模型，进一步强化了系统底层的AI技术应用。此次更新将AI大模型与专业影像技术相结合，重点优化星空、…

志斌
2023年12月19日
人工智能

昆仑万维发布「天工大模型4.0」o1版

大模型之家讯今日，昆仑万维正式宣布推出具有复杂思考推理能力的系列模型——「天工大模型4.0」o1版（Skywork o1）。作为国内首款具备中文逻辑推理能力的o1模型，Skywo…

志斌
2024年11月27日
人工智能

大模型驱动创新：开放性路径、多模态能力与多场景支持的商业价值

“人类历史上第一次，比最聪明的人类还要聪明得多的东西出现了。”马斯克在英国人工智能安全峰会上这样说道。论偏激与否，不可否认的是，AI在不到一年的时间，真切地改变着人类生产生活的方…

王昊达
2023年11月6日
人工智能

天工AI推出彩页功能，聚焦AI阅读质感+创作效能

大模型之家讯近日，昆仑万维旗下天工AI推出了全新功能——天工AI彩页。这一功能特别针对结构化知识型内容进行了优化，旨在为用户带来更加极致的阅读体验与创作效能。天工AI彩页的编辑…

志斌
2024年12月6日
成本最高降90%！百度发布端到端语音语言大模型，已在文小言上线

大模型之家讯 3月31日，在百度AI DAY上，百度发布业界首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型，实现超低时延与超低成本，在电话语音频道…

志斌
人工智能 2025年3月31日
人工智能

商汤元萝卜AI下棋机器人摘得“工业制造奥斯卡”中国设计智造银奖

大模型之家讯近日，被誉为“中国工业设计奥斯卡”的2023年中国设计智造大奖（Design Intelligence Award，简称“DIA”）评选结果正式揭晓。商汤科技“元萝卜…

志斌
2023年12月27日
人工智能

见证AI力量，大模型之家2024年度颁奖盛典圆满举行

12月31日，由国内专业人工智能垂直媒体大模型之家开启的2024年度人工智能获奖案例颁奖盛典圆满举行。作为年度最具专业性的评审活动，大模型之家本次推举出在人工智能领域中具有潜力和长…

赵小满
2024年12月31日
人工智能

知乎盐Club创作者圆桌话长论“短”：短篇故事的短剧化浪潮

大模型之家讯 “从短篇故事到短剧，越来越多年轻人为短内容买单”“短篇故事改编短剧的成功要素：坚持高立意并认真讲好故事”“短篇故事和短剧创作最大的共同点在于，对情感和情绪的高密度呈现…

志斌
2024年6月29日
人工智能

微软 Build 2024 开发者大会：50+产品重磅更新，奥特曼剧透OpenAI新模型

继Open AI、谷歌之后，微软 Build 2024 开发者大会5月22日凌晨在美国西雅图正式召开。大会伊始，微软公司CEO萨蒂亚·纳德拉首先阐述了微软对于计算机技术…

欧玉娇
2024年5月22日
人工智能

百度与OpenAI“默契”开放大模型背后，暗藏哪些AI技术突破的玄机？

AI大厂之间的“默契”，总是超越了竞争本身，形成一种既对抗又合作的微妙平衡。 2月13日凌晨，OpenAI宣布GPT-5即将到来，并将全面免费开放（Pro用户将获得更高阶智能的版本…

志斌
2025年2月13日

发表回复