大模型之家讯 根据权威评测平台OpenCompass多模态大模型学术榜单(Multi-modal Academic Leaderboard)最新数据显示,商汤「日日新 V6.5」(SenseNova-V6.5 Pro)多模态大模型以82.2的综合成绩登顶榜首,领先Gemini 2.5 Pro以及GPT-5等国际顶尖模型。

这一佳绩不仅意味着商汤「日日新 V6.5」成为全球最强多模态大模型之一,同时也是商汤在“多模态通用智能”技术战略下的成果印证。商汤科技联合创始人、执行董事、首席科学家林达华在《迈向多模态通用智能:商汤的思考》中指出,智能的核心是与外界进行自主交互的能力,多模态信息感知与处理的能力是AGI的核心要求,使AI能像人类一样,通过视觉、听觉等多种感官接收并融合信息,实现更深层次的理解与推理,是迈向AGI的必由之路。
商汤「日日新V6.5」正是商汤科技以多模态为技术主轴下的最新成果。在国内率先突破“图文交错思维链”技术,「日日新V6.5」能够像人一样,实现逻辑思维和形象思维的结合,可将部分思考过程转化为图形化表达,具备真正的多模态思考能力,成为国内首个拥有形象思维,实现图文交错思维的商业级大模型。
同时,凭借以思维链为载体、强化学习为主要途径的新范式,「日日新V6.5」能够在“生成-验证-学习”的算法闭环中持续改进自身的思维,推理性能大幅提升,其中在数理、代码、GUI操作、图表分析、高阶任务等维度的提升尤为显著。
商汤「日日新V6.5」还通过架构更新,采用轻量化的视觉编码器,同时加深MLLM主干网络,在保证同样性能的前提下,实现3倍以上的效率提升,使性能成本曲线显著优化,效费比优于Gemini 2.5等国际模型。
在以多模态通向通用人工智能(AGI)的过程,商汤科技以“基础设施-模型-应用”三位一体的总体战略,致力于打造业界领先的通用多模态大模型,并在真实场景牵引下,构建端到端的产品技术竞争力。以不断进化的多模态大模型能力为基础,商汤科技持续推动多模态AI从数字空间走入真实的物理世界,在真实场景中提供端到端的价值。
OpenCompass大模型开放评测体系是上海人工智能实验室推出的一站式、大模型评估平台,致力于提供公平、开源、可复现的评测标准,覆盖了语言、多模、安全、具身智能、金融与医疗等多个方面通用能力和垂类领域评测,是对大模型真实能力各个维度进行全面诊断的专业综合榜单。多模态模型公开学术榜单精选国内外具有广泛影响力的开源学术评测集,对行业多模态模型进行评测,采用主客观评测相结合的评测手段,运用了CircularEval、LLM-as-a-Judge等策略,被业界视为反映大模型“应用价值”的重要参考。
原创文章,作者:志斌,如若转载,请注明出处:http://www.damoai.com.cn/archives/12731