人工智能
-
科大讯飞开源“Spark Chemistry‑X1‑13B”与“AudioFly”两大模型 助力化学与声音生成前沿研究
大模型之家讯 近日,科大讯飞宣布将两款尖端人工智能模型正式开源:化学大模型 Spark Chemistry‑X1‑13B 与文本驱动音效生成模型 AudioFly。Spark Ch…
-
360开源视觉语言对齐模型FG-CLIP2:细粒度识别性能取得突破
大模型之家讯 11月3日,360方面宣布正式开源视觉语言对齐模型FG-CLIP2(Fine-Grained CLIP 2)。该模型的主要技术突破聚焦于“细粒度识别”能力,旨在提升机…
-
亚马逊云科技与OpenAI宣布达成多年战略合作
11月4日,亚马逊云科技与OpenAI宣布达成一项为期多年的战略合作协议。OpenAI将立即在亚马逊云科技全球领先的云基础设施上运行并扩展其核心AI(人工智能)工作负载。根据这项总…
-
大模型之家2025年10月热力榜:大模型正从”能力竞赛”转向”生态协同”
2025年10月,人工智能大模型领域呈现多维突破趋势,行业专家指出,生成式AI正从单一功能向全场景协同演进。在基础能力层面,多模态交互与长文本处理成为核心方向——通过混合专家架构、…
-
声网:RTE 步入“万亿分钟”时代,对话式 AI 开启 RTE 行业千亿级新蓝海
大模型之家讯 10月31日,由声网与 RTE 开发者社区联合主办的 Convo AI & RTE 2025 第十一届实时互…
-
别让“3秒迟疑”毁掉AI的未来:RTE如何成为具身智能的“神经系统”?
试想一个场景:一个高度精密的具身智能机器人,它拥有完美的机械结构和运动能力,但当你向它发出指令时,它却需要三秒钟的“思考”才能回应;或者,它无法分辨你是在对它说话,还是在对客厅的电…
-
MiniMax Music 2.0发布,音乐理解与声学表现能力增强、具备影视化表达潜力
大模型之家讯 10月31日,MiniMax正式发布新一代音乐生成模型MiniMax Music 2.0。相较上一版本,这一模型在音乐理解与声学表现能力上实现升级,能够更准确地再现人…
-
MiniMax发布新一代语音模型Speech 2.6,重点提升实时语音交互能力
大模型之家讯 10月30日,MiniMax发布最新版本的语音模型MiniMax Speech 2.6。本次更新主要面向Voice Agent场景,优化端到端延迟、专业格式文本支持能…
-
当AI把薯片看成枪:一个“Hard Case”拷问万亿安防产业
“薯片惊魂”事件的背后,不只是AI误报引发的笑话,更暴露了AGI路上不得不面对的坎。 近日,在美国马里兰州的校园里,一名16岁高中生因口袋里的一包薯片被学校AI监控系统误判为枪支,…
-
OpenAI完成股改,非营利主体更名“OpenAI 基金会”
大模型之家讯 10 月 29 日消息,OpenAI 宣布其资本结构重组已正式完成。重组后,其原非营利主体OpenAI Nonprofit 更名为 OpenAI Foundation…