大模型之家讯 近日,科大讯飞宣布将两款尖端人工智能模型正式开源:化学大模型 Spark Chemistry‑X1‑13B 与文本驱动音效生成模型 AudioFly。Spark Chemistry‑X1‑13B 在讯飞星火X1‑0420基础上,结合快思考与慢思考机制,并采用新型注意力掩码解耦多推理模式,已在自建化学基准上超越多主流通用模型,在化学问答、分子性质预测等任务中表现卓越,为化学科研、化学知识检索与跨学科创新提供低门槛工具。

AudioFly 采用潜在扩散模型架构,支持从文本描述生成 44.1 kHz 高质量音频,已在 AudioCaps 公开数据集上达到 SOTA 水平,具备单事件与多事件场景生成能力。其开源可广泛应用于短视频配音、有声故事、音效创作等领域,降低声音生成门槛,激发创意潜能。两大模型的公开部署将显著提升科研与内容创作效率,推动化学与声音技术的深度融合与应用落地。
原创文章,作者:志斌,如若转载,请注明出处:http://www.damoai.com.cn/archives/13454