微软发布创新语言模型Phi-2：27亿参数挑战大模型性能边界

志斌 • 2023年12月13日下午2:12 • 人工智能

大模型之家讯 12月13日，微软宣布推出其最新语言模型Phi-2，凭借27亿参数的规模，挑战了大型语言模型的性能边界。据微软介绍，通过在模型缩放和训练数据整理方面的创新，Phi-2在复杂的基准测试中展示出可媲美或优于比其大25倍的模型的性能。

Phi-2是一个基于Transformer的模型，它在1.4T的词块上进行了训练，这些词块来源于自然语言处理（NLP）和编码的合成数据集以及网络数据集。在96个A100 GPU上进行训练的过程中，Phi-2耗时14天。值得注意的是，Phi-2作为一个基础模型，并未通过人类反馈强化学习（RLHF）进行调整，也未经过指导性微调。尽管如此，与经过对齐的现有开源模型相比，Phi-2在毒性和偏差方面表现出更好的性能。

在各种综合基准测试中，Phi-2超越了Mistral和Llama-2模型在70亿和130亿参数下的性能。令人瞩目的是，在多步骤推理任务（即编码和数学）上，Phi-2的性能达到了Llama-2-70 B模型的25倍。此外，与最近发布的Google Gemini Nano 2相比，Phi-2的性能不相上下，甚至在某些方面更胜一筹。

这一突破性的成果表明，微软在语言模型领域的研究正取得显著进展。Phi-2的成功发布为自然语言处理和人工智能领域的研究提供了新的思路和方法。微软表示，他们将继续致力于推动语言模型的发展，并期待未来更多创新的突破。

原创文章，作者：志斌，如若转载，请注明出处：http://www.damoai.com.cn/archives/2449

赞 (0)

0 0

微软或调整H100 AI服务器订单拟加大对B100和超微MI300投入

上一篇 2023年12月13日

Meta Ray-Ban智能眼镜推出多模态AI功能，可实时感知用户提供相关信息

下一篇 2023年12月13日

人工智能

百川智能大模型项目落地宁波，携手共创AI产业新生态

大模型之家讯近日，百川智能创始人兼CEO王小川与宁波高新区管委会正式签订了合作协议，标志着百川智能大模型项目正式落地宁波高新区。此次会见，省常委、市委书记彭家学，以及市领导林坚、…

志斌
2025年1月13日
人工智能

InfoQ发布2025推理模型评测报告：文心X1 Turbo领跑国内总分第一

大模型之家讯 5月29日，极客邦科技双数研究院InfoQ研究中心正式发布《2025推理模型评测报告》，基于逻辑推理、数学推理、多步推理、语言推理、及幻觉控制五大维度，对OpenAI…

志斌
2025年5月30日
阿里通义千问重磅升级：免费开放1000万字长文档处理功能

大模型之家讯 3月22日消息，阿里通义千问重磅升级，向所有人免费开放1000万字的长文档处理功能，成为全球文档处理容量第一的AI应用。即日起，所有金融、法律、科研、医疗、教育等领…

志斌
人工智能 2024年3月22日
人工智能

阿里云魔搭发起“ModelScope-Sora开源计划”，将为中国类Sora模型开发提供一站式工具链

大模型之家讯 3月23日，2024全球开发者先锋大会上，阿里云魔搭社区公布“ModelScope-Sora开源计划”，将以开源力量助力中国类Sora模型的探索和创新。该计划将为类S…

志斌
2024年3月24日
人工智能

商汤科技元萝卜家族首次集体亮相AWE 2024，为智慧家庭增添新纽带

大模型之家讯 “这样的坐姿会伤害你的眼睛和脊椎哦”，“白棋棋形已被破坏，通过打吃收气”。在熙熙攘攘、热闹非凡的会场上，一台台简约酷萌又科技感十足的机器人吸引了不少人的围观，有的和它…

志斌
2024年3月15日
人工智能

百川智能亮相WAIC：大模型、AI助手、医疗应用齐头并进

大模型之家讯近日，2024年世界人工智能大会（WAIC）在上海隆重召开，百川智能以强大的研发实力和创新应用成为展会焦点。公司携Baichuan系列通用大模型、AI助手百小应、内测…

志斌
2024年7月4日
百度发布2024Q4及全年财报：AI驱动业绩飙升，文心大模型调用量一年暴增33倍

大模型之家讯 2月18日晚，百度发布2024年第四季度及全年财报，显示全年总营收达1331亿元，归属百度核心的净利润达234亿元，同比增长21%。财报披露，2024年12月，文心大…

志斌
人工智能 2025年2月18日
人工智能

AI机器人引发行业热议，商汤科技元萝卜率先深入家庭场景

大模型之家讯在近日举办的GTC大会上，一列人形机器人亮相的画面引爆了国内外社交媒体的广泛关注和热议。该列人形机器人均由AI技术驱动，极具科幻和未来感，有望加速推动机器人和具身智能…

志斌
2024年3月25日
人工智能

百度智能云发布新一代智能计算操作系统“万源”，革新AI原生应用开发体验

大模型之家讯 4月16日，Create 2024 百度AI开发者大会在深圳召开。期间，百度集团执行副总裁、百度智能云事业群总裁沈抖正式发布新一代智能计算操作系统——万源，通过对AI…

志斌
2024年4月16日
人工智能

银泰商业陈晓东：商场将进入AI时代

大模型之家讯坚守“渠道为王”将可能面临“渠道唯亡”。近日，银泰商业集团董事长陈晓东在一次会议上提醒大家重视“科技来了”，他认为，此后商场一定进入AI时代，越来越多的机器人将高效、…

志斌
2023年12月15日

发表回复

志斌

数码科技领域深耕多年的专业管理者与技术服务专家，现任大模型之家主编、速途网资深编辑、元宇宙研究院分析师。专注于人工智能、消费电子与IDC行业的深度报道，凭借广泛科技圈人脉，包括媒体、公关、分析师及企业高层，持续引领行业洞察与分析。商务合作咨询： Qiaodao007

1.2K posts

0 comments