正视与GPT-4的差距，讯飞星火能否扛起AI大旗？

10月24日，在程序员节的这一天，也迎来了科大讯飞刘庆峰“Flag”的兑现日。在今日举行的“全球1024开发者节”上，科大讯飞正式宣布“讯飞星火认知大模型V3.0”（后简称：讯飞星火V3.0）的升级，号称通用模型对标ChatGPT，实现中文超越、英文相当的水平。

从今年5月6日首次发布以来，讯飞星火至今已进行过4次重大技术迭代。9月5日凌晨，科大讯飞官宣向全民开放使用，截至目前讯飞星火认知大模型用户数突破1200万。

据科大讯飞董事长刘庆峰介绍，根据OpenAI在官网发布的英文任务测试集，讯飞星火V3.0和ChatGPT 3.5得分分别为85.1%和84.3%，目前的讯飞星火V3.0已经实现了对ChatGPT 3.5的超越。

星火V3.0号称综合能力超越ChatGPT

图源：科大讯飞

具体来说，讯飞星火V3.0在七大能力上均有所升级，其中文本生成提升7%，语言理解提升6%，知识问答提升7%，逻辑推理提升8%，数学能力提升3%，代码能力提升9%，多模态能力提升7%。

刘庆峰透露，在数学能力上，讯飞星火3.0已遥遥领先于ChatGPT。在设计方案生成、代码补全、测试检错等领域，讯飞星火3.0的能力也已经超越ChatGPT。

图源：科大讯飞

目前，AI代码开发工具iFlyCode迭代到2.0版本，可实现设计阶段、编码阶段、测试阶段分别可提效50%、37%、44%。刘庆峰表示，借助讯飞iFlyCode工具，程序员原本进行平台迁移需要3个月完成的开发工作，现在只需一个月就完成了。

此外，科大讯飞称，基于星火代码大模型的智能编程助手 iFlyCode自8月15日发布以来，已与京东云、软通动力等107家机构实现深度对接应用。在内部提效方面，根据科大讯飞内部使用数据，本次升级的iFlyCodeV2.0提效范围更广，可实现设计阶段提效50%，编码阶段、测试阶段分别可提效37%、44%。

在此次升级中，讯飞星火研究院院长刘聪还在现场展示了星火认知大模型的“AI人设”新功能，如有声绘本创作助手、友伴功能等。

图源：科大讯飞

图源：讯飞星火

在大模型之家看来，类似友伴等功能的AI人设内容已在行业中屡见不鲜，以360智脑、百度文心一言等在今年也先后推出了类似功能。在产业落地方面，科大讯飞坚持将大模型融入千行百业中，在此次发布会上牵手行业伙伴共同发布十二大行业大模型、并重磅发布医疗大模型讯飞晓医APP、全新发布AI答疑辅学和AI心理伙伴以及首次发布科技文献大模型等，为行业赋能的坚定决心值得肯定。

图源：科大讯飞

目前，科大讯飞已联合华为打造基于昇腾生态的自主可控大模型算力底座“飞星一号”平台。在此基础上，讯飞星火大模型将开启对标GPT-4的更大规模训练。

刘庆峰表示，中国现有的大模型跟GPT-4比都还是实实在在有差距的，所以我们必须正视今天和GPT-4的差距，找到差距所在。“大模型之战绝对是一场硬仗，绝不是靠吹牛能做成的，只有实事求是的的精神才能真正实现超越。”

此外，刘庆峰再次喊话：在2024年上半年，讯飞星火V4.0发布将全面对标GPT-4，而且绝不仅仅是一个简单的技术对标问题，而是要走出自己的技术路线，走出自己的产业方向。

成也AI败也AI，科大讯飞屡次受累

在10月24日，第六届世界声博会暨科大讯飞1024开发者节上午开幕之际，科大讯飞股价报每股49.47元，但在午后遭遇股价跳水跌停，报46.68元/股。

图源：百度股市通

据相关媒体报道称，近日，有用户反馈，在自家孩子的科大讯飞学习机中的《蔺相如》一文里，发现了违背主流价值观的内容。报道称科大讯飞工作人员表示已经在第一时间做出了响应处理，目前是永久性下架了《蔺相如》这篇文章。接下来将会加强内容安全管理。

联想到今年5月24日，科大讯飞股价一度闪崩跳水，盘中一度跌超9%，当时科大讯飞回应称，系某生成式AI写作虚假小作文导致。

如今科大讯飞也是被AI生成的内容所影响，在高喊“超越ChatGPT”“遥遥领先”等口号后，这也显示出了讯飞星火大模型对于AI生成的内容，无法完全规避AI生成的有害信息。无论是科技发展的必然，还是降本增效的推进，生成式人工智能的可靠性仍然有较大的提升空间，尤其对于如何消除大模型幻觉，是提升人工智能性能与鲁棒性重要课题。

其次，尽管人工智能有潜力生成与人类书面内容一样准确的科学文本，但在深度和整体质量方面仍存在差距，它可能包含语言冗余和事实问题方面的错误，这可能会影响其生成内容的质量和可信度。

图源：科大讯飞第三季度报告

不仅如此，据科大讯飞第三季度财报显示，2023年第三季度公司实现营业收入47.72亿元，同比增长2.89%；毛利19.37亿元，同比增长3.62%；但归母净利润仅为2579万元，同比下滑82%；扣非后归母净利润再度由盈转亏，亏损达2019万元。对此，科大讯飞表示，利润大幅减少系公司在通用人工智能认知大模型等方面投入所致。

图源：科大讯飞第三季度报告

值得注意的是，科大讯飞2023年前三季度计入的政府补助3.02亿元。其中，第三季度计入的政府补助为8119万元。科大讯飞第三季度的研发费用为9.81亿元，相比较去年同期的8.92亿元，同比增加超10.04%；相比二季度的8.01亿元，环比增加22.50%。销售费用从去年的同期的7.59亿元，增加了9.86%至8.34亿元。

在业绩交流会上，科大讯飞董秘、副总裁江涛表示，公司还将陆续推出讯飞星火在运营商、金融、汽车、工业等领域的私有化解决方案，但客户从技术调研到招投标一般至少需要6个月，当前正处于方案对接、效果验证和测试阶段。这意味着，星火大模型可能带来的显著业绩贡献还需等到明年有所体现。

如今，星火大模型已搭载在科大讯飞众多AI产品线中，能够为用户提供智能交互。不过，在全面对标ChatGPT的星火大模型V3.0及相关应用发布后，上述产品将会为科大讯飞的业绩表现带来多大影响，仍有待市场验证。

原创文章，作者：赵小满，如若转载，请注明出处：http://www.damoai.com.cn/archives/1530