李开复亲自下场,零一万物的首份To C答卷还是差点儿火候

李开复亲自下场,零一万物的首份To C答卷还是差点儿火候

在经历了创业热潮的洗礼后,今年伊始,大模型开始进入了“落地为王”的新阶段……

两天前,零一万物官宣了一站式AI工作平台——万知。

李开复亲自下场,零一万物的首份To C答卷还是差点儿火候

图源:万知

根据官方介绍,万知是一个专门为中国用户量身打造的一站式AI工作平台,可以做会议纪要、周报、写作助手、解读财报、论文、做PPT,中英双语且完全免费。

值得注意的是,这是零一万物自创业以来首次面向C端用户发布一站式AI产品。同时,其CEO李开复也将亲自出任万知C“E”O(Chief Experience Officer),即“首席体验官”。

目前,用户可以通过官网和微信小程序「万知AI」登录体验。

近来,国产大模型赛道迎来了密集的产品官宣和更新时刻。就在万知“问世”的一天前,大模型公司月之暗面也为其明星产品Kimi带来了首次大规模的迭代升级,推出了全新的Kimi+功能。据悉,用户只需简单地通过网页聊天框输入信息,或在左侧工具栏进行一键操作,即可轻松体验到Kimi+带来的高效与智能。而再往前追溯,诸如讯飞星火、商汤科技等一系列大模型参与者也相继推出了全新的大模型产品……

不难发现,AI办公助手类产品正在成为所有大模型参与者的“必争之地”。零一万物在官宣中提到:基于强大的 Yi 大模型的模型知识能力,搭配上以 AI-First 理念精心设计的工具软件界面,零一万物试图打造适合国人的“ChatGPT Moment”。

接下来,就请跟着大模型之家的脚步,看看万知真正的实测效果吧!

实测万知后:AI知识问答、AI读文档及AI创作PPT均有“进步空间”

完成登录后,大模型之家首先对实时对话和提问功能进行了体验。

李开复亲自下场,零一万物的首份To C答卷还是差点儿火候

图源:大模型之家

在基础能力测试环节,大模型之家以时下热门的巧克力甜甜圈做法为题进行测试,并着重对答案的表现形式、结构组成进行了要求。几十秒后,万知给出了生成答案,且按照字文字表述+表格+表情包的结构对答案进行了展示,同时,大模型之家校对后发现其所生成的食材、配料及步骤均无差错。

值得注意的是,以表格形式呈现信息,是万知主打的亮点功能之一,这比密密麻麻的文字信息看起来更清爽直观。

数学能力测试上:大模型之家依然选取了经典的鸡兔同笼问题,提出了“若干只鸡和兔子关在同一个笼子里,从上边数,有35个头,从下边数,有94只脚,问,鸡和兔子各有几只”的设问。

同样,万知不仅回答正确!而且回答速度还挺快!

李开复亲自下场,零一万物的首份To C答卷还是差点儿火候

图源:大模型之家

联网能力上,大模型之家以“淄博烧烤是凭什么成为网红的”进行设问。生成的回答非常的有条理,不仅从风味、传播渠道、价格属性多个角度上逐步分析,还对每个因素进行了既严密又易于理解的解释,使最终得出的结论逻辑上自洽且有说服力。

李开复亲自下场,零一万物的首份To C答卷还是差点儿火候

图源:大模型之家

不过,值得注意的是,虽然万知对提出问题:“淄博烧烤为什么这么火”,作出了解答,并对最终的结果进行了总结,但并未给出联网能力所体现出的参考信息来源,大多属于“片汤式”答案,整体表现未达预期。

李开复亲自下场,零一万物的首份To C答卷还是差点儿火候

图源:大模型之家

逻辑能力上:大模型之家以“在跑步比赛中,你如果超过了倒数第一名,你是第几名?”脑筋急转弯类型的题目进行考验。通过测试发现,万知的确能够很好的规避题目存在的陷阱,同时在语言表述上也完全趋近用户的自然语言。

就此,从整体基础对话功能来看,万知在简单的对话交流表现的十分出色,不仅能够正确回答所提问题,在答案给出的结构及展示上也具有一定的条理性及模板化特点。不过,在联网功能上,万知的表现仍有待加强,可能出现突然失效的情况,这对于需要最新信息的用户来说相当“扫兴”。

其次,我们对万知的PDF阅读理解能力进行了测试:

上传拓尔思财报文件后,万知给出了十分完整的财报简要信息理解,同时在大模型之家追问关于财数据的形成原因也给出了十分清晰的答案。

李开复亲自下场,零一万物的首份To C答卷还是差点儿火候

图源:大模型之家

不过,在选择以《西游记》《甄嬛传》等理解类读物继续提问时,万知给出的答案却有些一言难尽。不仅在整个页面显示乱码,甚至在解析的第一步上也迟迟未出现响应。

AI PPT生成能力:

我们尝试以“北京密云区发展”为主题,让万知生成一份PPT

①:根据输入的主题,万知所生成的幻灯片大纲

李开复亲自下场,零一万物的首份To C答卷还是差点儿火候

图源:大模型之家

②:仔细核对大纲内容及结构后,点击生成幻灯片即可开始生成,预览结果如下:

李开复亲自下场,零一万物的首份To C答卷还是差点儿火候

图源:大模型之家

从操作上来看,万知的AI PPT功能在响应速度上可圈可点,生成PPT结构模式化显著的同时,还支持11中风格的自由切换,且可以在最下面的“上传参考”处上传Word材料,让万知将其转化成PPT,或上传PPT参考模板进行个性化内容填充,使用户在实际使用中的流程实现了化繁为简的迭代。不过,万知自主生成的大纲内容相对单薄,完全呈“流水线”效果,在实际使用过程中容易出现“双胞”情况。

李开复亲自下场,零一万物的首份To C答卷还是差点儿火候

图源:大模型之家

值得注意的是,我们发现,其生成的ppt中普遍存在大量模糊、重复的元素。包括:部分图片存在明显变形,文字内容与主题表达观点相去甚远等等。于此,笔者实在找不到该功能任何能与世面“友商”媲美之处,甚至怀疑其存在“强蹭热搜”的嫌疑。

抵达AGI,零一万物胜算几何?

目前,办公已经成为AI产品落地的首要场景。赛道内,微软Office去年就推出了Copilot系列产品,国内的钉钉、飞书也在做类似的产品改造。也就是说,从时间上来看,零一万物似乎算是国内智慧办公赛道的“新玩家”。

不过,大模型之家了解到,零一万物曾经于去年在海外市场进行了产品试水,明确了AI读文档、PPT制作等高价值场景,在打造优质专业的用户体验的基础上探索商业化空间。

同时,尽管探路者们曾反复构想和描绘抵达AGI境界后的宏伟蓝图,但大模型技术是一个动态发展的领域,始终处于不断演进的阶段。OpenAI固然在这一进程中取得了显著的进展,但也只是众多勇敢前行者中的暂时领先。在这个充满无限可能的领域中,每一个敢于挑战、敢于创新的探路者,都拥有通往最终胜利的潜力。

换句话说,那些在算力、资本、技术研发上底蕴深厚的“参与者”,才能更接近胜利。

算力方面,零一万物在很早时候就做了资源规划,其曾在去年11月公开表示,算力储备可以支持其用到 18 个月以后。另外,团队还建立了故障预测与故障解决大模型,利用模型本身为预训练过程中可能出现的问题设计相应的解决方案,以及如何以最低成本解决这个问题。

资本方面,去年11月,零一万物正式发布了首款开源中英双语大模型“Yi”。彼时,零一万物新一轮融资由阿里云领投,估值已超10亿美元,跻身独角兽行列,也就是说,零一万物有足够的“底气”持续参与竞技。

技术研发上,自创立之处,零一万物便聚集了数十名核心成员的团队,集中在大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全、产品研发等领域。这其中,包括前阿里巴巴副总裁、前百度副总裁、前滴滴/百度首席算法负责人、前谷歌中国高管、前微软/SAP/Cisco/副总裁,算法和产品团队背景均来自国内外大厂。

大模型之家认为,虽然现阶段的万知目前仍有些许待完善之处,但其仍是是零一万物在C端场景下应用AI技术的一个典型案例,展示了其在大模型技术方面的领先水平和创新能力。同时,通过万知与不同落地应用的需求相结合,万知可以为用户提供个性化的AI解决方案。不过,作为一款基于AI大模型技术打造的产品,零一智能并没能与竞品拉开差距,形成独家竞争力,意味着万知想要在C端用户市场中寻得一隅,需要更多的推广力量,这对于一家初创科技公司来说,仍然是不容忽视的挑战。

百川智能创始人王小川曾强调:“模型往前走,技术是你的发动机,市场是你的方向盘。你可以先造发动机,再造车。但当你上路,两个都得有才行。”如今,大模型故事仍在继续,落地、商业化已经成为主旋律,已经拥有了发动机的零一万物,恐怕暂时还不能以“伤痕累累”的万知作为其上路远行的车。

原创文章,作者:欧 玉娇,如若转载,请注明出处:http://www.damoai.com.cn/archives/5150

(0)
上一篇 2024年5月10日
下一篇 2024年5月11日

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注