AQUA实测“天工”大模型：以AI改写搜索边界

在昆仑万维的AI之路上，天工AI搜索诠释的正是企业的发展布局和技术禀赋……

11月3日，昆仑万维“天工”大模型通过《生成式人工智能服务管理暂行办法》备案，面向全社会开放服务。昆仑万维表示将持续推动天工大模型及AIGC业务迈向新高度，提高多款生成式AI产品的用户体验，探索未知世界、创造美好未来。

不同于以往通过《生成式人工智能服务管理暂行办法》的大模型，天工大模型直接为用户提供的便是一款包含着联网能力的生成式大模型产品。根据目前国内大模型市场现状，因数据、隐私等相关风险，具备联网功能的大模型产品少之又少。

作为搜索引擎领域的一个重要发展方向，AI搜索具有广阔的市场前景和一定的竞争优势。通过自然语言交互，AI搜索能进行问答式对话，提供智能化、自然化、高效化的搜索体验，以适应用户多样化的信息需求。

图片来源：大模型之家

对此，大模型之家沿用《人工智能大模型产业创新价值研究报告》中提出的“AQUA”评价体系，从模型能力、任务处理能力、应用生态等六个维度对“天工大模型”展开多角度全方位的评测。

模型能力

模型规模：天工大模型拥有双千亿级的参数量，包括千亿级的预训练基座模型和千亿级的RLHF模型。天工大模型不仅包含了130亿参数的Skywork-13B-Base模型和Skywork-13B-Math模型，还包含了千亿参数的Skywork-100B-Base模型和Skywork-100B-Math模型。模型规模的增加可以提高模型的表达能力和泛化能力，使其能够处理更复杂的自然语言任务。

训练数据量：天工大模型使用了近3万亿个多语言高质量数据进行训练，其训练数据集主要来自互联网、图书馆、百科全书、新闻媒体、社交网络等各种渠道，涵盖了中文、英文、德文、俄文等30多种语言。训练数据量的增加可以提高模型的知识覆盖度和语言理解能力，使其能够回答更多的用户问题，甚至是一些跨领域、跨语言、跨文化的问题。天工大模型不仅可以理解用户的输入，还可以根据用户的偏好、情感、兴趣等因素，生成更加个性化和人性化的回复。

训练算力：天工大模型基于中国最大的GPU集群之一进行训练，拥有强大的计算资源和优化技术。训练算力的增加可以提高模型的训练效率和稳定性，使其能够快速迭代和优化。天工大模型使用了腾讯云的超级计算集群，该集群拥有超过10万张NVIDIA V100 GPU3，是全球最大的GPU集群

除此之外，天工大模型还采用了Zero-Infinity等创新的训练方法，可以在256张卡上一天内训练完万亿级别的NLP大模型。这些训练方法可以有效降低模型的内存占用，提高模型的并行度和收敛速度，降低模型的训练成本。

任务处理能力

在任务处理能力测试环节，大模型之家发现，天工大模型在数学测试中会出现在思路、公式等解题方法正确的情况下给出错误的答案的现象。

图片来源：天工大模型

在大模型计算中，算法实现错误并不少见，即使模型的总体思路是正确的，但在具体实现时，也可能出现各种问题。并且，由于计算机实数是用有限位的二进制或十六进制数来表示的，这就会导致精度损失。当进行浮点数的加减乘除运算时，这种精度损失可能累积，从而影响最终的计算结果。大模型在进行数学运算时，特别是涉及到多次迭代或复杂计算时，更容易受到这种精度问题的影响。

图片来源：天工大模型

无论模型有多大、多复杂，它仍然是一个模型，是对现实世界的一个近似。这就意味着，它可能无法处理某些极端情况，或者对某些问题的理解存在局限。在某些情况下，即使模型的公式和思路都是正确的，它也可能因为统计上的原因而得出错误的答案。特别是对于主打AI搜索功能的天工大模型，在回答测试问题后，还给出了相关的搜索链接，甚至根据提示词给出了相应的视频资料。

图片来源：天工大模型

在多轮对话中，对天工大模型给出“这道题你做错了，请重做一遍”的指令后，天工大模型还是为大模型之家给出了正确答案，并且没有省略掉此前的计算过程。可以看出虽然天工大模型可能会出现模型局限或算法实现错误，但通过联系上下文的能力进行自我纠正、学习和适应，在与用户的交互中不断优化答案，并提供更可靠、准确的信息。

值得一提的是，天工大模型还为用户通过“Copilot”功能，据了解该功能基于更先进的大模型打造，帮用户分析最优个性化搜索词，深入分析搜索结果，精炼优质内容，只不过目前该功能对于普通用户每日仅有四次体验功能，并且四次体验仅限于四次问答而非四轮对话。

图片来源：天工大模型

天工大模型是国内首款集成了大模型能力的AI搜索。它在搜索引擎领域中引入了一个新的发展方向，为用户提供了一种全新的搜索方式。这种方式突破了传统搜索的某些局限性，并在AI搜索的发展趋势中起到了一定的引领作用。

泛化能力

在泛化能力上，天工大模型还提供了文档理解功能，通过向天工AI搜索上传文件并提出自己的需求，用户可以得到属于“天工”的理解，目前天工对于文档中存在的图片还不能提供分析。

图片来源：天工大模型

由于文档往往包含复杂的上下文关系，大模型之家发现，天工大模型的回答能够理解文档中的句间关系、段落间的逻辑关系，从而对整篇文档有全面且准确的理解。并且实际应用中，文本可能以各种形式出现，如拼写错误、语法不规范、使用俚语等。大模型经过大量训练后，能适应这些文本变化，准确理解文档内容。

图片来源：天工大模型

在处理文档中的语义抽象概念，比如比喻、隐喻、指代消解等。天工大模型能够理解文档中的深层含义，而不仅仅是表面的文字信息。这种语义抽象能力也是泛化能力的重要体现，因为它要求模型能够在不同的语境中，都能准确地理解文本的深层含义。

应用拓展能力

图片来源：昆仑万维

除AI搜索功能外，昆仑万维在github上发布四款AIGC产品的开源代码：天工巧绘SkyPaint、天工乐府SkyMusic、天工妙笔SkyText、天工智码SkyCode。涵盖了聊天、绘画、文本生成和编程等多个领域。

通过与Stable Diffusion、GPT-3等先进技术的融合与创新为AI领域带来了新的可能性。为天工大模型拓展了应用场景。这种多元化的应用使得天工大模型的实用性更强，能够适应不同用户的需求。

图片来源：网络

特别是文本层面（SkyText），天工大模型还特别强调了中文处理能力，包括中文聊天、问答、翻译和文本生成等。这进一步完善了天工大模型对中文语言的处理能力，使其更好地适应中文用户。

图片来源：大模型之家

随着人工智能技术的不断发展，AI搜索成为了搜索引擎领域的一个重要发展方向。AI搜索通过自然语言交互，能够进行问答式对话，提供智能化、自然化、高效化的搜索体验，以适应用户多样化的信息

商业应用的角度来看，AI搜索为大模型商业化提供了强有力的支持。随着AI技术的不断成熟和应用场景的不断拓展，越来越多的企业开始将AI技术应用于自身的业务中。而天工大模型的出现，为企业提供了更加高效、智能的解决方案，助力企业实现数字化转型和智能化升级。这种商业应用不仅仅局限于某个特定领域，而是可以渗透到各个行业中，推动整个社会的智能化进程。

原创文章，作者：王昊达，如若转载，请注明出处：http://www.damoai.com.cn/archives/1789