据EDN电子技术设计报道,在 1 月 16 日举办的 2024 智谱 AI 技术开放日 Zhipu DevDay 上,智谱 AI 正式发布新一代基座大模型GLM-4。
智谱AI的CEO张鹏介绍,GLM-4 的整体性能相比上一代大幅提升,实现了 60% 的性能全面提升,逼近GPT-4。它可以支持更长的上下文,具备更强的多模态能力,推理速度更快,支持更高的并发,大大降低推理成本。
此外,GLM-4 也增强了智能体能力,智谱 AI 正式上线了GLM-4-All Tools和GLMs个性化智能体定制能力,在产品上持续全面对标 OpenAI。
目前GLM-4已在智谱 AI 开放平台上线。
据张鹏介绍,GLM-4 带来了 128K 上下文窗口长度,单次提示词可处理文本达到 300 页,在总结信息、内容抽取、复杂推理、代码等多个应用场景实现了复杂长文本能力。
智谱 AI 技术团队解决了长上下文全局信息因失焦导致的精度下降问题。在 needle test 大海捞针测试中,在 128K 文本长度内, GLM-4 模型可实现几乎 100% 精度召回。
张鹏表示,GLM-4 性能已经超过 Claude 2.1,直接逼近 GPT 4 。
当天活动现场,智谱AI公布了GLM-4的全面能力测试结果。
据智谱AI现场公布的分数,GLM-4的中文能力以及在编程能力测试(HumanEval)上,超越GPT-4,其它能力接近GPT-4或与GPT-4持平。但是在偏人类常识理解测试的HellaSwag中,表现最弱。
图源:智谱AI
智谱AI还发布了GLM-4 All Tools“全家桶”,对标OpenAI此前发布的GPTs及GPT Store。
GLM-4-All Tools提供了一系列强大的内置工具,让 GLM-4 实现了自主根据用户意图,自动理解、规划复杂指令,自由调用 WebGLM 搜索增强、Code Interpreter 代码解释器和多模态生成能力以完成复杂任务。
同时,GLM-4 通过代码解释器,会自动调用代码解释器进行复杂的方程或者微积分求解。对比 GSM8K、Math 以及Math23K 三个数据集上的结果,GLM-4 All Tools 取得和GPT-4 All Tools相当的效果。GLM-4的All Tools能力完全自动,而且可以处理各种任务,比如包括文件处理、数据分析、图表绘制等复杂任务,支持处理 Excel、PDF、PPT 等格式的文件。
为降低大模型使用门槛,GLMs个性化智能体定制能力也同步上线。用户只要登录智谱清言官方网站,用简单的提示词指令就能创建属于自己的GLM智能体。2023年11月OpenAI推出GPTs以来,智能体已成为当下大模型赛道最热门的落地方向,也被认为是打造大模型行业生态的重要基石。
图源:智谱AI
对标GPTs的GLM智能体有了,GLM Store也即将推出。张鹏表示,GLMs模型应用商店开发者分成计划也将同期发布。
张鹏表示:GLM 系列模型的全家桶能力,终于实现了 All-In-One。
基于比肩 GPT-4 的基座大模型能力,这一功能的上线将为应用、行业模型和商业化落地案例开辟出更加广阔的实践空间。