广告

国产大模型GLM-4推出,性能直逼GPT-4?

2024-01-17 17:37:51 综合报道 阅读:
据报道,苹果正在为其未来的设备采购QLC(四级单元)NAND闪存,但使用 QLC NAND 技术有几个缺点……

据EDN电子技术设计报道,在 1 月 16 日举办的 2024 智谱 AI 技术开放日 Zhipu DevDay 上,智谱 AI 正式发布新一代基座大模型GLM-4。G7Xednc

G7Xednc

智谱AI的CEO张鹏介绍,GLM-4 的整体性能相比上一代大幅提升,实现了 60% 的性能全面提升,逼近GPT-4。它可以支持更长的上下文,具备更强的多模态能力,推理速度更快,支持更高的并发,大大降低推理成本。G7Xednc

此外,GLM-4 也增强了智能体能力,智谱 AI 正式上线了GLM-4-All Tools和GLMs个性化智能体定制能力,在产品上持续全面对标 OpenAI。G7Xednc

目前GLM-4已在智谱 AI 开放平台上线。G7Xednc

性能逼近GPT-4

据张鹏介绍,GLM-4 带来了 128K 上下文窗口长度,单次提示词可处理文本达到 300 页,在总结信息、内容抽取、复杂推理、代码等多个应用场景实现了复杂长文本能力。G7Xednc

智谱 AI 技术团队解决了长上下文全局信息因失焦导致的精度下降问题。在 needle test 大海捞针测试中,在 128K 文本长度内, GLM-4 模型可实现几乎 100% 精度召回。G7Xednc

G7Xednc

张鹏表示,GLM-4 性能已经超过 Claude 2.1,直接逼近 GPT 4 。G7Xednc

当天活动现场,智谱AI公布了GLM-4的全面能力测试结果。G7Xednc

据智谱AI现场公布的分数,GLM-4的中文能力以及在编程能力测试(HumanEval)上,超越GPT-4,其它能力接近GPT-4或与GPT-4持平。但是在偏人类常识理解测试的HellaSwag中,表现最弱。G7Xednc

G7Xednc

图源:智谱AIG7Xednc

发布了GLM-4 All Tools“全家桶”,对标OpenAI

智谱AI还发布了GLM-4 All Tools“全家桶”,对标OpenAI此前发布的GPTs及GPT Store。G7Xednc

GLM-4-All Tools提供了一系列强大的内置工具,让 GLM-4 实现了自主根据用户意图,自动理解、规划复杂指令,自由调用 WebGLM 搜索增强、Code Interpreter 代码解释器和多模态生成能力以完成复杂任务。G7Xednc

同时,GLM-4 通过代码解释器,会自动调用代码解释器进行复杂的方程或者微积分求解。对比 GSM8K、Math 以及Math23K 三个数据集上的结果,GLM-4 All Tools 取得和GPT-4 All Tools相当的效果。GLM-4的All Tools能力完全自动,而且可以处理各种任务,比如包括文件处理、数据分析、图表绘制等复杂任务,支持处理 Excel、PDF、PPT 等格式的文件。G7Xednc

为降低大模型使用门槛,GLMs个性化智能体定制能力也同步上线。用户只要登录智谱清言官方网站,用简单的提示词指令就能创建属于自己的GLM智能体。2023年11月OpenAI推出GPTs以来,智能体已成为当下大模型赛道最热门的落地方向,也被认为是打造大模型行业生态的重要基石。G7Xednc

图源:智谱AIG7Xednc

对标GPTs的GLM智能体有了,GLM Store也即将推出。张鹏表示,GLMs模型应用商店开发者分成计划也将同期发布。G7Xednc

张鹏表示:GLM 系列模型的全家桶能力,终于实现了 All-In-One。G7Xednc

基于比肩 GPT-4 的基座大模型能力,这一功能的上线将为应用、行业模型和商业化落地案例开辟出更加广阔的实践空间。G7Xednc

责编:Demi
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了