近日,Anthropic宣布其Claude 3系列模型正式推出,并在大语言模型(LLM)的各种认知任务上树立了新的性能标杆。Claude 3系列包含三个子模型,分别为Claude 3 Haiku、Claude 3 Sonnet和 Claude 3 Opus,它们提供不同程度的智能、速度和成本选择,以满足各种人工智能应用的需求。
三款型号模型不同的定位如下:
据官方称,Claude 3系列的旗舰模型Opus在本科水平专家知识(MMLU)、研究生水平专家推理(GPQA)、基础数学(GSM8K)等多个测试中均超越了OpenAI的GPT-4和谷歌的Gemini 1.0 Ultra,并在复杂任务上表现出接近人类水平的理解力和流畅性。
性能测试对比
据了解,Claude 3模型可以支持实时客户聊天、自动完成和数据提取任务,提供近乎即时的响应结果。以Haiku为例,它可以在不到三秒的时间内阅读arXiv上包含图表和图形的信息和数据密集的研究论文(约10k token)。并且三种型号的模型都具有与其他领先模型相当的复杂视觉功能,可以处理各种视觉格式,包括照片、表格、图形和技术图表。
视觉能力对比
上下文方面,Anthropic表示,此次全系列大模型均将提供200k token的上下文窗口(相当于150000个单词),并都能够接受超过100万个token的输入,用户可以输入大量数据集,并要求其以备忘录、信件或故事的形式进行摘要,整体来看其单词处理能力接近ChatGPT的50倍。
据悉,Opus和Sonnet现已可在claude.ai中使用,已有159个国家/地区提供支持,Sonnet可免费体验,Opus需要付费订阅,Haiku则还需要一段时间才会推出。