OpenAI的劲敌发了一款新模型,Claude 3.5 Sonnet多模态能力超过GPT-4o
OpenAI的劲敌发了一款新模型,Claude 3.5 Sonnet多模态能力超过GPT-4o
界面新闻记者 | 伍洋宇界面新闻编纂 | 刘方远 在GPT-4o炸场一个月后,OpenAI最年夜的竞争敌手Anthropic放出了一款很有竞争力的新模子。 北京时候6月21日,Anthropic正式发布Claude 3.5 Sonnet,这是其Claude系列的最新AI模子。从Anthropic流露的信息来看,在浏览、编码、数学和视觉等几个首要AI基准测试中,新模子能力不但跨越了Claude 3 Sonnet,还超出了Anthropic此前最强版本的旗舰模子Claude 3 Opus。 依照老例,Anthropic也释出了一系列与行业竞争敌手的测试成果榜单,使人注视的是,Claude 3.5 Sonnet的年夜部门成就优于OpenAI、Google、Meta的旗舰模子,此中天然也包罗刚推出不久还处于风口的GPT-4o。 注意来看,Claude 3.5 Sonnet在研究生程度推理 (GPQA)、编码能力 (HumanEval) 、文本推理(DROP)等方面的成就均好过GPT-4o,但在数学问题解决能力上稍逊于后者。 Claude 3.5 Sonnet强调了本身在创意写作方面的凸起表示,公司暗示它可以或许更好理解prompt(指令)之间的细微不同和有更强的诙谐能力。 而作为一款多模态年夜模子,Claude 3.5 Sonnet与GPT-4o比拟,未将重点放在及时音频交互能力上,而是临时侧重凸起了图象处置能力的晋升。 Claude 3.5 Sonnet在年夜大都视觉基准测试中比Claude 3 Opus平均表示超出跨越10%。公司称,Claude 3.5 Sonnet可以更正确地注释图表和图形,在带有扭曲和视觉伪像的这类“不完善”图象中,它也能顺遂完成文本转录使命。 据TechCrunch报导,Anthropic的产物主管Michael Gerstenhaber暗示,这些手艺改良的来历是架构调剂和新练习数据(包罗人工智能生成的数据),但他并未流露具体数据内容。 机能提高、本钱下降的纪律也表现在这款最新模子上。按照公司分享的信息,Claude 3.5 Sonnet比Opus速度更快(以聊天机械人为例其速度年夜约是Opus的两倍),但价钱仅为后者的五分之一。 在订价上,该模子的输入价钱为3美元/百万Tokens,输出价钱为15美元/百万Tokens,上下文窗口长度达200K Tokens。 除年夜模子产物,Anthropic此次还推出了一款利用产物Artifacts预览版。这是一个可供用户添加和编纂其模子生成内容的工作空间,例如用其生成的代码、文档、图象、网站设计等内容建立作品。 这款产物会在Claude的web客户端设置一个专用窗口,产物形态近似于将年夜模子接入工作流。Anthropic暗示,Artifacts后续还可能会与其他团队合作以接入新功能。 另外,Anthropic流露,公司将在本年晚些时辰陆续更新其余两款年夜模子Claude 3.5 Haiku和Claude 3.5 Opus。 作为Anthropic背后的科技巨子,亚马逊云科技也随即公布,Claude 3.5 Sonnet已正式接入其Amazon Bedrock。