OpenAI劲敌出现!Claude3正式发布,超越GTP-4?

全文1721字,阅读约需5分钟,帮我划重点

划重点

01Anthropic公司发布了最新一代大模型Claude3,距离上一代Claude2仅相隔8个月。

02Claude3具有强大的视觉能力,部分行业行为准则中的表现优于OpenAI的GPT-4和谷歌的Gemini Ultra。

03与GPT-4相比,Claude3 Opus在图片识别上表现更出色,但在准确率上仍有不足。

04Anthropic公司承诺开发值得信赖、安全和透明的模型,并确保模型不会偏向任何特定立场。

05目前,Claude3家族的产品均不能直接链接互联网查询资料,但已开放API版本供用户试用。

以上内容由腾讯混元大模型生成,仅供参考

近日,被视为“OpenAI公司最大劲敌”的Anthropic公司毫无预警地发布了最新一代大模型Claude3,距离上一代Claude2发布,仅仅相隔8个月。根据其官网发布的信息来看,新模型中能力最强的Claude3 Opus已经在部分行业行为准则中的表现优于OpenAI的GPT-4和谷歌的Gemini Ultra,如本科生水平知识(MMLU)、研究生级别专家推理(GPQA)和基础数学(GSM8K)。
图片
什么是Claude3?
北京青年报记者了解到,Claude3是由Anthropic发布的最新的AI大模型系列,同时,Claude3是多模态大模型 ,具有强大的“视觉能力”。Anthropic强调,自己会确认安全措施跟上技术的步伐,引导模型向社会有益的方向发展。关于Claude3,目前得到的测评结果是已经全面超越了GPT-4,算得上是目前最强的语言模型,目前线上可以直接免费使用网页版。官方视频显示Claude在推理、数学、编码、多语言理解以及视觉方面都有新的行业标杆作用。同时专家领域方面的表现也给予很高的评价。该模型一经发出,就引起AI界广泛关注,并进行相应方面的测试,发现,相对于GPT-4,Claude3 Opus在图片识别上会有更多细节表现,但在这准确率上表现仍有不佳。
Claude3有哪些提升点?
在Anthropic官网的描述中,我们了解到Claude3有以下特点:多模态智能的新标准、近乎即时的结果、强大的视觉能力、更少的拒绝以及提高准确性。在与以往的语言模拟软件的对比中,可以得出以下结果:
图片
第一个最大的提升点是长上下文和近乎完美的回忆。Claude3这次发布了三个模型,Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。Claude3至少支持20万(200k)token以上的长上下文,也就是说给它一本书都没有问题。如果是研究还可以申请长达1m的上下文。
第二个特点是超强的分析能力。支持分析照片.图形还有各种复杂的图表,而且它非常的精准,可以在长段的信息中大海捞针一样找到想要的那条最精准的信息Opus大海捞针准确率超过百分之九十九。在官方的测评结果中,它可以只用几分钟的时间就分析出全世界的经济情况,还能够预测美国gdp在下一个十年里可能的范围。而且即使是它最小规模的模型也能够在3秒内读完10万token的论文。
Anthropic公司对于开发值得信赖、安全和透明的模型表示承诺,致力于解决偏见问题,并确保模型不会偏向任何特定的立场。Opus和Sonnet模型已经在Claude API和claude.ai上可用,而Haiku模型即将推出。公司还计划为Claude3家族频繁地推出更新,并引入新功能,以增强企业用例和大规模部署的能力。模型的安全性也是设计的重点之一,Opus模型运行在AI安全等级2上,确保了灾难性风险的可能性极低。
对比GPT-4有哪些新突破?
Claude3 Opus标志着模型能力实质性飞跃,实现了在全方位能力上对GPT-4的超越,使其成为全球唯一能与GPT-4匹敌的模型。特别是在特定领域如数学、逻辑推理、编程方面有位出色。特别是在零样本(zero-shot)设置下,Claude 3 Opus在GSM8k和MATH评测中胜过GPT-4,显示出其强大的能力。(中信证券研究部数据)此外,通过技术上的创新,Claude 3也在多模态视觉方面取得了突破,据Anthropic提供的官方文档显示,在处理科学示意图方面,相比GPT-4V展现出了明显的优势。
图片
此外,Claude 3模型的定价也高于GPT-4。能力最强的Claude 3 Opus比GPT-4 Turbo贵得多:GPT-4 Turbo每百万token输入价格为10美元,输出价格为30美元,Claude 3 Opus每百万token输入5美元,输出75 美元。
图片
目前Claude 3 Haiku 尚未推送,Sonnet已经开放在Claude的官网上可以免费试用,Opus也已经上线,不过要体验Opus需要花每月20美元(不含税)去订阅Claude Pro。相对于ChatGPT,目前Claude的全系产品均不能直接链接互联网查询资料。Claude API 现已在159 个国家/地区广泛使用。同时在Claude3上线时,直接开放了API版本,直接可以通过申请API版本,从而去申请试用版本。绑定手机号之后,还给你5美元的TOKEN额度。
【版权声明】本文著作权(含信息网络传播权)归属北京青年报社所有,未经授权不得转载
文/北京青年报记者 温婧  实习生 周嘉怡
编辑/樊宏伟