客户端
游戏
无障碍

0

评论

收藏

分享

手机看

微信扫一扫,随时随地看

对标Llama2 70B!部分测评超越ChatGPT!国内开源免费大模型领域迎来重磅更新:Qwen-72B

国内AI开源领头羊争夺愈发激烈!

近日,阿里云开源了720亿参数的Qwen-72B大模型!

图片

通义千问-72B(Qwen-72B)是阿里云研发的通义千问大模型系列的720亿参数规模的模型。是阿里AI大模型开源全家桶最新成员!

全家桶除此之外,还包含:Qwen-7B、Qwen-14B和视觉大模型Qwen-VL,Audio-Chat等等。现在依然打造了全尺寸和全模态的开源全家桶了!

图片

Qwen-72B是不是最优秀的?

模型性能优异,大多数测评内容超过了meta的Llama2-70B。

在部分中文测评中(C-Eval、CMMLU、Gaokao等),甚至超越了GPT-3.5和GPT-4。

(官方公布的数据,感兴趣的可以自行体验感受下~)

图片

Qwen-72B和LLaMA2-70B的对比,可以看出自然语言理解、数学方面的能力Qwen-72B 在所有任务上都比 LLaMA2-70B 更好高的评分。

Qwen-72B和国内其他的开源AI模型对比,也是显得十分优异。

图片

Qwen-72B实际体验如何?

俗话说,是骡子是马拉出来溜溜!光看介绍还是无法体验实际性能的!我们出几个问题考考!

图片

鸡兔同笼问题回答的很正确!

图片

脑筋急转弯也算正确吧,看起来还是比较理性

大家如果感兴趣,可以自行体验以下。

总结

Qwen-72B是阿里云打造的超大规模语言模型,它具有强大的性能和多功能的能力,可以为用户提供丰富的服务和体验。

Qwen-72B也是一个开放的平台,它已经在Hugging Face和ModelScope上开源,任何人都可以下载和使用。Qwen-72B还支持用户自定义的微调和适配,可以根据用户的需求和场景,定制专属的语言模型。

Qwen-72B的目标是成为一个通用的语言模型,可以处理任何自然语言任务,无论是文本、图片、音频、视频等等。

目前看,阿里通义系列,可以算是国内开源大模型领域最优秀之一。

模型地址:

https://modelscope.cn/models/qwen/Qwen-72B-Chat/files

论文地址:

https://arxiv.org/pdf/2309.16609.pdf

体验地址:

https://modelscope.cn/studios/qwen/Qwen-72B-Chat-Demo/summary

项目地址:

https://mmmu-benchmark.github.io/

免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部