国内AI开源领头羊争夺愈发激烈!
近日,阿里云开源了720亿参数的Qwen-72B大模型!
通义千问-72B(Qwen-72B)是阿里云研发的通义千问大模型系列的720亿参数规模的模型。是阿里AI大模型开源全家桶最新成员!
全家桶除此之外,还包含:Qwen-7B、Qwen-14B和视觉大模型Qwen-VL,Audio-Chat等等。现在依然打造了全尺寸和全模态的开源全家桶了!
Qwen-72B是不是最优秀的?
模型性能优异,大多数测评内容超过了meta的Llama2-70B。
在部分中文测评中(C-Eval、CMMLU、Gaokao等),甚至超越了GPT-3.5和GPT-4。
(官方公布的数据,感兴趣的可以自行体验感受下~)
Qwen-72B和LLaMA2-70B的对比,可以看出自然语言理解、数学方面的能力Qwen-72B 在所有任务上都比 LLaMA2-70B 更好高的评分。
Qwen-72B和国内其他的开源AI模型对比,也是显得十分优异。
Qwen-72B实际体验如何?
俗话说,是骡子是马拉出来溜溜!光看介绍还是无法体验实际性能的!我们出几个问题考考!
鸡兔同笼问题回答的很正确!
脑筋急转弯也算正确吧,看起来还是比较理性
大家如果感兴趣,可以自行体验以下。
总结
Qwen-72B是阿里云打造的超大规模语言模型,它具有强大的性能和多功能的能力,可以为用户提供丰富的服务和体验。
Qwen-72B也是一个开放的平台,它已经在Hugging Face和ModelScope上开源,任何人都可以下载和使用。Qwen-72B还支持用户自定义的微调和适配,可以根据用户的需求和场景,定制专属的语言模型。
Qwen-72B的目标是成为一个通用的语言模型,可以处理任何自然语言任务,无论是文本、图片、音频、视频等等。
目前看,阿里通义系列,可以算是国内开源大模型领域最优秀之一。
https://modelscope.cn/models/qwen/Qwen-72B-Chat/files
论文地址:
https://arxiv.org/pdf/2309.16609.pdf
体验地址:
https://modelscope.cn/studios/qwen/Qwen-72B-Chat-Demo/summary
项目地址:
https://mmmu-benchmark.github.io/