对标Llama2 70B！部分测评超越ChatGPT！国内开源免费大模型领域迎来重磅更新：Qwen-72B

AI变革指南

2023-12-02 17:15发布于辽宁

+关注

国内AI开源领头羊争夺愈发激烈！

近日，阿里云开源了720亿参数的Qwen-72B大模型！

通义千问-72B（Qwen-72B）是阿里云研发的通义千问大模型系列的720亿参数规模的模型。是阿里AI大模型开源全家桶最新成员！

全家桶除此之外，还包含：Qwen-7B、Qwen-14B和视觉大模型Qwen-VL，Audio-Chat等等。现在依然打造了全尺寸和全模态的开源全家桶了！

Qwen-72B是不是最优秀的？

模型性能优异，大多数测评内容超过了meta的Llama2-70B。

在部分中文测评中(C-Eval、CMMLU、Gaokao等)，甚至超越了GPT-3.5和GPT-4。

（官方公布的数据，感兴趣的可以自行体验感受下~）

Qwen-72B和LLaMA2-70B的对比，可以看出自然语言理解、数学方面的能力Qwen-72B 在所有任务上都比 LLaMA2-70B 更好高的评分。

Qwen-72B和国内其他的开源AI模型对比，也是显得十分优异。

Qwen-72B实际体验如何？

俗话说，是骡子是马拉出来溜溜！光看介绍还是无法体验实际性能的！我们出几个问题考考！

鸡兔同笼问题回答的很正确！

脑筋急转弯也算正确吧，看起来还是比较理性

大家如果感兴趣，可以自行体验以下。

总结

Qwen-72B是阿里云打造的超大规模语言模型，它具有强大的性能和多功能的能力，可以为用户提供丰富的服务和体验。

Qwen-72B也是一个开放的平台，它已经在Hugging Face和ModelScope上开源，任何人都可以下载和使用。Qwen-72B还支持用户自定义的微调和适配，可以根据用户的需求和场景，定制专属的语言模型。

Qwen-72B的目标是成为一个通用的语言模型，可以处理任何自然语言任务，无论是文本、图片、音频、视频等等。

目前看，阿里通义系列，可以算是国内开源大模型领域最优秀之一。

模型地址：

https://modelscope.cn/models/qwen/Qwen-72B-Chat/files

论文地址：

https://arxiv.org/pdf/2309.16609.pdf

体验地址：

https://modelscope.cn/studios/qwen/Qwen-72B-Chat-Demo/summary

项目地址：

https://mmmu-benchmark.github.io/

查看原图 106K

免责声明：本内容来自腾讯平台创作者，不代表腾讯新闻或腾讯网的观点和立场。