百川智能发布新一代大模型，「多模态」能力飞升？

雷科技

2024-05-22 18:05发布于广东科技领域创作者

如果说去年的行业主旋律是“家家都有大模型”，那么今年的行业主旋律，似乎已经变成“家家都有大模型应用了”。

事实上，在过去短短几个月时间，我们已经能看到国内外近百家AI大模型涌现市场。通用大模型、行业大模型、垂直大模型，各企业纷纷选择最擅长的赛道起跑，各家互联网厂商争先恐后地发布各种垂类大模型和大模型应用，赋能的产品更是屡见不鲜，个中竞争可谓好不激烈。

5月22日讯，百川智能发布最新一代基座大模型Baichuan 4，并推出成立之后的首款AI助手“百小应”。

（图源：百川）

先说大模型，相较于前代Baichuan 3，迭代后的Baichuan 4在各项能力上均有极大提升，其中通用能力提升超过10%，数学和代码能力分别提升14%和9%，在国内权威大模型评测机构SuperCLUE的评测中，模型能力国内第一。

此外，官方表示，Baichuan 4还具备行业领先的多模态能力，即文本和图像等多种元素对齐、交互的能力，并在各大评测基准上表现优异，领先Gemini Pro、Claude3-sonnet等多模态模型。

（图源：百川）

近段时间，国内外AI巨头都在加紧发力多模态大模型，例如OpenAI的“GPT-4o”，支持文本、音频和图像的任意组合输入；谷歌推出新的多模态AI项目Project Astra，可以为用户解释智能手机拍到的东西；而微软在近日举行的Build大会上也带来了自家的多模态模型Phi-3-vis，用来理解图像中的内容并为用户进行分析。

不难看出，在可以预见的未来，多模态大模型将会成为行业的长期趋势。相较于语言大模型，多模态大模型泛用性更高，不仅降低了应用门槛，还提升了信息交互效率，并将很多人没有接触过的AI概念和人类的视觉、听觉等元素进行高度融合，可以说是将AI能力扩充到更多应用场景中的必经之路。

再说应用，基于全新的Baichuan 4，百川智能推出了成立之后的首款AI应用——智能助手“百小应”。

从现场的演示来看，在Baichuan 4的赋能下，“百小应”已经具备了多轮搜索和定向搜索的能力，可以针对用户的问题快速、准确地找到相关的专业信息，结果呈现的效果很简洁，让用户可以快速掌握其中有效的信息点。

（图源：百川）

不仅如此，基于全新大模型的多模态能力，“百小应”还可以读懂你的PDF、word文档，甚至对你上传的照片进行解读，或者将图片作为补充材料，获取更精准的回答，语音交互更是信手拈来。

（图源：百川）

相较于传统的助手，百川智能认为自家推出的“百小川”更像是伙伴。尽管如今受限于模型能力，当下的AI应用还无法完全做到如同人一样，能够使用工具、会思考、有情感等，但至少前途是可期的。

至于B端这边，百川智能针对企业用户推出了全新的MaaS+AaaS服务，旗舰版将全量开放Baichuan 4的各项能力，专业版也包含Baichuan3-Turbo和Baichuan3-Turbo-128K两款模型，效果和定价上对比友商都有一定优势。

重点来了，即日起，百川智能MaaS 的新用户都可以获得1000万免费token，同时本次发布的基于Baichuan 4的Assitants API现已正式开启公测。

感兴趣的用户，可以申请免费试用了。

查看原图 96K