百川智能发布新一代大模型,「多模态」能力飞升?

如果说去年的行业主旋律是“家家都有大模型”,那么今年的行业主旋律,似乎已经变成“家家都有大模型应用了”。
事实上,在过去短短几个月时间,我们已经能看到国内外近百家AI大模型涌现市场。通用大模型、行业大模型、垂直大模型,各企业纷纷选择最擅长的赛道起跑,各家互联网厂商争先恐后地发布各种垂类大模型和大模型应用,赋能的产品更是屡见不鲜,个中竞争可谓好不激烈。
5月22日讯,百川智能发布最新一代基座大模型Baichuan 4,并推出成立之后的首款AI助手“百小应”。
图片
(图源:百川)
先说大模型,相较于前代Baichuan 3,迭代后的Baichuan 4在各项能力上均有极大提升,其中通用能力提升超过10%,数学和代码能力分别提升14%和9%,在国内权威大模型评测机构SuperCLUE的评测中,模型能力国内第一。
此外,官方表示,Baichuan 4还具备行业领先的多模态能力,即文本和图像等多种元素对齐、交互的能力,并在各大评测基准上表现优异,领先Gemini Pro、Claude3-sonnet等多模态模型。
图片
(图源:百川)
近段时间,国内外AI巨头都在加紧发力多模态大模型,例如OpenAI的“GPT-4o”,支持文本、音频和图像的任意组合输入;谷歌推出新的多模态AI项目Project Astra,可以为用户解释智能手机拍到的东西;而微软在近日举行的Build大会上也带来了自家的多模态模型Phi-3-vis,用来理解图像中的内容并为用户进行分析。
不难看出,在可以预见的未来,多模态大模型将会成为行业的长期趋势。相较于语言大模型,多模态大模型泛用性更高,不仅降低了应用门槛,还提升了信息交互效率,并将很多人没有接触过的AI概念和人类的视觉、听觉等元素进行高度融合,可以说是将AI能力扩充到更多应用场景中的必经之路。
再说应用,基于全新的Baichuan 4,百川智能推出了成立之后的首款AI应用——智能助手“百小应”
从现场的演示来看,在Baichuan 4的赋能下,“百小应”已经具备了多轮搜索和定向搜索的能力,可以针对用户的问题快速、准确地找到相关的专业信息,结果呈现的效果很简洁,让用户可以快速掌握其中有效的信息点。
图片
(图源:百川)
不仅如此,基于全新大模型的多模态能力,“百小应”还可以读懂你的PDF、word文档,甚至对你上传的照片进行解读,或者将图片作为补充材料,获取更精准的回答,语音交互更是信手拈来。
图片
(图源:百川)
相较于传统的助手,百川智能认为自家推出的“百小川”更像是伙伴。尽管如今受限于模型能力,当下的AI应用还无法完全做到如同人一样,能够使用工具、会思考、有情感等,但至少前途是可期的。
至于B端这边,百川智能针对企业用户推出了全新的MaaS+AaaS服务,旗舰版将全量开放Baichuan 4的各项能力,专业版也包含Baichuan3-Turbo和Baichuan3-Turbo-128K两款模型,效果和定价上对比友商都有一定优势。
重点来了,即日起,百川智能MaaS 的新用户都可以获得1000万免费token,同时本次发布的基于Baichuan 4的Assitants API现已正式开启公测。
感兴趣的用户,可以申请免费试用了。