冲出“包围圈”,阶跃星辰登顶国内多模态理解大模型榜首

图片

说起阶跃星辰,可以说是 AI 六小强中最低调的一个,但最近这家公司在 AI 圈里频频“闹出动静”。

前几天,中文大模型基准测评机构 SuperCLUE 发布了 10 月中文多模态理解测评基准榜,阶跃星辰 Step-1V 在榜单中位列国内多模态大模型技术实力榜首,逼近 OpenAI 的 ChatGPT-4o-lastest,并超越腾讯、阿里云、百度等国内头部厂商。

图片

SuperCLUE 的多模态理解测评基准榜对大模型的八大能力进行了细分评测,Step-1V 在数理逻辑分析、通用场景、常识问答、中文元素理解和推理、粗颗粒度视觉认知几个维度上都表现出了明显的优势,其中细颗粒度视觉认知能力超过了包括 ChatGPT-4o 在内所有国内外参评模型。

图片

“细粒度视觉认知-文本理解” 测试案例:

图片

提示词:「请问图片中的产品保质期是几天?」
Step-1V-8K 答案:图片中的产品保质期是 3 天。
评分:【5 分】

另外,OpenCompass 最新的多模态模型测试榜单显示,阶跃星辰 Step-1.5V 的得分超过 GPT-4o,成为唯一进入前 10 名的国内创业公司,给中国大模型六小强争了口气。

图片

不仅是多模态理解模型,阶跃星辰 Step 系列全家桶中,语言模型也在大杀四方。

在司南 OpenCompass 9 月发布的榜单中,阶跃星辰万亿参数语言大模型 Step-2 ,在国内大模型创业公司发布的同类模型中表现最优。

图片

阶跃星辰的技术实力强劲且全面,旗下 Step 系列通用大模型矩阵,目前覆盖了从千亿参数到万亿参数,从语言到多模态,从理解到生成的全面能力,是名副其实的全家桶。

另外,这家神秘的公司一直保持着高频的输出速度,基本每 100 天就有一次大动静。今年 3 月份,阶跃星辰正式亮相时就一口气发布了三款大模型产品:综合性能超过 GPT-3.5 的千亿参数大模型 Step-1,千亿参数的多模态模型 Step-1V 和国内首款万亿参数模型语言大模型 Step-2 的预览版。这三款产品让阶跃星辰在上半年的“百模大战”中亮相即炸场。今年 7 月的 WAIC 2024 世界人工智能大会上,阶跃星辰又发布了三款 Step 系列通用大模型新品:Step-2 万亿参数语言大模型正式版、Step-1.5V 多模态大模型、Step-1X 图像生成大模型。

现在看来,除了抢占基座大模型的技术领先优势,阶跃星辰开始加速将模型能力往应用层渗透。在上个月召开的云栖大会上,阶跃星辰创始人、CEO 姜大昕透露阶跃星辰旗下智能助手“跃问”全面升级。这款 C 端产品目前已经接入了 Step-2 万亿参数大模型和 Step1.5V 多模态模型。基于这两款模型的能力,跃问还推出了多模态搜索问答功能“拍照问”,用户可以通过图像交互“即拍即问”,解决文字和语音交互中难以准确描述的需求。

除了自研应用,阶跃的 Step 系列模型正在获得越来越多开发者的选用,网红 AI 应用胃之书、国内首款 C 端 AI 电商应用物圆、AI 科研大模型专业社区 ReadPaper、AI心理陪伴应用林间聊愈室、面向胰腺癌肿瘤患者的智能 RAG 平台小胰宝等等都不约而同的选择阶跃星辰的大模型。葬花达人鲁智深在即刻上评论到,阶跃星辰的 API 参数和行为,是目前最遵从 OpenAI 标准的。

前天晚上,小编在群里刷到一款低调上线的小程序,叫歌词爆改机。我已经玩到停不下来了。选择歌曲后输入简单的指令,就可以生成各种模型爆改的歌词和歌曲封面配图。

仔细一看,产品页面上标注了“Powered by 阶跃星辰”,了解后发现,原来这款产品歌词文本和图片生成的功能背后都是阶跃星辰提供的技术支持。

孤勇者版被股市套牢的勇者、可不可以版乙方的无奈、爱如火版早八如火……各种热点、网梗,AI 都信手拈来。我已经玩到停不下来了,感兴趣的读者可以试试,祝我们每天都可以轻松摸鱼。

大家已经玩爆了,快来扫码入群看看他们都有哪些脑洞。

图片