对话阿里云CTO周靖人:大模型降价不是价格战,现在的价格还不够低

全文2822字,阅读约需9分钟,帮我划重点

划重点

01阿里云智能集团CTO周靖人表示,大模型降价并非价格战,现在的价格仍相对未来庞大的应用来说太贵了。

02阿里云通义千问三款主力模型再度大幅降价,最高降幅85%,百万tokens价格低至0.3元。

03周靖人认为,OpenAI新模型o1具有革命性,指明了一条今天可行的道路,未来模型预训练和推理将大量使用算力。

04为此,阿里云推动社区及行业发展,以激发更多产业级创新,同时提供极致性价比的服务。

05除此之外,阿里云正在围绕AI时代,树立一个AI基础设施的新标准,全面升级技术架构体系。

以上内容由腾讯混元大模型生成,仅供参考

智东西(公众号:zhidxcom)
作者 | ZeR0
编辑 | 漠影
“我们不认为这是价格战。”被问到国内大模型持续降价的趋势时,阿里云智能集团CTO周靖人谈道,“今天的价格不存在说已经足够低了,相对未来庞大的应用来说,还是太贵了。”
他打了个比方:“你今天觉得便宜了,今天上网多少钱一个月?手机上网费,我的手机套餐不到200元,但是今天200元能用几十个G的流量,你能在二十年前想象这个事儿吗?今天的流量,你要是在二十年前估计得用破产。”
2024云栖大会主论坛开幕首日,周靖人代表阿里云公布了通义大模型的一系列年度重磅发布,其中阿里云通义千问三款主力模型再度大幅降价,最高降幅85%,百万tokens价格低至0.3元。(全球开源大模型新王!阿里Qwen2.5来了,性能跨量级超Llama3.1
图片
在会后媒体问答环节,周靖人与阿里云副总裁、公共与客户沟通部的总经理张启就大模型持续降价、开源与闭源路径选择、对OpenAI o1模型的看法、对AI算力趋势的预判等业界关注话题逐一作答。
周靖人认为,OpenAI新模型o1是一个非常具有代表性、革命性的方向,让模型自动分析、策划、试错等,这一系列能力在各种各样场景里都能完成比较鲁棒性的表现,指明了一条今天可行的道路;今后模型预训练和推理都会大量使用算力,也会把这部分通过强化学习方式有效拓展开来。
一、全线降价主要通过技术优化,将红利让渡给企业级用户与开发者
据周靖人分享,通义千问此次全线降价主要是借势规模效应,通过技术的优化、资源的调度,从云基础设施提升到模型优化,都能够将模型推理成本进一步降下来,阿里云希望将这样的技术红利给到企业级用户及开发者,从而带动整个产业的发展。
“今天模型的运用,包括模型各种各样的创新,现在还在早期的阶段。”周靖人谈道,很多新模型的迭代、Agent的使用都会大量并发、被模型调用,如果模型推理很昂贵,开发者难以有效大规模使用,因此阿里云会坚定不移推动社区及行业的发展,以激发更多产业级创新。
这与阿里云做开源的逻辑殊途同归。他补充说,从去年开始,阿里云非常坚定不移地做开源,希望有更多人能够利用开源能力,推动生态发展。同时,针对一些闭源的、企业级的客户,阿里云希望为这些有特殊要求的客户提供一个极致的能力。
“我们把选择权给到企业,同时即使我们开源,我们希望在云平台上提供服务时,也提供极致的性价比。一方面,我们希望生态的发展。另一方面,我们还是希望能更有效服务到企业。”周靖人透露道,阿里云不仅希望通过开源使大家能将模型能力用起来,同时也要降低模型使用的成本,每一次降价是一个非常严肃的过程,会从整个产业的发展及开发者、企业用户的反馈等各方面进行权衡。
张启补充道,国内外大方向都是不断降价,基础设施只有把资费降到足够的低,才有可能未来更好的发展,不能现在简单算一个投资回报率。
他提到一个说法,现在的AI相当于1996年左右的互联网,也就是BBS时代,当时上网资费很贵,后来互联网和移动互联网发展,运营商大兴基建,现在我们也在疯狂地推进AI大基建,把资费降下来,才有可能去谈未来应用的爆发。
“所以这个长远的目标,才是我们考虑更多的事情。而不是说今天一定要算一个账,马上就能够赚多少钱,或者马上又到什么样的一个目标。”张启说。
二、开源模型做到全球第二,获得海内外开发者认可
阿里云一直将大模型生态繁荣作为首要目标,目前其魔搭社区已成为中国最大的模型社区,拥有超过690万个开发者用户,与行业合作伙伴合作贡献了超10000款模型。
周靖人谈道,阿里云是一家以技术为主的公司,在各方面都有前瞻性的一些布局和思考,阿里云的技术体系经过长期演进,通义千问的前身通义系列预训练大模型便是这一波AI浪潮到来前阿里云前瞻性布局的一个代表。
在业务层方面,阿里云从去年开始宣称“要成为AI时代最开放的云”。周靖人说,这是非常具有事实依载的一句话,今天通义模型生态已经发展到全球第二,仅次于美国Llama,开源社区蓬勃发展。
其中“全球第二”来自于Hugging Face全球模型的分析,当前Llama衍生模型数量是全球第一;短短一年内得到全球开发者认可的通义模型排名全球第二,正在高速发展过程中。
通义开源模型累计下载量已经突破4000万,通义原生模型和衍生模型总数超过5万,成为仅次于美国Llama的世界级模型群。
另外在模型能力方面,阿里云最新推出的Qwen2.5系列开源模型,一些具体指标已经超过Llama 3.1 405B。阿里云希望也能够把相关一系列技术创新能力更好让开发者使用起来。
阿里云此次共开源,创大模型开源史上之最。周靖人谈道,阿里云推出不同规格的模型,以便将把更多选择权留给开发者,使开发者可以根据自己的业务场景去做选择。
此外,他补充说像Qwen这样的模型系列受到了海内外广泛开发者的喜爱,认知度非常高,这也有助于阿里云出海业务的开展。
三、算力市场飞速转向AI计算,AI基建升级托载大模型创新
在开幕式年度技术发布环节,周靖人提到云厂商拥有全栈技术储备,并通过基础设施的全面升级,让AI训练、推理、部署和应用整个生命周期变得更高效。
阿里云正在围绕AI时代,树立一个AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。
周靖人在会后接受采访时进一步强调说,模型更新离不开基础设施,AI技术变革是一个系统化的技术变革,如果没有底层的相关能力的支持,今天模型的研发、迭代等方方面面则没有承载的地方,这是一个相辅相成、承上启下的关系。阿里云最新分享的一系列基础设施进展,也在引领行业的发展。
在他看来,“AI的基础设施”中间有很多细微且重要的创新,正是因为这些重要的创新,才让今天大模型的训练与创新变成了可能。
张启补充道,阿里云在云栖大会上的所有发布,都是围绕着“一张遍布全球的理想的AI云计算网络”去打造。
他提到整个算力市场上新增的算力需求中,AI算力需求已经超过了50%。这个速度非常之快,意味着整个算力市场正在飞速的从原来的CPU转向AI计算。
谈及对算力趋势的预测,周靖人认为模型仍在创新、不断迭代,还没有一个固定的范式,所谓算力的分布到底是预训练居多还是推理的居多,或者说中间的比例有什么样的变化,大家都有各种各样的尝试,还没有一个完全的定论。
在他看来,如何有效把算力利用好,仍是整个行业所需要去解决的一个问题。要把好钢用在刀刃上,哪一部分持续去做Scaling Law能够达到更好的return?还是通过强化学习方式,能够进一步提升模型对于人类问题的解答?这些当前都没有定论。他相信每个技术团队都在做各个方面的探索。
结语:技术创新不能闭门造车,需与商业逻辑有机结合
周靖人认为,今天整个AI产业带来的变化是深远的。他非常欢迎创业公司的创新,因为这个时代需要更多优秀人才在各个领域进行探索、突破;科技创新不是只有一条路,希望大家通过各种的渠道、思考,不断推进科技发展浪潮。今天各种各样创业公司已经在基于通义模型生态做创新,阿里云乐意与更多创业公司合作,为他们提供很好的支持。
在他看来,现在企业CTO要保持技术优势,关注前瞻性的技术布局,还要理解整个技术如何被利用好,不能闭门造车,而更多是希望造出来的技术能够有效被市场、被企业客户所用。周靖人说,阿里云在聆听开发者的需求方面做得非常突出,能够容纳大家各种各样的需求,并将大家的反馈作为技术创新重要的输入,这些都是与其整个商业逻辑、技术体系有机的结合,是“双轮驱动”。