最近几年,AI的发展可以说是非常迅速。从ChatGPT爆火引爆大模型,到现在Agent、小模型各种遍地开花,AI的发展已经进入下一个方向。这篇文章,我们来看看作者的见解。
模型和应用:保大保小?
01
人工智能虽然发展了好多年,但是真正意义上的众所周知,也不过就是最近2年的事情。从ChatGPT的爆火出圈到现在的随地大小模型,从最初的卷模型到现在的卷应用卷产品。
最近几个月,还有一大把AI公司卷铺盖。
AI号称人类的最后发明,其巨大的潜力和影响已经毋庸置疑,在当前降本增效的大趋势下,全球的科技巨头都在开源节流缩减预算,却在人工智能产业上疯狂投入。
投资:没有仅退款;巨头在AI上宁可错投,也不能错过。
人工智能行业在经历2年跌跌撞撞的狂奔后,现在也开始慢慢认清现实冷静下来了,虽然AI被一致性看好未来的潜力,高预期和高投入与客观现实的冲突已经愈发明显了。
大模型技术的发展进入瓶颈期,突破的难度未知,缺乏爆火的现象级产品,同质化的应用碎了一地;说白了AI能处理的事情,并不是非它不可。
当前,仍在互联网产品的包围圈内。
人工智能也许要经历短暂的挤泡沫阶段,等待底层模型的能力再突破,产品应用的场景冲出包围圈,AI依然是走在时代前列腺的物种。只是这个过程的难度和进度,很难评估。
站在当下看,过去互联网的轨迹清晰可见,将来AI的路也不算一片混沌。
02
想要快速了解一个复杂行业的现状,有个比较简单的方式,聚焦引领行业风向的企业即可。
OpenAI:架在全球热搜榜上的AI玩家。
从OpenAI发布的ChatGPT大模型爆火开始,这家公司任何的风吹草动都会被媒体挂在头条上,无论是底层模型的更新迭代,还是上层应用的创新尝试,甚至与其相关的推文都会被拿来分析和揣测。
ChatGPT从发布一直到更新GPT-4o版本,而用户和对其的评价却从最初的颠覆,到现在的更好用更强大更全面,在年初发布的Sora模型迟迟没有真正搬到台面上,OpenAI这家公司本身也深陷各种内耗的状态。
这里并不是说OpenAI不行了,ChatGPT依然当下使用体验最好的大模型,当技术进入到瓶颈期的时候,前进一点点可能都是巨大的领先,前提是它的内部没有自我雪崩。
最近发布的o1推理模型,更像是给融资加大砝码而已。
对个人来说,没钱的烦恼会有很多,对于企业来说,没钱的话根本没有烦恼。
OpenAI发展到现在,背后关联的投资方,以及拿到的投资额度,是其它AI创业公司远远不能比的,有钱则可以一定程度上解决算力和数据问题,外界对OpenAI最大的质疑,则来自核心创始团队的散场,以及主要员工的不断流失。
OpenAI在资金,算力,人才,数据等方面占尽优势地位,在底层大模型上都处在瓶颈阶段,前进的节奏开始迟缓,这多少会令其它创业公司和投资方有些不自信。
近些年,与AI概念一样火爆的还有个:元宇宙。
在元宇宙概念火爆的那半年,曾经的Facebook直接改名Meta,以此来表达All-IN的态度,之后的走向连抛物线都算不上,最后Meta都拿不出惊艳的产品,其它跟风的项目也都不了了之。
所以看一个行业的风口,重点关注头部的1-2家公司进展,尤其是门槛高的行业。
03
从ChatGPT大模型发布之后,不过两年时间,各种基础或垂直类大模型就已经遍地走了。
但是大模型的能力,却是一言难尽。
底层的基础大模型更侧重通用的能力,训练的参数多自然知道的就多,虽然提供的回答很难给用户眼前一亮的感觉,还偶尔能给人两眼一黑的错觉。垂直类的大模型,在今年已经得到了高度的可行性验证,训练参数偏向垂直的行业领域,生成内容的精确度高,进而形成数据和模型的正向循环。
使用底层大模型,可以快速完成各种行业或者领域的资料整理,输出一个相对完善的框架概览,而垂直类大模型用来提供行业的深度解决方案。
在OpenAI产品系列中,也拆分出GPT-4系列基础模型、o1推理模型、DALL·E绘图模型、sora视频模型。
基础大模型在这两年的迭代中,不管是适用范围还是可用的程度都有明显的提升,通用性在提高成本在逐步下降,垂直类大模型在各自的领域中不断的迭代进化,虽然缺乏通用性但是胜在高精度和高效率。
当下比较共识的看法,是两种模型协同处理任务,至于以后能融合到什么程度,还得看算力和模型结构的迭代优化。
虽然大模型的迭代眼花缭乱,但是真正火起来的应用并不多。
这也是令很多用户和资本困惑的一大原因,媒体上对于大模型的舆论也从热捧慢慢转向质疑,模型的更新速度很快,但是从实际的应用效果上感知又不明显。
OpenAI大热门的sora模型迟迟没有正式公开,快手的可灵视频模型热了一阵,3D类的模型昙花一现,垂直类模型真正被摆上应用端并且大火的并不多,声音比较大的就是宠物类和编程这两个方向。
大模型的迭代进入瓶颈期,同样在应用端也没有大热门的产品,以搜索产品为例,虽然向大模型提问越来越多,但是真正的刁钻问题,或者系统性的实践案例,还是更多来源于搜索引擎的内容。
大模型的能力和传统搜索的最大区别在于,搜索更多从别人的内容中找到自己需要的,而大模型会从问题中推测和找到用户想要的答案。
应用和模型:保大保小?
对于AI创业公司来说,最难的技术层面很难轻易的分出高下,却在价格战和营销战上打的热火朝天,市场都在等一个现象级的应用问世,产品的能力足够颠覆,使用的是哪个基础模型,用户未必真的关心。
04
人工智能近2年发展堪称疯狂,高预期高投入高估值,唯独产生的回报低于预期,这也导致了当下的质疑声和泡沫言论此起彼伏,但是在牌桌上的巨头玩家依然坚定和激进。
此前几年时髦的企业都在说信息化和数字化,而最近两年都在高呼智能化,虽然有点底气不足。
但不可否认的是,AI确实已经从最初的玩具转变到工具形态了。
在互联网这个行业内,AI的使用已经很普遍,尤其是产品和研发的岗位。不论是基础还是垂直类的大模型,都在慢慢的融入到更多的实践场景中,比如知识的搜集整理、3D模型搭建、AI面试官、AI编程和教育等。虽然还做不到完全替代,但是已经证明了可行性,这样就会带来足够的发展动力。
从自身实践的角度来看,还没有一款大模型做到真正的多面手,在工作当中,更多的还是多款大模型的组合使用。
作为身在卷味最冲的杭州,在写汇报文档这个板块,使用最多的是通义大模型,各种周报月报季度总结等绝对是手拿把掐,生成文档之后再借助PPT的AI能力一键生成,堪称反内卷的利器。
对于复杂的文档或者资料的分析整理,使用比较多的是Kimi模型,没有深度对比过和其它大模型的能力差异,但是就处理速度这一块,绝对是体验感拉满了。
互联网热点事件的解读整理,使用是腾讯混元模型的深度研究,可以快速了解事件的前因现状,做到吃瓜吃的全面,也可以快速获取各种深度分析的文章,比如之前的萝卜快跑事件和当下抖音快手的一哥事件等。
绘图和视频生成大模型,在体验过的产品中,快手的可灵模型,OpenAI的DALL·E模型,所呈现的内容都不错,至于sora模型,个人觉得如果它做不到绝对的领先,保持神秘吊着用户的胃口和舆论,也是一种策略。
人工智能狂奔的两年,从最初的文本对话到现在的多模态,从最初的内测申请到现在充斥在各种产品的内部,从最初的通用大模型到现在与垂直大模型协同,从最初的模型端卷到现在的产品应用端。
虽然质疑和声讨不断,但是技术的发展趋势不以个人意志为转移。
05
最后,不得不提的一个灵魂问题,人工智能的发展是否会影响就业?
以史为鉴可以知兴替,几次工业革命带来的阵痛和影响,技术的革新和发展既可以解决矛盾,也会制造新的矛盾。而在这种变化中有两类人容易平稳度过,走到所在领域的头部,这需要一定的天赋;要么放弃对于垂直技能的专注,提升自己技能的广度,快速调整自己适应变化顺应趋势。
有句话很有道理,卷倒我们的不是AI而是用AI的人。
与其在原地焦虑着,不怕事的思维也许能带来更多的机会,AI发展都发展了,还是要习惯才好。
本文由 @半问 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务