李彦宏给出“卷”大模型应用的三个姿势

图片
李彦宏提到,大模型和生成式AI将彻底改变开发者群体
文 | 施然
2023年是百度在AI大模型狂奔的一年,根据2023年财报各项数据,百度也是国内最先享受到新一代AI技术带来商业红利的公司之一。今年,这家公司的新重点是大模型开发生态的建设。2024年4月16日,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上提到了一个新说法:“只要会说话,你就可以成为一名开发者”。
开发者也好,程序员也罢,这个职业多多少少存在普通人很难一蹴而就的专业门槛。大模型的一个核心功能是生成代码,过去一年多时间里,关于“大模型是否会取代程序员”的讨论一直没有停歇。目前的进展来看,对于大部分不懂代码的人来说,用大模型开发应用依然有门槛。这是行业的新痛点,也是百度的新机会。李彦宏认为,这样的门槛应该被进一步削低。
至于如何削低门槛,百度的方式是在这次大会上发布三个AI开发工具,智能体开发工具(AgentBuilder),AI原生应用开发工具(AppBuilder)和模型定制工具(ModelBuilder),希望能进一步削低应用开发门槛,最终实现“人人都是开发者”目标。
这三个工具适用于不同类型的开发者。
AgentBuilder是三个工具套件中门槛最低的套件。它可以实现“一句话开发”,无论是专业的企业开发者,或是不懂代码的个人,都可以用一句话建立自己的智能体。例如,家长输入“创建一个小学数学老师”,就可以生成一个用于辅导小孩功课的智能体。智能体相当于大模型中的应用插件,可以同时生成多个,并协同工作。   
AppBuilder同样不需要开发者有专业代码能力,使用自然语言就可以开发应用。开发者可以通过给应用起名、填写应用功能、插入工具组件,三个步骤就可以生成一款应用。
ModelBuilder则更适合于专业开发者,主要用于根据不同需求定制不同尺寸的模型,并根据细分场景对模型进行精调。百度在其中预置了多种大模型,包括百度自研的文心3.5和文心4.0和多个轻量级大模型,以及国内外第三方的主流大模型,共计77个。今天,调用大模型的成本依然高昂,在不同流程中使用大小不同尺寸模型搭配,可以帮助开发者控制成本。
百度于2023年3月推出文心一言大模型,百度的最新数据显示,文心一言用户数量目前已经超过2亿,API(应用程序接口)日均调用量超过2亿次,服务客户约8.5万。这意味着中国每100个人里,有14个人在使用文心一言。用户量的稳定上升,支撑了API调用和客户数据的提升。
一年多时间过去,中国大模型产业目前已经从“卷参数”进入到实际应用阶段,多位接受我们访谈的专业人士的一个共同观点是,大模型产业目前处于“行业内很热,行业外感知不明显”阶段,打破这堵墙的力量很简单——要么有用,要么有很多有趣应用。
李彦宏多次在公开场合强调,大模型本身不直接创造价值,真正的机会在于应用。
先踩坑,再推墙
事实上,互联网程序应用开发门槛在过去十几年间一直在降低,新技术层出不穷,让“应用开发”这件事越来越大众化。但目前的技术发展依然没有实现“零代码”开发,大模型是一个新的技术契机,机器可以把人类语言转化成代码,自然语言和机器语言之间的壁垒被打破。
即便如此,对于大部分人来说,要在大模型环境里去开发一个程序,还是存在挑战。除了不知从何下手,还有成本问题,成本一旦投入,最后效果如果不能稳定达到预期,会劝退一大波人。
基于这样的背景,百度的判断是,要做到人人都能成为大模型应用开发者,需要做到两点:“把门槛降到最低”是其中之一,仅是简单还不够,还需要有质量,同时做到个性化。在传统的应用开发工作过程中,开发者主要的精力是在收集和研究用户反馈,再基于用户诉求不断做应用优化和调试。未来,这些能力都可以通过大模型自动完成。
举个例子,农民想要用大模型来帮助自己种地,他可以创建一个小助手来制定计划、使用农药,如果发现农作物出了问题,还可以拍照发给小助手来解决。同时,他可以定制小助手的声音和形象。这个种地小助手也可以被更多人使用,这个过程中,底座大模型会通过每一次的交互自主调优,让小助手变得越来越专业。   
这看起来更像是一个“订制数字人”的过程,但实际内核是完成了一次“应用开发”。
专业开发者面对大模型的实际问题并非像外界担心的“人随时被机器替代”。更多专业开发者意识到大模型的潜力,实际难题是不确定要怎么去把大模型技术和业务场景结合起来;或是缺乏高质量数据、算力资源等,很难畅快下手;还有一些专业开发者已经使用大模型,痛点是调用成本太高,觉得不划算。
大模型需要“祛魅”。一个误解是,大模型是暴力美学的产物,算力越强越好,模型越大越好。但实际业务场景中专业人士会发现,多数时候并不需要特别强的大模型来解决问题,考虑到实际需要的效果和成本的平衡,在一些环节用轻量版模型,成本能大幅减少,例如文心Tiny版的价格是文心4.0版本的百分之一。
百度深知其中利害,在这次演讲中,李彦宏提到,基于大模型开发AI原生应用的具体思路和工具的开发,是百度根据过去一年的实践“踩了无数的坑,交了高昂学费”换来的。套件的具体应用场景遵循上述逻辑。
AI原生应用开发的具体思路包含三个要点。
一是MoE。李彦宏称,未来大型AI原生应用基本都将基于MoE架构。需要强调的是,MoE不是通常意义上的学术概念,更准确地说,是大小模型的混用,不依赖一个模型来解决所有问题。什么时候调用小模型、什么时候调用大模型、什么时候不调用模型,需要针对应用的不同场景做匹配。
其二是小模型。相对于大家看起来“不明觉厉”的大模型,小模型推理成本低,响应速度快,在一些特定场景中,经过SFT精调(在一个已经训练好的模型基础上,通过进一步训练模型的一部分参数,以适应新的任务或数据集)后的小模型,使用效果可以媲美大模型。百度此前发布Speed,Lite、Tiny三个轻量模型就是基于这个逻辑。
关于小模型,李彦宏认为其有独特价值——通过大模型,压缩蒸馏出来一个基础模型,然后再用数据去训练,这比从头开始训小模型,效果要好很多,比基于开源模型训出来的模型效果更好,速度更快,成本更低。
第三是智能体。智能体,顾名思义,具有智能的实体,英文名是Agent。以云为基础,以AI为核心,构建一个立体感知、全域协同、精准判断、持续进化、开放的智能系统。智能体能力提升会不断催生出大量新应用。智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。
智能体还有一个特点,在一些复杂系统中,可以让不同智能体互动,相互协作,更高质量地完成任务,这就好比一个无人机群,可以完成一架无人机难以完成的工作。李彦宏称,百度已经开发出上述智能体能力,并且向开发者全面开放。
新工具,新用法
前文提到的智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder三种不同的工具,是在MoE、小模型、智能体这三个方向上开发提炼出来的。
图片
AgentBuilder在三大开发工具中门槛最低,被定义为“零门槛智能体开发工具”。
索菲亚是一个专注全屋定制的家居品牌。家居行业十分注重消费者的线下体验,索菲亚和百度的合作中有一个诉求——希望能打造出一个线上金牌销售,还原线下接待体验。
这个小任务基于零门槛的AgentBuilder开发工具完成。索菲亚选择了数字人作为展示方式,然后给数字人选取了合适的背景和声音,并且结合平台的智能解析能力,自动总结了一套销售话术。最终打造出一位温柔亲切、话术专业的金牌销售,她能24小时满足用户的各种需求,提供高水准的服务体验。
当百度搜索用户有装修诉求时,索菲亚智能体会利用文心大模型的能力,优先给出问题的答案。除此之外,她还会主动与客户确认具体需求,如装修类型、预算等,并推荐附近的线下门店。
索菲亚给出的一个数据显示,商家智能体上线以来,“有效线索成本”下降了30%。也就是说,它获得一个有效客户是70元,过去需要100元。
这种方式简巧有效。李彦宏称,目前已有超过1万个百度的客户拥有了商家智能体,涵盖了教育培训、房产家居、机械设备、商务服务等超过30个行业。
今年初,百度在开发者群体里组织了一期AI原生应用开发挑战赛,赛题是利用另一套开发工具AppBuilder打造一款“游乐场排队规划助手”,帮助游客更好地了解游乐场排队情况,设计个性化的游玩路线,在有限时间内获得最好的游玩体验。   
AppBuilder是一款门槛较低的AI原生应用开发工具,原因是百度在AppBuilder内提前封装和预置了开发AI原生应用所需的各种组件和框架,大幅降低开发门槛。李彦宏称,最快只需三步,开发者就可以用自然语言开发出一个AI原生应用,并且能够便捷地发布、集成到各种各样的业务环境中。
那期比赛的冠军选手用的就是AppBuilder。没写一行代码就开发出了应用,拿到了百度的10万元奖金。
赛题假定了环球影城各个项目的排队时间和刺激指数,在有限的时间内获得刺激指数最高的体验,是赛题要解决的问题。李彦宏评价,如果会写代码,这个赛题很简单,但一行代码都不写,就考验工具的聪明度了。
当期冠军用了三步拿到了奖金。
第一步,打开AppBuilder的开发界面,给应用起名“游乐场排队助手”。
第二步,在角色指令中描述具体要求,包括调用代码解释器、算出在固定时间内的最佳组合、输出结果等。
第三步就是到工具组件中,把代码解释器添加进来,帮助运算。
李彦宏强调,和年初相比,AppBuilder现在又进化了,在创建的过程中,全部可以通过“AI优化配置”功能,自动帮助开发者优化角色指令、组件配置等环节,进一步提高开发效率。
百度此次发布的第三套开发套件ModelBuilder,更适合专业开发者使用它可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调SFT。开发者用好这柄剑的核心是掌握模型精调方法。
一家教育培训机构利用ModelBuilder来批改作文。作文批改有明确的评分标准,但不同年级对作文的要求和打分标准不同。让机器来批量批改作文,前提是模型精调。
第一步:创建数据集。模型精调的效果很大程度依赖我们的数据质量。在这个案例中,原始数据只有180条,质量也不够高。我们就需要用到三个功能:数据清洗、数据标注和数据增强。数据清洗,可以快速去除数据的空缺、乱码等问题。数据标注方面,我们对作文增加了更多维度,比如内容深度、写作手法等评价。数据增强功能,可以生成同类但不重复的数据,进行数据扩充。扩充后,ModelBuilder生成了920条高质量数据。
第二步:精调模型。选择一个进行精调的基础模型,根据平台推荐值来配置参数,这次数据接近1000条,按照推荐的迭代轮次,配置为10轮,然后进入模型训练阶段。
第三步:把模型部署在平台上,精调过程完成。   
李彦宏在现场演示了一篇题为《期待长大》的中学生作文批改情况。现场展示了两个模型及一位老师点评,三者对比的情况。精调后的大模型拥有了更加接近专业的老师点评思维,更好地做了格式遵循。不同的是,借助大模型,几秒钟就可以快速完成一篇作文的批改,大大提升反馈速度和效率。
李彦宏称,这类精调后的模型,目前已经在多个教育行业的头部企业中应用。
一个新消息是,百度已经把ModelBuilder应用于百度小度中,当用户提问时,对于简单的问题,比如天气、新闻等,小度会调用小模型,对于更复杂的问题,比如日程安排,就会调用性能更好的大模型。李彦宏提到,相比全部使用大模型,大小模型组合能够让响应速度提升2倍,成本下降99%。
另外,针对具体的业务场景,ModelBuilder提供模型精调样板间,开发者可以跟着样板间一步步来完成,就能得到一个专业模型。在这个过程中,可以直接使用平台上的数据集,来完成模型创建。
应用开发门槛降低后,会有一个新问题出现,那就是原创模型保护以及数据安全。百度的解决方案是,开发者在开发模型时,可以选择不把数据提供给任何一方,包括大模型平台在内,也就是说,数据是完全在私域中的;百度也会加大人力投入,加强应用的审核与治理工作。
要卷出“更惊艳”的应用
对于开发者来说,应用开发只是第一步,更难的是应用的分发、运营和商业化。两位不同平台的开发者告诉我们,开发应用不难,难的是开发一个能赚钱的应用。
赚钱的第一步是触达用户。以AgentBuilder为例,用户开发的智能体可以直接上传到百度搜索中的Agent广场,另外,百度生态的其他产品,如小度、地图、贴吧等,都能接入智能体。
李彦宏认为,有分发,就会有数据反馈,这样智能体就能自主迭代,越用越聪明。
留学教育机构启德教育,通过简单的设置做出一个具备基本能力的智能体,可以解答用户的一些留学相关的基本问题。再通过调优,比如添加更多专业数据,把不在经营范围内的国家过滤掉,加入预约到店服务等,智能体就从简单的问答功能发展成具备转化率功能的业务工具。
数据显示,启德教育智能体上线第一周,就分发了155万次,与用户交互5.8万次,这组数据的背后,启德教育看重的是有效线索转化量直线增长、转化成本明显降低。
今年3月,李彦宏接受媒体采访时提到,2023年他一直在思考大模型究竟能产生多少实际价值,“什么时候我们能做出上亿用户都在使用的应用,才是大模型真正的价值体现。”
去年3月,百度发布文心一言时,李彦宏就表示,大模型的机会既不是基础服务,也不是行业服务,而是应用。2023年10月的百度世界大会上,百度发布了文心4.0,但李彦宏并未强调新版模型的能力,而是展示了百度用大模型重构的应用,比如百度文库、百度地图等,他当时提到,“希望能激发大家做出更惊艳的AI原生应用。”    
2023年12月,李彦宏再次表示,大模型的进展对于大多数人来说不是机会,应该去“卷应用”。
只有更多人参与到应用开发中,才更有可能诞生超级应用。百度也一直在持续控制大模型的推理、训练成本。李彦宏介绍,过去一年,文心大模型算法训练效率提升了5.1倍,推理性能提升了105倍,推理成本降到原来的1%。百度希望让更多人可以高效、低价地用大模型来做AI应用。
李彦宏认为,AI原生应用不是简单的重复移动互联网时代的App,或是PC时代的软件,而是要能解决过去解决不了、或是解决不好的问题。
机器诞生初期,人机交互时,必须使用机器语言,口令、代码等,门槛很高。进入PC和移动互联网时代,交互变成了点击菜单、图形用户界面(GUI),操作简单了很多,但随着机器的功能越来越强大,各类菜单栏越来越多,系统也越来越复杂。大模型时代,人机交互有了革命性变化,只需要通过自然语言就能解决问题。比如公司想查一下2024年4月各个产品线的毛利率情况,有哪些超过了疫情前的水平,过去可能需要几个小时来调取数据横向对比,现在只需要一秒钟,机器就能生成表格。
目前已经有不少开发者通过大模型开发新的应用,他们大多是本身就有技术能力的开发者,已经有一定的“肌肉记忆”,更多时候还是延续着移动互联网时代的应用开发路径。当技术不再是开发门槛,就会有更多想象力和创造力可以落地到应用中。