解码讯飞大模型战略:基本盘打井,增量盘开渠

图片
本图由讯飞星火生成
科大讯飞作为最早将大模型落地的企业之一,讯飞星火也受到多领域头部企业的青睐。而在深挖“基本盘”的同时,讯飞星火也在开拓新兴的“增量盘”。
文|赵艳秋 徐鑫
编|石兆
从去年11月开始,大模型落地开始提速,这超出很多人的意料。第一波在大模型应用上赚到钱的人已出现。业界都在加班加点做研发、抢落地,等待C端和BG端杀手级应用的出现。
大模型企业间的竞争也白热化,开源、降价、上新、头部项目争夺,过去一段时间,大模型市场异常热闹。6月9日,在科大讯飞成立25周年活动上,董事长刘庆峰发表了《顶天立地 星火燎原》内部讲话,提出“语音领域几乎所有应用,都值得用新方式重构一遍”,引发业界关注。今年,OpenAI推出GPT-4o,并与苹果展开落地。大模型与语音技术的融合,正带来巨大的战略和产业机遇。
各家大模型企业已开足马力,在各大市场全力出击。科大讯飞是其中最早将大模型落地的企业之一。刘庆峰说,讯飞星火正在成为多领域头部企业的首选。这得益于它的“基本盘”“增量盘”。其中,基本盘是在已聚焦一二十年的行业赛道上“深挖井”,快速形成技术商业闭环;增量盘则是拓展战略新兴市场“开新渠”,盘活整片“水域”。
这一舞台的机会千载难逢,但科大讯飞也面临许多同行所没有的挑战,一面在正面战场上拼命打仗,一面还要在后台同步磨砺武器,再往前跑。刘庆峰坦言,科大讯飞当下正经历创业以来比较艰辛的挑战,也是最扣人心弦、最激动人心的历史时刻
01
正面战场拼杀,后台同步磨砺武器
在内部讲话中,刘庆峰提到当下业界正在迎来语音和大模型的全新战略机遇。
今年5月,OpenAI发布的GPT-4o,自然的语音交互、实时的视觉理解、语音播报语言能够包含“呼吸声”,迅速引起了业界的巨大关注。就在6月11日,GPT-4o 入驻苹果生态,联手苹果这家世界级产品公司,开始探索大模型的端侧应用。
很多人将GPT-4o称为“AI语音助手”,但作为以语音人工智能技术起家、又承建了认知智能全国重点实验室和语音及语言信息处理国家工程研究中心的科大讯飞,认为本质上这是大模型时代下,语音技术一次重大的、推动万物互联和人机交互场景重构的巨大产业机会,这让他们感到了兴奋、压力与紧迫性。
刘庆峰谈及GPT-4o的重大革新,他说OpenAI每一次更新,都离不开底座大模型的智慧升级,同时OpenAI把工程化上做得更加透彻——这些工程化技术主要包括三方面,其中超拟人合成,实现真的像人一样自由对话;全双工交互,使得人机对话可随时打断和继续;而语音从输入到输出的端到端建模,实现了极快的响应速度。这些让GPT-4o达到了惊艳的效果。
“在这个背景下,语音领域几乎所有应用,都值得用新方式重构一遍。”刘庆峰说。
据悉,公司在上半年为此已召开两次专题会。各类机器人、企业各类岗位的数字员工、汽车以及手机等终端的智能语音服务,都能通过语音交互能力的提升,来进行重构,产业空间巨大。
科大讯飞要抓住这个全新战略机遇,刘庆峰提到了几个比较优势。
其一是大模型底座能力,在底座大模型上,讯飞始终持有对标国际一流和长期投入的决心。他称,这是科大讯飞下半年和未来5年工作的核心抓手,即使热点不断分层,也要在星火底座上坚定不移地、踏踏实实地去干。从认知智能全国重点实验室牵头、中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同参与设计的通用认知大模型评测体系看,今年5月底升级的讯飞星火V3.5 Max,已在多个能力上超过GPT-4 Turbo 0429的最新版本,在国内可测的大模型中处于领先地位,尤其是在文本生成(特别是英文)、逻辑推理、数学和代码能力上领先优势显著。6月27日,科大讯飞将推出讯飞星火V4.0,并展示最新的端到端落地成果。
其二,作为国内第一个基于全国产算力平台训练的大模型,完全自主可控的讯飞星火也承担了国家发改委、工信部、科技部和中科院的多项国家战略任务,并开始在各行业赛道上快速推进。
图片
其三是行业龙头客户的招标选择。刘庆峰提到最近在央国企市场,国家能源集团经过招投标,最终选择了科大讯飞;中石油也选择与科大讯飞共建昆仑大模型。“这些都是客户的慎重选择、各家PK的结果,代表着讯飞星火真正的硬实力。”
科大讯飞也首次提出,大模型能力可达的程度是分台阶的,可以分三个层次(见下图)。业界可以参考这三个台阶,来考虑大模型的落地实践。
图片
2022年,科大讯飞被美国极限施压,要做国产化替代。刘庆峰称,“国产化替代的工作无比艰辛”,既要做相关技术产品的适配,还要跟硬件厂商一起发现bug、做无数次的实验,还要面对非常大的不确定性,比同行们要付出多几倍的努力。
经过不懈的努力,去年10月,科大讯飞和华为共同推出中国首个万卡的国产算力平台——“飞星一号”,并在3个多月后推出了部分赶超GPT-4的讯飞星火V3.5,验证了“飞星一号”的可靠性。
“我们一方面要做国产化替代,一方面还要在通用人工智能领域,全力以赴抢抓机遇。”他形容这个过程是,一面在正面战场上拼命打仗,一面还要在后台同步磨砺武器,帮助国产平台改进算法,去造下一个“武器”平台。
“在中国人工智能最核心、最中坚的力量中,只有我们在经历这样一个过程。”刘庆峰说。
02
基本盘,聚焦主赛道“深挖井”
科大讯飞是最早将大模型落地的人工智能企业,这得益于它在一些垂直行业市场上一二十年的积累。从去年初开始,基于通用星火大模型底座,科大讯飞聚焦在教育、医疗、汽车等多个行业赛道,打造了“N”个行业专用模型,便于在垂直行业落地。
刘庆峰表示,用大模型加速赋能科大讯飞现有业务,是大模型时代,科大讯飞5大核心战略组成里的第一部分。他专门提到,要赋能现有的软硬件和行业产品,形成科大讯飞的基本盘。
图片
教育、医疗等行业市场,科大讯飞投入已久,属于主赛道、主场景。出于落地的纵深考虑,科大讯飞去年就分别成立了专职行业大模型团队,加速将行业大模型落地。
讯飞智慧教育大模型产品部副总经理韩萌介绍,教育场景的规模化应用,一定要确保技术安全可靠、内容准确适切、使用科学有效。这就要求在通用大模型底座的基础上针对不同的应用场景进行专门的调优和处理。
过去一年,科大讯飞教育大模型团队,一边训练优化自主可控的教育大模型底座,一边开发响应刚需应用场景,做了大量工作,落地进展很快。
星火教育大模型能结合教师需求生成符合新课标要求的教学设计和课件,全面激发“三新”改革背景下教师的备授课活力。截至2024年4月,已服务近万名教师,课件制作效率提升64.18%,教师好评率93%。
集成了大模型能力的“星火智慧黑板”,让黑板从板书工具跃迁为教师AI助手。在今年第83届中国教育装备展上,科大讯飞的黑板被围得水泄不通。“星火智慧黑板”搭载“虚拟教师”实时开展英语情景对话评测、学生科普知识问答,提升了学生提问能力和课堂积极性。“以前是师生互动,现在是师机生共育。”
图片
星火教育大模型赋能AI学习机,全面升级了作文批改、口语对话、智能编程助手等功能,获得家长认可,销量增长显著。
在医疗行业里,大模型在加速赋能讯飞现有的BG端业务和C端产品。比如,讯飞星火医疗大模型通过由中国信通院牵头并联合20多家产学研用机构,发布全国首个医疗健康领域大模型应用技术标准评测,为每个医生打造 AI 诊疗助理。面向C端的讯飞晓医APP,满足用户在看病前、用药时、检查后的咨询需求,为每个人打造AI健康助手。
在汽车行业,作为一家进入汽车行业已有21年的AI企业,讯飞从车载语音助手切入,做到行业龙头,与各大车厂已建立起长期合作关系,业务从车舱类拓展到车企数字化等多个板块。
今年是大模型上车元年,由于众所周知的汽车市场内卷,所有车企都期望大模型上车能带来新卖点。“我们在Q1、Q2将此前一些概念落地。”科大讯飞智能汽车市场与解决方案部总监祝敏告诉数智前线。
比如由星火大模型赋能的车载语音助手,已在奇瑞星纪元系列、长城蓝山、大众ID.UNYX等明星车型上落地。与传统语音助手相比,大模型能够作为国产车载语音的开创者。科大讯飞深耕行业超过20年,能够为车企提供整套智能座舱闭环方案,无须协调多家供应商“搭积木”,产品落地更快,用户体验更好。
另一方面,星火大模型赋能的面向汽车行业的智能客服、营销助手等工具,也在多家车企中获得了运用与认可。作为资深Tier 1,讯飞拥有经验丰富的属地化交付团队,能够快速满足车企的定制化需求。
此外大模型还在帮助成熟的业务开拓新的领域。比如科大讯飞智慧城市数字政府业务团队,与安徽省农业农村厅合作,共同开发安徽耕云农业大型模型,为农业全产业链提供智慧化服务。例如在市场行情方面,通过分析行业资源状况、产业发展特征、市场供需形势等,帮助涉农主体对未来市场容量和产品竞争力进行预测,做出最佳经营策略,最大限度地降低生产经营风险。扮演着市场信息的“小灵通”角色。
大模型加持下,科大讯飞核心战略里的基本盘正在转化为业绩增长的重要引擎。比如,今年618“开门红”讯飞C端智能硬件的销售额实现了同比82%的增长,一批硬件产品“加量不加价”,受到了市场的欢迎。
03
增量盘 ,在新兴赛道开新渠
除了基本盘,科大讯飞在另外四个战略级市场也快速推进大模型战略。这些市场更像是一些战略新兴赛道,可以认为是公司的“增量盘”。
其中之一是以央国企为代表的重点行业客户市场。这是今年上半年竞争最为激烈的市场。今年开年国资委召开中央企业人工智能专题推进会,此后政府工作报告中首次提出“人工智能+”行动,这些动向点燃了市场。业界也看到,在大模型推进上,目前呈现出央国企先行趋势。
为探索央国企大模型之路,发布星火大模型之后,科大讯飞迅速整合讯飞研究院、相关业务单元及部分前场力量,成立了公司的一级组织“星火军团”。这一布局和投入已有成果。根据第三方对人工智能招投标的统计,今年上半年,科大讯飞已成为央国企项目中标最多的人工智能企业之一
科大讯飞星火军团行业总监张阳观察,央国企的动作很快,一些企业已在具体场景上开展落地,另一些则探索集团级人工智能平台建设。“我们判断大模型正处于爆发前夜”。
通过大模型,科大讯飞已将自身业务拓展到能源、航空等新行业,如与中石油、厦门航空等签订合作协议。当下,张阳团队正协助国家能源集团,构建集团级人工智能平台,并在招投标场景中,落地了智能无人评审系统。
图片
央国企往往是一个行业的链主企业。刘庆峰称,做完一家央国企,就打磨好一个行业。通过大模型能力可达程度的三个台阶,当下科大讯飞将重点放在中等难度任务的突破上,期望进一步解决行业和企业刚需方案落地。第三方的客户选择是大模型竞争力的重要体现之一,讯飞星火也成为多领域头部企业的首选。
在央国企重点行业市场之外,科大讯飞也在重点开辟新兴赛道的软硬件一体化授权和新硬件的机遇,如机器人硬件、医疗硬件等。目前,它与优必选、傅利叶、宇树科技等近400家机器人企业已展开合作,除了提供后台大模型,也提供前端麦克风阵列、视频模组等软硬件一体方案,让机器人更好用。
此外,在AI助手的入口级战略市场,以及家庭陪伴机器人的万亿市场上,科大讯飞也在快速推进。讯飞星火APP的用户粘性越来越强,涌现出很多热门助手,绘画大师使用次数1674万;写作助手使用次数596万……
如果说基本盘是保证公司持续稳定发展和公司关键现金流的基石,那么增量盘就是扮演突破公司业务疆界的战略盘。在当下语音加大模型带来的重大战略机遇中,科大讯飞将“能听会说、能理解会思考”的智能软硬件,作为关键突破口。
以医疗终端为例,科大讯飞“智医助理”已覆盖中国1.3亿居民,结合医疗全科能力+语音能力,可以研发一系列具有刚需场景的健康终端。此前,讯飞智能助听器的销售额已翻番。
刘庆峰提到,大模型应用落地的关键是要“云边端一体化、软硬件一体化”。在云侧,有大参数的通用模型(各种不同尺寸都有),也有星火一体机、“飞星一号”算力平台等完全自主可控的硬件支撑;在边、端侧,有在汽车等行业落地的中等参数模型和软硬软硬件一体化方案,也有完全能够在手机等智能终端上安装和使用的“小”模型和方案。这也是国际企业,如微软、苹果等在探索的道路。
当下,大模型的技术演进和应用落地,竞争极为激烈。船到中流浪更急,刘庆峰说,抓住大模型红利的关键,最重要的还是“顶天立地”。顶天是核心技术保持业界领先,大模型底座做到领先,云边端软硬一体化做到领先;立地是聚焦市场导向,做出典型领域的刚需产品,通过前后端拉动,把大模型赋能做到极致,彻底激发市场空间。“从技术中来,到产品中去,才能真正改变世界。”