人工智能行业海外大模型专题报告:OpenAI和微软

(报告出品方/作者:中信建投证券,阎贵成、金戈、于芳博)

OpenAI概述

OpenAI:全球估值最高的人工智能创业公司

OpenAI成立于2015年12月,成立的目的是让通用人工智能(Artificial General Intelligence)朝着最有可能造福人类 的方向发展。公司的主要创始人包括山姆奥尔特曼(Sam Altman)、格雷格·布罗克曼(Greg Brockman)、里德·霍夫曼 (Reid Hoffman)、杰西卡·利文斯顿(Jessica Livingston)、埃隆·马斯克(Elon Musk)、Amazon Web Services (AWS)等。截止2022年,OpenAI拥有大约375名员工,主要面向以下三个方面:Capabilities,不断的提高AI的功能和能 力;Safety,确保这些AI系统拥有和人类一致的价值观念;Policy,确保这些AI系统能够得到适当的治理。

根据路透社报道,OpenAI在2022年收入数千万美元,并预计2023、2024年收入为2亿、10亿美元。截止2023年4月29日, OpenAI历史融资额超200亿美元,当前估值为290亿美元,是全球估值最高的AI初创公司。

公司愿景:以最有可能造福人类的方式推进人工智能发展

2015年公司成立之初的愿景是让通用人工智能(Artificial General Intelligence)朝着最有可能造福人类的方向发展, 与此同时不受财务回报的约束。 2023年初,公司对未来发展做了进一步描述,其中提到公司目标是确保通用人工智能(在智能水平上胜过人类的AI系统)造 福全人类。

OpenAI融资历史:通用人工智能发展的有力保障

OpenAI一共经历了7轮融资,包括种子前融资,种子轮融资,二级市场融资和企业融资,总募集资金超过200亿美元。 主要投资者包括有:微软、Y Combinator、科斯拉风险投资公司,里德霍夫曼基金会、红衫资本、基岩资本、安德森·霍 格威兹、马修布朗公司等。 2019年开始,OpenAI开始对融资保持相对开放的态度,彼时公司的大语言模型正处于GPT-2迈向GPT-3的发展阶段。训练大 语言模型所需要的庞大算力是公司成立之时始料未及的,公司开始接受融资同时寻求与云厂商的广泛合作,与此同时也伴 随着公司商业模式的变化。

OpenAI商业模式

2019年,为了获取大规模投资和吸引人才从而更好完成企业使命,OpenAI从非营利性企业转变为具有利润上限的营利实体 OpenAI LP。在新的公司结构下,OpenAI就特指现在的OpenAI LP,原先的非营利实体转变为OpenAI Inc。而OpenAI LP则会 受到OpenAIInc的董事会进行控制。在此结构下,所有的投资者和员工的经济回报都是有限的,所有超额的回报都会归 OpenAI Inc所有。对于第一轮投资者(First Close Partners)的回报上限定为了投资的100倍,后续的投资回报率会不断 降低。 OpenAI的主要盈利模式包括:会员订阅费、API许可费、与微软合作带来的商业收入。

OpenAI技术发展路径

人工智能发展历程

人工智能大致可以分为三个发展阶段:弱人工智能、强人工智能、超人工智能。 弱人工智能(Weak artificial intelligence)或称狭义人工智能(Artificial Narrow Intelligence)是实现部分思维 的人工智能,且仅专注于某项特定任务。弱人工智能不需要具有人类完整的认知能力,甚至是完全不具有人类所拥有的感 官认知能力,只处理特定的问题。弱人工智能专注于模仿人类如何执行基本动作,例如记忆或感知事物、解决简单问题。 比如:AI模型AlphaGo战胜了顶尖的人类选手,但是局限于特定问题,仍然不能被称之为强人工智能。 当前人工智能技术发展处于弱人工智能相对成熟、强人工智能曙光乍现的阶段。

强人工智能

强人工智能也指通用人工智能(artificial general intelligence,AGI),具备非常通用的“智能能力”,包括推理能 力、规划能力、抽象思考能力、理解复杂概念的能力、快速学习的能力、从经验中学习能力等,并且在这些方面达到或超 过人类水平,强人工智能是人工智能研究的主要目标之一。 强人工智能的目标是创建一个能够与人类一样自适应、灵活地处理各种问题和任务的智能系统。强人工智能使得人工智能 具备意识、感性、知识和自觉等人类特征,有潜力为每个人提供几乎任何认知方面的帮助,可以为人类的聪明才智和创造 力提供巨大助力。

OpenAI技术发展路线

从时间维度上看,OpenAI的研究方向大致聚焦在三个领域:强化学习领域、自然语言处理领域、多模态模型领域。 在强化学习领域,OpenAI采用通用的强化学习策略来来帮助AI应对灵活多变的困难问题;在自然语言处理领域,OpenAI开 辟自回归建模路径,大语言模型无需在特定领域微调也有出色的任务表现;在多模态模型领域,OpenAI围绕Transformer主 架构不断增强多模态能力。OpenAI的研究方向始终关注问题的通用性解决方案,而不是聚焦在特定问题之上,与其通用人 工智能的研究目标契合。

OpenAI Five在多人竞技游戏中击败人类顶尖选手

OpenAI研究早期涉及各类游戏对战,其中包括著名的Dota 2对战机器人,在2017年8月在1v1比赛中击败了世界的顶尖选手。

OpenAI Five的目标是寻找最大化与人类玩家对战获胜的策略,模型训练过程中通过强化学习来实现这一目标,设置了最大 化的奖励函数,奖励函数中包括:角色死亡、资源收集等与胜率相关的信号。游戏过程中,OpenAI Five通过程序接口和游 戏进行交互,直接从游戏中获取诸如生命值、位置等具体的状态值,在获取观测到的状态后,通过LSTM长短期记忆网络进 行处理,之后AI反馈一个离散化的动作指令,如移动、攻击、使用技能等。

从2018年6月开始,OpenAI Five就从OpenAI内部逐步进行了与人类对战的测试,直至2019年4月,OpenAI Five以2-0击败了 职业战队OG,并在接下来的4天时间中,在线上与3193支不同的人类队伍进行了7257场比赛,达到了99.4%的胜率。Dota 2 复杂程度接近现实世界中的问题,OpenAI Five的成功证明强化学习在困难的任务当中也能够取得超越人类的表现。

多模态领域的基石性模型CLIP

2020年后,OpenAI开始逐步涉足多模态研究领域,2021年3月发布了图文配对模型CLIP。CLIP利用文本信息监督视觉任务 自训练,训练数据集为网络搜集得到的4亿个“文本-图像”对,采用Vision Transformer模型和ResNet实现图像的特征提 取,将不同模态的原始数据映射到统一或相似的语义空间,实现不同模态信号间的相互理解,模型在这种对应关系中学习 到文本和图像这两种不同模态信息背后的内涵,为多模态的生成模型奠定了基础。 CLIP在零样本学习任务上表现较好。与机器视觉中常用的先预训练然后微调不同,CLIP可以直接使用提示进行零样本学习 图像分类,在某个具体下游任务上实现分类。CLIP在具体的细粒度对象分类、地理定位、视频中的动作识别和OCR等27个数 据集的任务中表现十分优异。

未来技术展望

着眼于通用人工智能的发展目标,我们预计,OpenAI的研究会沿着两个方向进一步延升:多模态能力不断提升;大模型充 当AI代理、能力范围不断扩大。 多模态能力不断提升。GPT-4初步融入了多模态能力,具备了图像的识别和理解能力,OpenAI在图像生成方面也颇有建树, 预期未来在大语言模型基础之上,也会融入图像生成等多模态能力。 大模型充当AI代理,通过调用各种专业化工具进一步扩大能力范围。大语言模型未来将与搜索引擎、代码编程工具、实体 机器人等专业化工具进一步深化融合,打造更强大高效的多任务解决方案,为现实世界中的复杂任务提供全面的支持,让 大模型成为日常生活中的个人助理,充分释放个人创造力。

大模型全面赋能微软传统业务

个人办公是自然语言大模型的最佳落地场景

大语言模型具备出色的文本理解与处理能力,个人办公领域涉及到大量的文本处理工作,与大语言模型的优势高度契合, 是大语言模型最佳落地场景。微软业务多聚焦在个人办公领域,是OpenAI的最佳合作伙伴之一。微软和OpenAI合作始于 2016年,2019年7月合作关系得到进一步巩固,随后不断在Aure云、大模型模型方面加强合作。 OpenAI与微软达成人工智能行业的一次双赢合作。OpenAI的通用人工智能研究需要庞大的计算能力做支撑,同样需要充足 的资金支持去支付运营成本和科研人员薪酬。微软也亟待OpenAI的合作增强其AI技术实力,微软作为OpenAI先进人工智能 技术的首选商业合作伙伴,获得了人工智能技术商业化的竞争力。

微软分业务经营情况

微软FY2023Q3的营业收入为528.57亿美元,同比增长7.1%,营业利润达到223.5亿美元,同比增长9.7%,毛利率为69%。 生产力及业务流程:FY2023Q3营业收入175.2亿美元,同比增长10.9%。得益于Office 365 copilot的推出,Office 365 Commerical营收同比增长14%,用户量增加11%,而Microsoft 365的订阅量达到6540万,同比增长12%。Dynamics产品营收 同比增长25%。 智能云业务:FY2023Q3营业收入220.8亿美元,同比增长15.9%,其中Azure和其他云服务收入增长27%。 个人计算业务:2023Q3营业收入132.6亿美元,同比降低8.7%。受PC需求疲软影响,Windows OEM收入和设备收入分别减少 28%和30%。New Bing的推出带来了搜索量和用户量的提升叠加收购Xandr,搜索和新闻广告业务收入同比增长10%。

OpenAI助力Azure云增强其生态优势和协同效应

Microsoft Azure云具备较强的生态优势和协同效应。Azure云提供Office 365、Dynamics、LinkedIn等Saas化服务,微软 IaaS、PaaS、SaaS各产品均采用同类数据模型,形成较强的协同优势。近期,Azure云市场份额占比持续不断上升。OpenAI与Microsoft Azure云深度融合之后,实现了其Saas化服务的全面赋能。通过将大模型能力融入Office 365、 Dynamics、LinkedIn等产品,不断增强其丰富生态下的产品能力。Azure OpenAI同时提供大模型的全栈式工具,其中包括 预训练的大模型、大模型的应用微调、用于检测和减轻人工智能有害输出的工具、基于用户的访问控制和专用网络的企业 级安全性保障。全栈工具促进企业级应用与大模型的结合,进一步增强云上业务的协同优势。

Dynamics 365通过大模型进一步实现企业运行的降本增效

Dynamics 365是微软面对企业现代化需求推出的智能化应用组合。Dynamics 365融合企业的销售业务和信息管理服务,统 一整合Dynamics CRM和Dynamics NA ERP等产品,有效连接组织架构下的人员、数据和操作流程,降低企业的运行成本并且 简化了商业流程。 大模型助力Dynamics 365 Copilot实现企业运行的降本增效。CRM(客户关系管理)、ERP(企业资源管理)系统中经常需 要执行繁琐的任务操作,比如数据的手工输入、内容生成和事实记录。微软率先将大语言模型与其CRM、ERP系统进行融合, 帮助用户实现任务自动化、提供工作创意、并获得见解,从而快速推进交易、深入理解客户需求,提升客户问题的响应速 度。例如Dynamics 365下的Viva Sales,允许卖家使用Microsoft 365和Microsoft Teams自动将数据捕获到CRM系统中,消 除了手动数据输入,同时通过AI推荐最佳的营销行动,缩短整个销售周期,Viva Sales用户每月收费40美元。

OpenAI打开AI应用新局面

GPT-4显著提升代码编程效率和质量

GPT-4可以根据需求自动生成、修改、优化代码,提高编程的效率和质量。以往在编程过程中,程序员需要经历搜索相关 代码,学习代码,编写代码的复杂过程。而GPT-4通过学习和整合大量代码,可以根据所写代码上下文意图进行匹配,直接 生成相关代码,还可以帮助程序员修改代码中的错误,大大提升程序员的编程效率和编程质量。 OpenAI和Github合作推出AI辅助代码生成工具Github Copilot。Copilot可以通过注释了解程序员的目的,自动匹配相关 代码,并根据上下文进行理解,生成所需要的代码。除此之外,还可以帮助程序员减少重复性的代码编程工作,自动AI生 成接下来的代码,而代码准确性也会随着上下文的理解而不断提升,让程序员可以专注于创新性的代码编程。2022年6月底, Github Copilot已正式上线,定价每月 10 美元或每年 100 美元,对学生用户和流行开源项目的维护者免费提供。

GPT-4成为金融领域强力的信息汇总和分析工具

GPT-4具备优秀的数据整合、搜索和分析的能力,在投研、投顾、营销、客服、运营、风控等各类金融业务场景下都将具有 广泛的应用和可观的潜力,可以为金融业投资者和金融从业人员提供更高质量的信息和数据分析服务。 Morgan Stanley利用GPT-4来实现企业运作中多维度的提升。Morgan Stanley内部数据库中包含了大量高质量的涵盖全球资 本市场、资产类别、行业分析和经济区域等方面的见解。这些数据以PDF形式存储在多个内部网站中,而GPT-4的应用让这 些丰富而深刻的知识以一种更可用和可操作的形式出现,助力公司内部数据与知识应用高效化。彭博社(Bloomberg)发布拥有500亿个参数的针对金融领域的自然语言模型——BloombergGPT。 BloombergGPT在常规 金融问答(ConvFinQA)、情绪分析(FIQA SA)、包含观点的金融专业词汇分析(FPB)、通过对新闻标题研究得到特定 商品价格的上涨或者下跌信息等金融领域的测试中均表现优异,同时不会牺牲通用自然语言模型的基准性能。

GPT-4提升零售中的业务效率和用户体验

GPT-4帮助企业不断的创新和提升服务质量, 提升零售业的业务效率和用户体验。GPT-4在零售业中,可以帮助企业生成个 性化的商品推荐和描述,根据消费者的喜好,生成不同的商品信息,增加消费者的兴趣和体验;同时,也可以通过GPT-4构 建智能的客服对话,提升用户的售后体验。Stripe是一个支付平台,借助GPT4的能力进行更好地服务客户、回答技术问题以及识别虚假信息。Stripe借助GPT-4的能力 可以扫描隐藏网站并且做出汇总,节省了人工精力更好地服务客户。此外,借助GPT-4,Stripe能够快速理解用户的问题, 阅读详细的文档,梳理想关信息分并总结出解决方案,极大提升工作效率。GPT-4还会帮助识别虚假信息,通过分析社区 Discord 中帖子的语法,就会发现欺诈团队,以方便相关工作人员将他们清除出去。

报告节选:

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

精选报告来源:【未来智库】。