聚焦微软开发者大会!“AI员工”闪亮登场,编程进入自然语言时代,将率先使用英伟达AI芯片

每经编辑:杜宇
当地时间5月21日,美国科技公司微软召开年度Build 2024开发者大会。在CEO纳德拉的带领下,微软各个产品团队再一次展现出惊人的执行力,在发布会上又拿出了接近50个新产品或功能更新。
纳德拉开场先提到微软几十年来有两大梦想:一是能不能让电脑理解人类,而不是人类被迫理解电脑,二是在信息日益增加的世界,电脑能不能帮助人类推理、规划以及更有效地运用所有的信息。纳德拉认为,现在这波AI浪潮能为微软找到实现这两大梦想的答案。
随后,Nadella聚焦Copilot。纳德拉提到了包含随时可用本地API的Copilot库Windows Copilot Library,称有40多种端侧AI模型“开箱即用”,展示了将Copilot全面融入个人电脑(PC)的新型PC Copilot+ PC如何与AI应用程序(App)密切结合。
周一微软介绍过Windows Copilot Runtime中包含超过40个AI模型。周二Nadella将Windows Copilot Runtime类比为重磅Windows API Win32,因为它让开发者更容易利用AI打造自己的Windows App。
图片
图片来源:每日经济新闻 资料图
微软宣布Team Copilot发布,年内将推出初步预览版
微软宣布发布最新的Team Copilot,这是Copilot for Microsoft 365的扩展,它从一个幕后的个人AI助理变成了团队中的智能助理,使用者将能够在Teams、Loop、Planner等协作应用中调用Copilot。
据介绍,Team Copilot可以在会议中充当会议主持人,管理议程、跟踪时间和做笔记。它可以充当聊天中的合作者,提供重要信息、跟踪行动项目并解决未解决的问题。也可以充当项目经理,帮助确保每个项目顺利进行,并在需要团队意见时通知他们。这些初步体验将在今年晚些时候以预览版的形式推出。
此外,据悉Microsoft Copilot Studio还引入了新的代理功能,使开发人员能够构建能够主动响应数据和事件的Copilot,并针对特定任务和功能进行量身定制。利用此类新功能构建的Copilot现在可以利用内存和知识来获取上下文信息、推理操作和输入、根据用户反馈进行学习并在遇到不知道如何处理的情况时寻求帮助,从而独立管理复杂、长期运行的业务流程。
图片
Azure AI Studio现已支持提供GPT-4o API 将率先使用英伟达Blackwell AI芯片
纳德拉介绍,由OpeanAI开发的最新旗舰模型GPT-4o,现已在Azure AI Studio中提供,并作为API提供。该多模态模型集成了文本、图像和音频处理能力,带来了全新的生成式和对话式AI体验。
此外,由微软开发的Phi-3列AI小型语言模型(SLM)中的一种新型多模态模型Phi-3-vision现已在Azure中推出。Phi-3模型功能强大、经济高效,并且针对个人设备进行了优化。Phi-3-vision提供了输入图像和文本并接收文本响应的功能。例如,用户可以询问有关图表的问题,或询问有关特定图像的开放式问题。
开发人员可以在Azure AI Playground中试验这些前沿模型,并且可以开始使用Azure AI Studio中的模型进行构建和自定义。
图片
随后,纳德拉聚焦Copilot。他提到了包含随时可用本地API的Copilot库Windows Copilot Library,称有40多种端侧AI模型“开箱即用”,展示了将Copilot全面融入个人电脑(PC)的新型PC Copilot+ PC如何与AI应用程序(App)密切结合。
纳德拉将Windows Copilot Runtime类比为重磅Windows API Win32,因为它让开发者更容易利用AI打造自己的Windows App。
图片
接着纳德拉提到AI基础设施。他表示,微软拥有“世界上最全面的人工智能基础设施”,有望在2025年以前实现数据中心100%由可再生能源供电,微软云计算Azure的AI服务落地国家数量已增加三倍。
他说,微软将成为首批提供英伟达最新Blackwell AI 芯片的云服务商之一,与英伟达建立了“深厚的合作伙伴关系”。
纳德拉称,如今,已有超过5万家组织使用Azure AI。借助 Azure AI,微软提供最广泛的前沿和开源模型选择,包括大语言模型( LLM)和小语言模型( SLM)。
纳德拉在开发者大会现场提及,GPT-4o已经结合到Azure AI,称OpenAI上周的GPT-4o演示“非常神奇”,OpenAI 是微软“最具战略意义、以及最重要的合作伙伴”。
同时,微软开发的AI SLM Phi-3 系列也发布了一款新的多模态模型Phi-3-vision,已可在 Azure 中使用。微软介绍,Phi-3 模型功能强大、经济实惠,并针对个人设备进行了优化。Phi-3-vision 能够输入图像和文本,并接收文本回复。例如,用户可以就图表提出问题,或就特定图像提出开放式问题。
微软宣布推出Team Copilot,这是其Copilot系列生成式AI技术的最新扩展。
Azure AI可用文图小模型Phi-3-vision OPPO新手机正测试Azure AI文本语言互转技术
微软开发的AI SLM Phi-3系列周二发布了一款新的多模态小模型Phi-3-vision,它可在Azure中使用。
微软介绍,Phi-3模型功能强大、经济实惠,并针对个人设备进行了优化。Phi-3-vision有42亿参数,能够输入图像和文本,并接收文本回复。例如,用户可以就图表提出问题,或就特定图像提出开放式问题。
微软还透露,中国手机厂商OPPO正在其新款智能手机上试点Azure AI的语音转文本、快速转录和Azure AI文本转语音技术。
Team Copilot将个人助手变身团队会议主持人、聊天协作者、项目经理
图片
微软推出多种Copilot的AI功能扩展。周二公布的一大扩展功能是Team Copilot。
作为Copilot系列生成式AI技术的最新扩展,Team Copilot将Copilot for Microsoft 365从幕后的个人AI助手,扩展为团队新的重要成员。您将能够在Teams、Loop、Planner等协作工具中调用Copilot。
Team Copilot能够在会议中担任会议主持人,管理会议议程、跟踪会议时间并记录会议要点;也可以在聊天中作为协作者,提供重要信息、跟踪行动项目并解决未决问题。它还可以担任项目经理,帮助确保每个项目顺利推进,并及时通知团队进行输入。这些初始体验将在今年晚些时候推出预览版。
Copilot Studio升级用户可定制AI代理
微软Copilot Studio升级,推出全新的Agent代理功能,让开发者能够根据特定任务和功能,构建主动响应数据和事件的Copilot。
基于这类新功能的Copilot通过记忆和知识了解上下文、推理操作和输入,基于用户反馈进行学习,并在不知道如何处理时寻求帮助,从而独立管理复杂、长期运行的业务流程。
从IT设备采购到销售和服务的客户接待,用户都可以让基于Copilot Studio构建的Copilot为其工作。在部署前,用户可以先测试自己设计的Copilot AI代理,然后在多个渠道使用该代理。
首款基于Arm Azure Cobalt虚拟机预览版正式发布Azure ND MI300X v5虚拟机
图片
去年11月,微软发布了首款自研AI芯片Azure Maia 100和首款自研云处理器Azure Cobalt 100。本周二微软宣布,在Azure Cobalt 100的基础上,推出基于Arm架构定制的Cobalt 100虚拟机(VM)预览版。它是第一代采用微软新Cobalt处理器的虚拟机,对运行通用工作负载和云原生工作负载时的效率和性能进行了优化。
纳德拉介绍,相比同类型Azure虚拟机,基于Arm的Cobalt 100虚拟机性能可提升多达40%,它是微软Azure推出的功效最高计算产品。
微软Azure硬件系统及基础设施负责人Rani Borkar也告诉媒体,其初步测试显示,Azure Cobalt的性能比目前其数据中心所用所用商用Arm服务器的性能高多达40%。媒体称,微软目前正在Microsoft Teams和SQL Server等工作负载上测试Cobalt CPU,计划明年向客户提供处理各种工作负载的虚拟机。
Maia 100目前正在GPT 3.5 Turbo上进行测试,GPT 3.5同样是支持ChatGPT、Bing AI工作负载和GitHub Copilot的模型。与Cobalt CPU类似,微软目前对Maia 100处于部署的早期阶段,并未披露其具体规格和性能表现。
微软是首家将AMD的MI300X AI加速器芯片用于客户AI训练和AI推理的云服务商。本周二微软宣布,Azure ND MI300X v5虚拟机系列已正式发布,针对高需求AI,以及诸如Azure OpenAI Service的高性能计算(HPC)工作负载进行了优化。
编程进入自然语言时代 编程小白也能开发软件?
纳德拉在周二演示了“帮助小白编程”的GitHub Copilot Workspace,这是一款通过聊天实现完成程序编写的软件。这将使任何新手,即使对编程语言几乎没有了解,也能开发自己的软件。
纳德拉表示:“任何人都可以在瞬间将想法转变为代码,你能够控制这个过程中的每一个环节...这将使得编程更加快乐和有趣。”
微软计划在未来几个月里进一步打磨这个功能,使其更加可用。
图片
AI实时视频翻译功能
微软的Edge浏览器将在近期推出一款视频实时翻译功能。与目前常见的视频字幕翻译不同,这款产品已经能提供实时语音同传翻译。
Edge的AI实时翻译初始将支持彭博、路透等一系列主流视频网站和主流新闻网站,且只支持英语、印地语、德语、俄语、意大利语和西班牙语的双向互译。微软也表示,后续将会支持更多的网站和语言。
图片
截至当地时间5月21日收盘,微软报429.04美元,涨幅0.87%,市值3.2万亿美元。
图片
每日经济新闻综合公开资料