高通与网易、智谱、腾讯混元等企业合作，基于骁龙8至尊版移动平台打造创新体验

春卷

2024-10-22 15:38发布于上海数码领域创作者

2024年10月21日，夏威夷——网易和高通技术公司宣布合作优化《永劫无间》手游，双方将基于骁龙®8至尊版移动平台的多个核心进行调优。此外，网易还采用一系列Snapdragon Elite Gaming特性，并在终端侧带来全新升级的AI队友功能，打造创新的《永劫无间》手游体验。

骁龙8至尊版移动平台采用高通技术公司全新自研的定制高通Oryon™ CPU，带来突破性的CPU单核和多核性能，以及超高能效，赋能顶级游戏体验。不仅如此，高通技术公司和网易还针对线程调度进行联合调优，并应用骁龙遮挡剔除（Snapdragon Occlusion Culling）等Snapdragon Elite Gaming特性，从而打造更加稳定的游戏体验。在《永劫无间》手游极致画质下，与前代平台相比，骁龙8至尊版的平均帧数提升22帧，帧率稳定性提升43%，助力实现更加流畅、稳定的复杂多人竞技场景。

GPU对于游戏画质至关重要。《永劫无间》手游利用了骁龙8至尊版的高通Adreno™ GPU的出色性能和领先能效，以及可变分辨率渲染（VRS）等一系列先进的Snapdragon Elite Gaming特性。在此基础上，双方针对渲染管线和Vulkan API对Adreno GPU进行联合深度优化，实现更高画质和出色能效。

基于骁龙8至尊版强大的高通Hexagon™ NPU，《永劫无间》手游首次将具有18亿参数的大语言模型引入终端侧，利用包括软件和工具在内的高通AI Stack的全栈优化，打造全新升级的端到端AI队友功能。该功能可以让AI队友不仅听懂玩家的语音对战指令并执行，还能够通过语音指导新手游玩；不仅如此，玩家还能够与AI队友进行自然的语音交流，获得优质队友的情绪价值。与云端推理相比，在终端侧进行AI推理具有诸多优势。首先，在终端侧推理可以显著降低网络传输带来的时延，使得首词时延控制在300毫秒以内，让玩家与AI队友的语音沟通更流畅、响应速度更快。其次，用户数据无需上传云端，这将大大提升用户的隐私的安全性。此外，将AI推理从云端迁移到终端侧，可以充分利用骁龙8至尊版强大的终端侧AI推理能力，从而降低云端运行成本并降低能耗。

高通公司高级副总裁兼手机业务总经理Chris Patrick表示：“高通技术公司和网易在游戏技术领域长期保持深入合作。我们很高兴能与网易合作，为热门手游大作《永劫无间》手游带来骁龙专属优化，通过提升游戏稳定性和能效，为全球广大玩家带来前所未有的手游体验。”

网易高级副总裁、网易雷火游戏事业群负责人胡志鹏表示：“长期以来，高通技术公司一直是网易信赖的领先合作伙伴，其先进的骁龙移动平台在支持网易游戏方面发挥关键作用。骁龙定制处理器的强大性能结合我们持续的技术优化，能够确保为所有玩家提供出色游戏体验。随着AI与游戏的融合正在不断变革玩家的游戏体验，我们很高兴与高通技术公司持续深入合作，将性能强劲、AI算力出众的骁龙8至尊版和网易前沿的AI大模型推理技术相结合，率先将终端侧AI大模型引入手游，为全球玩家解锁游戏体验新天地。”

骁龙峰会首日技术演示环节将展示骁龙8至尊版独家支持的《永劫无间》手游全新画面配置，以及全新升级的AI队友功能。

————————————

2024年10月21日，夏威夷——骁龙峰会首日，智谱与高通技术公司宣布合作将GLM-4V端侧视觉大模型，面向骁龙8至尊版进行深度适配和推理优化，支持丰富的多模态交互方式，进一步推动多模态生成式AI在终端侧的部署和推广，赋能更加情境化、个性化的终端侧智能体验。

骁龙8至尊版移动平台搭载全新第二代高通^®Oryon CPU和高通^®Hexagon^™ NPU，终端侧AI能力再次实现突破，能够赋能规模更大且更加复杂的多模态生成式AI用例在终端侧高效运行。充分利用骁龙8至尊版的强大终端侧AI性能和高通AI软件栈为模型带来的性能优化，GLM-4V端侧视觉大模型能够实现令人惊叹的处理能力，以超过70 tokens/秒的速度在终端侧高速运行。

改善情境化和定制化一直是用户体验的长期需求。多模态生成式AI模型能够利用终端侧丰富的传感器数据，例如文本、图像、音频、视频等，打造更加直观、无缝的智能交互体验。通过与骁龙8至尊版进行深度适配和推理优化，终端侧多模态应用ChatGLM能够支持三种终端侧交互方式：使用相机进行实时语音对话、上传照片进行对话、上传视频进行对话。丰富的多模态输入输出方式赋能智能助手ChatGLM实现了跨家庭、出行、工作和教育等多个场景的应用，例如通过手机摄像头获取穿搭建议，利用视觉信息实现智能导航，通过车内摄像头识别遗留物品，拍摄画作进行风格解析等。

高通技术公司高级副总裁兼技术规划和边缘解决方案业务总经理马德嘉表示：“高通与智谱共同致力于推动生成式AI在边缘终端上的应用和普及，并已经在手机、PC、汽车等领域展开了紧密合作。结合高通在终端侧AI领域的长期领导力，跨不同边缘终端的广泛市场布局，以及骁龙8至尊版的AI创新，我们在推动终端侧生成式AI发展方面独具优势。多模态是发挥终端生成式AI潜力的重要技术发展方向，我们期待携手智谱，探索多模态在终端侧AI应用上的更多可能。”

智谱COO张帆表示：“骁龙8至尊版移动平台提供了卓越的AI算力，结合高通AI软件栈推理框架的性能优化，使得智谱的终端侧大模型可以在设备端实现高速推理。我们相信，终端侧算力平台的性能跃迁结合大模型能力的进步，会将生成式AI带入新的时代。终端侧运行的生成式AI，在为用户提供变革性体验的同时，能更好地保护用户隐私安全，真正让AI变革用户的日常生活。”

GLM-4V-Mini、GLM-4V-Nano端侧视觉大模型和GLM-4-9B模型即将在高通AI Hub上线，搭载骁龙8至尊版的商用手机均可支持。

————————————

2024年10月21日，夏威夷——骁龙峰会期间，高通技术公司宣布与腾讯混元合作，基于骁龙8至尊版移动平台，共同推动了腾讯混元大模型7B和3B版本的终端侧部署，展示了此合作实现出色的运行表现。这将有助于腾讯混元大模型为广泛的业务场景提供技术支持，通过利用终端侧AI加速产品创新，有效降低运营成本，并进一步扩展生成式AI在终端侧的应用和普及。

骁龙8至尊版移动平台搭载全新的第二代定制高通^®Oryon CPU和增强的高通^®Hexagon^™NPU，充分利用高通^®AI引擎优势，能够带来更强大的终端侧生成式AI处理能力。骁龙8至尊版的强大AI算力，结合高通^®AI软件栈以及行业领先的工具套件，包括高通^®AI模型增效工具包（AIMET）等，为模型提供了全栈优化能力。通过使用基于硬件的INT4量化技术，可以大幅提升腾讯混元大模型在终端侧的运行效率，端侧推理实现首个token生成时延达到150ms，解码速率达到超过30 tokens/秒。

腾讯混元大模型已为腾讯内部超过700个业务场景和C端应用提供底层技术支持，包括微信输入法、腾讯手机管家、QQ、腾讯视频、QQ浏览器、企业微信、腾讯会议等，通过实现面向骁龙8至尊版的终端侧部署，能够利用终端侧生成式AI的丰富优势，更好地满足广泛的终端侧业务需求。例如，腾讯手机管家短信智能识别功能率先利用腾讯混元的终端侧模型能力，通过海量数据结合深度神经网络与预训练，让模型具备极强的语义理解能力，通过结合上下文语境信息更准确地理解短信意图，使短信召回率大幅提高将近200%，识别准确率提升20%。由于部分短信涉及用户个人敏感信息，端侧AI还可以在保证出色性能表现的同时，有效保护用户的个人信息隐私安全。

高通技术公司高级副总裁兼技术规划和边缘解决方案业务总经理马德嘉表示：“高通与腾讯混元大模型团队长期携手推动前沿终端侧技术创新在移动应用中的部署和推广，为广大用户和消费者打造创新的应用体验。高通公司致力于赋能广大ISV合作伙伴和开发者，利用高通强大的异构计算、行业领先的CPU、GPU、NPU和软件解决方案，在搭载骁龙平台的终端上推动生成式AI应用的普及，惠及全球更多用户。”

腾讯机器学习平台部总经理，腾讯混元大模型负责人王迪表示：“腾讯混元已经构建起了全链路的大模型矩阵和应用平台。同时，腾讯混元不断完善部署生态。在云服务场景，我们通过多种技术在提升效果的同时调用价格持续降低。在智能终端场景，腾讯和高通持续深入合作，赋能不同业务对端侧模型的部署需求，并在腾讯丰富的生态中持续迭代能力，让更多的B端和C端用户获得实用大模型的非凡体验。”

查看原图 75K