构建离产业最近的AI 腾讯混元参数已超万亿

全文2124字,阅读约需7分钟,帮我划重点

划重点

01腾讯混元大模型在国内率先采用MoE架构,实现性能大幅提升,截至目前,整体参数量已达到万亿。

02腾讯云副总裁吴运声表示,大模型的研发、应用必须关注、解决具体业务场景,以及可用性和性价比。

03除此之外,腾讯在大模型领域已经构建了一套全链路产品矩阵,涵盖从底层丰富基础设施到顶层多元智能应用。

04由安阳师范学院甲骨文信息处理教育部实验室等发起的“数字甲骨共创中心”宣布,将全球最大的甲骨文多模态数据集正式开源。

05同时,腾讯在天文学领域推出“探星计划”,整体探星信号处理效率提升1800倍,目前已发现41颗脉冲星。

以上内容由腾讯混元大模型生成,仅供参考

IT时报记者 郝俊慧
连续七届参加世界人工智能大会的腾讯,再次将表达的重点放到“大模型行业和应用”上。
经历了一年半“技术狂飙”后,国产大模型的数量已经超过200个,2024年也被称为“大模型落地元年”。但作为国内互联网头部大厂,腾讯始终走得不疾不徐。
图片
“大模型的打造只是起点,把技术落地到产业场景,创造价值才是目标”,2024WAIC·腾讯论坛上,腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声表示,大模型的研发、应用必须关注、解决具体业务场景,以及可用性和性价比。
自2023年9月首次亮相以来,经过多次迭代升级,腾讯混元大模型在国内率先采用MoE架构,实现了性能大幅提升。据腾讯集团副总裁蒋杰介绍,截至目前,混元整体参数量已达到万亿,Tokens数量超过7万亿,居国内大模型第一梯队。
智能体“最火”
WAIC展览期间,腾讯展区始终人头攒动。在腾讯元宝片区,现场观众可以通过互动装置,生成个人多风格专属头像。
元宝是一款基于腾讯混元大模型开发的AI原生应用,拥有看、听、说等多模态交互能力,提供AI搜索、AI总结、AI写作一站式服务,可支持单文档最长1000万字的超长文处理,能够一次性解析最多50个文件,支持上传和解析包括 pdf、doc、txt、xlsx、pptx 在内的多种文件格式。
从形式上看,腾讯元宝覆盖工作提效、生活娱乐两大场景,除了和文字相关的核心功能,元宝还可以提供创意绘画、口语陪练、百变AI头像等有趣好玩的特色应用,以及更多用户创建的智能体。
智能体是今年WAIC上的新晋“网红”。在“腾讯元器”展区,参会嘉宾可以通过添加提示词、插件、知识库等自由创建智能体,也可以在智能体商店选择、使用智能体,以满足不同场景下的需求。
目前,腾讯在大模型领域已经构建了一套全链路产品矩阵,涵盖从底层丰富基础设施到顶层多元智能应用。包括自研通用大模型、模型开发平台、智能体开发平台,以及针对不同场景定制的智能应用解决方案等。通过这些产品和方案,致力于助力企业客户高效地将大模型技术应用到实际业务场景中,实现快速部署和价值创造。
做离产业最近的AI
自从进入大模型赛道以来,腾讯始终坚持“产业实用”的核心战略,构建离产业最近的AI。
去年6月,腾讯云对外发布行业大模型解决方案,通过TI平台打造全新模型精选商店,为客户提供MaaS一站式服务,涵盖模型预训练、模型精调、智能应用开发等,大大降低模型应用及落地成本。
吴运声认为,大模型的打造只是起点,把技术落地到产业场景、创造价值才是目标。他特别强调了大模型知识引擎在智能客服、营销等多场景的落地应用,比如在客服场景,知识引擎可以融入到客服系统,让客服人员更准确、更高效率地解答客户的问题;在产品营销场景,知识引擎可以整合到腾讯企点营销SCRM中,提供更优质的服务,提升客户转化率;在人才培训场景,知识引擎可以结合腾讯乐享知识学习平台,把员工的智慧聚集成企业知识库,促进内部知识分享和传播。
图片
作为支撑AI大模型的重要基础设施,向量数据库能突破大模型在时间和空间上的限制,加速大模型落地行业场景。
今年大会上,腾讯秀出了“肌肉”:腾讯云向量数据库可支持千亿级向量规模、五百万QPS及毫秒级查询延迟,专用于在搜索/推荐和AIGC场景中提供文档、图片、音视频等非结构化数据检索服务。
从科技向善到AI普惠
大模型技术正在往多模态、零样本学习、3D和视频生成等方向快速演进,增强技术融合、简化模型训练流程、提供更加沉浸式体验等方式,正在加速AI技术的普惠。
论坛当天,由安阳师范学院甲骨文信息处理教育部实验室、腾讯SSV数字文化实验室、腾讯优图实验室、中国社会科学院甲骨学殷商史研究中心等单位共同发起建立的“数字甲骨共创中心”宣布,将全球最大的甲骨文多模态数据集正式开源。该数据集包含一万片甲骨的拓片、摹本,以及甲骨单字对应位置、对应字头、对应隶定字以及辞例分组、释读顺序等数据。基于该数据集,研究人员可开发甲骨文检测、识别、摹本生成、字形匹配以及释读等方向的智能算法,助推甲骨文研究加速数字化和智能化。
近年来,随着AI技术的快速发展,探索AI与甲骨文研究相结合,成为了研究人员的解题思路。但高质量的AI算法非常依赖高质量的甲骨文数据集。
此次开源的甲骨文多模态数据集集合了甲骨文数字化研究的最新成果。它吸收了当前业界最先进的甲骨文研究资料,包括剑桥大学博士秦培超发布的镜元甲骨文字库,该字库考虑了人工智能标注需求的字库进行了细粒度的异体字标识;以及清华大学黄天树教授发布的《摹本大系》,得益于其具有大量甲骨片清晰字形,降低了标注的难度。
AI相关技术的应用也为数据集的信息丰富提供了支撑。比如由腾讯优图实验室联合安阳团队开发的甲骨字检测模型,可以对甲骨片上的字进行一个初步的标注;字形降噪与匹配模型,为检索提供了最直接的方法;甲骨校重算法,可以实现拓片与大系摹本的配准,使得大系摹本可以直接辅助拓片的标注;同时双方联合打造的协同创新平台,也大大提升了数据标注的效率。
中国社会科学院学部委员宋镇豪表示,甲骨文是中华文明的重要瑰宝,甲骨文研究不仅有助于揭示中国上古信史,还能为现代汉字由来和汉语研究提供标志性依据。通过AI技术的应用,有望加快甲骨文探析进程,解决长期困扰学界的疑难问题。希望更多的科研机构和专家学者加入到这一伟大事业中,共同拓展甲骨文研究工作新天地。
此外,在天文领域,“探星计划”在“云+AI”的辅助下,整体探星信号处理效率提升1800倍,目前已发现41颗脉冲星,助力中国天文取得更多成果;以“AI+公益”为方向的Light技术公益平台,开放腾讯云上300余项AI原子能力,以多种社会热点议题为方向,号召各界人士共同打造技术公益解决方案。