一毕业即百万年薪!曾在腾讯和百度实习,最终他选择加入蚂蚁集团,用图来解释人类难题

1967年,哈佛大学心理学教授斯坦利·米尔格提出了一个叫“六度空间”的理论:最多通过6个中间人,你就能联系到世界上的任何一个陌生人。
不只是人与人,世上万事万物互相关联形成了一张极其复杂的关系图谱,如何在短时间内认识到事物之间的联系并作出科学分析?
一定程度上,这是张志强的工作。
他是2016年入职蚂蚁集团的“蚂蚁星”,一毕业即拥有百万年薪,他的研究领域叫知识图谱和图学习。
这里的图,并不是一般意义上的图片,而是一个抽象的数学概念,由点和边构成的网络,指的是客观世界里事物和事物之间的联系。这个事物可以是人,也可以是物,可以是任何产生的关系图。
一个简单的例子:你在支付宝端发起的每一笔付款,图技术都会在短时间内分析交易双方的关系网络,来判断这笔交易是否存在风险,是否有被骗的可能。
图片
在千丝万缕的关系中发现蛛丝马迹
判断一笔交易的双方是好人还是坏人,不是一个新话题。一般而言,A给B转钱,系统把A的信息、B的信息以及这笔交易的信息,比如说什么时候发生的,这三个维度的信息拼在一起输入到一个模型进行分析。
加入图技术后,这套系统的视野和格局更大,可以把这两个人在这两天、一周内甚至一个月内做过所有的交易,编织成一个更广泛的关系网络,在千丝万缕的关系中分析出“可疑交易”的蛛丝马迹。
从这点上说,应用在支付安全领域的图技术,更像是游走在海量数据间的福尔摩斯。
图技术不只是能抓坏人,它已经运用在蚂蚁集团多个业务领域。最近,网商银行刚刚升级的大雁系统,就涉及通过图来定义和发现复杂的供应链关系,在海量的数据里发现一些真实存在但很难显示以及描述出来的关系。
如何发现两家企业间的上下游关系?传统方法是派信贷专员去企业实地走访,查看交易信息。
新升级后的大雁系统,通过读取海量的商品信息、企业关系信息之后,形成产业链图谱,然后让全产业链上下游的小微“显形”,大大提升了网商银行的信贷服务能力。
“简单举例,根据大数据发现两家企业的货车司机和仓储主管之间存在一定的关联性,进而推断两家企业间可能存在供应链关系。”张志强说。
代码写得最好的一批人之一
在进入蚂蚁之前,张志强已经在研究图了。他本科和研究生都就读于北京邮电大学计算机学院。这个来自广东的男生,专业学习之余,花了很多精力打程序设计比赛,参加过ACM/ICPC国际大学生程序设计竞赛,并获得了亚洲区域的金牌。
这是世界上公认的规模最大、水平最高的国际大学生程序设计竞赛,被称为“程序设计的奥林匹克”。在这类比赛上获奖,尤其是获得区域金牌,说明你是代码写得最好的那批人之一,是保研和互联网大厂招聘中的“特别加分项”。
读完本科后张志强保研本校,研究生阶段师从北京邮电大学的石川教授,图机器学习领域的权威专家。“当时选择这个方向,坦白说,并没有想到后续这么快就能在实践中得到应用。”张志强说,“只能说我还是比较幸运的。”
在校期间,他曾在腾讯和百度两家大厂都实习过,毕业后最终决定加入蚂蚁集团,理由是想去一个“活多人少”的地方,能让自己获得长足的进步。
刚加入蚂蚁时,张志强经常有三四个项目同时在做。他倒是坦然接受并且游刃有余,“顶着‘蚂蚁星’的头衔,大家都会判断你这个人究竟值不值的问题,所以也要拼命干活”。
步入工作岗位的张志强依然和石川教授保持着密切联系,蚂蚁技术研究院也和众多高校有着深入的合作,石川教授在一份介绍自己的材料中,张志强被放在了学生中的第一个。“还是很开心的一件事。”
图片
深度学习技术路线的“双向奔赴”
能在深度学习浩瀚的技术路线里相逢,张志强和蚂蚁算是“双向奔赴”。因为蚂蚁集团和图学习、图智能有着天然的适配度。支付宝有着海量的交易数据,但是其使用场景最为复杂、风控要求最高。
从2017年开始,入职1年后的张志强逐渐承担起技术创新的任务,开始主导蚂蚁集团的图学习技术体系,他和团队的研究方向包括图学习、机器学习、风险控制、推荐系统等各类图技术能力。
这些年,张志强和团队在蚂蚁集团的图学习技术实战经验,形成了蚂蚁集团的图学习系统Ant Graph Learning(AGL),这是行业首个通用工业图学习系统。目前,这一系统已经实现了万亿规模图数据上的信息协同和结构感知,构建了多个行业数字化图智能方案,也沉淀了多个优秀的算法实践,相关技术成果在NeurIPS、VLDB、SIGKDD、TKDE、WWW等国际会议期刊发表论文70余篇。
2021年,被誉为“中国智能科技最高奖”的“吴文俊人工智能科学技术奖”公布获奖名单,蚂蚁集团与清华大学、北京邮电大学共同获得人工智能科技进步奖一等奖,联合成果为《金融智能图机器学习系统的研发与大规模应用》,张志强和他的导师石川教授作为主要完成人获奖。
随后的2022年,由北京邮电大学、蚂蚁集团等主导研发的“大规模复杂异质图数据智能分析技术与规模化应用”的技术成果获得科技进步一等奖,这也是国内电子信息领域的最高奖项。
在蚂蚁集团对内对外的上百个业务场景中应用,如金融风控、财富管理、人脸支付等,AGL服务了数亿用户。在去年外滩大会上,蚂蚁集团将AGL正式对外开源,为开发者提供一个强大的工具和平台,以更好地应用图学习技术解决实际业务问题。
用图来解释人类难题
最近,张志强和团队投入到千亿级语言大模型基座研发的技术攻坚上,这又是一个新的挑战,涉及到大语言模型回复高阶问题的顺畅程度。
如果你问一位非常资深的乔丹迷:“乔丹退役那天NBA有几场比赛?”即使一开始不知道答案,他也会将问题拆解,通过搜索告诉你准确答案。
但对机器而言,这是一个复杂的问题。
首先,它们得知道乔丹是什么时候退役的,而乔丹退役了三次。其次,它们需要确定每次退役的时间,以及对应在当个赛季的哪个阶段……一个问题实际上是多个问题的叠加,看上去不难,对现有的大部分大模型却都是一种考验。
拿乔丹举例,因为张志强是个篮球爱好者,从小就是篮球队的主力成员,现在也是蚂蚁集团篮球兴趣小组的负责人,收藏了100多双AJ球鞋。
他希望自己在图智能技术的创新和研究,为推动技术进步贡献一点力量,“图的未来有很大的想象空间,比如用于研究复杂的气象问题,人类大脑复杂的神经网络等”。
更生动和耳熟能详的一个场景是:一只在亚马孙雨林中的蝴蝶偶尔扇动几下翅膀,就可以在两周以后引起美国得克萨斯州的一场龙卷风。表面上看来毫无关系、非常微小的事情,可能带来巨大的改变。
从2015年开始研究,蚂蚁集团图智能研究连续为通用人工智能提速,连续四次打破权威测评世界纪录。最近,国际关联数据基准委员会发布了图数据基准测评的最新结果,蚂蚁集团自研的流式图智能引擎 TuGraph Analytics已经取得了国际领先的并发吞吐量和查询能力,被称为全球最快图智能引擎。
因为张志强们,那些纷繁复杂的关系正在被看见、被定义,也被更好地用于为人类服务。
173114
VJQByakzzB43
图片
28岁的“老师傅”,打造国产大飞机C919的“生命之门”
图片
在马云们曾经创业的地方,浙大毕业的90后小伙要让“天下没有难走的路”
图片
真实到可怕!7年前一图成名的他,是如何影响50000多名医学生的?