美网×IBM:体育大数据的“次世代”范本

图片
今年的美网女单决赛,上演了一组「00后」之间的青春对话。华裔英国18岁小将拉杜卡努(Emma Raducanu)以6比4、6比3直落两盘,击败了加拿大19岁新秀费南德兹(Leylah Fernandez),成为了自2004年莎拉波娃在温网封后以来,最年轻的大满贯赛冠军得主。
而与女子网坛一同进入「次世代」的,还有美网的数字化进程——在上一篇专栏《进军NFT,美网也开始做数字周边了》中,作者介绍了美网在NFT上的勇敢尝试。在本篇文章中,作者将借助美网IBM合作的案例,更加详细地阐释美网如何用大数据,为赛事带来了全新的观赛体验。
ECOSPORTS
特约作者:陈天皓
在推出了赛事历史上第一个NFT项目之外,2021年,也是美网和IBM一起合作的第30个年头。
作为美网的官方云服务和人工智能(AI)合作伙伴,IBM一直和美国网协(USTA)紧密合作,为全球超过1000万网球迷开发和提供世界一流的数字体验。这些体验通过美网的官方应用程序和网站来提供给受众,并通过IBM的混合云技术进行支持,同时还融入了IBM Watson的洞察力。
图片
在今年,IBM也在美网推出了一系列的新功能,其中包括世界上第一个基于人工智能的网球运动员排名——IBM Power Rankings。而IBM Watson则产生了一系列带有预测性的比赛洞察,来帮助球迷将注意力集中在整个美网赛事最有趣的比赛上,并识别出潜在的冷门以及具有明显上升势头的球员。
那么下面就让我们一起来看看,IBM都为球迷们提供了哪些全新的数字化体验。
01
IBM Power Rankings
IBM Power Rankings,是一个由AI生成的球员每日走势排名,可以帮助预测美网每场单打比赛球员获胜的概率。
这个排名的算法,将球员最近的比赛得分和全面的数据统计分析,与IBM Watson Discovery的自然语言处理(NPL)能力相结合,来了解媒体对球员表现的评价,把球迷的注意力引导到最引人注目的比赛上。
该排名每天更新一次。在整体的页面上,你可以看到每位球员的Power Ranking、单打世界排名、姓名以及国家/地区。
图片
当点击右侧的下拉箭头时,你可以看到每位球员更为详细的信息。以下图的新科奥运会冠军小兹维列夫的数据为例:
图片
在Power Ranking的详细信息中,我们可以看到:
· 他在下一轮的对手将会是哈里斯(UPCOMING vs L. Harris)
· 在Power Ranking的决定性因素中,他在「最近比赛中的表现(Recent Performance)」和「媒体上的声量(Media Volume)」这两项都几乎完全拉满
· 媒体上对他的评价,处于一个中立但略微偏负面的状态
在界面右侧,则显示了小兹维列夫的Power Ranking随时间变化的情况——他的Power Ranking从未跌落到第4位以下。同时,我们还可以看到他在8月31日、9月2日、9月4日和9月6日分别赢下了4场比赛。
而在Power Ranking中排名第7位的加拿大选手阿里亚西姆,呈现出的则是不一样的信息:
· 他在「最近比赛中的表现」略差于小兹维列夫
· 在「媒体声量」方面,他的影响力大概只有小兹维列夫的35%左右
· 媒体上对他的评价要比小兹维列夫正面很多
· 他的Power Ranking随着时间不断上升,从17位逐渐上升到第7位
如果球员尚未被淘汰,你可以在该球员的Power Ranking详细信息页面中点击「Match Insights(比赛洞察)」来了解由IBM Watson提供的关于该球员即将进行的比赛的预先分析。
下面来详细介绍一下「Match Insights with Watson」
02
来自沃森的比赛洞察
Match Insights with Watson
「来自沃森的比赛洞察」是通过人工智能技术生成的比赛指南,可以帮助球迷在美网的每场单打比赛前快速了解比赛对阵双方的情况。
美网通过企业级的人工智能和IBM云,来挖掘最新的球员数据统计和媒体评论,以获得比赛洞察,其中包括了最新的IBM Power Rankings、来自各种媒体渠道的相关引述以及通过自然语言处理技术完成的关键致胜指标。
让我们继续以小兹维列夫为例,来了解一下比赛洞察的具体内容。
图片
在前四轮比赛获胜后,他在2021年9月7日的男单1/4决赛中面对南非选手哈里斯。基于Watson 的赛前分析,小兹维列夫有64%的概率会在这场比赛中获胜。他的IBM Power排名是第1位,而对手哈里斯的排名是第6位。两人的单打世界排名分别是第4和第46位。
在随后的「In the Media(媒体评论)」板块,呈现了媒体对两位球员各3条的引述。这些引述是IBM利用其Watson Discovery平台,基于AI的智能搜索和文本分析得到的。
接下来的「By the Numbers(关键数字)」,则是基于两位选手在美网比赛中的详细数据统计所得出的洞察。
图片
其中,小兹维列夫的5个关键数字是:
· 截至第4轮,小兹维列夫在发球时的得分率是76%,在所有128名选手中排名第一
· 他的一发平均时速为127英里/小时(204公里/小时),是所有选手中发球时速最快的
· 在他的制胜分中,有41%来自于反手
· 小兹维列夫的二发得分率是60%,而哈里斯只有44%
· 他的反手制胜分得分占到了总得分的4%,而哈里斯只有2%
而哈里斯的5个关键数字是:
· 截至第4轮,他的一发得分率是83%,在所有128名选手中排名第二
· 他在发球时的得分率是71%,在所有选手中排名第八
· 在哈里斯的制胜分中,有78%来自于正手
· 他的正手制胜分得分占到了总得分的7%,而小兹维列夫只有6%
· 哈里斯的反手失误占到了总得分的4%,而小兹维列夫则占到了5%
除了上面数字外,在不同选手间的比赛洞察中,还有诸如:Ace球占比、平均一发时速、接发球得分率、破发成功率、上网次数占比等众多不同的数据。这些数据可以让评论员和观众进一步了解选手的表现,增加他们对选手特点的认知。
同时,这些数据也会随着选手的不断晋级在每一轮后更新。因此每位选手在每场比赛中的洞察都会有所不同。
而所有这些数据和排名的基础,都来源于IBM在每场比赛的现场专门安排的数据统计人员,通过专用的数据统计软件来人工逐分录入的数据。而IBM则通过专门开发的SlamTracker比分应用程序,来呈现这些比分和数据。
03
IBM SlamTracker
在2011年,IBM和美网共同开发了一款名为「PointStream」的应用程序,通过对数据进行可视化来呈现比分和数据统计。经过不断地更新迭代,PointStream成为了现在的SlamTracker,而它的功能也一直在不断地变化。
根据美网官方网站的描述:「IBM SlamTracker是美国网球公开赛首屈一指的比分应用程序。它提供了每场比赛的实时比分、数据统计以及逐分的深入分析」。
图片
在SlamTracker上,我们可以看到对阵双方选手的头像、名字、比分以及这场比赛的项目、轮次、场地、比赛用时等基础信息。
而除此之外,SlamTracker的下方共有四个部分来帮助球迷了解一场比赛的情况,分别是:比赛概况(Overview)、态势分析(Momentum)、数据统计(Stats)和比赛洞察(Insights)。
a.比赛概况(Overview)
「比赛概况」的内容其实就是之前「来自沃森的比赛洞察」页面中第一部分的内容。其中显示了基于IBM Watson在赛前分析所得出的双方选手胜率、IBM Power Ranking和选手的单打世界排名。而双打比赛的「比赛概况」呈现的是对阵双方球员的基础个人资料。
图片
b.态势分析(Momentum)
「态势分析」应该说是整个SlamTracker中,对数据进行可视化的应用典范。它显示了随着比赛不断进行,球员得分胜负变化态势的情况。
根据美网的描述,「这一功能可以直观地描绘出比赛得分的态势变化,让你可以一眼看出哪方选手的态势更好,以及整场比赛中态势是如何变化的。」
通过观察,笔者发现:代表双方表现的态势线条会从中间向赢得一分的选手一侧绘制。而一方选手连续赢得的分数越多,态势线条就越会向该方增长。
在「态势分析」中,球迷可以通过缩放功能从三个不同的量级来了解得分的变化趋势。
线条的颜色代表了这一分的得分方,蓝色代表着左侧的球员得到了这一分,而黄色代表着右侧的球员得分
如上图所示,最左侧的图只能看出最基础的得分走势;中间的图则提供了更多细节,可以让球迷得知一分是否为Ace球(A)、双误(D)、制胜分(W)、非受迫性失误(U)和破发点(B)。
而最右侧的图,则提供了更多细节——当点开一分后,你会看到该分的开始时间,以及球员是如何赢下/丢掉这一分的。例如:小兹维列夫由于双误丢掉该分(A. Zverev loses the point with a double fault);小兹维列夫通过Ace球赢得该局(A. Zverev wins the game with an ace)。
当出现破发点时,「态势分析」中还会给出「破发机会(BREAK POINT OPPORTUNITY)」的提示,来告诉你现在是哪方选手有机会破掉对手的发球局。
图片
在比赛进行的过程中,「态势分析」还会根据选手在刚结束一分中的发挥给出与该分相关的双方数据对比。
例如在下图中,我们可以看到,截止到第3盘比赛第8局比分为40:40时,小兹维列夫和哈里斯的制胜分分别为38和32个。而当你滑动下方的圆点时,数据会告诉你:小兹维列夫45%(17/38)的制胜分是Ace球,而哈里斯41%(13/32)的制胜分是Ace球。
图片
通过这张图,我们则可以看到:小兹维列夫的平均发球时速为193公里/小时而哈里斯的平均发球时速只有178公里/小时。小兹维列夫的最快发球时速是220公里/小时,最近一次发球的时速是207公里/小时,而哈里斯的最快发球时速是207公里/小时,最近一次发球的时速是183公里/小时。
图片
除此之外,「态势分析」还会展示球员在比赛中的移动数据对比。
例如下图:截止到第3盘比赛第9局比分为30:15时,小兹维列夫的总跑动距离是4506.47米,平均每分跑动25.18米,而哈里斯的总跑动距离是4467.13米,平均每分跑动24.96米。和种子球员以及所有其他球员相比,两人的跑动距离都略低于平均值。
图片
所有这些额外的数据对比,都是IBM Watson根据比赛进程来自动实时计算并推送的。可以看出,尽管只是比分应用程序中的一部分,美网依然进行了很细致和全面的工作,来为受众提供更多信息。
c.数据统计(Stats)
在「数据统计」部分,提供了网球比赛常见的统计数据,包括了:Ace球、双误、一发得分率、二发得分率、破发成功率、制胜分、非受迫性失误等等。