世界杯之前,在ITPUB上翻到一篇主题讨论,关于『大数据、预测』,嗯,近两年你在互联网上几乎躲不开这几个字眼。媒体的威力不可小视,当这种95%以上业内人士都说不清道不明的概念也能在街边卖菜大婶的嘴里蹦出来的时候,你就知道,他和『小苹果』『欧巴江南style』无异了。
回想起来,数据仓库的概念也不过才诞生在90年代初期由Bill Inmon(数据仓库之父)提出。在足球领域用数据来作为决策支撑的理念很可能在2000年之后,大批量的数据采集,包括医疗、训练场上的表现、热成像摄影收集球员跑动数据(里皮团队)、包括商业数据OPTA这样的数据运用也不过是近几年才开始普及。
比如,看起来很绚丽的世界杯开赛前32支队伍的夺冠预测图
鼠标放在图中某个节点、国家名称、地图区域上,左图中即会显示该国家队在世界杯各轮比赛中获胜的几率。
演示地址 ,甚至作者把实现方式都开源了。
本质上,这种预测是基于FIFA历来的官方比赛比分统计、排名数据汇集而成。看到这里可能会有观众跳出来,嗤之以鼻:
『足球是圆的!Everything can be happen!』
『Impossible is nothing!』
『Impossible is nothing!』
是的,足球确实是圆的,不可预知性是它最大的魅力,场面瞬息万变,任意一个细节都会影响全盘战局,这些都没错。但这在理科生的世界观里,可以将其抽象理解为『全盘战局分解为若干个参数,可统计与不可统计,可预测与不可预测等等』,依照系统分析的角度来看,任意复杂的系统皆可按模块、功能分解至最后成为一个个小且简单的『块』。再来便是不同的排列组合拆解出来的『块』,经过加工,将其关系化与数据化。
这里有点绕,我们举个栗子:
(比如:阿根廷小组赛对阵伊朗,补时阶段91"梅西的绝杀)
这张图由以下数据构成:
第1、2列,为时间,90分29秒,
start_x,start_y为起脚射门的球场坐标,
goal_y,goal_z为对应球门的坐标
start_x,start_y为起脚射门的球场坐标,
goal_y,goal_z为对应球门的坐标
最后三列分别为:左脚、个人能力的进球、力度强劲
这些统计数据的粒度非常翔实,倘若我说这种大数据能够左右比赛,
你们肯定会说我吹牛逼整噱头。。。嗯,确实是的。
换种提问方式,那么数字化、数据、软件等给在足球领域能够带来足够多的颠覆吗?
巨大颠覆性质的改变倒不敢说,但它实实在在冲击了很多传统足球领域的工作模式。它们具体能提供些什么?改变了什么?
我们占座留个坑,接着往下看。
一、电视机前的观众你们好,这里是懂球帝TV
你没看错,我们打算聊聊电视!嗨,懂球帝er们,别走~ 兄台留步,爱过~提到数字化、数据、软件给足球届带来的颠覆,我第一反应…… 是电视转播(包括卫星信号)
千万别小瞧电视转播,听说过视频球探吗?(有种键盘侠的即视感)没错,他们就是坐在电视机前,阅读大量比赛,发掘有潜力的球员并提交报告给首席球探分析,进行潜力判定,如为可塑之才就紧接着进入实地考察阶段,直至最后操作转会,一线/二线队/预备队进行职业比赛培养,最后出售。你没听错,这很像在玩足球经理游戏『FM』,事实上乌迪内斯实验室便是为此成立的,他们挖掘了前南斯拉夫人——汉达诺维奇(斯洛文尼亚甲级联赛的多姆扎莱队),以4万欧元的价格买入,8年后出售给国际米兰,获得了1200万欧元的收入。
这一切归功于乌迪内斯实验室的创始人保罗·马里诺,他1995年任职足球总监,扩大了球探的覆盖面积,不止是早先传统的口口相传名声在外的球员资源,还包括固定各大洲电视台的转播,100多个海外卫星信号,还有世界各地收集的比赛录像,乌迪内斯实验室负责值班监控,专人进行筛选,录像编辑,提交报告。
图表摘自于macca的雄文《从管理架构和决策方式解读利物浦转会操作》,有兴趣可以前往围观。
上图可以看到,乌迪内斯这3年的转会收入让人垂涎欲滴,这也让南美等球探网络不发达地区的球员们更加努力投入到比赛当中,因为他们的激情、活力会让电视另外一端的球探们两眼放光。
还有,他的笔记本电脑,这即便是莫拉蒂,也不敢乱碰,因为大师真的会发怒的。上面有他收集的各式各样的数据,甚至,贝尼特斯还主导了一款战术板类的应用开发,没记错的话这款应用名叫Golball Coach,顺带八卦一下,穆里尼奥也整了一款同类型的软件,叫做mourinho tactical board 『穆里尼奥的战术板』,早期的时候甚至高调的称作mourinho special board
这一切归功于乌迪内斯实验室的创始人保罗·马里诺,他1995年任职足球总监,扩大了球探的覆盖面积,不止是早先传统的口口相传名声在外的球员资源,还包括固定各大洲电视台的转播,100多个海外卫星信号,还有世界各地收集的比赛录像,乌迪内斯实验室负责值班监控,专人进行筛选,录像编辑,提交报告。
图表摘自于macca的雄文《从管理架构和决策方式解读利物浦转会操作》,有兴趣可以前往围观。
上图可以看到,乌迪内斯这3年的转会收入让人垂涎欲滴,这也让南美等球探网络不发达地区的球员们更加努力投入到比赛当中,因为他们的激情、活力会让电视另外一端的球探们两眼放光。
没错,电视、卫星信号等数字化媒体是一种巨大的颠覆。
『老湿,这段看起来好像不是很强的样子,你还可以更厉害一点吗?』
『老湿,这段看起来好像不是很强的样子,你还可以更厉害一点吗?』
二、手抄数据?!
『数据告诉我们如何防守,如何快速反击』——拉法·贝尼特斯
前利物浦主帅,现任那不勒斯教头的贝尼特斯被尊称为战术大师,也被戏称『大湿』;因为当你在电视机前看到他的时候他几乎都是在拿着战术笔记本写写画画着些什么,开口所及的话题几乎都是数据、分析、战术,针对对手布置有效的打击。
可能太高调了影响销量吧,后来便把Special改掉了,两款都是公开发行的应用,似乎穆帅的软件价格要更贵一点,40~50欧元,贝帅的则是5欧元左右。切尔西助教法利亚在球员们上场前会在场边拿着iPad比划一番,估计就是用这个软件部署的战术跑位、对手的布局、战术变化点、以及软肋等等。
我们回到标题,手抄数据是什么时候开始的?我们回忆下,大伙津津乐道的2006年世界杯小纸条的故事:
『课间作业,猜猜这是什么纸条?』
1/4决赛德国与阿根廷队的120分钟厮杀得难分难解,以至于进入点球决胜负的生死关头。在点球大战开始前,以严谨闻名天下的日耳曼民族这时体现了他们的民族素养,德国队教练组悄悄给门将莱曼递来一张小纸条,在那之后莱曼像信了春哥一样每轮点球都判断出正确方向,同时成功扑出了两粒点球帮助德国队晋级四强。赛后德国队教练组和莱曼也揭秘说,纸条上写的正是阿根廷队每个点球手的罚球特点及方向,而莱曼也正是凭借这这张可歌可泣的纸条成功的将德国战车送进四强。
近俩赛季常看英超的球迷们肯定能发现,下图右侧的信息图在点球的时候出现:杰拉德过往5次罚点球的分布图
近俩赛季常看英超的球迷们肯定能发现,下图右侧的信息图在点球的时候出现:杰拉德过往5次罚点球的分布图
如果样本足够大,假设有杰拉德职业生涯里所有点球的数据分析,那确实是能够分析出:
1、点球手射上下左右的方向趋势,更喜欢上角还是下角。『扑救方向的选择』
2、发力习惯,爆射或是稳妥的推射。『步点节奏』
3、是否会用踩步点的节奏停顿骗门将先移动重心(如:巴洛特利)。『可以反骗』
4、射失率,射失点球的分布图。『关键球的选择上,罚球手的本能出世他更倾向于选择稳妥的路线』
5、以上的习惯,分布在比赛的各个时间段,是否会有不同?『如上半时,下班时,补时,加时赛,点球决战』
6、支撑脚的脚趾头方向是否是惯骗?『正常情况下,射门方向与支撑脚的脚趾头所指方向相同,:D 不信的童鞋可以去球场试试』
这样的数据样本具备客观分析价值,内容翔实,球队的分析师们在点球大战前就可以透过数据分析,整理出一份简明扼要的并且对门将有所帮助的『小纸条』了。
当然了,在2004~05年期间贝尼特斯便已经雇人在做这样的事情了,伊斯坦布尔之夜点球大战便可体现(贝帅的自传里提到),或许在这之前早已有人这么干了,但具体时间以及数据所涵盖范围等细节便不得而知了,如果你知道更多关于点球的小故事,欢迎回帖爆料。
三、球迷们的狂欢,李菊福们的盛宴
李菊福:有『理』有『据』,让人信『服』……
OPTA很有可能是最早进行大规模数据采集的提供商了,即便是这样,那也不过是从1996年开始的,而且,开始的时候只是靠几名朋友在伦敦酒吧里看着电视手工填入比赛的基础数据而已。
最开始的统计粒度估计很粗糙,详细的数据采集是近10年来才开始见到的,到底是球迷们先开始关注翔实的数据呢?还是数据公司先提供出来的?这是个先有鸡or蛋的问题。
无论如何,这总归是好事,不止是球队分析师、教练们会主动去购买这些数据,连媒体站们也会买回来提供给球迷观众们讨论分析侃大山,给足球记者、写手们做为分析的支撑依据,记者&写手们撰稿所汇集而成的专栏反哺媒体站点,透过这种良性循环,媒体站们博得较高的曝光率及用户后,再通过广告获取收入。
比较有名的媒体站如Whoscored、squawka、fourfourtwo stats zone、国内的有搜达、懂球帝等等,他们的数据源几乎都来自于OPTA,用IT术语来说,只是前端展现的方式不同,大家的侧重点不同,扯得有点远了,对此不再做展开。
我们来看看,现有的媒体站给我们球迷们提供了什么。
比如,在英超赛季后段,利物浦与曼城的比赛当中我们能透过上图知道,26~46分钟内,曼城球员的平均站位图(一般来说,名字越大说明各项比赛数据表现好,如:抢断拦截更多,传球更多,对抗更多,射门更多,存在感更多)几乎一眼就看出,曼城的火力集中在右路,而在比赛的场面上确实反映了纳瓦斯、席尔瓦的右路频频杀至底线。
纳瓦斯的传球路线,红色为MISS,橙色的为KEY PASS,上图为传球,下图为传中。
纳瓦斯从右路频频插入禁区,共传出三次关键传球,而且传中都在禁区肋部,相当危险。
我们再来看看费尔南蒂尼奥的表现:
费尔南蒂尼奥上半场的传球(左),与下半场(右)对比,下半场竟然没有任何一脚传丢100%的传球成功率,这中场休息室里发生了什么让巴西人如此绷紧神经。可以推测曼城主教练佩莱格里尼在中场休息时严肃指出巴西人的问题,强调他的纪律,下半时必须把前场的球权交给席尔瓦,自身做好传递齿轮的工作。
再来对比席尔瓦的上下半场传球对比图,西班牙的前腰确实离禁区更近了,而且经常换位,下半场时他几乎是MVP级的表现,每个进球甚至每次极具威胁的进攻都由他发起。这说明什么?
佩莱格里尼看出球队的问题,换下上半场发挥还算出色的纳瓦斯, 换上防守时攻击力更强的米尔纳,他防守时擅长身体对抗/不惜体力的奔跑持续给予右路压力,还记得上面提到的强调费尔南蒂尼奥的纪律吗?让巴西人更稳妥的处理球,解放席尔瓦,让西班牙大脑辐射禁区前沿,这在下半场起到了绝好的效果。
我们转头看另外一边,红军教头罗杰斯在赛季后半段喜欢首发中后卫萨科不是没有原因的,对阵曼城一役的上半时里他的传球成功率是100%,小心翼翼的出球,稳妥给到队友脚下,后防线稳固且不易被挑战,在心理对抗上,失误较少的后卫会让对手的前场逼迫陷入消极。
我们再换一场比赛来看:
利物浦对阵西汉姆一役,上下半场判若两人的斯特林,上半时只有1次过人成功,寥寥无几的9次传球6次成功,向前的传递全部失败了。牙买加小将面对铁锤帮摆出的大巴似乎也没太多办法,但反观下半时,1次抢断,34次传球31次成功,几乎全部到位,还有将3次关键传球送入禁区,两次射门均命中目标,似乎变了个戏法换了个人似的。其实这得益于罗杰斯中场休息时的换人,并非说卢卡斯替换掉库蒂尼奥后有多么出色的表现,这属于战术上的改变,巴西后腰中规中矩的拦截与传接球,让出了冲刺的空间,斯特林回撤改变角色为前场自由AMC后便如鱼得水了。
说到这里,这节课也差不多要结束了,不知道大家对足球领域的数据是否有了更多的理解,看球聊球的时候有更多可探讨的空间了吗?透过数据辅佐验证你的想法,针对比赛一探究竟,如果你们喜欢的话,围绕着世界杯,或许还有下一堂课哦。